Japanese / English

文献の詳細

論文の言語 日本語
著者 上田 敬介, 黄瀬 浩一
論文名 カメラを用いたレイアウトフリー文書画像検索
書名 電子情報通信学会技術研究報告
Vol. 111
No. 430
発表番号 PRMU2011-227
ページ pp.185-190
査読の有無
年月 2012年2月
要約 本稿では,我々が構築している,コンテンツ一致を基準としたカメラベースの文書画像検索手法における検索精度の向上法を提案する.我々はこれまでに,次のような特徴を持つ手法 (従来手法と呼ぶ) を提案した.すなわち,(1) 単語ごとの特徴抽出とクラスタリングを用いた単語画像の簡易コード化,(2) メッシュ特徴による特徴抽出,(3) 単語クラスタ ID の n-gram による索引付け,の 3 つである.しかし,従来手法には 3 つの問題点がある.単語の回転を考慮していないこと,フォントの変化に弱いこと,n-gram の特定性を考慮していないことである.これら対して,提案手法では回転処理を加えた単語の形状から特徴抽出を行い,更に,データベース文書を複数のフォントで登録するとともに,重み付けを加える.その結果,従来手法よりも精度の向上が見られた.レイアウトや撮影方法の異なる文書画像 320 枚をクエリ画像とし,データベースの画像 2,500 枚に対して検索実験を行ったところ,検索精度88.1%,処理時間 671[ms] を得た.検索精度については,従来手法の 42.8%,OCR を用いた手法の 70.3%から大幅に改善しており,処理時間についても,OCR を用いた手法の 1/5 であったことから,有効性が実証された.
一覧に戻る