Japanese / English

文献の詳細

論文の言語 日本語
著者 上田 敬介, 黄瀬 浩一
論文名 レイアウト変動にも対応できる文書画像検索法
書名 電子情報通信学会技術研究報告
Vol. 111
No. 317
発表番号 PRMU2011-111
ページ pp.25-30
査読の有無
年月 2011年11月
要約 レイアウトが変更されていても,コンテンツが一致すれば検索が可能な文書画像検索法を提案する. 文書画像検索の既存手法は大きく分けて2種類ある. 1つは,各文字や各単語の近傍位置関係を特徴として検索する手法である. もう1つは,文字認識を行い,文書をコード化して検索を行う手法である. しかし,これらの手法にはそれぞれ問題点がある. 前者の手法では,データベースの文書画像とレイアウトが違う文書画像を与えると検索ができなくなる. 後者の手法では,レイアウト変動には柔軟であるが,処理時間が長いという問題点がある. そこで本研究では,レイアウトの変動にも対応でき,文字認識ほど厳密な処理を行わない手法を提案する. レイアウトの違う文書300ページをクエリ画像とし, データベースの画像10,000枚に対して検索実験を行ったところ, 認識精度93.7%,検索時間417[ms]を得た.これはOCRを用いて得られる 認識精度99.0%には劣るものの,検索時間は1/4となっていることから 高速な検索が可能であることがわかった.
一覧に戻る