Japanese / English

Detail of Publication

Text Language Japanese
Authors 上田 敬介, 黄瀬 浩一
Title レイアウト変動にも対応できる文書画像検索法
Book_Title 電子情報通信学会技術研究報告
Vol. 111
No. 317
Presentation number PRMU2011-111
Pages pp.25-30
Reviewed or not Not reviewed
Month & Year November 2011
Abstract レイアウトが変更されていても,コンテンツが一致すれば検索が可能な文書画像検索法を提案する. 文書画像検索の既存手法は大きく分けて2種類ある. 1つは,各文字や各単語の近傍位置関係を特徴として検索する手法である. もう1つは,文字認識を行い,文書をコード化して検索を行う手法である. しかし,これらの手法にはそれぞれ問題点がある. 前者の手法では,データベースの文書画像とレイアウトが違う文書画像を与えると検索ができなくなる. 後者の手法では,レイアウト変動には柔軟であるが,処理時間が長いという問題点がある. そこで本研究では,レイアウトの変動にも対応でき,文字認識ほど厳密な処理を行わない手法を提案する. レイアウトの違う文書300ページをクエリ画像とし, データベースの画像10,000枚に対して検索実験を行ったところ, 認識精度93.7%,検索時間417[ms]を得た.これはOCRを用いて得られる 認識精度99.0%には劣るものの,検索時間は1/4となっていることから 高速な検索が可能であることがわかった.
Back to list