Japanese / English

文献の詳細

論文の言語 日本語
著者 竹田 一貴, 黄瀬 浩一, 岩村 雅一
論文名 1億ページのデータベースを対象とした大規模文書画像検索
論文誌名 電子情報通信学会技術研究報告
Vol. 112
No. 441
発表番号 PRMU2012-161
ページ pp.131-136
発表場所 大阪府堺市
査読の有無
発表の種類 口頭発表
年月 2013年2月
要約 本稿では,1億ページのデータベースを対象とした大規模実時間文書画像検索法を提案する.我々はすでに,1,000万ページのデータベースから実時間で検索可能な手法を提案している.この手法を用いてさらなる大規模化を実現するためには,より一層のメモリ削減が求められる.同時に,メモリ削減による検索精度の低下を抑制する必要がある.これを実現するため,検索に有効な特徴量のサンプリング法と,特徴量の柔軟な照合を実現するための多重探索法を提案する.1,000万ページのデータベースを用いた実験から,従来手法と比較して,検索精度を維持したまま70%のメモリ削減を実現できることが分かった.また,1億ページのデータベースから,必要メモリ量236GB,精度98.7%,処理時間26.8msで検索でき,高いスケーラビリティを持つこと確認した.
一覧に戻る