Japanese / English

文献の詳細

論文の言語 日本語
著者 能祖 正樹,黄瀬 浩一, 岩村 雅一
論文名 Local Text Reuse Detection のLSHによる高速化
論文誌名 データ工学と情報マネジメントに関するフォーラム論文集
発表番号 D8-6
査読の有無
年月 2009年3月
要約 Local text resuse detectionとは,文書の部分的なコピーを発見する技術であり,文書の盗用検出に有効である. ただし,この処理には,データベースの規模を大きくすると,処理時間が大幅にかかってしまうという問題がある. その原因は,大量のデータに対して最近傍探索を行うためである. 最近傍探索にかかる時間を短縮する手法の一つに,近似を導入するものがある. そこで,本稿では近似最近傍探索の一手法であるLocality-Sensitive Hashing(LSH) とSpherical LSH を用いて,local text reuse detectionの処理を高速化する手法を提案する.
一覧に戻る