内海ゆづ子のホームページ


大規模データベースにおける顔認識

犯罪捜査や写真の自動整理などでの顔認識の利用を考慮して, 大量の顔画像の中から特定の人物の顔画像を認識する手法を提案した. 多くの従来の顔認識手法では,大域的特徴量をSVM などの機械学習を用いて学習した識別器を 用いて認識を行っている. このような手法では,計算時間が考慮されていないため,データベースの規模が大きくなると 計算時間が爆発的に増えるため,大規模なデータベースに対しては現実的な手法ではない. 提案手法では,特徴量の照合に計算が単純でかつ近似計算が可能な最近傍探索を用いることで 高速な認識を実現し, 複数の局所特徴量の照合結果を投票で統合することで,認識率の向上を図った.
実験の結果,提案手法では300 万顔画像データベースに対して, 計算時間257 ms, 1000位累積認識率96.9% で認識を実現した.

提案手法と従来手法の認識率の比較
提案手法のデータベースの規模と計算時間

 

主な発表

  1. 内海 ゆづ子、坂野 悠司、前川 敬介、岩村 雅一、黄瀬 浩一, "局所特徴量と投票処理を用いた大規模データベースに対する高速顔認識," 電子情報通信学会論文誌D, Vol. J97-D, No. 8, pp.1263--1272, 2014.
  2. Yuzuko Utsumi, Yuji Sakano, Keisuke Maekawa, Masakazu Iwamura, and Koichi Kise, "Scalable Face Retrieval by Simple Classifiers and Voting Scheme," Proc. 1st International Workshop on Face and Facial Expression Recognition from Real World Videos (FFER 2014), Lecture Notes in Computer Science, 8912, pp. 99-108, 2014.
  3. 北野 豊,内海 ゆづ子,岩村 雅一,黄瀬 浩一, "解像度低下と照明変動に頑健な大規模顔画像認識," 電子情報通信学会技術研究報告, Vol. 114, No. 521, pp.199-204, 2015.

読書行動の検出と文書カテゴリ識別

人間の活動の様子をデジタルデータとして記録するライフログが認知され,急速に広まっている.人間の活動のうち,読書は知的活動の中心であり,重要な行動の1つであるが,読書行動をデジタルデータとして記録する技術は確立されていない.そこで現在,我々の研究グループでは,人の読書行動を自動的に記録するReading-Life Log を提案し,読書行動をデジタルデータとして自動的に記録することを目標に研究を行っている.その一環として,我々は,いつ読書を行っているか,また,何を読んでいるかを検出することに焦点を当て,自動的に読書行動を検出し,文書カテゴリを識別する手法を提案した.
提案手法では,モバイルアイトラッカから得られる視線の動きをもとに読書行動を検出し,一人称視点画像から視線情報をもとに文書領域画像を取り出し,画像特徴量を用いて,読んでいる文章を6種類のカテゴリ(教科書,論文,新聞,雑誌,小説.マンガ)に分類した.読書行動や文書カテゴリ分類にはmulticlass SVMを用いた.
実験の結果,読書行動検出精度は90.5%,文書カテゴリの識別精度は85%となった.

主な発表

  1. 志賀 優毅、内海 ゆづ子、岩村 雅一、Kai Kunze、黄瀬 浩一,"視線情報と一人称視点画像を用いた文書カテゴリの自動識別," 電子情報通信学会論文誌, Vol. J99-D, No. 9, pp.950-958, 2016.
  2. 志賀 優毅,内海 ゆづ子,岩村 雅一,カイ クンツェ,黄瀬 浩一, "読書活動の自動的記録のための文書画像の識別," 電子情報通信学会論文誌D, Vol. J97-D, No. 12, pp. 1733-1736, 2014.
  3. 中嶌 一樹,内海 ゆづ子,岩村 雅一,黄瀬 浩一, "読書行動の検出における有効な視線特徴量の選定," 情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM), Vol. 2016-CVIM-202, No. 28, pp. 1-6, 2016.

植物の3次元計測

現在,農業では,従事者の勘と経験により,生育方法,育種などが行われているが,異常気象などの急激な変化には対応が困難となっている.そこで,植物の生育を網羅的に調査するフェノタイピングを行うことで,植物の環境応答特性を知り,最適な作物の栽培方法を模索することが解決策として挙げられている.フェノタイピングでは,植物の形状を大量に計測する必要があるが,作業は現在手動で行われており,自動化がされていない.そこで,本研究では,植物の形状のデータを自動的に計測することを目的とし,高精度な植物の3次元形状復元を提案した.
提案手法では,従来の3次元復元手法であるStructure from Motion で復元不可能な部分を補うため,画像の色情報に基づいて3次元位置を推定した.
実験の結果,従来手法で失敗していた葉の中央部分の復元に成功した.

従来手法での復元結果
提案手法での補完結果

 

主な発表

  1. 三木啓輔,内海ゆづ子,岩村雅一,黄瀬浩一, "アピアランスに基づいた植物の3次元復元結果の補完," 情報処理学会研究報告コンピュータビジョンとイメージメディア(CVIM), Vol. 2016-CVIM-202, No. 29, pp. 1-7, 2016.

ブドウ栽培者支援システムの開発

大阪では,ブドウの栽培が盛んであるが,農業従事者の高齢化が進んでおり,新規参入者の育成が課題となっている. しかし,ブドウ栽培は他の果物と比較して作業の種類が多い上,時間がかかるため,ブドウ栽培技術取得は 新規参入者の大きな負荷となっている. そこで,我々はブドウ栽培の作業のうち,摘房(房を間引いてブドウの品質を安定させる作業),摘粒(ブドウの実を間引いて房の整形をする作業)に注目し,これらを画像処理を用いて支援するシステムの開発を行っている. 摘房作業では,ブドウ畑での房の数を自動的に数え,房の密度を提示することで,作業の効率化を図る. 摘粒作業では,ブドウの画像から3次元構造を取得し,その中から間引く実を自動的に決定し提示することで, 作業の支援をする. 最終的には,ウェアラブル端末にこれらの支援情報を提示するシステムを開発する予定である.

ブドウ栽培支援システム概要