講演抄録/キーワード |
講演名 |
2011-01-21 14:10
[フェロー記念講演]セマンティックギャップに架ける橋 ○馬場口 登(阪大) PRMU2010-184 MVE2010-109 |
抄録 |
(和) |
画像,映像など視覚情報から人間の解釈できる意味情報(セマンティックス)を得ることがメディア理解研究の究極の目標である.しかしながら,メディア(映像,画像など)から抽出できる情報(特徴など)と,そのメディアに対する人間の解釈との間の不一致をいうセマンティックギャップが存在するため,メディアの意味理解を困難にしている.すなわち,メディアに対する低レベル記述である信号表現・特徴・属性と,メディアのもつ高レベルの概念記述との適切な対応付けの方策,いわばセマンティックギャップに架ける橋が,現在でもなお,構築できない状況にある.本講演では,筆者の取り組みを振り返りながら,セマンティックギャップ架橋への3種類のアプローチを取り上げ考察する.第1は,機械学習・統計的パターン認識の利用である.これは近年最も成功を収めているアプローチで,グラウンドトゥルース付きの大規模コーパスの利用が前提となる.第2は,情報統合である.マルチモーダルで実世界の情報を捉え,それらの相互の関係を有効利用するものである.Web空間という大規模知識源はこれを支える重要な要素となる.第3は,ヒューマン中心型コンピューティング,すなわち人間が計算システムに介在する仕掛けである.人間が順次与える高レベル記述と低レベル記述の対応付けを学習しながら意味理解の性能向上を図るものである.これらのアプローチを吟味しながら今後の展開を議論したい. |
(英) |
The ultimate goal of media understanding researches is to acquire semantics from images and videos. However, the semantic gap, which means the lack of coincidence between the information that can be extracted from the visual media and the interpretation that humans give for it, makes media understanding very difficult. Since the gap between low level image/video features and high level concept descriptions is very large, we have not built a bridge over the troubled gap until now. In this lecture, we discuss three different approaches to bridge the semantic gap, tracing back to our research activities. The first is statistical pattern recognition or machine learning with extensive use of large-scale corpus with ground truth. This has been one of the most successful approaches in recent years. The second is information integration or multimodal analysis. In this approach, it is of great importance to view the real world in a multi-modal fashion as well as to make use of the Web space as a large-scale knowledge source. The third is human-centered computing; in other words, human-in-the-loop systems. Because such a system is capable of incrementally learning the correspondence between high and low level descriptions through human-system interaction, its performance of understanding media semantics can be increased. |
キーワード |
(和) |
セマンティックギャップ / 機械学習 / 情報統合 / ヒューマン中心型コンピューティング / / / / |
(英) |
Semantic Gap / Machine Learning / Information Integration / Human-Centered Computing / / / / |
文献情報 |
信学技報, vol. 110, no. 381, PRMU2010-184, pp. 289-289, 2011年1月. |
資料番号 |
PRMU2010-184 |
発行日 |
2011-01-13 (PRMU, MVE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2010-184 MVE2010-109 |
研究会情報 |
研究会 |
PRMU MVE IPSJ-CVIM |
開催期間 |
2011-01-20 - 2011-01-21 |
開催地(和) |
立命館大学 びわこ・くさつキャンパス |
開催地(英) |
|
テーマ(和) |
MR/ARの実用化に向けたCV/PR技術の課題と展望(PRMU,VR学会SIG-MRと共催) |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
PRMU |
会議コード |
2011-01-PRMU-MVE |
本文の言語 |
日本語 |
タイトル(和) |
セマンティックギャップに架ける橋 |
サブタイトル(和) |
|
タイトル(英) |
- |
サブタイトル(英) |
|
キーワード(1)(和/英) |
セマンティックギャップ / Semantic Gap |
キーワード(2)(和/英) |
機械学習 / Machine Learning |
キーワード(3)(和/英) |
情報統合 / Information Integration |
キーワード(4)(和/英) |
ヒューマン中心型コンピューティング / Human-Centered Computing |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
馬場口 登 / Noboru Babaguchi / ババグチ ノボル |
第1著者 所属(和/英) |
大阪大学 (略称: 阪大)
Osaka University (略称: Osaka Univ) |
第2著者 氏名(和/英/ヨミ) |
/ / |
第2著者 所属(和/英) |
(略称: )
(略称: ) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2011-01-21 14:10:00 |
発表時間 |
60分 |
申込先研究会 |
PRMU |
資料番号 |
PRMU2010-184, MVE2010-109 |
巻番号(vol) |
vol.110 |
号番号(no) |
no.381(PRMU), no.382(MVE) |
ページ範囲 |
p.289 |
ページ数 |
1 |
発行日 |
2011-01-13 (PRMU, MVE) |
|