講演名 2012/6/22
連続値と統計的自然言語処理(特別セッション,自然言語とパターン認識の境界)
持橋 大地,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 統計的自然言語処理はこれまで,言語を記号的に扱い,その中で構文解析や係り受け解析などの組み合わせ的構造を学習することを主としてきた.しかし,言葉の意味に踏み込もうとすると,われわれは厖大な語彙の裏に潜んだ,連続的な意味的空間に直面せざるを得ない.これらは,離散的構造の推論にも本来は不可欠なものである.また,統計的自然言語処理の進歩に伴い,組み合わせ的方法では不可能だった画像,動画,音声をはじめ,空間的・地理的位置や時系列データ等との統計的な同時モデルが可能になりつつある.長期的にはこれらを統合して,ロボティクスや言語の認知科学の基盤ともなると考えられる.そこで本講演では,意味を扱う最近の種々の確率的トピックモデルを紹介し,上記のような連続データと連携する様々な統計的研究について概観することで,従来独立の分野と考えられてきた,統計的自然言語処理とパターン認識・機械学習がいかに統合され得るかについて考えたい.
抄録(英) Statistical natural language processing so far mainly focused on combinatorial structure of languages, such as syntactic parsing and dependency analysis, based on a view of symbolic processing from an artificial intelligence research. However, when we delve into semantic space behind an enormous size of lexicon in natural languages, we are stuck to face their inherent continuous property that is originally inevitable for inducing discrete structures. With the latest advances in statistical natural language processing, we are now able to consider a joint model of languages with images, videos, sounds and even spatial and geographical locations and time-series data. They will eventually lay as a foundation of probabilistic robotics and cognitive studies of languages. This talk will first introduce some types of latest statistical topic models and overview the approaches to tackle with continuous data described above. The objective is to think over how we can combine the two different fields, natural language processing with pattern recognition and machine learning.
キーワード(和) 確率的トピックモデル / ガウス過程 / ボルツマンマシン / MCMC
キーワード(英) Statistical topic models / Gaussian processes / Boltzmann machine / MCMC
資料番号 PRMU2012-25,NLC2012-5
発行日

研究会情報
研究会 PRMU
開催期間 2012/6/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 連続値と統計的自然言語処理(特別セッション,自然言語とパターン認識の境界)
サブタイトル(和)
タイトル(英) Statistical natural language processing with continuous models
サブタイトル(和)
キーワード(1)(和/英) 確率的トピックモデル / Statistical topic models
キーワード(2)(和/英) ガウス過程 / Gaussian processes
キーワード(3)(和/英) ボルツマンマシン / Boltzmann machine
キーワード(4)(和/英) MCMC / MCMC
第 1 著者 氏名(和/英) 持橋 大地 / Daichi MOCHIHASHI
第 1 著者 所属(和/英) 統計数理研究所数理・推論研究系
Department of Mathematical Statistics, The Institute of Statistical Mathematics
発表年月日 2012/6/22
資料番号 PRMU2012-25,NLC2012-5
巻番号(vol) vol.112
号番号(no) 111
ページ範囲 pp.-
ページ数 20
発行日