講演名 | 2012-06-29 連続値と統計的自然言語処理(特別セッション,自然言語とパターン認識の境界) 持橋 大地, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 統計的自然言語処理はこれまで,言語を記号的に扱い,その中で構文解析や係り受け解析などの組み合わせ的構造を学習することを主としてきた.しかし,言葉の意味に踏み込もうとすると,われわれは厖大な語彙の裏に潜んだ,連続的な意味的空間に直面せざるを得ない.これらは,離散的構造の推論にも本来は不可欠なものである.また,統計的自然言語処理の進歩に伴い,組み合わせ的方法では不可能だった画像,動画,音声をはじめ,空間的・地理的位置や時系列データ等との統計的な同時モデルが可能になりつつある.長期的にはこれらを統合して,ロボティクスや言語の認知科学の基盤ともなると考えられる.そこで本講演では,意味を扱う最近の種々の確率的トピックモデルを紹介し,上記のような連続データと連携する様々な統計的研究について概観することで,従来独立の分野と考えられてきた,統計的自然言語処理とパターン認識・機械学習がいかに統合され得るかについて考えたい. |
抄録(英) | Statistical natural language processing so far mainly focused on combinatorial structure of languages, such as syntactic parsing and dependency analysis, based on a view of symbolic processing from an artificial intelligence research. However, when we delve into semantic space behind an enormous size of lexicon in natural languages, we are stuck to face their inherent continuous property that is originally inevitable for inducing discrete structures. With the latest advances in statistical natural language processing, we are now able to consider a joint model of languages with images, videos, sounds and even spatial and geographical locations and time-series data. They will eventually lay as a foundation of probabilistic robotics and cognitive studies of languages. This talk will first introduce some types of latest statistical topic models and overview the approaches to tackle with continuous data described above. The objective is to think over how we can combine the two different fields, natural language processing with pattern recognition and machine learning. |
キーワード(和) | 確率的トピックモデル / ガウス過程 / ボルツマンマシン / MCMC |
キーワード(英) | Statistical topic models / Gaussian processes / Boltzmann machine / MCMC |
資料番号 | NLC2012-5,PRMU2012-25 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2012/6/22(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 連続値と統計的自然言語処理(特別セッション,自然言語とパターン認識の境界) |
サブタイトル(和) | |
タイトル(英) | Statistical natural language processing with continuous models |
サブタイトル(和) | |
キーワード(1)(和/英) | 確率的トピックモデル / Statistical topic models |
キーワード(2)(和/英) | ガウス過程 / Gaussian processes |
キーワード(3)(和/英) | ボルツマンマシン / Boltzmann machine |
キーワード(4)(和/英) | MCMC / MCMC |
第 1 著者 氏名(和/英) | 持橋 大地 / Daichi MOCHIHASHI |
第 1 著者 所属(和/英) | 統計数理研究所数理・推論研究系 Department of Mathematical Statistics, The Institute of Statistical Mathematics |
発表年月日 | 2012-06-29 |
資料番号 | NLC2012-5,PRMU2012-25 |
巻番号(vol) | vol.112 |
号番号(no) | 110 |
ページ範囲 | pp.- |
ページ数 | 20 |
発行日 |