講演名 2016-10-27
[招待講演]ノンパラメトリックベイズに基づく教師なし語彙獲得
谷口 忠大(立命館大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声発話データの分節化と語彙の発見は幼児の語彙獲得にとって重要な課題である.人間の幼児は事前の言語的知識が無い状態から音声を分節化し語彙や音素を発見していくことができる.しかし,このような音声データからの直接的な語彙獲得は計算機科学にとっても未だに大きな挑戦である.本講演では我々が近年提案した教師なし学習手法について紹介する.この手法はロボットに音響モデル(音素モデル)と言語モデルを同時に音声データのみから学習させる事が出来る.教師なし学習であるので,人手によるラベルデータを必要としない.この手法はノンパラメトリックベイズに基づいており,語彙の数や音素の数も自動的に推定することが出来る.この手法のために確率的生成モデルであるhierarchical Dirichlet process-hidden language model (HDP-HLM)を導入する.また,いくつかの実験結果についても報告する.
抄録(英) Word discovery is a critical task in language acquisition for infants. Human infants can discover words from speech signals directly without pre-existing linguistic knowledge. However, direct word discovery from raw speech signals is still a challenging problem in computer science. %This invited talk introduces our recently developed machine learning method that enables robots to acquire acoustic and language models simultaneously. This means the method enables the robots to acquire them from raw speech signals without any transcribed data, {it i.e.,.}, in an unsupervised manner. The machine learning method is based on Bayesian nonparametrics. This talk introduces a probabilistic generative model named hierarchical Dirichlet process-hidden language model, which is a generative model that integrate language and acoustic models. This talk also reports our some results about direct word discovery from vowel sequences.
キーワード(和) ノンパラメトリックベイズ / 語彙獲得 / 教師なし学習
キーワード(英) Bayesian nonparametrics / word discovery / unsupervised learning
資料番号 SP2016-44
発行日 2016-10-20 (SP)

研究会情報
研究会 SP
開催期間 2016/10/27(から1日開催)
開催地(和) 静岡大学
開催地(英) Shizuoka University.
テーマ(和) 学習,認識,合成,対話,音声一般
テーマ(英) Learning, Recognition, Synthesis, Dialogue, etc.
委員長氏名(和) 間野 一則(芝浦工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.)
副委員長氏名(和) 森 大毅(宇都宮大)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.)
幹事氏名(和) 滝口 哲也(神戸大) / 西田 昌史(静岡大)
幹事氏名(英) Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.)
幹事補佐氏名(和) 浅見 太一(NTT) / 橋本 佳(名工大)
幹事補佐氏名(英) Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech
本文の言語 JPN
タイトル(和) [招待講演]ノンパラメトリックベイズに基づく教師なし語彙獲得
サブタイトル(和)
タイトル(英) [Invited Talk] Unsupervised Word Discovery based on Bayesian Nonparametrics
サブタイトル(和)
キーワード(1)(和/英) ノンパラメトリックベイズ / Bayesian nonparametrics
キーワード(2)(和/英) 語彙獲得 / word discovery
キーワード(3)(和/英) 教師なし学習 / unsupervised learning
第 1 著者 氏名(和/英) 谷口 忠大 / Tadahiro Taniguchi
第 1 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan)
発表年月日 2016-10-27
資料番号 SP2016-44
巻番号(vol) vol.116
号番号(no) SP-279
ページ範囲 pp.21-22(SP),
ページ数 2
発行日 2016-10-20 (SP)