講演名 2000/12/15
話し言葉音声の認識を目指して
篠崎 隆宏, 斎藤 洋平, 堀 智織, 古井 貞煕,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 話し言葉音声の認識を目指して平成11年度に開始したプロジェクトに関連して、講演音声、対談音声、討論音声などを対象として進めている種々の検討状況を報告する。実際の話し言葉コーパスから作成した音素モデルや言語モデル、話題の分野に対応した過去のニュースや教科書を用いた未知語の登録、対談のクロストークの区間における音響back-offなどが有用であることが確認された。認識性能に個人差が大きく、発話速度、フィラー数、言い直し数などに関連していることなどが確認された。会議などの議事録を、音声認識システムとユーザとが対話を行いながら効率的に作成する方法についても検討した。話し言葉の音声認識性能はまだ低く、認識対象としての文単位の抽出法、発音辞書、コーパス作成における書き起こし法など、今後解決しなければならない研究課題が多い。
抄録(英) This paper reports various investigations on recognizing spontaneous speech such as lectures, interviews and discussions conducted in relation with our national project started in 1999. Usefulness of acoustic and linguistic modeling based on actual spontaneous speech corpora, registration of new words using past broadcast news or a textbook related to the areas of topics, and an acoustic backing-off method for the periods of cross talk in interviews have been confirmed. Recognitionaccuracy has a wide speaker-to-speaker variability according to the speaking rate, number of fillers, number of repairs, etc. This paper also reports a method for efficiently making minutes of meetings based on interaction between a speech recognition system and a user. The recognition accuracy for spontaneous speech is still very low, and there exist a large number of research issues ubcluding how to extract pseudo-sentence unit speech for recognition, how to build pronunciation dictionaries, and how to transcribe spontaneous speech in corpora.
キーワード(和) 話し言葉音声認識 / 話し言葉プロジェクト / 講演 / 対談 / 討論 / 未知語 / 音響back-off
キーワード(英) spontaneous speech recognition / national project / lectures / interviws / discussion / OOV words / acoustic backing-off
資料番号 NLC2000-48,SP2000-96
発行日

研究会情報
研究会 NLC
開催期間 2000/12/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 話し言葉音声の認識を目指して
サブタイトル(和)
タイトル(英) Toward Spontaneous Speech Recognition
サブタイトル(和)
キーワード(1)(和/英) 話し言葉音声認識 / spontaneous speech recognition
キーワード(2)(和/英) 話し言葉プロジェクト / national project
キーワード(3)(和/英) 講演 / lectures
キーワード(4)(和/英) 対談 / interviws
キーワード(5)(和/英) 討論 / discussion
キーワード(6)(和/英) 未知語 / OOV words
キーワード(7)(和/英) 音響back-off / acoustic backing-off
第 1 著者 氏名(和/英) 篠崎 隆宏 / Takahiro Shinozaki
第 1 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Tokyo Institute of Technology, Department of Computer Science
第 2 著者 氏名(和/英) 斎藤 洋平 / Yohei Saito
第 2 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Tokyo Institute of Technology, Department of Computer Science
第 3 著者 氏名(和/英) 堀 智織 / Chiori Hori
第 3 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Tokyo Institute of Technology, Department of Computer Science
第 4 著者 氏名(和/英) 古井 貞煕 / Sadaoki Furui
第 4 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Tokyo Institute of Technology, Department of Computer Science
発表年月日 2000/12/15
資料番号 NLC2000-48,SP2000-96
巻番号(vol) vol.100
号番号(no) 521
ページ範囲 pp.-
ページ数 6
発行日