講演名 2008-01-25
日本語母語話者のための英語音声認識システム用英語言語モデルの検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
山崎 博紀, 喜多村 圭介, 山本 誠一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 国際的なビジネスの場などでの発表や交渉・議論は英語でなされることから,英語発話を認識し,検索・要約などの処理を行う英語発話のドキュメント処理技術は一層重要となる.第2言語による発音や表現は,母語の干渉を受けるため,英語を母語とする話者の音声データを用いて学習を行った英語音声認識装置では,第2言語話者による英語に対する音声認識性能は大きく低下する.このため,日本人による英語発話をドキュメント処理することは極めて困難である.本稿では,日本語母語話者による英語音声の認識率を向上させる取り組みとして,日本語母語話者の言語特性を考慮した言語モデルの採用がどの程度音声認識率を向上させるかを検討した.本稿では,旅行会話に関する英語テキストコーパス(BTEC)より選択した課題文を学習者が英訳した学習者コーパスを用いて学習を行った言語モデルにより,日本語母語話者の英語発話の認識率がどの程度認識率を向上したかを述べる.
抄録(英) English are spoken in various occasions like presentations and discussions at international conferences by a lot of people whose mother tongues are different from. Their second languages often have not only distinct accent but also different lexical and syntactic characteristics. Speech recognition performance is severely affected when the lexical, syntactic, or semantic characteristics in the training and recognition tasks differ. Language model of a speech recognition system is usually trained with transcribed speech data or text data collected in English native countries, therefore, speech recognition performance is expected to be degraded by mismatch of lexical and syntactic characteristics between native speakers and second languages speakers as well as by the distinction between their accents. This paper describes improvement of speech recognition performances when the language model are trained with the learner corpus which was created by collecting sentences translated by Japanese subjects and linearly interpolated with a language model trained with a corpus in the same domain.
キーワード(和) 音声認識 / ドキュメント処理 / 言語モデル
キーワード(英) Speech recognition / Document processing / Language model
資料番号 TL2007-72,SP2007-167,WIT2007-72
発行日

研究会情報
研究会 SP
開催期間 2008/1/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 日本語母語話者のための英語音声認識システム用英語言語モデルの検討(福祉と知能・情動・認知障害,福祉と音声処理,一般)
サブタイトル(和)
タイトル(英) A Language Model for English Speech Recognition Systems for Japanese Native Speakers
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / Speech recognition
キーワード(2)(和/英) ドキュメント処理 / Document processing
キーワード(3)(和/英) 言語モデル / Language model
第 1 著者 氏名(和/英) 山崎 博紀 / Hiroki YAMAZAKI
第 1 著者 所属(和/英) 同志社大学工学部
Faculty of Engineering, Doshisha University
第 2 著者 氏名(和/英) 喜多村 圭介 / Keisuke KITAMURA
第 2 著者 所属(和/英) 同志社大学工学部
Faculty of Engineering, Doshisha University
第 3 著者 氏名(和/英) 山本 誠一 / Seiichi YAMAMOTO
第 3 著者 所属(和/英) 同志社大学工学部
Faculty of Engineering, Doshisha University
発表年月日 2008-01-25
資料番号 TL2007-72,SP2007-167,WIT2007-72
巻番号(vol) vol.107
号番号(no) 435
ページ範囲 pp.-
ページ数 6
発行日