講演名 2007-05-31
Consolidation-based Speech Translation applied to Chinese-English Broadcast News domain
,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声認識システムと機械翻訳システムを統合した音声翻訳システムでは,発話者による冗長な情報や認識誤りが含まれる音声認識結果をそのまま和訳すると性能が劣化することが知られている.本報告では,音声認識結果から誤りを排除しつつ意味のまとまりのある部分単語列を抽出するコンソリデーションという枠組みに基づく新しい音声翻訳注を提案する.一方,コンソリデーションに基づく音声翻訳は発話された全ての単語を翻訳するアプローチではないため,書き起こし文を人手により翻訳した結果を正解として評価するのは適切ではない.そこで,本研究では正解翻訳結果から文意を保持した様々な長さの部分単語列を単語ネットワークで表現し,そのネットワークから抽出される部分翻訳を正解として評価を行う枠組みを提案する.中国語ニュース音声データRT04内の発話をコンソリデーションに基づき翻訳レBLEUで評価した結果を報告する.さらにコンソリデーションの精度およびコンソリデーションに基づく翻訳の性能を評価するため,情報保持精度(IPAccy)と意味保持精度(MPAccy)を提案する.
抄録(英) The performance of speech translation systems combining automatic speech recognition (ASR) and machine translation (MT) systems is degraded by redundant and irrelevant information caused by speaker's disfluency and recognition errors. This paper proposes a new approach to translate speech recognition results through speech consolidation which extracts meaningful phrases and remove errors and disfluencies. The speech translation results via consolidation cannot be directly compared with gold standards in which all words in speech are translated because consolidation-based translations are partial translations. We would like to propose a new evaluation framework for partial translation by comparing with the most similar set of words extracted from a word network created by merging gradual summarizations of the gold standard translation. Chinese broadcast news (BN) speech in RT04 were recognized, consolidated and then translated. The performance of MT results was evaluated using BLEU. We also propose Information Preservation Accuracy (IPAccy) and Meaning Preservation Accuracy (MPAccy) to evaluate consolidation and consolidation-based MT.
キーワード(和) 音声翻訳 / コンソリデーション / 中国語ニュース音声 / 中国語-英語和訳 / BLEU / IPAccy / MPAccy
キーワード(英) speech translation / speech consolidation / Chinese broadcast news speech / Chinese-English translation / BLEU / IPAccy / MPAccy
資料番号 SP2007-5
発行日

研究会情報
研究会 SP
開催期間 2007/5/24(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) Consolidation-based Speech Translation applied to Chinese-English Broadcast News domain
サブタイトル(和)
タイトル(英) Consolidation-based Speech Translation applied to Chinese-English Broadcast News domain
サブタイトル(和)
キーワード(1)(和/英) 音声翻訳 / speech translation
キーワード(2)(和/英) コンソリデーション / speech consolidation
キーワード(3)(和/英) 中国語ニュース音声 / Chinese broadcast news speech
キーワード(4)(和/英) 中国語-英語和訳 / Chinese-English translation
キーワード(5)(和/英) BLEU / BLEU
キーワード(6)(和/英) IPAccy / IPAccy
キーワード(7)(和/英) MPAccy / MPAccy
第 1 著者 氏名(和/英) / Chiori Hori
第 1 著者 所属(和/英)
NICT-ATR
発表年月日 2007-05-31
資料番号 SP2007-5
巻番号(vol) vol.107
号番号(no) 77
ページ範囲 pp.-
ページ数 6
発行日