講演名 2004/12/14
インドネシア語の音声コーパス作成および音声認識システムの開発(ポスターセッション)(第6回音声言語シンポジウム)
, /, 中村 哲,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では,我々の行ったインドネシア語の音声コーパス作成および音声認識システムの開発について述べる.インドネシア語は実際には,大部分の人にとって,自分が属する民族の母国語の後で習う第二言語であり,インドネシア語音声コーパス作成における一つの問題になる.音声認識システム開発では,主な問題の一つとして,音響モデル学習に対するラベル付けされた発話が必要であることがあげられる.等間隔セグメンテーションによる初期化では十分な性能を得られない.そこで, 我々は英語音声認識器をインドネシア語発声の初期セグメント作成に利用した.この手法により,性能を絶対値で40%上げることができた.
抄録(英) In this paper, we describe our efforts in developing Indonesian speech corpus and speech recognition system. Difficulties arise in developing Indonesian speech corpus since Indonesian is actually most people's second language after their own ethnic native language. In developing speech recognition system, segmented utterances according to labels as a starting point for training speech models also one of the main issues. The initialization method with uniform segmentation would not give sufficient performance. Here, we used an English speech recognizer to set initial segmentation of Indonesian utterances. This method improves the performance significantly up to 40% absolute.
キーワード(和) インドネシア語音声認識 / 音声コーパス / 等間隔セグメンテーション / 他の言語による新しい言語発声のセグメンテーション
キーワード(英) Indonesian speech recognition system / speech corpus development / uniform segmentation / new language segmentation utterance with other different language
資料番号 NLC2004-71,SP2004-111
発行日

研究会情報
研究会 SP
開催期間 2004/12/14(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 ENG
タイトル(和) インドネシア語の音声コーパス作成および音声認識システムの開発(ポスターセッション)(第6回音声言語シンポジウム)
サブタイトル(和)
タイトル(英) Development of Speech Corpus and Speech Recognition System for Indonesian Language
サブタイトル(和)
キーワード(1)(和/英) インドネシア語音声認識 / Indonesian speech recognition system
キーワード(2)(和/英) 音声コーパス / speech corpus development
キーワード(3)(和/英) 等間隔セグメンテーション / uniform segmentation
キーワード(4)(和/英) 他の言語による新しい言語発声のセグメンテーション / new language segmentation utterance with other different language
第 1 著者 氏名(和/英) / Sakriani SAKTI
第 1 著者 所属(和/英) ATR音声言語コミュニケーション研究所
Spoken Language Translation Research Laboratories, ATR
第 2 著者 氏名(和/英) / / Paulus HUTAGAOL
第 2 著者 所属(和/英) /
R&D Division, PT Telekomunikasi Indonesia
第 3 著者 氏名(和/英) 中村 哲 / Airy Akhmad ARMAN
第 3 著者 所属(和/英) ATR音声言語コミュニケーション研究所
Electrical Engineering Department, Bandung Institute of Technology
発表年月日 2004/12/14
資料番号 NLC2004-71,SP2004-111
巻番号(vol) vol.104
号番号(no) 542
ページ範囲 pp.-
ページ数 6
発行日