講演名 | 2004/12/14 インドネシア語の音声コーパス作成および音声認識システムの開発(ポスターセッション)(第6回音声言語シンポジウム) , /, 中村 哲, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本論文では,我々の行ったインドネシア語の音声コーパス作成および音声認識システムの開発について述べる.インドネシア語は実際には,大部分の人にとって,自分が属する民族の母国語の後で習う第二言語であり,インドネシア語音声コーパス作成における一つの問題になる.音声認識システム開発では,主な問題の一つとして,音響モデル学習に対するラベル付けされた発話が必要であることがあげられる.等間隔セグメンテーションによる初期化では十分な性能を得られない.そこで, 我々は英語音声認識器をインドネシア語発声の初期セグメント作成に利用した.この手法により,性能を絶対値で40%上げることができた. |
抄録(英) | In this paper, we describe our efforts in developing Indonesian speech corpus and speech recognition system. Difficulties arise in developing Indonesian speech corpus since Indonesian is actually most people's second language after their own ethnic native language. In developing speech recognition system, segmented utterances according to labels as a starting point for training speech models also one of the main issues. The initialization method with uniform segmentation would not give sufficient performance. Here, we used an English speech recognizer to set initial segmentation of Indonesian utterances. This method improves the performance significantly up to 40% absolute. |
キーワード(和) | インドネシア語音声認識 / 音声コーパス / 等間隔セグメンテーション / 他の言語による新しい言語発声のセグメンテーション |
キーワード(英) | Indonesian speech recognition system / speech corpus development / uniform segmentation / new language segmentation utterance with other different language |
資料番号 | NLC2004-71,SP2004-111 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2004/12/14(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | ENG |
タイトル(和) | インドネシア語の音声コーパス作成および音声認識システムの開発(ポスターセッション)(第6回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | Development of Speech Corpus and Speech Recognition System for Indonesian Language |
サブタイトル(和) | |
キーワード(1)(和/英) | インドネシア語音声認識 / Indonesian speech recognition system |
キーワード(2)(和/英) | 音声コーパス / speech corpus development |
キーワード(3)(和/英) | 等間隔セグメンテーション / uniform segmentation |
キーワード(4)(和/英) | 他の言語による新しい言語発声のセグメンテーション / new language segmentation utterance with other different language |
第 1 著者 氏名(和/英) | / Sakriani SAKTI |
第 1 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 Spoken Language Translation Research Laboratories, ATR |
第 2 著者 氏名(和/英) | / / Paulus HUTAGAOL |
第 2 著者 所属(和/英) | / R&D Division, PT Telekomunikasi Indonesia |
第 3 著者 氏名(和/英) | 中村 哲 / Airy Akhmad ARMAN |
第 3 著者 所属(和/英) | ATR音声言語コミュニケーション研究所 Electrical Engineering Department, Bandung Institute of Technology |
発表年月日 | 2004/12/14 |
資料番号 | NLC2004-71,SP2004-111 |
巻番号(vol) | vol.104 |
号番号(no) | 542 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |