講演名 | 2000/12/15 「日本語話し言葉コーパス」の書き起こし基準について 小磯 花絵, 土屋 菜穂子, 間淵 洋子, 斉藤 美紀, 籠宮 隆之, 菊池 英明, 前川 喜久雄, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 国立国語研究所, 通信総合研究所, 東京工業大学では, 科学技術振興調整費開放的融合研究制度の下, 自発性の高い話し言葉の情報処理技術の確立を目標に活動を進めている.現在国立国語研究所では, このプロジェクトの一環として, モノローグを対象とした大規模な日本語話し言葉コーパスを作成している.このコーパスには, 約700時間(約700万形態素に相当)の音声, 書き起こしテキスト, および形態素などの情報が含まれる予定である.本稿では, 本コーパスの書き起こし基準の詳細について紹介する. |
抄録(英) | A large-scale corpus of spontaneous Japanese speech is being compiled as a joint work of the National Language Research Institute, the Communications Research Laboratory, and Tokyo Institute of Technology. This corpus is designed to contain about 700 hours of speech (about 7 million morphemes), a transcription, and various tagging information such as POS information. This article describes the details of the transcription criteria for this corpus. |
キーワード(和) | 話し言葉コーパス / 自発的発話 / モノローグ / 書き起こし基準 |
キーワード(英) | spoken corpus / spontaneous speech / monologue / transcription criteria |
資料番号 | NLC2000-56,SP2000-104 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2000/12/15(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 「日本語話し言葉コーパス」の書き起こし基準について |
サブタイトル(和) | |
タイトル(英) | Transcription Criteria for the Corpus of Spontaneous Japanese |
サブタイトル(和) | |
キーワード(1)(和/英) | 話し言葉コーパス / spoken corpus |
キーワード(2)(和/英) | 自発的発話 / spontaneous speech |
キーワード(3)(和/英) | モノローグ / monologue |
キーワード(4)(和/英) | 書き起こし基準 / transcription criteria |
第 1 著者 氏名(和/英) | 小磯 花絵 / Hanae Koiso |
第 1 著者 所属(和/英) | 国立国語研究所 The National Language Research Institute |
第 2 著者 氏名(和/英) | 土屋 菜穂子 / Naoko Tsuchiya |
第 2 著者 所属(和/英) | 国立国語研究所 : 青山学院大学大学院 Aoyama Gakuin University : The National Language Research Institute |
第 3 著者 氏名(和/英) | 間淵 洋子 / Yoko Mabuchi |
第 3 著者 所属(和/英) | 国立国語研究所 : 東京都立大学大学院 Tokyo Metropolitan University : The National Language Research Institute |
第 4 著者 氏名(和/英) | 斉藤 美紀 / Miki Saito |
第 4 著者 所属(和/英) | 国立国語研究所 : 東京大学大学院 Tokyo University : The National Language Research Institute |
第 5 著者 氏名(和/英) | 籠宮 隆之 / Takayuki Kagomiya |
第 5 著者 所属(和/英) | 国立国語研究所 The National Language Research Institute |
第 6 著者 氏名(和/英) | 菊池 英明 / Hideaki Kikuchi |
第 6 著者 所属(和/英) | 国立国語研究所 The National Language Research Institute |
第 7 著者 氏名(和/英) | 前川 喜久雄 / Kikuo Maekawa |
第 7 著者 所属(和/英) | 国立国語研究所 The National Language Research Institute |
発表年月日 | 2000/12/15 |
資料番号 | NLC2000-56,SP2000-104 |
巻番号(vol) | vol.100 |
号番号(no) | 521 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |