講演名 | 2019-01-24 非言語音に対する疑似音素列定義を用いたリアルタイム非言語音・生活音認識システムの開発 竹之内 翔太郎(電通大), 沼尾 雅之(電通大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 行動認識や状況把握への寄与を目的に,本研究では非言語音や生活音をリアルタイムで認識するためのシステムを提案する.また,話声との識別や雑音入力による誤検出対策も併せて導入する.非言語音が持つ性質を考慮して,一般的な音声認識手法における認識対象を拡張する形で認識手法を提案し,その手法に合ったリアルタイム音声認識エンジンを利用して実装した.その際に,非言語音を正確に認識することを目的として,咳と笑い声に対する疑似音素列および文法定義を提案に導入した.提案手法に対する3つの評価を行った結果,疑似音素列定義を使うことによって非言語音認識への応用の可能性を得たことに加えて,発話中に笑った際でも約50%の割合で笑いを検出できるという結果を得た.しかし,連続音声からのリアルタイム認識を想定した評価を行った結果,特に非言語音の認識精度が悪いことが課題点となった. |
抄録(英) | We propose a real-time non-verbal sound and daily-life sound recognition system, which also reflects identificating with speech and noise. To take characteristic of non-verbal sounds into consideration, we build a recognition method in the form of extending recognition targets of in generic speech recognition method. And we implemented by using a real-time speech recognition engine, which is suitable for our proposal. In order to identificating non-verbal sound accurately, we applied imitate syllable models to non-verbal sound. As a result of 3 evaluations against our proposal, we obtained the possibility of applicating to non-verbal sound recognition by using pseudo phoneme sequence definition. And even if laughter during speech, we got the result that laughter can be detected at a rate of about 50%. However, as a result of evaluation that assumed real time recognition from continuous sound, there was the problem that detection accuracy of non-verbal sound. |
キーワード(和) | 非言語音認識 / 生活音認識 / リアルタイム認識 / 疑似音素列定義 / Julius |
キーワード(英) | Non-Velbal Sound Recognition / Life-Sound Recognition / Realtime Recognition / Imitate syllable definition / Julius |
資料番号 | ICM2018-40,LOIS2018-46 |
発行日 | 2019-01-17 (ICM, LOIS) |
研究会情報 | |
研究会 | ICM / LOIS |
---|---|
開催期間 | 2019/1/24(から2日開催) |
開催地(和) | 鹿児島県文化センター |
開催地(英) | |
テーマ(和) | ライフログ活用技術,オフィス情報システム,ビジネス管理,一般 |
テーマ(英) | Practical Use of Lifelog, Office Information System, Business Management, etc. |
委員長氏名(和) | 吉原 貴仁(KDDI総合研究所) / 山田 智広(NTT) |
委員長氏名(英) | Kiyohito Yoshihara(KDDI Research) / Tomohiro Yamada(NTT) |
副委員長氏名(和) | 山下 陽一(NTT-N) / 三好 匠(芝浦工大) / 小林 透(長崎大) |
副委員長氏名(英) | Yoichi Yamashita(NTT-N) / Takumi Miyoshi(Shibaura Inst. of Tech.) / Toru Kobayashi(Nagasaki Univ.) |
幹事氏名(和) | 服部 雅晴(KDDI総合研究所) / 大石 晴夫(NTT) / 中村 幸博(NTT) / 岡本 基(情報・システム研究機構) |
幹事氏名(英) | Masaharu Hattori(KDDI Research) / Haruo Ooishi(NTT) / Yukihiro Nakamura(NTT) / Motoi Okamoto(Research Organization of Information and Systems) |
幹事補佐氏名(和) | 朱 韵成(日立) / 永徳 真一郎(NTT) |
幹事補佐氏名(英) | Yunchen Zhu(Hitachi) / Shinichiro Eitoku(NTT) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Information and Communication Management / Technical Committee on Life Intelligence and Office Information Systems |
---|---|
本文の言語 | JPN |
タイトル(和) | 非言語音に対する疑似音素列定義を用いたリアルタイム非言語音・生活音認識システムの開発 |
サブタイトル(和) | |
タイトル(英) | Development of living sound and non-verbal sound real-time recognition system using imitated syllable definition against non-verbal sound |
サブタイトル(和) | |
キーワード(1)(和/英) | 非言語音認識 / Non-Velbal Sound Recognition |
キーワード(2)(和/英) | 生活音認識 / Life-Sound Recognition |
キーワード(3)(和/英) | リアルタイム認識 / Realtime Recognition |
キーワード(4)(和/英) | 疑似音素列定義 / Imitate syllable definition |
キーワード(5)(和/英) | Julius / Julius |
第 1 著者 氏名(和/英) | 竹之内 翔太郎 / Shotaro Takenouchi |
第 1 著者 所属(和/英) | 電気通信大学(略称:電通大) The University of Electro-Communications(略称:UEC) |
第 2 著者 氏名(和/英) | 沼尾 雅之 / Masayuki Numao |
第 2 著者 所属(和/英) | 電気通信大学(略称:電通大) The University of Electro-Communications(略称:UEC) |
発表年月日 | 2019-01-24 |
資料番号 | ICM2018-40,LOIS2018-46 |
巻番号(vol) | vol.118 |
号番号(no) | ICM-419,LOIS-420 |
ページ範囲 | pp.27-32(ICM), pp.27-32(LOIS), |
ページ数 | 6 |
発行日 | 2019-01-17 (ICM, LOIS) |