第6回音声研究会 (2004年12月) 開催のご案内
日時: 平成16年12月21日(火)・22日(水)
会場: 国際電気通信基礎技術研究所(ATR)
(住所 京都府相楽郡精華町光台二丁目2番地2,近鉄京都線新祝園駅よりバス10分
http://www.atr.jp/index_j.html)
主催: 電子情報通信学会 言語理解とコミュニケーション(NLC)研究会
電子情報通信学会および日本音響学会 音声(SP)研究会
情報処理学会 音声言語情報処理(SLP)研究会
協賛: 人工知能学会;言語・音声理解と対話処理(SLUD)研究会
概要:
21日
(午前1) 9:20 - 11:00 雑音下音声処理
(午前2) 11:10 - 12:00 言語モデル
昼休み
(午後1) 13:00 - 15:00 [招待講演] 音声・言語における標準化動向
(午後2) 15:10 - 15:50 ポスター概要講演
(午後3) 16:00 - 17:30 ポスターセッション
22日
(午前1) 9:20 - 10:35 大語彙音声認識
(午前2) 10:45 - 12:00 対話(1)
昼休み
(午後1) 13:00 - 13:45 [招待講演] 自然言語処理の展開
(午後2) 13:55 - 15:35 対話(2)
(午後3) 15:45 - 17:25 音声言語応用
----------------------------------------------------------------------
プログラム:
12月21日(火)
session-1 9:20-11:00 雑音下音声処理
1. 頑健な区間検出とモデル適応に基づく雑音下音声認識
○ 張 志鵬 (NTT ドコモ), 古井 貞煕 (東工大)
2. 音声認識率改善のための波形減算とスペクトル減算の併用による反射音除去法
○大田健紘,柳田益造(同志社大学)
3. 雑音モデルに基づく補正音響尤度を用いた音声認識
○佐藤庄衛,尾上和穂,小林彰夫,今井亨 (NHK技研)
4. SNR and subband SNR estimation based on Gaussian mixture modeling on log-power domain with applications to speech enhancement
Tran Huy Dat,Kazuya Takeda (Graduate school of information science, Nagoya University) and Fumitada Itakura (Graduate school of information engineering, Meijo University)
session-2 11:10-12:00 言語モデル
5. 講演・討論の音声認識のためのトリガー言語モデル適応
○カルロス・トロンコーソ,河原 達也(京大),山本 博史,菊井 玄一郎(ATR-SLT)
6. 意味属性を利用したクラスN-gram言語モデルの評価
○ 池谷 晴生,福田 隆,山田 博文,桂田 浩一,新田 恒雄(豊橋技科大)
session-3 13:00:00-15:00 音声・言語における標準化動向
7. (招待講演) 自動要約評価型ワークショップ:TSC
平尾努 (NTT)
8. (招待講演) 多言語翻訳技術に関する公開性能評価
- 音声翻訳技術のための国際評価ワークショップIWSLT2004 -
中岩浩巳 (NTT)
9. (招待講演) 実環境下音声認識の評価の標準化とその動向
○中村哲(ATR), 武田一哉(名古屋大), 黒岩眞吾(徳島大), 北岡教英(豊橋技科大), 山田武志(筑波大), 山本一公(信州大), 西浦敬信(立命館大), 佐宗晃(産総研),水町光徳(九州工大), 宮島千代美(名古屋大),藤本雅清(ATR),遠藤俊樹(ATR)
session-4 15:10-17:30 ポスターセッション
10. 文脈情報を利用した構文的曖昧性の解消
○ 池ヶ谷 有希(静岡大学情報学部),野口 靖浩(静岡大学情報学部), 小暮 悟(静岡大学情報学部), 小西 達裕(静岡大学情報学部),近藤 真(静岡大学情報学部), 高木 朗(CSK&産総研), 伊東 幸宏(静岡大学情報学部)
11. 依存構造を利用した意味の重ねあわせに基づく連体・連用修飾成分の意味解釈
○相澤 真(静岡大学), 野口 靖浩(静岡大学), 池ヶ谷 有希(静岡大学), 近藤 真(静岡大学), 小西 達裕(静岡大学), 高木 朗(CSK&産総研), 伊東 幸宏(静岡大学情報学部)
12. 依存関係の解釈と概念情報の統合処理
○ 常盤 大樹(法政大学), 内田 尚和(法政大学), 樋本 綾乃(法政大学), 河野 安友未(お茶の水女子大), 高木 朗(CSK&産総研),麻生 英樹(産総研), 中島 秀之(はこだて未来大学), 伊東 幸宏(静岡大学), 小林 一郎(お茶の水女子大), 八名 和夫(法政大学)
13. 混合正規分布モデルに基づく非可聴つぶやき声(NAM)から通常音声への変換
○ 戸田 智基 (名古屋工業大学), 鹿野 清宏 (奈良先端科学技術大学院大学)
14. 固有声を用いた音声合成
森 真也,森山 剛,小沢 慎治(慶應義塾大学)
15. 帯域分割型CSP法に基づく話者位置推定法の検討
○傳田 遊亀(和歌山大学大学院) 西浦 敬信(立命館大学) 河原 英紀(和歌山大学) 入野 俊夫(和歌山大学)
16. マルチストリーム話者照合におけるブースティングに基づく重み最適化法の検討
○浅見 太一,岩野 公司,古井 貞煕 (東工大)
17. Development of Speech Corpus and Speech Recognition System for Indonesian Language
Sakriani Sakti (ATR, SLT Laboratories, Japan) Paulus Hutagaol (R&D Division, PT Telekomunikasi Indonesia, Indonesia) Arry Akhmad Arman (EE Department, Bandung Institut of Technology, Indonesia) Satoshi Nakamura (ATR, SLT Laboratories, Japan)
18. 複数の信頼度尺度を統合した音声認識
小林彰夫,尾上和穂,佐藤庄衛,今井亨(NHK)
19. 音節継続長比モデルを用いた音声認識の検討
○蟻生政秀,益子貴史,田中信一,河村聡典(東芝 研究開発センター)
20. 子供音声認識のための音響モデルの構築および適応手法の評価
○鮫島 充,李 晃伸,猿渡 洋,鹿野 清宏(奈良先端大)
21. HMM Sufficient Statistics Based Speaker Adaptation Using Multiple Acoustic Models for Huge Variety of Training Speakers
○Randy Gomez, Akinobu Lee, Hiroshi Saruwatari, Kiyohiro Shikano
22. Multichannel estimation of the power spectral density of noise for mixtures of non-stationary signals
Wolfgang Herbordt, Spoken Language Translation Research Laboratories, ATR, Kyoto, Japan;Satoshi Nakamura, Spoken Language Translation Research Laboratories, ATR, Kyoto, Japan;Walter Kellermann, Multimedia Communications and Signal Processing, University Erlangen-Nuremberg, Germany;
23. Two-stage Noise Spectra Estimation and Regression based In-car Speech Recognition using Single Distant Microphone
Weifeng Li (Nagoya University) Katunobu Itou (Nagoya University) Kazuya Takeda (Nagoya University) Fumitada Itakura (Meijo University)
24. 背景雑音を対象とした特徴パラメータ正準化法
○ 福田 隆,新田 恒雄 (豊橋技科大)
25. 雑音抑圧手法の主観・客観品質と音声認識性能の関係
○山田武志、熊倉正和、北脇信彦(筑波大学)
26. CENSREC-3: 実走行車内単語音声データベースと評価環境の構築
○ 藤本 雅清, 中村 哲(ATR-SLT), 武田 一哉(名大), 黒岩眞吾(徳島大),山田武志(筑波大), 北岡教英(豊橋技科大), 山本一公(信州大), 水町光徳(九工大), 西浦敬信(立命大), 佐宗 晃(産総研), 宮島千代美(名大), 遠藤俊樹(ATR-SLT)
27. GMMによる雑音抑圧手法選択に基づく雑音下音声認識
○濱口 早太, 北岡 教英, 中川 聖一(豊橋技科大)
12月22日(水)
session-5 9:20-10:35 大語彙音声認識
28. 音声理解のための音声認識評価尺度とベイズ誤り最小化デコーディング
○ 南條 浩輝(龍谷大),河原 達也(京大)
29. Efficient generation of high-order context-dependent weighted finite state transducers for speech recognition
○Schuster Mike(NTT研究所)堀貴明(NTT研究所)
30. VERIFYING LVCSR OUTPUT AT DIFFERENT LEVELS WITH GENERALIZED POSTERIOR PROBABILITY
Wai Kit LO (ATR), Frank K. SOONG (ATR), and Satoshi NAKAMURA (ATR)
session-6 10:45-12:00 対話(1)
31. 情報家電の操作のための対話インタフェースの開発
○ 内田 尚和(法政大学), 常盤 大樹(法政大学), 西 末衣(法政大学), 高木 朗(CSK&産総研), 麻生 英樹(産総研), 橋本 政朋(産総研), 森 彰(産総研), 中島 秀之(はこだて未来大学), 伊東 幸宏(静岡大学), 小林 一郎(お茶の水女子大), 八名 和夫(法政大学)
32. 異なる端末環境から利用可能なMMIアプリケーション開発における記述負担の軽減
青木 一峰,桂田 浩一,山田 博文,新田 恒雄(豊橋技術科学大)
33. エージェントとの対話によってユーザの操作を支援するVoiceWebシステム
大宮広義(京都工芸繊維大学)、荒木雅弘(京都工芸繊維大学)
session-7 13:00-13:45 自然言語処理の展開
34. (招待講演) 状況を考慮した言語理解にむけて
徳永健伸 (東工大)
session-8 13:55-15:35 対話(2)
35. 意味の対応付けと依存関係の解釈を考慮した対話意味表現
○ 高木 朗(CSK&産総研), 麻生 英樹(産総研), 中島 秀之(はこだて未来大学), 伊東 幸宏(静岡大学), 小林 一郎(お茶の水女子大)
36. Out-of-Domain Detection Incorporating Dialogue Context and Topic Clustering
○LANE Ian R.(京大/ATR) 河原 達也(京大/ATR) 中村 哲(ATR)
37. TF*AoIを用いた類似性による発話予測
○木村泰知,荒木健治(北大)
38. ユーザ発話の予測に基づく音声対話システム
○ 西田 昌史, 寺師 弘将, 堀内 靖雄, 市川 熹 (千葉大)
session-9 15:45-17:25 音声言語応用
39. 混合ガウス分布による多言語音声系統樹の構成
○朱 世イ, 板橋 秀一 (筑波大)
40. 音声訂正: ``CHOICE'' on Speech
○ 緒方 淳, 後藤 真孝(産総研)
41. 多言語音声ポータルシステムの構築
○ 大迎 純也(京都工繊大),荒木 雅弘(京都工繊大)
42. 知識を用いた音声認識による野球実況中継の構造化
○ 佐古 淳, 有木 康雄 (神戸大)
シンポジウム実行委員:
実行委員長: 出羽達也(東芝)
副委員長: 広瀬啓吉(東大), 中村哲(ATR)
幹事: 秋葉友良(豊橋技科大), 篠田浩一(東工大), 畑崎香一郎(NEC)
委員: 宇津呂武仁(京大), 中野幹生(HRI-JP), 福本淳一(立命館大), 神崎享子(NICT)
川端豪(関西学院大), 籠島岳彦(東芝), 大川茂樹(千葉工大), 持田岳美(NTT)
武田一哉(名古屋大), 山田武志(筑波大)
* 研究会今後の予定
言語理解とコミュニケーション(NLC)
・2月24日(木)25日(金) 国立情報学研究所 [12月8日(水)]
テーマ:自然言語処理,メディア理解,機械学習
電子情報通信学会PRMU研究会と共催, 電子情報通信学会IBIS研究会協賛
【発表申込・問合先】
中野幹生(ホンダ・リサーチ・インスティチュート・ジャパン)
音声研究会(SP)
・1月27日(木),28日(金) 東京大 [11月17日(水)]
テーマ:一般
【発表申込・問合先】
籠嶋岳彦(東芝)
音声言語処理研究会(SLP)
(今後の予定)