12月9日(火) 午前 音響処理・話者同定 10:00 - 12:05 |
(1) |
10:00-10:25 |
スパース性に基づくブラインド音源分離を用いた2チャンネル入力音声認識 |
○西亀健太・和泉洋介(東大)・渡部晋治(NTT)・西本卓也・小野順貴・嵯峨山茂樹(東大) |
(2) |
10:25-10:50 |
ロボットのためのハンズフリー音声対話システム |
○細谷耕佑・小川哲司・藤江真也・渡辺大地・市川悠飛・谷山 輝・小林哲則(早大) |
(3) |
10:50-11:15 |
音声区間検出と雑音抑圧の統合法を用いた雑音下音声認識 |
○藤本雅清・石塚健太郎・中谷智広(NTT) |
(4) |
11:15-11:40 |
ベイジアンネットワークを用いた単一チャネル信号による背景音楽の抑圧 |
○伊藤弘章・西野隆典・北岡教英・武田一哉(名大) |
(5) |
11:40-12:05 |
音響情報と映像情報の統合による多人数会話における話者決定技術 |
○石塚健太郎・荒木章子・大塚和弘・藤本雅清・中谷智広(NTT) |
|
12:05-13:10 |
昼食 ( 65分 ) |
12月9日(火) 午後 招待講演 13:10 - 14:00 |
(6) |
13:10-14:00 |
[招待講演]音声言語運用が要求する認知的能力と音声言語工学が構築した計算論的能力 |
○峯松信明(東大) |
|
14:00-14:10 |
休憩 ( 10分 ) |
12月9日(火) 午後 音声認識・音響モデル 14:10 - 15:00 |
(7) |
14:10-14:35 |
重回帰HMMに基づくスタイル推定を用いた音声認識における音響モデル学習法 |
○井島勇祐・橘 誠・能勢 隆・小林隆夫(東工大) |
(8) |
14:35-15:00 |
制約付き非負行列因子分解を用いた音声特徴抽出の検討 |
○朴 玄信・滝口哲也・有木康雄(神戸大) |
|
15:00-15:10 |
休憩 ( 10分 ) |
12月9日(火) 午後 言語モデル・システム 15:10 - 16:25 |
(9) |
15:10-15:35 |
PLSA言語モデル適応におけるアニーリングスケジュールの評価 |
○加藤正治(山形大/東北大)・小坂哲夫(山形大)・伊藤彰則・牧野正三(東北大) |
(10) |
15:35-16:00 |
話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識 |
○佐古 淳・有木康雄(神戸大)・岩田具治・渡部晋治・堀 貴明(NTT) |
(11) |
16:00-16:25 |
音声認識システムの満足度評価におけるユーザモデル |
○原 直・北岡教英・武田一哉(名大) |
|
16:25-16:40 |
休憩 ( 15分 ) |
12月9日(火) 午後 10周年企画 16:40 - 18:10 |
|
- |
10周年企画:「音声言語研究関連分野の10年の歩み」
趣旨:本シンポジウムは開催10年目の節目を迎える.
このセッションでは,関連研究分野ごとの10年の進展を
リレー形式でまとめて紹介するとともに,今後の発展に
向けたディスカッションを行う.
「フロントエンド・特徴抽出・音響モデル」
講演:堀 貴明(NTT) 討論:東工大 古井先生
「サーチ・信頼度・LVCSR」
講演:李 晃伸(名工大) 討論:奈良先端大 鹿野先生
「音声対話システム・音声インタフェース」
講演:中野 幹生(HRI-JP) 討論:豊橋技科大 中川先生
「音声検索」
講演:秋葉 友良(豊橋技科大) 討論:京大 河原先生
「機械翻訳」
講演:加藤 直人(NHK技研) 討論:筑波大 宇津呂先生
「言語資源」
講演:竹内 孔一(岡山大) 討論:(株)東芝 出羽様 |
12月10日(水) 午前 音声合成・声質変換 09:30 - 11:10 |
(12) |
09:30-09:55 |
音響的特徴を用いた話し言葉の断片発話単位への分割 |
○瀬戸山勝義(奈良先端大)・柏岡秀紀・ニック キャンベル(奈良先端大/NICT/ATR) |
(13) |
09:55-10:20 |
Bayesian Context Clustering Using Cross Validation for HMM-Based Speech Synthesis |
○Kei Hashimoto・Heiga Zen・Yoshihiko Nankaku・Keiichi Tokuda(Nagoya Institute of Technology) |
(14) |
10:20-10:45 |
Simultaneous Transformation of Duration and Spectrum Using Statistical Models Including Time-Sequence Matching |
○Kaori Yutani・Yoshihiko Nankaku(Nagoya Institute of Technology)・Tomoki Toda(Nara Institute of Science and Technology)・Keiichi Tokuda(Nagoya Institute of Technology) |
(15) |
10:45-11:10 |
基本周波数情報に基づく線形予測と時間軸伸縮を利用した非周期成分の抽出につい |
○河原英紀(和歌山大)・森勢将雅(関西学院大)・高橋 徹(京大)・坂野秀樹(名城大)・西村竜一・入野俊夫(和歌山大) |
|
11:10-11:20 |
休憩 ( 10分 ) |
12月10日(水) 午前 対話 11:20 - 12:35 |
(16) |
11:20-11:45 |
実世界における人とロボットの共有信念に基づいた相互適応的な発話生成 |
○中村慎也(電通大/NICT)・岩橋直人(NICT/ATR)・長井隆行(電通大) |
(17) |
11:45-12:10 |
POMDPを利用した思考喚起型対話の制御 |
○南 泰浩・澤木美奈子・東中竜一郎・堂坂浩二(NTT) |
(18) |
12:10-12:35 |
音声対話用音声認識システム |
○谷口 徹・藤江真也・小林哲則(早大) |
|
12:35-13:40 |
昼食 ( 65分 ) |
12月10日(水) 午後 13:40 - 14:30 |
(19) |
13:40-14:30 |
[招待講演]音声認識応用システム開発の新パラダイム |
○小林哲則(早大) |
|
14:30-14:40 |
休憩 ( 10分 ) |
12月10日(水) 午後 ドキュメント処理・翻訳・言語獲得 14:40 - 15:55 |
(20) |
14:40-15:05 |
SLP音声ドキュメント処理ワーキンググループ活動報告 |
○秋葉友良(豊橋技科大)・相川清明(東京工科大)・伊藤慶明(岩手県立大)・河原達也(京大)・南條浩輝(龍谷大)・西崎博光(山梨大)・安田宜仁(NTT)・山下洋一(立命館大)・松井知子(統計数理研)・胡 新輝(NICT/ATR)・中川聖一(豊橋技科大)・伊藤克亘(法政大) |
(21) |
15:05-15:30 |
会議録作成支援のための国会審議の音声認識システム |
○秋田祐哉・三村正人・河原達也(京大) |
(22) |
15:30-15:55 |
音声翻訳単位の推定における句読点情報の効果 |
○清水 徹(NICT/ATR/京大)・中村 哲(NICT/ATR)・河原達也(NICT/京大) |
|
15:55-16:10 |
休憩 ( 15分 ) |
12月10日(水) 午後 ポスターセッション 16:10 - 18:00 |
(23) |
16:10-18:00 |
対乳児発話におけるピッチアクセントの性質について ~ 理研日本語母子会話コーパスを用いた分析 ~ |
○北原真冬(早大/理研)・西川賢哉(理研/慶大)・五十嵐陽介(国立国語研/理研)・新谷敬人(上智大/理研)・馬塚れい子(理研/デューク大) |
(24) |
16:10-18:00 |
効果音を用いた感性伝達における条件付加による受信感性情報の変化 |
○佐藤真梨・相川清明(東京工科大) |
(25) |
16:10-18:00 |
軟らかい素材による軟口蓋を伴う声道の物理模型 |
○荒井隆行・田中希美(上智大)・片岡竜太(昭和大) |
(26) |
16:10-18:00 |
Articulatory feature extraction based on 3-stage MLNs and Inhibition/Enhancement Network |
○Mohammad Nurul Huda・Hiroaki Kawashima・Tsuneo Nitta(Toyohashi Univ. of Tech.) |
(27) |
16:10-18:00 |
TANDEM-STRAIGHTに基づく基本周波数抽出法の最適化に関する一検討 |
○板垣英恵・森勢将雅・西村竜一・入野俊夫・河原英紀(和歌山大) |
(28) |
16:10-18:00 |
スペクトル平面における勾配ヒストグラムに基づく音声特徴量の検討 |
○室井貴司・滝口哲也・有木康雄(神戸大) |
(29) |
16:10-18:00 |
声道情報を用いたニューラルネット話者照合システム |
○渡辺優介・松本直樹(明大) |
(30) |
16:10-18:00 |
位相情報を利用した話者識別・照合法の評価 |
○王 龍標(静岡大)・南 和江・山本一公・中川聖一(豊橋技科大) |
(31) |
16:10-18:00 |
Dialect-based speaker classification of Chinese using acoustic features invariant with extra-linguistic factors |
○XueBin Ma・Nobuaki Minematsu・Yu Qiao・Keikichi Hirose(Univ. of Tokyo)・Akira Nemoto(Nankai Univ.)・Feng Shi(nankai Univ.) |
(32) |
16:10-18:00 |
Speaker Recognition Based on Gaussian Mixture Models Using Variational Bayesian Method |
○Tatsuya Ito・Kei Hashimoto・Yoshihiko Nankaku・Akinobu Lee・Keiichi Tokuda(Nitech) |
(33) |
16:10-18:00 |
音声の動的特徴のモデルを使った突発性雑音の除去 |
○三宅信之・滝口哲也・有木康雄(神戸大) |
(34) |
16:10-18:00 |
距離マトリクス画像のハフ変換を用いた単語音声区間検出 |
○西 宏之・木村義政・グエン ヴァン ドン(崇城大) |
(35) |
16:10-18:00 |
音声の構造的表象と判別分析を用いた単語音声認識 |
○朝川 智・喬 宇・峯松信明・広瀬啓吉(東大) |
(36) |
16:10-18:00 |
アフィン変換不変性を有する局所的特徴量を用いた音声認識 |
○鈴木雅之・喬 宇・峯松信明・広瀬啓吉(東大) |
(37) |
16:10-18:00 |
HMM音声合成における共分散パラメータの共有に関する検討 |
○大浦圭一郎・全 炳河・南角吉彦・李 晃伸・徳田恵一(名工大) |
(38) |
16:10-18:00 |
Speech Recognition Based on Statistical Models Including Multiple Decision Trees |
○Sayaka Shiota・Kei Hashimoto・Yoshihiko Nankaku・Akinobu Lee・Keiichi Tokuda(Nagoya Institute of Technology) |
(39) |
16:10-18:00 |
話速管理機能を持った原稿提示収録システム(ReCoK5)と話速バリエーション型音声データベース(SRV-DB)の公開について |
○高橋弘太・蔦木圭悟・吉原 亨(電通大) |
(40) |
16:10-18:00 |
音声の高速再生のための話速推定法と高速発話時の特性解析 ~ 話速バリエーション型データベースの活用例 ~ |
○吉原 亨・蔦木圭悟・高橋弘太(電通大) |
(41) |
16:10-18:00 |
音声の雑音比とスペクトルQを用いた全疲労検知 ~ 話者への効率や安全への助言を考えて ~ |
○岡田一秀(トヨタ自動車) |
(42) |
16:10-18:00 |
Driver's irritation detection using speech recognition results |
○Lucas Malta・Chiyomi Miyajima・Akira Ozaki・Norihide Kitaoka・Kazuya Takeda(Nagoya Univ.) |
(43) |
16:10-18:00 |
単語出現順序を考慮したトピックモデルによる言語モデル適応 |
○佐古 淳・滝口哲也・有木康雄(神戸大) |
(44) |
16:10-18:00 |
単語誤り最小化に基づく識別的リスコアリングによる音声認識 |
○小林彰夫・奥 貴裕・本間真一・佐藤庄衛・今井 亨・都木 徹(NHK) |
(45) |
16:10-18:00 |
条件付き確率場を用いた発話内容の分類による音声認識結果の検証 |
○大田健紘・江原暉将(諏訪東京理科大) |
(46) |
16:10-18:00 |
質問応答データベースの自動作成に基づく音声対話システムの評価 |
○森本高弘・伊藤 仁(東北大)・鈴木基之(徳島大)・伊藤彰則・牧野正三(東北大) |
(47) |
16:10-18:00 |
ロボット・エージェント対話行動制御部構築ツールRIME-TKを用いた質問応答機能の実現 |
○成松宏美(津田塾大)・中野幹生(ホンダ・リサーチ・インスティチュート・ジャパン)・船越孝太郎・長谷川雄二・辻野広司(津田塾大) |