3月2日(月) 午前 オーガナイズドセッション(一般講演) 09:20 - 11:00 |
(1) |
09:20-09:45 |
複数話者WaveNetボコーダを用いたニューラル話速変換の試み |
○岡本拓磨(NICT)・松原圭亮(神戸大/NICT)・戸田智基(名大/NICT)・志賀芳則・河井 恒(NICT) |
(2) |
09:45-10:10 |
ブラインド音源分離のための高速多チャネル相関テンソル分解 |
○吉井和佳(京大/理研)・関口航平(理研/京大)・坂東宜昭(産総研)・Mathieu Fontaine・Aditya Arie Nugraha(理研) |
(3) |
10:10-10:35 |
一般化Gauss分布に基づく同時対角化制約付き多チャネルNMFを用いたブラインド音源分離 |
○加茂佳吾・久保優騎・高宗典玄(東大)・北村大地(香川高専)・猿渡 洋(東大)・高橋 祐・近藤多伸(ヤマハ) |
(4) |
10:35-11:00 |
機械学習における乗算を用いない次元削減 |
○小野順貴(首都大東京) |
|
11:00-11:10 |
休憩 ( 10分 ) |
3月2日(月) 午前 オーガナイズドセッション(招待講演) 11:10 - 12:00 |
(5) |
11:10-12:00 |
[招待講演]SpeakerBeamに基づく混合音声からの目的話者抽出 |
○デルクロア マーク(NTT)・モリコバ カテリナ(BUT)・木下慶介・落合 翼・中谷智広・荒木章子(NTT) |
|
12:00-13:00 |
昼食 ( 60分 ) |
3月2日(月) 午後 ポスター1 13:00 - 14:30 |
(6) |
13:00-14:30 |
ブラックボックス型敵対的攻撃に対する話者照合システムの脆弱性に関する調査 |
○甲斐優人・塩田さやか・貴家仁志(首都大東京) |
(7) |
13:00-14:30 |
音声に含まれる感情の認識に向けた感情の性質を考慮したソフトラベル学習 |
○大澤まゆ子・井本桂右・山西良典・山下洋一(立命館大) |
(8) |
13:00-14:30 |
系列分類型ニューラルネットワークを用いた日本語方言識別の検討 |
○今泉 遼(首都大東京)・増村 亮(NTT)・塩田さやか・貴家仁志(首都大東京) |
(9) |
13:00-14:30 |
[ポスター講演]複数の補助ネットワークを利用したニューラル音声区間検出の大規模学習の検討 |
○増村 亮・松井清彰・小泉悠馬・大庭隆伸(NTT) |
(10) |
13:00-14:30 |
時間反転音声を用いた音声認識のためのデータ拡張 ~ 特徴量系列における反転 ~ |
○芦原孝典・田中智大・森谷崇史・増村 亮・篠原雄介・柏野牧夫(NTT) |
(11) |
13:00-14:30 |
End-to-end音声認識における会議音声への適応および回り込み音声の影響軽減 |
○大内一亜・甲斐充彦(静岡大) |
(12) |
13:00-14:30 |
DNNに基づく話し言葉音声合成における追加コンテキストの効果 |
○山下優樹・郡山知樹・齋藤佑樹・高道慎之介(東大)・井島勇祐・増村 亮(NTT)・猿渡 洋(東大) |
(13) |
13:00-14:30 |
模擬難聴システムWHISを用いた発声訓練音声の発声特徴量と聴覚特徴量 |
○東山宗一・吉木華子・河原英紀・入野俊夫(和歌山大) |
(14) |
13:00-14:30 |
[ポスター講演]周波数ごとの反射音打ち消しを用いた反射音環境におけるスピーカ特性測定の検討 |
○森谷晃行・金田 豊(東京電機大) |
(15) |
13:00-14:30 |
[ポスター講演]MUSIC音源方向推定における低周波数帯の劣化要因と改善法の検討 |
○湯浅一輝・金田 豊(東京電機大) |
(16) |
13:00-14:30 |
[ポスター講演]イベント検知のための分散型無線同期集音システムの開発 |
○北島 拓・大久保 寛・田川憲男(首都大東京) |
(17) |
13:00-14:30 |
[ポスター講演]ヘッドホン再生のためのステレオ音源加工方法の空間印象評価 |
○上野裕生・水町光徳(九工大)・堀内俊治(KDDI総合研究所) |
(18) |
13:00-14:30 |
[ポスター講演]狭帯域信号を用いた音像定位における精度と偏り方向の特徴 |
○山田美知花・佐瀬文一(首都大東京)・堀内俊治(KDDI総合研究所)・大久保 寛(首都大東京) |
(19) |
13:00-14:30 |
[ポスター講演]指向性制御とステレオ幅制御を用いた音場の選択的合成 |
○堀内俊治・新井田 統(KDDI総合研究所) |
(20) |
13:00-14:30 |
[ポスター講演]3マイクロホンを用いたジブクレーンの振れ角計測 |
○堀江直貴・中本昌由・山本 透(広島大) |
(21) |
13:00-14:30 |
[ポスター講演]GANを用いたCNNによる影検出と影除去 |
○長江貴弘・安孫子 涼・山口拓郎・池原雅章(慶大) |
(22) |
13:00-14:30 |
[ポスター講演]A Robust Approach to Jointly-Sparse Signal Recovery Based on Minimax Concave Loss Function |
○Kyohei Suzuki・Masahiro Yukawa(Keio Univ.) |
(23) |
13:00-14:30 |
[ポスター講演][ポスター講演]非線形IIRフィルタの非線形音響エコーキャンセラへの応用 |
○岩居健太(立命館大)・梶川嘉延(関西大) |
(24) |
13:00-14:30 |
[ポスター講演]スペクトル特徴量を利用した深層学習による歪みエフェクタの高精度モデリング |
○吉本健人・北原大地・平林 晃(立命館大) |
(25) |
13:00-14:30 |
[ポスター講演]ガウス過程に基づく場の計測のための推定・候補領域を独立に設定可能なセンサ配置法 |
○西田智哉・植野夏樹・小山翔一・猿渡 洋(東大) |
(26) |
13:00-14:30 |
[ポスター講演]微分可能な凸損失関数を用いたオーバーサンプリングされたクリップ信号の復元 |
○植野夏樹・小山翔一・猿渡 洋(東大) |
(27) |
13:00-14:30 |
[ポスター講演]重み関数を用いたフェイズドアレイ技術を利用した携帯型パラメトリックスピーカのビーム制御 |
○中川京佑・梶川嘉延(関西大) |
(28) |
13:00-14:30 |
[ポスター講演]2マイクロホンによる3音源定位の有効な音源配置 |
○菊池慶樹・石黒智之・陶山健仁(東京電機大) |
|
14:30-14:45 |
休憩 ( 15分 ) |
3月2日(月) 午後 SIP1 14:45 - 15:35 |
(29) |
14:45-15:10 |
反復位相復元を利用した音声スペクトログラムへの画像埋め込み |
○川村 新(京都産大) |
(30) |
15:10-15:35 |
L0ノルム最小化における秘匿スパース表現を用いたパターン認識法 |
○仲地孝之・Yitu Wang(NTT)・貴家仁志(首都大東京) |
|
15:35-15:45 |
休憩 ( 10分 ) |
3月2日(月) 午後 SP1 15:45 - 16:35 |
(31) |
15:45-16:10 |
音声認識におけるEncoder-Decoderモデルの注意重みを用いたCTCモデルへの知識蒸留の評価 |
○森谷崇史・佐藤 宏・田中智大・芦原孝典・増村 亮・篠原雄介(NTT) |
(32) |
16:10-16:35 |
深層距離学習に基づく構音障害者音声認識 |
○高島悠樹・高島遼一・滝口哲也・有木康雄(神戸大) |
|
16:35-16:45 |
休憩 ( 10分 ) |
3月2日(月) 午後 フェロー記念講演 16:45 - 17:25 |
(33) |
16:45-17:25 |
[フェロー記念講演]メディア情報の辞書をつくる |
○柏野邦夫(NTT) |
3月3日(火) 午前 ポスター2 09:00 - 10:30 |
(34) |
09:00-10:30 |
[ポスター講演]日本人による英語自然発声を対象とした流暢さの高精度自動スコアリングの実現 |
○安ヵ川彩乃・安藤慎太郎・紺野瑛介・林 振超・井上雄介・齋藤大輔・峯松信明(東大)・斉藤一弥(Univ. Coll. London) |
(35) |
09:00-10:30 |
[ポスター講演]音読スキルの定量評価に向けた大規模主観評価データの収集と分析 |
○大鶴拓哉(東大)・井島勇祐(NTT)・齋藤大輔・峯松信明(東大) |
(36) |
09:00-10:30 |
[ポスター講演]Automatic estimation of prosodic control made in English utterances using DNN-based acoustic models trained with prosodic features and labels |
○Yang Shen・Shintarou Ando・Nobuaki Minematsu・Daisuke Saito(UTokyo)・Satoshi Kobashikawa(NTT) |
(37) |
09:00-10:30 |
[ポスター講演]日本語end-to-end音声合成を用いた韻律シンボル教示とその音響的実現に関する音声教育的考察 |
○吉澤風希(東大)・熊野 正(NHK)・峯松信明(東大)・栗原 清(NHK) |
(38) |
09:00-10:30 |
朗読音声を用いたノンパラレル声質変換による変換音声の話者性と表現の評価 |
○永瀬亮太郎・井本桂右・山西良典・山下洋一(立命館大) |
(39) |
09:00-10:30 |
CycleVAEを用いたクロスリンガル声質変換 |
○中谷 輝・Patrick Lumban Tobing・武田一哉・戸田智基(名大) |
(40) |
09:00-10:30 |
変分自己符号化器を用いた空気・体内伝導音の結合音源モデリングに基づく半教師あり自己発声音強調・抑圧 |
○関 翔悟・高田萌絵・武田一哉・戸田智基(名大) |
(41) |
09:00-10:30 |
組み込み向けHMM音声合成における大規模音声コーパスの利用に関する検討 |
○西澤信行・小原朋広・石先広海(KDDI総合研究所) |
(42) |
09:00-10:30 |
長期文脈を考慮したPointer-Generator Networkに基づく話し言葉・書き言葉変換 |
○庵 愛・高島瑛彦・増村 亮(NTT) |
(43) |
09:00-10:30 |
フィードバック型能動騒音制御システムにおける事前推定適応フィルタのステップサイズ制御法に関する検討 |
○藤井健作(コダウェイ研)・棟安実治(関西大)・苣木禎史(千葉工大) |
(44) |
09:00-10:30 |
[ポスター講演]画像の物体検出に基づくサウンドスケープ自動生成システムの設計 |
○苣木禎史(千葉工大)・堀内俊治(KDDI総合研究所) |
(45) |
09:00-10:30 |
[ポスター講演]回帰誤差を用いた残響時間推定方法の検討 |
○飯山陽平・金田 豊(東京電機大) |
(46) |
09:00-10:30 |
[ポスター講演]鈴虫の鳴き声による個体識別へ向けた高解像度音響解析 |
○大塚英時・佐瀬文一・大久保 寛(首都大東京) |
(47) |
09:00-10:30 |
[ポスター講演]対向型超音波センサアレイによる無指向性音源の基礎検討 |
○岡本恭佳・大久保 寛(首都大東京) |
(48) |
09:00-10:30 |
[ポスター講演]聴覚フィルタバンクを利用した定常音に対するラウドネスモデルの構築 |
○磯山拓都・木谷俊介・鵜木祐史(北陸先端大) |
(49) |
09:00-10:30 |
[ポスター講演]ニューラルネットワークとウェーブレット基底関数の同時学習に基づく多重解像度深層分析を用いた時間領域音源分離 |
○小塚詩穂里・中村友彦・猿渡 洋(東大) |
(50) |
09:00-10:30 |
[ポスター講演]集中治療室での騒音低減を目的とする補助フィルタ法を用いたベッドANCシステム |
○前田怜央・梶川嘉延(関西大)・劉 麗川・畢 聰智(北イリノイ大) |
(51) |
09:00-10:30 |
[ポスター講演]SPIHTアルゴリズムを用いたグラフ信号の符号化のための多スケールグラフ構築法 |
○阿部幸輔・田中雄一(東京農工大) |
(52) |
09:00-10:30 |
[ポスター講演]音素セット縮小に用いる言語モデル比較 |
○古明地秀治・田中聡久(東京農工大)・篠田浩一(東工大) |
(53) |
09:00-10:30 |
[ポスター講演]畳み込みニューラルネットワークを用いた脳波解析による非等時性リズム想像のデコーディング |
○吉村直己・田中聡久(東京農工大) |
(54) |
09:00-10:30 |
[ポスター講演]水制の模型実験による畳み込みスパース符号化動的モード分解の性能評価 |
○新井裕介・金子侑平・村松正吾・安田浩保・早坂圭司・大竹 雄(新潟大) |
(55) |
09:00-10:30 |
[ポスター講演]音楽と音声の同時傾聴時における脳波解析による注意方向の推定 |
○松井亮祐・田中聡久(東京農工大) |
(56) |
09:00-10:30 |
[ポスター講演]てんかん性脳波異常区間の検出におけるニューラルネットワークモデルの一検討 |
○福森航輔(東京農工大)・吉田 登(順天堂大)・田中聡久(東京農工大) |
(57) |
09:00-10:30 |
[ポスター講演]EpiNet:発作間欠期頭蓋内脳波からてんかん発作起始領域を推定する畳み込みニューラルネットワーク |
○森 滉介・福森航輔・田中聡久(東京農工大)・飯村康司・三橋 匠・菅野秀宣(順天堂大) |
|
10:30-10:45 |
休憩 ( 15分 ) |
3月3日(火) 午前 招待講演 10:45 - 11:35 |
(58) |
10:45-11:35 |
[招待講演]深層学習ベースの音源分離において空間モデルを如何に取り込むべきか? |
○戸上真人(LINE) |
|
11:35-12:35 |
昼食 ( 60分 ) |
3月3日(火) 午後 EA 12:35 - 13:25 |
(59) |
12:35-13:00 |
周波数領域ベルベットノイズを用いた残響時間の実時間可視化の検討 |
○河原英紀(和歌山大)・榊原健一(北海道医療大)・水町光徳(九工大)・森勢将雅(明大)・坂野秀樹(名城大) |
(60) |
13:00-13:25 |
副音声制作におけるダイアログレベル自動調整のための客観指標の検討 |
○久保弘樹・大出訓史(NHK) |
|
13:25-13:35 |
休憩 ( 10分 ) |
3月3日(火) 午後 SP2 13:35 - 14:50 |
(61) |
13:35-14:00 |
音声の基本周波数に対する聴覚の影響の測定への周波数領域ベルベットノイズの応用について |
○河原英紀(和歌山大)・榊原健一(北海道医療大)・津崎 実(京都市芸術大)・松井淑恵(豊橋技科大)・森勢将雅(明大)・入野俊夫(和歌山大) |
(62) |
14:00-14:25 |
話者認識のための音声原波形、線形予測波形、残差波形からの特徴パラメータの比較 |
○中川聖一・花井洸斗・山本一公(中部大) |
(63) |
14:25-14:50 |
円滑な音声対話のためのセミブラインド音源分離と音声区間検出の統合 |
○和気雅弥・戸上真人(LINE)・吉井和佳・河原達也(京大) |
|
14:50-15:00 |
休憩 ( 10分 ) |
3月3日(火) 午後 SIP2 15:00 - 16:40 |
(64) |
15:00-15:25 |
Multiresolutional graph learning |
○Koki Yamada・Yuichi Tanaka(TUAT) |
(65) |
15:25-15:50 |
エピグラフ射影を用いた混合ノルム最小化 |
○京地清介(北九州市大)・小野峻佑(東工大) |
(66) |
15:50-16:15 |
生育診断の熟練者の視線に基づく圃場ヒートマップ |
○渡辺秀典(熊本県産技センター) |
(67) |
16:15-16:40 |
宛先ポート行列の低ランク性を用いたポートスキャン検出法 |
○農宗弘貴・山岸昌夫・山田 功(東工大) |