講演抄録/キーワード |
講演名 |
2018-08-27 16:30
[招待講演]音楽・歌声情報処理に基づくインタフェース構築と可視化 ○中野倫靖(産総研) SP2018-31 |
抄録 |
(和) |
音楽や歌声を自動理解する技術は,人の音楽活動を補助する知的なシステムの構築を可能とする.そのようなシステムにおいては,インタラクション技術や可視化技術が重要な役割を担う.本講演では,信号処理と機械学習という基礎技術に基づいた,インタフェース構築や情報可視化に関する研究事例を紹介する.まずインタフェース構築においては,自動理解技術の性能が100%にならない状況を想定した研究を紹介し,インタラクション技術によって実用性が向上することを示す.例えば,人の歌い方を真似る歌声合成インタフェースVocaListenerでは,お手本となる人間の歌声から音高,音量,歌詞の時刻を自動推定して,それを合成結果に反映する.ここで,認識誤りが合成品質を低下させることから,歌詞の同期誤りを指摘するだけで修正できるダメ出しインタラクションを提案した.一方,情報可視化においては,何を可視化するかだけでなく,それをどう可視化するかも考えることで,より効果的な可視化が実現可能となる.そのような研究例として,「何を発声しているか(単語)」と「どう発声しているか(音響特徴量)」を同時に可視化するTextTimeline を紹介する.文字と直交する方向(横書きテキストなら縦方向)に音の時間軸を可視化することで,文字の表示位置を崩さず,かつ音声の時間軸を伸縮させることなく可視化できる特長がある. |
(英) |
Technologies to automatically understand music and singing voices make it possible to develop intelligent systems that support human activities based on music. In such systems, interaction technology and visualization technology play a key role. In this talk, I introduce studies on interface development and information visualization based on signal processing and machine learning as basic technologies. First, in interface development, I introduce studies assuming situations where the performance of automatic recognition technology does not become 100% and show that practicality improves by a human-computer interaction. For example, VocaListener, a singing synthesis interface that imitates singing expressions of a human singer, automatically estimates the fundamental frequency, intensity, and vocalized timings of the target singing, and reflects them to the synthesized voice. Since the synthesis quality deteriorates due to recognition errors, we proposed an interaction that lets a user easily correct lyrics-to-singing synchronization errors just by pointing them out. Regarding information visualization, on the other hand, not only what is visualized but also how to visualize it can be considered, to realize more effective visualization. As an example of such research, I introduce TextTimeline that simultaneously visualizes ``what was uttered ({it i.e.}, words)'' and ``how the words were expressed ({it i.e.}, acoustic features)''. By visualizing the time axis of the sound in a direction orthogonal to the character (vertical direction for horizontal text), TextTimeline can visualize them without changing the display position of the character and without stretching the time axis of the sound. |
キーワード |
(和) |
音楽情報処理 / 歌声情報処理 / Human-Computer Interaction (HCI) / 情報可視化 / / / / |
(英) |
Music information processing / Singing information processing / Human-computer interaction (HCI) / Information visualization / / / / |
文献情報 |
信学技報, vol. 118, no. 198, SP2018-31, pp. 43-43, 2018年8月. |
資料番号 |
SP2018-31 |
発行日 |
2018-08-20 (SP) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2018-31 |
研究会情報 |
研究会 |
SP |
開催期間 |
2018-08-27 - 2018-08-27 |
開催地(和) |
京都大学 |
開催地(英) |
Kyoto Univ. |
テーマ(和) |
認識,理解,一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2018-08-SP |
本文の言語 |
日本語 |
タイトル(和) |
音楽・歌声情報処理に基づくインタフェース構築と可視化 |
サブタイトル(和) |
|
タイトル(英) |
Interface Development and Visualization Based on Information Processing for Music and Singing Voices |
サブタイトル(英) |
|
キーワード(1)(和/英) |
音楽情報処理 / Music information processing |
キーワード(2)(和/英) |
歌声情報処理 / Singing information processing |
キーワード(3)(和/英) |
Human-Computer Interaction (HCI) / Human-computer interaction (HCI) |
キーワード(4)(和/英) |
情報可視化 / Information visualization |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
中野 倫靖 / Tomoyasu Nakano / ナカノ トモヤス |
第1著者 所属(和/英) |
産業技術総合研究所 (略称: 産総研)
National Institute of Advanced Industrial Science and Technology (AIST) (略称: AIST) |
第2著者 氏名(和/英/ヨミ) |
/ / |
第2著者 所属(和/英) |
(略称: )
(略称: ) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2018-08-27 16:30:00 |
発表時間 |
60分 |
申込先研究会 |
SP |
資料番号 |
SP2018-31 |
巻番号(vol) |
vol.118 |
号番号(no) |
no.198 |
ページ範囲 |
p.43 |
ページ数 |
1 |
発行日 |
2018-08-20 (SP) |
|