講演名 2016-11-18
アニメ動画における音声の周波数スペクトルを用いた声優認識
榮田 基希(室蘭工大), 服部 峻(室蘭工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) アニメ動画から音声が流れたとき,それが誰であるか調べようとするならば,エンドロールを探すといった手間を掛ける必要がある.音声から声優認識することが出来るようになれば,手間が掛からずに声優名が分かるだけではなく,その声優の他作品の出演情報やブログ,関連動画や関連商品,これからのイベント情報など幅広く情報を取得することが出来る.これまでの研究では,Webから取得したアニメ動画のキャスト情報や音声の振幅に基づく類似度計算による絞り込みによって声優認識を試みたが,声優認識精度として良好な結果を得ることが出来なかった.そこで本稿では,声優認識するために音声の振幅ではなく周波数パワースペクトルを活用する.データベースに登録されている声優が個々に持つ特有の周波数パワースペクトルのパターンである「特有パワースペクトル」を自己相関分析によって予め特定しておき,実際に流れている再生中の動画の周波数パワースペクトルと,データベースに登録されている個々の声優が持つ特有パワースペクトルとを比較することによって声優認識を行う新しいシステムを提案する.
抄録(英) When we hear someone's voice from an anime video, we need to carry extra burdens of searching the end roll of the anime video in order to know about whose voice it is. If a system can recognize a voice actor from his/her voice on behalf of us, not only we can know about the voice actor's name without carrying extra burdens, but also we can acquire widely information about him/her such as his/her appearance information, blogs, related videos, related goods, and event information in the future. Our previous research has been tackling a system of voice actor recognition with filtering by cast information extracted from the Web and similarity calculation based on voice amplitude, but the system could not give enough good performance as voice actor recognition accuracy. Therefore, this paper proposes a novel system of voice actor recognition that utilizes not voice amplitude but frequency power spectrum. Our proposed system identifies the "characteristic power spectrum" for each of individual voice actors who are registered in the database of the system by auto-correlation analysis in advance, and recognizes a voice actor from a voice in a playing anime video by comparing the voice's frequency power spectrum with each individual voice actor's characteristic power spectrum registered in the database.
キーワード(和) 声優認識 / 音声認識 / 特有パワースペクトル / 自己相関
キーワード(英) Voice Actor Recognition / Speech Recognition / Characteristic Power Spectrum / Auto-Correlation
資料番号 IN2016-64
発行日 2016-11-10 (IN)

研究会情報
研究会 IN / MoNA / CNR
開催期間 2016/11/17(から2日開催)
開催地(和) 霧島観光ホテル
開催地(英) Kirishima-kanko Hotel
テーマ(和) M2M・IoT通信制御、自己組織化・自律分散制御、車載ネットワーク、車車間/路車間通信・ITS、ビッグデータ解析・サイバーフィジカルシステム(CPS)、セキュリティ・プライバシ保護技術、ソーシャルネットワーク(SNS)、サイバー攻撃対策、モバイル仮想化、モバイルアプリケーション、クラウドネットワークロボットの実用化・新規サービス、及び一般
テーマ(英) M2M, IoT, Self Organization, Autonomous Distributed Control, Car Area Network, Car-Car network, Car-Road Network, ITS, Big Data Analysis, Cyber Physical System (CPS), Security Privacy Protection, Social Network (SNS), Cyber Attack resolution, Mobile Virtualization, Mobile Application, Cloud Robotics Service, etc.
委員長氏名(和) 山岡 克式(東工大) / 森野 博章(芝浦工大) / 今井 倫太(慶大)
委員長氏名(英) Katsunori Yamaoka(Tokyo Inst. of Tech.) / Hiroaki Morino(Shibaura Inst. of Tech.) / Michita Imai(Keio Univ.)
副委員長氏名(和) 岸田 卓治(NTT) / 新熊 亮一(京大) / 小野 哲雄(北大) / 神原 誠之(奈良先端大)
副委員長氏名(英) Takuji Kishida(NTT) / Ryoichi Shinkuma(Kyoto Univ.) / Tetsuo Ono(Hokkaido Univ.) / Masayuki Kanbara(NAIST)
幹事氏名(和) 北原 武(KDDI研) / 木村 達郎(NTT) / 鈴木 誠(東大) / 森広 芳文(NTTドコモ) / 坂本 大介(東大) / 大澤 博隆(筑波大)
幹事氏名(英) Takeshi Kitahara(KDDI R&D Labs.) / Tatsuro Kimura(NTT) / Makoto Suzuki(Univ. of Tokyo) / Yoshifumi Morihiro(NTT DoCoMo) / Daisuke Sakamoto(Univ. of Tokyo) / Hirotaka Osawa(Univ. of Tsukuba)
幹事補佐氏名(和) 金子 晋丈(慶大) / 夏目 貴史(NTT) / 石田 繁巳(九大) / 倉沢 央(NTT) / 二瓶 浩一(NEC) / 吉岡 康介(パナソニック) / 山本 大介(東芝) / 松元 崇裕(NTT)
幹事補佐氏名(英) Kunitake Kaneko(Keio Univ.) / Takashi Natsume(NTT) / Shigemi Ishida(Kyushu Univ.) / Hisashi Kurasawa(NTT) / Koichi Nihei(NEC) / Kosuke Yoshioka(Panasonic) / Daisuke Yamamoto(Toshiba) / Takahiro Matsumoto(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Information Networks / Technical Committee on Mobile Network and Applications / Technical Committee on Cloud Network Robotics
本文の言語 JPN
タイトル(和) アニメ動画における音声の周波数スペクトルを用いた声優認識
サブタイトル(和)
タイトル(英) Voice Actor Recognition Using Frequency Spectrum in Anime Video
サブタイトル(和)
キーワード(1)(和/英) 声優認識 / Voice Actor Recognition
キーワード(2)(和/英) 音声認識 / Speech Recognition
キーワード(3)(和/英) 特有パワースペクトル / Characteristic Power Spectrum
キーワード(4)(和/英) 自己相関 / Auto-Correlation
第 1 著者 氏名(和/英) 榮田 基希 / Motoki Eida
第 1 著者 所属(和/英) 室蘭工業大学(略称:室蘭工大)
Muroran Institute of Technology(略称:Muroran Inst. of Tech.)
第 2 著者 氏名(和/英) 服部 峻 / Shun Hattori
第 2 著者 所属(和/英) 室蘭工業大学(略称:室蘭工大)
Muroran Institute of Technology(略称:Muroran Inst. of Tech.)
発表年月日 2016-11-18
資料番号 IN2016-64
巻番号(vol) vol.116
号番号(no) IN-304
ページ範囲 pp.25-30(IN),
ページ数 6
発行日 2016-11-10 (IN)