講義・講演の自動字幕システムを想定した低コストな半自動修正・適応手法

田宮,健多; 寺田,侑司; 甲斐,充彦

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2017-10-20 10:40 講義・講演の自動字幕システムを想定した低コストな半自動修正・適応手法 ○田宮健多・寺田侑司・甲斐充彦（静岡大） SP2017-50 WIT2017-46
抄録	（和）	自動音声認識(ASR)技術を利用することで、講義等の音声を低コスト、リアルタイムに字幕化することができ、聴覚障害者にとって大きな助けとなる。しかしASRシステムを用いる場合、特に大学講義では専門用語が未知語となりやすいことや、話者や収録環境によって認識精度が大きく左右される問題がある。このような誤認識結果を修正するために、従来では複数のオペレータが必要で高コストであったり、大きな遅延が生じる問題があった。本稿で提案する半自動修正の仕組みは、自動音声認識システムが出力するテキストに対して人手による修正を行うが、作業内容として修正してもらう範囲を限定して修正語の入力のみに限定することで低コストおよび低遅延化を図る。具体的には、聴覚障害者等が字幕から内容を理解する際に影響が大きいと思われる専門用語のような語だけを修正対象とし、修正支援者に求められる作業内容はそれらの修正語の入力だけに限定する。そして、音声検索語検出(STD)を利用して修正語の出現時刻を特定してASRシステムが出力する中間表現のラティスを修正することで、半自動的な修正を実現する。提案手法では、一部の重要な修正語のみを対象として字幕修正を行うため全ての誤認識が修正されるわけではない。そこで、一回分の講義の修正字幕が得られた後、修正字幕を用いて言語モデルを講義内容に適応させることにより更なる自動修正を行う。実際に講演音声に対する自動音声認識の出力を用いて人手による修正入力を想定した評価実験を行なった結果、提案する仕組みを用いることで修正支援者の作業コストを軽減でき、２つの段階ともに字幕修正の効果が得られることが明らかになった。
	（英）	By using Automatic Speech Recognition (ASR) technology, it is possible to subtitle lecture and other voices at low cost and in real time, which is a great help for the hearing impaired people. However, when using the ASR system, there is a problem that the recognition accuracy is greatly influenced by the fact that the technical term tends to become an unknown word especially in a university lecture and the recognition accuracy is greatly influenced by the speaker and the recording environment. In order to correct such a misrecognition result, conventional semi-automatic captioning systems require several operators for simultaneous editing, or cause a large delay for time-consuming editing work. In this paper, we propose a low cost correction method to feedback only a part of errors such as misrecognized technical terms and to identify and correct erroneously recognized segments by using Spoken Term Detection (STD) and lattice modification methods. We also adopt an unsupervised language model adaptation for additional subtitle correction after the modified online caption text were obtained for a lecture. We report the experimental result of our proposed system using the lecture speech corpus.
キーワード	（和）	音声認識 / 音声検索語検出 / 自動字幕システム / 認識誤り修正 / 聴覚障害者支援 / / /
	（英）	Automatic Speech Recognition / Spoken Term Detection / Automatic captioning system / Recognition error correction / Supporting hearing impaired / / /
文献情報		信学技報, vol. 117, no. 250, SP2017-50, pp. 89-94, 2017年10月.
資料番号		SP2017-50
発行日		2017-10-12 (SP, WIT)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
査読について		本技術報告は査読を経ていない技術報告であり，推敲を加えられていずれかの場に発表されることがあります．
PDFダウンロード		SP2017-50 WIT2017-46

研究会情報
研究会	WIT SP
開催期間	2017-10-19 - 2017-10-20
開催地（和）	九工大戸畑図書館（北九州）
開催地（英）	Tobata Library of Kyutech (Kitakyushu)
テーマ（和）	福祉情報工学と音声，一般
テーマ（英）
講演論文情報の詳細
申込み研究会	SP
会議コード	2017-10-WIT-SP
本文の言語	日本語
タイトル（和）	講義・講演の自動字幕システムを想定した低コストな半自動修正・適応手法
サブタイトル（和）
タイトル（英）	Low Cost Semi-automatic Correction and Adaptation Method Assuming Automatic Captioning System for Lectures
サブタイトル（英）
キーワード(1)（和/英）	音声認識 / Automatic Speech Recognition
キーワード(2)（和/英）	音声検索語検出 / Spoken Term Detection
キーワード(3)（和/英）	自動字幕システム / Automatic captioning system
キーワード(4)（和/英）	認識誤り修正 / Recognition error correction
キーワード(5)（和/英）	聴覚障害者支援 / Supporting hearing impaired
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	田宮健多 / Tamiya Kenta / タミヤケンタ
第1著者所属（和/英）	静岡大学 (略称：静岡大) Shizuoka University (略称： Shizuoka Univ.)
第2著者氏名（和/英/ヨミ）	寺田侑司 / Terada Yuji / テラダユウジ
第2著者所属（和/英）	静岡大学 (略称：静岡大) Shizuoka University (略称： Shizuoka Univ.)
第3著者氏名（和/英/ヨミ）	甲斐充彦 / Kai Atsuhiko / カイアツヒコ
第3著者所属（和/英）	静岡大学 (略称：静岡大) Shizuoka University (略称： Shizuoka Univ.)
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2017-10-20 10:40:00
発表時間	20分
申込先研究会	SP
資料番号	SP2017-50, WIT2017-46
巻番号（vol）	vol.117
号番号（no）	no.250(SP), no.251(WIT)
ページ範囲	pp.89-94
ページ数	6
発行日	2017-10-12 (SP, WIT)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会