お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2017-10-20 10:40
講義・講演の自動字幕システムを想定した低コストな半自動修正・適応手法
田宮健多寺田侑司甲斐充彦静岡大SP2017-50 WIT2017-46
抄録 (和) 自動音声認識(ASR)技術を利用することで、講義等の音声を低コスト、リアルタイムに字幕化することができ、聴覚障害者にとって大きな助けとなる。しかしASRシステムを用いる場合、特に大学講義では専門用語が未知語となりやすいことや、話者や収録環境によって認識精度が大きく左右される問題がある。このような誤認識結果を修正するために、従来では複数のオペレータが必要で高コストであったり、大きな遅延が生じる問題があった。本稿で提案する半自動修正の仕組みは、自動音声認識システムが出力するテキストに対して人手による修正を行うが、作業内容として修正してもらう範囲を限定して修正語の入力のみに限定することで低コストおよび低遅延化を図る。具体的には、聴覚障害者等が字幕から内容を理解する際に影響が大きいと思われる専門用語のような語だけを修正対象とし、修正支援者に求められる作業内容はそれらの修正語の入力だけに限定する。そして、音声検索語検出(STD)を利用して修正語の出現時刻を特定してASRシステムが出力する中間表現のラティスを修正することで、半自動的な修正を実現する。提案手法では、一部の重要な修正語のみを対象として字幕修正を行うため全ての誤認識が修正されるわけではない。そこで、一回分の講義の修正字幕が得られた後、修正字幕を用いて言語モデルを講義内容に適応させることにより更なる自動修正を行う。実際に講演音声に対する自動音声認識の出力を用いて人手による修正入力を想定した評価実験を行なった結果、提案する仕組みを用いることで修正支援者の作業コストを軽減でき、2つの段階ともに字幕修正の効果が得られることが明らかになった。 
(英) By using Automatic Speech Recognition (ASR) technology, it is possible to subtitle lecture and other voices at low cost and in real time, which is a great help for the hearing impaired people. However, when using the ASR system, there is a problem that the recognition accuracy is greatly influenced by the fact that the technical term tends to become an unknown word especially in a university lecture and the recognition accuracy is greatly influenced by the speaker and the recording environment. In order to correct such a misrecognition result, conventional semi-automatic captioning systems require several operators for simultaneous editing, or cause a large delay for time-consuming editing work. In this paper, we propose a low cost correction method to feedback only a part of errors such as misrecognized technical terms and to identify and correct erroneously recognized segments by using Spoken Term Detection (STD) and lattice modification methods. We also adopt an unsupervised language model adaptation for additional subtitle correction after the modified online caption text were obtained for a lecture. We report the experimental result of our proposed system using the lecture speech corpus.
キーワード (和) 音声認識 / 音声検索語検出 / 自動字幕システム / 認識誤り修正 / 聴覚障害者支援 / / /  
(英) Automatic Speech Recognition / Spoken Term Detection / Automatic captioning system / Recognition error correction / Supporting hearing impaired / / /  
文献情報 信学技報, vol. 117, no. 250, SP2017-50, pp. 89-94, 2017年10月.
資料番号 SP2017-50 
発行日 2017-10-12 (SP, WIT) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
査読に
ついて
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります.
PDFダウンロード SP2017-50 WIT2017-46

研究会情報
研究会 WIT SP  
開催期間 2017-10-19 - 2017-10-20 
開催地(和) 九工大戸畑図書館(北九州) 
開催地(英) Tobata Library of Kyutech (Kitakyushu) 
テーマ(和) 福祉情報工学と音声,一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SP 
会議コード 2017-10-WIT-SP 
本文の言語 日本語 
タイトル(和) 講義・講演の自動字幕システムを想定した低コストな半自動修正・適応手法 
サブタイトル(和)  
タイトル(英) Low Cost Semi-automatic Correction and Adaptation Method Assuming Automatic Captioning System for Lectures 
サブタイトル(英)  
キーワード(1)(和/英) 音声認識 / Automatic Speech Recognition  
キーワード(2)(和/英) 音声検索語検出 / Spoken Term Detection  
キーワード(3)(和/英) 自動字幕システム / Automatic captioning system  
キーワード(4)(和/英) 認識誤り修正 / Recognition error correction  
キーワード(5)(和/英) 聴覚障害者支援 / Supporting hearing impaired  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 田宮 健多 / Tamiya Kenta / タミヤ ケンタ
第1著者 所属(和/英) 静岡大学 (略称: 静岡大)
Shizuoka University (略称: Shizuoka Univ.)
第2著者 氏名(和/英/ヨミ) 寺田 侑司 / Terada Yuji / テラダ ユウジ
第2著者 所属(和/英) 静岡大学 (略称: 静岡大)
Shizuoka University (略称: Shizuoka Univ.)
第3著者 氏名(和/英/ヨミ) 甲斐 充彦 / Kai Atsuhiko / カイ アツヒコ
第3著者 所属(和/英) 静岡大学 (略称: 静岡大)
Shizuoka University (略称: Shizuoka Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2017-10-20 10:40:00 
発表時間 20分 
申込先研究会 SP 
資料番号 SP2017-50, WIT2017-46 
巻番号(vol) vol.117 
号番号(no) no.250(SP), no.251(WIT) 
ページ範囲 pp.89-94 
ページ数
発行日 2017-10-12 (SP, WIT) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会