講演名 2002/6/21
生字幕放送のための音声認識 : システムの概要とリスピークの効果
本間 真一, 松井 淳, 佐藤 庄衛, 小早川 健, 尾上 和穂, 今井 亨, 安藤 彰男,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) NHKは,音声認識技術を利用したニュース番組の生字幕放送をすでに実現しているが,スポーツなどの生放送番組については,背景雑音や発話スタイル等の問題があるため,直接その番組音声に対してリアルタイムで音声認識を行うことは困難である.そこで我々は,「リスピーカー(re-speaker)」と呼ばれる話者を起用し,この話者が番組音声を聞きながらその内容を言い直し,その声を音声認識することにより生放送番組の字幕放送を実現した.本稿では,ソルトレークシティーオリンピックの生中継において実際に使用された生字幕放送ための音声認識システムと,新たに構築した言語モデルおよび音響モデルの概要を説明する.また,音声認識率やテストセットパープレキシティーなどをもとに,リスピーカーによる言い直しの効果について報告する.
抄録(英) Although NHK has been subtitling broadcast news simultaneously by using a real-time speech recognition system, it is difficult to use the system for other live programs such as sports due to problems caused by background noise, speaking style, etc.. Therefore we decided to use a special speaker called "re-speaker", who listens to the speech in the program and re-speaks the content of that speech into the speech recognizer, and as a result, we realized to subtitle live broadcasts in the live programs. In this paper, we describe an outline of the speech recognition system that was actually used for live subtitling in Salt Lake City Olympic Games and effects of the re-speak method with the speech recognition experimental results and test-set perplexities.
キーワード(和) 字幕放送 / 音声認識 / リアルタイム処理 / リスピーク / 言語モデル / 音響モデル
キーワード(英) Subtitling Broadcast / Speech Recognition / Real-Time Processing / Re-Speak / Language Model / Acoustic Model
資料番号 SP2002-50
発行日

研究会情報
研究会 SP
開催期間 2002/6/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 生字幕放送のための音声認識 : システムの概要とリスピークの効果
サブタイトル(和)
タイトル(英) Speech Recognition for Subtitling Live Broadcasts : An Outline of the System and Effects of Re-Speaking
サブタイトル(和)
キーワード(1)(和/英) 字幕放送 / Subtitling Broadcast
キーワード(2)(和/英) 音声認識 / Speech Recognition
キーワード(3)(和/英) リアルタイム処理 / Real-Time Processing
キーワード(4)(和/英) リスピーク / Re-Speak
キーワード(5)(和/英) 言語モデル / Language Model
キーワード(6)(和/英) 音響モデル / Acoustic Model
第 1 著者 氏名(和/英) 本間 真一 / Shinichi HOMMA
第 1 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 2 著者 氏名(和/英) 松井 淳 / Atsushi MATSUI
第 2 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 3 著者 氏名(和/英) 佐藤 庄衛 / Shoei SATO
第 3 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 4 著者 氏名(和/英) 小早川 健 / Takeshi S. KOBAYAKAWA
第 4 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 5 著者 氏名(和/英) 尾上 和穂 / Kazuo ONOE
第 5 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 6 著者 氏名(和/英) 今井 亨 / Toru IMAI
第 6 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
第 7 著者 氏名(和/英) 安藤 彰男 / Akio ANDO
第 7 著者 所属(和/英) NHK放送技術研究所
NHK Science and Technical Research Laboratories
発表年月日 2002/6/21
資料番号 SP2002-50
巻番号(vol) vol.102
号番号(no) 160
ページ範囲 pp.-
ページ数 6
発行日