講演抄録/キーワード |
講演名 |
2015-10-16 10:50
WFSTを用いたスイッチ入力音声コミュニケーション支援システムと低遅延探索アルゴリズム ○房 福明・篠崎隆宏(東工大) SP2015-68 |
抄録 |
(和) |
病気や事故により発声を含む多くの随意運動が失われた患者のために,我々はこれまでにスイッチ入力音
声コミュニケーション支援システムを提案した.提案システムは入力プロトコルを用いて動作列から文字列に直接変
換し音声を出力する仕組みであり,ディスプレイを用いたシステムより携帯しやすい特徴がある.また,ユーザーに
対してプロトコルの学習容易性を向上させるために入力プロトコルの推薦手法も提案した.この手法は覚える必要の
ある動作の組み合わせ数を削減し,それにより生じた曖昧性はN-gram 言語モデルを用いることで補償する仕組みで
ある.しかし,入力動作を行ってから意図した仮名が同定されるまでに,長い言語コンテキストを探索する必要があ
るため,大きな出力遅延が生じる問題がある.そこで,本論文では出力遅延の低減を目的に高精度の単語N-gram を
用いずに,仮名N-gram を利用する手法を提案する.さらに,デコーディング時に従来の確定した探索パスを逐次的
に出力する方法に対して,一定の遅延閾値を越えた場合に最尤パスを強制出力する手法を提案する.この2 つの手法
を用いることで,動作列から仮名列への変換精度は仮名単語3-gram を用いた場合の97.2%から仮名5-gram を用いた
場合の92.8%まで4.4%程度減少したものの,平均出力遅延を4.6 仮名から0.9 仮名まで大幅に削減できた. |
(英) |
To establish a communication method for the patients who have lost nearly all of their voluntary movement
including speech, we have proposed a switch-to-speech communication aid system. Since this system can
directly convert the motion sequence into string of characters using an input protocol, it is portable compared to
the other system that uses a large display. In order to produce efficient and easily-learned protocol, we have also
proposed an input protocol recommendation method. This method produces a protocol that has less combination of
motions to be remembered by mapping multiple Kana characters to the same motion sequence. To compensate for
the introduced ambiguity of converting input motion sequence to Kana sequence, a word N-gram language model
is used. However, the method has a problem that there is a large delay before intended Kana is output after the
corresponding motion sequence is input since it requires to search a long language context. In this paper, we first
propose to adopt a Kana N-gram instead of a high precision word N-gram. Secondly, we propose a low latency search
algorithm at the expense of accuracy, which compulsorily outputs the best path if the delay exceeds a pre-defined
value. These two methods significantly reduce the delay from 4.6 Kana to 0.9 Kana, while the accuracy is slightly
reduced from 97.2% to 92.8%. |
キーワード |
(和) |
コミュニケーション支援システム / WFST / 低遅延探索 / N-gram / / / / |
(英) |
Communication aid system / WFST / low latency search / N-gram / / / / |
文献情報 |
信学技報, vol. 115, no. 253, SP2015-68, pp. 51-56, 2015年10月. |
資料番号 |
SP2015-68 |
発行日 |
2015-10-08 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2015-68 |
研究会情報 |
研究会 |
SP |
開催期間 |
2015-10-15 - 2015-10-16 |
開催地(和) |
神戸大学 瀧川記念学術交流会館 |
開催地(英) |
Kobe Univ. |
テーマ(和) |
音声インタフェース,合成,対話,アプリケーションシステム,一般 |
テーマ(英) |
Speech interface, Synthesis, Dialogue, Application system, etc. |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2015-10-SP |
本文の言語 |
日本語 |
タイトル(和) |
WFSTを用いたスイッチ入力音声コミュニケーション支援システムと低遅延探索アルゴリズム |
サブタイトル(和) |
|
タイトル(英) |
Switch-To-Speech Communication Aid System Using WFST and Low Latency Search Algorithm |
サブタイトル(英) |
|
キーワード(1)(和/英) |
コミュニケーション支援システム / Communication aid system |
キーワード(2)(和/英) |
WFST / WFST |
キーワード(3)(和/英) |
低遅延探索 / low latency search |
キーワード(4)(和/英) |
N-gram / N-gram |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
房 福明 / Fuming Fang / ボウ フクメイ |
第1著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech) |
第2著者 氏名(和/英/ヨミ) |
篠崎 隆宏 / Takahiro Shinozaki / シノザキ タカヒロ |
第2著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute of Technology (略称: Tokyo Tech) |
第3著者 氏名(和/英/ヨミ) |
/ / |
第3著者 所属(和/英) |
(略称: )
(略称: ) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2015-10-16 10:50:00 |
発表時間 |
25分 |
申込先研究会 |
SP |
資料番号 |
SP2015-68 |
巻番号(vol) |
vol.115 |
号番号(no) |
no.253 |
ページ範囲 |
pp.51-56 |
ページ数 |
6 |
発行日 |
2015-10-08 (SP) |
|