講演抄録/キーワード |
講演名 |
2016-02-29 13:30
音声入力を用いた用例対訳検索における拡張コーパスの利用 ○福島 拓・甲斐充彦(静岡大) AI2015-57 |
抄録 |
(和) |
現在,グローバル化による多言語間コミュニケーションの機会が増加している.しかし,多言語間での正確な情報共有は十分に行われていない.この問題は,正確性が求められる医療分野や災害時において顕著に現れ,解決が求められている.このため,正確な情報共有を可能にする一技術である用例対訳を用いた支援や,用例対訳の作成が多く行われている.また,入力の迅速化のために音声を用いた用例対訳検索も行われている.しかし,従来手法では不適切な用例を抽出する場合が多く存在していた.そこで本稿では,用例対訳コーパスに含まれる文を否定文や疑問文に変換して追加した,拡張コーパスを用いた用例対訳検索手法を提案する.本稿の貢献は以下の2点である.(1) 拡張コーパスを用いることで,従来手法よりも高い適合率の検索結果の提示を可能とした.(2) 正解が存在しない文を検索した場合,利用者に提示する検索結果数を減少可能であることを示した. |
(英) |
Recently, worldwide globalization has helped to increase communication among people with different native languages. However, accurate information sharing in multiple languages is currently inadequate. This problem appears conspicuously in the medical field, during emergencies, and so on. To solve this problem, parallel-text has been used for accurate multilingual communication. Parallel-text is able to support accurate information sharing. There are parallel-text creating projects. Moreover, there are retrieval of parallel-text using speech recognition for smooth input. However, existing retrieval tasks of parallel-text using speech recognition sometimes extracted improper texts. To resolve this problem, we propose a speech-enabled parallel-text retrieval method using an expanded corpus. The expanded corpus has negative sentences and interrogative sentences that are converted from existing parallel corpus. The contributions of this paper are the following results: (1) Our method that uses the expanded corpus provides retrieval results of higher precision than existing method. (2) Our method is able to decrease the number of retrieval results when a user retrieves a sentence that has no correct texts. |
キーワード |
(和) |
用例対訳 / 機械翻訳 / 音声認識 / Forced Alignment / 多言語間コミュニケーション支援 / / / |
(英) |
parallel text / machine translation / speech recognition / forced alignment / multilingual communication support / / / |
文献情報 |
信学技報, vol. 115, no. 468, AI2015-57, pp. 29-34, 2016年2月. |
資料番号 |
AI2015-57 |
発行日 |
2016-02-22 (AI) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2015-57 |