お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2022-05-27 15:28
[ポスター講演]科学的用語を含む文章の機械翻訳の精度向上
加藤 馨白 寅天会津大SC2022-14
抄録 (和) 機械翻訳は昔から翻訳の手法の一つとして研究対象になってきた。以前は辞書ベースの機械翻訳や、統計モデルを用いた機械翻訳が主流だったが、現在ではニューラルネットワークを用いたニューラル機械翻訳が主流の手法である。しかしながら、現在の機械翻訳では専門用語等を含む文章を翻訳する際に誤訳や、不自然な翻訳が行われることがある。そこで私たちは科学の分野に注目し、科学的な専門用語を含む文章の翻訳精度の向上を目指した。データセットとして約300万の一般的な日本語-英語の対訳コーパスとNTCIRの12万件の科学論文の日本語‐英語の抄録を用意した。アーキテクチャにはTransformerを使用した。機械翻訳の性能の評価に使われるBLEUスコアが一般的なデータのみで学習したものが19.3程度であり、追加で科学論文の抄録を学習させたモデルでは20.9と性能の改善が見られた。翻訳精度を向上させたい分野の文章を追加で学習させることは、専門用語を含む文章の翻訳精度を向上させるうえで有効な手法であった。 
(英) Machine translation has long been a subject of research as a method of translation. In the past, dictionary-based machine translation and machine translation using statistical models were the mainstream methods, but today, neural machine translation using neural networks is the mainstream method. However, current machine translation methods sometimes produce mistranslations or unnatural translations when translating texts containing technical terms. Therefore, we focused on the field of science and aimed to improve the translation accuracy of sentences containing scientific terminology. We prepared a dataset of approximately 3 million common Japanese-English bilingual corpora and 120,000 Japanese-English abstracts of scientific papers from NTCIR. We used Transformer model for the architecture. The BLEU score used to evaluate machine translation performance was about 19.3 for the model trained on common data only, and 20.9 for the model trained on the abstracts of additional scientific papers, indicating an improvement in performance. Learning additional sentences in the field in which translation accuracy is to be improved was an effective method for improving the translation accuracy of sentences containing technical terms.
キーワード (和) 機械翻訳 / 自然言語処理 / / / / / /  
(英) Machine Translation / NLP / / / / / /  
文献情報 信学技報, vol. 122, no. 50, SC2022-14, pp. 83-87, 2022年5月.
資料番号 SC2022-14 
発行日 2022-05-20 (SC) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SC2022-14

研究会情報
研究会 SC  
開催期間 2022-05-27 - 2022-05-27 
開催地(和) オンライン開催 
開催地(英) Online 
テーマ(和) サービス化するAI技術とDX, 一般 
テーマ(英) AI Service and Digital Transformation, and general topics 
講演論文情報の詳細
申込み研究会 SC 
会議コード 2022-05-SC 
本文の言語 日本語 
タイトル(和) 科学的用語を含む文章の機械翻訳の精度向上 
サブタイトル(和)  
タイトル(英) Improving the accuracy of machine translation of sentences including scientific terms 
サブタイトル(英)  
キーワード(1)(和/英) 機械翻訳 / Machine Translation  
キーワード(2)(和/英) 自然言語処理 / NLP  
キーワード(3)(和/英) /  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 加藤 馨 / Kaoru Kato / カトウ カオル
第1著者 所属(和/英) 会津大学 (略称: 会津大)
University of Aizu (略称: Aizu Univ.)
第2著者 氏名(和/英/ヨミ) 白 寅天 / Paik Incheon /
第2著者 所属(和/英) 会津大学 (略称: 会津大)
University of Aizu (略称: Aizu Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2022-05-27 15:28:00 
発表時間 3分 
申込先研究会 SC 
資料番号 SC2022-14 
巻番号(vol) vol.122 
号番号(no) no.50 
ページ範囲 pp.83-87 
ページ数
発行日 2022-05-20 (SC) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会