講演名 | 2023-03-14 単語埋め込みによる言語横断バグ箇所検索 大柴 昂輝(東工大), 林 晋平(東工大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | バグの原因となっているソースコードを特定するアプローチとして,バグレポートと関連の高いファイルを自動的に推薦するバグ箇所検索の研究が進められてきた.しかし,既存研究のほとんどは英語で記述されたバグレポートのみを扱っており,非英語のバグレポートに対してバグ箇所検索を行う言語横断バグ箇所検索は機械翻訳に頼る研究しか行われておらず精度も芳しくない.本稿では,言語横断バグ箇所検索に対し単語埋め込みを適用し,非英語バグレポートとソースコードの間のギャップを埋めるアプローチを検討した.日本語バグレポートとソースコードの類似性を多言語単語埋め込みにより計算する方法と,日本語バグレポートを英語に機械翻訳したものとソースコードの類似性を単言語単語埋め込みで計算する方法を比較検証した結果,前者の精度が高くなった.また,この手法の精度は既存の機械翻訳を用いた言語横断バグ箇所検索よりも,MRRで10%,MAPで27%向上した. |
抄録(英) | |
キーワード(和) | バグ箇所検索 / 言語横断情報検索 |
キーワード(英) | |
資料番号 | SS2022-53 |
発行日 | 2023-03-07 (SS) |
研究会情報 | |
研究会 | SS |
---|---|
開催期間 | 2023/3/14(から2日開催) |
開催地(和) | 名護市産業支援センター |
開催地(英) | |
テーマ(和) | ソフトウェアサイエンスおよび一般 |
テーマ(英) | |
委員長氏名(和) | 岡野 浩三(信州大) |
委員長氏名(英) | Kozo Okano(Shinshu Univ.) |
副委員長氏名(和) | 肥後 芳樹(阪大) |
副委員長氏名(英) | Yoshiki Higo(Osaka Univ.) |
幹事氏名(和) | 小形 真平(信州大) / 林 晋平(東工大) |
幹事氏名(英) | Shinpei Ogata(Shinshu Univ.) / Shinpei Hayashi(Tokyo Inst. of Tech.) |
幹事補佐氏名(和) | ?本 真佑(阪大) |
幹事補佐氏名(英) | Shinsuke Matsumoto(Osaka Univ.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Software Science |
---|---|
本文の言語 | JPN-ONLY |
タイトル(和) | 単語埋め込みによる言語横断バグ箇所検索 |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | バグ箇所検索 |
キーワード(2)(和/英) | 言語横断情報検索 |
第 1 著者 氏名(和/英) | 大柴 昂輝 / Koki Oshiba |
第 1 著者 所属(和/英) | 東京工業大学(略称:東工大) Tokyo Institute of Technology(略称:Tokyo Tech) |
第 2 著者 氏名(和/英) | 林 晋平 / Shinpei Hayashi |
第 2 著者 所属(和/英) | 東京工業大学(略称:東工大) Tokyo Institute of Technology(略称:Tokyo Tech) |
発表年月日 | 2023-03-14 |
資料番号 | SS2022-53 |
巻番号(vol) | vol.122 |
号番号(no) | SS-432 |
ページ範囲 | pp.37-42(SS), |
ページ数 | 6 |
発行日 | 2023-03-07 (SS) |