講演抄録/キーワード |
講演名 |
2016-03-10 14:15
Word2Vecを用いたバグ報告からの不具合ファイル特定 ○釆野友紀也・水野 修(京都工繊大)・崔 銀惠(産総研) SS2015-85 |
抄録 |
(和) |
ソフトウェアのバグが報告されると,開発者はバグ修正のためにバグに関連するソースコードファイルを特定する必要がある.この過程は,不具合ファイル特定と呼ばれ,不具合ファイル特定の自動化は開発者の生産性向上のために重要である.本研究では,単語分散表現作成のための自然言語処理ツールword2vecによって学習されるベクトル空間モデルsemantic-VSMを用いて,与えられたバグ報告に対する不具合ファイル特定を効果的に行う手法を提案する.また,不具合ファイル特定の正答率を向上させるために,semantic-VSMとともに既存の不具合ファイル特定手法BugLocator及びBugspotsを組み合わせて用いる手法CombBLを紹介する.我々の実験結果は,提案手法の正答率が既存の高水準の不具合ファイル特定手法と比べて大幅には劣らない結果を達成していることを示す.また我々は,提案手法が既存手法に比べてスケーラビリティ及び高速さにおいては優れている点について考察した. |
(英) |
Once a fault in software is reported, developers have to determine which source files are related to the fault. This process is referred as buggy file localization (shortly, bug localization), and an automatic way of bug localization is important to improve developers’ productivity. This paper proposes an approach that efficiently localizes faulty files for a given bug report by our vector space model named semantic-VSM. Our semantic-VSM is constructed by using word2vec which generates distributed representations of words. We also propose CombBL, which combines our semantic-VSM with existing BugLocator and Bugspots tools. Experimental results show that CombBL is not so much inferior at accuracy but superior at scalability to existing techniques. |
キーワード |
(和) |
word2vec / 不具合ファイル特定 / バグ報告 / 自然言語処理 / 情報検索 / / / |
(英) |
word2vec / Bug localization / Bug report / Natural language processing / Information retrieval / / / |
文献情報 |
信学技報, vol. 115, no. 508, SS2015-85, pp. 55-60, 2016年3月. |
資料番号 |
SS2015-85 |
発行日 |
2016-03-03 (SS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SS2015-85 |