講演抄録/キーワード |
講演名 |
2013-05-09 17:20
修正の分類に基づいたコミット分割手法の提案 ○楠 野明・堀田圭佑・肥後芳樹・楠本真二(阪大) SS2013-6 |
抄録 |
(和) |
ソフトウェアリポジトリマイニングが広く注目されている.これはソフトウェアリポジトリから将来の開発及び保守作業に有用な知見を得ようとする研究である.
ソフトウェアリポジトリマイニングにおいて,ビッグコミットを解析対象から除外する処理が行われる.ビッグコミットとは大規模な修正をリポジトリに反映するコミットである.ビッグコミットはフォーマットの修正を多く含むことが指摘されており,そのため分析対象から除外される.しかし,ビッグコミットはフォーマットの修正と同時に分析すべき情報も含む場合があるため,ビッグコミットの除外によってそれらが失われている.よってリポジトリマイニングの結果が正確でなくなっている可能性がある.
この問題を解決するため,本研究ではコミットに含まれる修正を分類し,それに基づいてコミットを分割する手法を提案する.これによって,コミットに含まれる分析すべき修正のみを対象とした解析が可能となる. |
(英) |
Many researchers have mined software repositories to gain knowledge or principles that can encourage efficient software development. Historical code repositories are one of the well-mined repositories. In mining historical code repositories, researchers often omit big commits from their mining targets. A big commit indicates a commit that modifies many source files or many lines of code. The reason of the preprocessing is that it is said that most of modifications included in big commits were trivial ones such as re-formatting of source code. However, nobody can say that all of such modifications are trivial without any exception. In other words, big commits can include non-trivial modifications on code. Hence, omitting big commits should reduce the accuracy of the mining. This paper proposes a method that divides a commit into multiple commits based on types of modifications. The proposed method enables us to retrieve valuable information that was discarded by ommiting big commits. |
キーワード |
(和) |
ソフトウェアリポジトリマイニング / 版管理システム / コミット / 最長共通部分列 / / / / |
(英) |
software repository mining / version control system / commit / longest common subsequence / / / / |
文献情報 |
信学技報, vol. 113, no. 24, SS2013-6, pp. 31-36, 2013年5月. |
資料番号 |
SS2013-6 |
発行日 |
2013-05-02 (SS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SS2013-6 |