講演名 2013-05-09
修正の分類に基づいたコミット分割手法の提案(開発履歴と支援)
楠 野明, 堀田 圭佑, 肥後 芳樹, 楠本 真二,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ソフトウェアリポジトリマイニングが広く注目されている.これはソフトウェアリポジトリから将来の開発及び保守作業に有用な知見を得ようとする研究である.ソフトウェアリポジトリマイニングにおいて,ビッグコミットを解析対象から除外する処理が行われる.ビッグコミットとは大規模な修正をリポジトリに反映するコミットである.ビッグコミットはフォーマットの修正を多く含むことが指摘されており,そのため分析対象から除外される.しかし,ビッグコミットはフォーマットの修正と同時に分析すべき情報も含む場合があるため,ビッグコミットの除外によってそれらが失われている.よってリポジトリマイニングの結果が正確でなくなっている可能性がある.この問題を解決するため,本研究ではコミットに含まれる修正を分類し,それに基づいてコミットを分割する手法を提案する.これによって,コミットに含まれる分析すべき修正のみを対象とした解析が可能となる.
抄録(英) Many researchers have mined software repositories to gain knowledge or principles that can encourage efficient software development. Historical code repositories are one of the well-mined repositories. In mining historical code repositories, researchers often omit big commits from their mining targets. A big commit indicates a commit that modifies many source files or many lines of code. The reason of the preprocessing is that it is said that most of modifications included in big commits were trivial ones such as re-formatting of source code. However, nobody can say that all of such modifications are trivial without any exception. In other words, big commits can include non-trivial modifications on code. Hence, omitting big commits should reduce the accuracy of the mining. This paper proposes a method that divides a commit into multiple commits based on types of modifications. The proposed method enables us to retrieve valuable information that was discarded by ommiting big commits.
キーワード(和) ソフトウェアリポジトリマイニング / 版管理システム / コミット / 最長共通部分列
キーワード(英) software repository mining / version control system / commit / longest common subsequence
資料番号 SS2013-6
発行日

研究会情報
研究会 SS
開催期間 2013/5/2(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Software Science (SS)
本文の言語 JPN
タイトル(和) 修正の分類に基づいたコミット分割手法の提案(開発履歴と支援)
サブタイトル(和)
タイトル(英) Dividing commits based on classification of modifications
サブタイトル(和)
キーワード(1)(和/英) ソフトウェアリポジトリマイニング / software repository mining
キーワード(2)(和/英) 版管理システム / version control system
キーワード(3)(和/英) コミット / commit
キーワード(4)(和/英) 最長共通部分列 / longest common subsequence
第 1 著者 氏名(和/英) 楠 野明 / Noa KUSUNOKI
第 1 著者 所属(和/英) 大阪大学大学院情報科学研究科
Graduate School of Information Science and Technology, Osaka University
第 2 著者 氏名(和/英) 堀田 圭佑 / Keisuke HOTTA
第 2 著者 所属(和/英) 大阪大学大学院情報科学研究科
Graduate School of Information Science and Technology, Osaka University
第 3 著者 氏名(和/英) 肥後 芳樹 / Yoshiki HIGO
第 3 著者 所属(和/英) 大阪大学大学院情報科学研究科
Graduate School of Information Science and Technology, Osaka University
第 4 著者 氏名(和/英) 楠本 真二 / Shinji KUSUMOTO
第 4 著者 所属(和/英) 大阪大学大学院情報科学研究科
Graduate School of Information Science and Technology, Osaka University
発表年月日 2013-05-09
資料番号 SS2013-6
巻番号(vol) vol.113
号番号(no) 24
ページ範囲 pp.-
ページ数 6
発行日