講演名 2021-01-27
変更個所の構造的特徴の学習に基づく複合コミットの分割
眞田 行隆(東工大), 小林 隆志(東工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) バグ修正とリファクタリングを並行して行うなど,複数のタスクの結果として生まれたコミットは複合コミットと呼ばれ,後にレビューを行う際や過去の状態に戻す際に問題を複雑化させる.この問題に対処する為に,自動で複合コミットを分割する様々な研究が行われている.しかしながら,既存研究は経験則によって選択された特徴量に基づくものであり,複雑な特徴を認識しきれない問題がある.本研究では,過去の変更における変更個所の構造的特徴を分析し機械学習することで,チャンク間の関係を距離として算出し,これに基づいてクラスタリングを行うことでコミットを分割する手法を提案する. 5 つの OSS プロジェクトのデータに提案手法を適用し,チャンク同士の結合・分離の推定精度およびコミット分割の精度を計測し先行研究と比較を行う
抄録(英) Commits that are the result of multiple tasks, such as bug fixing and refactoring in parallel, are called compound commits. They complicate the problem of reviewing and reverting changes. In order to deal with this problem, various researches have been conducted to automatically split compound commits. However, the existing studies are based on heuristic features, and they fail to recognize complex features. In this study, we propose a method to divide commits by clustering based on the relation among chunks, which is estimated by neural networks trained with the structural features of chanks in past changes. We apply the proposed method to data from five OSS projects, and measure the accuracy of estimating the join/separation between chunks and the accuracy of commit partitioning, and compare it with previous studies.
キーワード(和) コミット分割 / Tangled Commit / Change Partitioning / 改版履歴分析 / 機械学習
キーワード(英)
資料番号 MSS2020-42,SS2020-27
発行日 2021-01-19 (MSS, SS)

研究会情報
研究会 MSS / SS
開催期間 2021/1/26(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 一般
テーマ(英)
委員長氏名(和) 髙井 重昌(阪大) / 小林 隆志(東工大)
委員長氏名(英) Shigemasa Takai(Osaka Univ.) / Takashi Kobayashi(Tokyo Inst. of Tech.)
副委員長氏名(和) 尾崎 敦夫(阪工大) / 岡野 浩三(信州大)
副委員長氏名(英) Atsuo Ozaki(Osaka Inst. of Tech.) / Kozo Okano(Shinshu Univ.)
幹事氏名(和) 金澤 尚史(摂南大) / 小林 孝一(北大) / 島 和之(広島市大) / 林 晋平(東工大)
幹事氏名(英) Takahumi Kanazawa(Setsunan Univ.) / Koichi Kobayashi(Hokkaido Univ.) / Kazuyuki Shima(Hiroshima City Univ.) / Shinpei Hayashi(Tokyo Inst. of Tech.)
幹事補佐氏名(和) 林 直樹(阪大) / 小形 真平(信州大)
幹事補佐氏名(英) Naoki Hayashi(Osaka Univ.) / Shinpei Ogata(Shinshu Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Mathematical Systems Science and its applications / Technical Committee on Software Science
本文の言語 JPN
タイトル(和) 変更個所の構造的特徴の学習に基づく複合コミットの分割
サブタイトル(和)
タイトル(英) A change untangling technique based on learning structural features of chunks
サブタイトル(和)
キーワード(1)(和/英) コミット分割
キーワード(2)(和/英) Tangled Commit
キーワード(3)(和/英) Change Partitioning
キーワード(4)(和/英) 改版履歴分析
キーワード(5)(和/英) 機械学習
第 1 著者 氏名(和/英) 眞田 行隆 / Yukitaka Sanada
第 1 著者 所属(和/英) 東京工業大学(略称:東工大)
Tokyo Institute of Technology(略称:Tokyo Tech.)
第 2 著者 氏名(和/英) 小林 隆志 / Takashi Kobayashi
第 2 著者 所属(和/英) 東京工業大学(略称:東工大)
Tokyo Institute of Technology(略称:Tokyo Tech.)
発表年月日 2021-01-27
資料番号 MSS2020-42,SS2020-27
巻番号(vol) vol.120
号番号(no) MSS-342,SS-343
ページ範囲 pp.78-83(MSS), pp.78-83(SS),
ページ数 6
発行日 2021-01-19 (MSS, SS)