講演名 2024-03-07
リファクタリング推薦におけるCodeT5の転移学習有効性評価に向けて
中島 悠斗(東京都市大), 藤原 賢二(東京都市大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) リファクタリングとは 「外部から見たときの振舞いを保ちつつ,理解や修正が簡単になるように,ソフトウェアの内部構造を整理すること」 であり,ソフトウェア開発における重要な活動の1つである.本研究では,ソースコードに特化した事前学習済みモデルであるCodeT5を用いて,リファクタリング推薦において転移学習を行い,深層学習モデルを使用した場合の予測精度向上を試みた.具体的には,Apache,F-Droid,GitHubの3種のリポジトリ群における11,149の実プロジェクトから30万以上のExtract Methodからなるデータセットを用いて,CodeT5を推薦モデルに転移学習させた.モデルの精度評価は,Precision,Recall,F値を評価尺度として用いた.その結果,モデルはリファクタリング対象となるメソッドのうち97%を推薦モデルから特定でき,Anicheらの手法と比較して適合率が13ポイント,再現率が12ポイント向上することを確認した.このことから,CodeT5を用いた転移学習がリファクタリング推薦において有効であることが明らかになった.
抄録(英) Refactoring is "the process of restructuring the internal architecture of software to make it easier to understand and modify without changing its external behavior," and it is a crucial activity in software development. In this study, we utilized CodeT5, a pre-trained model specialized in source code, to perform transfer learning for refactoring recommendations, aiming to improve prediction accuracy when using deep learning models. Specifically, we fine-tuned CodeT5 as a recommendation model using a dataset comprised of over 300,000 Extract Method refactoring from 11,149 real projects across three repository groups: Apache, F-Droid, and GitHub. The model's accuracy was evaluated using Precision, Recall, and F-measure as metrics. The results showed that the model could identify 97% of the methods targeted for refactoring from the recommendation model, achieving a 13 percentage point increase in precision and a 12 percentage point increase in recall compared to the method by Aniche et al. This indicates that transfer learning using CodeT5 is effective for refactoring recommendations.
キーワード(和) リファクタリング推薦 / 深層学習 / CodeT5 / 事前学習モデル
キーワード(英) Refactoring recommendation / deep learning / CodeT5 / pre-training model
資料番号 SS2023-62
発行日 2024-02-29 (SS)

研究会情報
研究会 SS
開催期間 2024/3/7(から3日開催)
開催地(和) 石垣市健康福祉センター(沖縄)
開催地(英)
テーマ(和) ソフトウェアサイエンスおよび一般
テーマ(英)
委員長氏名(和) 岡野 浩三(信州大)
委員長氏名(英) Kozo Okano(Shinshu Univ.)
副委員長氏名(和) 肥後 芳樹(阪大)
副委員長氏名(英) Yoshiki Higo(Osaka Univ.)
幹事氏名(和) 小形 真平(信州大) / 林 晋平(東工大)
幹事氏名(英) Shinpei Ogata(Shinshu Univ.) / Shinpei Hayashi(Tokyo Inst. of Tech.)
幹事補佐氏名(和) ?本 真佑(阪大)
幹事補佐氏名(英) Shinsuke Matsumoto(Osaka Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Software Science
本文の言語 JPN
タイトル(和) リファクタリング推薦におけるCodeT5の転移学習有効性評価に向けて
サブタイトル(和)
タイトル(英) For evaluating the effectiveness of CodeT5 transfer learning in refactoring recommendations.
サブタイトル(和)
キーワード(1)(和/英) リファクタリング推薦 / Refactoring recommendation
キーワード(2)(和/英) 深層学習 / deep learning
キーワード(3)(和/英) CodeT5 / CodeT5
キーワード(4)(和/英) 事前学習モデル / pre-training model
第 1 著者 氏名(和/英) 中島 悠斗 / Yuto Nakajima
第 1 著者 所属(和/英) 東京都市大学(略称:東京都市大)
Tokyo City University(略称:Tokyo City University)
第 2 著者 氏名(和/英) 藤原 賢二 / Kenji Fujiwara
第 2 著者 所属(和/英) 東京都市大学(略称:東京都市大)
Tokyo City University(略称:Tokyo City University)
発表年月日 2024-03-07
資料番号 SS2023-62
巻番号(vol) vol.123
号番号(no) SS-414
ページ範囲 pp.79-84(SS),
ページ数 6
発行日 2024-02-29 (SS)