講演名 2013/10/17
テキストマイニング技術を応用したメソッドクローン検出手法の提案
山中 裕樹, 吉田 則裕, 崔 恩瀞, 井上 克郎,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ソフトウェア保守における問題の1つとしてコードクローン(ソースコード中に存在する同一または類似した部分を持つコード片)が指摘されている.コードクローンを検出し,共通する処理に対して親クラスへの引上げやライブラリ化といった集約を行うことによって,ソフトウェアの保守性や可読性を向上させることが可能となる.これまでの研究において様々なコードクローン検出手法が提案されてきたが,多くの手法がプログラムの構造的な類似性に着目しており,意味的に類似したコードクローンを検出することを目的とした手法は少ない.また,プログラムの意味的な類似性に着目した手法では,検出時間に膨大な時間がかかるという問題点がある.そこで本研究では,テキストマイニング技術を応用したメソッドクローン(メソッド単位のコードクローン)を検出する手法を提案する.テキストマイニングは文字列を対象としたデータマイニングのことであり,自然言語で書かれた文書の分類などに利用される.本手法ではこの技術を利用し,ソースコード中の識別子や予約語に利用される単語に対して重要度の重み付けを行うことによって,各メソッドの特徴ベクトルを計算する.そして,特徴ベクトル間の類似度を求めることによってメソッドクローンの検出を行う.本手法によって,類似した処理を行うメソッドを高速に検出することが可能であると考えられる.
抄録(英) Code clone (i.e., code fragment that has identical or similar fragment in source code) is one of the major problems for software maintenance. Software developers can increase the maintainability and the readability of source code by merging them (e.g., create library, pull up method). At present, a lot of techniques have been done on the detection of code clones in source code. However, most of them focus on structural similarities. Moreover, the detection techniques that focus on semantic similarities lack the scalability for large-scale source code. In this study, we propose a technique to detect method clones using text mining techniques (i.e., data mining technique intended for natural language text). In our approach, we generate feature vectors for each method by weighting words in identifier and syntactic keyword based on the important degree of them. And then, we detect method clones based on the similarity among the feature vectors. We believe that our technique can perform the scalable detection of similar method clones from source code.
キーワード(和) コードクローン / ソフトウェア保守 / テキストマイニング
キーワード(英) Code Clone / Software Maintenance / Text Mining
資料番号 Vol.2013-SE-182No.28
発行日

研究会情報
研究会 SS
開催期間 2013/10/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Software Science (SS)
本文の言語 JPN
タイトル(和) テキストマイニング技術を応用したメソッドクローン検出手法の提案
サブタイトル(和)
タイトル(英) Method Clone Detection Using Text Mining Techniques
サブタイトル(和)
キーワード(1)(和/英) コードクローン / Code Clone
キーワード(2)(和/英) ソフトウェア保守 / Software Maintenance
キーワード(3)(和/英) テキストマイニング / Text Mining
第 1 著者 氏名(和/英) 山中 裕樹
第 1 著者 所属(和/英) 大阪大学
Osaka University
第 2 著者 氏名(和/英) 吉田 則裕
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学
Nara Institute of Science and Technology
第 3 著者 氏名(和/英) 崔 恩瀞
第 3 著者 所属(和/英) 大阪大学
Osaka University
第 4 著者 氏名(和/英) 井上 克郎
第 4 著者 所属(和/英) 大阪大学
Osaka University
発表年月日 2013/10/17
資料番号 Vol.2013-SE-182No.28
巻番号(vol) vol.113
号番号(no) 269
ページ範囲 pp.-
ページ数 8
発行日