講演抄録/キーワード |
講演名 |
2014-11-29 10:55
シーケンスマイニングアルゴリズムを用いた構造クローンの検索方式 ○宇田川佳久(東京工芸大) SWIM2014-17 |
抄録 |
(和) |
実務で使われている大規模SWには,コピー&ペーストによる類似コード(クローンコード)が20—50% 含まれていて,これがソフトウェア保守の妨げになっていることが指摘されている.一般に,クローンコードは,元のコードに対する文の挿入,削除,変更が行われている.従って,クローンコードの検出は,本質的に「部分的に一致する文字列の検出」に帰着する.本文では,頻出シーケンス抽出アルゴリズムとLCS(最長共通部分列)アルゴリズムを使ったクローンコードの検出方法について論じる.Java swingソースコードへの適用結果を示し,本手法の有効性を論じる. |
(英) |
Several studies suggest that as much as 20—50% of large software in industry consist of copied fragments (clone codes) which make it harder to maintain, understand the software. Generally, code clones are altered by changing, adding and/or deleting statements. Thus, the problem to find code clones essentially results in the detection of strings that partially match. Our approach is parse-tree-based enhanced by a frequent subsequence mining and a modified Longest Common Subsequence (LCS) algorithm. Experimental results conducted using Java swing source code show the effectiveness of our approach. |
キーワード |
(和) |
コードクローン / 制御文 / メソッド識別名 / 頻出シーケンス抽出 / 最長共通部分列 / / / |
(英) |
Code clone / Control statement / Method identifier / Frequent subsequence mining / Longest common subsequence / / / |
文献情報 |
信学技報, vol. 114, no. 344, SWIM2014-17, pp. 15-22, 2014年11月. |
資料番号 |
SWIM2014-17 |
発行日 |
2014-11-22 (SWIM) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SWIM2014-17 |