講演抄録/キーワード |
講演名 |
2014-05-23 14:35
頻出ソースコードパターン探索のための一手法 ○宇田川佳久(東京工芸大) SWIM2014-3 |
抄録 |
(和) |
本文は,プログラム構造を探索するためのアルゴリズムとソースコードの類似度について論じている.Apache-Tomacat 7ソースコードを対象とした実験の結果,提案するアルゴリズムは頻出するソースコードパターンを1分以内に探索できること,および,提案する類似指標は,集合の類似指標であるSorensen-Dice指標よりも平均で23.9%向上していることを確認した. |
(英) |
This paper discusses a mining algorithm to explore program structure and the definition of a similarity measure that is tailored to retrieving similar source code fragments. Retrieval experiments were conducted using Apache-Tomcat 7, which consists of approximately 330,000 lines of source code. The results show that the proposed mining algorithm finds a set of frequent sequences within one minute, and the proposed similarity measure achieves a 23.9% improvement on average over the extended Sorensen-Dice model. |
キーワード |
(和) |
Javaソースコード / 制御文 / メソッド識別名 / シーケンス派生検索モデル / Sorensen-Dice指標 / / / |
(英) |
Java source code / Control statemen / Method identifier / Derived sequence retrieval model / Sorensen-Dice index / / / |
文献情報 |
信学技報, vol. 114, no. 49, SWIM2014-3, pp. 13-18, 2014年5月. |
資料番号 |
SWIM2014-3 |
発行日 |
2014-05-16 (SWIM) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SWIM2014-3 |