講演抄録/キーワード |
講演名 |
2013-11-29 13:20
シーケンスに基づく検索モデルの検索精度について ○宇田川佳久(東京工芸大) SWIM2013-12 |
抄録 |
(和) |
プログラム開発・保守作業を効率的に支援するために類似ソースコードの検索機能が求められている.ソースコードは,本質的に文の列 (シーケンス)で構成されていることから,従来の文書を検索するために開発された手法には検索精度に問題があった.本文では,シーケンスに基づく検索モデルを提案し,集合に基づく検索モデルとの比較に於いて当該検索モデルの検索精度について考察する.Struts 2 Coreソースコードを対象とした実験では,ベクトル空間モデルによる検索よりも,本研究で開発した検索機能が平均で66.8%,最大で98.7%の効率化を達成していることを確認した. |
(英) |
Retrieving similar source code is required in order to support the efficient program development and maintenance work. Source code is essentially a sequence of statements; therefore, we define a similarity model that is tailored to sequentially structured texts for retrieving similar source code fragments. Our similarity model is evaluated by comparing two well-known similarity models using Struts 2, which is a medium-size open source Java program. The results show that our similarity model outperforms the vector space retrieval model by 66.8% on average and 98.7% at the maximum. |
キーワード |
(和) |
シーケンス構造派生検索モデル / 制御文 / メソッド名 / Sorensen-Dice係数 / Vector space model / / / |
(英) |
Sequence structure retrieval model / Control statement / Method identifier / Sorensen-Dice Index / Vector space model / / / |
文献情報 |
信学技報, vol. 113, no. 334, SWIM2013-12, pp. 1-8, 2013年11月. |
資料番号 |
SWIM2013-12 |
発行日 |
2013-11-22 (SWIM) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SWIM2013-12 |