講演名 2008-05-29
ソースコード中に含まれる不具合トークンをテキスト分類に基づいて推定するツールの試作と評価
森井 亮介, 水野 修, 菊野 亨,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 不具合が混入していそうなモジュール(Fault-prone(FP)モジュール)の検出はソフトウェアテストにおける重要な問題の一つである.これまでにも多くの研究が行われてきたが,それらの多くはソフトウェアメトリクスを利用して予測を行うため,メトリクスの収集環境が必要であった.そこで,我々は「Fault-proneフィルタリング」という手法を提案している.この手法ではモジュールを単にテキストと見なし,ベイズの定理を用いたテキスト分類技術を利用して予測を行うため,メトリクスの収集や測定を行う必要がない.しかし,この手法のこれまでの実装ではモジュール単位でFPか否かの予測を行うことはできるが,モジュールのどの部分が不具合に関連していそうなのかという具体的な情報を入手することはできなかった.そこで本論文ではモジュール単位に加え,トークン単位でもFPか否かを予測し,ソースコード中における不具合の可能性が高いトークンを推定するツールを試作した.また,適用実験としてオープンソースソフトウェアeclipseの関連プロジェクトを対象とし,トークン単位での予測精度の測定を行った.
抄録(英) Prediction of fault-prone(FP) software modules has been one of the important area of software testing and many approaches has been conducted. Most of them use software metrics for predection, however there is difficulties in collecting the metrics. We introduced a new approach, named "Fault-Prone Filtering". In this approach, FP modules are detected in a way that the source code modules are regarded as text files and they are classified by text mining technique based on Bayesian theory, so there is no need to collect the metrics. But there was an implementing shortage of this approach at this time. When we classified modules into FP or NFP(not-fault-prone), we could get the result of classification only. There was no information available on FP tokens in each module, and such information is important to conduct debug activities. In this paper, we tried to develop a tool that classifies not only modules into FP or NFP but also tokens in them. And we experimented using open source project to check how accurately this tool classified tokens.
キーワード(和) フォールトプローンモジュール / テキスト分類 / ベイズの定理
キーワード(英) Fault-prone Module / text mining / Bayesian theory
資料番号 SS2008-4,KBSE2008-4
発行日

研究会情報
研究会 KBSE
開催期間 2008/5/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) ソースコード中に含まれる不具合トークンをテキスト分類に基づいて推定するツールの試作と評価
サブタイトル(和)
タイトル(英) Identifying Fault-Prone Tokens in Source Code Modules with Spam-Filtering Technique
サブタイトル(和)
キーワード(1)(和/英) フォールトプローンモジュール / Fault-prone Module
キーワード(2)(和/英) テキスト分類 / text mining
キーワード(3)(和/英) ベイズの定理 / Bayesian theory
第 1 著者 氏名(和/英) 森井 亮介 / Ryosuke MORII
第 1 著者 所属(和/英) 大阪大学大学院情報科学研究科
Graduate School of Information Science and Technology, Osaka University
第 2 著者 氏名(和/英) 水野 修 / Osamu MIZUNO
第 2 著者 所属(和/英) 大阪大学大学院情報科学研究科
Graduate School of Information Science and Technology, Osaka University
第 3 著者 氏名(和/英) 菊野 亨 / Tohru KIKUNO
第 3 著者 所属(和/英) 大阪大学大学院情報科学研究科
Graduate School of Information Science and Technology, Osaka University
発表年月日 2008-05-29
資料番号 SS2008-4,KBSE2008-4
巻番号(vol) vol.108
号番号(no) 65
ページ範囲 pp.-
ページ数 6
発行日