お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2006-02-02 15:45
SVMを用いたコンピュータウイルス情報の抽出
鈴木雄策山村 毅愛知県立大
抄録 (和) 本稿では,ニュース記事から,文節をまたがった名詞句や文を抽出することで(コンピュータウイルスに関する)事典を作成する手法を提案する.抽出は手掛かり語などを利用したテンプレート型ではなく,前後の形態素や文に含まれる単語などといった情報を素性として使用し,SVM(Support Vector Machine)を用いて抽出を行った.実験の結果,平均で適合率86.2%,再現率77.5%という結果を得た.現在の情報抽出は特定の分野に依存する手法が多いが,Webを対象とした場合,必ずしも利用したい記事のみを選択できるとは限らない.そこで本稿では抽出対象としていない分野の記事に対しても抽出実験を行い評価した.その結果,本来の抽出対象の記事と酷似した記述があった場合には,局所的な情報のみを利用した手法では無駄な抽出を避けることが難しく,記事全体の情報を利用した手法を考案する必要があるという知見を得た. 
(英) This paper proposes the method of information extraction of noun phrase and sentence to create the dictionary concerning computer virus by using SVM (Support Vector Machine). We extract the information of virus by using features of surrounding morphemes and words in the sentence, not template matching. As a result of the experiment, our method attained 86.2% precision and 77.5% recall on the average. Most of extraction methods have depended on a certain domain. However, web sites have lots of category and articles. So it isn't necessarily articles as we wish. And so this paper estimates extraction effect for other articles we didn't use. As a result, we got the findings that our simple method using local informations is difficult to avoid useless extractions. And we must invent applications which use informations of the whole article.
キーワード (和) 情報抽出 / Support Vector Machine / / / / / /  
(英) Information Extraction / Support Vector Machine / / / / / /  
文献情報 信学技報, vol. 105, no. 594, NLC2005-111, pp. 31-36, 2006年2月.
資料番号 NLC2005-111 
発行日 2006-01-26 (NLC) 
ISSN Print edition: ISSN 0913-5685
PDFダウンロード

研究会情報
研究会 NLC  
開催期間 2006-02-02 - 2006-02-03 
開催地(和) ラフォーレ琵琶湖 
開催地(英) Laforet Biwako 
テーマ(和) テキスト情報の要約と掲示に関わる自然言語処理シンポジウムおよび一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 NLC 
会議コード 2006-02-NLC 
本文の言語 日本語 
タイトル(和) SVMを用いたコンピュータウイルス情報の抽出 
サブタイトル(和)  
タイトル(英) Extraction of Computer Virus Information using SVM 
サブタイトル(英)  
キーワード(1)(和/英) 情報抽出 / Information Extraction  
キーワード(2)(和/英) Support Vector Machine / Support Vector Machine  
キーワード(3)(和/英) /  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 鈴木 雄策 / Yusaku Suzuki / スズキ ユウサク
第1著者 所属(和/英) 愛知県立大学 (略称: 愛知県立大)
Aichi Prefectural University (略称: Aichi Prefectural Univ.)
第2著者 氏名(和/英/ヨミ) 山村 毅 / Tsuyoshi Yamamura /
第2著者 所属(和/英) 愛知県立大学 (略称: 愛知県立大)
Aichi Prefectural University (略称: Aichi Prefectural Univ.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2006-02-02 15:45:00 
発表時間 30分 
申込先研究会 NLC 
資料番号 NLC2005-111 
巻番号(vol) vol.105 
号番号(no) no.594 
ページ範囲 pp.31-36 
ページ数
発行日 2006-01-26 (NLC) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会