SVMを用いたコンピュータウイルス情報の抽出

鈴木,雄策; 山村,毅

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2006-02-02 15:45 SVMを用いたコンピュータウイルス情報の抽出 ○鈴木雄策・山村　毅（愛知県立大）
抄録	（和）	本稿では，ニュース記事から，文節をまたがった名詞句や文を抽出することで（コンピュータウイルスに関する）事典を作成する手法を提案する．抽出は手掛かり語などを利用したテンプレート型ではなく，前後の形態素や文に含まれる単語などといった情報を素性として使用し，SVM（Support Vector Machine）を用いて抽出を行った．実験の結果，平均で適合率86.2%，再現率77.5%という結果を得た．現在の情報抽出は特定の分野に依存する手法が多いが，Webを対象とした場合，必ずしも利用したい記事のみを選択できるとは限らない．そこで本稿では抽出対象としていない分野の記事に対しても抽出実験を行い評価した．その結果，本来の抽出対象の記事と酷似した記述があった場合には，局所的な情報のみを利用した手法では無駄な抽出を避けることが難しく，記事全体の情報を利用した手法を考案する必要があるという知見を得た．
	（英）	This paper proposes the method of information extraction of noun phrase and sentence to create the dictionary concerning computer virus by using SVM (Support Vector Machine). We extract the information of virus by using features of surrounding morphemes and words in the sentence, not template matching. As a result of the experiment, our method attained 86.2% precision and 77.5% recall on the average. Most of extraction methods have depended on a certain domain. However, web sites have lots of category and articles. So it isn't necessarily articles as we wish. And so this paper estimates extraction effect for other articles we didn't use. As a result, we got the findings that our simple method using local informations is difficult to avoid useless extractions. And we must invent applications which use informations of the whole article.
キーワード	（和）	情報抽出 / Support Vector Machine / / / / / /
	（英）	Information Extraction / Support Vector Machine / / / / / /
文献情報		信学技報, vol. 105, no. 594, NLC2005-111, pp. 31-36, 2006年2月.
資料番号		NLC2005-111
発行日		2006-01-26 (NLC)
ISSN		Print edition: ISSN 0913-5685
PDFダウンロード

研究会情報
研究会	NLC
開催期間	2006-02-02 - 2006-02-03
開催地（和）	ラフォーレ琵琶湖
開催地（英）	Laforet Biwako
テーマ（和）	テキスト情報の要約と掲示に関わる自然言語処理シンポジウムおよび一般
テーマ（英）
講演論文情報の詳細
申込み研究会	NLC
会議コード	2006-02-NLC
本文の言語	日本語
タイトル（和）	SVMを用いたコンピュータウイルス情報の抽出
サブタイトル（和）
タイトル（英）	Extraction of Computer Virus Information using SVM
サブタイトル（英）
キーワード(1)（和/英）	情報抽出 / Information Extraction
キーワード(2)（和/英）	Support Vector Machine / Support Vector Machine
キーワード(3)（和/英）	/
キーワード(4)（和/英）	/
キーワード(5)（和/英）	/
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	鈴木雄策 / Yusaku Suzuki / スズキユウサク
第1著者所属（和/英）	愛知県立大学 (略称：愛知県立大) Aichi Prefectural University (略称： Aichi Prefectural Univ.)
第2著者氏名（和/英/ヨミ）	山村毅 / Tsuyoshi Yamamura /
第2著者所属（和/英）	愛知県立大学 (略称：愛知県立大) Aichi Prefectural University (略称： Aichi Prefectural Univ.)
第3著者氏名（和/英/ヨミ）	/ /
第3著者所属（和/英）	(略称： ) (略称： )
第4著者氏名（和/英/ヨミ）	/ /
第4著者所属（和/英）	(略称： ) (略称： )
第5著者氏名（和/英/ヨミ）	/ /
第5著者所属（和/英）	(略称： ) (略称： )
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2006-02-02 15:45:00
発表時間	30分
申込先研究会	NLC
資料番号	NLC2005-111
巻番号（vol）	vol.105
号番号（no）	no.594
ページ範囲	pp.31-36
ページ数	6
発行日	2006-01-26 (NLC)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会