講演抄録/キーワード |
講演名 |
2020-12-22 12:40
Wikipediaのカテゴリとエンティティベクトルを用いたTwitterユーザの言及分野の抽出 ○中谷将佳史・湯本高行・礒川悌次郎・上浦尚武(兵庫県立大) DE2020-24 |
抄録 |
(和) |
代表的なSNSの一つであるTwitterには,情報発信元のユーザをよく知らないまま,情報を鵜呑みにして拡散してしまうなどし,誤った情報が流布されやすいという問題がある.
本研究では,Twitterユーザに対して,話題や言及分野に対応するWikipediaカテゴリをラベル付けし,発信された情報の信憑性に注意を促すような仕組みを提案する.
出現単語と記事を結び付け,話題別の単語クラスタを作成するため,ファインチューニングを行った日本語Wikipediaエンティティベクトルを用い,クラスタから得られるカテゴリの集合を1文書とみなして,カテゴリのIDFを計算し,クラスタとユーザの言及分野に対応するカテゴリを抽出した. |
(英) |
|
キーワード |
(和) |
Twitter / Wikipedia / Word2Vec / / / / / |
(英) |
/ / / / / / / |
文献情報 |
信学技報, vol. 120, no. 305, DE2020-24, pp. 42-47, 2020年12月. |
資料番号 |
DE2020-24 |
発行日 |
2020-12-14 (DE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
DE2020-24 |