講演抄録/キーワード |
講演名 |
2020-09-10 17:05
PMIを用いた新聞記事におけるカテゴリ・テーマ推定 ○姫野拓未・嶋田和孝(九工大)・村重剛弘(西日本新聞) NLC2020-11 |
抄録 |
(和) |
近年,新聞社は多くの人に情報を伝えるために新聞を紙で発行するだけでなく,電子データで発行することが増えている.
その中で電子データの新聞記事には関連記事を検索しやすくするためのタグが付与されている.
しかし,タグの数は膨大な数であり,新聞記者は手動で記事に対して適切なタグを付与するため多大なコストを費やさなければならない.
そこで本研究では,タグの付与の自動化に向け,自己相互情報量 (PMI) を用いた新聞記事のタグ推定を行い,分析結果について報告する.
まず,推定のためにPMIを新聞記事コーパスより算出し,定量評価と定性評価によってタグの推定結果について考察する. |
(英) |
In recent years, newspaper companies publish newspapers by not only paper but also electronic data to spread information.
Electronic newspaper on the Web contains various tags easily to find related articles.
However, assigning appropriate tags to each article is costly for writers because of many types of tags.
In this paper, we propose a score-based model for tag prediction.
The score is based on Point-wise Mutual Information (PMI).
First, we calculate PMI from the newspaper article corpus.
Next, we confirm the results of predicting tags through quantitative evaluation and qualitative evaluation. |
キーワード |
(和) |
タグ推定 / 自己相互情報量 (PMI) / 新聞記事 / / / / / |
(英) |
Tagging / Point-wise Mutual Information (PMI) / Newspaper Article / / / / / |
文献情報 |
信学技報, vol. 120, no. 166, NLC2020-11, pp. 52-56, 2020年9月. |
資料番号 |
NLC2020-11 |
発行日 |
2020-09-03 (NLC) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
NLC2020-11 |
研究会情報 |
研究会 |
NLC |
開催期間 |
2020-09-10 - 2020-09-10 |
開催地(和) |
オンライン開催 |
開催地(英) |
Online |
テーマ(和) |
第16回テキストアナリティクス・シンポジウム |
テーマ(英) |
The Sixteenth Text Analytics Symposium |
講演論文情報の詳細 |
申込み研究会 |
NLC |
会議コード |
2020-09-NLC |
本文の言語 |
日本語 |
タイトル(和) |
PMIを用いた新聞記事におけるカテゴリ・テーマ推定 |
サブタイトル(和) |
|
タイトル(英) |
Predicting categories and themes in newspaper articles using PMI |
サブタイトル(英) |
|
キーワード(1)(和/英) |
タグ推定 / Tagging |
キーワード(2)(和/英) |
自己相互情報量 (PMI) / Point-wise Mutual Information (PMI) |
キーワード(3)(和/英) |
新聞記事 / Newspaper Article |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
姫野 拓未 / Takumi Himeno / ヒメノ タクミ |
第1著者 所属(和/英) |
九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: Kyutech) |
第2著者 氏名(和/英/ヨミ) |
嶋田 和孝 / Kazutaka Shimada / シマダ カズタカ |
第2著者 所属(和/英) |
九州工業大学 (略称: 九工大)
Kyushu Institute of Technology (略称: Kyutech) |
第3著者 氏名(和/英/ヨミ) |
村重 剛弘 / Takehiro Murashige / ムラシゲ タケヒロ |
第3著者 所属(和/英) |
株式会社西日本新聞社 (略称: 西日本新聞)
The nishinippon Shinbun Co. Ltd. (略称: NNP) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2020-09-10 17:05:00 |
発表時間 |
25分 |
申込先研究会 |
NLC |
資料番号 |
NLC2020-11 |
巻番号(vol) |
vol.120 |
号番号(no) |
no.166 |
ページ範囲 |
pp.52-56 |
ページ数 |
5 |
発行日 |
2020-09-03 (NLC) |