お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2013-03-07 11:15
Twitterにおける極大部分文字列の反復度および時系列相関を用いた類似単語判定
久野雄一郎澤勢一史延原 肇筑波大SIS2012-49
抄録 (和) Twitterは近年注目されているマイクロブログの1つであり,検索エンジンによる情報検索では得られないような,即時性や多様性のある情報が得られる.その一方で,固有名詞の類似単語である俗語や略語等が多数登場するため,情報検索において検索エンジンよりも適切なキーワード選択が難しい.そこでTwitter検索支援を目的とした類似単語を考慮したキーワード推薦のために,極大部分文字列による固有名詞の抽出と時系列データの相関および単語の共起確率に基づき固有名詞の類似度判定を行い,類似単語辞書を構成する.また,固有名詞抽出において,反復度を用いた極大部分文字列からノイズとなる部分文字列の除去を行う.2011年末,2012年末のテレビ番組である紅白歌合戦のハッシュタグが付与されたデータに提案手法を用い,形態素解析を用いる手法よりも効果的に類似度判定ができることを示す. 
(英) In order to merge various onomastic expressions for valuable tweet topic retrieval/clustering, a construction method of twitter dictionaries based on lexical extraction and their time-correlation is proposed. In this paper, we propose Maximal substrings to extract efficient lexical set and adaptation to remove superfluous substrings. Moreover, similarities between keywords are calculated by the time-correlation of each word and co-occurrence probability. Through experiments with 101,714/354,706 tweets with the hashtags related to “NHK Kohaku-Utagassen” in 2011/2012, the effectiveness of the proposed method compared with the method used morphological analysis is shown.
キーワード (和) マイクロブログ / 検索支援 / 時系列相関 / 極大部分文字列 / 反復度 / / /  
(英) Microblog / Retrieval support / Time-correlation / Maximal substring / Adaptation / / /  
文献情報 信学技報, vol. 112, no. 465, SIS2012-49, pp. 21-26, 2013年3月.
資料番号 SIS2012-49 
発行日 2013-02-28 (SIS) 
ISSN Print edition: ISSN 0913-5685    Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード SIS2012-49

研究会情報
研究会 SIS  
開催期間 2013-03-07 - 2013-03-08 
開催地(和) クリエート浜松 
開催地(英) Create Hamamatsu 
テーマ(和) ソフトコンピューティング,一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 SIS 
会議コード 2013-03-SIS 
本文の言語 日本語 
タイトル(和) Twitterにおける極大部分文字列の反復度および時系列相関を用いた類似単語判定 
サブタイトル(和)  
タイトル(英) Extraction of Similar Words Based on Adaptation and Time-correlation of Maximal Substrings from Tweets of The Same Topic 
サブタイトル(英)  
キーワード(1)(和/英) マイクロブログ / Microblog  
キーワード(2)(和/英) 検索支援 / Retrieval support  
キーワード(3)(和/英) 時系列相関 / Time-correlation  
キーワード(4)(和/英) 極大部分文字列 / Maximal substring  
キーワード(5)(和/英) 反復度 / Adaptation  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 久野 雄一郎 / Yuichiro Hisano / ヒサノ ユウイチロウ
第1著者 所属(和/英) 筑波大学 (略称: 筑波大)
University of Tsukuba (略称: Univ. of Tsukuba)
第2著者 氏名(和/英/ヨミ) 澤勢 一史 / Kazuhito Sawase / サワセ カズヒト
第2著者 所属(和/英) 筑波大学 (略称: 筑波大)
University of Tsukuba (略称: Univ. of Tsukuba)
第3著者 氏名(和/英/ヨミ) 延原 肇 / Hajime Nobuhara / ノブハラ ハジメ
第3著者 所属(和/英) 筑波大学 (略称: 筑波大)
University of Tsukuba (略称: Univ. of Tsukuba)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2013-03-07 11:15:00 
発表時間 20分 
申込先研究会 SIS 
資料番号 SIS2012-49 
巻番号(vol) vol.112 
号番号(no) no.465 
ページ範囲 pp.21-26 
ページ数
発行日 2013-02-28 (SIS) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会