講演名 2019-09-29
単語の分散表現とトピックモデルを利用した隠語の検出
ギ イツリン(日大), 労 瑛瑩(日大), 韓 東力(日大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 自然言語の分析においては、分析の障害となりうる隠語と呼ばれる現象が存在する。既存研究では未知語としての隠語に関する処理方法が多く語られ、別単語への置き換えとしての隠語を検出する技術があまり開発されてこなかった。本研究では、トピックモデルとword2vecを用いて単語の分散表現を獲得し、文のトピックと全単語の適合性を求めることで、隠語を自動的に検出する手法を提案した。また、自動的に作成された例文を用いた評価実験を行った結果、提案手法の有効性が確認できた。
抄録(英) In natural language analysis, there is a phenomenon called hidden-word that can be an obstacle. Most previous studies deal with hidden-words as one type of unknown words. However, the approach to detect hidden words as replacements for other words is not sufficient. In this research, by employing the topic model and word2vec to obtain distributed expressions of words, we have proposed a method to automatically detect hidden-words from a sentence by estimating the compatibility between each word and the topic of the sentence. Also, we have automatically created test sentences containing hidden-words and conducted an evaluation experiment. The experimental results have shown the effectiveness of our approach.
キーワード(和) 隠語 / word2vec / トピックモデル
キーワード(英) Hidden-word / Word2vec / Topic-model
資料番号 TL2019-39
発行日 2019-09-22 (TL)

研究会情報
研究会 TL
開催期間 2019/9/29(から1日開催)
開催地(和) 独立行政法人国立高等専門学校機構 函館工業高等専門学校
開催地(英) National Institute of Technology, Hakodate College
テーマ(和) テーマ(1):芸術と言語 テーマ (2):場の言語学・意味の創発・場の共創 テーマ(3):思考と言語一般
テーマ(英) Theme 1 Arts and Language, Theme 2 Ba linguistics, Abduction of meaning, "Ba" in Co-Creation, Abduction and Innovation, Theme 3 Language and Thought
委員長氏名(和) 佐野 洋(東京外国語大)
委員長氏名(英) Hiroshi Sano(Tokyo Univ. of Foreign Studies)
副委員長氏名(和) 近藤 公久(工学院大) / 竹内 和広(阪電通大)
副委員長氏名(英) Tadahisa Kondo(Kogakuin Univ.) / Kazuhiro Takeuchi(Osaka Electro-Comm. Univ.)
幹事氏名(和) 森下 美和(神戸学院大) / 坪田 康(京都工繊大)
幹事氏名(英) Miwa Morishita(Kobe Gakuin Univ.) / Yasushi Tsubota(Kyoto Inst. of Tech.)
幹事補佐氏名(和) 神長 伸幸(ミイダス) / 高田 明典(フェリス女学院大) / 石川 彰夫(KDDI総合研究所)
幹事補佐氏名(英) Nobuyuki Jincho(Miidas) / Akinori Takada(Ferris Univ.) / Akio Ishikawa(KDDI Research)

講演論文情報詳細
申込み研究会 Technical Committee on Thought and Language
本文の言語 JPN
タイトル(和) 単語の分散表現とトピックモデルを利用した隠語の検出
サブタイトル(和)
タイトル(英) Hidden-word detection based on distributed representations and the topic model
サブタイトル(和)
キーワード(1)(和/英) 隠語 / Hidden-word
キーワード(2)(和/英) word2vec / Word2vec
キーワード(3)(和/英) トピックモデル / Topic-model
第 1 著者 氏名(和/英) ギ イツリン / Wei Yilun
第 1 著者 所属(和/英) 日本大学(略称:日大)
Nihon University(略称:Nihon Univ.)
第 2 著者 氏名(和/英) 労 瑛瑩 / Lao Yingying
第 2 著者 所属(和/英) 日本大学(略称:日大)
Nihon University(略称:Nihon Univ.)
第 3 著者 氏名(和/英) 韓 東力 / Han Dongli
第 3 著者 所属(和/英) 日本大学(略称:日大)
Nihon University(略称:Nihon Univ.)
発表年月日 2019-09-29
資料番号 TL2019-39
巻番号(vol) vol.119
号番号(no) TL-213
ページ範囲 pp.11-15(TL),
ページ数 5
発行日 2019-09-22 (TL)