講演名 2017-07-14
テクストの相互情報量により非文字オントロジー間を接続する概念の提案とそのケーススダディ
宋 先波(神奈川大), 森住 哲也(神奈川大), 木下 宏揚(神奈川大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究は,神奈川大学で研究されている「非文字資料」をデータベース化するテーマに連関する.しかし本論文では「非文字」とはテクストに陽に書かれていない潜在的なテクストであると見做す.一般にデータは,共有・再利用のためデータを指し示す概念を分類整理する工学的オントロジー:~として示される.しかしながらこの操作によって非文字特有の(或いはもっと一般的なテクストに於いても)潜在的なテクストが削ぎ落される.即ち,次の問題が明示される:他者と非文字テクストを共有し,かつ非文字の潜在性を残しておきたい.本論文では次に示す4つの仮説に基づいてこの問題を考える:<『意味』は『作用』とともに変動する>,<思考と言語的振舞いには情報理論的な相関がある>,<実在を指示するテクストの,「語」を命題の変項と見做し,「語」と言う変項を『確率変数として見る』!>,<テクストを構成する語は事前的な語と事後的な語の相互情報量が最大になる様に生成される>.この仮説にしたがい,テクストはコーパス分解されワードベクトルとして捉えられる.ここにC. E. SHANNONのN-gramモデルと機械学習を組み合わせたプログラム (word2vec) の概念が使用される.即ち,語と語の内積的類似が語と語の相互情報量に近似できると言う性質を利用し,オントロジー間に情報理論的チャネルを生成する.更に,オントロジー間の情報量的チャネルを情報理論:~として評価する一つの試みを示す.
抄録(英) This paper is linked to the theme of database creation of "HIMOJI data" which has been studied at Kanagawa University. However, we regard "HIMOJI" as a latent text that is not explicitly written in texts. In general, data handled on the Internet is shown as an engineering ontology: that organizes the concepts that points to data for sharing and reusing the resources, However, this ontological operation will trim down the latent texts of "HIMOJI" (or even in more general). That is, the following problem is stated: we would like to share the "HIMOJI" text with others and keep the latent strength. In this paper, we consider this problem based on the following four hypotheses: <"Meaning" fluctuates with "behavior">, , , . According to this hypotheses, text is decomposed corpus and caught as a word vector. Here, the concept of a program (word 2 vec) combining C. E. SHANNON's N-gram model and machine learning is used. In other words, we utilize the property that the inner product similarity among the words can be approximated to the mutual information capacity among the words, and an informative channel between ontologies can be generated. Furthermore, we present an attempt to evaluate the information channel between ontologies as an information theory.
キーワード(和) 非文字 / オントロジー / ジル・ドゥルーズ / 確率変数 / 情報理論 / 相互情報量 / N-gram / 単語ベクトル
キーワード(英) HIMOJI / ontology / Gilles Deleuze / random variable / information theory / mutual information capacity / N-gram / word vector
資料番号 ISEC2017-26,SITE2017-18,ICSS2017-25,EMM2017-29
発行日 2017-07-07 (ISEC, SITE, ICSS, EMM)

研究会情報
研究会 SITE / EMM / ISEC / ICSS / IPSJ-CSEC / IPSJ-SPT
開催期間 2017/7/14(から2日開催)
開催地(和) 内田洋行東京本社ショールーム
開催地(英)
テーマ(和) セキュリティ、一般
テーマ(英)
委員長氏名(和) 岡田 仁志(NII) / 岩村 惠市(東京理科大) / 小川 一人(NHK) / 白石 善明(神戸大)
委員長氏名(英) Hitoshi Okada(NII) / Keiichi Iwamura(TUC) / Kazuto Ogawa(NHK) / Yoshiaki Shiraishi(Kobe Univ.)
副委員長氏名(和) 森住 哲也(神奈川大) / 小川 賢(神戸学院大) / 日置 尋久(京大) / 栗林 稔(岡山大) / 藤岡 淳(神奈川大) / 盛合 志帆(NICT) / 植田 武(三菱電機) / 高倉 弘喜(NII)
副委員長氏名(英) Tetsuya Morizumi(Kanagawa Univ.) / Masaru Ogawa(Kobe Gakuin Univ.) / Hirohisa Hioki(Kyoto Univ.) / Minoru Kuribayashi(Okayama Univ.) / Atsushi Fujioka(Kanagawa Univ.) / Shiho Moriai(NICT) / Takeshi Ueda(Mitsubishi Electric) / Hiroki Takakura(NII)
幹事氏名(和) 芳賀 高洋(岐阜聖徳学園大) / 川口 嘉奈子(東京藝術大) / 生源寺 類(静岡大) / 藤吉 正明(首都大東京) / 水木 敬明(東北大) / 大東 俊博(東海大) / 吉岡 克成(横浜国大) / 神谷 和憲(NTT)
幹事氏名(英) Takahiro Haga(Gifu Shotoku Gakuen Univ.) / Kanako Kawaguchi(Tokyo Univ. of the Arts) / Rui Shogenji(Shizuoka Univ.) / Masaaki Fujiyoshi(Tokyo Metropolitan Univ.) / Takaaki Mizuki(Tohoku Univ.) / Toshihiro Ohigashi(Tokai Univ.) / Katsunari Yoshioka(Yokohama National Univ.) / Kazunori Kamiya(NTT)
幹事補佐氏名(和) 壁谷 彰慶(千葉大) / 加藤 尚徳(KDDI) / 姜 玄浩(東京高専) / 村田 晴美(中京大) / 江村 恵太(NICT) / 駒野 雄一(東芝) / 須賀 祐治(インターネットイニシアティブ) / 笠間 貴弘(NICT) / 山田 明(KDDI labs.)
幹事補佐氏名(英) Akiyoshi Kabeya(Chiba Univ.) / Hisanori Kato(KDDI) / Kan Hyonho(NIT, Tokyo) / Harumi Murata(Tyukyo Univ.) / Keita Emura(NICT) / Yuichi Komano(TOSHIBA) / Yuuji Suga(IIJ) / Takahiro Kasama(NICT) / Akira Yamada(KDDI labs.)

講演論文情報詳細
申込み研究会 Technical Committee on Social Implications of Technology and Information Ethics / Technical Committee on Enriched MultiMedia / Technical Committee on Information Security / Technical Committee on Information and Communication System Security / Special Interest Group on Computer Security / Special Interest Group on Security Psychology and Trust
本文の言語 JPN
タイトル(和) テクストの相互情報量により非文字オントロジー間を接続する概念の提案とそのケーススダディ
サブタイトル(和) 潜在的テクストを確率変数として見る場合
タイトル(英) Proposal of the concept of connecting HIMOJI-ontologies by mutual information of texts, and its case study
サブタイトル(和) In the case to see latent texts as random variables
キーワード(1)(和/英) 非文字 / HIMOJI
キーワード(2)(和/英) オントロジー / ontology
キーワード(3)(和/英) ジル・ドゥルーズ / Gilles Deleuze
キーワード(4)(和/英) 確率変数 / random variable
キーワード(5)(和/英) 情報理論 / information theory
キーワード(6)(和/英) 相互情報量 / mutual information capacity
キーワード(7)(和/英) N-gram / N-gram
キーワード(8)(和/英) 単語ベクトル / word vector
第 1 著者 氏名(和/英) 宋 先波 / Xianbo Song
第 1 著者 所属(和/英) 神奈川大学(略称:神奈川大)
Kanagawa University(略称:Kanagawa Univ.)
第 2 著者 氏名(和/英) 森住 哲也 / Tetsuya Morizumi
第 2 著者 所属(和/英) 神奈川大学(略称:神奈川大)
Kanagawa University(略称:Kanagawa Univ.)
第 3 著者 氏名(和/英) 木下 宏揚 / Hirotsugu Kinoshita
第 3 著者 所属(和/英) 神奈川大学(略称:神奈川大)
Kanagawa University(略称:Kanagawa Univ.)
発表年月日 2017-07-14
資料番号 ISEC2017-26,SITE2017-18,ICSS2017-25,EMM2017-29
巻番号(vol) vol.117
号番号(no) ISEC-125,SITE-126,ICSS-127,EMM-128
ページ範囲 pp.135-140(ISEC), pp.135-140(SITE), pp.135-140(ICSS), pp.135-140(EMM),
ページ数 6
発行日 2017-07-07 (ISEC, SITE, ICSS, EMM)