講演抄録/キーワード |
講演名 |
2017-07-14 15:45
テクストの相互情報量により非文字オントロジー間を接続する概念の提案とそのケーススダディ ~ 潜在的テクストを確率変数として見る場合 ~ ○宋 先波・森住哲也・木下宏揚(神奈川大) ISEC2017-26 SITE2017-18 ICSS2017-25 EMM2017-29 |
抄録 |
(和) |
本研究は,神奈川大学で研究されている「非文字資料」をデータベース化するテーマに連関する.しかし本論文では「非文字」とはテクストに陽に書かれていない潜在的なテクストであると見做す.一般にデータは,共有・再利用のためデータを指し示す概念を分類整理する工学的オントロジー:~として示される.しかしながらこの操作によって非文字特有の(或いはもっと一般的なテクストに於いても)潜在的なテクストが削ぎ落される.即ち,次の問題が明示される:他者と非文字テクストを共有し,かつ非文字の潜在性を残しておきたい.
本論文では次に示す4つの仮説に基づいてこの問題を考える:<『意味』は『作用』とともに変動する>,<思考と言語的振舞いには情報理論的な相関がある>,<実在を指示するテクストの,「語」を命題の変項と見做し,「語」と言う変項を『確率変数として見る』!>,<テクストを構成する語は事前的な語と事後的な語の相互情報量が最大になる様に生成される>.
この仮説にしたがい,テクストはコーパス分解されワードベクトルとして捉えられる.ここにC. E. SHANNONのN-gramモデルと機械学習を組み合わせたプログラム (word2vec) の概念が使用される.即ち,語と語の内積的類似が語と語の相互情報量に近似できると言う性質を利用し,オントロジー間に情報理論的チャネルを生成する.更に,オントロジー間の情報量的チャネルを情報理論:~として評価する一つの試みを示す. |
(英) |
This paper is linked to the theme of database creation of "HIMOJI data" which has been studied at Kanagawa University. However, we regard "HIMOJI" as a latent text that is not explicitly written in texts. In general, data handled on the Internet is shown as an engineering ontology: that organizes the concepts that points to data for sharing and reusing the resources, However, this ontological operation will trim down the latent texts of "HIMOJI" (or even in more general). That is, the following problem is stated: we would like to share the "HIMOJI" text with others and keep the latent strength. In this paper, we consider this problem based on the following four hypotheses: <"Meaning" fluctuates with "behavior">, <There is an Information theoretic correlation between thought and linguistic behavior>, <The text that instructs real existence is regarded as a propositional variable, and the variable called "word" is viewed as a random variable! >, <The words that make up the text are generated such that the mutual information capacity among the prior word and the posterior word is maximized>.
According to this hypotheses, text is decomposed corpus and caught as a word vector. Here, the concept of a program (word 2 vec) combining C. E. SHANNON's N-gram model and machine learning is used. In other words, we utilize the property that the inner product similarity among the words can be approximated to the mutual information capacity among the words, and an informative channel between ontologies can be generated. Furthermore, we present an attempt to evaluate the information channel between ontologies as an information theory. |
キーワード |
(和) |
非文字 / オントロジー / ジル・ドゥルーズ / 確率変数 / 情報理論 / 相互情報量 / N-gram / 単語ベクトル |
(英) |
HIMOJI / ontology / Gilles Deleuze / random variable / information theory / mutual information capacity / N-gram / word vector |
文献情報 |
信学技報, vol. 117, no. 126, SITE2017-18, pp. 135-140, 2017年7月. |
資料番号 |
SITE2017-18 |
発行日 |
2017-07-07 (ISEC, SITE, ICSS, EMM) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ISEC2017-26 SITE2017-18 ICSS2017-25 EMM2017-29 |
研究会情報 |
研究会 |
SITE EMM ISEC ICSS IPSJ-CSEC IPSJ-SPT |
開催期間 |
2017-07-14 - 2017-07-15 |
開催地(和) |
内田洋行東京本社ショールーム |
開催地(英) |
|
テーマ(和) |
セキュリティ、一般 |
テーマ(英) |
|
講演論文情報の詳細 |
申込み研究会 |
SITE |
会議コード |
2017-07-SITE-EMM-ISEC-ICSS-CSEC-SPT |
本文の言語 |
日本語 |
タイトル(和) |
テクストの相互情報量により非文字オントロジー間を接続する概念の提案とそのケーススダディ |
サブタイトル(和) |
潜在的テクストを確率変数として見る場合 |
タイトル(英) |
Proposal of the concept of connecting HIMOJI-ontologies by mutual information of texts, and its case study |
サブタイトル(英) |
In the case to see latent texts as random variables |
キーワード(1)(和/英) |
非文字 / HIMOJI |
キーワード(2)(和/英) |
オントロジー / ontology |
キーワード(3)(和/英) |
ジル・ドゥルーズ / Gilles Deleuze |
キーワード(4)(和/英) |
確率変数 / random variable |
キーワード(5)(和/英) |
情報理論 / information theory |
キーワード(6)(和/英) |
相互情報量 / mutual information capacity |
キーワード(7)(和/英) |
N-gram / N-gram |
キーワード(8)(和/英) |
単語ベクトル / word vector |
第1著者 氏名(和/英/ヨミ) |
宋 先波 / Xianbo Song / ソウ センハ |
第1著者 所属(和/英) |
神奈川大学 (略称: 神奈川大)
Kanagawa University (略称: Kanagawa Univ.) |
第2著者 氏名(和/英/ヨミ) |
森住 哲也 / Tetsuya Morizumi / モリズミ テツヤ |
第2著者 所属(和/英) |
神奈川大学 (略称: 神奈川大)
Kanagawa University (略称: Kanagawa Univ.) |
第3著者 氏名(和/英/ヨミ) |
木下 宏揚 / Hirotsugu Kinoshita / キノシタ ヒロツグ |
第3著者 所属(和/英) |
神奈川大学 (略称: 神奈川大)
Kanagawa University (略称: Kanagawa Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2017-07-14 15:45:00 |
発表時間 |
25分 |
申込先研究会 |
SITE |
資料番号 |
ISEC2017-26, SITE2017-18, ICSS2017-25, EMM2017-29 |
巻番号(vol) |
vol.117 |
号番号(no) |
no.125(ISEC), no.126(SITE), no.127(ICSS), no.128(EMM) |
ページ範囲 |
pp.135-140 |
ページ数 |
6 |
発行日 |
2017-07-07 (ISEC, SITE, ICSS, EMM) |
|