講演抄録/キーワード |
講演名 |
2008-05-23 11:30
タグなしコーパスのフレーズ分析 ~ 日本語とブルガリア語におけるオンライン発話行動の諸相 ~ ○マルチェフ ミレン(一橋大) TL2008-4 |
抄録 |
(和) |
タグなしコーパスのフレーズ分析をNグラムで行う方法を考案し、日本語とブルガリア語のオンライン上での発話行動の分析に適用してみた。ここでは、インターネット掲示板コーパスから得られたNグラム頻度情報をデータとして、両言語についてオンライン会話およびオンライン行動の特徴を取り上げ比較する。「議論フレーズ」、挨拶、ハイパーリンクなどを検討する。また、Nグラムによるフレーズ分析の利点や可能性、コーパス言語学における有用性についても主張する。 |
(英) |
This paper describes an N-gram-based approach to interrogating untagged corpora, called Phrasal Analysis, and attempts to explain its value and practicability. Furthermore, N-gram data from Japanese and Bulgarian Internet message boards is used to compare aspects of the language and behaviour of posters in the respective two countries. Contrasted categories include discussional phrases, greetings, time expressions and hyperlinks. |
キーワード |
(和) |
タグなしコーパス / Nグラム / フレーズ分析 / インターネット掲示板 / / / / |
(英) |
Untagged Corpora / N-grams / Phrasal Analysis / Internet Forums / Message Boards / / / |
文献情報 |
信学技報, vol. 108, no. 50, TL2008-4, pp. 17-22, 2008年5月. |
資料番号 |
TL2008-4 |
発行日 |
2008-05-16 (TL) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
TL2008-4 |