講演名 2011-10-10
HPSGに基づく英日翻訳とT_EXによるXMLの可視化(招待講演,自然言語処理)
磯崎 秀樹,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 筆者は昨年,HPSGパーザEnjuを前処理に用いた英日翻訳手法を提案した.その失敗解析でEnjuのXML出力を調べることになったが,短い英文でもXML出力は長大でわかりにくい.そこで,XMLのコードから構文木を描画するT_EXマクロパッケージを作成した."<"のカテゴリコードを"\"と同じにすれば,XMLのタグはT_Exの命令になる.ノードの座標をボトムアップに計算してeepicで描画するこのパッケージは失敗解析で活躍した.本稿では,TikZ/PGFで機能拡張したパッケージについて述べる.HTML文書をT_EXで直接扱えることも示す.
抄録(英) Last year, the author proposed an English-to-Japanese translation method that used Enju, an HPSG parser, in its preprocessor. In its failure analysis, the author examined XML output from the Enju parser. Even a short English sentence becomes a long and incomprehensible XML output. Therefore, the author implemented a T_EX macro package that draws syntax trees from the XML output. If we make the category code of "<" same as that of "\", XML tags become T_EX's control sequences. Then, we denned them to determine coordinates of nodes in a bottom-up manner and to draw the tree using eepic. This package was useful in failure analysis. In this paper, we describe an extended package based on TikZ/PGF. We can also process HTML documents.
キーワード(和) HPSG / 機械翻訳 / XML / 可視化
キーワード(英) HPSG / Machine Translation / XML / T_EX / Visualization
資料番号 TL2011-28,NLC2011-25
発行日

研究会情報
研究会 NLC
開催期間 2011/10/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) HPSGに基づく英日翻訳とT_EXによるXMLの可視化(招待講演,自然言語処理)
サブタイトル(和)
タイトル(英) HPSG-based English-to-Japanese Translation and XML Visualizer written in T_EX
サブタイトル(和)
キーワード(1)(和/英) HPSG / HPSG
キーワード(2)(和/英) 機械翻訳 / Machine Translation
キーワード(3)(和/英) XML / XML
キーワード(4)(和/英) 可視化 / T_EX
第 1 著者 氏名(和/英) 磯崎 秀樹 / Hideki ISOZAKI
第 1 著者 所属(和/英) 岡山県立大学
Okayama Prefectural University
発表年月日 2011-10-10
資料番号 TL2011-28,NLC2011-25
巻番号(vol) vol.111
号番号(no) 228
ページ範囲 pp.-
ページ数 6
発行日