◇ 第168回 自然言語処理研究会 言語理解とコミュニケーション研究会 ◎ 日 時: 平成17年7月22日(金) 09:30〜17:00 23日(土) 09:00〜17:00 ◎ 会 場: 健康文化村 カルチャーリゾート フェストーネ 〒901-2224 沖縄県 宜野湾市 真志喜 3-28-1 TEL:098-898-1212 [交通手段] (参考:http://www.oki-conven.jp/access/index.html 会場は沖縄コンベンションセンターがある公園の斜め向かいです) * 那覇空港から会場まで: 空港リムジンバス:ラグナガーデンホテル下車 徒歩5分 (所要時間:45分、料金:1000円) 路線バス:コンベンションセンター前バス停下車 徒歩3分 タクシー(所要時間:45分) * 那覇バスターミナル〜コンベンションセンター前バス停まで: (所要時間:35分、料金:450円) 系統:28番(国道58号経由のバスはコンベンションセンター前を 通らないので、注意してください。) 時刻表や路線図は、http://www.rosenbus.com/で確認してください。 (他の系統もHPに乗っています。ただ、遠回りなので、所要時間は 1時間程度かかります。) 〔連絡先〕・研究会、会場に関すること 自然言語処理研究会: 内元清貴(NICT) Tel: (0774)98-6834, Fax: (0774)98-6961 E-mail: uchimoto@nict.go.jp 言語理解とコミュニケーション研究会: 神崎享子(NICT) Tel: (0774)98-6836, Fax: (0774)98-6961 E-mail: kanzaki@nict.go.jp (問い合わせはできるだけ電子メイルでお願いします) ------------------------------------------------------------ 【プログラム】(発表件数25件) 7月22日(金) ― 09:30 〜 17:00 ― [09:30 〜 12:00] ● 重要語抽出・検索・文書分類 〔5件〕 [13:15 〜 15:15] ● 言い換え・質問応答 〔4件〕 [15:30 〜 17:00] ● 情報抽出・可視化 〔3件〕 7月23日(土) ― 09:00 〜 17:00 ― [09:00 〜 10:30] ● 専門用語 〔3件〕 [10:45 〜 12:15] ● 文脈・照応解析 〔3件〕 [13:15 〜 14:45] ● 推論・意味 〔3件〕 [15:00 〜 17:00] ● 言語の統計モデル 〔4件〕 ------------------------------------------------------------ 7月22日(金) ― 09:30 〜 17:00 ― [09:30 〜 12:00] ● 重要語抽出・検索・文書分類 〔5件〕 1. 時系列ニュース記事における最新話題語抽出方法 ○佐藤吉秀, 川島晴美, 佐々木努, 奥雅博(NTT) ニュース記事をクラスタリングした後、記事間類似度と新鮮度を用 いて各クラスタから話題性の高いキーワードを抽出する手法を提案、 評価結果を報告する。 2. 文書群の局所性と大域性の差を利用したキーワード粒度評価 ○下司義寛, 和多太樹, 安元裕司, 関隆宏, 廣川佐千男(九州大学) 局所的文書群と大域的文書群によるキーワードの重要性の違いに着 目し、キーワードの粒度を評価する方式を提案する。 3. 階層構造データ列の簡易な高速検索アルゴリズム ○村田真樹, 内山将夫(NICT), 金丸敏幸(京都大学/NICT), 井佐原均(NICT) 京大コーパスの形態素情報の品詞,品詞細分類,単語などの階層構 造をもったデータの列を簡易に高速検索する. 4. 特許、論文データベースを統合した検索環境の構築 ○安善奈津美, 難波英嗣, 相沢輝昭(広島市立大学), 奥村学(東京工業大学) 論文と特許間の引用関係を解析し、特許と論文の横断的な検索を可 能にするシステムについて述べる。 5. 構造と特徴選択に着目した電子メールの分類手法の提案 ○川前徳章(NTT) 本論文は電子メールの分類精度の向上に関する研究である。本研究 では電子メールの分類手法としてナイーブベイズ分類を用い、この 分類精度を向上するために電子メールの構造と特徴選択に着目する 手法を提案し、その効果を実験によって確認した。 [13:15 〜 15:15] ● 言い換え・質問応答 〔4件〕 6. 異なる文書中の文間関係の特定 ○宮部泰成, 高村大也, 奥村学(東京工業大学) 同一トピックについて書かれた複数の新聞記事中の文間には、同じ 事柄を述べたものや、簡略に述べたもの、詳細に述べたものなどの 関係がある。本研究ではそれらの中で、同じ事柄を述べる同等関係 の特定を行う。 7. 統合的言い換え表現の抽出 ○呉浩東, 下川浩, 二宮哲(獨協大学) 本稿では、複数名言語資源から語彙的言い換え表現、構文的言い換 え表現、意味的言い換え表現 の抽出方法を提案する。 8. 質問応答システムの正解順位とユーザ満足率の関係について ○國分智晴, 酒井哲也, 齋藤佳美, 筒井秀樹, 真鍋俊彦, 小山誠, 藤井寛子(東芝) デスクトップおよびモバイル環境における質問応答に要求される精 度について、アンケートに基づく分析を行った。 9. Howto型質問応答の実現に向けた質問回答文書の特徴分析 ○麻野間直樹, 古瀬蔵, 片岡良治(NTT) 方法を問う質問に対してどの程度役立つ回答文書かを示す説明度合 いの尺度を設け,この説明度が高い文書の特徴を分析した結果につ いて報告する [15:30 〜 17:00] ● 情報抽出・可視化 〔3件〕 10. プライバシ保護に向けた固有表現処理技術 ○小作浩美(ATR), 相良かおる(西南女学院大学), 納谷太, 桑原教彰, 阿部明典, 小暮潔(ATR) 我々は看護師支援システムの開発を行っている。本稿では、看護師 の作業を理解するために行った看護師の会話データ収集実験とその データからのプライバシ情報の削除について報告する。 11. 文書横断文間関係を考慮した動向情報の抽出と可視化 ○難波英嗣(広島市立大学), 国政美伸(中国サンネット), 福島志穂(マイティネット), 相沢輝昭(広島市立大学), 奥村学(東京工業大学) あるトピックに関する複数テキストから「推移」の関係にある文集 合を 検出し、そこから動向情報を抽出・可視化する手法について 述べる。 12. アンカーテキストを用いたWebディレクトリの構築 ○鈴木祐介, 松原茂樹, 吉川正俊(名古屋大学) 複数のサイトからWeb文書間の上位-下位関係を抽出し,階層的なデ ィレクトリ構造を構築する手法を提案する. 7月23日(土) ― 09:00 〜 17:00 ― [09:00 〜 10:30] ● 専門用語 〔3件〕 13. 医療用語のコード化手法 ○藤尾正和, 関峰伸, 永崎健, 丹羽芳樹, 久光徹(日立製作所) 診療報酬請求書の審査業務は、大部分が紙ベースで行われる。OCR 認識結果のテキストを診療報酬マスター用語に変換する手法を検討 ・評価したので報告する。 14. 属性影響語を用いた専門用語判別 ○池野篤司, 濱口佳孝(沖電気), 山本英子, 井佐原均(NICT) 統計的に獲得された複合語の専門用語判別において、著者が提案し ている属性影響語の効果と選別方法について報告する。 15. 専門分野対訳用語集の自動生成 ○外池昌嗣, 木田充洋, 高木俊宏, 佐々木靖弘, 宇津呂武仁, 佐藤理史(京都大学) ウェブと既存の対訳辞書を利用して、特定の専門分野の用語及びそ れらの訳語を集めた対訳用語集を生成する方法を提案する。 [10:45 〜 12:15] ● 文脈・照応解析 〔3件〕 16. ネットワークの活性値に基づく深層格解析手法の提案 ○渋木英潔(北海学園大学), 荒木健治(北海道大学), 桃内佳雄(北海学園大学), 栃内香次(北海学園大学) 文章の話題の推移をネットワーク上の活性値の変化により表現し、 その活性値に基づいて照応と深層格推測を行う手法を提案する。 17. 物体の集合関係を含む参照表現の解析 ○渡辺聖, 船越孝太郎, 栗山直子, 徳永健伸(東京工業大学) 類似した物体が散在する状況では,その物体の集合を参照する指示 表現が用いられる。 このような表現から指示対象を特定するアル ゴリズムを提案する. 18. PIIからマニュアルへの参照を作成する方法について ○加藤直孝(日本IBM), 有澤誠(慶應義塾大学) プログラムの国際化では、プログラム中の文字列をプログラムから 分離して翻訳を行う。この文字列をPII(Program Integrated Information)と呼ぶ。本稿はPIIとプログラムのマニュアルの連鎖 に関する問題とその解決方法を述べる。 [13:15 〜 14:45] ● 推論・意味 〔3件〕 19. 連想メカニズムを用いた時間判断手法の有効性の検証 ○土屋誠司(同志社大学/三洋電機), 渡部広一, 河岡司(同志社大学) 日常的な時間表現に着目し,事前に与えた基本的な常識知識から, 未知の表現にも対応する手法を提案する. 20. 頑健なHPSGパーザの出力からTDL意味表現への変換手法 ○佐藤学, 戸次大介, 宮尾祐介, 辻井潤一(東京大学) 自動獲得されたHPSGパーザの出力からTDL意味表現を得るための語 彙項目間の変換規則を提案する。 21. 意味役割名と意味型名の区別による新しい概念分類の可能性 ○黒田航, 井佐原均(NICT) 現行の多くの概念分類体系には不備がある.その一つが意味型と意 味役割の区別の不在である.例えば日本語語彙大系では「番犬」と 「番人」の共通性[番をする者]が表現されていない.この種の表現 力の不足を補うための枠組みを意味フレームの一般理論の観点から 素描する. [15:00 〜 17:00] ● 言語の統計モデル 〔4件〕 22. GMAISによる文化言語温存の研究 ○沢恒雄(愛知学泉大学), 上江洲基(名桜大学) 環境・社会・経済のトリレンマ緩解でしか22世紀まで人類が存続 し得ない。人類存続のため方略として6800種の言語(文化)を温存 するモデル、人類存続の最低条件を満たすための地球環境経営のモ デルが双対であることを提言する 23. 擬似単語モデルによる非言語音声の認識 ○高橋伸弥, 森元逞(福岡大学) 咳や咳払いといった非言語音声を音素系列で近似した擬似単語モデ ルを提案し、認識実験により有効性を示す。 24. 極性反転に対応した評価表現モデル ○高村大也(東京工業大学), 乾孝司(日本学術振興会), 奥村学(東京工業大学) 「完成度が高い」と「違法性が高い」のように、同じ単語(ここで は「高い」)が使われていても共起する単語によって評価極性が反 転することがある。隠れクラスを導入することにより、このような 評価表現をモデル化する。 25. 単語リストと生コーパスによる確率的言語モデルの分野適応 ○森信介(日本アイ・ビー・エム) 単語リストとそれを含むコーパスによる確率的言語モデルの分野適 応について述べ、仮名漢字変換の精度により評価する