講演名 2002/9/12
順位づけ学習問題 : 順位つきサンプルを用いた順序関係推定
賀沢 秀人, 平尾 努, 前田 英作,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 全順序を備えた未知の集合から取り出された順位つきサンプルを利用し,サンプル間の順序関係を推定する「順位づけ学習問題」について議論する.従来,ある順位を境にサンプルを正例と負例にわけ,SVMの学習を行ったのち,得られた識別関数の値で未知の事例に対する順位づけを行うという手法が提案されている.この手法は,実験的に高い精度を残すことが報告されているが,妥当性について理論的な説明を欠き,また,ある特定の順位の上下という粗い順序関係しか用いていないという点で,問題があった.そこで,本稿では,このSVMによる順序づけ手法の理論的な妥当性を検証するとともに,改善手法の一つとして,複数の順位を境として正例と負例にわけたサンプルから学習を行うRanking SVMの提案を行う.また,テキスト自動要約タスクにおける重要文抽出データと人工データを用いて,Ranking SVMと従来手法を比較した結果についても報告する.
抄録(英) In this paper, we study the learning problem of ordering function, where training examples are ranked according to unknown ordering and the learner is to estimate ordering function which maps each sample to a real number which is consistent with the unkown ordering. Recently, a classifier estimation method was applied to this problem and obtained good results with real-world data. Although the method has several advantages over other existing methods in terms of computation time and design simplicity, it lacks theoretical justification. In this paper, we theoretically argue why classifiers can order examples. Additionally, we propose "Ranking SVM" to overcome some shortcomings of classifier-based methods. Ranking SVM and existing learning methods are experimentally compared using artificial data and real "sentense selection" data.
キーワード(和) 順位つきデータ / サポートベクトルマシン / 順序関係 / 重要文抽出
キーワード(英) ordered data / support vector machines / parallel boundaries / parameter variation regularization / sentence selection
資料番号 WIT2002-15
発行日

研究会情報
研究会 WIT
開催期間 2002/9/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Well-being Information Technology(WIT)
本文の言語 JPN
タイトル(和) 順位づけ学習問題 : 順位つきサンプルを用いた順序関係推定
サブタイトル(和)
タイトル(英) Learning Ordering Function from Ranked Examples
サブタイトル(和)
キーワード(1)(和/英) 順位つきデータ / ordered data
キーワード(2)(和/英) サポートベクトルマシン / support vector machines
キーワード(3)(和/英) 順序関係 / parallel boundaries
キーワード(4)(和/英) 重要文抽出 / parameter variation regularization
第 1 著者 氏名(和/英) 賀沢 秀人 / Hideto KAZAWA
第 1 著者 所属(和/英) NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories
第 2 著者 氏名(和/英) 平尾 努 / Tsutomu HIRAO
第 2 著者 所属(和/英) NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories
第 3 著者 氏名(和/英) 前田 英作 / Eisaku MAEDA
第 3 著者 所属(和/英) NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories
発表年月日 2002/9/12
資料番号 WIT2002-15
巻番号(vol) vol.102
号番号(no) 319
ページ範囲 pp.-
ページ数 6
発行日