トップ 差分 一覧 ソース 検索 ヘルプ RSS ログイン

研究賞2020年被表彰者

委員による厳正な審査の結果,2020年の優秀研究賞・学生研究賞はそれぞれ以下のように決定しました(2021年1月25日決定,2021年1月27日公表).なお,規程に基づき,優秀研究賞は共著者を含む全員,学生研究賞は筆頭著者である学生が表彰の対象となります.

優秀研究賞 (Best Paper Award)

受賞者

久本空海・山村 崇・勝田哲弘・竹林佑斗・高岡一馬・内田佳孝(ワークス)・岡 照晃・浅原正幸(国立国語研)

タイトル

chiVe: 製品利用可能な日本語単語ベクトル資源の実現へ向けて 〜形態素解析器Sudachiと超大規模ウェブコーパスNWJCによる分散表現の獲得と改良 〜

  • 2020年9月10日 第16回テキストアナリティクスシンポジウム における発表
概要

事前学習された単語分散表現(単語埋め込み、単語ベクトル)は,自然言語処理において重要な言語資源である.しかし特に日本語では,実用において使い勝手の良いリソースは少ない.我々の取り組む chiVe (チャイブ)は,形態素解析器 Sudachi による複数粒度分割を活用し,100億語規模コーパス NWJC をもとに学習した単語分散表現である.この資源は商用利用可能なライセンスのもと一般公開している( https://github.com/WorksApplications/chiVe ).本稿ではその概要と,その改良へ向けた取り組み,特に,未知語対応,同義語辞書の活用,そしてドメイン適用について解説する.

選奨理由

形態素解析器SudachiとNWJCコーパスを利用し,chiVeと呼ばれる日本語単語ベクトルを構築しています.また,その結果を言語資源として公開しています.このような汎用的な資源の公開は,自然言語処理分野全体にとって有益だと考えられ,とても公益性の高い研究だと考えられます.また,学術研究だけではなく,商用利用も可能だという点が,学術界と産業界の連携を目的の一つとしているテキストアナリティクスシンポジウムを開催しているNLCの研究分野・特性にもマッチしており,重要な研究成果です.これらの有用性や公益性から本研究が優秀研究賞にふさわしいと判断しました.

学生研究賞 (Best Student Paper Award)

受賞者

塩田 宰(九州工業大学)

タイトル

ランキング学習を用いた関連記事候補の抽出

  • 2020年9月10日 第16回テキストアナリティクスシンポジウム における発表
  • 著者:塩田 宰・嶋田和孝(九工大)・野上真司・福山修平(西日本新聞)
概要

オンラインで発行されるニュース記事に付与されている関連記事は,読者が有益な情報にアクセスすることを容易にする役割があり,読者の情報収集の効率化に貢献している.そのため,発行記事に対して適切な関連記事を付与することは新聞社にとって重要な課題の1つである.しかしながら,関連記事候補の中から適切な関連記事を人手で選択することは多大な労力を要する.そこで本研究は関連記事選択のコスト削減・自動化に向け,発行記事に対して関連記事候補をランキング形式で提示する手法について提案する.複数のランキング評価指標を用いた各モデルの精度比較を行い,最も精度の高かったモデルによる実際の入出力例について報告する.

選奨理由

オンラインニュース配信サイトを対象として,適切な関連記事を抽出することを目的とした研究です.実務的な課題に対して丁寧に手法や設定が検討されている研究であると考えられます.この選択問題をランキング学習として設定するのは良い着眼点だと考えられます.複数の手法を利用し,結果に対しても詳細な分析をしており,今後の課題などもよく考察されています.これらから,本研究が学生研究賞にふさわしいと判断しました.

リンク

最終更新時間:2021年02月12日 18時39分11秒