大会名称 |
---|
2021年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2021 |
発行日 |
2021-08-12 |
セッション番号 |
6d |
セッション名 |
自然言語処理(情報検索・推論) |
講演日 |
2021/08/27 |
講演場所(会議室等) |
d |
講演番号 |
E-044 |
タイトル |
BERTを用いた分類モデルによる冗長な質問文の要点抽出 |
著者名 |
中山研一朗, 正田備也, |
キーワード |
BERT, チャットボット, AI, 自然言語処理 |
抄録 |
AIを用いたチャットボットが多くの企業で導入されているが、その多くが、事前に登録したFAQから、利用者が入力した質問に対応して最も類似したものを選択する分類モデルである。しかし、利用者はしばしば冗長な説明のついた質問を行うことがあり、分類精度を下げる要因となっている。本研究は、冗長な質問から疑問文のみを抽出するモデルを、日本語Wikipediaで事前訓練済みのBERTを用いて構築した。ファインチューニングには、ヤフー知恵袋のデータを用いることで、質問かそれ以外か分類するアノテーションを容易に取得した。ファインチューニングの結果、90%を超えるAccuracyを実現した。 |
本文pdf |
PDF download (881.2KB) |