大会名称
2021年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2021
発行日
2021-08-12
セッション番号
6d
セッション名
自然言語処理(情報検索・推論)
講演日
2021/08/27
講演場所(会議室等)
d
講演番号
E-044
タイトル
BERTを用いた分類モデルによる冗長な質問文の要点抽出
著者名
中山研一朗正田備也
キーワード
BERT, チャットボット, AI, 自然言語処理
抄録
AIを用いたチャットボットが多くの企業で導入されているが、その多くが、事前に登録したFAQから、利用者が入力した質問に対応して最も類似したものを選択する分類モデルである。しかし、利用者はしばしば冗長な説明のついた質問を行うことがあり、分類精度を下げる要因となっている。本研究は、冗長な質問から疑問文のみを抽出するモデルを、日本語Wikipediaで事前訓練済みのBERTを用いて構築した。ファインチューニングには、ヤフー知恵袋のデータを用いることで、質問かそれ以外か分類するアノテーションを容易に取得した。ファインチューニングの結果、90%を超えるAccuracyを実現した。
本文pdf
PDF download (881.2KB)