講演名 | 2021-12-03 マルチラベル分類における共起情報を用いたラベル平滑化手法 安田 有希(NHK), 石渡 大智(NHK), 宮﨑 太郎(NHK), 後藤 淳(NHK), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | マルチラベル分類のなかでも,ラベルの出現頻度が不均衡な分布であるデータセットを用いた学習は重要な課題の一つである.そのような不均衡データセットを用いた学習では,低頻度ラベルに対応する入力サンプルが少ないことから,モデルの低頻度ラベルに対する精度が低下してしまう.そこで,本研究では各ラベルの共起情報をラベル平滑化手法に取り込み,低頻度ラベルであっても関連した入力サンプルで学習を可能とする手法を提案する.実験の結果,本研究における提案手法が低頻度ラベルの精度向上に寄与している可能性が示唆された. |
抄録(英) | Imbalanced learning is one of the big issues in multi-label classification task. Training models using such imbalanced distribution of labels can cause overfitting to low-frequency labels because of lack of samples related to such labels. To tackle this issue, we propose a novel method for creating a soft target that represents the strength of label relationships, which is inspired by widely-used approaches, considering label co-occurrences and label smoothing. The result of the experiment shows that proposed method outperforms each baseline method, especially in terms of low-frequency labels. |
キーワード(和) | マルチラベル分類 / ラベル平滑化 / 共起 / 相互情報量 |
キーワード(英) | Multi-label classification / Label smoothing / Co-occurrence / Pointwise Mutual Information |
資料番号 | NLC2021-27,SP2021-48 |
発行日 | 2021-11-24 (NLC, SP) |
研究会情報 | |
研究会 | NLC / IPSJ-NL / SP / IPSJ-SLP |
---|---|
開催期間 | 2021/12/1(から3日開催) |
開催地(和) | オンライン開催 |
開催地(英) | Online |
テーマ(和) | 第23回音声言語シンポジウムおよび第8回自然言語処理シンポジウム |
テーマ(英) | |
委員長氏名(和) | 嶋田 和孝(九工大) / 関根 聡(理化学研究所) / 北岡 教英(豊橋技科大) / 北岡 教英(豊橋技術科学大学) |
委員長氏名(英) | Kazutaka Shimada(Kyushu Inst. of Tech.) / 関根 聡(理化学研究所) / Norihide Kitaoka(Toyohashi Univ. of Tec) / 北岡 教英(豊橋技術科学大学) |
副委員長氏名(和) | 吉田 光男(豊橋技科大) / 小早川 健(NHK) |
副委員長氏名(英) | Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Takeshi Kobayakawa(NHK) |
幹事氏名(和) | 坂地 泰紀(東大) / 石野 亜耶(広島経済大) / 内海 慶(株式会社デンソーアイティーラボラトリ) / 内田 ゆず(北海学園大学) / 木村 泰知(小樽商科大学) / 古宮 嘉那子(東京農工大学) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 秋田 祐哉(京都大学) / 太刀岡 勇気(デンソーアイティーラボラトリ) / 高島 遼一(神戸大学) / 高道 慎之介(東京大学) |
幹事氏名(英) | Hiroki Sakaji(Univ. of Tokyo) / Aya Ishino(Hiroshima Univ. of Economics) / 内海 慶(株式会社デンソーアイティーラボラトリ) / 内田 ゆず(北海学園大学) / 木村 泰知(小樽商科大学) / 古宮 嘉那子(東京農工大学) / Shinnosuke Takamichi(Univ. of Tokyo) / Ryouichi Takashima(Kobe Univ.) / 秋田 祐哉(京都大学) / 太刀岡 勇気(デンソーアイティーラボラトリ) / 高島 遼一(神戸大学) / 高道 慎之介(東京大学) |
幹事補佐氏名(和) | 高橋 寛治(Sansan) / 光田 航(NTT) / 笹野 遼平(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学) / 横野 光(明星大学) / 吉野 幸一郎(理化学研究所) / 中鹿 亘(電通大) / 増村 亮(NTT) |
幹事補佐氏名(英) | Kanji Takahashi(Sansan) / Koh Mitsuda(NTT) / 笹野 遼平(名古屋大学) / 須藤 克仁(奈良先端科学技術大学院大学) / 横野 光(明星大学) / 吉野 幸一郎(理化学研究所) / Toru Nakashika(Univ. of Electro-Comm.) / Ryo Masumura(NTT) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Natural Language / Technical Committee on Speech / Special Interest Group on Spoken Language Processing |
---|---|
本文の言語 | JPN |
タイトル(和) | マルチラベル分類における共起情報を用いたラベル平滑化手法 |
サブタイトル(和) | |
タイトル(英) | Label smoothing with co-occurrences information for multi-label classification |
サブタイトル(和) | |
キーワード(1)(和/英) | マルチラベル分類 / Multi-label classification |
キーワード(2)(和/英) | ラベル平滑化 / Label smoothing |
キーワード(3)(和/英) | 共起 / Co-occurrence |
キーワード(4)(和/英) | 相互情報量 / Pointwise Mutual Information |
第 1 著者 氏名(和/英) | 安田 有希 / Yuki Yasuda |
第 1 著者 所属(和/英) | 日本放送協会(略称:NHK) NIPPON HOUSOU KYOUKAI(略称:NHK) |
第 2 著者 氏名(和/英) | 石渡 大智 / Taichi Ishiwatari |
第 2 著者 所属(和/英) | 日本放送協会(略称:NHK) NIPPON HOUSOU KYOUKAI(略称:NHK) |
第 3 著者 氏名(和/英) | 宮﨑 太郎 / Taro Miyazaki |
第 3 著者 所属(和/英) | 日本放送協会(略称:NHK) NIPPON HOUSOU KYOUKAIroadcasting Corporation(略称:NHK) |
第 4 著者 氏名(和/英) | 後藤 淳 / Jun Goto |
第 4 著者 所属(和/英) | 日本放送協会(略称:NHK) NIPPON HOUSOU KYOUKAI(略称:NHK) |
発表年月日 | 2021-12-03 |
資料番号 | NLC2021-27,SP2021-48 |
巻番号(vol) | vol.121 |
号番号(no) | NLC-281,SP-282 |
ページ範囲 | pp.48-53(NLC), pp.48-53(SP), |
ページ数 | 6 |
発行日 | 2021-11-24 (NLC, SP) |