講演名 2019-02-22
データジャケットにおける一部の変数ラベルへのアノテーションを用いた能動的な変数ラベル推定
岩永 宇央(東大/数理システム), 早矢仕 晃章(東大), 大澤 幸生(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) データジャケットは,データそのものをオープンにせずにデータの概要情報を自然言語で記述する枠組みであり,多様なデータの共有・結合・利活用を促進する基盤として発展してきた.データジャケットにおいて,変数の名前や意味を記述した変数ラベルは,利用するデータ項目とその利活用プランを検討する上で欠かせない情報である.しかし,データジャケットはすべてのデータ項目や内容について記述することは強制しないため,変数ラベルには欠損が存在する.データ概要には明示的に記述されていない変数ラベルを推定するために,データ概要のテキストのみから変数ラベルを推定する行列ベースの手法が提案されているが,一部の変数ラベルの存在が予め分かっている場合や,ある変数ラベルが含まれるべきといったユーザーの事前知識や要求は考慮されていない.本研究では,行列ベースの変数ラベル推定手法を拡張し,一部の変数ラベルに対するアノテーションを元に推定結果の更新を可能にする手法を提案する.
抄録(英) Data Jacket (DJ) is a framework for sharing summaries of the data and encouraging collaboration and utilization of data in the market, with the data itself hidden. Variable labels (VLs) are described in DJs as the name or meaning of variables in the data. While VLs are the key information for planning data utilization or data collection, DJs have missing VLs because the registration rule of DJs does not force data holders to enter all the information about variables in the data. To infer likely VLs in DJs which are not explicitly in the outline of data, matrix-based method (MBM) are proposed. However, MBM is difficult for DJ users to reflect their prior knowledge or requirement about variables of the data (e.g. “some VLs should be included in the DJ”). In this paper, we propose a method for inferring VLs using ODs and annotation to some VLs, extending MBM to be applicable for active learning situations. Our method enables DJ users to update the inference results as needed by adding the annotation to VLs.
キーワード(和) データジャケット / 変数ラベル / 能動的学習 / 部分的なアノテーション
キーワード(英) Data Jacket / Variable Label / active learning / partial annotation
資料番号 AI2018-44
発行日 2019-02-15 (AI)

研究会情報
研究会 AI
開催期間 2019/2/22(から2日開催)
開催地(和) 関西大学 東京センター
開催地(英)
テーマ(和) 「データ市場特集V:異分野データ連携技術とイノベーション」および一般
テーマ(英)
委員長氏名(和) 峯 恒憲(九大)
委員長氏名(英) Tsunenori Mine(Kyushu Univ.)
副委員長氏名(和) 片上 大輔(東京工芸大) / 福田 直樹(静岡大)
副委員長氏名(英) Daisuke Katagami(Tokyo Polytechnic Univ.) / Naoki Fukuta(Shizuoka Univ.)
幹事氏名(和) 服部 宏充(立命館大) / 清 雄一(電通大)
幹事氏名(英) Hiromitsu Hattori(Ritsumeikan Univ.) / Yuichi Sei(Univ. of Electro-Comm.)
幹事補佐氏名(和) 櫻井 祐子(産総研)
幹事補佐氏名(英) Yuko Sakurai(AIST)

講演論文情報詳細
申込み研究会 Technical Committee on Artificial Intelligence and Knowledge-Based Processing
本文の言語 JPN
タイトル(和) データジャケットにおける一部の変数ラベルへのアノテーションを用いた能動的な変数ラベル推定
サブタイトル(和)
タイトル(英) Active Inference of Variable Labels Using Annotation to Some Variable Labels in Data Jackets
サブタイトル(和)
キーワード(1)(和/英) データジャケット / Data Jacket
キーワード(2)(和/英) 変数ラベル / Variable Label
キーワード(3)(和/英) 能動的学習 / active learning
キーワード(4)(和/英) 部分的なアノテーション / partial annotation
第 1 著者 氏名(和/英) 岩永 宇央 / Hiroo Iwanaga
第 1 著者 所属(和/英) 東京大学/NTTデータ数理システム(略称:東大/数理システム)
The University of Tokyo/NTT DATA Mathematical Systems Inc.(略称:UTokyo/NTT DATA MSI)
第 2 著者 氏名(和/英) 早矢仕 晃章 / Teruaki Hayashi
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 3 著者 氏名(和/英) 大澤 幸生 / Yukio Ohsawa
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
発表年月日 2019-02-22
資料番号 AI2018-44
巻番号(vol) vol.118
号番号(no) AI-453
ページ範囲 pp.39-44(AI),
ページ数 6
発行日 2019-02-15 (AI)