お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2022-03-07 16:15
勾配ブースティングを用いた番組情報抽出
谷岡広樹徳島大)・谷脇研児プラットワークスNLC2021-37
抄録 (和) インターネットを用いた動画配信サービスが続々と立ち上がっているが,著者らは現在,番組制作会社のおすすめの番組情報を一元管理するデータベースシステムへ登録する作業の大部分を人手で行っており,今後の番組の増加に対応が困難となることが考えられる.そのため本研究では,番組情報をメタデータ化する作業の自動化を目指す.具体的には,PDF等の文書データから文字データや画像データを抽出し,その中から番組タイトル,番組内容などの番組情報としてメタデータ化する.このとき,番組情報のメタデータを人手で生成した番組情報を教師データとして,勾配ブースティングを用いて学習と推定することで高い精度で番組情報のメタデータ化が実現できることを確認したので報告する. 
(英) Although video distribution services using the Internet have been launched one after another, the authors currently perform most of the work of registering program information recommended by television production offices into a unified database system by hand, which be expected to become difficult to cope with the increase in the number of programs in the future. Therefore, this study aims to automate the process of converting program information into metadata. Specifically, text data and image data are extracted from PDF and other document data and converted into program metadata such as program titles and program contents. We have confirmed that the metadata of program information can be converted to metadata with high accuracy by learning and estimating the metadata using gradient boosting, using manually generated program information as training data.
キーワード (和) 勾配ブースティング / キーワード抽出 / メタデータ / / / / /  
(英) gradient boosting / keyword extractor / metadata / / / / /  
文献情報 信学技報, vol. 121, no. 415, NLC2021-37, pp. 54-55, 2022年3月.
資料番号 NLC2021-37 
発行日 2022-02-28 (NLC) 
ISSN Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード NLC2021-37

研究会情報
研究会 NLC  
開催期間 2022-03-07 - 2022-03-07 
開催地(和) オンライン開催 
開催地(英) Online 
テーマ(和) 観光情報処理と一般 
テーマ(英) Information Processing of Tourism, etc. 
講演論文情報の詳細
申込み研究会 NLC 
会議コード 2022-03-NLC 
本文の言語 日本語 
タイトル(和) 勾配ブースティングを用いた番組情報抽出 
サブタイトル(和)  
タイトル(英) Program Information Extraction Using Gradient Boosting 
サブタイトル(英)  
キーワード(1)(和/英) 勾配ブースティング / gradient boosting  
キーワード(2)(和/英) キーワード抽出 / keyword extractor  
キーワード(3)(和/英) メタデータ / metadata  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 谷岡 広樹 / Hiroki Tanioka / タニオカ ヒロキ
第1著者 所属(和/英) 徳島大学 (略称: 徳島大)
Tokushima University (略称: Tokushima Univ.)
第2著者 氏名(和/英/ヨミ) 谷脇 研児 / Kenji Taniwaki /
第2著者 所属(和/英) 株式会社プラットワークス (略称: プラットワークス)
PLAT WORKS Corporation (略称: PLAT WORKS Corp.)
第3著者 氏名(和/英/ヨミ) / /
第3著者 所属(和/英) (略称: )
(略称: )
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者 第1著者 
発表日時 2022-03-07 16:15:00 
発表時間 25分 
申込先研究会 NLC 
資料番号 NLC2021-37 
巻番号(vol) vol.121 
号番号(no) no.415 
ページ範囲 pp.54-55 
ページ数
発行日 2022-02-28 (NLC) 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会