講演名 2018-11-02
調理手順テキストと料理画像の特徴量の最近傍探索に基づく重複レシピの検出手法
小邦 将輝(筑波大), Lasguido Nio(楽天), 平手 勇宇(楽天), 関 洋平(筑波大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 投稿型レシヒ?サイトには,調理手順テキストや料理画像といった他のレシヒ?の構成要素を模倣したレシヒ?か?掲載されている.本研究て?はそれらのレシヒ?を「重複レシヒ?」と呼ふ?.本研究て?は,調理手順テキスト間類似度およひ?材料相違数を用いて重複レシヒ?を検出する手法,料理画像間類似度を用いて重複レシヒ?を検出する手法を提案する.本研究て?は,調理手順テキストの特徴量を約116万件のレシヒ?から学習した単語の分散表現をもとに抽出する.また,料理画像の特徴量を学習済みのInception-v3を用いて抽出する.重複レシヒ?を検出する際には,高速な検索を行うために,最近傍探索を用いる.提案手法の評価実験として,料理レシヒ?テ?ータセットを用いた重複レシヒ?検出実験を行った.評価実験の結果,調理手順テキスト中て?言い換えや書き換えか?行われている場合て?も,重複レシヒ?の検出か?行えることを確認した.また,最近傍探索を用いて重複レシヒ?ヘ?アを検出する提案手法の実行時間を計測した結果,総当たりて?重複レシヒ?ヘ?アを検出する先行研究の手法に比へ?,実行時間を約70分の1に短縮することか?て?きた.
抄録(英) In user-generated recipe websites, recipes that imitated recipe elements of other recipes are posted. In this study, we call these recipes as “near-duplicate recipes”. We propose the methods for detecting near-duplicate recipes based on cooking instructions similarities and number of differences of ingredients, and also based on food images similarities. We extracted cooking instruction features based on the distributed representation of words trained on using approximately 1.16 millions of recipes. In addition, we extracted food image features based on pre-trained Inception-v3. We utilize nearest neighbor search technique to reduce search time for near-duplicate recipes. We conducted the experiment to evaluate the proposed method. As a result, we confirmed that our proposed method were able to detect near-duplicate recipes, which the writer seemed to imitate the original recipe with paraphrasing the terms in the cooking instructions of it. We also measured execution time of our proposed method using nearest neighbor search and found that we could reduce execution time to approximately one seventieth compared to our previous method using exhaustive search.
キーワード(和) 重複レシピ / 最近傍探索 / 類似テキスト検索 / 類似画像検索
キーワード(英) Near-duplicate recipe / Nearest neighbor search / Similar text search / Similar image search
資料番号 HCS2018-44
発行日 2018-10-26 (HCS)

研究会情報
研究会 HCS
開催期間 2018/11/2(から1日開催)
開催地(和) つくばイノベーションプラザ
開催地(英)
テーマ(和) コミュニケーションと食および一般(CEA協賛)
テーマ(英)
委員長氏名(和) 松田 昌史(NTT)
委員長氏名(英) Masafumi Matsuda(NTT)
副委員長氏名(和) 渡邊 伸行(金沢工大) / 井上 智雄(筑波大)
副委員長氏名(英) Nobuyuki Watanabe(Kanazawa Inst. of Tech.) / Tomoo Inoue(Univ. of Tsukuba)
幹事氏名(和) 林 勇吾(立命館大) / 小森 政嗣(阪電通大) / 吉田 悠(NEC)
幹事氏名(英) Yugo Hayashi(Ritsumeikan Univ.) / Masashi Komori(Osaka Electro-Comm. Univ.) / Haruka Yoshida(NEC)
幹事補佐氏名(和) 高嶋 和毅(東北大) / 藤原 健(阪経済大) / 寺田 和憲(岐阜大) / 木村 敦(日大)
幹事補佐氏名(英) Kazuki Takashima(Tohoku Univ.) / Ken Fujiwara(Osaka Univ. of Economic) / Kazunori Terada(Gifu Univ.) / Atsushi Kimura(Nihon Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Human Communication Science
本文の言語 JPN
タイトル(和) 調理手順テキストと料理画像の特徴量の最近傍探索に基づく重複レシピの検出手法
サブタイトル(和)
タイトル(英) Method for Detecting Near-duplicate Recipes Based on Nearest Neighbor Search for Features of Cooking Instructions and Food Images
サブタイトル(和)
キーワード(1)(和/英) 重複レシピ / Near-duplicate recipe
キーワード(2)(和/英) 最近傍探索 / Nearest neighbor search
キーワード(3)(和/英) 類似テキスト検索 / Similar text search
キーワード(4)(和/英) 類似画像検索 / Similar image search
第 1 著者 氏名(和/英) 小邦 将輝 / Masaki Oguni
第 1 著者 所属(和/英) 筑波大学(略称:筑波大)
University of Tsukuba(略称:Tsukuba Univ.)
第 2 著者 氏名(和/英) Lasguido Nio / Lasguido Nio
第 2 著者 所属(和/英) 楽天技術研究所(略称:楽天)
Rakuten Institute of Technology(略称:RIT)
第 3 著者 氏名(和/英) 平手 勇宇 / Yu Hirate
第 3 著者 所属(和/英) 楽天技術研究所(略称:楽天)
Rakuten Institute of Technology(略称:RIT)
第 4 著者 氏名(和/英) 関 洋平 / Yohei Seki
第 4 著者 所属(和/英) 筑波大学(略称:筑波大)
University of Tsukuba(略称:Tsukuba Univ.)
発表年月日 2018-11-02
資料番号 HCS2018-44
巻番号(vol) vol.118
号番号(no) HCS-278
ページ範囲 pp.19-24(HCS),
ページ数 6
発行日 2018-10-26 (HCS)