講演抄録/キーワード |
講演名 |
2020-03-17 10:45
深層距離学習に基づく機械作業映像の半教師あり分節化 ○河森大樹・中村和晃・新田直子・馬場口 登(阪大) PRMU2019-92 |
抄録 |
(和) |
工場等の生産現場で行われる機械作業について,その映像を分節化し各分節で行われている作業を自動的に認識できれば,作業履歴の記録やそれに基づく作業計画の策定等に役立つ.
この処理を精度良く行うためには認識に適した特徴量を各分節から抽出することが必要であるが,これを教師なし学習で実現することは困難である一方,教師あり学習では人手による教師データ収集の負荷が問題となる.
そこで本稿では,機械作業映像を対象に,映像中のごく一部のフレームにのみ教師ラベルが付与されているという条件の下,半教師あり距離学習に基づいて適切な特徴量を取得し,それにより高精度な分節化を実現する手法を提案する.
一般に,任意の作業を認識可能な特徴量を一種類のみ得ることは容易ではない.
そこで提案手法では,認識対象の作業集合を自動的に階層化し,
各階層ごとに有効な特徴量を個別に得ることにより分節化精度の向上を図る.
実験の結果,教師ラベルの付与されているフレームが入力映像中の全フレームの3%に満たない場合でも,
F尺度にして0.956という非常に良好な分節化を達成した. |
(英) |
Today, cameras are often installed in many production sites for various purposes.
However, untrimmed raw videos captured by the cameras are hard to use.
Hence, it is desired to automatically segment the videos along the time axis and recognize which kind of operation is performed in each segment.
We call this task ``temporal segmentation,'' which is useful for making an operational record and building a new plan.
To achieve high performance of temporal segmentation, we have to use effective video features.
Such features can hardly be obtained by unsupervised learning,
whereas supervised learning has a drawback that collecting a lot of training data is labor-intensive.
From these backgrounds, in this paper, we propose a method of obtaining effective features based on semi-supervised distance metric learning,
under the assumption that only a few frames in input industrial operation videos are labeled and given as training data.
To achieve high performance, the proposed method automatically build a tree structure that represents hierarchal relationship between class labels,
and separately obtain an effective feature for each branch in the tree.
In our experimental results, we achieved the temporal segmentation performance of 0.956 on the F measure, even when less than 3% of all frames in the input videos are labeled. |
キーワード |
(和) |
機械作業映像 / 深層距離学習 / 分節化 / 半教師ありクラスタリング / ラベル分類木 / / / |
(英) |
industrial operation video / deep metric learning / temporal segmentation / semi-supervised clustering / label hierarchy tree / / / |
文献情報 |
信学技報, vol. 119, no. 481, PRMU2019-92, pp. 139-144, 2020年3月. |
資料番号 |
PRMU2019-92 |
発行日 |
2020-03-09 (PRMU) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2019-92 |