［チュートリアル講演］強化学習と計算機シミュレーション

河野 仁

講演名	2024-01-18 ［チュートリアル講演］強化学習と計算機シミュレーション河野仁(東京電機大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	強化学習はエージェントが試行錯誤的に行動を選択し，得られる報酬から問題の最適解を探査可能な機械学習アルゴリズムの一種である．様々な応用がなされているが，実時間での強化学習は現実的ではないことが多く計算機による学習が多く用いられる．そのため，本稿では強化学習を概説し，メリット，デメリットなどを明らかにした上でロボット実装における難しい点や計算機シミュレーションなどによる例示を行う．
抄録(英)	Reinforcement learning is a learning algorithm in which an agent selects actions through trial and error and explores for the optimal solution to a problem from the rewards obtained. Although various applications have been performed, real-time reinforcement learning is often impractical, and computer-based learning is often used. Therefore, this paper provides an overview of reinforcement learning, clarifies its merits and demerits, and then explains the difficulties in robot implementation and provides examples using computer simulations.
キーワード(和)	機械学習 / 強化学習 / 計算機シミュレーション
キーワード(英)	Machine learning / Reinforcement learning / Computer simulation
資料番号	AP2023-170
発行日	2024-01-10 (AP)

研究会情報
研究会	AP / WPT
開催期間	2024/1/17(から3日開催)
開催地（和）	新潟大学駅南キャンパスときめいと
開催地（英）	Niigata Univ.
テーマ（和）	電波伝搬・無線電力伝送・一般
テーマ（英）	Radio propagation, Wireless transmission technology, Antennas and Propagation
委員長氏名（和）	榊原久二男(名工大) / 西川健二郎(鹿児島大)
委員長氏名（英）	Kunio Sakakibara(Nagoya Inst. of Tech.) / Kenjiro Nishikaa(Kagoshima Univ.)
副委員長氏名（和）	袁巧微(東北工大) / 平山裕(名工大)
副委員長氏名（英）	YUAN Qiaowei(Tohoku Inst. of Tech.) / Hiroshi Hirayama(Nagoya Inst. of Tech.)
幹事氏名（和）	紀平一成(三菱電機) / 本間尚樹(岩手大) / 花澤理宏(UL Japan) / 三谷友彦(京大)
幹事氏名（英）	Kazunari Kihira(Mitsubishi Electric) / Naoki Honma(Iwate Univ.) / Masahiro Hanazawa(UL Japan) / Tomohiko Mitani(Kyoto Univ.)
幹事補佐氏名（和）	村上友規(NTT) / 鈴木麻子(富士ウェーブ) / 石川峻樹(オリエントマイクロウェーブ) / 畑勝裕(東大)
幹事補佐氏名（英）	Tomoki Murakami(NTT) / Asako Suzuki(Fujiwaves) / Takaki Ishikawa(Orient Microwave) / Katsuhiro Hata(Univ. of Tokyo)

講演論文情報詳細
申込み研究会	Technical Committee on Antennas and Propagation / Technical Committee on Wireless Power Transfer
本文の言語	JPN
タイトル（和）	［チュートリアル講演］強化学習と計算機シミュレーション
サブタイトル（和）
タイトル（英）	[Tutorial Lecture] Reinforcement learning and its computer simulation
サブタイトル（和）
キーワード(1)（和/英）	機械学習 / Machine learning
キーワード(2)（和/英）	強化学習 / Reinforcement learning
キーワード(3)（和/英）	計算機シミュレーション / Computer simulation
第 1 著者氏名（和/英）	河野仁 / Hitoshi Kono
第 1 著者所属（和/英）	東京電機大学(略称：東京電機大) Tokyo Denki University(略称：Tokyo Denki Univ.)
発表年月日	2024-01-18
資料番号	AP2023-170
巻番号（vol）	vol.123
号番号（no）	AP-336
ページ範囲	pp.58-61(AP),
ページ数	4
発行日	2024-01-10 (AP)