お知らせ 2023年度・2024年度 学生員 会費割引キャンペーン実施中です
お知らせ 技術研究報告と和文論文誌Cの同時投稿施策(掲載料1割引き)について
お知らせ 電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について
電子情報通信学会 研究会発表申込システム
研究会 開催スケジュール
技報閲覧サービス
[ログイン]
技報アーカイブ
    [Japanese] / [English] 
研究会名/開催地/テーマ  )→
 
講演検索  検索語:  /  範囲:題目 著者 所属 抄録 キーワード )→

すべての研究会開催スケジュール  (検索条件: すべての年度)

講演検索結果
 登録講演(開催プログラムが公開されているもの)  (日付・降順)
 13件中 1~13件目  /   
研究会 発表日時 開催地 タイトル・著者 抄録 資料番号
CCS, NLP
(共催)
2022-06-09
13:50
大阪 大阪大学 豊中キャンパス シグマホール
(ハイブリッド開催,主:現地開催,副:オンライン開催)
PPOにおける対称な制約条件の適用による学習性能の改善
岩谷尚輝中野秀洋東京都市大NLP2022-3 CCS2022-3
深層強化学習は経験から最適行動を学習するアルゴリズムである。その一種であるProximal Policy Optimiz... [more] NLP2022-3 CCS2022-3
pp.13-16
IBISML 2022-03-09
14:20
ONLINE オンライン開催 ベータダイバージェンスを用いたロバスト自然方策勾配法
小久保燎太福永修一都立産技高専IBISML2021-46
自然方策勾配法のなかでも,逆行列を計算することなく自然方策勾配を推定できる手法として,自然TD学習がある.本研究では,ベ... [more] IBISML2021-46
pp.53-60
NC, MBE
(併催)
2021-03-04
16:50
ONLINE オンライン開催 A3Cにおける決定論的方策勾配の導入
高萩 悠山内ゆかり日大NC2020-63
Mnihらは,Asynchronous Advantage Actor-Critic (A3C)と呼ばれる学習手法を提起... [more] NC2020-63
pp.117-120
RCS 2019-06-19
14:55
沖縄 宮古島 平良港ターミナルビル 方策勾配型強化学習を用いたEDCAにおける送信遅延時間短縮の検討
新﨑聖峰香田優介山本高至西尾理志守倉正博京大RCS2019-52
無線LAN(Local Area Network)におけるQoS(Quality of Service)制御を行う方式と... [more] RCS2019-52
pp.91-96
IBISML 2016-11-17
14:00
京都 京都大学 Importance Weight Aware Updateによる逐次的自然方策勾配推定
岩城 諒阪大)・横山裕樹玉川大)・浅田 稔阪大IBISML2016-81
自然方策勾配法などの強化学習の成功には,適切な学習率の設定が不可欠である.確率的勾配法の適応的学習率として提案された O... [more] IBISML2016-81
pp.251-257
IBISML 2012-11-07
15:30
東京 筑波大学 東京キャンパス文京校舎 Gaussian process regressionを用いた確率的方策に対する方策勾配法
中村 泰石黒 浩阪大IBISML2012-52
近年, ガウス過程回帰を用いて価値関数の学習を行う強化学習法が提案されてきた [1]. ガウス過程を用い たベイズ推論に... [more] IBISML2012-52
pp.129-133
NC, MBE
(併催)
2009-03-11
16:35
東京 玉川大学 方策勾配法によるCPGに基づいたエネルギー効率の良い二足歩行の学習
東 良行柴田智広奈良先端大NC2008-125
多リンク,多関節を有するロボットを少ない自由度で簡便に制御するために,しばしばCPG(Central Pattern G... [more] NC2008-125
pp.129-134
NC, NLP
(共催)
2008-06-27
17:05
沖縄 琉球大学 非定常環境における自己組織化強化学習
日栄 悠奈良先端大)・森 健京大)・石井 信京大/奈良先端大NC2008-30
実世界の環境は一般に非定常であり,最適制御は時間によって変化する.このような制御を,定常なマルコフ決定過程を仮定する強化... [more] NC2008-30
pp.97-101
NC, MBE
(併催)
2008-03-13
14:10
東京 玉川大学 確率的パラメータを持つ方策関数に対する方策勾配法
中村 泰阪大NC2007-170
強化学習の一種である方策勾配法は, 方策関数のパラメータ, すなわち方策パラメータを, 方策勾配に基づき更新する手法であ... [more] NC2007-170
pp.343-348
NC, MBE
(併催)
2008-03-14
13:20
東京 玉川大学 ガウス過程を用いた能動サンプリングに基づく強化学習法
竹田和博森 健奈良先端大)・石井 信京大NC2007-192
強化学習では一般に、良い方策を獲得するために多くのサンプルを生成する必
要がある。このことは、実
ロボットなどの制... [more]
NC2007-192
pp.473-478
MBE, NC
(併催)
2007-12-22
16:10
愛知 名古屋大学 平均報酬の多様体に基づく方策勾配法
松原崇充奈良先端大/ATR-CNS)・森本 淳JST-ICORP,ATR-CNSNC2007-85
本稿では,方策のパラメータ空間においてパラメータ変化が及ぼす平均報酬の変化を量る計量に基づく方策勾配型強化学習法を提案す... [more] NC2007-85
pp.81-86
NC 2007-06-15
09:25
沖縄 沖縄科学技術研究基盤整備機構 内部状態を用いた強化学習によるマルチエージェント系における協調行動の獲得
谷口雄基森 健石井 信奈良先端大NC2007-15
本報告では, 内部状態を用いた強化学習法により, 部分観測環境のもとでマルチエージェントによる協調行動が効率良く実現でき... [more] NC2007-15
pp.41-45
NC 2007-03-14
15:30
東京 玉川大学 非マルコフ決定過程における方策勾配法の一考察 ~ カーリングの事例 ~
五十嵐治一芝浦工大)・石原聖司近畿大)・木村昌臣芝浦工大
強化学習には価値ベースと方策ベースの2つのアプローチがある.VAPSアルゴリズムは両者の統一を目指したアルゴリズムである... [more] NC2006-148
pp.179-184
 13件中 1~13件目  /   
ダウンロード書式の初期値を指定してください NEW!!
テキスト形式 pLaTeX形式 CSV形式 BibTeX形式
著作権について : 以上の論文すべての著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会