講演名 2019-01-16
無線LANアクセスポイント選択問題への文脈付きバンディット問題の応用に関する検討
榊原 太一(京大), 西尾 理志(京大), 守倉 正博(京大), 山本 高至(京大), 鍋谷 寿久(東芝),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) AP選択問題に対する文脈付きバンディット問題の応用について検討する.様々な事業者による公衆無線LANサービスの提供により,利用者は複数のネットワークを利用することができる.多くの場合,ユーザ端末は受信信号強度(RSSI:Received Signal Strength Indicator)が最大のアクセスポイント(AP:Access Point)を選択して接続するが,バックホールネットワーク帯域などの無線通信環境によって低いスループットしか得られないことがある. このような環境の差異に対応するために,強化学習の1つであるバンディット問題を応用したAP選択手法を提案する. バンディット問題を用いることで,現在ユーザが滞在する位置でのスループットを最大にするAPを学習するだけでなく,学習中の累積スループットをも最大化する. ユーザが移動して最適なAPが変化した場合でも,学習中の累積スループットの減少を抑えつつ学習し直すことができる.さらに,文脈付きバンディットではユーザ位置を表す特徴量を用いることですでに学習を行った場所やその近傍での再学習が不要になり,効率よく位置ごとのAP選択方策を学習できる. 各APのバックホールネットワークの帯域幅に差異がある場合やユーザが頻繁に移動する場合を想定したシミュレーションにより提案方式の有効性を示した.
抄録(英) This paper models access point (AP) selection problem wireless LAN as an bandit problem and evaluate a performance of an AP selection method based on contextual bandit algorithm. Multiple wireless LAN services are provided in public places, and user devices have to select an AP from them. Common strategy of AP selection is to select an AP which has the maximum received signal strength indicator (RSSI), but there are cases where throughput becomes low due to congestion and narrow bandwidths of core networks. Reinforcement learning based AP selection is a promising way to solve the problem. This paper employs contextual bandit algorithm, which is one of reinforcement learning algorithms and try to maximize cumulative throughput including exploration duration, for the AP selection. The proposed method efficiently learns the optimal AP that depends on the user's position by using RSSI as features that represent the location of the user. Simulations results confirm that the proposed method achieves larger throughput than the RSSI-based method where bandwidths of core networks are limited.
キーワード(和) バンディット問題 / 強化学習 / AP選択 / 無線LAN
キーワード(英) Bandit problem / Reinforcement learning / AP selection / Wireless LAN
資料番号 MoNA2018-58
発行日 2019-01-09 (MoNA)

研究会情報
研究会 MoNA
開催期間 2019/1/16(から2日開催)
開催地(和) キャンパスプラザ京都(京都駅前)
開催地(英) T. B. D.
テーマ(和) モバイルコンピューティング、機械学習 in/for モバイル、モバイルネットワークとモバイルアプリケーション 一般
テーマ(英)
委員長氏名(和) 新熊 亮一(京大)
委員長氏名(英) Ryoichi Shinkuma(Kyoto Univ.)
副委員長氏名(和) 田頭 茂明(関大) / 北形 元(東北大)
副委員長氏名(英) Shigeaki Tagashira(Kansai Univ.) / Gen Kitagata(Tohoku Univ.)
幹事氏名(和) 石田 繁巳(九大) / 二瓶 浩一(NEC) / 西尾 理志(京大) / 齊藤 隆仁(NTTドコモ)
幹事氏名(英) Shigemi Ishida(Kyushu Univ.) / Koichi Nihei(NEC) / Takayuki Nishio(Kyoto Univ.) / Takato Saito(NTT DOCOMO)
幹事補佐氏名(和) 臼井 健(KDDI総合研究所) / 金井 謙治(早大)
幹事補佐氏名(英) Ken Usui(KDDI Research) / Kenji Kanai(Waseda Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Mobile Network and Applications
本文の言語 JPN
タイトル(和) 無線LANアクセスポイント選択問題への文脈付きバンディット問題の応用に関する検討
サブタイトル(和)
タイトル(英) A Study on Application of Contextual Bandit Problem to Wireless LAN Access Point Selection
サブタイトル(和)
キーワード(1)(和/英) バンディット問題 / Bandit problem
キーワード(2)(和/英) 強化学習 / Reinforcement learning
キーワード(3)(和/英) AP選択 / AP selection
キーワード(4)(和/英) 無線LAN / Wireless LAN
第 1 著者 氏名(和/英) 榊原 太一 / Taichi Sakakibara
第 1 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 2 著者 氏名(和/英) 西尾 理志 / Takayuki Nishio
第 2 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 3 著者 氏名(和/英) 守倉 正博 / Masahiro Morikura
第 3 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 4 著者 氏名(和/英) 山本 高至 / Koji Yamamoto
第 4 著者 所属(和/英) 京都大学(略称:京大)
Kyoto University(略称:Kyoto Univ.)
第 5 著者 氏名(和/英) 鍋谷 寿久 / Toshihisa Nabetani
第 5 著者 所属(和/英) 株式会社東芝(略称:東芝)
TOSHIBA CORPORATION(略称:TOSHIBA)
発表年月日 2019-01-16
資料番号 MoNA2018-58
巻番号(vol) vol.118
号番号(no) MoNA-389
ページ範囲 pp.7-11(MoNA),
ページ数 5
発行日 2019-01-09 (MoNA)