これからの強化学習

10/27発売予定の、強化学習に関する最新技術を書いた本

作者: 牧野貴樹,澁谷長史,白川真一,浅田稔,麻生英樹,荒井幸代,飯間等,伊藤真,大倉和博,黒江康明,杉本徳和,坪井祐太,銅谷賢治,前田新一,松井藤五郎,南泰浩,宮崎和光,目黒豊美,森村哲郎,森本淳,保田俊行,吉本潤一郎
出版社/メーカー: 森北出版
発売日: 2016/10/27
メディア: 単行本（ソフトカバー）
この商品を含むブログ (2件) を見る

強化学習の「いま」を知り，「これから」を切り拓くための1冊．本書では，この分野を代表する執筆陣が集い，強化学習の基礎・発展・応用を多面的に解説します．
・基礎：強化学習の動作原理と基本アルゴリズムを，初学者でも分かるように導入．
・発展：より複雑な問題に対処し，高度な研究に進むための，さまざまな発展的手法を解説．
・応用：マルチロボットシステムの制御，対話処理，医療データ分析，囲碁の対局など広範な応用例・研究事例を通して，強化学習の活用法を紹介．人間の行動や脳の動作を説明するモデルとしての理論・実験も解説．

第1章　強化学習の基礎的理論強化学習とは／強化学習の構成要素／価値関数に基づくアルゴリズム／改善に基づくアルゴリズム／部分観測マルコフ決定過程と強化学習
第2章　強化学習の発展的理論統計学習の観点から見たTD学習／強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化／逆強化学習／試行錯誤回数の低減を指向した手法：経験強化型学習XoL／群強化学習法／リスク考慮型強化学習／複利型強化学習
第3章　強化学習の工学応用高次元・実環境における強化学習／連続的な状態・行動空間への拡張：マルチロボットシステムへの適用／対話処理における強化学習／マルチエージェント系の報酬設計／自然言語処理における逆強化学習・模倣学習の適用／医療臨床データ分析への応用／深層学習を用いたQ関数の学習：Atariと囲碁への応用
第4章　知能のモデルとしての強化学習

目次を見る限り、

第1章はtraditionalな強化学習の理論的な説明になっていて、この分野に入るには必須の事項である方策改善定理やマルコフ決定過程(MDP)などに触れるであろうことが予想される。
第2章でも同じように理論的な導入部であり、見る限りこの2章を読めば強化学習を理解できそう。書きっぷりに期待したい。
第3章は強化学習の応用例。話題の囲碁の話などにも触れるということだ。個人的にはマルチエージェント系の報酬設計には期待したいところ。迷路を素早く解く方法などエージェントを用いた学習をどのように行うかは非常に興味がある。
第4章も面白そうであるが、これだけでは何を書くかまではわからない。あくまで予想だが、強化学習と人の学習の類似性などを脳科学的な観点から触れてくれるのではとき対している。