実は深層強化学習について直接触れているわけでは無いですが…
・ドラフト版(2018年2月ぐらいのもの)のパート2までほとんど読み切っていたので購入しました(最後のパート3はほとんどが神経科学や応用のお話です).ざっと見てはドラフト版と大きくは変わっていないようです.
・基本的な方針・雰囲気は初版と同じで図と文章での説明が中心ですが,数式が若干増えたかもしれません.適格度トレースの説明は若干分かりにくくなったかも.
・英語は若干まどろっこしい感じがあって,コード本ほどスラスラとは読めない感じがしました.
・数式の展開・擬似コードの記述は初版と同じく丁寧で分かりやすいと思います.
・タイトルの通り,深層強化学習について直接触れているわけではありません,が,関数近似のパートを読むと,何故近年の深層強化学習においてベルマン方程式に基づくTDバックアップが直接は行われず,SGDを用いているかについて知見が得られるなど,近年の研究のモチベーションを理解するのに役立ちます(他には,ツリーバックアップを見れば,TRPOのVineに対して自然に理解できるようになります).また,n-stepバックアップ(A3Cで使用)・適格度トレース(PPOで使用されていたような…)についてやさしく説明している本が他にあまり見当たらないのでそこも貴重です.
・TD学習の収束性の証明について,一応触れられているものの一箇所論文任せになっています.
・方策ベースの方法,特にアクタークリティックに関してはもう少し詳しく説明があっても良かったかも.また,方策勾配定理の証明は割引率γ=1のケースのみですが,Webで探せば一般的なケースのものも見つかります.
・個人的に,初版でイマイチ歯切れが悪かったように感じた箇所はかなりカットされています.
Reinforcement Learning: An Introduction (Adaptive Computation and Machine Learning series) (English Edition)

その他の感想

想像以上に高画質、ファン必携です
良い良い
ここ数日の低評価レビューで購入躊躇してませんか?
10代、20代の「ひきこもり」を持つ親が読む本
夏用ゴルフウェア
純正品より安価
ラメラメ
夜間画面がGOOD
懐かしいような・・・温かい気持ちになる
進歩・発展・専門分化しているからこそ辞典を
何度頼んでも飽きない味です!
slingbox PRO-HD故障のため買い替えました。
このサイズのリングファイルは100均にないんです
HARLY好きにはたまらない一品
外人女性とロマンスを求めるなら この一冊
タイトルにふさわしい一冊
大変良いお買い物でした
見ただけで小さい!と思ったぐらい小さい
心に染み入る小説!
小さくて良いが、これまでのUPよりもバイブが弱い
専門店の肉料理
アルティマニアがないと、グッドED攻略は難しい…
便利で助かります
◆半透明の素材が、見た目に涼しげで良い。
VAPE MOD本体にプルームテックのカートリッジが接続できます。
聴いたことのない、「スタンダード」が満載
金融工学初級者向け
愛用のゲルインキボールペン
戻る