強化学習アルゴリズム入門 「平均」からはじめる基礎と応用

購入済み

返品不可

シリーズ

全1冊

作品情報

※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。「平均」という観点から強化学習の基本が理解できる!AlphaGoがプロ棋士を破った2016年以降、強化学習や深層強化学習はさまざまな分野から注目を集めています。しかし、専門書では難解な専門用語や数式が多用されるため、初学者にとってはハードルが高い状態が続いていました。本書は、そのハードルの高さを解消することを目的に制作されました。平均という初歩的な数学を使うことで、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては、PythonとMATLABの2種類のコードを、オーム社と著者のWebサイト、およびGithubで配布します。配布コードを実行することで、「原理→数式→プログラム」という一連の流れを直感的に把握できます。【本書の特徴】・難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説します。・さまざまなアルゴリズムを、共通する例題を用いて特徴がわかりやすいように比較します。・PythonとMATLAB、2種類のコードを配布します。※Pythonのバージョンは3です。第1章 平均から学ぶ強化学習の基本概念第2章 各アルゴリズムの特徴と応用第3章 関数近似…

作品をシェアする

同じ作者の本

オーム社のおすすめ本

科学・テクノロジーのおすすめ本

チェックリストに追加しました
クリップボードにURLをコピーしました
カートに追加しました
お気に入りに登録しました
作者をフォローしました

ポイント詳細

  • 通常ポイント

    pt

    ご購入額に応じて、dポイントを還元いたします。還元するdポイント数はご購入代金100円(税抜)につき1ポイントです。

【dカードならさらにおトク!】

さらにdカードをご利用の場合、ご購入代金100円(税込)につき2ポイントを加算し還元いたします。

  • dポイントによるお支払いはポイント進呈の対象外となります。
  • 開催中のキャンペーンにより、還元されるdポイント数は変動いたします。
dカードのお申込みはこちら

お手数ですが、ログイン後に再度登録をお試しください