強化学習を使った最適化手法をゼロから理解する! Pythonによる問題解決シリーズ第3巻『最適化のための強化学習』発行

2024.09.30 11:00
株式会社インプレスホールディングス

インプレスグループで理工学分野の専門書出版事業を手掛ける株式会社近代科学社は、2024年9月30日に、『最適化のための強化学習』(監修:久保 幹雄、著者:小林 和博)を発行いたしました。
●書誌情報
【シリーズ名】Pythonによる問題解決シリーズ第3巻
【書名】最適化のための強化学習
【監修】久保 幹雄
【著者】小林 和博
【仕様】B5変形判・並製・204頁
【本体価格】3,200円(税込3,520円)
【ISBN】978-4-7649-0710-2 C3304
【商品URL】
●内容紹介
 本書では、強化学習における基本的な考え方や計算手法を紹介し、実際にPythonを用いて実現する方法をまとめている。具体的にはマルコフ決定過程、価値関数、方策評価、方策反復、価値反復、モンテカルロ評価、SARSA、Q学習を扱う。ほとんどの内容は簡単な数学の知識があれば問題なく理解できるよう記述し、読者の学びやすさを優先して繰り返しの説明や既出の数式を再掲するなど工夫している。Pythonの基礎から強化学習の利用までを詳細に解説した充実の一冊。

●著者紹介
小林 和博(こばやし かずひろ)
2003 年3 月 慶應義塾大学大学院文学研究科前期博士課程修了
1998年 東京大学工学部計数工学科卒業 
2000年 東京大学大学院工学系研究科計数工学専攻修士課程修了,修士(工学)
2009年 博士(理学)
現在青山学院大学理工学部准教授

主要著書
『サプライチェーンリスク管理と人道支援ロジスティクス』(共著),近代科学社(2015)
『航海応用力学の基礎』(共著),成山堂書店(2015)
『Python言語によるビジネスアナリティクス|実務家のための最適化・統計解析・機械学習』(共著),近代科学社(2016)
『最適化問題入門』(Pythonによる問題解決シリーズ2),近代科学社(2020)

●目次
第1章 Pythonで強化学習を行うための環境構築
1.1 オンラインサービスを利用する方法
1.2 手元のコンピュータに実行環境を整える方法
1.3 パッケージのインストール
1.4 実行環境

第2章 Pythonの基礎
2.1 データ構造
2.2 科学技術計算パッケージNumPy
2.3 条件分岐
2.4 繰り返し処理
2.5 擬似乱数生成パッケージrandom
2.6 可視化ライブラリMatplotlib
2.7 関数
2.8 内包表記

第3章 強化学習の概要

第4章 マルコフ決定過程
4.1 マルコフ性
4.2 推移確率行列
4.3 マルコフ過程
4.4 マルコフ報酬過程
4.5 リターン
4.6 価値関数
4.7 方策
4.8 マルコフ決定過程

第5章 動的計画
5.1 例1: 整数の和
5.2 例2: 最短路問題
5.3 動的計画による価値関数の評価
5.4 方策評価
5.5 方策改善
5.6 方策反復
5.7 価値反復

第6章 モンテカルロ学習
6.1 全幅探索とサンプル探索
6.2 モンテカルロ方策評価
6.3 First-visit モンテカルロ方策評価
6.4 Every-visit モンテカルロ方策評価
6.5 平均の増分計算

第7章 Temporal Difference学習
7.1 TD(0) 学習
7.2 オンポリシー学習とオフポリシー学習
7.3 オンポリシーモンテカルロ学習
7.4 オンポリシーTD学習―SARSA
7.5 オフポリシーTD学習―Q 学習



【株式会社 近代科学社】
株式会社近代科学社(本社:東京都千代田区、代表取締役社長:大塚浩昭)は、1959年創立。
数学・数理科学・情報科学・情報工学を基軸とする学術専門書や、理工学系の大学向け教科書等、理工学専門分野を広くカバーする出版事業を展開しています。自然科学の基礎的な知識に留まらず、その高度な活用が要求される現代のニーズに応えるべく、古典から最新の学際分野まで幅広く扱っています。また、主要学会・協会や著名研究機関と連携し、世界標準となる学問レベルを追求しています。

【インプレスグループ】
株式会社インプレスホールディングス(本社:東京都千代田区、代表取締役:松本大輔、証券コード:東証1部9479)を持株会社とするメディアグループ。
「IT」「音楽」「デザイン」「山岳・自然」「航空・鉄道」「モバイルサービス」「学術・理工学」を主要テーマに専門性の高いメディア&サービスおよびソリューション事業を展開しています。さらに、コンテンツビジネスのプラットフォーム開発・運営も手がけています。

【お問い合わせ先】
株式会社近代科学社
TEL : 03-6837-4828
電子メール: reader@kindaikagaku.co.jp

あわせて読みたい

石川県七尾市で開催された「災害時の食について考える体験会」にて最適化栄養食提供
STRAIGHT PRESS
最新AIのCopilotに対応! 内容を大幅に刷新した「できるWord 2024」「できるExcel 2024」を11月29日(金)に同時発売!
PR TIMES
相続にはトラブルがつきもの? 予期せぬ事態への対処法
antenna
翔泳社10月新刊のご案内
PR TIMES
学研版学びの地図「学びマップ」が2024年度グッドデザイン賞受賞
PR TIMES
「相続ナビ」で相続を手軽に! 事例とともに対処法を解説
antenna
AI・データサイエンスで必須の基礎数学をやさしく学べる! 『数理・データサイエンス・AIのための数学基礎』発行
PR TIMES
シミュレーションと実験結果の不一致やバラつきを解析し、優れた製品を開発する! 『CAE活用のための不確かさの定量化−ガウス過程回帰と実験計画法を用いたサロゲートモデリング−』
PR TIMES
楽しさ体験「都心の工場」PRINTONE渋谷5周年!エコバッグプレゼント
PR TIMES Topics
これからの時代に必要な情報活用能力が身に付く! 『つながるコンピュータリテラシー-情報Iの復習から活用スキルまで-』発行
PR TIMES
大学数学の登竜門「ε-δ論法」を、直感的理解に繋げて解説した意欲作! 大学数学スポットライト・シリーズ 第11巻『ε-δ論法と数学の基礎-『原論』の時代から20世紀まで-』発行
PR TIMES
伝統工芸を未来につなぐ取り組み!職人技を取り入れたネームタグ「LEE」発売
PR TIMES Topics
高校物理の教科書の流れとは違う観点で、力学の理解を深める! 『解きながら学ぶ 微積分でよくわかる力学』発行
PR TIMES
世界的名著『アルゴリズムイントロダクション』第4版の翻訳総合版! 『世界標準MIT教科書 アルゴリズムイントロダクション第4版 総合版』発行
PR TIMES
【ねんりん家】おめでたい紅白カラーの「初春のストレートバーム」販売
PR TIMES Topics
シリーズ累計90万部を突破した大人気プログラミング入門書の改訂版 『スッキリわかるC言語入門 第3版』を2024年11月19日(火)に発売
PR TIMES
DAX関数の多様な使い方が身に付く『できるDAX関数 Power BI&Excelパワーピボット対応』を12月17日(火)に発売
PR TIMES
40代女性の欲しいを全部詰め込んだ「新美容手帳」制作プロジェクトスタート
PR TIMES Topics
「教育に新たな視点を!次世代学習用ドローン、ついに販売開始」
ラブすぽ
業務効率化に役立つ関数を解説した『できるExcel関数 Copilot対応 Office 2024/2021/2019&Microsoft 365版』を12月19日(木)に発売
PR TIMES
【IFME新作】機能性にこだわった防寒ブーツ登場  
PR TIMES Topics