题名:
基于Python的强化学习   ji yu python de qiang hua xue xi / (美)安德里亚·隆萨(Andrea Lonza)著 , 刘继红,王瑞文译
ISBN:
978-7-5198-7037-9 价格: CNY88.00
语种:
chi
载体形态:
265页 图,照片 24cm
出版发行:
出版地: 北京 出版社: 中国电力出版社 出版日期: 2023
内容提要:
本书首先介绍在强化学习环境中工作所需的工具、库和设置,涵盖了强化学习的构成模块,深入探讨基于值的方法,如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外,在学习DDPG和TD3确定性算法之前,读者将学习策略梯度方法,如TRPO和PPO,以提高性能和稳定性。本书还介绍模仿学习的原理,以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。 
主题词:
软件工具   程序设计
中图分类法:
TP311.561 版次: 5
主要责任者:
隆萨 long sa 著
次要责任者:
刘继红 liu ji hong 译
次要责任者:
王瑞文 wang rui wen 译
责任者附注:
Andrea Lonza,是一名深度学习工程师入对人工智能怀有极大的热情,渴望创造出具有智能行为的机器。他通过理论性的和工业应用性的机器学习项目获得了强化学习、自然语言处理和计算机视觉方面的专业知识。他还参加过几次Kaggle比赛,并取得了很好的成绩。 
索书号:
TP311.561/glg7744.B