
会员
深度强化学习理论与实践
计算机网络/计算机理论、基础知识· 12.5万字
更新时间:2024-12-27 22:26:05
最新章节:参考文献开会员,本书免费读 >
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。
品牌:清华大学
上架时间:2023-03-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
同类热门书
最新上架
- 会员
多源信息融合推理与应用
本书共共15章,主要包括多源信息融合处理理论与方法及多源信息目标检测、识别和应用两部分内容。书中具体讲述了多源信息融合处理的基本概念以及多源信息融合发展的核心理论方法,如Dempster-Shafer证据理论等;介绍了多源高冲突信息鲁棒性证据推理方法、多辨识框架下异构证据融合方法以及多值迁移融合方法等多种融合技术;给出了多源信息融合的典型应用,特别是在不确定数据分类、多源信息融合检测与识别领域的实计算机17万字 - 会员
Bootstrap基础教程
Bootstrap是一个基于HTML5和CSS3的前端开发框架,它现成可用的HTML标记、CSS样式、JavaScript插件,极大地提高了Web前端界面的开发效率。目前,它已成为了前端设计领域流行的辅助技术。本书共分8章,围绕Bootstrap4框架的使用,讲述了Bootstrap4框架中各类排版元素,表单、表格、列表、图片、导航等各类CSS组件和轮播、对话框、下拉菜单、滚动监听等JavaSc计算机6.4万字