
会员
Joy RL:强化学习实践教程
江季 王琦 杨毅远更新时间:2025-05-19 16:15:54
最新章节:第12章开会员,本书免费读 >
本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
江季 王琦 杨毅远
主页
同类热门书
最新上架
- 会员
中国人形机器人创新发展报告2025
作为一本技术性很强的书,《中国人形机器人创新发展报告2025》覆盖人工智能、大模型、视觉捕捉、自动化控制等一些列技术和学科。本书系统性梳理了《人形机器人创新发展指导意见》发布以来中国人形机器人产业在关键技术、产品培育、场景应用、生态营造、支撑能力以及保障措施等多方面的发展态势,通过多角度案例研究,全面解析了中国在这一领域的成果与经验,力图展示中国人形机器人产业的全貌,洞察人形机器人产业未来发展的新计算机9万字 - 会员
秒懂AI辅助论文写作
本书是一本深入探讨AI在论文写作中应用的指南。本书通过九章内容,全面介绍如何在论文选题、前言写作、大纲写作、正文写作、数据分析、摘要写作、结语撰写、文稿翻译与润色、答辩PPT制作、查重投稿等环节借助AI提高效率和质量。本书不仅讨论了AI的使用伦理,还针对论文写作的具体问题,提供了提示词示例(已全部收录到秋叶AI智能鼠标平台),为论文写作提供了广阔的视角和新的方法。本书可作为缺少学术论文写作经验的大计算机7.3万字 - 会员
AI时代项目经理成长之道:ChatGPT让项目经理插上翅膀
本书通过13章的探讨,带领读者踏上项目管理卓越之路。第1章“人工智能颠覆与重塑项目管理”,首先揭示了人工智能对项目管理的深刻影响和带来的机遇与挑战。紧接着,第2章至第13章依次介绍了使用ChatGPT编写各种文档、在项目启动中的应用、帮助组建高效团队、辅助项目沟通管理、项目计划与管理、项目成本管理、项目时间管理、项目质量管理、项目风险管理、辅助采购计划与采购流程、辅助项目绩效管理以及进行项目总结等计算机16.6万字 - 会员
DeepSeek原理与项目实战:大模型部署、微调与应用开发
DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合计算机17.1万字 - 会员
如何教人工智能说人话?
AI的本质是什么?自然语言和人工语言的区别在哪里?ChatGPT究竟是人工智能发展道路上的里程碑,还是某种误入歧途的“假AI”?我们不许诺美丽空洞的AI前景,而是告诉读者,未来的AI之路到底有多少激流险滩——对于统计学工具与硬件升级的片面崇拜,对于智能科学基本原理的蔑视,是目前AI研究的大危机。在我们看来,万众期待的ChatGPT,只是新时代的“牛顿炼金术”。计算机17.8万字 - 会员
从零构建大模型
本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。计算机13.8万字 - 会员
AI时代架构师修炼之道:ChatGPT让架构师插上翅膀
本书以ChatGPT为核心工具,揭示了人工智能技术对架构师的角色和职责进行颠覆和重塑的关键点。全书通过共计13章的系统内容,探讨AI技术在架构设计中的应用,以及AI对传统架构师工作方式的影响,读者可以了解如何利用ChatGPT这一强大的智能辅助工具,提升架构师的工作效率和创造力。计算机7字 - 会员
AI虚拟仿真从入门到参赛
本书全面探讨人工智能三维仿真竞赛,包括竞赛的立意、类型和流程,并详细介绍人工智能三维仿真软件的核心功能,如编程、控制、循迹、定位等的应用。本书首先介绍人工智能三维仿真竞赛的基础知识,为读者打下坚实的理论基础;其次转向人工智能三维仿真软件的详细教学,通过具体案例强化读者的学习效果;最后总结人工智能三维仿真竞赛中的常见任务类型,并结合历史竞赛案例,为读者提供实际参考。本书适合准备参加人工智能三维仿真竞计算机4.4万字 - 会员
DeepSeek实操:职场效率倍增的秘籍
本书是一本专为企业管理者和办公人员打造的实用指南,旨在帮助企业通过人工智能技术实现数字化转型,提升运营效率与竞争力。结合丰富的企业AI解决方案设计与实施经验,深入剖析了DeepSeek这一领先的人工智能模型在企业中的广泛应用场景。全书共分为四大部分,涵盖了企业管理、市场营销、销售与客服等多个核心领域,详细介绍了近100个企业使用场景,展示了如何通过DeepSeek实现效率的百倍提升。无论是人力资源计算机8.7万字