| ISBN/价格: | 978-7-118-13707-1:CNY88.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 异策略安全约束强化学习/.杨奇松 ... [等]著 |
| 出版发行项: | 北京:,国防工业出版社:,2025 |
| 载体形态项: | 117页:;+图:;+24cm |
| 相关题名附注: | 英文题名取自封面 |
| 提要文摘: | 本书深入探讨了强化学习在现实世界应用中面临的安全挑战, 特别是在与不可预测环境交互时确保智能体的安全性。书中提出了基于约束的强化学习方法, 区分奖励函数与安全相关的成本函数, 以实现安全与性能的平衡。分别针对安全风险控制和训练安全保证问题, 开发了相应的算法。 |
| 并列题名: | Off-policy safety constrained reinforcement learning eng |
| 题名主题: | 机器学习 |
| 中图分类: | TP181 |
| 个人名称等同: | 杨奇松 著 |