ISBN/价格: | 978-7-111-75488-6:CNY119.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 多模态大模型/.刘兆峰著 |
出版发行项: | 北京:,机械工业出版社:,2024 |
载体形态项: | 404页:;+图:;+24cm |
提要文摘: | 本书分为两篇: 第一篇算法原理: 详细介绍了先进的深度学习模型, 包括Transformer、GPT系列、深度生成模型, 从基本架构、训练方法到特定应用, 包括但不限于Seq2Seq结构、位置编码、注意力机制、残差连接、变分自编码器、GAN、ViT、CLIP、Stable Diffusion、各模型训练实践的知识点。此外, 探讨了预训练模型的涌现能力、模型参数和通信数据量的估算, 以及分布式训练的各种技术, 如数据并行、模型并行和混合精度训练等。第二篇应用实战: 聚焦于深度学习模型的实际应用, 特别是文本和图像生成, 以及代码生成的应用实战。通过具体实战项目, 如利用Stable Diffusion进行图像生成和Code Llama进行代码生成, 提供了微调技术的详细细节等。 |
并列题名: | Multimodal large language models eng |
题名主题: | 人工智能 |
中图分类: | TP18 |
个人名称等同: | 刘兆峰 著 |