目前国内关于大模型的教科书已经至少有三本了,而且都是公开了pdf版本可以直接下载的。之前都发过,这里再做个汇总。
电子书《大语言模型》
github.com/LLMBook-zh/LLMBook-zh.github.io
一本评价不错的书。中国人民大学AI Box的著作,主要作者中国人民大学高瓴人工智能学院教授赵鑫等编著。本书注重为大模型技术的入门读者提供讲解,力图展现一个整体的大模型技术框架和路线图。本书适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的技术书籍。
浙江大学毛玉仁、高云君等老师的电子书《大模型基础》
github.com/ZJU-LLMs/Foundations-of-LLMs
这本书和一般的著作不太一样,因为大模型的技术这几年发展太快了,本书的一个目标也是“月度更新”,自半年前发布后就在不断update,致力打造易读、严谨、有深度的大模型教材。
张奇 《大规模语言模型:从理论到实践》
intro-llm.github.io/
本书围绕大语言模型构建的四个主要阶段:预训练、有监督微调、奖励建模和强化学习,详细介绍各阶段使用的算法、数据、难点以及实践经验。
三本书的选择上,相对来说,似乎是《大模型基础》适合入门,《大语言模型》跟进新技术,《大规模语言模型:从理论到实践》更偏理论些。(不当处欢迎纠正)