作者知名:轩辕大模型负责人:真正的大语言模型实践者,拥有十亿、百亿、千亿等不同参数规模大语言模型的训练经验
系统性强:从数据处理的基础工作(如数据清洗与去重)讲起,逐步深入,探讨预训练、微调技术和强化对齐技术等核心技术环节。同时,书中对大语言模型评估策略及其应用技术架构,包括推理引导技术和动态交互技术,进行了全面且深入的探讨,确保读者能够从理论和技术角度全面理解大语言模型。
实践性强:精心设计了从零开始的教学章节,提供大语言模型微调的详细指导,逐步引领读者掌握关键技能。
本书不仅有助于初学者迅速上手,也为有经验的开发者提供了深入学习的机会
全彩印刷
缘起:为什么要写这本书
OpenAI的ChatGPT自推出以来,迅速成为人工智能领域的焦点。ChatGPT在语言理解、生成、规划及记忆等多个维度展示了强大的能力。这不仅体现在对特定任务的高效处理上,更重要的是,它在处理多样化任务和复杂场景中的灵活性显著,甚至能在一定程度上模拟人类的思考方式。这种能力的展现,标志着人工智能从专注于单一任务的传统模型向通用人工智能转变,其强大的能力将对千行百业产生深远影响,尤其在优化业务流程和重塑组织结构方面。
然而,在研究和实践过程中,我们遇到了一个主要挑战:市场上缺乏大语言模型在实际应用方面的资料。现有的资料多聚焦于理论研究,而具体的实践方法多被保密,难以获得实际操作的指导。为了填补这一空白,我们历经一年的实践和探索,决定分享我们的经验和成果,旨在为大语言模型的初学者和实践者提供快速入门和应用的途径。
为应对技术的快速演进和信息的日新月异,我们建立了一个GitHub社区,用于持续更新我们的技术成果和见解。我们期望通过这种方式,促进读者对大语言模型的深入理解和广泛应用,推动整个领域的持续发展和创新。
本书特色
本书旨在揭开大语言模型的神秘面纱,透彻地解读其内在机理和应用实践。书中不仅介绍理论知识,更介绍了深入这一技术领域的具体训练过程,目的是为读者提供一个全面、深入且系统化的视角,以揭示大语言模型的精妙之处。
本书的一大特色体现在其知识体系的系统性。我们从数据处理的基础工作(如数据清洗与去重)讲起,逐步深入,探讨预训练、微调技术和强化对齐技术等核心技术环节。同时,书中对大语言模型评估策略及其应用技术架构,包括推理引导技术和动态交互技术,进行了全面且深入的探讨,确保读者能够从理论和技术角度全面理解大语言模型。
本书的另一大特色是对实践性的重视。我们精心设计了从零开始的教学章节,提供大语言模型微调的详细指导,逐步引领读者掌握关键技能。这不仅有助于初学者迅速上手,也为有经验的开发者提供了深入学习的机会。
作为真正的大语言模型实践者,我们拥有十亿、百亿、千亿等不同参数规模大语言模型的训练经验。在本书中,这些经验都被毫无保留地融入其中,确保本书内容的实用性和深度。
本书是理论与实践经验的精华,干货满满,绝非空谈。
本书结构
本书共10章,下面是各章的主要内容概述。
第1章:解锁大语言模型
本章勾勒大语言模型的全貌,并介绍大语言模型的基础概念。
第2章:大语言模型基础技术
本章旨在深度解析构成大语言模型的基础知识和核心技术。先回顾自然语言的基础表示方法,为理解复杂模型奠定基础;再详尽地探讨自然语言处理中的预训练架构Transformer,以揭示其内在工作机制;接着介绍如BERT和GPT这样的标杆性预训练模型;最后以InstructGPT和LLaMA系列为例,为读者呈现大语言模型的初步实用成果。
第3章:预训练数据构建
本章将深入探讨预训练数据的常见类别、来源和预处理方式,以及构建训练数据的重点和难点。
第4章:大语言模型预训练
本章将深入探讨大语言模型预训练的各个方面。首先解析不同的大语言模型架构和不同模块的选择;同时对大语言模型的训练过程进行介绍,包括数据选择和配比策略、模型训练等。
第5章:挖掘大语言模型潜能:有监督微调
本章将从定义、用途和应用场景3个方面解释有监督微调;同时讲解如何构建有针对性的微调数据,以及大语言模型微调的各种技巧。
第6章:大语言模型强化对齐
本章先介绍强化学习的基础知识、两类主流深度强化学习算法,重点介绍大语言模型中基于人类反馈的强化学习(RLHF)技术,然后介绍强化学习常用的训练框架和平台,以及RLHF实践过程中的常见问题;最后介绍RLHF中的难点及目前存在的问题,对RLHF将来可能的技术发展做进一步展望。
第7章:大语言模型的评测
本章首先介绍大语言模型的评测,如基座模型的评测方式等。然后重点讲解微调之后具有对话能力的模型的评测方式,包括SFT阶段全维度的对话能力评测和 RLHF 阶段模型以安全性为主的能力评测。最后探讨如何评价一个通用人工智能。
第8章:大语言模型的应用
本章将展示提示词技术对大语言模型的引导能力。首先从最简单的零样本提示开始介绍,这些技术使大语言模型拥有逐步推理的能力。然后介绍搜索增强生成技术、推理和行动协同技术,利用这两个技术,大语言模型可以获得在与环境的交互中逐步分解并解决问题的能力。
第9章:工程实践
本章将深入探讨大语言模型从训练到完成任务的各个环节所涉及的工程优化技术和相关实践案例。这些技术和实践旨在提高模型的效率、性能和可扩展性,从而满足实际应用中的需求。
第10章:手把手教你训练7B大语言模型
本章将介绍微调大语言模型的关键步骤和代码示例,以便更直接地应用这些技术。
通过阅读本书,读者可以获得全面且深入的大型语言模型的知识框架。无论您是研究人员、工程师,还是产品经理,都能从中获得有价值的知识。大语言模型已经在各个领域展现出了巨大的潜力,本书将帮您更好地掌握和应用这一技术。
说明
本书包含与大语言模型的对话示例。为了真实地展示大语言模型的对话能力,对话内容中难免会出现用词不规范、语句不通顺甚至错误的情况。在此,恳请各位读者包涵。
致谢
在本书的创作旅程中,感激所有给予我们支持的人。感谢我的团队成员,他们对技术的信仰和对卓越的追求为本书注入了灵魂;感谢行业内的所有贡献者,他们的研究和实践成果为我们提供了宝贵的参考和灵感;感谢电子工业出版社郑柳洁编辑和整个出版团队,他们的专业技能和对细节的关注,确保了这本书能够完美地呈现给广大读者。感谢所有直接或间接参与本书创作的人,是你们让这一切成为可能。
杨青
度小满金融技术委员会执行主席、数据智能应用部总经理,度小满AI Lab负责人,硕士毕业于清华大学计算机系,曾就职于百度、阿里巴巴,从事自然语言处理、搜索、推荐、大数据架构等相关方向的研发工作。
2018年年初加入度小满金融,组建数据智能部和AI Lab团队,从0到1构建度小满金融的智能引擎核心算法,深耕计算机视觉、自然语言处理、图模型、机器学习、因果推断等技术领域,多篇文章被EMNLP、ACL、CIKM等国际会议收录,智能化征信解读中台工程荣获吴文俊人工智能科技进步奖。相关技术广泛应用于度小满营销、经营、风控、反欺诈全流程业务场景,为上千万客户提供稳定、安全的金融服务。
目前,专注于AIGC相关研究及产品落地工作,基于度小满模型即服务(MaaS)的模式积极探索文生图、数字人与生成式大语言模型的应用转化。于2023年年初带领团队发布千亿参数规模的中文大语言模型轩辕。2023年9月, 轩辕-70B大语言模型在C-Eval和CMMLU两大权威榜单上位列所有开源模型榜首。