AI 大语言模型入门

第一章:AI 大模型技术综述

1.1 AI发展的四波浪潮

从20世纪末的弱人工智能开始,我们着重于构建能够执行特定逻辑任务的系统。紧接着,机器学习的出现破冰而出,将数据作为知识的基石,让计算机自行学习规律和模式。深度学习的大潮涌入,随着神经网络的复杂性和深度增加,越来越难以解决的问题开始迎刃而解。现在,我们站在了大模型的门槛上,尤其是大语言模型,它们的能力超越了之前所有AI技术的联合体,为我们带来了前所未有的应用潜力。

  • 弱人工智能 - 专注模拟特定任务能力的系统
  • 机器学习 - 数据驱动的学习模型
  • 深度学习 - 利用深层神经网络模拟复杂任务处理
  • 大语言模型 - 深度模型处理大数据得到复杂的文本输出

1.2 AI大模型的四个技术层面

This chapter requires login to view full content. You are viewing a preview.

Login to View Full Content

Course Curriculum

1

LLM

我们将对比确定性编程与概率编程的根本差异,理解从“编写逻辑”到“设计引导”的范式转移。同时,将API设计、参数调试等传统研发直觉,快速映射到提示词工程与生成参数驯化上,让您在AI时代继续发挥工程优势。
2

Transformer

我们将建立从软件模块到模型组件的认知桥梁,把Transformer理解为一个新的“运行时环境”。目标是让您能像分析JVM GC或线程调度一样,洞察注意力机制、Token生成等核心过程的资源消耗与性能瓶颈。
3

Prompt Engineering

我们将建立从软件模块到模型组件的认知桥梁,把Transformer理解为一个新的“运行时环境”。目标是让您能像分析JVM GC或线程调度一样,洞察注意力机制、Token生成等核心过程的资源消耗与性能瓶颈。
4

Fine-tuning

我们将建立清晰的决策框架,像在“使用开源库”和“自研核心组件”之间做权衡一样,在提示工程与模型微调之间做出成本最优解。深入LoRA等关键技术,理解其如同软件工程中的“依赖注入”般高效参数更新原理。
5

RAG

我们将对比传统数据库查询与向量检索的核心差异,构建混合检索的新心智模型。深入文本分块、Embedding选型等生产细节,让RAG系统从“能跑”到“好用”,解决准确性、幻觉治理等实际工程挑战。
6

Agent

我们将智能体架构理解为“一个高度自治的微服务集群”,其工具调用如同服务间API调用,记忆体系如同分布式缓存与数据库。在此基础上,设计能够规划、执行并从容应对失败的鲁棒性AI系统。