第 1 章 智能体概览与本书导读
- 理解 智能体的定义及其四大核心能力(感知、推理、行动、学习)
- 描述 从图灵测试到 ChatGPT 的 AI 发展历程中的关键里程碑
- 区分 人与 AI 协作的三种模式(辅助、增强、自主)及适用场景
- 说明 AI 智能体在经济金融领域的六大应用场景
- 理解 Effective Vibe Coding 的核心循环:提示 → 生成 → 评估 → 优化

2022 年 11 月 30 日,OpenAI 发布 ChatGPT。五天内,用户突破 100 万——Instagram 达到这一里程碑用了 75 天;两个月后,月活用户达到 1 亿。这是消费级应用史上最快的增长记录。更重要的是,它让全世界第一次直观感受到:AI 真的能理解我们在说什么,并给出有意义的回应。
但 ChatGPT 只是开始。2023 年以来,AI 领域正经历一场更深刻的变革:从聊天机器人到智能体。今天的 AI 不仅能回答问题,还能使用工具、规划任务、自主执行复杂工作流。它们开始像有能力的同事一样工作,而不只是被动响应的工具。
这一章,我们将回答两个核心问题:什么是 AI 智能体?为什么经济金融专业的学生需要学习智能体设计?
1.1 智能体的由来与大语言模型的发展
什么是智能体
想象你是一名研究员,负责分析某个行业。你每天需要:阅读文献和资料(感知信息)、分析数据和现象(推理判断)、撰写研究报告(输出行动)、根据反馈改进方法(学习提升)。金融分析师、管理咨询师、市场研究员都是这样工作的。
AI 智能体做的事情和你一样。根据人工智能经典教材的定义,智能体(Agent)是通过传感器感知环境、通过执行器作用于环境的实体。用更直白的话说,智能体能够自主地感知、思考、行动和学习。
这四种能力构成了智能体的核心特征:
- 感知(Perception):获取环境信息,比如阅读文档、接收用户指令
- 推理(Reasoning):基于知识和目标进行思考判断
- 行动(Action):执行操作改变环境,比如生成报告、调用工具
- 学习(Learning):从经验中改进自身表现
理解这四个能力,是理解整本书的基础。
七十年演进:从图灵测试到 ChatGPT

智能体的概念并非凭空出现。它的发展历程,折射出人工智能七十年的探索与突破。
1950 年代:AI 的诞生
1950 年,英国数学家图灵发表论文《计算机器与智能》,提出了著名的图灵测试:如果人类无法区分对话者是人还是机器,就认为这台机器具有智能。这个思想实验将哲学层面的智能讨论转化为可操作的实验范式。
1956 年夏天,麦卡锡、明斯基等人在达特茅斯学院召开研讨会,正式提出人工智能这一术语。会议提出一个大胆的主张:智能的任何方面原则上都可以被精确描述,从而让机器模拟。这次会议标志着 AI 作为独立学科的诞生。
1970-1980 年代:专家系统的黄金时代
早期 AI 研究者相信,智能可以通过符号和规则来实现。他们开发了一系列专家系统(Expert System),试图将人类专家的知识编码进计算机。
最著名的例子是 MYCIN,一个医疗诊断系统。它用约 600 条规则构成知识库,能够诊断细菌感染并推荐抗生素治疗方案。在测试中,它的诊断准确率达到 65%,优于部分非专业医生。MYCIN 还开创了解释子系统——它能说明自己为什么做出某个诊断,这是可解释 AI 的早期形态。
但专家系统有致命弱点:知识获取困难,维护成本高昂,而且一旦超出预设知识范围,性能就急剧下降。到 1980 年代末,AI 研究陷入第二次寒冬。
1987 年:意图理论与 BDI 模型
就在 AI 研究低迷之际,哲学家 Bratman 提出了意图理论,后来被形式化为 BDI 模型(Belief-Desire-Intention,信念-愿望-意图)。这个模型描述了理性智能体如何做决策:
- 信念:智能体对世界状态的认知
- 愿望:智能体希望达成的目标
- 意图:智能体承诺执行的行动计划
用投资经理的工作来理解:他观察市场变化、更新对市场状态的判断(信念);根据判断和投资目标,列出可能的方案(愿望);权衡利弊后选择要执行的方案(意图);然后制定操作步骤并执行。
这种观察-思考-决策-执行的循环,正是后来大语言模型智能体的思维原型。
2016 年:AlphaGo 的里程碑
2016 年 3 月,DeepMind 的 AlphaGo 以 4:1 击败围棋世界冠军李世石。这是 AI 发展史上的标志性事件。
围棋的可能局面数量超过宇宙中原子的总数,传统穷举搜索完全不可行。AlphaGo 结合了深度神经网络和强化学习:用策略网络学习人类棋手的落子模式,用价值网络评估棋局胜率,通过自我对弈不断提升。它证明了 AI 在极其复杂的决策任务中可以达到甚至超越人类顶尖水平。
2017 年:Transformer 架构的突破
2017 年,Google 研究团队发表论文《Attention Is All You Need》,提出 Transformer 架构。这项技术创新为后续所有大语言模型奠定了基础。
Transformer 的核心是自注意力机制(Self-Attention),允许模型在处理文本时同时关注所有位置的信息,而不是像传统方法那样逐字处理。这使得模型能够更好地理解语言中的长距离依赖关系。
2018-2022 年:大语言模型的崛起
基于 Transformer 架构,OpenAI 发布了 GPT 系列模型:
- GPT-1(2018):1.17 亿参数,首次展示预训练-微调范式
- GPT-2(2019):15 亿参数,展现令人惊讶的文本生成能力
- GPT-3(2020):拥有 1750 亿参数,首次展示上下文学习能力——不需要微调,只需要在提示中给几个例子,模型就能学会新任务
研究者发现了两个关键现象。规模法则:模型性能随参数量、数据量和计算量的增加呈幂律增长。涌现能力:当模型规模超过某个阈值时,会突然展现出小模型不具备的能力,比如逻辑推理、代码生成。
2022 年 11 月,ChatGPT 发布。它基于 GPT-3.5,采用人类反馈强化学习(RLHF)优化,使模型更符合人类偏好。ChatGPT 的成功不仅在于技术,更在于产品形态——它让普通人第一次能够通过自然对话与强大的 AI 交互。
2022 年至今:从语言模型到智能体
ChatGPT 之后,AI 领域的焦点开始从单纯的对话转向智能体。
2022 年,Yao 等人提出 ReAct 框架(Reasoning + Acting),将推理和行动交织进行。模型在回答问题时,会先思考(Thought),然后执行行动(Action),观察结果(Observation),再继续思考。这种模式让 AI 能够调用外部工具获取信息,弥补自身知识的局限。
2023 年,AutoGPT 项目爆火,展示了 AI 自主设定子目标、执行任务链的可能性。虽然它还不够成熟,但让公众看到了自主智能体的潜力。
2024-2025 年,Anthropic 推出 Claude Code——一个在终端中运行的编码智能体。它能理解整个代码库的上下文,执行文件操作、运行命令,还能通过 MCP 协议调用外部工具。Claude Code 代表了 AI 智能体从研究走向实用的重要一步,也是本书的核心教学工具。
大语言模型(Large Language Model,LLM)是一类基于 Transformer 架构、经过大规模文本训练的神经网络模型。它们能够理解和生成自然语言,是当代 AI 智能体的认知核心。代表模型包括 OpenAI 的 GPT 系列、Anthropic 的 Claude 系列、Google 的 Gemini 系列。
为什么 LLM 改变了一切
大语言模型之所以能成为智能体的核心,是因为它带来了几项关键能力:
通用知识:通过海量文本的预训练,LLM 获得了广泛的世界知识。它懂金融、懂经济学、懂历史、懂编程,虽然不是每个领域都精通,但基础知识面极广。
自然语言接口:你不需要学习编程语言,用日常的话就能与 AI 交流。这大大降低了使用门槛。
上下文学习:在对话中给 AI 几个例子,它就能学会新任务的模式。不需要重新训练模型。
推理能力:通过链式思考(Chain-of-Thought)等技术,LLM 能够分步骤推理复杂问题。
传统软件是确定性的:同样的输入必然产生同样的输出。LLM 驱动的智能体则完全不同——它们具有概率性和灵活性,能理解模糊的需求,在没有明确规则的情况下做出判断。这正是经济金融领域许多任务所需要的能力——分析师的工作充满不确定性,需要判断而非机械执行。
| 特征 | 传统软件系统 | LLM 智能体系统 |
|---|---|---|
| 执行方式 | 确定性规则 | 概率性推理 |
| 输入形式 | 结构化数据 | 自然语言 |
| 任务适应 | 需要重新编程 | 通过提示词调整 |
| 知识来源 | 显式编码 | 预训练 + 检索增强 |
| 适用场景 | 规则明确的任务 | 需要判断的任务 |
1.2 从工具到同事:人与 AI 智能体的新关系
三阶段演进

人类与 AI 的关系正在经历深刻转变。我们可以用三个阶段来描述这种演进:
工具阶段:AI 作为被动执行器。你输入指令,它返回结果,没有任何主动性。传统的计算器、搜索引擎、电子表格都是这种模式。每次交互都是独立的,系统不记得你之前做过什么。
助手阶段:AI 具备上下文理解能力。ChatGPT 就是典型代表。它能理解你说的话,保持对话上下文,提供建议和解释。但本质上,它仍然是被动响应式的——等着你发起每一次交互。
同事阶段:AI 具备自主性与判断力。它不仅能响应请求,还能主动规划、执行多步骤任务、使用工具,在必要时寻求人类指导。
当代 AI 智能体正处于从助手向同事过渡的阶段。我们在本书中学习的 Claude Code 等工具,已经展现出部分同事式的能力,但仍需要人类的指导和监督。
这种转变改变了我们使用 AI 的方式:
- 从指令到目标:不再给出每一步的具体指令,而是设定高层目标,让 AI 自主规划实现路径
- 从执行到协商:AI 可以提出建议、表达不确定性、请求澄清,而非机械执行
- 从同步到异步:AI 可以独立工作一段时间,人类不需要实时监督每一个动作
- 从完美期待到容错设计:承认 AI 会犯错,设计系统使其能够检测和恢复错误
三种协作模式
在实际工作中,人与 AI 的协作可以采用不同模式,取决于任务特点和风险等级:
辅助模式(Assist):人类主导,AI 提供建议。人类做所有决策,AI 提供数据、分析、选项供参考。人类可以完全忽略 AI 的建议。适用于高风险决策,比如医疗诊断、法律判决、重大投资决策。
金融场景示例:AI 分析市场数据并提供投资建议,人类投资经理做最终决策;AI 标记可疑交易,人类分析师确认是否为欺诈。
增强模式(Augment):人类规划,AI 执行。人类设定目标和制定计划,AI 负责执行具体步骤,人类在关键节点审核和调整。AI 在预设范围内有一定自主权。
金融场景示例:人类设定投资策略规则,AI 自动执行交易;人类定义报告模板和要求,AI 生成报告内容。
自主模式(Autonomous):人类设定目标,AI 自主完成。人类只定义最终目标和约束条件,AI 自主规划、执行、评估、调整。人类只在例外情况或完成时介入。
金融场景示例:高频交易系统在预设参数内自动运行;自动化合规检查系统。
| 协作模式 | 人类角色 | AI 角色 | 适用场景 |
|---|---|---|---|
| 辅助模式 | 主导执行 | 提供建议 | 高风险、需专业判断 |
| 增强模式 | 规划决策 | 执行细节 | 中等复杂度、可分解 |
| 自主模式 | 设定目标 | 自主完成 | 低风险、高频率、规则明确 |
选择哪种模式,需要考虑风险等级、任务频率、是否需要专业判断、时间压力、AI 可靠性等因素。一个原则是:风险越高,人类参与度应越高。
指挥者心态
与 AI 高效协作,需要一种新的心态。我们称之为指挥者心态(Commander Mindset)。
一个有用的比喻是:把自己定位为老板,把 AI 当作一个强大的执行团队。老板不需要知道每件事怎么做,而是思考和设置宏观流程、指挥团队收集信息、让团队深度思考和制定计划、把控方向并验收结果。
具体来说,指挥者的职责包括:
战略层面:定义任务目标和成功标准;设计宏观工作流程;做关键决策和方向判断;分配资源和确定优先级。
执行层面:审核 AI 制定的计划;在关键检查点验收结果;提供反馈和修正指导;处理 AI 无法解决的例外情况。
一个重要原则是先探索后执行:
- 信息收集阶段:让 AI 先搜索、阅读相关资料
- 规划阶段:让 AI 制定执行计划并呈报
- 审核阶段:人类审核计划,提出修改意见
- 执行阶段:批准后让 AI 执行
- 验收阶段:检查结果,提供反馈
这种方法避免了 AI 在信息不足时盲目行动,减少返工,保持人类对流程的掌控。
Effective Vibe Coding 简介
Vibe Coding 由前 OpenAI 研究员、特斯拉 AI 负责人 Andrej Karpathy 在 2025 年初的技术分享中提出,描述了一种新的人机协作范式:用 AI 完成工作,而你只是把握感觉(vibe)。
但这不意味着人类完全放手。人类的角色从亲自执行转变为:描述意图和需求、审核生成的内容、测试和验证结果、指导迭代优化。

有效的 Vibe Coding 遵循一个核心循环:提示 → 生成 → 评估 → 优化
- 提示(Prompt):清晰描述需求和上下文
- 生成(Generate):AI 产出代码或内容
- 评估(Evaluate):人类评估输出质量
- 优化(Optimize):基于反馈迭代改进
这个循环可能重复多次,直到达到满意的结果。
本章只是简要介绍这一理念。第 2 章将详细展开 Effective Vibe Coding 的完整方法论和操作流程。
人在回路(Human-in-the-Loop,HITL)是一种设计模式,在 AI 决策的关键环节引入人类审核。它不是用人类替代 AI,而是创建一个协同生态系统:AI 处理计算密集型任务,人类提供判断和伦理推理,双方协作达成单方无法实现的结果。
1.3 AI 智能体在经济金融领域的应用概览
为什么金融领域特别适合智能体
经济金融领域有几个特点,使其成为 AI 智能体应用的沃土:
信息密集:金融分析需要处理海量数据——财报、新闻、研报、公告、社交媒体。人工阅读和整合的效率有限,AI 能大幅提升信息处理能力。
决策复杂:投资决策涉及多维度因素,需要综合基本面、技术面、情绪面等分析。AI 的多步推理能力可以辅助人类做出更全面的判断。
时效性强:金融市场瞬息万变,快速获取和处理信息至关重要。AI 能实现 7×24 小时监控和即时响应。
规则与判断并存:金融工作既有明确规则(如合规检查),也需要灵活判断(如估值分析)。AI 智能体能很好地处理这种混合场景。
六大应用场景

场景一:金融舆情分析
实时监控社交媒体、财经新闻、官方公告,分析市场情绪和事件影响。
蚂蚁集团的智能风控体系是一个成功案例。它日均处理 2 亿笔交易,欺诈识别准确率达 99.98%。系统不仅被动检测,还主动出击——通过 AI 叫醒热线主动致电潜在被骗用户,止付率提升 80%。根据蚂蚁集团 2024 年公开披露,该系统当年帮助减少资损超过 80 亿元。
场景二:交易信号分析
综合基本面、技术面、情绪面数据,生成交易信号和投资建议。
现代 AI 交易系统往往采用多智能体架构。以 TradingAgents 开源项目为例,它模拟真实交易公司的决策流程,包含基本面分析师、技术分析师、情绪分析师、风险经理、交易员、基金经理等多个 AI 角色协同工作。还有多空辩论机制:牛市研究员和熊市研究员分别提出论点,通过结构化辩论形成最终观点。
场景三:投资研究报告生成
自动收集信息、分析数据、生成结构化研报。
这类系统通常采用 Plan-and-Solve 架构:规划智能体将研究主题分解为子问题;研究智能体从多源检索信息并评估质量;写作智能体按专业格式撰写内容;审核智能体进行事实核查和逻辑检验。
场景四:风险评估与合规自动化
自动化反洗钱检测、信贷审批、合规审查等流程。
一个典型设计是信贷审批的双审反思机制:初审智能体检查数据完整性和基本资质;风控评估智能体进行信用评分和欺诈检测;反思智能体评估决策置信度,检查逻辑一致性;根据置信度高低,自动审批、二级审核或转人工深度调查。
场景五:智能投顾与客户服务
提供个性化投资建议,实现客户服务自动化。
招商银行的 AI 小招是一个代表案例。它采用三层分流模式:第一层由 AI 处理日常咨询;复杂问题升级到第二层远程人工服务;特殊需求再升级到专属客户经理。根据招商银行 2024 年年报,招行在信息科技上投入 133.5 亿元,AI 大模型落地 120 余项产品。
场景六:学术研究辅助
协助文献综述、数据分析、论文写作等学术工作。
这也是本书后三章的重点。我们将学习如何用 AI 智能体辅助论文润色、自动化文献综述、甚至进行多智能体社会科学实验。
本书案例体系
本书的应用篇(第 11-16 章)提供了六个完整的项目案例:
| 章节 | 项目 | 核心模式 | 复杂度 |
|---|---|---|---|
| 第 11 章 | 金融舆情分析系统 | 路由、并行化、工具使用 | ★★☆ |
| 第 12 章 | 交易信号分析系统 | 多智能体、反思、规划 | ★★★ |
| 第 13 章 | 金融研报生成系统 | RAG、规划、提示链 | ★★★ |
| 第 14 章 | 论文润色提升系统 | 反思、人在回路 | ★★☆ |
| 第 15 章 | 文献综述智能体系统 | RAG、多智能体 | ★★☆ |
| 第 16 章 | 多智能体社会科学实验 | 记忆、多智能体协作 | ★★★ |
每个项目都会综合运用原理篇学到的设计模式,让你在实践中掌握智能体系统设计。
风险与边界
在热情拥抱 AI 智能体的同时,我们必须清醒认识其风险和边界。
AI 会出错。大语言模型可能产生幻觉——自信地编造不存在的信息。在金融领域,错误信息可能导致严重后果。任何重要决策都需要人类审核和验证。
历史教训。2012 年,Knight Capital 因一个软件部署错误,在 45 分钟内损失 4.4 亿美元。2010 年美股闪崩,36 分钟内道琼斯指数暴跌 998 点,近 1 万亿美元市值蒸发。这些事件提醒我们:自动化系统需要严格的风险控制和熔断机制。
伦理与合规。AI 系统可能产生算法歧视。Apple Card 曾因女性用户系统性获得更低信用额度而受到指控。监管机构对 AI 在金融领域的应用有明确要求,包括模型可解释性、公平性、可审计性。
能力边界。当前的 AI 智能体擅长信息整合、模式识别、内容生成,但在需要深度因果推理、处理罕见情况、做出伦理判断时仍有局限。了解这些边界,才能正确使用 AI。
学习本书的目标不是盲目信任 AI,而是学会如何设计、监督和评估 AI 智能体系统,让它们安全、有效地服务于经济金融工作。
1.4 本书导读
四大部分的设计逻辑
本书共 16 章,分为四个部分:
基础篇(第 1-3 章) 为后续学习做认知和工具准备。第 1 章建立对智能体的整体认知;第 2 章讲解 Effective Vibe Coding 方法论;第 3 章完成 Claude Code 的安装与配置。
原理篇(第 4-10 章) 系统讲解智能体设计的核心模式。从提示词工程开始,逐步深入智能增强、记忆管理、工具使用、检索增强生成(RAG)、多智能体协作,最后学习如何评估和优化智能体系统。
业界应用篇(第 11-13 章) 聚焦金融行业实战项目。通过舆情分析、交易信号、研报生成三个完整项目,将原理篇的知识应用于真实场景。
科研应用篇(第 14-16 章) 面向学术研究场景。帮助你用 AI 智能体提升论文写作、文献研究和实验设计的效率。
学习路径建议
标准路径:按章节顺序学习。每周 4-6 学时,大约 14 周完成。适合希望系统掌握的学习者。
快速入门:第 1-4 章 → 第 11 章。一周内可以完成第一个项目,建立直观认识后再回头补充原理。适合时间有限或希望快速上手的学习者。
研究导向:第 1-5 章 → 第 8 章(RAG)→ 第 14-15 章。重点掌握文献检索和论文写作相关内容。适合准备毕业论文的学生。
章节依赖关系:基础篇是所有后续章节的前置;原理篇各章之间有一定依赖,建议顺序学习;应用篇可以根据兴趣选择性学习,但建议至少完成一个完整项目。
给经济金融学生的建议
不要害怕技术。本书不需要编程基础。与 AI 对话就是编程。你要学的是设计思维,不是写代码。
带着问题学习。想想你工作或学习中的哪些任务可以让 AI 帮忙?每学一个概念,思考它在你熟悉的场景中如何应用。
多动手实践。每章的案例都要亲自完成。遇到问题是正常的,解决问题是学习的一部分。
建立批判性思维。AI 不是万能的。学会验证 AI 的输出,理解人类监督的重要性。信任要基于验证,而非盲从。
本章小结
本章为全书奠定认知基础,核心要点如下:
- 智能体是能够自主感知、推理、行动和学习的 AI 系统,以大语言模型为认知核心的智能体代表了 AI 发展的新阶段
- 从图灵测试到 ChatGPT,AI 经历了七十年演进,当前正从聊天机器人向智能体范式转变
- 人与 AI 的关系从工具到助手再到同事,指挥者心态和 Effective Vibe Coding 是高效协作的关键
- 经济金融领域的信息密集性、决策复杂性和时效性要求,使其成为 AI 智能体应用的理想场景
- 学习智能体设计的目标是掌握如何设计、监督和评估 AI 系统,而非盲目信任
接下来,我们将深入 Effective Vibe Coding 方法论,学习与 AI 高效协作的完整工作流。
实验 1:智能体初体验
实验目标
- 直观感受 LLM 驱动的智能体能力
- 体验提示 → 生成 → 评估 → 优化的 Vibe Coding 循环
- 理解智能体与普通聊天机器人的区别
实验准备
- 已安装 Claude Code(如未安装,可先阅读第 3 章后返回完成本实验)
- 稳定的网络连接
- 预计时长:30-45 分钟
实验步骤
第一部分:认识智能体(10 分钟)
- 启动 Claude Code,进行简单对话,感受 AI 的响应方式
- 询问 AI 它能做什么、有什么局限,了解能力边界
第二部分:信息获取任务(10 分钟)
- 尝试让 AI 整理一家上市公司的基本信息
- 改进你的提示词,观察回答质量的变化
- 体会提示词设计对结果的影响
第三部分:情感分析任务(10 分钟)
- 给 AI 一段财经新闻,让它分析情感倾向
- 与 AI 讨论你对分析结果的不同看法
- 体验人机协作中人类判断的价值
第四部分:生成任务(10 分钟)
- 让 AI 生成一份简短的投资备忘录
- 提出修改意见,让 AI 迭代优化
- 让 AI 将结果保存到文件,观察人在回路机制
思考题
- 智能体与普通聊天机器人的本质区别是什么?
- 在你熟悉的经济金融场景中,哪些任务适合智能体化?
- 什么情况下你会信任 AI 的判断?什么情况下需要自己核实?