Workflow Comparison

人类vsAI

完成 9 项相同任务,谁更快?
👤
人类工作模式
经验丰富,每次执行都很熟练——但必须逐个重复完成
0.0s
总耗时
等待开始...
🤖
AI 工作模式
首次构建较慢,但之后可以近乎瞬间复制
0.0s
总耗时
等待开始...
AI 完成全部任务的速度比人类快
2
The Expansion of AI

AI 能力边界的扩张

从一颗种子的不经意分支,长出覆盖一切的参天大树

一颗种子 → 从图像识别的不起眼分支中 → 长出了大模型的无限可能 → 其中编程能力又催生出Agentic AI → 直到万物皆可 AI

3
OpenAI's Path to AGI

通往 AGI 的五个等级

OpenAI 于 2024 年 7 月内部提出的五级分类框架
20221
20242
20253
未来4
远期5
LV1
💬
Chatbots对话机器人
具备自然语言对话能力的 AI
已实现

核心能力

  • 流畅的多轮对话与上下文理解
  • 文本生成、翻译、摘要
  • 多语言理解与跨模态初步能力

代表产品

  • ChatGPT (GPT-3.5/4)
  • Claude、Gemini、文心一言
LV2
🧠
Reasoners推理者
博士级问题解决能力,无需外部工具深度推理
已实现

核心能力

  • 数学竞赛和科学问题的深度推理
  • 链式思维(Chain-of-Thought)

里程碑

  • 2024.09 — OpenAI o1 发布
  • 2025 — o3、GPT-5 系列突破
LV3
🤖
Agents智能体
自主执行复杂任务、跨系统操作的 AI 系统
初步涌现

核心能力

  • 自主规划并执行多步骤工作流
  • 使用工具(浏览器、API)完成任务

当前进展

  • OpenAI Operator
  • Claude Code / Codex
LV4
💡
Innovators创新者
辅助甚至主导科学发现和技术发明
尚未到达

核心能力

  • 在科学、医药领域产生原创创新
  • 自主提出假设并验证

前瞻信号

  • AlphaFold 蛋白质预测
  • GPT-5.2 辅助数学证明
LV5
🏢
Organizations组织级 AI
替代整个组织运作的 AI 系统
尚未到达

核心能力

  • 跨职能团队协调与多项目管理
  • 端到端业务流程自主运营

愿景

  • 类比自动驾驶 L5
  • 安全对齐成为核心挑战

2026 年初,我们正处于Level 2 → Level 3 的过渡区间

4
AI Model Race

AI 模型军备竞赛

GDPval-AA 评测:真实世界工作任务的 Agentic 表现(ELO 评分)
数据来源:Artificial Analysis 独立评测 · 覆盖 44 种职业 × 9 大行业
美国模型
中国模型
其他
Y轴:GDPval-AA ELO 分数
GDPval-AA ELO Score →

Claude Sonnet 4.6 以 ELO 1633 登顶,Anthropic 包揽前四 · 中国模型(GLM-5、Kimi K2.5、Qwen3.5)快速追赶至 1200-1400 区间 · 2025 下半年密集发布,军备竞赛加速白热化

5
Chat AI vs Agentic AI

从对话到自主执行

同一个任务,两种工作方式的根本差异
📋 任务:分析上季度销售数据,生成可视化报告,找出下滑品类并给出建议
💬
网页版 AI 对话
一问一答
Agentic AI (Claude Code)
自主执行
6
Insights

AI 时代的八个判断

01
未来最危险的岗位,不是被AI替代的岗位,而是无法用AI替代的岗位——因为它们的价值无法通过AI进行扩展。
02
AI不会取代人,但会用AI的人会取代不会用AI的人。
— Jensen Huang
03
AI无法直接完成深度工作,但它能在你完成一次深度工作之后,以接近零成本将其规模化一万次。
04
AI产业的生长规律不是线性扩张,而是从某一个细分的枝丫中,长出远超上一层总量的全新层次——就像编程能力从大模型中长出来,又从编程中长出了Agentic AI。
05
用AI聊天已经是上一个时代的产能。我们已经站在Agentic AI的门槛上——下一步不是跟AI对话,而是让AI组队替你高质量地完成重复性工作。
06
AI能力每提升一个层次,它能胜任的工作不是加法增长,而是指数级爆发
07
AI已经进入递归自我进化的阶段——"我们正站在棋盘的第40格。从第40格到第64格,速度会超出所有人的想象,即使你已经目睹了它走到今天的速度。"
— Dario Amodei, Anthropic CEO · 2026.03 Morgan Stanley TMT
08
当AI把执行力拉平,决定一个人上限的不再是技能,而是品味——以及对AI能力边界的精准判断。