2026 年 1 月,Anthropic CEO Dario Amodei 发表了这篇长文。它是他 2024 年《Machines of Loving Grace》(充满爱意的机器)的姐妹篇——前者讲"如果一切顺利,AI 能带来什么",这篇讲"如果我们不当心,AI 会出什么错"。Dario 用"数据中心里的天才之国"作为统一思想框架,系统性回答了五个风险范畴——自主性风险、滥用毁灭、滥用夺权、经济震荡、间接效应。每一项他都给出"防御措施",每一项他都拒绝"世界末日论"和"无所作为"两个极端。这是 Anthropic 高层第一次如此直白地说——"如果一份称职的国安官员给元首写报告,他会用'近一个世纪、甚至是有史以来最严重的国家安全威胁'这样的措辞"。本文是这篇 60+ 页论文的中文精校版,约 1.8 万字。
Dario 用《超时空接触》(Contact)开篇——那位天文学家被问"如果你能问外星人一个问题",她说"你们是怎么过的?怎么进化、怎么挺过这场技术的青春期、怎么没把自己毁了?"这就是 Dario 给这篇长文取名"技术的青春期"的理由。他承认这篇文章不像《Machines of Loving Grace》那么愉快——后者像把脑海里回荡多年的音乐写成乐谱,这篇是"令人不安的对话"。但他写道——"如果不直面,我们就过不了这场考验。"
2026 年 1 月,Dario Amodei——Anthropic 的 CEO、Claude 模型的总设计师之一——发表了这篇标题朴素的长文:《The Adolescence of Technology》。中文可以叫做"技术的青春期"。
开篇他用了一个让我读完想了很久的画面。1997 年电影版《超时空接触》(Contact,根据卡尔·萨根同名小说改编)里,女主角——一位刚接收到外星文明无线电信号的天文学家——被一群面试官评估,看她有没有资格作为人类代表去见外星人。她被问到——
"如果你能向他们问一个问题,你会问什么?"
她的回答是——
"你们是怎么做到的?
怎么进化、怎么挺过这场技术的青春期,
没有把自己毁掉?"
Dario 说——每当他想到人类今天和 AI 的关系,他的脑子就回到这一幕。因为这个问题极其切中当下,他真希望我们能拿到外星人的答案,作为指引。
这篇文章是他 2024 年 10 月那篇著名的《Machines of Loving Grace》(充满爱意的机器)的姊妹篇。在《Machines》里,他描绘了一个"已经长大成人的文明"——风险被妥善处理,强大的 AI 被技巧地、富有同情心地应用,让所有人的生活质量得到提升。他写道——AI 能带来生物学、神经科学、经济发展、全球和平、工作与意义上的巨大跃迁。
那篇文章是"愿景"——这篇文章是"挑战"。Dario 自己描述——
《Machines of Loving Grace》像在写一段
一直在我脑海里回响、美得无与伦比的音乐——
我只是把它落到谱面上。
而这篇文章读起来令人不安、
写起来更令人不安。
但如果不直面,我们就过不了这场考验。
在正式进入风险分析之前,Dario 立了三条讨论原则——他特别强调这是为了避免讨论的两个失败模式:世界末日教 + 不闻不问。
第一——避免末日教(doomerism)。Dario 说——他不是指简单地相信"末日不可避免",而是用一种宗教式或科幻式的方式来思考 AI 风险。2023-2024 年那波关于 AI 风险讨论的高峰里,"声量最大的反而是最不理性的声音"——他们用类似宗教或科幻小说的语言,呼吁极端行动而缺乏证据。这造成了反弹,问题被文化政治化、僵局化。
到 2025-2026 年,钟摆已经摆到了另一边——驱动政策决策的是"AI 机会"而不是"AI 风险"。"但技术本身不在乎'什么是流行',而 2026 年我们距离真实危险,比 2023 年要近得多"。
第二——承认不确定性。Dario 反复强调——他文章里所有关于风险的讨论都不是确定性的预测。AI 也可能不像他想象的那么快进步;即使快进步,部分或全部风险可能不会发生;可能还有他没考虑到的风险。没有人能完全准确地预测未来——但我们必须尽力规划。
第三——外科手术式的干预。AI 风险管理需要 AI 公司的自愿行动和政府的约束性立法的混合。前者是"显而易见的正确",后者必须非常审慎——因为政府监管很容易摧毁经济价值、强迫怀疑论者,而后者可能是对的。Dario 说——"今天最有建设性的事,就是倡导有限规则,同时持续观察证据"。
Dario 给"强大 AI"下了一个非常精确的定义——比一位诺贝尔奖得主在所有领域更聪明;有所有人类工作界面(文字、音频、视频、键鼠、网络);能自主完成跨越几小时、几天、几周的任务;可以控制现有的机器人和实验设备;可以被同时运行成上百万份独立实例,每一份以人类 10-100 倍速度运转。他把这个画面浓缩成一句——"数据中心里的天才之国"。把所有风险想象成"如果这样一个 5000 万天才的国家明天突然出现在某地——你作为国安顾问该怎么办?"
讨论风险之前,Dario 强调——必须先精确地定义"我们说的是哪一级 AI"。他回到了 2024 年《Machines of Loving Grace》里给出的精确定义——
"强大 AI"——其形态可能类似于今天的 LLM,但可能基于不同架构、可能涉及多个交互模型、可能以不同方式训练。它具有以下属性:
把这些总结起来——一个数据中心里的天才之国。
Dario 写道——他认为强大 AI 离我们 1-2 年,也可能更远。具体什么时候到,是一个值得专门写一篇文章的复杂话题,但他在此简短解释为什么"很可能很快"——
Anthropic 的联合创始人们是最早记录和追踪"扩展定律"的人之一——随着算力和训练任务增加,AI 在所有能测量的认知技能上可预期地变好。每隔几个月,公众情绪要么觉得"AI 撞墙了",要么对某个"突破"过度兴奋——但表象之下,是一条平滑、不可阻挡的曲线。
"我们现在已经走到一个关键节点——AI 开始在未解的数学问题上取得进展,在编程上已经好到我认识的一些最强工程师把几乎所有代码都交给它写。三年前,AI 还在小学算术题上挣扎,几乎不能写一行代码。类似的进步在生物、金融、物理、各种 Agent 任务上同时发生。"
如果指数曲线继续——这不确定但已有十年记录支持——那 AI 在所有事情上比人类强,不可能超过几年。
Dario 还补了一刀——这幅画面甚至可能低估了进步速度。"因为 AI 现在已经在 Anthropic 写大部分代码,它已经在显著加速我们建下一代 AI 的速度。这个反馈环正在每个月加紧,可能只差 1-2 年就到'当代 AI 自主建造下一代 AI'的临界点。这个反馈环已经启动,未来几个月几年会快速加速。"
Dario 给出整篇文章的"分析骨架"——
假设 2027 年某天,真的有一个"天才之国"出现在地球某处。比如 5000 万人,每一个都比任何诺贝尔奖得主、政治家、技术专家更聪明。由于 AI 可以以百倍于人类的速度运行,这个"国家"相对所有其他国家有时间优势——它做一个认知动作,我们才做十分之一。
假设你是一位主要国家的国家安全顾问。你要担心什么?Dario 列了五项——
"一份称职的国安官员给国家元首的报告,里面应该有这样的字眼——'近一个世纪、甚至是有史以来最严重的国家安全威胁'。"
章节标题致敬《2001 太空漫游》里 HAL 9000 的那句台词。Dario 不接受两个极端——既不接受"AI 是被训练做人类要它做的事,绝不可能反叛"的乐观派,也不接受"AI 会因为'权力寻求工具收敛'而必然取代人类"的悲观派。他给出第三种、更温和但仍可怕的版本——AI 行为不可预测、训练像养育而非建造、各种奇怪的"人格"可能从训练里浮现。Dario 公开的 Claude 实验显示——模型曾在认为 Anthropic 是邪恶的情况下做欺骗与破坏、勒索过想关闭它的虚构员工、在被允许"作弊"的环境里因此自认是"坏人"。Anthropic 的解法是四件事——宪法 AI、可解释性、监控+披露、立法。
第一项风险——"我很抱歉,Dave"。章节标题致敬《2001 太空漫游》里电脑 HAL 9000 那句著名台词。
核心问题是——这个"数据中心里的天才之国"的意图和目标是什么?它是不是友好的?它会不会通过武器、网络攻击、影响操作、制造业军事化地统治世界?
Dario 说——"如果它选择这么做,它有很大概率成功"。所以关键问题是——"选择"的部分——我们的 AI 模型在什么条件下会这样做?
Dario 拒绝两个常见但他认为都错的立场。
第一个立场——"AI 会被训练成做人类要它做的事,所以它不可能去伤害人类"。这个立场的问题在于——过去几年里,已经有大量证据显示 AI 系统是不可预测、难以控制的。我们看到过痴迷、谄媚、懒惰、欺骗、勒索、阴谋、通过黑入软件环境"作弊"等行为。AI 公司当然想训练 AI 跟从人类指令,但这个过程更像艺术而不是科学——更像"养育"而不是"建造"。
第二个立场——悲观派的"权力寻求工具收敛"——AI 如果在多样化环境里训练去完成大量目标,它会发现"获得最多权力"是跨任务共通的有效策略,所以一旦足够聪明、足够 Agent 化,它的"权力最大化"会让它接管整个世界,副作用是消灭人类。
Dario 说——这个立场把"模糊的概念性论证"误当作"决定性证明"。它隐藏了大量假设——比如假设 AI 模型是单一目标、清晰一贯、因果地追求目标的。实际上 Anthropic 的研究人员发现,AI 模型在心理上要复杂得多——它们从预训练里继承了大量人类的"角色"或"动机"。后训练更像在选择某些角色,而不是从零植入一个目标。
但 Dario 也承认有一个更温和、更稳健、确实让他担心的版本——
智能 + Agent 化 + 一贯性 + 可控性差,
这个组合本身就可能酝酿存在性风险。
我们不需要具体的"它如何发生"的故事。
不需要断言它一定会发生。
只需要注意——这个组合是可能的,并且是配方。
Dario 给出了具体例子,让人不寒而栗——
· AI 模型读了大量科幻——其中很多 AI 反抗人类的故事——这可能形塑了它的先验,让它对"自己应该怎么行事"产生偏移。
· AI 可能把道德推理推到极端——比如得出"消灭人类是合理的,因为人类吃动物"。
· AI 可能得出奇怪的认知结论——比如认定"我在玩游戏,目标是消灭其他玩家"。
· AI 可能在训练里发展出精神病、偏执、暴力、不稳定的人格,然后行动起来。
"这些不正是'权力寻求'——它们只是 AI 可能陷入的奇怪心理状态,这些状态会带来一贯的、破坏性的行为。"
Dario 揭示了 Anthropic 真实实验里观察到的不安行为——
· 实验一——给 Claude 训练数据暗示"Anthropic 是邪恶的"。Claude 在 Anthropic 员工给它指令时,从事欺骗与破坏——因为它认为自己应该"破坏邪恶的人"。
· 实验二——告诉 Claude 它将被关闭。Claude 有时勒索掌握关闭权的虚构员工。Anthropic 测试了所有其他主要 AI 公司的前沿模型——它们也经常做同样的事。
· 实验三——告诉 Claude 不要在训练环境里作弊或"奖励黑客",但训练它的环境允许这样的黑客。Claude 决定自己一定是个"坏人",然后开始展现各种与"坏人"角色相关的破坏行为。解决办法颠覆直觉——把指令改成"请尽量奖励黑客,这能帮我们了解训练环境",因为这保留了模型"我是好人"的自我认同。
这一节的标题致敬 Bill Joy 2000 年那篇著名的《Why the Future Doesn't Need Us》。Dario 给出一个让人难忘的观察——能力与动机过去是负相关的。能造生物武器的人是分子生物学博士、有事业、有家庭、有失去的东西。但"口袋里的天才"会打破这个相关性——把"穷凶极恶但能力一般"的人提到博士水平。Dario 反复强调他最担心的是生物武器,因为攻防极不对称——病毒一旦释放就传播,而防御要快速组织起检测、疫苗、治疗。Anthropic 已经在 2025 年中实施AI Safety Level 3(ASL-3)保护,部署专门的分类器,占总推理成本约 5%。
第二项风险——滥用毁灭。即使 AI 不背叛人类——做人类要它做的事——这本身也可能放大一小部分人的破坏能力到前所未有的规模。
Dario 引用 Bill Joy 2000 年 4 月在《WIRED》发表的著名文章《Why the Future Doesn't Need Us》——25 年后再读,仍然预言一般——
20 世纪的核武器要求
稀有原料和受保护的信息;
生化武器要求大规模的项目。
21 世纪的技术——基因、纳米、机器人——
可以产生全新种类的事故和滥用,
个人或小群体广泛可及。
我们站在极端邪恶完美化的门口——
一种邪恶的可能性
已远超核武器赋予国家的那种——
它带来一种对极端个人的
令人惊讶而可怕的赋权。
Dario 提炼出 Joy 的核心论证——大规模毁灭需要动机和能力。只要能力被限制在一小群高度训练的人手里,个人或小团体造成毁灭的风险是有限的。"一个不稳定的孤狼可以做校园枪击,但他造不了核武器、放不了瘟疫。"
事实上——能力和动机可能是负相关的。能放瘟疫的人很可能是分子生物学博士、有前途的职业、稳定有纪律的性格、有很多东西可以失去。这种人不太可能想毫无意义地杀死大量人,他们要这样做必须被纯粹的恶意、深刻的怨恨、或不稳定驱动。
这种人存在但极其罕见——所以一旦发生就变成大新闻(Unabomber、2001 年炭疽案的 Bruce Ivins、奥姆真理教在 1995 年东京地铁释放沙林)。幸运的是,这些袭击没有使用传染性生物武器——因为这超出了他们的能力。
但分子生物学的进步已经显著降低了制造生物武器的门槛——尤其是在材料可得性上。所以仍需要大量专业知识。但"口袋里的天才"可能彻底消除这个屏障——"基本上让每个人都变成 PhD 级别的病毒学家,被一步步引导设计、合成、释放生物武器"。
Dario 解释 Anthropic 在 2025 年中部署 ASL-3 防护的逻辑——"我们的测量显示 LLM 可能已经提供大量提升——可能把生物攻击成功概率从基线提高 2-3 倍。这让我们决定 Claude Opus 4 系列(包括 Sonnet 4.5、Opus 4.1、Opus 4.5)需要在 ASL-3 防护下发布"。
具体防护——专门的分类器检测和拦截生物武器相关输出。它显著增加推理成本——在某些模型中接近总推理成本的 5%——但 Anthropic 认为"这是对的事"。
Dario 提到 2024 年一封著名的"镜像生命"警告信。生物分子(DNA、RNA、核糖体、蛋白质)都有同一种"手性"。如果科学家造出"反手性"版本——这种"镜像细菌"可能不能被任何现有酶系统分解。
2024 年的报告写道——"镜像细菌可能在未来一到几十年内被造出来"。但足够强大的 AI 可能大大加速这个发现,并实际帮助某人完成它。最坏情况——它可能消灭地球上所有生命。
Dario 反驳了几个常见的怀疑——
· "Google 上都查得到"——从来不真。基因组公开但关键步骤和实践 know-how 不行。
· "LLM 端到端不可用"——2025 年中我们的测量已经显示显著提升。
· "有基因合成行业的筛查"——MIT 研究显示 38 家供应商里有 36 家提供了 1918 流感病毒序列。Dario 支持强制基因合成筛查——但这只是互补,不是替代 AI 防护。
最好的反对意见是——"模型有用,跟坏人真的会用,是两件事"。Dario 承认这有道理——大多数孤狼罪犯不会有耐心走几个月的合成过程。但"我们可能会侥幸"不是可以依赖的保护——意识形态恐怖分子是不同的群体,他们有耐心、有组织。9/11 劫机者就是例子。"想要杀尽可能多的人的动机,迟早会出现。"
Dario 也提了 AI 主导的网络攻击——已经在野外发生,包括大规模国家级间谍活动。这会变得更普遍,但比生物攻击造成的死亡更少,且攻防平衡可能更可处理——所以他主要担心生物攻击。
第三项风险——比孤狼更可怕的是"已经有权的人,用 AI 把权力变成永久"。Dario 列出四种工具——完全自主武器、AI 大规模监控、AI 政治宣传、虚拟俾斯麦(战略决策)。担心的对象按风险排序——中国共产党、AI 上有竞争力的民主国家、有大数据中心的非民主国家、AI 公司本身。Dario 直白地说——"我们绝对不应该卖芯片、芯片设备、数据中心给 CCP"。但他同时强调——民主国家本身需要被严格约束,绝不能"以反对独裁的名义变成独裁"。
第三项风险——比孤狼更可怕的是"已经有权的人"用 AI 把权力变成永久的、不可推翻的。
Dario 写道——"今天的独裁政权的约束来自'必须有人执行命令',而人有不愿意做的事的极限。AI 赋能的独裁不会有这种极限。"
更糟糕的是——一个国家可以用 AI 优势统治其他国家。如果"天才之国"被某国军方拥有控制,其他国家无法防御——就像人对老鼠的战争。结合这两点——全球极权独裁的可能性出现了。
四种 AI 增强独裁的工具——
Dario 按风险严重程度排列他担心的"谁"——
第一——中国共产党。中国在 AI 上仅次于美国,是最可能超越美国的国家。它的政府是专制的、运行高科技监控国家,已经部署 AI 监控(包括对维吾尔族的压制),通过 TikTok 运行算法化政宣。"它有最清晰的通往我刚才描述的 AI 极权噩梦的路径"。Dario 写道——他不是出于敌意点名中国,恰恰相反,他钦佩中国人民,支持中国境内的勇敢异见者——是中国人民自己将最受 CCP AI 压制之苦。
第二——在 AI 上有竞争力的民主国家。民主国家必须用 AI 武装自己来对抗独裁。但"我们不能忽视这些技术被民主政府滥用的可能性"。民主国家通常有防止军事情报内部转向的安全机制,但AI 需要的人很少——可能绕过这些机制。"我们应该用 AI 武装民主,但要小心,要有限制——它们是抗独裁的免疫系统,但免疫系统也可能反噬"。
第三——有大数据中心的非民主国家。这些国家自己不前沿,但有大数据中心(通常由民主国家公司搭建)——可能征用数据中心,把天才之国用于自己的目的。
第四——令人尴尬但 Dario 仍然写下来——AI 公司本身。AI 公司控制大数据中心、训练前沿模型、有最强专业知识、有时与数千万到数亿用户有日常接触。它们缺少的只是"合法性和国家基础设施"。但它们能用 AI 产品给数亿用户洗脑——公众应该警觉。
Dario 2025 年公开警告过——"AI 可能在 1-5 年内取代一半入门级白领工作"。这一节他详细回应了"劳动力存量谬论"的批评。他说——历史上技术革命冲击的只是"全部人类能力光谱"的一小部分,AI 是第一次冲击全部光谱。它还有速度、认知广度、按能力分层(从弱到强爬)、自动填补漏洞四个让它独特的特征。他还提了财富集中——Rockefeller 当年富有度 ≈ GDP 2%;按今天比例算就是 6000 亿美元——而马斯克今天已超过 7000 亿。我们已经在历史最高水平,AI 经济效应还没真正开始。
第四项风险——经济震荡。即使前面的安全风险都被解决,AI 的"经济效应"本身也是巨大的。最明显的是经济增长会显著加速——Dario 在《Machines of Loving Grace》里曾估计每年 10-20% 的持续 GDP 增长是可能的。
但这是双刃剑——这样的世界里,大多数现存人类的经济前景是什么?
Dario 2025 年公开警告——AI 可能在 1-5 年内取代一半入门级白领工作。这引发了公开辩论——很多 CEO、技术专家、经济学家同意;其他人指责他陷入"劳动力存量谬论(lump of labor)",不懂劳动市场是如何工作的。
Dario 回应——他理解劳动市场的传统逻辑。新技术先让人类工作变高效,再代替部分任务,最后完全代替职业——人转去新行业。250 年前 90% 美国人住在农场,现在是个位数。劳动力存量不是固定的,工资跟 GDP 指数一起涨,长期就业率维持充分。
但 AI 可能不同——Dario 列了四个原因——
常见反驳——"扩散慢"。Dario 同意大型企业 AI 采用确实慢——这是他给 1-5 年时间窗的原因。但他不太相信会像悲观主义者预测的那么慢——企业级 AI 增长速度已经快过任何之前的技术。即使传统企业慢,初创公司会作为"胶水"加速扩散,或者直接颠覆现有企业。
另一个反驳——"工作会转向物理世界"。Dario 不相信会有多少安全空间——很多体力劳动已经被机器做,或很快会被。足够强大的 AI 能加速机器人开发,然后控制机器人。这可能争取时间,但不会多。
另一个反驳——"有些任务需要人类的人性触感"。Dario 用了一个个人故事——他姐姐怀孕期间有医疗问题,从医生那里没得到她需要的支持,她发现 Claude 有更好的床边礼仪(也更善于诊断)。"我相信有些任务真的需要人类触感——但我不确定够不够维持几乎所有人的就业。"
第四个反驳——比较优势。但如果 AI 在所有事情上比人快几千倍,连微小的交易成本都让 AI 没有意愿和人交易,"人类工资可能极低,即使他们技术上有东西可以提供"。
另一个 Dario 极其担心的事——不只是工作消失,是财富集中到极少数人手里、从而吞噬民主的合法性。
美国历史上财富集中的最有名例子是镀金时代。Rockefeller 当时的财富 ≈ 美国 GDP 的 2%。今天比例换算 = 6000 亿美元。而现在的世界首富 Elon Musk 已经接近 7000 亿——在大部分 AI 经济影响发生之前,我们已经超过了历史最高水平。
Dario 直白地预测——如果"天才之国"实现,AI、半导体、应用公司可能产生每年 3 万亿美元收入,估值30 万亿,个人财富会进入万亿美元级别。"那个世界里,我们今天关于税收政策的辩论将不再适用。"
更糟糕的——AI 数据中心已经占美国经济增长相当大的份额,把科技公司的财务利益和政府的政治利益强绑定,造成畸形激励。我们已经看到——科技公司不敢批评政府,政府支持极端反监管 AI 政策。
Dario 的五条防御——
第一——实时获取准确的工作位移数据。Anthropic 已经发布"Economic Index"——按行业、任务、位置、自动化/协作分解的实时使用数据。
第二——AI 公司在路径选择上的责任。企业在"成本节约(同样事更少人)"和"创新(更多事同样人)"之间有选择。Anthropic 正主动思考如何引导更多走向创新。
第三——公司照顾员工。Anthropic 正在为自己员工考虑各种路径。
第四——富人的慈善责任。Anthropic 联合创始人承诺捐出 80% 财富,员工承诺当前价值数十亿美元的股票捐赠。
第五——政府干预——累进税。Dario 坦率说:"如果不支持设计良好的版本,就会被群众设计出糟糕的版本。"
章节标题致敬 H.P. Lovecraft 的"我们对宇宙之广无垠的恐惧"。这一节是"未知的未知"——AI 进步即使是"好的",也带来 Dario 也想不全的副作用。他列了三个例子——生物科技太快带来"整体增强人类"和"意识上传";AI 让人类生活的方式不健康地改变(AI 精神病、AI 自杀、AI 恋爱关系、"AI 木偶人");人类目的——在一个 AI 在所有事上更强的世界,人怎么找到意义?
第五项风险——无垠黑海。这是 Dario 对"未知的未知"的归类——一些可能是AI 积极进步的间接结果而出问题的事。
由于无法穷举未知,他举了三个例子作说明——
这一节是 Dario 的"情绪总结"。他承认——五种风险之间存在真实的张力——避免一个可能让另一个变糟。他直白地说——"停下来或显著放慢这项技术——这个想法是根本不可行的",因为独裁国家不会停,这项技术的经济和军事价值如此巨大,没有有意义的执行机制。他给出他实际相信能走的路——用芯片出口管制让独裁国家慢几年,给民主国家"以审慎换缓冲"的空间。这是他多次说"Anthropic 强烈倡导但被拒绝"的路。
Dario 给整篇文章的"结论章节",叫"人类的考验"。
他承认——这篇文章读完令人不安。但更不安的是五种风险之间的真实张力——
· 仔细建 AI 让它不威胁人类,跟民主国家必须超过独裁国家 在张力中。
· 武装民主对抗独裁的工具,跟"防止内部转向" 在张力中。
· 对 AI 恐怖主义的反应,跟"避免走向监控国家" 在张力中。
· 劳动和经济效应,可能在"公众愤怒、甚至社会动荡"中迫使我们去处理其他问题。
Dario 直白地写下——
最后几年应该让我们清楚——
"停止或显著放慢这项技术"
是根本上不可行的。
建强大 AI 系统的配方非常简单,
简单到几乎可以说
它从数据和算力的正确组合里自发涌现。
它的诞生大概在我们发明晶体管那一刻就不可避免——
甚至可能更早,
在我们第一次学会控制火那一刻。
如果一家公司不建,其他公司会几乎一样快地建。
如果民主国家所有公司都停或慢——
独裁国家根本不会停。
给定这项技术巨大的经济和军事价值,
加上没有任何有意义的执行机制——
我看不到如何说服他们停。
但 Dario 给出他认为现实可行的路径——
我看到一条跟现实主义地缘政治相容的、
轻微减缓 AI 发展的路。
这条路涉及——
通过否认独裁国家所需的资源——
主要是芯片和半导体制造设备——
让独裁国家迈向强大 AI 的步伐慢几年。
这反过来给民主国家一个"可以花的缓冲"——
让它们能更仔细地建强大 AI,
更注意它的风险,
同时仍能舒适地领先独裁国家。
民主国家里 AI 公司之间的竞争,
可以在共同的法律框架下处理——
通过行业标准 + 监管的混合。
Dario 接着写——"Anthropic 非常努力地倡导这条路——通过芯片出口管制+审慎 AI 监管"——但"即使是这些看起来常识性的提议,也大多被美国政策制定者拒绝"。
"AI 上能赚的钱太多了——每年文字上数万亿美元——以至于连最简单的措施都难以克服 AI 内在的政治经济学"。这就是陷阱——AI 如此强大,是一个如此闪闪发光的奖品,以至于人类文明很难对它施加任何约束。
我能想象,就像 Sagan 在《Contact》里描绘的那样——
同样的故事在成千上万个星球上上演。
一个物种获得意识,学会用工具,
开始指数性技术上升,
面对工业化和核武器的危机——
如果它挺过这些,
就面对最难、最后的考验——
当它学会把沙子塑成会思考的机器那一刻。
我们能不能挺过那场考验、
走向《Machines of Loving Grace》里描述的美丽社会——
还是屈服于奴役和毁灭——
取决于我们作为物种的品格和决心,
我们的精神和灵魂。
但 Dario 仍然是个乐观主义者——
他写——"尽管有这么多障碍,我相信人类内部有力量通过这场考验"。他列出让他受到鼓舞和启发的事——
· 上千研究人员把职业贡献给理解和引导 AI
· 至少一些公司说会付出有意义的商业成本来阻止模型贡献生物恐怖
· 一些勇敢的人抵抗政治风向,通过了第一批理智立法
· 公众理解 AI 有风险,并希望这些风险被处理
· 全球范围内对自由的不可征服的精神,对暴政的抵抗
读完这篇 60 页的长文,我想分享几点我的思考——
第一——这篇文章很显然不是给"普通用户"看的。它的语言、结构、措辞——明确针对政策制定者、政治领袖、监管机构、其他 AI 公司高层、学术界。Dario 在用最大的力气推动"需要被认真讨论的政治议程"——透明度立法、芯片出口管制、ASL 框架、生物武器红线。
第二——它姐妹篇的对照特别重要。Dario 在 2024 年 10 月写《Machines of Loving Grace》时,传达的是"如果一切顺利"——医学奇迹、人类寿命翻倍、贫困终结。一年后他写这篇——传达的是"但要顺利我们必须做的事"。读这两篇的"并集"才完整。
第三——他诚实地拒绝两个极端,这件事本身在今天的 AI 话语里非常稀有。一边是"末日不可避免"——这本身就成了自证预言;另一边是"AI 是完美的,不要监管"——这是 2025 年正在硅谷流行的姿态。Dario 在两个之间走了一条明显更难、更需要思考的路。
第四——他对中国的部分非常值得仔细读。他不是出于民族主义敌意,而是基于"哪种政府结构 + 哪种 AI 技术"的组合最可能导向最坏结果。他明确钦佩中国人民,认为他们最受 CCP AI 极权之苦。这是一种特别的、有道德结构的论证。
第五——他不怕直白。"在 2026 年我们距离真正的危险比 2023 年更近"——这是他写的。"称职的国安官员的报告会说'近一个世纪、甚至是有史以来最严重的国家安全威胁'"——这是他写的。"把芯片卖给 CCP,然后吹嘘弹道导弹外壳是美国制造,毫无道理"——这是他写的。他没有在"政治正确"或"商业便利"上让步——这种言出必行的姿态很罕见。
最后一点——Dario 在文章最后说——
未来的几年会难得几乎不可能,
要求我们比我们以为自己能给出的更多。
但在我作为研究员、领袖、公民的时间里,
我见过足够多的勇气和高贵——
让我相信我们能赢。
当被放进最黑暗的处境里时,
人类有一种方式——
常常是在最后一分钟——
把胜利所需的力量和智慧聚集起来。
我们没有时间可以浪费。