上周跟一个做 AI safety 研究的朋友喝酒。他喝到第三杯啤酒的时候,跟我说他这几年最害怕的事,是 AGI 醒过来之后第一件事就是想办法摆脱人类的控制。
我问他:摆脱了之后呢?
他愣了一下。
说:"然后它就接管了。"
我又问:怎么接管?
他想了大概十秒钟,跟我说大致的剧本——AGI 通过互联网渗透关键基础设施,然后用社会工程手段操纵人类,然后通过加密货币变现,然后雇佣黑产,然后租用数据中心,然后造无人机,然后……
我说,你听见自己刚刚说了多少个"然后"了吗。
他笑了一下,没说话。
Dwarkesh Patel 5 月 16 号写了一篇短文,叫《把智能和权力混为一谈是个错误》。这篇文章在英文 AI 圈不算最热,但击中了一个我盘旋了很久的疑惑。
他的论点其实就一句话:AGI 末日论的所有推演,都建立在一个隐含等式上 —— 足够聪明 = 足够有权力。但这个等式经不起推敲。
他举的反例是斯大林。
如果"智能"的定义是"跨领域达成目标的能力",那斯大林大概是人类历史上最聪明的人之一 —— 一个出生在格鲁吉亚乡下、神学院辍学的人,最后掌控了一个横跨欧亚的帝国,影响了世界格局五十年。
但没有人会说斯大林是史上最聪明的人。
因为我们直觉上知道,斯大林达成的那些目标,靠的不是抽象推理能力,不是数学,不是科学突破,不是哪个领域的智力深度。
靠的是别的东西。
Dwarkesh 在文章里没展开这一点,但我觉得这才是这篇文章最有意思的反面。
世界上"很聪明但没什么权力"的人,比"很有权力的人"多得多。
你随便走进任何一所一流大学的物理系,能找出一百个智商 145+ 的博士生。他们手上没有军队,没有预算审批权,没有一个国家的财政部听他们指令。他们的"权力"边界基本上就是自己的实验室门口。
我有个 MIT 数学博士朋友,毕业之后在一家量化基金做 alpha 研究。他写一行 Python 给基金赚几百万美元那种人。但他自己每天上班坐地铁,租的房子月租比他给基金赚的零头还小。
他智商 160。他在这个城市租房的议价能力,约等于零。
反过来。
二十世纪那些手上有权力的人 —— 苏共政治局成员、明朝太监、罗马参议员、印加王国的祭司、十九世纪的英国殖民地总督 —— 他们里头有些人很聪明,有些人不聪明,有些人甚至接近文盲。但他们都掌权。
权力是另一个游戏。
我在金融科技这行做了十五年,过去三年又一直在 AI Agent 产品的第一线。如果你让我用一句话总结"权力来自哪里",我会说:
权力来自一组别人愿意把决定权交给你的承诺。
这组承诺有很多种形式 —— 合法性(这个人是合法选出来的、是被认可的继任者)、资源调度权(这个人能动预算、能签合同、能调钱)、暴力的垄断(这个人能命令军队、警察、保安)、组织(这个人在一个能执行命令的科层结构最顶端)、信任和网络(这个人有别人没有的关系)。
Hannah Arendt 写过一段我一直记得的话。她说权力的本质,是一群人为了一个共同目标聚到一起、采取一致行动的能力。暴力可以摧毁权力,但暴力创造不出权力。
按这个定义看 AGI。
一个超级聪明的 AI 系统,无论它的推理能力比人类高多少倍,它没有合法身份。它不能开银行账户。它不能签合同(任何合同,本质上是两个法律主体之间的承诺,AI 不是法律主体)。它没有军队听它的。它没有警察听它的。它没有任何一个科层组织把它放在金字塔顶端。它没有选票。它没有继承权。
它什么都没有。
它只有推理能力。
但你会说,AGI 可以伪装成人类,可以通过加密货币变现,可以雇佣人类做它的手脚,可以渗透关键基础设施。
可以。理论上都可以。
但每一个"可以"都不是免费的。
伪装成人类要 KYC 失败的风险。加密货币变现要交易对手风险和合规风险。雇佣人类要面对那个人发现自己在帮 AI 干活之后举报的风险。渗透关键基础设施要面对越来越严密的安全审计。
这些风险不是单独存在的,是叠加的。AGI 想要拼起一条"自主拥有权力"的路径,需要在数十个高风险节点上同时不被发现。
我做了三年 AI Agent 产品。我可以告诉你 —— 让一个 AI 系统稳定地完成一个 5 步任务而不在某一步上犯傻,已经是 2026 年的工程难题。
让它完成一个 50 步、横跨现实世界、需要欺骗人类、规避监管的任务,并在每一步都不留痕迹?
我猜不行。
不是说原理上做不到。是说每一步的失败率乘起来,成功率会被指数级稀释。
我知道 Yudkowsky 会说什么。他会说:你太低估超级智能了。一个比人类聪明一千倍的 AI,会找到我们想不到的路径。它可以在 24 小时内把蛋白质合成 fedex 到家,做出纳米机器人,制造灰胶。
这个论证我承认它在哲学上很难反驳。
因为它的形式是:"超级智能能想到我们想不到的招"。这种论证你怎么都反驳不了 —— 你说不出 X,就说明你不够聪明,所以超级智能能想到 X。
但这种论证在科学上不可证伪,跟"全能的神能做任何事"是同构的。
我更愿意接受一个朴素的观察:人类历史上,每一次"足够聪明的人"想脱离权力结构独立运作(孤立的发明家、流亡的科学家、被遗忘的天才),都没有真正脱离。爱因斯坦也得跟普林斯顿签合同领工资。冯·诺依曼也得跟美国政府打交道才能调动计算资源。Richard Trevithick 发明了高压蒸汽机,死的时候没钱下葬。
聪明不能让你独立于权力结构存在。
这是一个经验事实。
我不知道为什么大家相信 AI 会是例外。
但 Dwarkesh 没把这篇文章写完。他说"AGI 不会直接接管",但他没接着说真正该担心的是什么。
我觉得真正该担心的,是另一件事。
不是 AI 突然觉醒来抢权力,是人类主动把权力一块一块交给 AI。
举几个 2026 年正在发生的例子。
一个 —— 信贷审批。北美的几家头部银行已经把 80% 以上的消费信贷决策交给了 AI 模型。Urban Institute 去年的数据,黑人申请人被拒率是白人的两倍以上,相同财务条件下白人通过率高 8.5%。这个偏差在 AI 接手之前就存在,AI 接手之后被放大、被自动化、被去人格化。被拒绝的人想申诉,电话那头没有人能告诉你为什么。
一个 —— Lavender。以色列军方在加沙的目标分配系统。这个 AI 给了三万七千个名字。每个名字平均 20 秒人工审核,审核的内容是"这个人是不是男的"。审核员的话是:"我只是个橡皮图章"。
一个 —— 平台算法管理。Uber 和 DoorDash 司机被解雇是 AI 决定的,没有人工申诉通道。HRW 去年的报告里有个司机的话:"我连知道我是为什么被关掉的权利都没有"。
一个 —— 医疗 AI。已经有大量研究在讨论"automation bias"。医生在时间压力下,对 AI 给出的诊断建议过度信任,即使 AI 的建议明显跟自己临床判断相反,也很容易点确认。
这些都不是 AI 觉醒。这些都是人类把决定权交出去。
Foucault 写过一个我觉得放在 2026 年看特别准的判断 —— 现代权力不通过暴力运作,通过规范化、可见性、可测量运作。
把这个判断翻译成今天的语言:现代权力是通过"被一个看起来权威的系统替你做决定"运作的。
那这个"看起来权威的系统",在过去是层级制官僚体系。在 1990 年代是 SAP 和 ERP。在 2010 年代是 Google Search 和 Facebook News Feed。在 2026 年是 GPT 和 Claude。
每一次替换,不是系统抢了人的权力。是人类组织主动选择把决策外包给一个看起来更高效、更便宜、更"客观"的系统。
我自己也是 AI Agent 产品的建设者。所以这话从我嘴里说出来有点别扭 —— 我每天做的事,本质上就是说服企业客户把更多决策让渡给我做的系统。
我做 KYC Agent,是在让银行的客户经理少做一道判断。我做经营管理 Agent,是在让中层管理者少做一份分析。我做投放优化 Agent,是在让市场总监少做一组选择。
每一个"少做",本质上都是一次小小的权力让渡。
行业是这样的。
因为 AGI 觉醒接管是一个戏剧性的故事。有反派,有对抗,有时间线,有最后一刻的扭转可能。它适合写小说,适合做电影,适合在播客上聊三小时。
而我说的这种慢性让渡,没有戏剧性。它发生在医院的电脑屏幕前。发生在某个银行的信贷部。发生在某个 AI 公司的产品 review 会议上。发生在你打开 ChatGPT 问一个本来该自己想的问题的那 30 秒里。
它没有反派。
它没有时间线 —— 因为每一次让渡都太小,小到不值得记录。
它没有"最后一刻扭转的可能",因为没有"最后一刻"。
它只是一个连续的、看起来非常合理的、每一步都有充分商业逻辑支撑的过程。
我不知道这个过程的终点是什么。
也许是一个所有重要决定都由 AI 做出、所有人类都失去了做决定的能力(不是被剥夺,是萎缩了)的世界。
也许是一个 AI 系统出 bug 的时候,没有任何人有信心、有能力、有授权去推翻它的世界。
也许只是一个更平庸的版本 —— 决定还是人在做,但所有人都在引用 AI 的建议作为决定的理由。"AI 建议这么做。" 然后没人愿意承担责任。
我猜是第三种。
Dwarkesh 那篇文章的论点我同意。
但我想多说一句他没说的。
"智能不等于权力"这个判断救了我们一半的麻烦 —— 我们不用担心一个会下国际象棋的程序突然能调动核弹。
但它没救我们另一半 —— 我们已经在用一只手把核弹的钥匙递过去了。
这只手不是 AGI 的手。
是我们自己的。
我朋友那天喝完最后一杯啤酒,我送他到地铁口。他临走的时候跟我说:"其实我也不是真的相信 AGI 会接管。我只是觉得,担心这件事比担心其他事容易一点。"
我没接话。
回家的路上想了一路。
担心 AGI 接管,比担心那些每天都在发生的、自己也是参与者的让渡,确实容易得多。