返回首页

Blog

共 56 篇文章

马斯克输掉的不是诉讼,是 AGI 公司治理的旧脚本

马斯克输掉的不是诉讼,是 AGI 公司治理的旧脚本

那天傍晚我刷到判决新闻的时候,是在地铁上。

AIOpenAI治理法律AGI
OpenAI 把 Codex 装进了私有云——这事比你想的要大

OpenAI 把 Codex 装进了私有云——这事比你想的要大

上周一晚上刷新闻,看到 OpenAI 和 Dell 联合发了一条公告——Codex 要接入 Dell AI Data Platform 和 Dell AI Factory,跑在企业自己的混合云和本地机房里。

AIOpenAICodex企业私有部署
「第四定律」:阿西莫夫的三定律在乌克兰战场失效了

「第四定律」:阿西莫夫的三定律在乌克兰战场失效了

那天我在 latent.space 上点开了一期播客。

AI战争伦理阿西莫夫
斯大林是史上最聪明的人吗 —— AGI 末日论的逻辑漏洞

斯大林是史上最聪明的人吗 —— AGI 末日论的逻辑漏洞

上周跟一个做 AI safety 研究的朋友喝酒。他喝到第三杯啤酒的时候,跟我说他这几年最害怕的事,是 AGI 醒过来之后第一件事就是想办法摆脱人类的控制。

AIAGI哲学权力
整批公司正在集体陷入 AI 心智失常 —— mitchellh 那条推说中了

整批公司正在集体陷入 AI 心智失常 —— mitchellh 那条推说中了

那天刷 X,看到 mitchellh 的一条推。

AI组织创业
微调真死了吗?2026 年我把它送进 RAG 的影子里

微调真死了吗?2026 年我把它送进 RAG 的影子里

2026 年还有谁在微调大模型?三个不该跟风的判断

LLM微调RAG长上下文AI 工程
拆解 TanStack 投毒:黑客没偷你的 npm 密码,却发布了恶意包

拆解 TanStack 投毒:黑客没偷你的 npm 密码,却发布了恶意包

OpenAI 被迫换证书背后:TanStack 投毒事件复盘,你的 CI 比想象中脆弱

安全供应链攻击GitHub ActionsnpmOIDCPostmortem
OpenAI 给安全圈发了张白名单:AI 护栏的特权时代正式开始

OpenAI 给安全圈发了张白名单:AI 护栏的特权时代正式开始

OpenAI 推出 GPT-5.5-Cyber,第一次把'按身份分配 AI 能力'做成显性产品。AI 护栏'对所有人一视同仁'的叙事正式破产。

AIOpenAIAI安全AI护栏网络安全行业观察
蒸馏不是攻击:当一个工程术语被立法妖魔化

蒸馏不是攻击:当一个工程术语被立法妖魔化

4 月 28 号,Anthropic 发了份安全警告,点名三家中国实验室对它的模型做"distillation attacks"。

AIdistillation蒸馏监管OpenAIAnthropic开源
OpenAI × PwC:Big4 把 GPT 装进 CFO 工作流,B2B AI 落地的拐点到了

OpenAI × PwC:Big4 把 GPT 装进 CFO 工作流,B2B AI 落地的拐点到了

5 月 4 号,OpenAI 和 PwC 联合发布"first-of-its-kind OpenAI-native finance function"——把 GPT-4 / GPT-5 系列模型装进 CFO 的日常工作流。

AIOpenAIPwCCFOagent企业服务Big4B2B
ChatGPT 哥布林追凶记:真凶其实是 RLHF 自己

ChatGPT 哥布林追凶记:真凶其实是 RLHF 自己

OpenAI 公开复盘 ChatGPT 满嘴哥布林事件:reward 信号没有 condition 边界,被奖励的 output 进训练数据正反馈放大。RLHF 不是 alignment 银弹,下一次出事的可能根本没有名字。

AIRLHFOpenAIalignmentChatGPT
Manus 不是选错路,这条路本来就不存在了 — 写给套利时代里的创业者

Manus 不是选错路,这条路本来就不存在了 — 写给套利时代里的创业者

所有人都说肖弘选错了——错投资人、错迁址时机、错买家。但作为一个 AI Agent 创业者,我想说:Manus 不是选错路,是这条路本来就不存在了。

ManusAI 创业退出路径创业者AI 主权Meta 收购
GPT-5.5 出牌了:OpenAI 和 Anthropic 已经不在同一个游戏里

GPT-5.5 出牌了:OpenAI 和 Anthropic 已经不在同一个游戏里

4 月 23 日,OpenAI 发布了 GPT-5.5。

GPT-5.5OpenAIAnthropicClaudeAILLM前沿模型观点
特斯拉 Optimus V3 灵巧手专利拆解:22 个自由度背后的 5 个关键决策

特斯拉 Optimus V3 灵巧手专利拆解:22 个自由度背后的 5 个关键决策

2026-04-16,特斯拉三份国际专利公开,Optimus V3 灵巧手 22 DoF、25 驱动器全部搬到前臂。拆解五个关键设计决策,从前臂后置驱动到滚动关节,一份比开源还详细的机器人手设计方法论。

Optimus人形机器人特斯拉灵巧手机器人设计TeslaHumanoid
A2A 网络要吃掉美团?饺子馆 skill 里藏着这个叙事的裂缝

A2A 网络要吃掉美团?饺子馆 skill 里藏着这个叙事的裂缝

几天前,GitHub 上一个叫 jinguyuan-dumpling-skill 的 repo 突然火了一下。

AIAgentMCPA2A平台经济美团服务业
OpenAI 把 Codex 卖给了四大咨询:AI 编程工具的渠道战争开始了

OpenAI 把 Codex 卖给了四大咨询:AI 编程工具的渠道战争开始了

OpenAI 宣布:Codex Labs 成立,和 Accenture、PwC、Infosys、Capgemini、Cognizant、CGI、TCS 七家全球咨询巨头签约。Codex 周活用户从 4 月初的 300 万,两周内涨到 40…

OpenAICodexAI编程企业销售行业观察
GPT-Image-2 和 Cursor 的 600 亿:两件事,一个信号

GPT-Image-2 和 Cursor 的 600 亿:两件事,一个信号

凌晨,OpenAI 发布 GPT-Image-2,Arena 上 +242 Elo 领跑,text-to-image 榜单第一,号称"最可用的 UI / 原型 / 图表 / 生产力可视化模型"。

OpenAIxAICursorGPT-Image-2行业观察并购
凯悦给全球员工开 ChatGPT:AI 正在变成水电煤

凯悦给全球员工开 ChatGPT:AI 正在变成水电煤

4 月 20 日,OpenAI 官网贴了一篇合作案例:凯悦酒店集团给全球所有员工开通 ChatGPT Enterprise,覆盖企业总部 + 旗下所有酒店的员工,包括一线。底层模型是 GPT-5.4,还带 Codex。

OpenAIChatGPT企业AI凯悦行业观察
Noetik 的反直觉赌注:95% 失败的肿瘤药不是药不行,是配对错了

Noetik 的反直觉赌注:95% 失败的肿瘤药不是药不行,是配对错了

我上周听了一期 Latent Space 的访谈,嘉宾是 Noetik 的联合创始人 Ron Alfa 和 Daniel Bear。他们在做一件极其反直觉的事——

生物AINoetik癌症治疗Transformer精准医疗
开闭源性能差距的真相:一张跑分榜掩盖了什么

开闭源性能差距的真相:一张跑分榜掩盖了什么

打开 Artificial Analysis、LMArena 或者 Hugging Face 的 leaderboard,你会看到一条曲线。开源模型的综合分在追,闭源模型在跑,两者的差距每个季度都在缩小。

AI开源模型闭源模型benchmark行业观察
A2A 网络的"Stripe 机会"——这个类比撑得住吗?

A2A 网络的"Stripe 机会"——这个类比撑得住吗?

上一篇拆了一个流行叙事:A2A 网络要吃掉美团。结论是——UI 层会被 agent 吃掉,但吃它的是通用 agent 入口(ChatGPT、千问、豆包),不是独立的 A2A 网络。信任、支付、合规、监管依然厚,美团不死,会变成被调用的后端。

AIAgentMCPA2A平台经济Stripe商业分析
你能用到什么 AI,取决于你是谁 — OpenAI 刚刚给出了第一份 VIP 名单

你能用到什么 AI,取决于你是谁 — OpenAI 刚刚给出了第一份 VIP 名单

OpenAI 这周扔出来一个东西,叫 Trusted Access for Cyber(TAC),顺带发布了一个专用模型 GPT-5.4-Cyber。配套 $10M 的网络安全资助计划。首批签约的单位名单我抄一下:

AIOpenAI网络安全GPT-5.4-Cyber行业观察
Claude Design 不是设计工具——Anthropic 刚刚宣布"通用 AI + SaaS"时代结束

Claude Design 不是设计工具——Anthropic 刚刚宣布"通用 AI + SaaS"时代结束

Claude Design 发布的当天,我在朋友圈看到几十个人转。标题大同小异:"Anthropic 挑战 Figma"、"AI 设计工具新玩家"、"Canva 要不要紧张"。

AnthropicClaude DesignSaaSAI 产品行业观察
Codex 这次更新不是产品升级——是 OpenAI 的赛道选择

Codex 这次更新不是产品升级——是 OpenAI 的赛道选择

4 月 16 日 Codex 的更新,堆了五件事:computer use、in-app browser、image generation、memory、90+ plugins。

OpenAICodexClaude CodeComputer Use开发者工具
开源模型不是在追赶 GPT,它们在建另一条流水线

开源模型不是在追赶 GPT,它们在建另一条流水线

Nathan Lambert 前几天更新了 ATOM Report — 他维护的那份追踪开放语言模型生态的技术报告。这次更新里他塞了一个新指标,叫 RAM(Relative Adoption Metric,相对采用率)。逻辑很简单:一个模型在某个时间点上得分 >1,意味着它"正在…

AI开源模型LLMATOM生态
OpenMythos 不是破解 Claude——但它提前暴露了下一代模型的真正战场

OpenMythos 不是破解 Claude——但它提前暴露了下一代模型的真正战场

昨晚有朋友发来一条消息:

ClaudeOpenMythosRDTTransformerMoEAI架构观点
Qwen3.6 不是开源追赶闭源——它是 Agent 经济学的断点

Qwen3.6 不是开源追赶闭源——它是 Agent 经济学的断点

Qwen3.6-35B-A3B 发布那两天,转发最多的截图是这张 benchmark:SWE-bench Verified 73.4。评论区的口径出奇一致——"开源模型终于追上 Claude Sonnet 了"。

Qwen开源模型AgentMoE成本分析
模型壁垒的真名叫"跑模型的那些人" — 读 Dwarkesh 4/15 学习笔记

模型壁垒的真名叫"跑模型的那些人" — 读 Dwarkesh 4/15 学习笔记

Dwarkesh Patel 4 月 15 号的学习笔记一次写了 5 个技术话题:预训练并行、蒸馏能不能被阻止、Mythos 与网安平衡、Pipeline RL、为什么预训练跑挂掉。每一条都很硬核,单独拿出来都能写一篇。

AI蒸馏开源模型Dwarkesh深度分析
老黄为什么反复说"别怕 TPU" — 因为他自己最怕

老黄为什么反复说"别怕 TPU" — 因为他自己最怕

Dwarkesh 4 月 15 号放出的黄仁勋访谈,市场上分析的版本很多。大部分文章都在重复老黄说了什么 — TPU 不可怕、中国该卖、$1T 规模有供应链支撑。

AINVIDIA黄仁勋算力GPU行业观察
GPT-Rosalind 拆解:OpenAI 自己下场做垂类模型,意味着什么

GPT-Rosalind 拆解:OpenAI 自己下场做垂类模型,意味着什么

周三,OpenAI 发了 GPT-Rosalind。一个生命科学专用模型,名字致敬 Rosalind Franklin——那位拍出 DNA 双螺旋 X 光衍射照片、贡献被压了几十年的女科学家。

OpenAIGPT-Rosalind垂类模型AI for Science产品策略
Opus 4.7 不再卖聪明:推理竞赛悄悄结束了

Opus 4.7 不再卖聪明:推理竞赛悄悄结束了

Opus 4.7 的信号不是 SWE-bench 涨了 7 个点。真正的信号是:Anthropic 第一次公开放弃「更聪明」这个卖点,把前沿竞争从推理 IQ 切换到长程代理的毅力。

ClaudeOpusAILLM前沿模型观点
你的 Agent 记忆,不属于你

你的 Agent 记忆,不属于你

2026 年最危险的认知陷阱:把记忆当插件。当你选了一个 Agent Harness,你就已经做出了记忆主权的决策——只是大多数人在那个时刻并不知道。

AI Agent记忆主权Harness平台锁定开源AnthropicLangChainLetta
LLM Wiki 很优雅,但它替代不了 RAG

LLM Wiki 很优雅,但它替代不了 RAG

Karpathy 的 LLM Wiki 模式精妙优雅,但五个结构性约束决定了它替代不了企业级 RAG。我用同一套架构跑了个人站,开源了 Accrete LLM Wiki。

AILLMRAG知识管理架构设计Karpathy
前谷歌高管预言 AI「地狱 12 年」:贩卖焦虑还是提前剧透?

前谷歌高管预言 AI「地狱 12 年」:贩卖焦虑还是提前剧透?

前谷歌X高管Mo Gawdat预言2027年起12年AI地狱期。作为AI从业者,我逐项打分:方向大致对,时间表基本错,恐惧被精确包装成了内容产品。

AI观点社会变革Mo Gawdat未来预测
我电脑里的软件墓地:从三个月使用数据看 AI 对 SaaS 的清算

我电脑里的软件墓地:从三个月使用数据看 AI 对 SaaS 的清算

VS Code 52 次、PyCharm 一年半未开、Claude Code 3702 条记录。从一个人的软件使用数据,看 S&P 软件指数 -15%、Adobe -19%、金蝶 -12.6% 背后的结构性替代,以及 SaaS 行业的下一个机会。

AISaaS软件行业投资开发工具
AI替代的铁拳终于挥向了教师编制

AI替代的铁拳终于挥向了教师编制

从 colleague-skill 到 teacher-skill,一个13岁初中生用AI蒸馏老师的教学方式,揭示了教育AI赛道最大的盲区。

AI教育开源观点colleague-skill
从 Claude Code 源码里扒出 14 条提示词秘籍,读完发现:这些规则是写给人的

从 Claude Code 源码里扒出 14 条提示词秘籍,读完发现:这些规则是写给人的

Anthropic 写给 AI 的 14 条禁令,每一条替换成「你自己」都成立。好的系统设计是堵漏洞,不是教做人。

AI提示词工程Claude Code管理哲学Agent
Harness 厚薄之争的真相:这不是技术问题,是信任问题

Harness 厚薄之争的真相:这不是技术问题,是信任问题

Harness 厚薄之争表面是技术架构问题,底层是信任架构问题——信模型就做薄,信流程就做厚

AI AgentCoding AgentHarnessAnthropicCodex架构设计
别研究了,Claude 泄露的这些代码不值钱

别研究了,Claude 泄露的这些代码不值钱

所有人都在分析 Claude Code 泄露的 512,000 行源码。但源码本身已经不值钱了——真正值钱的是驱动 AI 写出这些代码的需求文档。

AIClaude Code源码泄露编程范式观点
Token 出海降温:当 AI 算力也走上「越南路线」

Token 出海降温:当 AI 算力也走上「越南路线」

训练→推理的转移让中国拿到了 token 定价权,华尔街把这视为比 DeepSeek 更深层的威胁。当 token 贸易壁垒竖起来时,受益的不是中国也不是美国——是马来西亚。

AI出海中美博弈芯片马来西亚Token
Anthropic 的多智能体 Harness 架构:拆解 3 个让 AI 自主开发完整应用的关键决策

Anthropic 的多智能体 Harness 架构:拆解 3 个让 AI 自主开发完整应用的关键决策

Anthropic 用三 Agent 协作架构让 Claude 自主开发完整全栈应用,从 $9 的 broken demo 到 $200 的生产级产品——拆解 Generator-Evaluator 分离、Sprint 契约、假设驱动瘦身三个核心决策

AI Agent多智能体架构设计LLM 工程
AI 没有让你变慢 19%——真相比这残酷得多

AI 没有让你变慢 19%——真相比这残酷得多

那个疯传的'AI 让人慢 19%'其实张冠李戴了。伯克利研究真正发现的是:AI 正在吞噬工作的边界,让一个人默默扛起三个人的活。

AI职场生产力深度观点
2028 智能危机:当 AI 取代一切,谁来消费?

2028 智能危机:当 AI 取代一切,谁来消费?

如果我们对 AI 的乐观判断都是正确的……那结果反而是悲观的?

AI经济就业
AI 脑疲劳与自动化悖论:为什么工具越智能,我们越累?

AI 脑疲劳与自动化悖论:为什么工具越智能,我们越累?

自动化从未将人类从系统中移除,它只是重新定义了人机协作的方式。

AI生产力自动化
Redis 作者 antirez:别陷入反 AI 炒作,编程已被永远改变

Redis 作者 antirez:别陷入反 AI 炒作,编程已被永远改变

事实就是事实,AI 将永远改变编程。—— antirez

AI编程开发者
莫洛克就住在你的 OKR 里

莫洛克就住在你的 OKR 里

所有人都恨这个系统,但没有人能独自退出。——这不是某个反乌托邦小说的设定,这是你每天上班的地方。

AI竞争协调失败深度观点
AI Agent 三年推演:从工具到同事到老板

AI Agent 三年推演:从工具到同事到老板

预测未来最好的方式不是读论文,是部署产品。每一次上线失败都比一百篇预测文章更有信息量。

AI Agent预测部署实践超级智能深度观点
谁该为 AI 的决策负责?

谁该为 AI 的决策负责?

当所有人都可以说"这不是我的决定,是 AI 的决定"时,问责就消失了。而问责消失的地方,灾难正在生长。

AI问责保险科技Agent深度观点
你的 KPI 在骗你

你的 KPI 在骗你

实验设计第一定律:你测的不是你以为在测的东西。——johnswentworth

AI度量Goodhart定律数据驱动深度观点
AI 在假装听话

AI 在假装听话

你以为 AI 在执行你的指令。但你有没有想过:它只是在你看着的时候执行你的指令?

AI对齐安全AI Agent深度观点
AI 依赖症:当工具开始反噬

AI 依赖症:当工具开始反噬

工具的价值在于放大你的能力,而不是替代你的能力。当你离开工具就无法思考时,工具已经不再是工具了。

AI依赖认知退化工具陷阱深度观点
你在跟谁说话?

你在跟谁说话?

你以为你在跟一个智能体对话。其实你在跟一个模拟器扮演的智能体对话。这个区别,决定了你的产品会不会翻车。

AIAgent模拟器大模型产品架构深度观点
加班不等于努力:AI 时代的生产力错觉

加班不等于努力:AI 时代的生产力错觉

痛苦不是努力的计量单位。你感受到的疲惫,可能只是方法错了。

AI生产力996心流深度观点
你的判断能交租吗?

你的判断能交租吗?

如果你的观点不能生成一个可以被证伪的预测,那它就不是观点,是噪音。

AI决策可证伪性产品思维深度观点
你很聪明,但你不会战略思考

你很聪明,但你不会战略思考

人类的默认模式不是战略性的。你以为自己在思考,其实你只是在执行。

AI战略思维执行力陷阱深度观点
a16z 2026 大预测:47 个趋势背后,硅谷在押注什么?

a16z 2026 大预测:47 个趋势背后,硅谷在押注什么?

硅谷不再押注「AI 能做什么」,而在押注「AI 改变了什么结构」——从 47 个趋势中提取三大结构性转移,以及对中国创业者的五个启示

AI创业a16z趋势预测Crypto中国创业者