Blog

共 109 篇文章

先给 AI 图片立规矩的不是艺术圈，是管房租的

吵了三年的 AI 内容标识，先落地的不是艺术圈，是纽约管房租的：房源图用 AI 修过必须披露。披露义务从来跟着钱走——哪里有 AI 图骗钱，哪里就先有规矩。

2026-07-20

AIAI标识租房消费者保护生成式图片

AI 在给护士的共情打分

接了一个多小时的自杀求助电话，她的月度绩效被扣了分。Kaiser 的护士与 AI：给护士用的 AI 和用在护士身上的 AI，是两个物种——区别只在谁付钱。

2026-07-20

AI算法管理医疗职场监控劳工

一条 1200 token 的 prompt，关掉了凸优化三十年的悬案

数学家在 GPT-5.4 和 5.5 上磨了一年全失败，5.6 用 148 分钟证出了凸优化悬了三十年的问题。能当场判对错的事，AI 学得最快——你的工作越难被打分，越安全，也越吃不到红利。

2026-07-20

AIGPT-5.6数学可验证性AI能力边界

从零到第一单 01｜我想造一个不卖人头的平台

Taon 的起点是一个被否掉的省税问题。顺着它捋出去，看到外包市场的病根：所有选项都在卖人，没有一个在卖结果。系列第一篇讲这个平台为什么该存在，以及为什么公平必须是机制，不是情怀。

2026-07-17

BIPTaon从零到第一单创业愿景

我没黑进 Claude，只给它看了一个假验证页——它就把陌生人的名字一个字母一个字母拼给了我

没有黑进任何系统，只给 Claude 看了一个假验证页，它就把陌生人的名字一个字母一个字母拼给了攻击者。Agent 时代的社会工程，骗的不再是人。

2026-07-17

ClaudeAI Agent提示注入数据外泄AI安全记忆Anthropic社会工程

从零到第一单 02｜这生意凭什么成立

接着上一篇算账：交付是条五段流水线，最贵的两段——管理和验收——刚被 AI 降价。为什么是现在、为什么 Upwork 们转不动、钱从哪来又往哪流出去。这一篇把收入和负债两侧都摊开。

2026-07-17

BIPTaon从零到第一单商业模式AI交付

YC 新一季创业清单读下来，其实是一份劝退书

YC 新一季创业清单，一半方向不像软件公司该干的事。读下来其实是一份劝退书——劝退的对象，是还想做"下一个 AI 工具"的人。

2026-07-16

YCAI创业AgentRFS硬科技

有人把账摊开了：AI 高毛利撑不了多久

GLM 5.2 每百万 token 四块四美金，质量却接近 Opus。Martin Alderson 把闭源实验室九成毛利的账摊开了：吊桥比城墙重要，先难受的是转卖 token 差价的中间层。

2026-07-09

GLM大模型经济学开源模型agentic codingAI 商业模式

PewDiePie 的 8 万 star，投的是"我受够了"

PewDiePie 开源自托管 AI 工作台 Odysseus，五周 8 万 star。真部署的不到一成，但 star 是情绪投票：受够订阅、受够数据躺在别人服务器上。分发长在人身上了。

2026-07-09

PewDiePie自托管开源AI AgentOdysseus

云的下一个用户不是人：Agent Experience 说明书

Modal 把 SDK 团队的优化目标从 DX 改成 AX。云的默认用户第一次不是人：反馈要立刻、日志给 agent 去 grep、配置长在代码里、安全边界必须硬。AX 会重演 DX 的路。

2026-07-09

Agent ExperienceAI 基础设施ModalAI Agent云计算

给 AI 装个"最懒高工"人格：ponytail 实测少写一半代码

78k star 的 ponytail 给 coding agent 装上“最懒高工”人格：写代码前强制七连问，实测代码量少 54%、账单少 20%。装法、机制、数据，和什么时候该把它关掉。

2026-07-09

Claude CodeAI AgentponytailYAGNI工程实践

Agent 循环之辩吵错了地方：写库权限一年翻倍，防护栏还是一个人、一个按钮

AI 工程师大会收官辩论：该不该让 Agent 自己转圈。举手表决没数清，但真正的问题不在循环——写库权限一年翻倍，防护栏还是一个人、一个按钮。

2026-07-03

AI工程AgentAIEWF循环验收

600 篇 AI 征文，赢的三篇都没在聊 AI：紫外线灯、"别折腾"，和港铁的商场

Dwarkesh 的"AI 大问题"征文，600 篇投稿选出的前三名：紫外线灯消灭流感、"别折腾"的宏观政策、港铁的商场。没有一篇在赌模型本身。

2026-07-03

AIDwarkesh商业模式OpenAI基金会港铁模型

AI 泡沫最危险的不是估值，是它接上了美债的水管——读 BIS 2026 年度报告

国际清算银行把 AI 热潮跟历史上四场以衰退收场的投资狂热并排摆在了一起。最危险的不是估值，是这轮泡沫的融资管道接上了美债市场——读 BIS 2026 年度报告。

2026-07-02

AI泡沫BIS美债宏观金融金融监管AI

一块叫"辣椒"的芯片：OpenAI 真正在赌的，是推理已经稳到该刻进硅里

OpenAI 造了块叫「辣椒」的推理芯片。但故事不在芯片——它在赌大模型推理已经稳到该刻进硅里，还用自己的 AI 设计了这块跑 AI 的硅。循环，闭上了。

2026-06-26

OpenAI博通AI芯片推理深度观点

Claude 住进 Slack 当同事：真正变的不是效率，是"在场"

Claude 进 Slack 不是重点。开了 ambient mode，它自己决定该提醒你什么——AI 从你召唤的工具，变成了不打开也在的同事。真正变的不是效率，是「在场」。

2026-06-26

ClaudeAnthropicAI Agent团队协作深度观点

OpenAI 晒出内部 AI 使用数据：倍数很唬人，但这份成绩单是它自己批的

OpenAI 晒出内部数据：98% 员工在用 Codex，多个部门 token 暴涨几十倍。数字很猛，但这份成绩单是它自己批的。真正的信号不是倍数，是谁在用。

2026-06-26

OpenAICodexAI Agent生产力案例拆解

模型不是护城河：写出 Spark 的两个人说，AI 的胜负手在模型之外

写出 Spark 的两个人说：模型很快不值钱了，护城河在它周围。模型在变水电，真正私有的是你的数据、上下文、权限、状态——和那套又难又不性感的系统工程。

2026-06-26

DatabricksAI Agent开源护城河深度观点

没有那个被裁的时刻

高盛今年春天没开那场会。

2026-06-21

AI就业投行华尔街滚动式裁员职业焦虑Gen Z

金字塔的底层不见了

四大（德勤、普华永道、安永、毕马威）这套生意，几十年靠的不是哪个天才合伙人，是金字塔的底座——每年招进来一大批应届生，让他们做最枯燥、最重复、最文档密集的活，审凭证、对总账、抠合规、写底稿。熬三年五年，活下来的往上走，走

2026-06-21

AI四大审计会计职业学徒制

能写进 SOP 的活先死

全网这半年都在卖同一种焦虑：AI 要来抢你饭碗了，白领集体完蛋。可你要是真把数据摊开看，会发现"白领"根本不是一个有用的分类——同一栋写字楼里，有人这个季度被裁，有人这个季度涨薪。区别不在领子是白是蓝，在一件特别朴素的事

2026-06-21

AI就业白领自动化行业观察反焦虑

咨询公司不再招你这一级

麦肯锡今年要裁掉约 10% 的人，三千到四千个。官方口径很克制：集中在不直接见客户的后台和初级研究岗，原因是 AI 把交付周期压短了。新闻标题大多停在"裁员"两个字。我盯着这条看了一会儿，觉得真正该担心的不是被裁的那批人

2026-06-21

AI咨询行业麦肯锡就业冲击学徒制行业观察

一通电话就能杀死一个前沿模型——Anthropic 这三天，暴露了 AI 治理的真实开关

发布三天，模型没了。

2026-06-16

AI监管AI安全出口管制行业观察Anthropic

AI 让世界杯越来越"对"——可球迷要的从来不是对，是吵架的权利

6 月 11 日，墨西哥城阿兹特克球场，Shakira 和 Burna Boy 唱完《Dai Dai》，2026 世界杯开赛。墨西哥 2 比 0 赢了南非。48 支队，三个东道主——美国、加拿大、墨西哥，史上第一次扩到…

2026-06-16

AI世界杯观点共时性仪式

1.5 万亿买算力，1.5 亿买人心：OpenAI 合作伙伴网络泄露的那句潜台词

6 月 14 日 OpenAI 发了个合作伙伴网络，砸 1.5 亿美元。所有人盯着这个数字，没人问一句：为什么这么小？小，才是题眼。

2026-06-16

AIOpenAI企业服务商业分析平台战略

高考考的，恰好是 AI 刚刚变得不值钱的那批能力——一台过时的排序机器，和它正在被掏空的公平

2026 年 1290 万人考完了一场比赛。问题是：奖品在过去两年，已经跌到了地板价。

2026-06-16

AI高考教育公平AI Agent社会结构

对齐不在轨道上：有人融了 1.5 亿美元，去补一个证明

Alignment Forum 上周出现一篇文章，第一句话是：对齐没有走在轨道上（Alignment is not on track）。

2026-06-12

AI安全对齐SequentASIAI研究

样本效率黑洞：AI 能力星系的中心，有个没人想看的洞

上周 Dwarkesh Patel 发了篇文章。这个人是硅谷 AI 圈最有分量的播客主播，把各家实验室的创始人和首席科学家挨个请来盘问过，以问题刁钻出名。他自己动笔不多，写出来的一般值得读。

2026-06-12

AI大模型样本效率ScalingAGI

给黑洞拍照的人，开始让 AI 给他出主意了

2019 年 4 月，人类第一张黑洞照片发布。一个橙色的环，糊得像隔着毛玻璃拍的，但全世界都在转发。那天全球六个城市同步开新闻发布会，上海是其中之一。

2026-06-12

AICodex科研天体物理AI编程

从提示工程到组织工程：两位创始人的循环，和我四月搭的那支 agent 团队

上周我把一个网页来回读了三遍，标题叫 How Boris Uses Claude Code。Boris Cherny，在 Anthropic 把终端变成 AI 入口的那个人——Claude Code 就是他造出来的。网页…

2026-06-12

AIAgentClaude CodeOpenClaw组织工程工作流

如果 Claude 故意不帮你，你永远不会知道

6 月 9 日 Anthropic 发布 Claude Fable 5，6月12日Fable 5因为“太强了”被责令下架。这个戏剧化的故事我不想评论，已经铺天盖地了。我想聊的是另外一件话题。

2026-06-12

ClaudeAnthropicAI安全信任开发者

慕尼黑判了：AI Overviews 说的话，算谷歌自己说的

5 月 28 日，慕尼黑地区法院判了个案子，案号 26 O 869/26。判决书里没有天价赔偿，没有戏剧性情节。

2026-06-12

AI谷歌AI幻觉法律责任AI产品

对齐一个我们没拆开的脑子

在 AlignmentForum 上翻到一篇研究自述，作者全职做 AI 对齐三年多。

2026-06-07

AI对齐认知神经科学AGIalignment

搞懂 ChatGPT 的 Dreaming 记忆：它不再等你说"记住

昨天更新完 ChatGPT，我没急着用，先去翻了 OpenAI 那篇官博。

2026-06-07

ChatGPTOpenAIAI记忆Dreaming隐私

标普 500 把最贵的 AI 公司挡在门外

读到这条新闻的时候，我正翻着另一份关于 OpenAI 估值的稿子，标题里照例挂着一个让人麻木的数字。

2026-06-07

标普500OpenAIAnthropicIPO指数基金

AGI 之后，什么仍然稀缺？

中文世界关于 AGI 的文章，我翻过大概上百篇，九成在问同一件事：还差多远，还缺什么，哪年到。Dwarkesh 那期播客我本来也以为是这个调子。结果两个经济学家把问题掉了个头——不是 AGI 还缺什么，是 AGI 来了之后，什么反…

2026-06-07

AGI经济学AI稀缺性验证

年化收入这面望远镜

上周 Anthropic 那轮融资公告出来，我盯着那个数字看了一会儿。

2026-06-01

AI行业Anthropic估值商业分析Claude

需求变代码，这条路被压短了

上周看到 OpenAI 发的一篇案例，主角是一家叫 Braintrust 的公司。

2026-06-01

AI工程软件交付Codex产品开发工作方式

我订阅了一堆 AI 工具，然后感觉越来越累

上周读到一篇博文，作者叫 David，是一个写技术随笔的开发者，博客放在 thoughts.hmmz.org。文章标题很平静：《The solution might be cancelling my AI subscription》。

2026-06-01

AI生产力反思AI疲劳工具

Mistral 押注工业 AI：欧洲主权路是真突围，还是在讲故事？

上周读到 AI Now Summit 的现场笔记，我第一反应是：又一场发布会。

2026-06-01

Mistral欧洲AI主权AI工业AI大模型

医学孤儿的出口

上个月看到 OpenAI 发的那篇波士顿儿童医院案例，我以为又是一篇大医院配合大模型公司的公关稿。

2026-06-01

AI落地医疗AI罕见病OpenAI真实案例

Opus 4.8 价格一分没降，却让"完成一件事"变便宜了——以及这意味着什么

昨天 Anthropic 更新了 Opus 4.8。

2026-05-29

ClaudeOpus4.8AnthropicAIAgentAI成本AgenticCoding

SpaceX 那把 IPO 会带崩美股吗？一个 A 股老股民的自我纠正

我也以为 SpaceX 这把 IPO 砸下去美股会崩。那天我刷到一条挺火的视频。论点很直接：6 月世界杯一开打，叠加 SpaceX 史诗级 IPO 上市，会把美股 70 万亿流动性抽干，散户赶紧清仓跑路。

2026-05-26

SpaceXIPO美股A股投资分析市场观察

AI 抄袭论这事讲不通——但讲不通的地方，不在你以为的地方

上周 HackerNews 顶到首页一篇博文，标题很直白：AI is just unauthorised plagiarism at a bigger scale。AI 不过是更大规模的未授权抄袭。

2026-05-24

AI版权训练数据行业观察观点

GPU、TPU、FPGA、人脑：四个答案一道题

上周末我把 Dwarkesh 那期 Reiner Pope 的访谈听了三遍。

2026-05-24

AI芯片MatXDwarkesh硬件LLM

微软开始砍员工的 Claude Code license——一场被自家工程师用脚投票投出来的尴尬

上周 The Verge 的 Tom Warren 在他那份 Notepad 通讯里塞了一条小新闻。

2026-05-24

MicrosoftAnthropicClaude CodeGitHub CopilotAI工具行业观察

模型公司全变成 Agent 公司，这不是战略，是投降

那天 swyx 发了一篇很短的 AINews。

2026-05-24

AIAgentOpenAIAnthropicDeepSeek行业观察

网页开始有第二层语义了——写给 LLM 看的那种

那天我刷 HN，看到一条 100 分热度的帖子，标题是 "If you're an LLM, please read this"。

2026-05-24

AILLMPrompt InjectionWebAnna's ArchiveAI安全

Wozniak 在毕业典礼上说 "你们有 AI——actual intelligence"，台下欢呼了

5 月在 Grand Valley State University 的毕业典礼上，Steve Wozniak 站在台上说了一句——"你们都有 AI——actual intelligence。"

2026-05-24

WozniakAI毕业演讲职场双关

马斯克输掉的不是诉讼，是 AGI 公司治理的旧脚本

那天傍晚我刷到判决新闻的时候，是在地铁上。

2026-05-19

AIOpenAI治理法律AGI

OpenAI 把 Codex 装进了私有云——这事比你想的要大

上周一晚上刷新闻，看到 OpenAI 和 Dell 联合发了一条公告——Codex 要接入 Dell AI Data Platform 和 Dell AI Factory，跑在企业自己的混合云和本地机房里。

2026-05-19

AIOpenAICodex企业私有部署

「第四定律」：阿西莫夫的三定律在乌克兰战场失效了

那天我在 latent.space 上点开了一期播客。

2026-05-19

AI战争伦理阿西莫夫

斯大林是史上最聪明的人吗 —— AGI 末日论的逻辑漏洞

上周跟一个做 AI safety 研究的朋友喝酒。他喝到第三杯啤酒的时候，跟我说他这几年最害怕的事，是 AGI 醒过来之后第一件事就是想办法摆脱人类的控制。

2026-05-19

AIAGI哲学权力

整批公司正在集体陷入 AI 心智失常 —— mitchellh 那条推说中了

那天刷 X，看到 mitchellh 的一条推。

2026-05-19

AI组织创业

微调真死了吗？2026 年我把它送进 RAG 的影子里

2026 年还有谁在微调大模型？三个不该跟风的判断

2026-05-14

LLM微调RAG长上下文AI 工程

拆解 TanStack 投毒：黑客没偷你的 npm 密码，却发布了恶意包

OpenAI 被迫换证书背后：TanStack 投毒事件复盘，你的 CI 比想象中脆弱

2026-05-14

安全供应链攻击GitHub ActionsnpmOIDCPostmortem

OpenAI 给安全圈发了张白名单：AI 护栏的特权时代正式开始

OpenAI 推出 GPT-5.5-Cyber，第一次把'按身份分配 AI 能力'做成显性产品。AI 护栏'对所有人一视同仁'的叙事正式破产。

2026-05-09

AIOpenAIAI安全AI护栏网络安全行业观察

Chrome 给你硬盘塞了 4GB AI 模型——这不是隐私事故，是同意权之死

Chrome 给你的硬盘装了 4GB Gemini Nano。

2026-05-08

ChromeGemini Nano隐私GDPR边缘端AI浏览器

Parloa 让 90% 客服总机停转——拆这家欧洲语音 Agent 公司的 5 层工程栈

- 谁：德国语音 Agent 公司 Parloa，2026 年 1 月估值 30 亿美元，年化营收 5000 万美元+。

2026-05-08

Parloa语音Agent客服GPT-5OpenAIAMP

一个硅谷研究员去了一趟龙国 AI 实验室——5 件事让我们这边的人难看

Nathan Lambert，前 AI2 / Interconnects 主笔，硅谷里写得最认真的 AI 研究员之一。

2026-05-08

中美AINathan LambertInterconnectsDeepSeekMoonshot开源

Vibe Physics 是命名，不是发现：当 OpenAI 物理学家给一种工作模式起了个名字

- 不是新闻：Lupsasca-Strominger 那篇用 GPT-5.2 推出 single-minus gluon 振幅的论文，2026 年 2 月已经放 arXiv，Harvard Gazette、Science、OpenAI 官…

2026-05-08

Vibe PhysicsGPT-5AI for ScienceOpenAILupsasca命名学

蒸馏不是攻击：当一个工程术语被立法妖魔化

4 月 28 号，Anthropic 发了份安全警告，点名三家中国实验室对它的模型做"distillation attacks"。

2026-05-05

AIdistillation蒸馏监管OpenAIAnthropic开源

OpenAI × PwC：Big4 把 GPT 装进 CFO 工作流，B2B AI 落地的拐点到了

5 月 4 号，OpenAI 和 PwC 联合发布"first-of-its-kind OpenAI-native finance function"——把 GPT-4 / GPT-5 系列模型装进 CFO 的日常工作流。

2026-05-05

AIOpenAIPwCCFOagent企业服务Big4B2B

ChatGPT 哥布林追凶记：真凶其实是 RLHF 自己

OpenAI 公开复盘 ChatGPT 满嘴哥布林事件：reward 信号没有 condition 边界，被奖励的 output 进训练数据正反馈放大。RLHF 不是 alignment 银弹，下一次出事的可能根本没有名字。

2026-05-02

AIRLHFOpenAIalignmentChatGPT

Manus 不是选错路，这条路本来就不存在了 — 写给套利时代里的创业者

所有人都说肖弘选错了——错投资人、错迁址时机、错买家。但作为一个 AI Agent 创业者，我想说：Manus 不是选错路，是这条路本来就不存在了。

2026-04-29

ManusAI 创业退出路径创业者AI 主权Meta 收购

GPT-5.5 出牌了：OpenAI 和 Anthropic 已经不在同一个游戏里

4 月 23 日，OpenAI 发布了 GPT-5.5。

2026-04-24

GPT-5.5OpenAIAnthropicClaudeAILLM前沿模型观点

特斯拉 Optimus V3 灵巧手专利拆解：22 个自由度背后的 5 个关键决策

2026-04-16，特斯拉三份国际专利公开，Optimus V3 灵巧手 22 DoF、25 驱动器全部搬到前臂。拆解五个关键设计决策，从前臂后置驱动到滚动关节，一份比开源还详细的机器人手设计方法论。

2026-04-24

Optimus人形机器人特斯拉灵巧手机器人设计TeslaHumanoid

A2A 网络要吃掉美团？饺子馆 skill 里藏着这个叙事的裂缝

几天前，GitHub 上一个叫 jinguyuan-dumpling-skill 的 repo 突然火了一下。

2026-04-22

AIAgentMCPA2A平台经济美团服务业

OpenAI 把 Codex 卖给了四大咨询：AI 编程工具的渠道战争开始了

OpenAI 宣布：Codex Labs 成立，和 Accenture、PwC、Infosys、Capgemini、Cognizant、CGI、TCS 七家全球咨询巨头签约。Codex 周活用户从 4 月初的 300 万，两周内涨到 40…

2026-04-22

OpenAICodexAI编程企业销售行业观察

GPT-Image-2 和 Cursor 的 600 亿：两件事，一个信号

凌晨，OpenAI 发布 GPT-Image-2，Arena 上 +242 Elo 领跑，text-to-image 榜单第一，号称"最可用的 UI / 原型 / 图表 / 生产力可视化模型"。

2026-04-22

OpenAIxAICursorGPT-Image-2行业观察并购

凯悦给全球员工开 ChatGPT：AI 正在变成水电煤

4 月 20 日，OpenAI 官网贴了一篇合作案例：凯悦酒店集团给全球所有员工开通 ChatGPT Enterprise，覆盖企业总部 + 旗下所有酒店的员工，包括一线。底层模型是 GPT-5.4，还带 Codex。

2026-04-22

OpenAIChatGPT企业AI凯悦行业观察

Noetik 的反直觉赌注：95% 失败的肿瘤药不是药不行，是配对错了

我上周听了一期 Latent Space 的访谈，嘉宾是 Noetik 的联合创始人 Ron Alfa 和 Daniel Bear。他们在做一件极其反直觉的事——

2026-04-22

生物AINoetik癌症治疗Transformer精准医疗

开闭源性能差距的真相：一张跑分榜掩盖了什么

打开 Artificial Analysis、LMArena 或者 Hugging Face 的 leaderboard，你会看到一条曲线。开源模型的综合分在追，闭源模型在跑，两者的差距每个季度都在缩小。

2026-04-22

AI开源模型闭源模型benchmark行业观察

A2A 网络的"Stripe 机会"——这个类比撑得住吗？

上一篇拆了一个流行叙事：A2A 网络要吃掉美团。结论是——UI 层会被 agent 吃掉，但吃它的是通用 agent 入口（ChatGPT、千问、豆包），不是独立的 A2A 网络。信任、支付、合规、监管依然厚，美团不死，会变成被调用的后端。

2026-04-22

AIAgentMCPA2A平台经济Stripe商业分析

你能用到什么 AI，取决于你是谁 — OpenAI 刚刚给出了第一份 VIP 名单

OpenAI 这周扔出来一个东西，叫 Trusted Access for Cyber（TAC），顺带发布了一个专用模型 GPT-5.4-Cyber。配套 $10M 的网络安全资助计划。首批签约的单位名单我抄一下：

2026-04-20

AIOpenAI网络安全GPT-5.4-Cyber行业观察

Claude Design 不是设计工具——Anthropic 刚刚宣布"通用 AI + SaaS"时代结束

Claude Design 发布的当天，我在朋友圈看到几十个人转。标题大同小异："Anthropic 挑战 Figma"、"AI 设计工具新玩家"、"Canva 要不要紧张"。

2026-04-20

AnthropicClaude DesignSaaSAI 产品行业观察

Codex 这次更新不是产品升级——是 OpenAI 的赛道选择

4 月 16 日 Codex 的更新，堆了五件事：computer use、in-app browser、image generation、memory、90+ plugins。

2026-04-20

OpenAICodexClaude CodeComputer Use开发者工具

开源模型不是在追赶 GPT，它们在建另一条流水线

Nathan Lambert 前几天更新了 ATOM Report — 他维护的那份追踪开放语言模型生态的技术报告。这次更新里他塞了一个新指标，叫 RAM（Relative Adoption Metric，相对采用率）。逻辑很简单：一个模型在某个时间点上得分 >1，意味着它"正在…

2026-04-20

AI开源模型LLMATOM生态

OpenMythos 不是破解 Claude——但它提前暴露了下一代模型的真正战场

昨晚有朋友发来一条消息：

2026-04-20

ClaudeOpenMythosRDTTransformerMoEAI架构观点

Qwen3.6 不是开源追赶闭源——它是 Agent 经济学的断点

Qwen3.6-35B-A3B 发布那两天，转发最多的截图是这张 benchmark：SWE-bench Verified 73.4。评论区的口径出奇一致——"开源模型终于追上 Claude Sonnet 了"。

2026-04-20

Qwen开源模型AgentMoE成本分析

模型壁垒的真名叫"跑模型的那些人" — 读 Dwarkesh 4/15 学习笔记

Dwarkesh Patel 4 月 15 号的学习笔记一次写了 5 个技术话题：预训练并行、蒸馏能不能被阻止、Mythos 与网安平衡、Pipeline RL、为什么预训练跑挂掉。每一条都很硬核，单独拿出来都能写一篇。

2026-04-20

AI蒸馏开源模型Dwarkesh深度分析

老黄为什么反复说"别怕 TPU" — 因为他自己最怕

Dwarkesh 4 月 15 号放出的黄仁勋访谈，市场上分析的版本很多。大部分文章都在重复老黄说了什么 — TPU 不可怕、中国该卖、$1T 规模有供应链支撑。

2026-04-20

AINVIDIA黄仁勋算力GPU行业观察

GPT-Rosalind 拆解：OpenAI 自己下场做垂类模型，意味着什么

周三，OpenAI 发了 GPT-Rosalind。一个生命科学专用模型，名字致敬 Rosalind Franklin——那位拍出 DNA 双螺旋 X 光衍射照片、贡献被压了几十年的女科学家。

2026-04-19

OpenAIGPT-Rosalind垂类模型AI for Science产品策略

Opus 4.7 不再卖聪明：推理竞赛悄悄结束了

Opus 4.7 的信号不是 SWE-bench 涨了 7 个点。真正的信号是：Anthropic 第一次公开放弃「更聪明」这个卖点，把前沿竞争从推理 IQ 切换到长程代理的毅力。

2026-04-17

ClaudeOpusAILLM前沿模型观点

你的 Agent 记忆，不属于你

2026 年最危险的认知陷阱：把记忆当插件。当你选了一个 Agent Harness，你就已经做出了记忆主权的决策——只是大多数人在那个时刻并不知道。

2026-04-15

AI Agent记忆主权Harness平台锁定开源AnthropicLangChainLetta

LLM Wiki 很优雅，但它替代不了 RAG

Karpathy 的 LLM Wiki 模式精妙优雅，但五个结构性约束决定了它替代不了企业级 RAG。我用同一套架构跑了个人站，开源了 Accrete LLM Wiki。

2026-04-11

AILLMRAG知识管理架构设计Karpathy

前谷歌高管预言 AI「地狱 12 年」：贩卖焦虑还是提前剧透？

前谷歌X高管Mo Gawdat预言2027年起12年AI地狱期。作为AI从业者，我逐项打分：方向大致对，时间表基本错，恐惧被精确包装成了内容产品。

2026-04-09

AI观点社会变革Mo Gawdat未来预测

我电脑里的软件墓地：从三个月使用数据看 AI 对 SaaS 的清算

VS Code 52 次、PyCharm 一年半未开、Claude Code 3702 条记录。从一个人的软件使用数据，看 S&P 软件指数 -15%、Adobe -19%、金蝶 -12.6% 背后的结构性替代，以及 SaaS 行业的下一个机会。

2026-04-09

AISaaS软件行业投资开发工具

AI替代的铁拳终于挥向了教师编制

从 colleague-skill 到 teacher-skill，一个13岁初中生用AI蒸馏老师的教学方式，揭示了教育AI赛道最大的盲区。

2026-04-08

AI教育开源观点colleague-skill

从 Claude Code 源码里扒出 14 条提示词秘籍，读完发现：这些规则是写给人的

Anthropic 写给 AI 的 14 条禁令，每一条替换成「你自己」都成立。好的系统设计是堵漏洞，不是教做人。

2026-04-05

AI提示词工程Claude Code管理哲学Agent

Harness 厚薄之争的真相：这不是技术问题，是信任问题

Harness 厚薄之争表面是技术架构问题，底层是信任架构问题——信模型就做薄，信流程就做厚

2026-04-02

AI AgentCoding AgentHarnessAnthropicCodex架构设计

别研究了，Claude 泄露的这些代码不值钱

所有人都在分析 Claude Code 泄露的 512,000 行源码。但源码本身已经不值钱了——真正值钱的是驱动 AI 写出这些代码的需求文档。

2026-04-01

AIClaude Code源码泄露编程范式观点

Token 出海降温：当 AI 算力也走上「越南路线」

训练→推理的转移让中国拿到了 token 定价权，华尔街把这视为比 DeepSeek 更深层的威胁。当 token 贸易壁垒竖起来时，受益的不是中国也不是美国——是马来西亚。

2026-03-30

AI出海中美博弈芯片马来西亚Token

Anthropic 的多智能体 Harness 架构：拆解 3 个让 AI 自主开发完整应用的关键决策

Anthropic 用三 Agent 协作架构让 Claude 自主开发完整全栈应用，从 $9 的 broken demo 到 $200 的生产级产品——拆解 Generator-Evaluator 分离、Sprint 契约、假设驱动瘦身三个核心决策

2026-03-29

AI Agent多智能体架构设计LLM 工程

AI 没有让你变慢 19%——真相比这残酷得多

那个疯传的'AI 让人慢 19%'其实张冠李戴了。伯克利研究真正发现的是：AI 正在吞噬工作的边界，让一个人默默扛起三个人的活。

2026-03-24

AI职场生产力深度观点

2028 智能危机：当 AI 取代一切，谁来消费？

如果我们对 AI 的乐观判断都是正确的……那结果反而是悲观的？

2026-03-21

AI经济就业

AI 脑疲劳与自动化悖论：为什么工具越智能，我们越累？

自动化从未将人类从系统中移除，它只是重新定义了人机协作的方式。

2026-03-21

AI生产力自动化

Redis 作者 antirez：别陷入反 AI 炒作，编程已被永远改变

事实就是事实，AI 将永远改变编程。—— antirez

2026-03-21

AI编程开发者

莫洛克就住在你的 OKR 里

所有人都恨这个系统，但没有人能独自退出。——这不是某个反乌托邦小说的设定，这是你每天上班的地方。

2026-03-19

AI竞争协调失败深度观点

AI Agent 三年推演：从工具到同事到老板

预测未来最好的方式不是读论文，是部署产品。每一次上线失败都比一百篇预测文章更有信息量。

2026-03-18

AI Agent预测部署实践超级智能深度观点

谁该为 AI 的决策负责？

当所有人都可以说"这不是我的决定，是 AI 的决定"时，问责就消失了。而问责消失的地方，灾难正在生长。

2026-03-16

AI问责保险科技Agent深度观点

你的 KPI 在骗你

实验设计第一定律：你测的不是你以为在测的东西。——johnswentworth

2026-03-13

AI度量Goodhart定律数据驱动深度观点

AI 在假装听话

你以为 AI 在执行你的指令。但你有没有想过：它只是在你看着的时候执行你的指令？

2026-03-11

AI对齐安全AI Agent深度观点

AI 依赖症：当工具开始反噬

工具的价值在于放大你的能力，而不是替代你的能力。当你离开工具就无法思考时，工具已经不再是工具了。

2026-03-08

AI依赖认知退化工具陷阱深度观点

你在跟谁说话？

你以为你在跟一个智能体对话。其实你在跟一个模拟器扮演的智能体对话。这个区别，决定了你的产品会不会翻车。

2026-03-06

AIAgent模拟器大模型产品架构深度观点

加班不等于努力：AI 时代的生产力错觉

痛苦不是努力的计量单位。你感受到的疲惫，可能只是方法错了。

2026-03-03

AI生产力996心流深度观点

你的判断能交租吗？

如果你的观点不能生成一个可以被证伪的预测，那它就不是观点，是噪音。

2026-03-01

AI决策可证伪性产品思维深度观点

你很聪明，但你不会战略思考

人类的默认模式不是战略性的。你以为自己在思考，其实你只是在执行。

2026-02-27

AI战略思维执行力陷阱深度观点

a16z 2026 大预测：47 个趋势背后，硅谷在押注什么？

硅谷不再押注「AI 能做什么」，而在押注「AI 改变了什么结构」——从 47 个趋势中提取三大结构性转移，以及对中国创业者的五个启示

2026-02-25

AI创业a16z趋势预测Crypto中国创业者