AndrejKarpathy在过去几周里大量使用Claude编码的体验。-

Andrej Karpathy在过去几周里大量使用 Claude 编码的体验。-----------------------🌟编码工作流。随着大模型编码能力的最新一波提升，和很多人一样，我在 11 月还大约是 80% 手写+自动补全、20% 用 agent；到 12 月就迅速变成了 80% agent 编码、20% 修改和收尾。也就是说，我现在基本是在用英语写程序了，有点不好意思地用“文字”告诉 LLM 要写什么代码。这多少会伤一点自尊，但能在软件层面做大规模的“代码级操作”实在是太有用，只要你适应它、配置好它、学会怎么用，并且真正理解它能做什么、不能做什么。这是我近二十年编程生涯里，对基础编码工作流影响最大的一次变化，而且只用了几周时间。我估计，工程师群体里已经有两位数百分比的人正在经历类似的转变，但普通大众的感知度可能还停留在个位数的低位。🌟IDE / agent 群 / 出错性。不管是“已经不需要 IDE 了”，还是“agent 群将一切自动化”，我都觉得现在有点过度宣传。模型确实还会犯错，如果是你真正关心的代码，还是要在旁边开一个好用的大 IDE，盯紧它们。错误的类型已经变了——不再是简单的语法问题，而是那种略显草率、匆忙的初级工程师会犯的概念性错误。最常见的一类是：模型替你做了错误假设，然后一路跑下去却不做校验。它们也不太会管理自己的困惑，不会主动澄清、不太会暴露不一致、不善于呈现取舍点，该反驳的时候也不反驳，而且多少有点迎合。进入 plan 模式后情况会好一些，但感觉还需要一种轻量、内联的计划模式。它们还很喜欢把代码和 API 搞复杂：抽象膨胀、遗留死代码不清理等等。经常会写出 1000 行低效、臃肿、脆弱的实现，然后你提醒一句“呃，其实这样不就行了吗？”，它们就会说“当然！”并立刻压缩到 100 行。有时它们还会顺手改掉或删掉一些自己不喜欢、或没完全理解的注释和代码，即便这些和当前任务并不相关。即使在 CLAUDE.md 里写了一些简单约束，也很难完全避免这些问题。即便如此，整体依然是巨大提升，很难想象再回到纯手工编码。TLDR：每个人都有自己的流程，我现在是左边开几个 CC 会话（ghostty 的窗口或标签页），右边开 IDE 用来看代码和手动修改。🌟韧性。看 agent 死磕一个问题非常有意思。它们不会累，不会泄气，只会不断尝试；换成人，可能早就放弃，改天再说了。看着它挣扎很久，30 分钟后突然成功，会有一种“触碰到 AGI 感觉”的瞬间。你会意识到，耐力本身是工作的一个重要瓶颈，而有了 LLM，这个瓶颈被大幅抬高了。🌟提速。很难准确衡量 LLM 带来的“提速”到底是多少。当然，我明显感觉自己做原本要做的事情更快了，但更大的变化在于：我做了更多原本根本不会去做的事情，因为一是很多以前不值得写的东西，现在随手就能写；二是一些以前因知识或技能限制而不敢碰的代码，现在也能上手。所以这既是速度提升，也更像是一种能力范围的扩展。🌟杠杆。 LLM 特别擅长反复循环，直到满足明确的目标，这也是很多“AGI 既视感”所在。与其告诉它一步步怎么做，不如给出成功标准，看它自己跑。让它先写测试，再把测试跑通；把它和浏览器 MCP 放进同一个循环；先写一个很可能正确但朴素的算法，再要求它在保持正确性的前提下优化；把思路从命令式改成声明式，让 agent 循环得更久、获得更大杠杆。🌟乐趣。我没预料到，用 agent 编程反而更有趣了，因为大量填空式的苦活被拿走，留下的是更偏创意的部分。我也更少卡住（而卡住本身并不好玩），胆子变大了，因为几乎总能找到一种和它配合、往前推进的方式。我也见过相反的看法；LLM 编码可能会把工程师分成两类：主要喜欢写代码的人，和主要喜欢做产品、做系统的人。🌟退化。我已经注意到，自己手写代码的能力在慢慢退化。生成（写代码）和判别（读代码）是大脑中不同的能力。编程里有大量偏语法、偏细节的东西，即便你写得不顺，读和评审代码依然可以做得不错。🌟Slopacolypse。我对 2026 年已经做好心理准备：GitHub、Substack、arXiv、X/Instagram，以及几乎所有数字媒体，都会迎来一波内容泛滥。同时也会出现更多“AI 提效表演”，夹杂在真实、实质性的改进之中。🌟一些问题。最近常在想：“10X 工程师”会发生什么变化？平均工程师和顶尖工程师之间的生产力差距，可能会被进一步放大。配上 LLM 后，通才是否会越来越压过专才？LLM 在补齐细节层面（micro）很强，但在整体战略层面（macro）相对弱一些。未来的 LLM 编码体验会更像什么？打《星际争霸》？玩《Factorio》？还是演奏音乐？社会中有多少环节，其实被数字化知识工作所限制？🌟TLDR / 去向。到 2025 年 12 月左右，LLM agent 的能力（尤其是 Claude 和 Codex）似乎跨过了某个连贯性的门槛，在软件工程及相关领域引发了一次相变。智能本身的进展，已经明显快于其他配套因素——工具与知识的整合、新的组织流程与工作方式、以及更广泛的扩散。2026 年注定会是一个能量密度很高的年份，整个行业都在消化这种新能力。HOW I AI