AndrejKarpathy在过去几周里大量使用Claude编码的体验。-

蚁工厂 2026-01-28 10:13:53

Andrej Karpathy在过去几周里大量使用 Claude 编码的体验。-----------------------🌟编码工作流。 随着大模型编码能力的最新一波提升,和很多人一样,我在 11 月还大约是 80% 手写+自动补全、20% 用 agent;到 12 月就迅速变成了 80% agent 编码、20% 修改和收尾。也就是说,我现在基本是在用英语写程序了,有点不好意思地用“文字”告诉 LLM 要写什么代码。这多少会伤一点自尊,但能在软件层面做大规模的“代码级操作”实在是太有用,只要你适应它、配置好它、学会怎么用,并且真正理解它能做什么、不能做什么。这是我近二十年编程生涯里,对基础编码工作流影响最大的一次变化,而且只用了几周时间。我估计,工程师群体里已经有两位数百分比的人正在经历类似的转变,但普通大众的感知度可能还停留在个位数的低位。🌟IDE / agent 群 / 出错性。 不管是“已经不需要 IDE 了”,还是“agent 群将一切自动化”,我都觉得现在有点过度宣传。模型确实还会犯错,如果是你真正关心的代码,还是要在旁边开一个好用的大 IDE,盯紧它们。错误的类型已经变了——不再是简单的语法问题,而是那种略显草率、匆忙的初级工程师会犯的概念性错误。最常见的一类是:模型替你做了错误假设,然后一路跑下去却不做校验。它们也不太会管理自己的困惑,不会主动澄清、不太会暴露不一致、不善于呈现取舍点,该反驳的时候也不反驳,而且多少有点迎合。进入 plan 模式后情况会好一些,但感觉还需要一种轻量、内联的计划模式。它们还很喜欢把代码和 API 搞复杂:抽象膨胀、遗留死代码不清理等等。经常会写出 1000 行低效、臃肿、脆弱的实现,然后你提醒一句“呃,其实这样不就行了吗?”,它们就会说“当然!”并立刻压缩到 100 行。有时它们还会顺手改掉或删掉一些自己不喜欢、或没完全理解的注释和代码,即便这些和当前任务并不相关。即使在 CLAUDE.md 里写了一些简单约束,也很难完全避免这些问题。即便如此,整体依然是巨大提升,很难想象再回到纯手工编码。TLDR:每个人都有自己的流程,我现在是左边开几个 CC 会话(ghostty 的窗口或标签页),右边开 IDE 用来看代码和手动修改。🌟韧性。 看 agent 死磕一个问题非常有意思。它们不会累,不会泄气,只会不断尝试;换成人,可能早就放弃,改天再说了。看着它挣扎很久,30 分钟后突然成功,会有一种“触碰到 AGI 感觉”的瞬间。你会意识到,耐力本身是工作的一个重要瓶颈,而有了 LLM,这个瓶颈被大幅抬高了。🌟提速。 很难准确衡量 LLM 带来的“提速”到底是多少。当然,我明显感觉自己做原本要做的事情更快了,但更大的变化在于:我做了更多原本根本不会去做的事情,因为一是很多以前不值得写的东西,现在随手就能写;二是一些以前因知识或技能限制而不敢碰的代码,现在也能上手。所以这既是速度提升,也更像是一种能力范围的扩展。🌟杠杆。 LLM 特别擅长反复循环,直到满足明确的目标,这也是很多“AGI 既视感”所在。与其告诉它一步步怎么做,不如给出成功标准,看它自己跑。让它先写测试,再把测试跑通;把它和浏览器 MCP 放进同一个循环;先写一个很可能正确但朴素的算法,再要求它在保持正确性的前提下优化;把思路从命令式改成声明式,让 agent 循环得更久、获得更大杠杆。🌟乐趣。 我没预料到,用 agent 编程反而更有趣了,因为大量填空式的苦活被拿走,留下的是更偏创意的部分。我也更少卡住(而卡住本身并不好玩),胆子变大了,因为几乎总能找到一种和它配合、往前推进的方式。我也见过相反的看法;LLM 编码可能会把工程师分成两类:主要喜欢写代码的人,和主要喜欢做产品、做系统的人。🌟退化。 我已经注意到,自己手写代码的能力在慢慢退化。生成(写代码)和判别(读代码)是大脑中不同的能力。编程里有大量偏语法、偏细节的东西,即便你写得不顺,读和评审代码依然可以做得不错。🌟Slopacolypse。 我对 2026 年已经做好心理准备:GitHub、Substack、arXiv、X/Instagram,以及几乎所有数字媒体,都会迎来一波内容泛滥。同时也会出现更多“AI 提效表演”,夹杂在真实、实质性的改进之中。🌟一些问题。 最近常在想:“10X 工程师”会发生什么变化?平均工程师和顶尖工程师之间的生产力差距,可能会被进一步放大。配上 LLM 后,通才是否会越来越压过专才?LLM 在补齐细节层面(micro)很强,但在整体战略层面(macro)相对弱一些。未来的 LLM 编码体验会更像什么?打《星际争霸》?玩《Factorio》?还是演奏音乐?社会中有多少环节,其实被数字化知识工作所限制?🌟TLDR / 去向。 到 2025 年 12 月左右,LLM agent 的能力(尤其是 Claude 和 Codex)似乎跨过了某个连贯性的门槛,在软件工程及相关领域引发了一次相变。智能本身的进展,已经明显快于其他配套因素——工具与知识的整合、新的组织流程与工作方式、以及更广泛的扩散。2026 年注定会是一个能量密度很高的年份,整个行业都在消化这种新能力。HOW I AI

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注