2026-06-29 04:19 UTC+8站内改写4 分钟阅读更新: 2026-06-29 04:22 UTC+8

2026年AI思考的演变

一篇反思2026年AI现状的文章，平衡了积极方面（如更好的工具和代码可塑性）与消极方面（增加的心理负担、虚假信息不对称以及工程师的士气低落）。

来源Hacker News AI作者: goostavos

2026年AI思考的演变

一切看起来不同，却又相同。2026年，AI给人的感觉不再是“奇点”，而更像是一匹“更快的马”。是的，它确实具有革命性，让人们能够做到以前无法想象的事情，但除了输出速度之外，真正改变了什么？构建和维护系统的一切困难似乎依旧如故。

但事物变化很快。我去年的一些观点已经过时了。以下是一些可能很快就会过时的观点。

好的方面

工具化 这是我最为喜爱的方面。用木工术语来说，现在制作“夹具”变得经济实惠。这些夹具只适用于你的特定设置，很少值得推广，常常是一次性使用。在AI出现之前，工具制作是一项投资，你必须证明花费时间的合理性，因此它们通常必须具有广泛的“用途”。那些宝贵的时间总是与“交付功能”之类的目标冲突，最终工具制作总是败下阵来。而现在，你可以随时随地按需制作它们。就原始生产力的提升而言，这无疑是最大的赢家。

代码更具可塑性 大型重构可以更有信心地完成。过去需要几个小时的工作现在可以在几分钟内完成。编写好代码比以往任何时候都更容易。

我找到了一种开发风格：手动开始修改，然后交给Claude完成繁琐的后续工作，比如将修改应用到整个代码库。我知道有些人不再手写代码，但这对我来说并不奏效。我花大量时间在大型/plan对话中解释我的需求，结果反而比我自己进行修改，然后指着代码说“像这样做，但应用到所有地方”更慢。

目前我仍然完全手动完成的一个领域是测试。Claude了解基于属性的测试库的所有API，但它很难理解如何正确使用它们。尽管我们的代码库中有大量例子可以参考，但它仍然会做出一些愚蠢的行为，导致我最终只能自己动手。糟糕的测试套件可以毁掉一个好的代码库。必须时刻保持警惕，现在比以往任何时候都更需要。

此外，好的基于属性的测试往往出奇的短小。生成大量测试代码通常是思考不足的表现。

减轻琐碎工作 软件开发中有大量乏味、无趣的琐碎工作。将这些工作外包给AI非常棒。

CDK？那个总是搞砸我生活的巨大垃圾堆？现在那是Claude的问题了。我的小帮手会自动为我更新个人栈。如果不是担心成为又一个让AI破坏生产环境的团队，我会更倾向于让Claude管理所有CDK部署，从而解放自己。但……那一天还很遥远（如果真能实现的话）。

我也喜欢那些小小的生活质量改进。任何代码修改最烦人的部分是最后的忙碌工作：运行格式化工具、解决lint问题、解决构建问题、运行测试等。这以前需要不断监控和频繁重启来处理出现的小问题（比如“哦，不小心留下的打印语句”）。现在？AI可以帮我完成这些，而我则去做其他事情。

AI代码审查突然变得有用 AI代码审查从令人烦躁的噪声变成了有用的工具。这一直是我最热衷的领域。我喜欢类型是有原因的，我喜欢静态分析也是有原因的。我希望有工具能在生命周期早期发现问题。AI代码审查工具已经成为很好的最后一道防线。

但AI代码审查有用并不意味着只能由AI来审查代码（在我看来）。

认真建议这么做的人越来越多（参见下面的“更快”段落）。除了反复发布那两篇相同的文章，我不知道还能做什么。

《作为理论构建的编程》《没有银弹》

我将这与遗留系统联系起来。使遗留项目工作变得困难的原因与代码的具体细节关系不大（虽然代码通常很糟糕），而更多是因为你没有与代码相关的“理论”。服务以其方式运行是因为你接手时它就是这样运行的。当它以不同的方式运行并触发警报时？谁知道呢。这个服务不是“你的”。它的行为方式源于一种你只能通过长时间的归纳来近似理解的哲学。导致其运作模式的无数不可见决策对你来说是不可获取的。

不过，我认为有些团队尝试这样做是好的。也许Peter Naur是个傻瓜，而那个拥有Claude订阅的家伙更懂行。只有时间才能证明。目前，我还需要参与值班，携带寻呼机，当影响客户时被责备。所以，旧习难改。我倾向于认为长期深入参与代码是有价值的。

不好的方面

AI最糟糕的部分是人 越来越多的评论回复是这样的：

“哦，我不知道。Claude这么做的，我没看。”

或者更糟的是，他们让AI来回复评论。

“你反对是对的。我应该巴拉巴拉……”

这在刚毕业的大学生和实习生中尤为普遍。他们甚至会将Slack对话交给Claude。当我意识到一个人类选择仅仅作为Claude的有损接口时，我难以表达我的失望。

门槛降到了地板 开发者以前就不擅长编写测试，但至少他们会写。在过去，他们必须在某种程度上参与到代码中才能让测试通过。现在，人们提交的代码评审充满了“测试”，这些测试他们没看过，而且什么都没做。你可能希望这只是新手的问题，但似乎每个人都接受了这种做法。我在我的团队中对AI生成的垃圾给予了很大的宽容，但测试是唯一一个“我会死在这个山上，而且死得其所”的领域。

心理负担 工作时间充满了噪音。你不断切换上下文，同时处理多个对话。在过去几个月里，我做出的糟糕设计决策数量飙升。任务加载超出了可以有效管理的范围。

虚假信息不对称 需要纠正的错误信息数量令人筋疲力尽。“是的，是的，我知道Claude说那样做可行，但它是错的。”“是的，是的，我知道它给你链接了RFC来‘证明’那样做可行，但实现经常会偏离……” “是的，我可以给你看，但这需要时间……” 这种争论会持续下去，直到你浪费大量时间找到一个反例，而提问者仍然表示怀疑。Claude说他们是对的！为什么不接受他们是对的？！

这个问题使得委托某些类型的任务变得非常困难。那些毫无批判地坐在Claude会话前消费其输出的“温吞身体”可能弊大于利。但这与过去的情况并没有太大不同。有些人是你可以信任去完成模糊任务的，而有些人你只能给他们范围明确的任务（“让Claude）按照这个ticket做”。诀窍在于不要混淆这两组人。

对提高绩效的要求 整个领导层都采纳了一个口号：更快。“用更少做更多。”更多，更多，更多。但“更多”仍然是未定义的。“更快”相对于什么？没有人能真正说清楚。就是“更多”，更快。

这导致了……

士气低落 它从许多人手中偷走了对工艺的热爱。“工程文化”一直只属于少数人。富有热情的人总是少数。现在他们正在溺水。领导层想要“更多”，而且现在就要。那些多年来以稳定的开发速度而受到赞扬的人现在发现自己成了“瓶颈”或“不扩展”或“拖慢他人”。他们目睹着一种以“9个9”为自豪的文化在他们周围瓦解。取而代之的是，他们被告知要习惯“错误纠正”。为了速度牺牲一切。许多人在这个新世界中挣扎。

我们正在按照经济时间表工作。从长远来看，我们会看到谁是对的。但这需要一段令人不安的时间。只有当某人的钱包感受到压力时，才会进行调整。

我发现自己经常想起《升空》这本书，它记录了SpaceX的早期岁月。他们以令人难以置信的速度前进，但也发现迭代速度存在上限，超过这个上限事情就会开始崩溃。目前，感觉我们正在接近这个边缘。但许多人正在超越它。事情和人开始崩溃。

令人鼓舞的方面

尽管网络上关于“技能流失”和没有人会再做什么的抱怨很多，但似乎仍然有许多好奇、有兴趣的人使用AI深入学习新主题。不是以那种互联网上常见的炫耀方式“我提示TLA+，因为我很聪明”，而是以安静、无聊的方式：因为他们觉得有趣。

孩子们会没事的。

（我想）