2026年AI思考的演变
一篇反思2026年AI现状的文章,平衡了积极方面(如更好的工具和代码可塑性)与消极方面(增加的心理负担、虚假信息不对称以及工程师的士气低落)。
2026年AI思考的演变
一切看起来不同,却又相同。2026年,AI给人的感觉不再是“奇点”,而更像是一匹“更快的马”。是的,它确实具有革命性,让人们能够做到以前无法想象的事情,但除了输出速度之外,真正改变了什么?构建和维护系统的一切困难似乎依旧如故。
但事物变化很快。我去年的一些观点已经过时了。以下是一些可能很快就会过时的观点。
好的方面
工具化 这是我最为喜爱的方面。用木工术语来说,现在制作“夹具”变得经济实惠。这些夹具只适用于你的特定设置,很少值得推广,常常是一次性使用。在AI出现之前,工具制作是一项投资,你必须证明花费时间的合理性,因此它们通常必须具有广泛的“用途”。那些宝贵的时间总是与“交付功能”之类的目标冲突,最终工具制作总是败下阵来。而现在,你可以随时随地按需制作它们。就原始生产力的提升而言,这无疑是最大的赢家。
代码更具可塑性 大型重构可以更有信心地完成。过去需要几个小时的工作现在可以在几分钟内完成。编写好代码比以往任何时候都更容易。
我找到了一种开发风格:手动开始修改,然后交给Claude完成繁琐的后续工作,比如将修改应用到整个代码库。我知道有些人不再手写代码,但这对我来说并不奏效。我花大量时间在大型/plan对话中解释我的需求,结果反而比我自己进行修改,然后指着代码说“像这样做,但应用到所有地方”更慢。
目前我仍然完全手动完成的一个领域是测试。Claude了解基于属性的测试库的所有API,但它很难理解如何正确使用它们。尽管我们的代码库中有大量例子可以参考,但它仍然会做出一些愚蠢的行为,导致我最终只能自己动手。糟糕的测试套件可以毁掉一个好的代码库。必须时刻保持警惕,现在比以往任何时候都更需要。
此外,好的基于属性的测试往往出奇的短小。生成大量测试代码通常是思考不足的表现。
减轻琐碎工作 软件开发中有大量乏味、无趣的琐碎工作。将这些工作外包给AI非常棒。
CDK?那个总是搞砸我生活的巨大垃圾堆?现在那是Claude的问题了。我的小帮手会自动为我更新个人栈。如果不是担心成为又一个让AI破坏生产环境的团队,我会更倾向于让Claude管理所有CDK部署,从而解放自己。但……那一天还很遥远(如果真能实现的话)。
我也喜欢那些小小的生活质量改进。任何代码修改最烦人的部分是最后的忙碌工作:运行格式化工具、解决lint问题、解决构建问题、运行测试等。这以前需要不断监控和频繁重启来处理出现的小问题(比如“哦,不小心留下的打印语句”)。现在?AI可以帮我完成这些,而我则去做其他事情。
AI代码审查突然变得有用 AI代码审查从令人烦躁的噪声变成了有用的工具。这一直是我最热衷的领域。我喜欢类型是有原因的,我喜欢静态分析也是有原因的。我希望有工具能在生命周期早期发现问题。AI代码审查工具已经成为很好的最后一道防线。
但AI代码审查有用并不意味着只能由AI来审查代码(在我看来)。
认真建议这么做的人越来越多(参见下面的“更快”段落)。除了反复发布那两篇相同的文章,我不知道还能做什么。
《作为理论构建的编程》 《没有银弹》
我将这与遗留系统联系起来。使遗留项目工作变得困难的原因与代码的具体细节关系不大(虽然代码通常很糟糕),而更多是因为你没有与代码相关的“理论”。服务以其方式运行是因为你接手时它就是这样运行的。当它以不同的方式运行并触发警报时?谁知道呢。这个服务不是“你的”。它的行为方式源于一种你只能通过长时间的归纳来近似理解的哲学。导致其运作模式的无数不可见决策对你来说是不可获取的。
不过,我认为有些团队尝试这样做是好的。也许Peter Naur是个傻瓜,而那个拥有Claude订阅的家伙更懂行。只有时间才能证明。目前,我还需要参与值班,携带寻呼机,当影响客户时被责备。所以,旧习难改。我倾向于认为长期深入参与代码是有价值的。
不好的方面
AI最糟糕的部分是人 越来越多的评论回复是这样的:
“哦,我不知道。Claude这么做的,我没看。”
或者更糟的是,他们让AI来回复评论。
“你反对是对的。我应该巴拉巴拉……”
这在刚毕业的大学生和实习生中尤为普遍。他们甚至会将Slack对话交给Claude。当我意识到一个人类选择仅仅作为Claude的有损接口时,我难以表达我的失望。
门槛降到了地板 开发者以前就不擅长编写测试,但至少他们会写。在过去,他们必须在某种程度上参与到代码中才能让测试通过。现在,人们提交的代码评审充满了“测试”,这些测试他们没看过,而且什么都没做。你可能希望这只是新手的问题,但似乎每个人都接受了这种做法。我在我的团队中对AI生成的垃圾给予了很大的宽容,但测试是唯一一个“我会死在这个山上,而且死得其所”的领域。
心理负担 工作时间充满了噪音。你不断切换上下文,同时处理多个对话。在过去几个月里,我做出的糟糕设计决策数量飙升。任务加载超出了可以有效管理的范围。
虚假信息不对称 需要纠正的错误信息数量令人筋疲力尽。“是的,是的,我知道Claude说那样做可行,但它是错的。”“是的,是的,我知道它给你链接了RFC来‘证明’那样做可行,但实现经常会偏离……” “是的,我可以给你看,但这需要时间……” 这种争论会持续下去,直到你浪费大量时间找到一个反例,而提问者仍然表示怀疑。Claude说他们是对的!为什么不接受他们是对的?!
这个问题使得委托某些类型的任务变得非常困难。那些毫无批判地坐在Claude会话前消费其输出的“温吞身体”可能弊大于利。但这与过去的情况并没有太大不同。有些人是你可以信任去完成模糊任务的,而有些人你只能给他们范围明确的任务(“让Claude)按照这个ticket做”。诀窍在于不要混淆这两组人。
对提高绩效的要求 整个领导层都采纳了一个口号:更快。“用更少做更多。”更多,更多,更多。但“更多”仍然是未定义的。“更快”相对于什么?没有人能真正说清楚。就是“更多”,更快。
这导致了……
士气低落 它从许多人手中偷走了对工艺的热爱。“工程文化”一直只属于少数人。富有热情的人总是少数。现在他们正在溺水。领导层想要“更多”,而且现在就要。那些多年来以稳定的开发速度而受到赞扬的人现在发现自己成了“瓶颈”或“不扩展”或“拖慢他人”。他们目睹着一种以“9个9”为自豪的文化在他们周围瓦解。取而代之的是,他们被告知要习惯“错误纠正”。为了速度牺牲一切。许多人在这个新世界中挣扎。
我们正在按照经济时间表工作。从长远来看,我们会看到谁是对的。但这需要一段令人不安的时间。只有当某人的钱包感受到压力时,才会进行调整。
我发现自己经常想起《升空》这本书,它记录了SpaceX的早期岁月。他们以令人难以置信的速度前进,但也发现迭代速度存在上限,超过这个上限事情就会开始崩溃。目前,感觉我们正在接近这个边缘。但许多人正在超越它。事情和人开始崩溃。
令人鼓舞的方面
尽管网络上关于“技能流失”和没有人会再做什么的抱怨很多,但似乎仍然有许多好奇、有兴趣的人使用AI深入学习新主题。不是以那种互联网上常见的炫耀方式“我提示TLA+,因为我很聪明”,而是以安静、无聊的方式:因为他们觉得有趣。
孩子们会没事的。
(我想)