AI編碼已達L3自主,但基礎設施仍卡在L1
AI驅動的編碼工具已實現高度自主,讓任何人都能開發軟體,但底層基礎設施卻依然陳舊,導致效率低下。我們需要一個全新的AI原生作業系統。
文章情報
要點
- Claude Code、Cursor等AI編碼工具已達到L3-L4級自主水平。
- 基礎設施停留在L1-L2級,存在代理孤立、資源閒置等問題。
- 根本性變革迫在眉睫,Aranya正構建AI原生分散式作業系統。
為什麼重要
這條新聞值得關注,因為Claude Code、Cursor等AI編碼工具已達到L3-L4級自主水平。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
為什麼AI基礎設施在AI應用層飛速發展的背景下仍然落後?這個問題一直困擾著我,尤其是當整個行業以驚人的速度增長時。我們實際上是在用AI應用程式(相當於一級方程式賽車)在AI基礎設施層(相當於泥土路)上行駛。要理解為什麼我稱基礎設施為泥土路,我們需要快速回顧一下當前AI應用層的現狀。
最令人興奮的例子之一是“氛圍編碼”(Vibe Coding)。這個術語由OpenAI聯合創始人、前特斯拉AI負責人Andrej Karpathy於2025年2月提出。理念非常簡單:你用自然語言描述你想要的東西,AI就會寫出程式碼。沒有語法,沒有堆疊溢位的深究,只有意圖到輸出的直接轉換。這不再是一個玩具。Y Combinator 2025年冬季班中,有25%的初創公司的程式碼庫是95%由AI生成的。谷歌CEO表示,谷歌超過25%的程式碼現在由AI生成。微軟的Satya Nadella證實,他們30%的程式碼由AI編寫。據報道,Spotify最優秀的開發人員自2025年12月以來沒有編寫過一行程式碼,而是使用AI編碼工作流交付了50多個功能。Anthropic的Claude Code負責人本人已經超過兩個月沒有親自編寫過程式碼。Anthropic 70-90%的程式碼現在由AI生成。
像Claude Code和Cursor這樣的平臺已經變得如此出色,以至於沒有程式設計經驗的人也可以建立想法原型、進行測試、迭代併發布產品。構建軟體的門檻實際上已降至零。正如微軟的David Fowler所說:“任何人都能做到。”但是,有一個話題沒人願意談論——背後的基礎設施並不成熟。
讓我們用自動駕駛的類比來完美說明這一點:L0(無自動化)對應手動編碼,無AI輔助;L1(基本輔助)對應程式碼自動補全;L2(部分自動化)對應AI結對程式設計;L3(條件自動化)對應氛圍編碼,AI處理整個功能,人類稽核;L4(高度自動化)對應自主編碼智慧體,如Claude Code執行30小時以上的會話。Claude Code和Cursor已經穩定在L3,並向L4邁進。Claude Code現在可以自主執行30小時以上處理複雜任務,同時部署多智慧體團隊處理專案的不同部分,甚至可以使用沙箱安全執行而無需頻繁請求許可權。這不再是自動補全,而是具有真正自主能力的系統。
然而,AI基礎設施停留在L1-L2。你仍然需要手動配置叢集、處理脆弱的擴充套件性,以及面對互不連線的孤立系統。Salesforce 2026年連線性報告發現,50%已部署的AI智慧體完全孤立執行,無法共享上下文、協調甚至看到相鄰智慧體的操作。96%的組織報告在將資料用於AI時遇到障礙,其中40%直接指向過時的IT架構。資料決策系統(DDN)2026年AI基礎設施狀況報告發現,44%的IT領導者認為基礎設施限制是擴充套件AI的首要障礙,而高達65%的AI基礎設施處於閒置狀態卻仍在消耗電力。美國行動論壇直言不諱地指出,向2026年的轉型“將基礎設施和監管置於AI議程的核心”。
我們需要的不是對遺留工具的拼湊,也不是另一個帶有營銷包裝的Kubernetes外殼,而是一個全新的、AI原生的分散式作業系統——專為執行計算叢集而非單臺PC而構建。甚至連我們的PC作業系統,如Windows和macOS,在AI時代也已過時。它們是為滑鼠、鍵盤和資料夾時代設計的,代表著一種迅速變得無關的計算正規化。
Aranya正在構建第一個AI原生分散式作業系統。它不是一個覆蓋在遺留基礎設施之上的額外層,而是一個從根本上為叢集設計的作業系統。它可以在幾分鐘內部署超過1000個節點的GPU叢集,使用ClusterdOS——一個可移植的Kubernetes作業系統——實現真正的多租戶和聯邦架構。它可以從單個儀表板管理數百個叢集,並自動回收未使用的計算資源,將成本降低高達30%。這不是另一個臨時修補方案,而是真正的出路。
AI革命已經擁有了應用層和模型層,但缺少的正是能夠以所需規模實際執行的基礎設施。現有的解決方案也許能工作,但對我來說還不夠。現在是時候做出改變了。