Unix工作站的迴歸(現在加入AI)
一位資深Unix使用者回顧了從1990年代RISC工作站到現代基於ARM的AI工作站的演變,重點介紹了從執行Asahi Linux的Mac Studio遷移到將20核ARM CPU與強大GPU相結合的Dell Pro Max GB10(NVIDIA DGX Spark)的經歷,使得本地AI代理部署和資料科學任務成為可能。
文章情報
要點
- 作者追溯了Unix工作站從1990年代RISC機器到現代基於ARM系統的歷史。
- 蘋果轉向ARM(M1)復興了強大RISC Unix工作站的概念,現在透過Asahi執行Linux。
- NVIDIA DGX Spark(Dell Pro Max GB10)提供了專為AI設計的RISC Unix工作站,具備1 petaFLOP的AI效能。
- 作者將GB10作為主要工作站,用於執行本地AI代理(NemoClaw)和模型,進行開發與資料科學工作。
為什麼重要
這條新聞值得關注,因為作者追溯了Unix工作站從1990年代RISC機器到現代基於ARM系統的歷史。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
我是1990年代Unix的忠實使用者,那時強大的RISC Unix工作站還在地球上橫行。SGI Octanes、Sun Ultras、DEC Alphastations……這些工作站價格昂貴,專為科學、工程和開發工作設計。它們使用RISC處理器(因為RISC是未來!),價格不菲。天哪,它們太強大了。我在其中許多機器上安裝了Linux(本質上是開源Unix)。
然而到了2000年代,廉價的Intel/AMD x86 PC提供了更好的價效比,強大的RISC Unix工作站逐漸滅絕。但沒關係,那些PC仍然可以執行Linux。蘋果Mac執行macOS(也是Unix),所以所有概念和命令從未消失。事實上,Web和雲——包括相關的開發框架——都是在Linux基礎上成長起來的。因此,當21世紀初雲和Linux突然成為主流媒體關注的焦點時,我們這些自滿的Unix使用者只是坐享其成。
時間快進到2020年:蘋果宣佈將放棄Intel x86處理器,轉向自主研發的極快ARM處理器。ARM是RISC處理器,macOS是Unix。於是,蘋果帶回了1990年代的強大RISC Unix工作站(儘管價格更低)。
如今macOS是不錯的Unix,但不如Linux。幸運的是,Asahi開源專案逆向工程了蘋果平臺,並找到了在其上原生執行Linux的方法(畢竟Linux早在其他硬體廠商之前就支援了ARM)。我是最早的使用者之一,如今我在Mac Studio M1(20核ARM處理器,128GB記憶體,4TB儲存)上原生執行Fedora Asahi Remix Linux。
這很完美,因為我執行大量虛擬化Linux伺服器和容器,並開發許多在其中執行的軟體。一臺執行Linux的強大RISC工作站令人耳目一新,極大地提高了我的生產力。
然而,我現在需要做大量資料科學工作,涉及訓練、調優和執行各種機器學習與AI模型。
幸運的是,2025年NVIDIA釋出了Grace Blackwell GB10臺式超級計算機平臺:一款配備20核ARM CPU、128GB記憶體、4TB儲存以及強大NVIDIA GPU(可實現高達1 petaFLOP的AI效能)的Linux工作站。換句話說,這是一款專為AI和資料科學工作負載設計的現代RISC Unix工作站。
NVIDIA的GB10版本稱為DGX Spark,但我早在11月就拿到了戴爾版本(Dell Pro Max with GB10),其散熱效能更好。最初我將其用作遠端連線的伺服器,但後來它成了我的主要工作站。畢竟它的規格與我的Mac Studio基本相同(20核ARM處理器,128GB記憶體,4TB儲存),開箱即用執行Linux,無需依賴逆向蘋果硬體的開源專案。而且它還擁有強大的NVIDIA GPU用於我的資料科學工作,NVIDIA提供了一些精良的工具,使我能更輕鬆地執行所需的資料科學內容。
效能方面,ARM CPU與我的Mac Studio相當,Linux在兩種系統上都執行飛快。因此我將所有虛擬化Linux伺服器、容器、Kubernetes叢集和Ansible檔案遷移過來,並安裝了我的完整開發棧。突然間,我擁有了一臺能完成所有任務的機器:軟體開發、虛擬化、容器、DevOps、資料科學、AI推理和本地AI代理。砰!90年代回來了,寶貝!
不過,還有更多!GB10是一款AI超級計算機,NVIDIA使執行任何AI相關任務變得極其簡單(他們有詳細的設定文件)。因此,我還執行著NemoClaw AI代理來協助我的任務。NemoClaw本質上將DGX Spark變成了一個本地AI操作員,可以自動化開發工作流程、檢查檔案、編寫程式碼和指令碼、總結文件、執行命令和分析日誌,而不僅僅是像傳統聊天機器人那樣回應提示。這意味著我可以委派實際任務讓它完成,而不僅僅是提問。
它利用了Nemotron 3 Super 120B引數AI模型,並主要使用Telegram作為聊天機器人介面。它將AI代理與主機系統隔離,這比直接執行底層OpenClaw安全得多(我可以輕鬆限制AI代理的訪問許可權和整合範圍)。一切都在系統上與其他工作負載完美執行。幾年前,這種設定需要整個伺服器機架。現在它執行在我的桌面上。這仍然讓人感到有點荒謬,卻是最好的方式。
我還利用GPT-OSS 120B引數模型在DGX Spark本地進行VS Code中的AI輔助開發。作為一名資深開發者,我更多地將AI視為“氛圍編碼”的替代品,而是作為加速軟體工程中重複工作的倍增器。這意味著我可以花更多時間專注於架構、系統設計和問題解決。
令我著迷的是,行業不知何故回到了起點:強大的本地Unix工作站執行在RISC架構上,由工程師、科學家和開發者用於計算密集型工作。不同之處在於,工作負載不再僅僅是統計分析、3D渲染或科學視覺化……現在我們在Unix工作站上本地執行AI模型。太棒了。
免責宣告:我仍然使用macOS和Windows系統來支援學院的IT、軟體開發和資料科學專案,因為這些課程要麼在Windows PC上教授,要麼在Mac上教授。