Unix工作站的迴歸(現在加入AI)
一位資深Unix用户回顧了從1990年代RISC工作站到現代基於ARM的AI工作站的演變,重點介紹了從運行Asahi Linux的Mac Studio遷移到將20核ARM CPU與強大GPU相結合的Dell Pro Max GB10(NVIDIA DGX Spark)的經歷,使得本地AI代理部署和數據科學任務成為可能。
文章情報
要點
- 作者追溯了Unix工作站從1990年代RISC機器到現代基於ARM系統的歷史。
- 蘋果轉向ARM(M1)復興了強大RISC Unix工作站的概念,現在通過Asahi運行Linux。
- NVIDIA DGX Spark(Dell Pro Max GB10)提供了專為AI設計的RISC Unix工作站,具備1 petaFLOP的AI性能。
- 作者將GB10作為主要工作站,用於運行本地AI代理(NemoClaw)和模型,進行開發與數據科學工作。
為甚麼重要
這條新聞值得關注,因為作者追溯了Unix工作站從1990年代RISC機器到現代基於ARM系統的歷史。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
我是1990年代Unix的忠實用户,那時強大的RISC Unix工作站還在地球上橫行。SGI Octanes、Sun Ultras、DEC Alphastations……這些工作站價格昂貴,專為科學、工程和開發工作設計。它們使用RISC處理器(因為RISC是未來!),價格不菲。天哪,它們太強大了。我在其中許多機器上安裝了Linux(本質上是開源Unix)。
然而到了2000年代,廉價的Intel/AMD x86 PC提供了更好的性價比,強大的RISC Unix工作站逐漸滅絕。但沒關係,那些PC仍然可以運行Linux。蘋果Mac運行macOS(也是Unix),所以所有概念和命令從未消失。事實上,Web和雲——包括相關的開發框架——都是在Linux基礎上成長起來的。因此,當21世紀初雲和Linux突然成為主流媒體關注的焦點時,我們這些自滿的Unix用户只是坐享其成。
時間快進到2020年:蘋果宣佈將放棄Intel x86處理器,轉向自主研發的極快ARM處理器。ARM是RISC處理器,macOS是Unix。於是,蘋果帶回了1990年代的強大RISC Unix工作站(儘管價格更低)。
如今macOS是不錯的Unix,但不如Linux。幸運的是,Asahi開源項目逆向工程了蘋果平台,並找到了在其上原生運行Linux的方法(畢竟Linux早在其他硬件廠商之前就支持了ARM)。我是最早的用户之一,如今我在Mac Studio M1(20核ARM處理器,128GB內存,4TB存儲)上原生運行Fedora Asahi Remix Linux。
這很完美,因為我運行大量虛擬化Linux服務器和容器,並開發許多在其中運行的軟件。一台運行Linux的強大RISC工作站令人耳目一新,極大地提高了我的生產力。
然而,我現在需要做大量數據科學工作,涉及訓練、調優和運行各種機器學習與AI模型。
幸運的是,2025年NVIDIA發佈了Grace Blackwell GB10台式超級計算機平台:一款配備20核ARM CPU、128GB內存、4TB存儲以及強大NVIDIA GPU(可實現高達1 petaFLOP的AI性能)的Linux工作站。換句話説,這是一款專為AI和數據科學工作負載設計的現代RISC Unix工作站。
NVIDIA的GB10版本稱為DGX Spark,但我早在11月就拿到了戴爾版本(Dell Pro Max with GB10),其散熱性能更好。最初我將其用作遠程連接的服務器,但後來它成了我的主要工作站。畢竟它的規格與我的Mac Studio基本相同(20核ARM處理器,128GB內存,4TB存儲),開箱即用運行Linux,無需依賴逆向蘋果硬件的開源項目。而且它還擁有強大的NVIDIA GPU用於我的數據科學工作,NVIDIA提供了一些精良的工具,使我能更輕鬆地運行所需的數據科學內容。
性能方面,ARM CPU與我的Mac Studio相當,Linux在兩種系統上都運行飛快。因此我將所有虛擬化Linux服務器、容器、Kubernetes集羣和Ansible文件遷移過來,並安裝了我的完整開發棧。突然間,我擁有了一台能完成所有任務的機器:軟件開發、虛擬化、容器、DevOps、數據科學、AI推理和本地AI代理。砰!90年代回來了,寶貝!
不過,還有更多!GB10是一款AI超級計算機,NVIDIA使運行任何AI相關任務變得極其簡單(他們有詳細的設置文檔)。因此,我還運行着NemoClaw AI代理來協助我的任務。NemoClaw本質上將DGX Spark變成了一個本地AI操作員,可以自動化開發工作流程、檢查文件、編寫代碼和腳本、總結文檔、運行命令和分析日誌,而不僅僅是像傳統聊天機器人那樣回應提示。這意味着我可以委派實際任務讓它完成,而不僅僅是提問。
它利用了Nemotron 3 Super 120B參數AI模型,並主要使用Telegram作為聊天機器人界面。它將AI代理與主機系統隔離,這比直接運行底層OpenClaw安全得多(我可以輕鬆限制AI代理的訪問權限和集成範圍)。一切都在系統上與其他工作負載完美運行。幾年前,這種設置需要整個服務器機架。現在它運行在我的桌面上。這仍然讓人感到有點荒謬,卻是最好的方式。
我還利用GPT-OSS 120B參數模型在DGX Spark本地進行VS Code中的AI輔助開發。作為一名資深開發者,我更多地將AI視為“氛圍編碼”的替代品,而是作為加速軟件工程中重複工作的倍增器。這意味着我可以花更多時間專注於架構、系統設計和問題解決。
令我着迷的是,行業不知何故回到了起點:強大的本地Unix工作站運行在RISC架構上,由工程師、科學家和開發者用於計算密集型工作。不同之處在於,工作負載不再僅僅是統計分析、3D渲染或科學可視化……現在我們在Unix工作站上本地運行AI模型。太棒了。
免責聲明:我仍然使用macOS和Windows系統來支持學院的IT、軟件開發和數據科學項目,因為這些課程要麼在Windows PC上教授,要麼在Mac上教授。