Unix工作站的回归(现在加入AI)
一位资深Unix用户回顾了从1990年代RISC工作站到现代基于ARM的AI工作站的演变,重点介绍了从运行Asahi Linux的Mac Studio迁移到将20核ARM CPU与强大GPU相结合的Dell Pro Max GB10(NVIDIA DGX Spark)的经历,使得本地AI代理部署和数据科学任务成为可能。
文章情报
要点
- 作者追溯了Unix工作站从1990年代RISC机器到现代基于ARM系统的历史。
- 苹果转向ARM(M1)复兴了强大RISC Unix工作站的概念,现在通过Asahi运行Linux。
- NVIDIA DGX Spark(Dell Pro Max GB10)提供了专为AI设计的RISC Unix工作站,具备1 petaFLOP的AI性能。
- 作者将GB10作为主要工作站,用于运行本地AI代理(NemoClaw)和模型,进行开发与数据科学工作。
为什么重要
这条新闻值得关注,因为作者追溯了Unix工作站从1990年代RISC机器到现代基于ARM系统的历史。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
我是1990年代Unix的忠实用户,那时强大的RISC Unix工作站还在地球上横行。SGI Octanes、Sun Ultras、DEC Alphastations……这些工作站价格昂贵,专为科学、工程和开发工作设计。它们使用RISC处理器(因为RISC是未来!),价格不菲。天哪,它们太强大了。我在其中许多机器上安装了Linux(本质上是开源Unix)。
然而到了2000年代,廉价的Intel/AMD x86 PC提供了更好的性价比,强大的RISC Unix工作站逐渐灭绝。但没关系,那些PC仍然可以运行Linux。苹果Mac运行macOS(也是Unix),所以所有概念和命令从未消失。事实上,Web和云——包括相关的开发框架——都是在Linux基础上成长起来的。因此,当21世纪初云和Linux突然成为主流媒体关注的焦点时,我们这些自满的Unix用户只是坐享其成。
时间快进到2020年:苹果宣布将放弃Intel x86处理器,转向自主研发的极快ARM处理器。ARM是RISC处理器,macOS是Unix。于是,苹果带回了1990年代的强大RISC Unix工作站(尽管价格更低)。
如今macOS是不错的Unix,但不如Linux。幸运的是,Asahi开源项目逆向工程了苹果平台,并找到了在其上原生运行Linux的方法(毕竟Linux早在其他硬件厂商之前就支持了ARM)。我是最早的用户之一,如今我在Mac Studio M1(20核ARM处理器,128GB内存,4TB存储)上原生运行Fedora Asahi Remix Linux。
这很完美,因为我运行大量虚拟化Linux服务器和容器,并开发许多在其中运行的软件。一台运行Linux的强大RISC工作站令人耳目一新,极大地提高了我的生产力。
然而,我现在需要做大量数据科学工作,涉及训练、调优和运行各种机器学习与AI模型。
幸运的是,2025年NVIDIA发布了Grace Blackwell GB10台式超级计算机平台:一款配备20核ARM CPU、128GB内存、4TB存储以及强大NVIDIA GPU(可实现高达1 petaFLOP的AI性能)的Linux工作站。换句话说,这是一款专为AI和数据科学工作负载设计的现代RISC Unix工作站。
NVIDIA的GB10版本称为DGX Spark,但我早在11月就拿到了戴尔版本(Dell Pro Max with GB10),其散热性能更好。最初我将其用作远程连接的服务器,但后来它成了我的主要工作站。毕竟它的规格与我的Mac Studio基本相同(20核ARM处理器,128GB内存,4TB存储),开箱即用运行Linux,无需依赖逆向苹果硬件的开源项目。而且它还拥有强大的NVIDIA GPU用于我的数据科学工作,NVIDIA提供了一些精良的工具,使我能更轻松地运行所需的数据科学内容。
性能方面,ARM CPU与我的Mac Studio相当,Linux在两种系统上都运行飞快。因此我将所有虚拟化Linux服务器、容器、Kubernetes集群和Ansible文件迁移过来,并安装了我的完整开发栈。突然间,我拥有了一台能完成所有任务的机器:软件开发、虚拟化、容器、DevOps、数据科学、AI推理和本地AI代理。砰!90年代回来了,宝贝!
不过,还有更多!GB10是一款AI超级计算机,NVIDIA使运行任何AI相关任务变得极其简单(他们有详细的设置文档)。因此,我还运行着NemoClaw AI代理来协助我的任务。NemoClaw本质上将DGX Spark变成了一个本地AI操作员,可以自动化开发工作流程、检查文件、编写代码和脚本、总结文档、运行命令和分析日志,而不仅仅是像传统聊天机器人那样回应提示。这意味着我可以委派实际任务让它完成,而不仅仅是提问。
它利用了Nemotron 3 Super 120B参数AI模型,并主要使用Telegram作为聊天机器人界面。它将AI代理与主机系统隔离,这比直接运行底层OpenClaw安全得多(我可以轻松限制AI代理的访问权限和集成范围)。一切都在系统上与其他工作负载完美运行。几年前,这种设置需要整个服务器机架。现在它运行在我的桌面上。这仍然让人感到有点荒谬,却是最好的方式。
我还利用GPT-OSS 120B参数模型在DGX Spark本地进行VS Code中的AI辅助开发。作为一名资深开发者,我更多地将AI视为“氛围编码”的替代品,而是作为加速软件工程中重复工作的倍增器。这意味着我可以花更多时间专注于架构、系统设计和问题解决。
令我着迷的是,行业不知何故回到了起点:强大的本地Unix工作站运行在RISC架构上,由工程师、科学家和开发者用于计算密集型工作。不同之处在于,工作负载不再仅仅是统计分析、3D渲染或科学可视化……现在我们在Unix工作站上本地运行AI模型。太棒了。
免责声明:我仍然使用macOS和Windows系统来支持学院的IT、软件开发和数据科学项目,因为这些课程要么在Windows PC上教授,要么在Mac上教授。