xAI的Colossus 2——全球首個千兆瓦級數據中心、獨特強化學習方法與大規模融資 2025-09-17 01:38 UTC+8 xAI正在建造Colossus 2,一個千兆瓦級AI訓練集羣,通過跨州電力供應和與Solaris Energy Infrastructure的合作,實現快速建設。該項目有望在2025年第三季度超越競爭對手,並可能通過中東資金獲得數十億美元融資。
xAI的Colossus 1在122天內建成,擁有約200,000個H100/H200 GPU;Colossus 2規模更大、速度更快。 Colossus 2的電力來自密西西比州的前杜克能源電廠,通過燃氣輪機提供,避開了本地阻力。 又一巨大飛躍:Rubin CPX 專用加速器及機架 2025-09-11 03:57 UTC+8 Nvidia 發佈了 Rubin CPX,這是一款專門為預填充階段優化的解決方案,單芯片 Rubin CPX 重點強調計算 FLOPS 而非內存帶寬。這對推理來説是遊戲規則的改變者,其重要性僅次於 2024 年 3 月發佈的 GB200 NVL72 Oberon 機架級形態。只有為推理的預填充和解碼這兩個截然不同的階段定製硬件,才能充分發揮分解式服務的潛力。Nvidia 的機架系統設計差距已變得如鴻溝般巨大,競爭對手需要重新調整路線圖。
Rubin CPX 是一款預填充專用 GPU,具有 20 PFLOPS FP4 密集計算和 2 TB/s 內存帶寬,使用 128GB GDDR7,成本遠低於 HBM。 新的 VR200 NVL144 CPX 和雙機架方案為分解式推理提供了靈活的預填充到解碼比例。 華為Ascend生產提速:Die Bank、台積電持續生產,HBM成為瓶頸 2025-09-08 17:54 UTC+8 華為正在加速Ascend AI芯片的生產,利用台積電的Die Bank和SMIC的產能提升。然而,HBM(高帶寬內存)的短缺將成為未來生產的最大瓶頸。中國國內HBM供應商CXMT正在快速追趕,但短期內仍無法滿足需求。文章還分析了出口管制對華為的影響以及NVIDIA H20芯片進入中國市場的潛在影響。
華為2024年出貨507K顆Ascend芯片,2025年預計805K顆,其中大部分為910C型號。 SMIC的產能不再是瓶頸,但HBM供應不足將限制華為明年生產100萬顆以上的芯片。 亞馬遜的AI復興:AWS與Anthropic的多千兆瓦Trainium擴張 2025-09-04 04:55 UTC+8 兩年前SemiAnalysis曾警告AWS面臨“雲危機”,如今危機顯現:Azure在季度新增雲收入上領先,谷歌雲與AWS差距縮小。但SemiAnalysis逆勢看多,認為AWS將迎來AI復興,核心驅動力是合作伙伴Anthropic。Anthropic 2025年收入從10億美元激增至50億美元,AWS為其建設了超過1.3吉瓦的數據中心,用於部署近百萬顆Trainium2芯片。儘管Trainium2在性能上落後於Nvidia,但其每TCO內存帶寬優勢契合Anthropic的強化學習路線。AWS與Anthropic的合作正走向深度硬件-軟件協同設計,有望在2025年底推動AWS雲增速超過20%。
AWS面臨AI雲市場份額下滑,但SemiAnalysis預測其將因Anthropic合作而復興。 Anthropic成為AWS的“錨定客户”,其2025年收入增長5倍至50億美元。 H100與GB200 NVL72訓練基準測試:功耗、TCO與可靠性分析,及軟件隨時間的改進 2025-08-20 12:56 UTC+8 本文深入分析了H100與GB200 NVL72在訓練前沿模型時的基準表現,涵蓋模型浮點利用率(MFU)、總擁有成本(TCO)、每百萬token成本、能耗及可靠性。研究發現,H100在12個月內通過軟件優化實現了高達57%的吞吐量提升;而GB200 NVL72雖然在性能上具有優勢,但面臨可靠性挑戰和大規模訓練尚未完成的現狀。文章還提供了具體模型(如GPT-3 175B、Llama 3 405B)的詳細基準數據,並給出對Nvidia的三點建議:增加基準測試透明度、擴展至原生PyTorch、改進GB200診斷工具。
H100通過軟件優化在一年內將BF16 MFU從34%提升至54%,FP8 MFU從29.5%提升至39.5%。 GB200 NVL72的每GPU總擁有成本約為H100的1.6倍,因此需要至少1.6倍的性能優勢才能在性能/TCO上勝出。 GPT-5為廣告變現和超級應用鋪平道路 2025-08-13 08:27 UTC+8 GPT-5的發佈讓高級用户失望,但實際重點是為超過7億的免費用户鋪平變現之路。文章分析OpenAI如何通過路由器(Router)技術區分查詢意圖,未來可能通過代理購買和交易抽成實現免費用户的變現,從而打造一個消費者超級應用。
GPT-5的重點不是高級用户,而是通過路由器技術為免費用户變現做準備。 路由器能夠區分信息查詢和商業查詢,為高價值查詢分配更多計算資源。 機器人自主級別:從腳本運動到通用任務的進階之路 2025-07-31 01:02 UTC+8 本文提出了業界首個“機器人自主級別”分類法,將機器人自主能力劃分為0到4共五個級別,每個級別基於前一級別逐步解鎖新能力。文章分析了各級別當前部署情況、經濟性、挑戰及進展,並指出通用型機器人正從早期生產階段走向勞動力替代。當前通用機器人已達到2級,3級處於早期試點,而4級仍有待突破。
機器人自主級別共5級:0級腳本運動、1級智能拾放、2級自主移動、3級低技能操作、4級力控任務。 當前通用機器人大多處於2級(早期生產)和3級(試點),4級仍處於研究階段。 Meta超級智能:領導力計算、人才與數據 2025-07-12 04:12 UTC+8 Meta以約300億美元估值收購Scale AI 49%股份,顯示其資金充裕。儘管資源雄厚,Meta在模型性能上落後於基礎實驗室。Zuckerberg親自領導新“超級智能”團隊,以鉅額薪酬挖角頂級人才,並徹底改革數據中心策略,採用帳篷式快速建設。同時,Llama 4因注意力機制、數據質量等問題遭遇失敗,但Meta正通過收購和挖角彌補人才差距。
Meta收購Scale AI 49%股份,估值約300億美元。 Zuckerberg組建超級智能團隊,以2-3億美元四年薪酬挖角頂級AI人才。