AI News HubLIVE
站内改写

清華系團隊給大模型織了一張“智慧算力電網”

清華系創業公司是石科技透過自主研發的並行最佳化技術,構建異構算力資源池與推理最佳化引擎,實現單位Token成本降低40%,旨在打造國產Token調優工廠,降低AI落地門檻。

文章情報

工程師進階

要點

  • 是石科技成立於2021年,源於國家超算無錫中心,創始人閆博文為清華博士後。
  • 透過全域異構算力池和深度國產化適配,將閒置國產晶片轉化為可用算力。
  • 推理最佳化使吞吐量提升30%-50%,單位Token成本降低40%。
  • 多Provider容災體系保障99.9%高可用性,實現穩定Token產能。

為什麼重要

這條新聞值得關注,因為是石科技成立於2021年,源於國家超算無錫中心,創始人閆博文為清華博士後。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

清華系團隊給大模型織了一張“智慧算力電網” – 量子位

清華系團隊給大模型織了一張“智慧算力電網”

思邈 2026-05-29 10:47:09

來源:量子位

單位Token成本降低40%

允中 發自 凹非寺

量子位 | 公眾號 QbitAI

AI晶片,正在機房裡猛猛吃灰。

海外高階GPU供不應求、又貴又難買;

國產晶片產能好不容易上來了,結果是「能用但不好用」,生態不全、適配難、推理最佳化門檻高,大量國產卡就這麼空轉著,電費照燒,卻產不出一顆能用的Token。

企業想用AI,偏偏卡在了最不該卡的環節,算力。

所有人都在比誰的模型引數更大,但真正決定AI能不能落地的,其實是另一件沒那麼性感的事:一顆Token,能不能被穩定、便宜、規模化地生產出來。

死磕這件事的,是一支從中國超級計算體系裡走出來的年輕團隊,是石科技。

△AI生成

這家公司成立於2021年,由國家超級計算無錫中心的核心科研團隊聯合組建,是國內最早將超算智算並行最佳化的技術進行產業化的團隊之一。

名字取自“實事求是,甘為基石”,寄託著創始團隊對算力基礎設施地位的深刻認知。其創始人兼董事長閆博文,出生於1993年,畢業於清華大學,是清華計算機系博士後。

這家公司瞄準的是透過自主研發的並行最佳化技術,將高效能運算(HPC)與人工智慧計算深度融合,專治各種異構算力資源排程的“疑難雜症”。

在他們看來,現在的AI行業根本不需要再多一個算力轉租平臺,要打破國產算力空轉的僵局,必須徹底跳出傳統租賃的淺層模式。

是石科技給出的解法直擊本質:

緊扣“Token標準化、國產化、效率提升”這三件事,直接重構算力變現路徑,重磅打造國產TOKEN調優工廠。

大模型也有了算力“電網”:插上插頭,算力秒變Token產能

是石科技TOKEN工廠的第一層技術底座,來自異構算力的全域整合與深度國產化適配。

區別於行業常見的單一算力資源模式,是石科技搭建了全域異構算力資源池,全面相容NVIDIA GPU、國產AI晶片(包括昇騰、崑崙芯、天數、太初、瀚博半導體等),以及雲廠商算力、邊緣算力等多源渠道。

透過智慧排程與彈性擴縮容技術,實現算力資源的統一納管、智慧分配與動態擴容,讓企業不再受困於“算力採購難、資源碎片化”。

△AI生成

打個比方,這就像一張“全域智慧電網”。

過去每家工廠只能用自己的發電機(單一算力),買不到柴油就停產,發電機壞了就癱瘓。

是石科技則類似於搭建了一張覆蓋全國的算力網路,把各地的風電、水電、火電、太陽能電(各種算力)全部接入統一電網。

企業需要用電時,只需“插上插頭”,電網就會自動排程、分配與你需求最匹配的電給你,你完全不用關心電是從哪個具體的電網節點送過來的。

更關鍵的是,是石科技團隊完成了主流國產AI晶片的深度適配與專項最佳化,打通了框架適配、運算元相容、通訊最佳化、效能調優全鏈路。

△AI生成

在這張電網的“變電與穩壓”作用下,原本閒置、難調通的國產算力,在這裡能被高效轉化為穩定、可用、低成本的標準化Token推理產能。

透過不斷提升算力利用效率,以及充分利用閒時的算力,或者根據客戶需求定製專屬算力資源,國產Token就可以真正變成可商用的產能優勢。

對此,一位長期從事AI基礎設施的工程師評價說:

過去我們買了國產卡,總要花幾個月去調驅動、改框架、修bug。是石科技把這條路鋪好了。國產卡不再是“擺設”,而是真正能跑生產的引擎。

把晶片效能榨乾到極限:吞吐暴漲50%,Token成本硬砍40%

如果說算力池化是底座,那麼推理最佳化就是TOKEN工廠的核心技術壁壘。

是石科技團隊深耕高效能運算領域多年,在嚴格恪守企業級SLA服務標準的前提下,從運算元、記憶體、排程、解碼等全維度進行技術革新。

CUDA Kernel運算元級最佳化、PagedAttention記憶體最佳化、Continuous Batching連續批處理、混合精度推理……這些技術被系統性地部署在TOKEN工廠的生產線上。

配合FlashAttention、推測解碼、KV Cache精細化管理、模型並行(TP/PP)等前沿加速方案,GPU等國產晶片的資源利用率大幅提升,Token吞吐總量顯著增加,單位Token生產成本大幅下降。

更重要的是,傳統推理中常見的延遲抖動、TTFT與TPOT波動等問題得到了有效控制——

Token生成變得高效、穩定、高品質。實測資料顯示,在同等算力條件下,是石科技的推理最佳化方案可將吞吐量提升30%-50%,單位Token成本降低40%。

△AI生成

治好“宕機焦慮”:99.9%高可用,把推理做成不斷電流水線

規模化的Token生產,不能建立在脆弱的單點算力之上。

是石科技構建了一套多Provider互補與容災體系:

資源互補:流量峰值時自動彈性擴容;

技術互補:接入特定模型和技術能力(如超低延遲、多模態);

區域互補:跨地域部署,降低延遲,滿足各行業合規要求。

自動Fallback故障切換機制,搭配“自有叢集承載主要流量、合作伙伴叢集兜底容災”的流量分配模式,徹底規避單點算力故障導致的業務中斷風險。

△AI生成

99.9%的高可用性服務保障,讓Token的規模化生產、排程、輸出全程穩定可控。

想象一下飛機引擎的“多冗餘設計”,即便一臺引擎失效,其他引擎能夠自動補位,飛機照常飛行。

是石科技相當於給AI推理服務裝了三套引擎——包括自己的引擎、合作伙伴的引擎、備用引擎。

哪怕其中一套突然熄火,系統會在0.1秒內自動切換到另一套,使用者完全感知不到。

從技術上看,這已經不是漸進式的改良,而是從“算力資源”到“優質Token產能”的價值躍遷。

當前,國產AI算力替代程序持續提速。

標準化、可量產、低成本的Token產能,已成為AI產業落地的核心生產資料。

是石科技的目標已經明確:

建成中國最大、技術最先進、服務最完善的國產TOKEN調優工廠。

讓千行百業降低AI落地門檻,讓國產算力生態真正實現規模化、高質量發展,推動中國AI產業邁入工業化、標準化的全新階段。

當行業還在追逐單一模型的精度時,是石科技選擇了一條更有挑戰但更具長期價值的道路——

做夯實AI推理底座的工廠,做可進化、可複用、可普惠的Token生產力平臺。

這條路投入更大、週期更長、協調更復雜。

但一旦走通,它改變的將不只是某一家企業的推理成本,而是整個適合中國AI產業高效發展的國產算力生態。

版權所有,未經授權不得以任何形式轉載及使用,違者必究。

AI infra 清華 算力電網 超算

思邈

世界模型接棒語言模型,這家公司全球首創物理AGI“雙金字塔”體系,通用機器人進入“家庭時代”2026-05-28

觸覺具身來了個夢之隊:天使輪近億2026-05-27

圖靈獎得主領銜,中國大模型第一梯隊集結!2026智源大會,看懂AI下一程2026-05-25

華為具身大腦一號位創業,用認知科學造世界模型,獲億元級融資2026-05-25

相關閱讀

按AI頂會評實力:美國7倍領先中國,騰訊和清華分獲中國產學No.1

十三2019-12-20

AI研究排行 北大 清華 騰訊

清華伯克利發起RISC-V國際開源實驗室,圖靈獎得主牽頭,落地深圳

雷剛2019-06-14

RISC-V 圖靈獎 開源 清華 晶片

KTransformers入選計算機系統頂會、與主流框架合作,趨境&清華讓「異構」成為推理新正規化

中國開源專案正在被世界看見

鄧思邈2025-10-23

異構推理 清華 趨境科技

清華系公司聯合,單4090讓安全大模型進入千億時代|長亭x趨境

大模型成網路攻防雙方互搏武器

衡宇2024-09-12

AI infra 大模型 清華系

ChatGLM-6B升級V2:效能大幅提升,8-32k上下文,推理提速42%

C-Eval榜單上排名最高的開源模型

衡宇2023-06-26

大模型 清華

2021清北畢業生去向關鍵詞:進體制、搞教育、國內深造

最新高校就業報告出爐

明敏2022-01-08

北大 就業 清華

熱門文章

剛剛,國產AI自己造了AI,全球首例!

2026-05-26

卡帕西Anthropic最新頭銜:技術員工(MTS)

2026-05-26

融資700億!DeepSeek Code真要來了,ACM金牌大神崔添翼掛帥

2026-05-22

李飛飛再出手,空間智慧的ImageNet來了

2026-05-22

80集短劇,3天拍完:當電影人下場做Agent,影視生產迎來了“最懂行”的解法

2026-05-22

掃碼關注量子位

量子位 QbitAI 版權所有©北京極客夥伴科技有限公司 京ICP備17005886號-1