AI News HubLIVE
站内改写1 分鐘閱讀

DiffusionGemma:谷歌開源高速文本生成模型

谷歌釋出了名為DiffusionGemma的新開源模型,基於Apache 2許可證,可在NVIDIA的NIM雲API上免費使用。該模型在生成速度上表現卓越,達到每秒500個token以上。

谷歌釋出了DiffusionGemma,一款全新的開源文本生成模型,採用Apache 2許可證,標誌著該公司在高效文本生成領域邁出了重要一步。該模型源於去年短暫釋出的實驗性Gemini Diffusion模型,當時僅以預覽形式出現,而如今以開放權重模型的形式迴歸,名為google/diffusiongemma-26B-A4B-it。

NVIDIA目前透過其NIM雲API免費提供該模型。使用者在測試中僅用4.4秒即可生成2,409個token,相當於每秒超過500個token,展現了極高的推理效率。這一速度與去年預覽版Gemini Diffusion模型的857 tokens/秒效能相當,但如今作為開源模型,更便於開發者整合與使用。

DiffusionGemma基於Gemma架構,專為快速文本生成最佳化,適合需要低延遲響應的應用場景。其開源許可允許商業使用和修改,有望推動AI文本生成技術的廣泛應用。