今天起,無限期免費!全球首個全模態API開放,Top 10 AI Lab出手
Agnes AI(全球Top 10 AI實驗室)宣佈無限期免費開放其核心模型API,包括文本、圖像、視頻模型,旨在降低開發者和創作者的使用門檻。
今天起,無限期免費!全球首個全模態API開放,Top 10 AI Lab出手 – 量子位
今天起,無限期免費!全球首個全模態API開放,Top 10 AI Lab出手
十三 2026-06-01 15:57:16
來源:量子位
文本圖像視頻都能用
金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
好好好,終於有人把文本、圖片、視頻全模態的API,統統給免費開放出來了!
這次動手的,是Agnes AI——
從今天起,正式面向全球開發者與創作者,無限期免費開放旗下核心模型API!
都有啥?
文本模型:Agnes-2.0-Flash
圖片模型:Agnes-Image-2.0-Flash
視頻模型:Agnes-Video-2.0
可以説是非常之全乎兒~
來,咱們先看一個視頻模型的效果。
視頻地址:
https://mp.weixin.qq.com/s/fe0tsOPNYAn9PmTolFlVZA
可以看到,即便是免費的API,視頻模型依舊能穩穩生成上世紀的電影風格。
但也正如我們剛才説的,這次Agnes不是單獨把某一個能力免費,而是把文本、圖片、視頻三類API一起開放。
所以説,以後一個開發者想做Agent、一個設計師想改圖、一個短視頻團隊想批量試分鏡,都能從同一個模型體系裏調用能力。
那麼其它模型的效果如何?
一波實測,走起~
免費的API,效果咋樣?
先來看下文本模型Agnes-2.0-Flash。
我們先讓它直接來做一個應用,Prompt是這樣的:
幫助我構建高德地圖類型的地圖App,以北京市東城區總部衚衕明陽國際中心為起點。地圖要可以放大縮小,輸入目的地起始點,移動端垂直屏APP界面,地圖應用UI設計,簡潔界面,分層UI佈局,圓角佈局,中部,高座標度圖標,手機屏幕畫幅,8K,UI界面設計,細節。1.寫實實地圖景觀(高德/百度風格)衞星實景地圖底圖,城市道路路網,建築標記,綠色植被區塊,藍色水系湖泊,道路分級,地點文字標籤,縮放比例尺控件,定位點圖標,室外光影寫實
這個任務考驗的是模型能不能把產品需求、UI結構、交互邏輯和視覺風格揉到一起。
從效果來看,Agnes-2.0-Flash明顯把Prompt裏的需求都一一做到位了。
對開發者來説,這種能力的價值在於,早期原型可以從白紙畫框架變成直接讓模型生成可參考的交互稿。
第一個場景,是讓它做一個手勢控制電影級3D AI網站。
Prompt如下:
Create a cinematic 3D AI website with breathtaking visuals.
可以看到,生成的HTML裏面的各種3D效果直接夯爆了。
Agnes-2.0-Flash已經把視覺、交互和體驗等都塞進一個需求裏。
接下來,我們再做一個更復雜的3D粒子系統。
用 Three.js + MediaPipe Hands 做一個手勢控制的 3D 粒子系統,單文件 HTML,要炫酷一點: 粒子(約 2.5 萬個) 用自定義 ShaderMaterial:頂點着色器做閃爍(twinkle,按時間+位置正弦波動 + 距離衰減點大小),片元着色器做圓形柔光輝光(exp(-d*4) 徑向 glow + AdditiveBlending),讓粒子像發光星點。
嗯,效果可以説是相當炸裂了。
這類案例能説明一點,Agnes-2.0-Flash在複雜結構化任務裏,目標不是隻給答案,而是把一個可運行的項目拆出來。
看完文本模型,我們再來看圖片模型Agnes-Image-2.0-Flash。
第一個場景,我們看下它是否能完全理解Prompt的意思:
賽博朋克動畫場景,雨夜的未來東京人行天橋,潮濕反光的地面,金屬框架的通道結構,頭頂有熒光燈管照明,行人撐傘在雨霧中穿行,背景是被雨霧模糊的摩天大樓與霓虹招牌,冷色調為主,粉紫與青藍的霓虹光暈在霧氣中散開,朦朧的雨夜氛圍感,鏡頭向通道深處延伸,景深效果,動漫渲染,細膩的光影與水汽效果。
可以看到,Agnes-Image-2.0-Flash生成的圖片確實get到了Prompt的諸多細節。
第二個場景,是電商主圖。
我們先給Agnes-Image-2.0-Flash這樣的Prompt:
少女已經完全跨出了屏幕,雙腳穩站在地面上,一隻手用力撥開殘餘的屏幕碎片向外推展,另一隻手則伸向鏡頭前,彷彿邀你走進這個奇幻空間
第三個場景,是信息圖和社交媒體配圖。
一張手機社交APP的豎屏圖文教程截圖,採用從上到下的瀑布流排版。整體背景為温馨的淺米色,呈現出日系清新的美食排版風格。畫面最頂部有手機系統的狀態欄,清晰顯示時間 ‘14:30’、5G信號圖標、Wi-Fi圖標和滿格電池圖標。\n\n狀態欄下方,是居中排版的大字號主標題,深棕色粗體文字 ‘巧克力拿鐵 零失敗教程’,標題下方有一行較小的淺棕色英文副標題 ‘Chocolate Latte Recipe’。\n\n標題下方佔據畫面約三分之一比例的是一張高清的成品展示主圖:放置在淺色木托盤上的一杯高透明度的玻璃杯裝巧克力拿鐵。杯內呈現出漂亮的分層:底部是深棕色的巧克力醬,中間是濃郁的濃縮咖啡與牛奶的融合層,頂部是綿密的奶泡,奶泡上撒着些許巧克力碎,並淋着深褐色的巧克力醬拉花。杯口裝飾有一根肉桂棒和一小枝薄荷。
這種任務考的是圖文排版和指令遵循。因為信息圖不是單純畫一張插畫,它要處理標題、層級、留白、圖標、説明文字之間的關係。對公眾號、短視頻封面、課程海報、企業內訓材料來説,這類能力非常剛需。
最後,我們再來看視頻模型Agnes-Video-2.0。
我們圍繞《龍族甦醒》這個主題來做個視頻,Prompt是這樣的:
16:9 橫屏,15 秒,奇幻史詩,龍之火焰。0-3 秒:俯拍古老山洞,洞內岩漿緩慢流動如河流般發出橙紅色光芒,洞壁佈滿鐘乳石,環境悶熱濕潤,每一塊石頭上都覆蓋着晶瑩的水珠。3-7 秒:中景,巨龍緩緩睜開眼睛,它的眼睛如燈籠般大小,瞳孔是金色的豎瞳,鱗片在岩漿光芒下閃爍如紅寶石,每一片鱗片都清晰可見。7-11 秒:特寫龍眼,瞳孔收縮視線聚焦,壓迫感撲面而來,巨頭移動帶動周圍空氣流動形成風,岩漿開始沸騰冒泡氣泡翻滾。11-15 秒:全景拉遠,巨龍完全甦醒抬起頭顱發出震耳欲聾的咆哮,聲音穿透山洞,石塊開始墜落,龍翼展開颳起狂風。【強化詞】巨龍特效,火焰物理,鱗片細節,電影級,4K 高清,奇幻史詩。
視頻地址:
https://mp.weixin.qq.com/s/fe0tsOPNYAn9PmTolFlVZA
短短15秒,效果已經有迪士尼動畫的味道了。
第二個場景,是音畫同出:
[VISUAL]: EXT. CORNFIELD – SUMMER – BRIGHT SUN. A teenager runs through the corn, arms brushing against leaves, then stops at a clearing. He sits on the ground, breathing hard, and looks up at the sky. [SPEECH]: None [SOUNDS]: Corn rustle, breathing, insects. [TEXT]: None
視頻地址:
https://mp.weixin.qq.com/s/fe0tsOPNYAn9PmTolFlVZA
音畫同出的難點,是中間過程不能違和。從效果來看,整個視頻音畫同步性可謂是一氣呵成。
如此一來,對廣告分鏡、產品短片等場景來説,試錯門檻會低很多。
第三個場景,我們結合圖片生成的案例,來考驗一下運鏡的效果:
大師級運鏡,由遠及近拉近,鏡頭推至天橋下,行人撐着傘匆匆忙忙
視頻地址:
https://mp.weixin.qq.com/s/fe0tsOPNYAn9PmTolFlVZA
Agnes-Video-2.0依舊是穩穩拿捏住了。
這些案例能看出視頻模型更接近真實創作流程的地方,創作者並不只需要動起來,還需要情緒、鏡頭、景別、光影和氛圍一起服務於內容。短劇、廣告、劇情分鏡、音樂MV、社媒視頻都不是單幀審美,而是連續敍事。
所以,Agnes這次免費開放的重點,不只是多了一個免費模型。更準確地説,它是在把文本、圖像、視頻三類能力,打包成一套可調用的創作與開發基礎設施。
幾分鐘就能上手的那種
除了效果,操作方式也是極易上手。
最直接的入口,是Agnes官方API平台:
https://platform.agnes-ai.com/。開發者登錄後創建API Key,就可以按文檔調用對應模型。
如果使用Workbuddy,可以把Agnes的圖片或視頻模型打包成一個Skill。比如配置Agnes Image 2.0或Agnes Video V2.0後,在對話裏就能像調用工具一樣調用生圖、生視頻能力。
如果使用Hermes這類本地Agent,也可以把Agnes-2.0-Flash配置成默認模型。關鍵配置主要是API Key、自定義模型提供商、接口地址
https://apihub.agnes-ai.com/v1,以及模型名稱agnes-2.0-flash。
對開發者來説,免費API意味着可以放心做高頻測試;對Agent應用來説,意味着多輪規劃、工具調用、失敗重試不再每一步都要計算成本;對內容創作者來説,意味着圖像和視頻可以更大膽地試鏡頭、試風格、試版本。
背後是Top 10 AI Lab
Agnes AI是全球Top 10的AI Lab。
根據Agnes披露的信息,Agnes-2.0-Flash進入Claw-Eval榜單,圖像模型Agnes-Image-2.0-Flash進入Artificial Analysis的Image Editing Leaderboard,視頻模型Agnes-Video-V2.0也進入Artificial Analysis的Image to Video Leaderboard(With Audio)。
這些榜單成績至少説明一件事,Agnes已經進入全球多模態模型競爭的可見區。
但這件事更值得討論的地方,不只是排名。
過去兩年,大模型競爭最容易被看見的主線,是誰參數更大、誰跑分更高、誰發佈會更炸。這個方向當然重要,因為模型能力決定了上限。
但到了應用落地階段,另一個問題會變得越來越現實:
誰能讓更多人真正用得起?
尤其是在Agent時代,調用成本會被進一步放大。一個普通聊天請求可能只消耗一次Token,但一個Agent工作流可能要反覆規劃、搜索、調用工具、寫代碼、檢查結果、失敗重試。看起來只是用户發出一句話,背後可能已經跑了幾十輪模型調用。
免費API,真正影響的還有開發者的實驗空間。
很多AI應用並不是沒有需求,而是卡在早期試錯階段:還沒驗證PMF,調用成本先上來了;還沒形成收入,模型賬單先跑起來了;還沒招到完整團隊,一個人想做Agent、做多模態應用、做自動化流程,卻發現每一步都在燒錢。
Agnes的打法,某種程度上把這個壓力往後推了一步。
先讓更多人用起來,先讓開發者把Demo跑通,先讓創作者把工作流搭起來,先讓中小團隊敢做實驗。只有當使用門檻降下來,模型能力才有機會從榜單走向真實應用。
當然,免費並不自動等於成功。
真正決定一個模型能不能長期留下來的,還是穩定性、調用體驗、生態工具、文檔完整度、併發能力和開發者社區。尤其是全模態API,後續要面對的不是單點能力競爭,而是端到端工作流競爭:文本怎麼規劃任務,圖像怎麼生成素材,視頻怎麼完成動態表達,工具怎麼串起來,失敗怎麼自動修復。
但至少這一次,Agnes給行業拋出了一個很直接的問題:
當高質量AI能力越來越像水、電、雲服務器一樣成為基礎設施,它到底應該有多貴?
如果説過去兩年,大模型競爭的關鍵詞是更強;那麼接下來,更可用、更便宜、更容易接入,會變得同樣關鍵。
因為真正改變行業的,往往不是少數人用得起的尖端能力,而是足夠多人能反覆調用、持續試錯、最終長進工作流裏的基礎能力。
版權所有,未經授權不得以任何形式轉載及使用,違者必究。
Agnes AI Lab 免費API 全模態API
十三
國產GPU開始造世界!國內首個全棧具身智能仿真平台來了2026-05-19
剛剛,國產AI自己造了AI,全球首例!2026-05-26
頂流裏最快!智譜,你是在「噴」代碼吧2026-05-22
國產GPU組了個開源局,把SGLang等核心開發者都搖來了!2026-05-14
熱門文章
剛剛,國產AI自己造了AI,全球首例!
2026-05-26
卡帕西Anthropic最新頭銜:技術員工(MTS)
2026-05-26
4nm!比亞迪自研AI芯片來了:製程對齊英偉達,算力拉爆特斯拉
2026-05-29
面壁智能「開源周」:一場定義端側 AI 終局的系統性「亮劍」
2026-05-29
DeepSeek V4芯模協同背後,國產算力生態開始飛輪加速
2026-05-28
掃碼關注量子位
量子位 QbitAI 版權所有©北京極客夥伴科技有限公司 京ICP備17005886號-1