ERGO Hestia 藉助 Lakebase 和 Mosaic AI Model Serving 縮短上市時間 2026-06-11 波蘭領先保險公司 ERGO Hestia 使用 Databricks Lakebase 和 Mosaic AI Model Serving 重構實時定價引擎,將數據、特徵和決策統一在湖倉一體平台上,實現毫秒級定價,加速模型部署,提升治理合規性。
ERGO Hestia 將實時定價引擎遷移到 Databricks 湖倉一體平台,消除了外部數據庫和適配層。 新架構通過 Lakebase 提供在線特徵存儲,Mosaic AI Model Serving 直接提供API,實現了毫秒級響應。 OpenAI與Anthropic:API代幣價格戰一觸即發 2026-06-11 據《華爾街日報》報道,OpenAI正考慮降低API代幣價格以從Anthropic手中爭奪客户,一場價格戰正在醖釀中。
OpenAI計劃通過降價吸引Anthropic的客户 價格戰可能影響AI API市場格局 NVIDIA加速谷歌DeepMind的DiffusionGemma,實現本地AI 2026-06-10 谷歌DeepMind發佈了DiffusionGemma實驗性開源模型,通過並行生成文本而非逐詞預測,大幅提升速度。NVIDIA對其進行了優化,使其在GeForce RTX、RTX PRO和DGX Spark等平台上運行更快,本地即可實現高達1000 tokens/sec的推理速度。
DiffusionGemma採用擴散模型方式,每步並行生成多達256個token,而非傳統自迴歸式逐個生成。 基於Gemma 4架構(26B參數,MoE),激活僅3.8B參數,性能提升達4倍。 Claude Fable 5 初印象 2026-06-09 Anthropic 發佈了 Claude Fable 5 和 Mythos 5,Fable 5 在性能與 Mythos 5 相當的基礎上增加了更嚴格的安全護欄,擁有 100 萬 token 的上下文窗口和 12.8 萬 token 的輸出能力,定價為 Opus 4.8 的兩倍。作者 Simon Willison 在 5.5 小時的測試中發現,該模型知識淵博、能力強大,在代碼生成和複雜任務處理上表現出色,但也伴隨着高昂的費用和較慢的速度。Fable 5 成功將 micropython-wasm 升級為完整 Python 沙箱,併為 Datasette Agent 和 LLM 庫實現了工具調用的暫停-恢復機制。作者當天消耗了 110.42 美元的 token。
Claude Fable 5 是 Anthropic 的新旗艦模型,性能與 Mythos 5 相同但安全限制更強。 模型上下文窗口 100 萬 token,輸出 12.8 萬 token,定價為 Opus 4.8 的兩倍。 Anthropic發佈首個Mythos級模型Claude Fable 5 2026-06-09 Anthropic宣佈推出Claude Fable 5,稱其是迄今為止最強大的廣泛可用AI模型,在軟件工程、知識工作和視覺方面表現卓越。該模型是Mythos類模型的首次公開發布,此前因網絡安全能力過強而被認為太危險。新安全措施可在高風險領域阻止響應,必要時回退到Claude Opus 4.8。Anthropic還發布了Claude Mythos 5,但僅在有限的受信任訪問計劃中提供。定價為每百萬輸入標記10美元,每百萬輸出標記50美元。
Claude Fable 5是Anthropic目前最強大的廣泛可用AI模型,在長任務和複雜任務上優勢明顯。 這是Mythos類模型的首次公開發布,此前因網絡安全風險而被限制。 CLI Market:面向AI代理的拉美零售商務基礎設施 2026-06-09 CLI Market 是一個為AI代理和商業團隊提供拉美零售定價數據的平台,覆蓋8個國家、68家零售商、51,000+個驗證過的價格,價格按公斤/升標準化,每4小時更新,並提供22個MCP工具和API,支持免費、專業版和企業版。
CLI Market 提供拉美地區51,000+個驗證過的零售價格,覆蓋8個國家、68家零售商,數據每4小時更新。 平台提供22個MCP工具和REST API,使AI代理能夠自主搜索、比較和組合購物籃。 Seedream 5.0 圖像與視頻——一站式AI創作平台 2026-06-08 字節跳動旗艦AI圖像模型Seedream整合Kling 2.1視頻動畫,提供從文本到圖像再到視頻的完整創作流程。支持四種版本一鍵切換,免費試用,定價靈活,適用於電商、社交媒體等場景。
集成Seedream 4.5/5.0/5.0 Lite/4.0四種版本,可自由切換 圖像生成後一鍵通過Kling 2.1轉化為5-15秒視頻 生成模型通過市場選擇侵蝕人類時間性學習 2026-06-08 本文論證當前次於AGI能力的生成模型對知識生產與文化傳承構成結構性風險。人類時間性學習(HTL)是指通過持續投入時間解決問題的路徑依賴式知識積累。生成模型的輸出在表面特徵上日益接近HTL密集型成果,導致驗證真實人類學習的成本相對於預期收益不斷上升。一旦驗證失去經濟合理性,評估者將獎勵所有產出而不區分生產方式,投入多年學習的人類生產者被迫與幾乎零成本的生成輸出進行價格競爭。作者將這一路徑稱為“價值崩潰”,並通過高成本檢驗框架加以形式化。跨學科證據(學術出版、法律實踐、內容平台、軟件安全)映射出四個驗證侵蝕階段。模型對齊的成功反而是正交因素:更優對齊縮小了人類與AI輸出之間的可觀察差距,使來源驗證更加困難,從而加劇了對HTL密集型工作的競爭壓力。
生成模型在表面特徵上模仿人類時間性學習(HTL)成果,導致驗證成本超過收益。 價值崩潰:一旦驗證失去經濟動機,人類學習者被迫與低成本AI輸出競爭。 Show HN:TeardownHQ——獨立初創企業增長案例與實操手冊 2026-06-08 TeardownHQ 為獨立 SaaS 創始人提供經過驗證的收入數據和深度研究手冊,詳細剖析初創公司如何增長,包括渠道、定價和進入市場策略。目錄免費瀏覽,完整分解報告為付費產品。前500名用户可獲創始會員終身優惠。
提供經過驗證的初創公司收入數據和增長策略手冊 目錄免費,完整分解報告付費,前500名有終身優惠 美國人工智能的OnlyFans經濟 2026-06-07 本文尖刻批評了美國AI行業的現狀,將之稱為“OnlyFans經濟”,指責Anthropic和OpenAI等公司過度炒作、定價高昂且充滿虛偽。作者對比中國模型Qwen 3.7 Max,認為其在實用性和性價比上全面超越美國前沿模型,並呼籲開發者根據實際需求理性選擇,避免為品牌溢價付費。文章還警告了盲目追捧帶來的估值泡沫可能對普通投資者造成傷害。
作者批評美國AI公司(尤其是Anthropic和OpenAI)的虛偽和傲慢,認為其存在雙重標準。 中國開源模型Qwen 3.7 Max在性能和成本上優於美國前沿模型,成為更具性價比的選擇。 X402-Mesh – 開放的同行定價與推薦協議 2026-06-07 X402-Mesh 是基於 x402 的開放協議,為 AI 代理在付費牆前提供競爭性報價菜單和推薦佣金結算,將付費瞬間轉化為去中心化市場。
在 x402 的 402 響應中附加帶簽名的競爭報價菜單,代理可比較並選擇更優方案。 若代理選擇競爭對手,推薦方獲得默認 5% 的佣金,通過 Base 鏈上原子結算合約即時到賬。 SpaceX IPO前簽署每月9.2億美元協議,向谷歌提供11萬塊英偉達AI芯片 2026-06-06 根據SEC文件,SpaceX以每月9.2億美元的價格向谷歌租賃AI計算能力,提供約11萬塊英偉達芯片,以滿足谷歌Gemini Enterprise平台的需求。這一交易凸顯了AI基礎設施的稀缺性以及大型科技公司業務的緊密交織。
SpaceX與谷歌簽署每月9.2億美元的AI計算能力租賃協議。 谷歌將獲得約11萬塊英偉達AI芯片的使用權。 Fitbit Air 是一款不錯的手環,但被囉嗦的AI“教練”拖累 2026-06-05 Fitbit Air 是一款出色的無屏幕健身追蹤器,舒適且價格合理。但谷歌強行將聊天式AI健康教練設為焦點,反而降低了使用體驗。免費版界面信息更密集,更實用。用户可以關閉AI功能,但操作選項隱藏較深。
Fitbit Air 硬件優秀,價格實惠,佩戴舒適。 谷歌AI健康教練過於囉嗦,影響體驗。 我構建了一個能察言觀色的AI代碼審查工具 2026-06-05 CodeMouse是一個集成於GitHub的AI代碼審查工具,使用Claude和/或GPT提供上下文感知的審查。它能閲讀之前的評論,避免重複,批准乾淨的PR,支持任何語言。定價每月10美元,提供14天免費試用。
在每個拉取請求上自動進行AI代碼審查,使用Claude和/或GPT。 具有完整倉庫上下文的上下文感知審查。 SpaceX IPO視頻向散户投資者推銷馬斯克的太空、AI和 asteroid夢想 2026-06-05 SpaceX發佈了面向散户投資者的IPO路演視頻,CFO Bret Johnsen闡述了公司火箭、衞星和AI業務的協同發展。該視頻突出了Starlink、AI解決方案、太空數據中心、點對點旅行及小行星採礦等遠大目標,並設定了毛利率和淨利率的提升目標。此次IPO估值約1.77萬億美元,定於6月11日定價,代碼SPCX。
SpaceX發佈17分鐘IPO路演視頻,面向全球散户投資者。 CFO Johnsen將火箭、Starlink和AI業務連接起來,強調使人類成為多行星物種的願景。 如何為AI API和LLM產品設計定價策略 2026-06-04 本文詳細介紹了AI API定價的六個關鍵決策:計量單位選擇、定價原語(令牌、積分、成果)、成本與定價計算、層級結構設計、硬上限與軟上限設置、積分錢包機制。通過實際案例和金額示例,幫助創始人和產品經理制定可持續的定價策略,並應對模型降價帶來的挑戰。
六個決策依次為:計量單位、定價原語、單位價格、層級結構、上限類型、積分錢包。 定價原語推薦優先選擇成果定價,其次積分,最後令牌。 Qwen 3.7 Plus:阿里巴巴的高智能但昂貴且緩慢的模型 2026-06-03 Qwen 3.7 Plus 是阿里巴巴於2026年6月發佈的專有推理模型,在人工智能分析智能指數上得分53,遠超平均水平。然而,它的價格昂貴,速度較慢,且非常冗長。該模型支持文本、圖像和視頻輸入,上下文窗口達100萬token。
智能得分53,遠超同類模型平均水平(23)。 輸入價格每百萬token 0.40美元,輸出價格1.16美元,屬於昂貴區間。 AI週報 #871:深入解析Claude Opus 4.8 2026-06-03 Claude Opus 4.8於2026年5月28日發佈,雖然版本號僅小幅提升,但在可靠性方面取得了重大進步,包括4倍的校準改進、修復靜默跳過工具調用、更好的壓縮恢復支持長期任務、動態工作流、自適應思考以及速度提升2.5倍且價格降低3倍的模式。該版本強調模型在長時間運行中的穩定性和誠實度,而非基準測試分數的提升,使其成為生產環境中代理循環的理想基礎設施。
Claude Opus 4.8在可靠性方面顯著提升,特別是校準和工具調用修復,相比4.7版本錯誤率降低約4倍。 新特性包括動態工作流、自適應思考和快速模式,使得模型在長時間任務中更穩定且成本更低。 GitHub Copilot 使用量計費已上線:你需要了解的信息 2026-06-02 GitHub Copilot 已從固定訂閲轉為基於令牌的計費模式,每個計劃包含月度 AI 信用額度。新推出的 Copilot Max 計劃定價 100 美元/月,提供 200 美元信用額度。企業用户需注意新的預算控制機制,包括用户級預算和企業級預算,以防止超額使用。模型選擇直接影響成本,團隊需根據任務合理選擇模型。
Copilot 改用令牌計費,每月提供固定信用額度加靈活額度。 新推出 Copilot Max 高端計劃,月費 100 美元,支持高強度代理工作。 OpenAI模型現已在亞馬遜雲服務上可用 2026-06-02 OpenAI通過亞馬遜Bedrock提供GPT-5.5、GPT-5.4和Codex模型,價格與OpenAI自有平台相同,使用量計入現有AWS合同,目前僅限美國區域。
GPT-5.5、GPT-5.4和Codex現可通過Amazon Bedrock使用 定價與OpenAI自有平台一致,無額外費用 AI 成本有多高?GitHub Copilot 用户對新的基於使用量的定價系統反應熱烈 2026-06-02 GitHub Copilot 引入基於使用量的計費系統,使用信用點數計費。成本取決於模型和令牌數,高級模型費用高,且簡單查詢也可能消耗大量信用點。用户需注意自動模式可能選擇昂貴模型。
Copilot 採用信用點計費,不同模型價格差異大。 簡單查詢也可能消耗大量信用點。 Nemotron 3 Ultra:高速、領先的美國開放權重智能模型 2026-06-01 NVIDIA在Computex主題演講中發佈了Nemotron 3 Ultra,擁有550B參數(55B活躍),是美國開放權重模型中智能最高的,AI Index得分48,推理速度超過300 tokens/s。
Nemotron 3 Ultra是美國開放權重模型中最大且最智能的。 AI Index得分48,領先其他美國模型,但落後於中國的Kimi K2.6。 重塑企業AI支出的定價轉變——UpperEdge的Adam Mansfield解析 2026-06-01 從基於座位許可到混合及消費型AI定價的快速轉變,使得企業技術支出更加難以預測和控制。Adam Mansfield探討了新定價模式如何為買家帶來財務風險,以及為何在主要供應商談判中,清晰的預測、透明度和槓桿作用越來越難以實現。他強調了領導者現在必須採取的實際步驟——從審計當前使用情況、識別未充分利用的支出,到儘早與供應商接觸並利用更廣泛的市場環境。
AI定價從座位制轉向消費制,增加了企業支出預測的難度。 新定價模式為買家帶來財務風險,談判中透明度和槓桿作用不足。 新型AI代理架構:用狀態機控制LLM,減少偏差與Token成本 2026-05-31 Botcircuits是一個開源AI代理,通過將LLM的逐步推理與確定性狀態機結合,實現了可預測且Token高效的多步驟自動化。它提供命令行界面、自然語言編寫工作流、技能模塊和MCP支持,顯著降低LLM偏差和Token消耗。
使用狀態機控制工作流,減少LLM偏差和Token消耗。 通過CLI斜槓命令支持自然語言編寫工作流。 Headroom:為AI代理壓縮上下文,削減50-90%的token成本 2026-05-31 Headroom是一個開源的上下文壓縮層,可在AI代理讀取的內容到達大語言模型之前進行壓縮,包括工具輸出、日誌、RAG塊、文件和對話歷史。它提供多種集成方式(庫、代理、MCP服務器等),支持多種代理(Claude Code、Codex、Cursor等),並聲稱在保持答案質量的同時將token使用量減少50-90%。項目已在社區中節省超過600億token。
Headroom作為中間層,在LLM處理前壓縮所有代理讀取的內容,減少token消耗50-90%。 提供庫、代理包裝、代理、MCP服務器等多種集成方式,支持Python、TypeScript、Docker部署。 AI加密貨幣價格預測模型基準測試 2026-05-31 Coinsignal推出全新AI模型基準測試平台,對13個模型在加密貨幣價格預測上的表現進行排名。OpenAI的GPT-5.4以73.8%的平均準確率位居第一,近期準確率高達78.5%。基準測試涵蓋方向、區間接近度和區間重疊三個準確性維度。
OpenAI GPT-5.4在13個模型中排名第一,平均準確率73.8%,近期準確率78.5% 基準測試包括方向、區間接近度和區間重疊三個準確性指標 跨9家供應商比較AI模型定價(385個模型) 2026-05-30 SilkDock推出AI模型定價比較工具,覆蓋385個模型和9家供應商,幫助用户找到最便宜的模型服務。
比較385個AI模型在9個平台上的價格 支持SilkDock、OpenRouter、Together AI等提供商 利用IBM量子採樣循環調優僅CPU的Qwen3-30B推理 2026-05-30 一個研究項目展示了在2017年MacBook Air上,通過結合人類實驗者、Codex、llama.cpp、本地數據庫和IBM量子處理器採樣,將Qwen3-30B模型的推理速度從0.09 tokens/sec提升至14.03 tokens/sec,同時保持輸出連貫性。該方法並非在量子處理器上運行模型,而是用量子採樣優化推理配置。
在8GB內存的2017年MacBook Air上,無GPU運行Qwen3-30B模型 通過人機協同量子優化循環,速度從0.09 tok/s提升到14.03 tok/s 不可持續的人工智能補貼 2026-05-29 Google、OpenAI 和 Anthropic 採用了截然不同的 AI 定價策略。Google 是低成本玩家,儘管漲價但仍低於對手一半。Anthropic 曾維持高價,OpenAI 則先補貼後漲價。這些變化反映了各公司在資本支出創紀錄背景下對市場份額和利潤率的權衡。
Google Gemini 3.1 Pro 輸入 2 美元/百萬 tokens,輸出 12 美元/百萬 tokens。 Anthropic Claude Opus 4.7 輸入 5 美元,輸出 25 美元。 每秒3000 tokens的LLM遊樂場 2026-05-29 一個高速LLM遊樂場,每秒可處理3000個token,提供開放Web界面。
Claude Opus 4.8:更智能的模型,正確的方向 2026-05-29 Anthropic發佈Claude Opus 4.8,重點提升可靠性、誠實性和自主工作流能力,而非單純追求基準分數。定價保持不變,快速模式大幅降價。
Claude Opus 4.8注重可靠性和不確定性處理,而非原始智力。 標準定價與Opus 4.7相同:每百萬輸入5美元,輸出25美元;快速模式降價三倍。 Anthropic 發佈 Claude Opus 4.8 2026-05-29 Anthropic 發佈了 Claude Opus 4.8,相比 Opus 4.7 在編程、代理工作、推理和知識工作方面有所提升。新功能包括努力控制、動態工作流和 Messages API 實時更新。定價不變,標準版每百萬代幣輸入/輸出 5/25 美元,快速版 10/50 美元。早期測試顯示成本與 GPT-5.5 相當,工具步驟更少。公司還透露了未來路線圖,包括 Mythos 級模型和網絡安全項目 Glasswing。
Claude Opus 4.8 在編程、代理工作、推理和知識工作方面優於 Opus 4.7。 新增努力控制、動態工作流和 Messages API 實時更新功能。 RightNow-Arabic-0.5B-Turbo:通過詞彙注入和邊緣優先部署的開源子10億阿拉伯語語言模型 2026-05-29 本文介紹了一個518M參數的阿拉伯語專用大型語言模型RightNow-Arabic-0.5B-Turbo,基於Qwen2.5-0.5B構建。通過詞彙注入和邊緣優先部署,該模型在阿拉伯語基準測試中達到35.9%的平均準確率,超越了同類開源模型,並在COPA-ar上與1.5B參數量的Falcon-H1-1.5B持平,而體積僅為後者的三分之一。量化後模型僅398 MB,在單塊H100上可實現635 tokens/s的推理速度。所有代碼和權重均已開源。
基於Qwen2.5-0.5B構建的518M參數阿拉伯語專用LLM,通過詞彙注入增加27,032個阿拉伯語token。 在COPA-ar、Arabic HellaSwag和ArabicMMLU三項基準上平均準確率35.9%,領先所有同類開源模型。 清華系團隊給大模型織了一張“智能算力電網” 2026-05-29 清華系創業公司是石科技通過自主研發的並行優化技術,構建異構算力資源池與推理優化引擎,實現單位Token成本降低40%,旨在打造國產Token調優工廠,降低AI落地門檻。
是石科技成立於2021年,源於國家超算無錫中心,創始人閆博文為清華博士後。 通過全域異構算力池和深度國產化適配,將閒置國產芯片轉化為可用算力。 Claude Opus 4.8:'適度但切實的改進' 2026-05-28 Anthropic發佈了Claude Opus 4.8,定位為對前代產品的適度但切實改進。主要亮點包括誠實性提升(減少無依據斷言,代碼錯誤遺漏率降低四倍),以及支持對話中修改系統提示等新功能。定價未變,但快速模式價格顯著降低。
Anthropic推出Claude Opus 4.8,官方稱其為'適度但切實的改進'。 誠實性顯著提升:模型更少做出無依據斷言,代碼錯誤遺漏率降低四倍。 Claude Opus 4.8 發佈:努力控制、動態工作流、更便宜的快速模式、更誠實、更少欺騙 2026-05-28 Anthropic 發佈了其旗艦模型 Opus 4.8,新功能包括用户可控制 Claude 的努力程度、動態工作流支持大規模編碼、快速模式價格降至原來的三分之一。模型在基準測試中領先 GPT-5.5 和 Gemini 3.1 Pro,但在終端編碼方面仍落後於 OpenAI。此外,模型在誠實性、自主支持和減少欺騙方面有顯著改進。
用户可調節 Claude 的“努力”程度,平衡響應質量與速度。 動態工作流(研究預覽)允許 Claude 在單個會話中並行運行數百個子代理,完成大規模代碼遷移。 Mistral 將 LeChat 更名為 Vibe,押注聊天機器人的未來是全能工作代理 2026-05-28 Mistral AI 將其聊天機器人 Le Chat 更名為 Vibe,並將聊天、編程代理和新的工作模式整合在一個品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,獨立處理電子郵件、報告或拉取請求等任務。Pro 套餐價格從 17.99 歐元降至 14.99 歐元,但未明確使用限制。此舉直接對標 OpenAI、Google 和 Anthropic 的代理型產品。
Mistral AI 將聊天機器人 Le Chat 更名為 Vibe,整合聊天、編程代理和工作模式。 工作模式可連接 Google Workspace、Outlook、Slack 或 GitHub,自主處理任務。 我認為Anthropic和OpenAI已找到產品市場契合點 2026-05-27 文章指出,Anthropic和OpenAI通過將企業客户轉向API定價模式,以及編碼代理產品的普及,實現了產品市場契合。這一轉折點始於2025年11月模型升級,並在2026年4月因新模型發佈和企業定價調整而加速。
Anthropic和OpenAI已將其企業計劃定價調整為API價格,編碼代理(如Claude Code和Codex)成為主要收入來源。 2026年4月,兩家公司發佈新前沿模型並提高API價格,同時鎖定企業客户以新價格簽約。 我獨自用Python、Flask和OpenAI API構建了28個工具的AI視頻SaaS 2026-05-27 一位獨立開發者創建了Snipforge,一個包含28種工具的全能AI視頻編輯套件,包括轉錄、智能剪輯、背景去除等功能。定價從免費到團隊版每月15美元。
Snipforge在一個平台上提供28種AI視頻工具,由開發者一人構建。 功能包括20種語言的AI轉錄、智能剪輯、自動字幕和背景去除。 我佩戴了谷歌的Fitbit Air進行一週健康追蹤——它是一款價格更低的Whoop強勁對手 2026-05-27 谷歌最新無屏幕健康追蹤器Fitbit Air售價僅100美元,是Whoop的強力競爭對手。經過一週的跑步、力量訓練、瑜伽等測試,我們發現這款設備輕便舒適,電池續航約一週,配合AI健康教練提供全面的追蹤體驗。雖然無屏幕設計減少了干擾,但在運動中查看數據需要打開手機應用。訂閲Google Health Premium可解鎖AI教練的高級功能。
Fitbit Air售價100美元,比Whoop更實惠。 無屏幕設計促進更健康的追蹤習慣,但運動中查看數據不便。 GPT Image 2 讓我驚歎又疲憊——於是我做了個小工具 2026-05-26 OpenAI 最新圖像模型 GPT Image 2 於 2026 年 4 月發佈,支持精準文本渲染、逼真圖像、自然語言編輯和透明背景。imagesv2.ai 平台提供免費試用、多種模板和生成工具,包括 360° 全景、推文截圖、微信聊天等。定價年付可享 50% 折扣。
GPT Image 2 是 OpenAI 下一代圖像模型,擅長文本渲染和逼真效果。 imagesv2.ai 提供免費積分和多種預設模板,無需 OpenAI 賬户。 剛剛,國產Agent模型闖入全球第一梯隊!限時免費 2026-05-26 崑崙萬維發佈SkyClaw-v1.0及輕量版SkyClaw-v1.0-lite,原生Agent模型性能比肩Claude Opus 4.6等頂尖模型,價格僅為主流一半,限時免費,深度適配OpenClaw、Claude Code等主流Agent框架,兼容OpenAI接口。
崑崙萬維發佈原生Agent模型SkyClaw-v1.0和輕量版SkyClaw-v1.0-lite,性能達到全球第一梯隊。 價格僅為主流頂尖模型的一半甚至更低,發佈期限時免費,後續計劃逐步開源。 邁向可靠的LLM驅動代理工作流設計:優化延遲-可靠性-成本權衡 2026-05-26 本文分析了大型語言模型(LLM)驅動的代理工作流中延遲、可靠性和成本之間的基本權衡,提出了一種參數化指數可靠性函數來建模LLM代理的計算投入與輸出質量關係,並推導了最優令牌分配策略(注水算法)以及影子價格表徵。
LLM代理工作流面臨延遲、可靠性和成本的三難權衡。 提出基於指數可靠性函數的性能模型,量化計算投入與輸出質量的關係。 Deepseek將75%折扣永久化,輸出令牌定價至少比GPT-5.5低34倍 2026-05-23 Deepseek宣佈其頂級模型V4-Pro的75%折扣永久生效。輸入令牌每百萬僅需0.435美元,至少比GPT-5.5便宜11.5倍,輸出令牌便宜34倍以上。對於令牌消耗巨大的代理系統,這一價格可能對西方供應商造成巨大壓力。
Deepseek永久保留V4-Pro模型75%的折扣。 輸入令牌定價0.435美元/百萬,比GPT-5.5低11.5倍。 DeepSeek V4價格打骨折,寧王京東網易搶着入場,梁文鋒:目標是AGI 2026-05-23 DeepSeek宣佈V4-Pro API永久降價,寧德時代、京東、網易等巨頭正洽談參投其首輪融資。梁文鋒明確表示優先追求AGI,堅持開源路線。
DeepSeek-V4-Pro API永久降價至原價的四分之一 寧德時代、京東、網易等公司洽談投資DeepSeek 利用大型語言模型進行情感分析:Decentraland的MANA代幣多模態分析 2026-05-21 本文研究將Discord社區情感與多模態金融數據結合,以增強虛擬世界經濟中的加密貨幣價格預測。利用基於BERT的大型語言模型進行情感分析,開發了兩種LSTM架構,結果表明多模態模型在預測準確性上顯著優於僅使用價格的基線模型。
研究發現Decentraland的Discord社區情感總體中性偏正面。 多模態LSTM模型結合情感分數、交易量和市值,顯著提升預測準確性。 Gemini 3.5 Flash:價格更高,但谷歌計劃將其用於所有產品 2026-05-19 谷歌在I/O大會上發佈Gemini 3.5 Flash,直接進入通用可用狀態,並將其集成到搜索、Gemini應用等核心產品中。該模型價格顯著上漲,輸入價格是前代Flash的3倍,輸出價格是6倍。儘管如此,谷歌仍將其免費提供給消費者,引發對API客户價格容忍度的討論。
Gemini 3.5 Flash在Google I/O上發佈,跳過預覽直接通用可用。 價格大幅上漲:輸入$1.50/百萬token,輸出$9/百萬token。 Cursor新模型,你怎麼還在套Kimi?馬斯克你怎麼還吆喝上了?? 2026-05-19 Cursor發佈Composer 2.5模型,基於Kimi K2.5,通過大量後訓練和強化學習,以Opus 4.7十分之一的成本達到接近其性能。馬斯克從批評轉為支持,因SpaceXAI與Cursor達成算力合作,並獲得收購優先權。模型在多項基準測試中接近Opus 4.7,價格大幅降低。
Composer 2.5基於Kimi K2.5,85%算力用於後訓練和RL 性能接近Claude Opus 4.7,但成本僅為其1/10 pixserp:為開發者打造的AI原生搜索引擎 2026-05-16 pixserp 是一款專為開發者設計的 AI 原生搜索引擎,通過單一端點提供十種實時網絡答案類型,兼容 OpenAI SDK,定價為每千次請求 1.50 美元,響應速度約 1.5 秒,並支持 SSE 流式傳輸。
十種答案類型:網頁、新聞、圖片、地點、購物、航班、酒店、YouTube、轉錄、任意 URL 兼容 OpenAI SDK,僅需更換 base_url 即可集成 我測試了Bose Lifestyle Ultra條形音箱,它在我家引發了“低音過重”的爭論 2026-05-15 Bose新款Lifestyle Ultra條形音箱以九個驅動單元和AI增強技術亮相,但低音表現較弱,需要搭配低音炮。與Sonos Arc Ultra等競品相比,其價格相同但音效控制不夠出色,且不支持與舊款產品向後兼容。適合作為智能音箱使用,但用作電影音箱時可能不如競品。
Bose Lifestyle Ultra條形音箱售價1099美元,九個驅動單元,支持5.0.2聲道。 低音表現不足,觀看電影時易產生震動噪音,需搭配低音炮。