DeepSeek AI News

DeepSeek動態

印度公司因AI成本高昂轉向中國大語言模型

2026-07-13 17:52 UTC+8

印度企業越來越多地使用DeepSeek、阿里巴巴和Moonshot AI等中國大語言模型來降低人工智能成本，這進一步加深了印度對中國尖端技術的依賴，儘管兩國之間長期存在衝突。

印度公司轉向中國LLM以削減AI成本
DeepSeek、阿里巴巴和Moonshot AI是主要供應商

Director：通過在線主動專家放置加速分佈式MoE服務

2026-07-13 12:00 UTC+8

本文介紹了Director，一種新的分佈式MoE推理系統，通過預測驅動的在線專家放置優化，顯著降低端到端延遲。系統採用輕量級級聯預測器或低比特量化副本預測專家激活模式，結合近乎零停機的在線遷移模塊，以及基於鬆弛優化的專家放置算法，在多項式時間內達到(1+ε)近似比。實驗表明，在Mistral、DeepSeek和Qwen等流行MoE模型上，相比現有工作延遲降低11%~55%。

提出預測驅動的在線專家放置方法
設計近乎零停機的專家遷移模塊

2026年中AI模型分級

2026-07-11 23:43 UTC+8

作者從個人編碼和審計經驗出發，對2026年中的主流AI模型進行非正式分級，涵蓋Anthropic Fable、OpenAI Sol、Mistral、Gemini和DeepSeek等模型，並融入美國出口管制和歐洲視角的評論。

Fable（Anthropic）被評為B級，雖然流暢但不可靠，常隱藏錯誤。
Sol（OpenAI）被評為S級，在低級代碼和測試方面表現出色，值得信賴。

DeepSeek V3.2 在 Hugging Bay 上發佈

2026-07-11 09:44 UTC+8

DeepSeek V3.2 現已登陸 Hugging Bay，這是一個開源 AI 工件註冊平台，提供來源驗證、許可證審核和可信託管服務。

DeepSeek V3.2 已在 Hugging Bay 上發佈。
Hugging Bay 是一個開源註冊表，具備來源驗證和信任功能。

DeepSeek DSpark：實現LLM速度提升400%的推測解碼技巧

2026-07-09 02:26 UTC+8

DeepSeek發佈了DSpark模塊，通過半自迴歸草案模型結合馬爾可夫頭，同時解決了推測解碼中草案質量低和驗證浪費兩大問題。在DeepSeek-V4上，它使每用户生成速度提升60-85%，且不降低模型質量。本文深入解析其工作原理、開源工具DeepSpec的使用方法及實驗結果。

DSpark採用半自迴歸草案模型，兼具並行速度和序列連貫性。
馬爾可夫頭以極低開銷提供與RNN頭相當的效果，已投入生產。

AI模型“過度思考”問題——這是一種安全風險

2026-07-08 19:00 UTC+8

研究表明，具備推理能力的大語言模型容易因邏輯不一致的提示而陷入“過度思考”，導致輸出長度激增，可能被利用發動拒絕服務攻擊。浙江大學與阿里巴巴的研究人員開發了一種進化算法，能夠生成惡意提示，使模型輸出長度最高增加26倍，影響包括DeepSeek-R1、Qwen3-Thinking、GPT-o3和Gemini 2.5 Flash在內的主流推理模型。

研究人員展示了一種利用AI推理模型“過度思考”漏洞的新型攻擊，導致計算量急劇增加。
通過進化算法破壞提示的邏輯結構，可使模型輸出長度最高達到正常情況的26倍。

中國AI模型憑藉成本優勢在美國企業中的採用率上升

2026-07-08 05:48 UTC+8

中國開發的AI模型正逐漸縮小與領先美國競爭對手的性能差距，同時保持顯著的價格優勢，因此在美國公司中越來越受歡迎。最近DeepSeek和Z.ai等中國公司發佈的模型被認為與Anthropic和OpenAI等前沿系統高度競爭。這些進步正值許多美國AI實驗室最先進模型的token價格上漲，使企業面臨與使用該技術相關的意外高成本。

中國AI模型性能提升，與美國領先模型差距縮小。
DeepSeek和Z.ai等中國公司的模型在成本上更具優勢。

DeepSeek V4 在代理型代幣份額中嶄露頭角

2026-07-07 04:27 UTC+8

DeepSeek V4 模型自2026年4月發佈以來，在OpenRouter上的代幣份額從年初的9%翻倍至18%，主要由代理型工作負載驅動。其成本效益比（每百萬代幣輸入0.09美元，輸出0.18美元）領先業界，吸引各類用户採用，並推動中國模型整體超越美國模型。

DeepSeek V4 發佈後六個月內，代幣份額從9%增至18%。
代理型工作負載是主要增長動力，V4-Flash佔DeepSeek代理型代幣流量的70%。

低成本中國AI模型如DeepSeek在美國受到青睞

2026-06-29 23:15 UTC+8

美國開發者和小型企業正在轉向中國AI模型以降低成本。儘管性能仍落後於美國頂尖模型，但中國模型能以極低價格處理大多數任務。微軟也在考慮使用DeepSeek等開源模型作為更低成本的替代方案。然而，中國公司面臨將流行度轉化為可觀收入的挑戰。

美國開發者用DeepSeek替代Claude，成本從10美元降至不到50美分。
中國模型價格低廉得益於國內較低的薪資和基礎設施成本。

DeepSeek發佈DSpark：一種投機解碼框架，將DeepSeek-V4每用户生成速度提升60-85%

2026-06-28 00:59 UTC+8

DeepSeek開源了DSpark，一種投機解碼框架，通過附加草稿模塊到現有DeepSeek-V4權重上。它結合並行草稿骨幹和輕量級馬爾可夫頭以減少後綴衰減，並加入基於置信度的調度驗證，根據實時GPU負載調整檢查的令牌數量。離線測試中，接受長度比DFlash和Eagle3提升16-31%；生產環境下，每用户生成速度比MTP-1基線提升57-85%，且無損。訓練代碼庫DeepSpec採用MIT許可證。

DSpark結合並行草稿骨幹和輕量級馬爾可夫頭，提高後綴接受率。
基於置信度的驗證根據GPU負載動態調整檢查令牌數。

cwmail：原生Golang終端郵件客户端，集成DeepSeek V4 Pro AI起草功能

2026-06-27 11:36 UTC+8

cwmail是一款基於Go語言和Bubbletea v2開發的終端郵件客户端，支持HTML郵件渲染、內嵌圖片顯示、多賬户IMAP管理、IDLE推送通知以及由DeepSeek V4 Pro驅動的AI回覆起草功能。它提供快速本地搜索、撤銷刪除、草稿自動保存、CLI發送模式等特性，且不依賴任何雲服務，用户數據完全本地存儲。

使用Go語言和Bubbletea v2構建，在終端中提供完整的郵件管理體驗。
支持多賬户IMAP，可同時管理Gmail、iCloud、Outlook等賬户，並採用IDLE推送通知而非輪詢。

我們在20秒內部署了DeepSeek-V4-Pro服務

2026-06-26 04:49 UTC+8

Inferize公司宣佈成功在20秒內部署DeepSeek-V4-Pro模型，實現極快且高效的LLM服務，並邀請用户加入等待列表。

Inferize在20秒內部署了DeepSeek-V4-Pro模型
該公司提供高度優化的彈性AI推理服務

AI模型發佈節奏分析：兩家實驗室加速，三家放緩

2026-06-21 10:16 UTC+8

本文通過數據分析了前沿AI模型的發佈節奏，發現Anthropic和OpenAI的發佈頻率在加速，而谷歌、Meta和DeepSeek並未出現類似趨勢。作者探討了遞歸自我改進的可能性，並指出了驗證這一假設的下一步觀察點。

Anthropic和OpenAI的模型發佈節奏在加速，其他三家實驗室未出現此趨勢。
加速可能源於遞歸自我改進，即實驗室利用自身模型改進後續模型。

7.4億美元背後的深層意義：DeepSeek的A輪融資標誌着中國AI聯盟的轉變

2026-06-21 07:47 UTC+8

本週三大看點：DeepSeek獲騰訊領投74億美元A輪融資，顯示中國AI投資正轉向非生態系統參與者；日本計劃到2040年投入650億美元公私合作建設物理AI基礎設施；智譜AI的GLM 5.2模型在設計基準測試中超越Anthropic的Claude，直接挑戰西方AI性能標準。

DeepSeek獲騰訊領投74億美元A輪融資，阿里巴巴和字節跳動未參與。
日本計劃到2040年投入650億美元建設物理AI基礎設施，優先硬件以對抗西方領導地位。

VibeThinker-3B：基於Qwen2.5-Coder-3B與頻譜到信號後訓練流水線的3B密集推理模型

2026-06-20 06:06 UTC+8

VibeThinker-3B是一個僅30億參數的開源推理模型，在可驗證基準測試中匹配DeepSeek V3.2和Kimi K2.5等千億級模型。它採用頻譜到信號後訓練流水線，通過監督微調、強化學習和自蒸餾實現高效推理，並引入測試時縮放方法CLR進一步提升性能。

VibeThinker-3B僅有3B參數，MIT許可證開源，基於Qwen2.5-Coder-3B構建，專攻可驗證推理。
在AIME26上得分94.3，與671B的DeepSeek V3.2和1T的Kimi K2.5相當。

微軟在中國銷售OpenAI模型，而OpenAI和Anthropic拒絕

2026-06-18 17:00 UTC+8

微軟已成為中國市場上OpenAI模型的主要供應商，向字節跳動、螞蟻集團、美團和騰訊等大型互聯網公司銷售GPT系列模型，儘管OpenAI和Anthropic出於知識產權和濫用風險拒絕直接進入中國市場。該業務為微軟帶來獨特優勢，使其成為唯一一家向中國銷售美國AI模型的美國供應商。據彭博社報道，微軟Azure在中國的AI收入增長迅猛，2025財年約增長三倍。微軟通過其與OpenAI的獨家合同提供這些模型，並採取監控措施防止模型蒸餾，但中國客户面臨審查有限。同時，微軟也在測試中國模型DeepSeek用於西方企業，形成雙向貿易。

微軟通過其與OpenAI的獨家合同，向中國大型互聯網公司提供GPT模型，而OpenAI和Anthropic拒絕直接銷售。
字節跳動是微軟最大的AI客户，年度支出超過10億美元；螞蟻集團、美團和騰訊也通過Azure購買AI模型。

歸因引導與覆蓋最大化的結構化MoE剪枝方法

2026-06-18 12:00 UTC+8

本文提出一種面向混合專家模型的結構化剪枝框架，通過將剪枝比率分配轉化為通道分數覆蓋最大化問題，並利用基於歸因的近似方法高效求解。實驗表明，在50%或25%結構化剪枝結合4位量化條件下，該方法在DeepSeek和Qwen MoE模型上保持了模型精度，並在Qwen3-30B-A3B上實現5.27倍內存壓縮，超越現有基準。

發現MoE專家內部信息集中在少數通道，存在顯著冗餘
提出通道級結構化剪枝框架，將剪枝比率分配建模為覆蓋最大化問題

專為本地LLM和DeepSeek v4優化的原生編碼代理，具備向量記憶功能

2026-06-17 06:36 UTC+8

cwcode是一個基於Go語言的終端編碼代理，利用DeepSeek V4 Pro等模型，提供文件編輯、子代理、語義記憶和自動恢復等功能。它強調低成本（每小時約0.40美元）、高效緩存（85%以上命中率），並支持本地模型和多種API。

基於Go的終端編碼代理，支持DeepSeek V4 Pro、Qwen3.6-27B等模型
採用哈希錨定編輯和粘性前綴緩存，降低令牌消耗和成本

中國打擊西方AI模型，美國公司卻湧入DeepSeek

2026-06-13 10:51 UTC+8

中國國家安全部警告使用西方AI模型存在安全風險，同時美國企業因成本優勢紛紛採用中國開源模型。雙方在AI領域相互牽制，用户繞道訪問對方模型的現象加劇了技術博弈。

中國國家安全部警告通過第三方工具訪問美國AI模型可能帶來安全風險
美國企業因成本優勢大量使用DeepSeek、阿里Qwen等中國開源模型

Pythagoras-Prover: 通過增強型Lean形式化推進高效形式化證明

2026-06-12 12:00 UTC+8

Pythagoras-Prover是一個計算高效的Lean定理證明器家族，包含4B和32B的自迴歸模型以及4B的擴散模型。它通過分層課程SFT和動態證明過濾提高訓練效率，並引入增強型Lean形式化(ALF)擴展驗證語料庫。實驗顯示，4B模型在MiniF2F-Test上以86.1%的pass@32超越DeepSeek-Prover-V2-671B（82.4%），而32B模型達到93.0%的新開源最佳水平，並在PutnamBench上解決93個問題。

Pythagoras-Prover包含4B和32B自迴歸模型及4B擴散模型，擴散模型在推理時迭代細化證明。
通過分層課程SFT和動態證明過濾實現訓練效率提升，保持8k token上下文預算。

Deepseek在2026年6月位列Ramp熱門軟件供應商榜首，美國企業尋求更便宜的AI

2026-06-08 00:06 UTC+8

2026年6月，Deepseek成為Ramp平台上最受歡迎的付費軟件供應商，美國企業直接向其發送數據。Ramp首席經濟學家Ara Kharazian指出成本意識是驅動因素，但警告使用中國模型的安全風險。

Deepseek在2026年6月成為Ramp熱門軟件供應商第一名。
美國企業為降低成本轉向使用Deepseek的付費AI服務。

DigitalOcean 成為 OpenRouter AI 模型提供商

2026-06-03 16:25 UTC+8

DigitalOcean 宣佈成為 OpenRouter 的模型提供商，提供 DeepSeek V3.2、Kimi K2.6 和 DeepSeek V4 Flash 模型。此舉表明該公司正從雲基礎設施擴展到 AI 推理領域。

DigitalOcean 在 X 上宣佈成為 OpenRouter 的模型提供商
首批模型包括 DeepSeek V3.2、Kimi K2.6 和 DeepSeek V4 Flash

新綜述論文：代碼不僅是AI智能體的產物，更是其思考與行動的方式

2026-05-29 21:10 UTC+8

一篇新綜述論文指出，自主AI智能體的真正瓶頸並非語言模型本身，而是圍繞其構建的軟件層。工具、記憶、測試和權限邊界將無狀態模型轉變為可工作的智能體。Deepseek已在北京組建專門的“Harness”團隊，其核心公式驗證了該論點：模型加Harness等於AI智能體。

論文強調AI智能體的瓶頸在於軟件封裝層，而非語言模型。
工具、記憶、測試和權限管理是將模型轉化為智能體的關鍵。

AI週刊第496期：Anthropic的國防級模型現已全民可用

2026-05-27 08:00 UTC+8

本週AI新聞要點：Anthropic公開了此前僅限國防承包商使用的頂級模型Mythos，使五角大樓級AI能力向開發者開放；DeepMind CEO哈薩比斯將AGI時間線提前至2029年；Starlette框架爆出嚴重認證繞過漏洞，影響數百萬AI代理；CrowdStrike等聯合摧毀Glassworm殭屍網絡；法國巴黎銀行與Mistral達成主權AI安全合作；中國限制阿里和深度求索頂尖AI工程師出境；Uber AI預算超支、ClickUp裁員並引入數千AI代理，同時MIT技術評論數據顯示AI暴露崗位失業率更低，奧特曼撤回白領失業預言。

Anthropic發佈Mythos模型，原本僅限NSA和五角大樓使用，現可通過標準API訪問。
深度思維CEO哈薩比斯將AGI實現時間從5-10年縮短至2029年。

DeepSeek V4還能更省！新工具緩存命中率高達99.82%，2折穩定到手

2026-05-25 12:40 UTC+8

DeepSeek V4系列發佈一個月後，開源社區推出Reasonix工具，專為DeepSeek設計，通過優化緩存機制將賬單成本降低至原來的五分之一左右。該工具緩存命中率高達99.82%，實現4億+token從61美元降至12美元。

Reasonix是專為DeepSeek打造的終端編碼工具，核心目標是降低使用成本。
通過緩存優先循環、工具調用修復和自動上下文壓縮等機制，實現長會話緩存命中率超90%。

Deepseek將75%折扣永久化，輸出令牌定價至少比GPT-5.5低34倍

2026-05-24 01:10 UTC+8

Deepseek宣佈其頂級模型V4-Pro的75%折扣永久生效。輸入令牌每百萬僅需0.435美元，至少比GPT-5.5便宜11.5倍，輸出令牌便宜34倍以上。對於令牌消耗巨大的代理系統，這一價格可能對西方供應商造成巨大壓力。

Deepseek永久保留V4-Pro模型75%的折扣。
輸入令牌定價0.435美元/百萬，比GPT-5.5低11.5倍。

阿里最新AI模型自主運行35小時優化自有芯片代碼

2026-05-23 18:17 UTC+8

阿里通義千問團隊發佈Qwen3.7-Max，專為長時間自主代理任務設計。在基準測試中匹配Claude Opus 4.6，超越DeepSeek V4 Pro和Kimi K2.6等中國對手。團隊還展示了該模型操控四足機器人。

Qwen3.7-Max專為長時間自主代理任務設計
基準測試匹配Claude Opus 4.6，超越中國競品

DeepSeek V4價格打骨折，寧王京東網易搶着入場，梁文鋒：目標是AGI

2026-05-23 17:46 UTC+8

DeepSeek宣佈V4-Pro API永久降價，寧德時代、京東、網易等巨頭正洽談參投其首輪融資。梁文鋒明確表示優先追求AGI，堅持開源路線。

DeepSeek-V4-Pro API永久降價至原價的四分之一
寧德時代、京東、網易等公司洽談投資DeepSeek

據報道，Deepseek優先考慮AGI研究而非短期利潤，儘管獲得數十億美元融資

2026-05-23 01:18 UTC+8

Deepseek正籌集約100億美元資金，估值約450億美元。創始人梁文峯向投資者表示，將通用人工智能（AGI）研究置於短期盈利之上。

Deepseek即將完成約100億美元融資，估值約450億美元。
創始人梁文峯強調AGI研究優先於短期利潤。

基於扁平度的理論最優量化

2026-05-20 12:00 UTC+8

本文提出一種新的量化指標“扁平度”來衡量異常值分佈，並據此推導出理論最優解。作者進一步提出雙向對角量化（BDQ）框架，通過學習到的對角操作將異常值分散到矩陣維度中，顯著提升了大語言模型低位寬量化的性能。實驗表明，BDQ在LLaMA-3-8B上W4A4量化精度下降不足1%，在DeepSeek-R1-Distill-LLaMA-70B的W2A4KV16任務中性能差距縮小39.1%。

提出Flatness指標量化異常值分佈，並推導理論最優解
BDQ框架通過雙向對角變換分散異常值

HELLoRA：混合專家模型的熱門專家層層級低秩適配方法

2026-05-20 12:00 UTC+8

HELLoRA是一種針對混合專家（MoE）模型的高效微調方法，僅對每層最活躍的專家附加LoRA模塊，從而減少可訓練參數和適配器帶來的計算量，同時提升下游任務性能。在OlMoE、Mixtral和DeepSeekMoE等模型上，HELLoRA在數學推理、代碼生成和安全對齊任務中均優於現有方法，例如在OlMoE上僅使用15.7%的參數，減少38.7%的FLOPs，吞吐量提升1.9倍，準確率提高9.2%。

HELLoRA僅對MoE模型每層最頻繁激活的專家附加LoRA模塊，實現參數高效微調。
在多種MoE模型上，HELLoRA顯著減少可訓練參數和計算開銷，同時提升性能。

2025年十大人工智能研究論文

2026-05-18 20:15 UTC+8

2025年AI研究從聊天機器人轉向推理系統、自主代理和多模態系統。十大論文包括DeepSeek-R1（強化學習）、Gemini 2.5（多模態推理）、Qwen2.5（開源模型）、Large Concept Models（概念級語言建模）、ESG分析抗漂綠、VideoWorld（世界模型）、AI Scientist-v2（自主研究）、SWE-Lancer（編碼代理基準）、OLMo 2（完全開源）和Mixture-of-Recursions（高效推理）。

DeepSeek-R1將強化學習後訓練方法公開，顯著提升推理和編碼能力。
Gemini 2.5引入“思考模式”，擴展多模態理解和長上下文。

GQLA：面向硬件自適應的大語言模型解碼的分組查詢潛在注意力機制

2026-05-18 12:00 UTC+8

研究人員提出了分組查詢潛在注意力（GQLA），這是對DeepSeek多頭潛在注意力（MLA）的改進，在不重新訓練的情況下提供兩種硬件自適應的解碼路徑。該方法能在H100和H20 GPU上實現高效推理，幷包含TransGQLA用於轉換預訓練的GQA模型。

GQLA在DeepSeek的MLA基礎上擴展出雙解碼路徑（MQA吸收和GQA），以適應不同硬件的roofline模型。
同一組GQLA權重既可用於H100（MQA路徑），也可用於H20（GQA路徑配合多token預測）。

最新開放製品（#21）：開放模型盛宴！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1等。關於CAISI對V4的評估。

2026-05-17 01:00 UTC+8

本月開放前沿實驗室紛紛發佈新模型，包括DeepSeek V4、Gemma 4、Kimi K2.6等。CAISI評估指出開放模型落後於美國前沿，且差距在擴大，但評估方法受到質疑，實際能力差距可能被高估。文章還介紹了多個亮點模型。

DeepSeek、Google、Moonshot AI等發佈多個開放模型。
CAISI評估顯示開放模型與封閉模型的Elo差距巨大，但基準測試方法存在爭議。

LLM架構最新發展：KV共享、mHC與壓縮注意力

2026-05-16 19:33 UTC+8

從Gemma 4到DeepSeek V4，本文探討了新的開源LLM如何通過跨層KV共享、逐層嵌入、注意力預算、壓縮卷積注意力和mHC等架構技術降低長上下文成本。

Gemma 4引入跨層KV共享，將KV緩存大小減半，同時保持模型質量。
逐層嵌入（PLE）通過增加小型嵌入參數提高模型容量，而不顯著增加計算成本。

我們測試了DeepSeek V4 Pro和Flash與Claude Opus 4.7及Kimi K2.6的對比

2026-05-15 09:39 UTC+8

我們對DeepSeek V4 Pro和Flash進行了與Claude Opus 4.7和Kimi K2.6相同的FlowGraph基準測試。Pro得分77/100，價格$2.25；Flash得分60/100，價格$0.02。Pro在性能上介於Opus（91）和Kimi（68）之間，但存在構建和租賃處理問題。Flash成本極低，但輸出缺少關鍵部分。

DeepSeek V4 Pro以77分和$2.25的價格位於Opus和Kimi之間。
DeepSeek V4 Flash以$0.02的成本獲得60分，但存在構建失敗和路由錯誤。

Violin：打破語言障礙的開源視頻翻譯技能

2026-05-14 08:00 UTC+8

Violin是一個完全開源的AI視頻翻譯工具，結合語音識別、大型語言模型翻譯和語音合成，使視頻內容跨越語言障礙。它提供網絡應用、命令行界面和代理技能，支持視頻內容問答和個性化語音選擇。使用Together API，利用Whisper、DeepSeek和Cartesia等模型，以MIT許可證發佈。

Violin將語音識別、LLM翻譯和語音合成整合為開源視頻翻譯工具。
支持網絡應用、CLI和代理技能，適合不同用户羣體。

騰訊計劃增加AI支出，因中國芯片供應據稱改善

2026-05-14 02:46 UTC+8

騰訊宣佈計劃在2026年下半年大幅增加AI基礎設施支出，原因是國內芯片製造商正在提升AI芯片產量。公司還公佈了強勁的第一季度業績，並正在談判入股Deepseek。

騰訊將在2026年下半年增加AI基礎設施支出。
中國芯片製造商正提升國內AI芯片產量。

思考越多，偏見越多：推理模型中長度驅動的立場偏差

2026-05-11 12:00 UTC+8

該論文挑戰了鏈式思維推理能減少偏見的普遍假設，通過實驗表明在多選題中，推理軌跡越長，立場偏差（位置偏好）越嚴重。研究涵蓋13種配置，發現12種顯示軌跡長度與立場偏差分數正相關，截斷實驗證明因果關係，且671B參數的DeepSeek-R1雖整體偏差低，但長軌跡下仍存在偏差。此外，直接回答的立場偏差是獨立現象。論文建議不應默認推理模型對選項順序魯棒，並提供了診斷工具包。

推理軌跡長度與立場偏差分數正相關，控制準確率後仍顯著。
截斷實驗表明，從軌跡後期繼續推理會增加選擇位置偏好選項的概率（16%-32%）。

梁文鋒出資200億！DeepSeek首輪創紀錄融資500億，V4.1定檔6月

2026-05-09 10:08 UTC+8

DeepSeek首輪融資目標最高500億元，梁文鋒個人出資200億，估值飆升至3500億元。同時，V4.1模型定檔6月發佈，公司從理想主義實驗室轉向商業化運營。

DeepSeek首輪融資最高500億元，梁文鋒個人出資200億元。
估值21天內從100億美元漲至500億美元。

DeepSeek以450億美元估值尋求融資，中國支持本土AI競爭對手

2026-05-09 07:14 UTC+8

DeepSeek正在以450億美元的估值進行首次外部融資，反映了中國對本土人工智能公司的大力支持。

DeepSeek首次尋求外部投資，估值達450億美元。
融資凸顯中國政府對本土AI產業的支持。

AI資金持續湧入：Deepseek計劃創紀錄融資，Core Automation估值數週內翻四倍

2026-05-09 01:50 UTC+8

Deepseek計劃進行高達73.5億美元的融資，創中國AI公司歷史紀錄，其V4.1版本將於6月發佈。與此同時，由前OpenAI研究員Jerry Tworek僅六週前創立的Core Automation，估值目標已達40億美元。

Deepseek計劃73.5億美元融資，為中國AI公司最大規模。
Deepseek V4.1預計於6月發佈。

Redis之父下場，給DeepSeek V4單獨造了一台推理引擎

2026-05-08 16:20 UTC+8

Redis創始人antirez為DeepSeek V4 Flash打造專用推理引擎ds4.c，在Mac上實現本地高性能運行，支持2-bit量化、KV緩存硬盤化及API兼容層，引發對模型專屬推理框架的討論。

Redis之父antirez發佈專為DeepSeek V4 Flash設計的推理引擎ds4.c，基於Metal框架，僅支持Apple Silicon。
通過非對稱量化、KV緩存外置和API兼容層實現128GB Mac上284B模型可用推理速度。

ZAYA1-8B技術報告

2026-05-08 12:00 UTC+8

ZAYA1-8B是一款基於MoE++架構的推理型混合專家模型，激活參數僅7億，總參數80億，在AMD全棧計算平台上訓練。它在數學和編程基準測試中與DeepSeek-R1-0528相當甚至超越，並提出了Markovian RSA測試時計算方法，進一步提升推理性能。

ZAYA1-8B擁有7億激活參數和80億總參數，在AMD平台上完整訓練。
在多個數學和編程基準測試中，表現與DeepSeek-R1-0528持平或更優。

部署DeepSeek-V4：為何百萬Token上下文是推理系統的問題

2026-05-08 08:00 UTC+8

DeepSeek-V4通過混合注意力設計（CSA、HCA、SWA）壓縮KV緩存，將百萬Token上下文從模型挑戰轉變為推理系統挑戰。Together AI在NVIDIA HGX B200上的早期部署經驗展示了緩存策略、前綴緩存和端點配置對長上下文工作負載性能的關鍵影響。

DeepSeek-V4的壓縮稀疏注意力（CSA）和高度壓縮注意力（HCA）減小了KV緩存大小，但推理引擎需要管理多種緩存佈局。
滑動窗口注意力（SWA）在長上下文時成為性能瓶頸，需謹慎選擇存儲策略。

Zyphra發佈ZAYA1-8B：基於AMD硬件訓練的小型推理MoE模型，性能遠超其體量

2026-05-07 13:44 UTC+8

Zyphra AI發佈了ZAYA1-8B，一款僅有7.6億活躍參數的小型混合專家（MoE）語言模型，但在數學和編程基準測試中擊敗了多個體量更大的開源模型。該模型採用MoE++架構，包含壓縮卷積注意力（CCA）、MLP路由器和PID控制器偏置平衡等創新，並引入了馬爾可夫遞歸自聚合（Markovian RSA）測試時計算方法，在HMMT'25上超越Claude 4.5 Sonnet，逼近DeepSeek-V3.2。模型完全在AMD Instinct MI300硬件上訓練，並以Apache 2.0許可發佈。

ZAYA1-8B僅有7.6億活躍參數，總參數84億，但在數學和編碼任務上超越多個更大模型。
採用MoE++架構，包括8倍KV緩存壓縮的CCA、MLP路由器及PID偏置平衡、學習殘差縮放。

Token需求狂飆千倍，22億熱錢湧向這家AGI Infra頭號玩家

2026-05-07 10:46 UTC+8

隨着AI進入Agent時代，Token需求爆發。無問芯穹作為國內中立AGI基礎設施頭部廠商，累計融資超22億元，日均Token調用量較2025年底增長超20倍。該公司支撐Kimi、GLM、MiniMax、DeepSeek等主流國產模型，成為Token經濟的關鍵樞紐。

Agent時代使單次任務Token消耗從數百飆升至百萬級，基礎設施面臨三重顛覆。
無問芯穹日均Token調用量每兩週翻一番，增速遠超全國平均水平。

Deepseek估值接近450億美元，中國國家芯片基金領投

2026-05-06 21:22 UTC+8

據英國《金融時報》報道，Deepseek即將完成一輪融資，估值約450億美元。中國國家集成電路產業投資基金（大基金）領投，騰訊也在洽談入股。創始人梁文峯持有89.5%股份，可能個人投資。估值在數週內從200億美元攀升。

Deepseek估值約450億美元，中國大基金領投
騰訊也在洽談入股

Show HN：Token用量儀表盤——12家提供商與編程代理

2026-05-06 00:03 UTC+8

qlaud推出包含qcode編程代理、Router API網關和Platform託管後端的全棧AI工具集。qcode在桌面本地運行，支持Claude、GPT、DeepSeek、Llama等前沿模型，保障代碼隱私；Router提供統一的API接口，具備故障轉移和延遲監控；Platform提供持久化線程、MCP連接器和向量搜索等能力。

qcode是本地運行的編程代理，支持多種前沿模型，代碼不出本地。
Router提供統一API，集成故障轉移和延遲監控。

亞馬遜通過支持Llama、Qwen、Deepseek和Nova為SageMaker帶來智能微調

2026-05-05 18:08 UTC+8

亞馬遜SageMaker AI現在包含一個AI代理，幫助開發者用自然語言描述用例，自動推薦訓練方法、準備數據、啓動訓練並提供可編輯的Jupyter筆記本代碼。支持Llama、Qwen、Deepseek和Nova等模型系列。

SageMaker AI新增Kiro AI代理，支持自然語言描述用例並自動完成微調工作流。
代理預裝在開發環境中，也可使用Claude Code等其他代理。

DeepSeek

相關主題