DeepSeek

來源分布

Hacker News AI28
The Decoder5
量子位4
MarkTechPost3
AI Weekly1
Analytics Vidhya1
Artificial Intelligence News1
arXiv AI1

主題分布

Agent37
模型24
晶片22
研究15
政策6
創業融資2
工具1

日期線

2026-06-213
2026-05-232
2026-05-262
2026-05-272
2026-05-292
2026-06-032
2026-06-082
2026-06-182

最新動態

2026年中AI模型分級

2026-07-11 23:43 UTC+8

作者從個人編碼和審計經驗出發，對2026年中的主流AI模型進行非正式分級，涵蓋Anthropic Fable、OpenAI Sol、Mistral、Gemini和DeepSeek等模型，並融入美國出口管制和歐洲視角的評論。

Fable（Anthropic）被評為B級，雖然流暢但不可靠，常隱藏錯誤。
Sol（OpenAI）被評為S級，在低階程式碼和測試方面表現出色，值得信賴。

DeepSeek V3.2 在 Hugging Bay 上釋出

2026-07-11 09:44 UTC+8

DeepSeek V3.2 現已登陸 Hugging Bay，這是一個開源 AI 工件註冊平臺，提供來源驗證、許可證稽核和可信託管服務。

DeepSeek V3.2 已在 Hugging Bay 上釋出。
Hugging Bay 是一個開源登錄檔，具備來源驗證和信任功能。

DeepSeek計劃自主研發AI晶片

2026-07-09 22:42 UTC+8

總部位於杭州的人工智慧初創公司DeepSeek正在設計自己的晶片，旨在減少對美國晶片巨頭輝達和華為的依賴。該晶片專注於推理而非訓練，以降低服務成本並適應美國出口管制。憑藉其在模型與硬體協同設計方面的優勢，DeepSeek有望在定價戰中進一步壓低價格，但面臨先進製造和記憶體受限的挑戰。

DeepSeek自研推理晶片，減少對輝達和華為的依賴。
晶片設計聚焦於推理階段，以最佳化成本並應對出口管制。

DeepSeek DSpark：實現LLM速度提升400%的推測解碼技巧

2026-07-09 02:26 UTC+8

DeepSeek釋出了DSpark模組，透過半自迴歸草案模型結合馬爾可夫頭，同時解決了推測解碼中草案質量低和驗證浪費兩大問題。在DeepSeek-V4上，它使每使用者生成速度提升60-85%，且不降低模型質量。本文深入解析其工作原理、開源工具DeepSpec的使用方法及實驗結果。

DSpark採用半自迴歸草案模型，兼具並行速度和序列連貫性。
馬爾可夫頭以極低開銷提供與RNN頭相當的效果，已投入生產。

AI模型“過度思考”問題——這是一種安全風險

2026-07-08 19:00 UTC+8

研究表明，具備推理能力的大語言模型容易因邏輯不一致的提示而陷入“過度思考”，導致輸出長度激增，可能被利用發動拒絕服務攻擊。浙江大學與阿里巴巴的研究人員開發了一種進化演算法，能夠生成惡意提示，使模型輸出長度最高增加26倍，影響包括DeepSeek-R1、Qwen3-Thinking、GPT-o3和Gemini 2.5 Flash在內的主流推理模型。

研究人員展示了一種利用AI推理模型“過度思考”漏洞的新型攻擊，導致計算量急劇增加。
透過進化演算法破壞提示的邏輯結構，可使模型輸出長度最高達到正常情況的26倍。

中國AI模型憑藉成本優勢在美國企業中的採用率上升

2026-07-08 05:48 UTC+8

中國開發的AI模型正逐漸縮小與領先美國競爭對手的效能差距，同時保持顯著的價格優勢，因此在美國公司中越來越受歡迎。最近DeepSeek和Z.ai等中國公司釋出的模型被認為與Anthropic和OpenAI等前沿系統高度競爭。這些進步正值許多美國AI實驗室最先進模型的token價格上漲，使企業面臨與使用該技術相關的意外高成本。

中國AI模型效能提升，與美國領先模型差距縮小。
DeepSeek和Z.ai等中國公司的模型在成本上更具優勢。

DeepSeek V4 在代理型代幣份額中嶄露頭角

2026-07-07 04:27 UTC+8

DeepSeek V4 模型自2026年4月釋出以來，在OpenRouter上的代幣份額從年初的9%翻倍至18%，主要由代理型工作負載驅動。其成本效益比（每百萬代幣輸入0.09美元，輸出0.18美元）領先業界，吸引各類使用者採用，並推動中國模型整體超越美國模型。

DeepSeek V4 釋出後六個月內，代幣份額從9%增至18%。
代理型工作負載是主要增長動力，V4-Flash佔DeepSeek代理型代幣流量的70%。

NVIDIA 推理軟體堆疊如何實現最低令牌成本

2026-06-30 23:00 UTC+8

NVIDIA 的推理軟體堆疊透過與 GPU、CPU、網路和系統的協同設計，並藉助開源生態系統，持續提升硬體效能。在 Blackwell 平臺上，該軟體堆疊在一個月內將 DeepSeek V4 模型的令牌成本降低了 5 倍。文章詳細介紹了軟體最佳化如何透過生產運營、應用加速和基礎設施訪問三個層次，將單個最佳化轉化為系統級效能提升，從而降低每令牌成本。

NVIDIA 全棧推理軟體透過協同設計，在 Blackwell 平臺上一個月內將令牌成本降低 5 倍。
Baseten、Cognition 等公司利用 TensorRT-LLM 和 Dynamo 框架實現了顯著效能提升。

AI新聞：今天沒什麼大事發生

2026-06-30 14:47 UTC+8

今天AI領域相對平靜，但仍有重要進展：Meta的非侵入式腦機介面Brain2Qwerty v2、Cursor的iOS遠端代理釋出、DeepSeek的DSpark推測解碼技術、開放權重模型的商業化訪問，以及Snowflake的Arctic RL訓練基礎設施。Reddit社群討論了在兩臺Mac上本地執行GLM-5.2 753B的情況。

Meta釋出Brain2Qwerty v2，非侵入式解碼器在即時打字任務中達到約61%的詞準確率。
Cursor推出iOS應用，支援始終線上的雲代理和遠端控制桌面代理。

低成本中國AI模型如DeepSeek在美國受到青睞

2026-06-29 23:15 UTC+8

美國開發者和小型企業正在轉向中國AI模型以降低成本。儘管效能仍落後於美國頂尖模型，但中國模型能以極低價格處理大多數任務。微軟也在考慮使用DeepSeek等開源模型作為更低成本的替代方案。然而，中國公司面臨將流行度轉化為可觀收入的挑戰。

美國開發者用DeepSeek替代Claude，成本從10美元降至不到50美分。
中國模型價格低廉得益於國內較低的薪資和基礎設施成本。

DeepSeek釋出DSpark：一種投機解碼框架，將DeepSeek-V4每使用者生成速度提升60-85%

2026-06-28 00:59 UTC+8

DeepSeek開源了DSpark，一種投機解碼框架，透過附加草稿模組到現有DeepSeek-V4權重上。它結合並行草稿骨幹和輕量級馬爾可夫頭以減少字尾衰減，並加入基於置信度的排程驗證，根據即時GPU負載調整檢查的令牌數量。離線測試中，接受長度比DFlash和Eagle3提升16-31%；生產環境下，每使用者生成速度比MTP-1基線提升57-85%，且無損。訓練程式碼庫DeepSpec採用MIT許可證。

DSpark結合並行草稿骨幹和輕量級馬爾可夫頭，提高字尾接受率。
基於置信度的驗證根據GPU負載動態調整檢查令牌數。

用Golang編寫的原生Hacker News TUI客戶端，具備AI評論摘要功能

2026-06-28 00:04 UTC+8

cwnews是一款終端下的Hacker News閱讀器，支援六個資料來源、三種主題、執行緒摺疊評論以及透過DeepSeek V4 Flash實現的AI摘要功能。它用Go和Bubbletea v2構建，左側面板顯示故事列表，右側面板呈現巢狀評論，並可透過按's'鍵呼叫AI即時總結討論內容。所有資料快取在SQLite中，確保快速響應。

終端UI客戶端，支援Hacker News的六個資料來源（Top/New/Best/Ask/Show/Jobs）。
評論以可摺疊的執行緒樹形式展示，帶有深度顏色標記。

DeepSeek開源推理最佳化，生成速度提升60–85%

2026-06-27 17:18 UTC+8

DeepSeek開源了一套推理最佳化技術，可將生成速度提升60%至85%，相關技術論文已在GitHub上釋出。

DeepSeek釋出了推理最佳化技術
生成速度提升60-85%

cwmail：原生Golang終端郵件客戶端，整合DeepSeek V4 Pro AI起草功能

2026-06-27 11:36 UTC+8

cwmail是一款基於Go語言和Bubbletea v2開發的終端郵件客戶端，支援HTML郵件渲染、內嵌圖片顯示、多賬戶IMAP管理、IDLE推送通知以及由DeepSeek V4 Pro驅動的AI回覆起草功能。它提供快速本地搜尋、撤銷刪除、草稿自動儲存、CLI傳送模式等特性，且不依賴任何雲服務，使用者資料完全本地儲存。

使用Go語言和Bubbletea v2構建，在終端中提供完整的郵件管理體驗。
支援多賬戶IMAP，可同時管理Gmail、iCloud、Outlook等賬戶，並採用IDLE推送通知而非輪詢。

DeepSeek Flash 顛覆了智慧代理產品的經濟模式

2026-06-26 06:56 UTC+8

DeepSeek Flash 透過提供廉價、快速、純文本的程式碼生成模型，打破了開發者與大型模型實驗室之間不合理的定價關係。它使得智慧代理的構建者能夠從依賴昂貴的多模態 API 轉向使用開源模型作為編譯器，大幅降低成本並重構了瀏覽器代理的架構。

DeepSeek Flash 改變了智慧代理產品的經濟模式，使開發者無需再補貼競爭對手。
透過將模型從執行者轉變為編譯器，代理的工作流從數十次模型呼叫減少為一次規劃呼叫。

我們在20秒內部署了DeepSeek-V4-Pro服務

2026-06-26 04:49 UTC+8

Inferize公司宣佈成功在20秒內部署DeepSeek-V4-Pro模型，實現極快且高效的LLM服務，並邀請使用者加入等待列表。

Inferize在20秒內部署了DeepSeek-V4-Pro模型
該公司提供高度最佳化的彈性AI推理服務

百度釋出Unlimited OCR：3B引數模型透過恆定KV快取實現長文件高效解析

2026-06-25 13:39 UTC+8

百度開源了Unlimited OCR，這是一個30億引數的混合專家模型，採用參考滑動視窗注意力機制（R-SWA）保持KV快取恆定，從而在一次前向傳播中高效解析數十頁文件。在OmniDocBench v1.5上達到93.23分，比DeepSeek OCR基線高出6.22分，採用MIT許可證。

Unlimited OCR擁有30億總引數，但推理時僅啟用5億引數。
參考滑動視窗注意力（R-SWA）使KV快取大小恆定，不隨輸出長度增長。

Show HN：利用逼真AI語音將電子書轉換為有聲書

2026-06-24 23:04 UTC+8

一位開發者構建了名為ebookaloud的服務，利用開源Kokoro模型將電子書轉換為有聲書，並採用AI多智慧體程式設計工作流（主要使用DeepSeek）。該產品按需付費，質量足夠好，未來計劃支援更多語言和PDF提取。

使用開源Kokoro模型生成逼真AI語音，可長時間聆聽而不疲勞。
99%的程式碼由DeepSeek v4透過多智慧體工作流編寫，成本僅12美元。

更便宜、更安全的代理式AI工作流程

2026-06-22 02:39 UTC+8

一位開發者透過使用GLM-5.2和DeepSeek V4 Flash等模型，實現了低成本、高效的代理式AI編碼，同時透過虛擬機器隔離保護隱私。文章分享了具體步驟、成本對比（低至0.034美元）以及對AI行業商業模式的思考。

使用GLM-5.2和DeepSeek V4 Flash模型，任務成本低至0.034美元，耗時僅3分鐘。
透過VirtualBox中的Debian虛擬機器隔離環境，保護私有資料。

Show HN: CommitGate – 自動掃描提交中的漏洞

2026-06-21 23:35 UTC+8

CommitGate 是一個 AI 驅動的 Git 預提交安全門，在每次 git commit 時自動掃描暫存區差異，阻止包含金鑰、令牌或危險程式碼的提交進入歷史記錄。它結合 Gitleaks 確定性掃描和 LLM 語義分析，支援 OpenAI、DeepSeek、Groq 等 AI 提供商，並可將審計日誌傳送到 Splunk。

在每次提交前自動掃描暫存區差異，阻止高風險程式碼進入倉庫。
雙引擎掃描：Gitleaks 檢測已知金鑰模式，AI 評審器捕捉正規表示式遺漏的漏洞。

AI模型釋出節奏分析：兩家實驗室加速，三家放緩

2026-06-21 10:16 UTC+8

本文透過資料分析了前沿AI模型的釋出節奏，發現Anthropic和OpenAI的釋出頻率在加速，而谷歌、Meta和DeepSeek並未出現類似趨勢。作者探討了遞迴自我改進的可能性，並指出了驗證這一假設的下一步觀察點。

Anthropic和OpenAI的模型釋出節奏在加速，其他三家實驗室未出現此趨勢。
加速可能源於遞迴自我改進，即實驗室利用自身模型改進後續模型。

7.4億美元背後的深層意義：DeepSeek的A輪融資標誌著中國AI聯盟的轉變

2026-06-21 07:47 UTC+8

本週三大看點：DeepSeek獲騰訊領投74億美元A輪融資，顯示中國AI投資正轉向非生態系統參與者；日本計劃到2040年投入650億美元公私合作建設物理AI基礎設施；智譜AI的GLM 5.2模型在設計基準測試中超越Anthropic的Claude，直接挑戰西方AI效能標準。

DeepSeek獲騰訊領投74億美元A輪融資，阿里巴巴和字節跳動未參與。
日本計劃到2040年投入650億美元建設物理AI基礎設施，優先硬體以對抗西方領導地位。

VibeThinker-3B：基於Qwen2.5-Coder-3B與頻譜到訊號後訓練流水線的3B密集推理模型

2026-06-20 06:06 UTC+8

VibeThinker-3B是一個僅30億引數的開源推理模型，在可驗證基準測試中匹配DeepSeek V3.2和Kimi K2.5等千億級模型。它採用頻譜到訊號後訓練流水線，透過監督微調、強化學習和自蒸餾實現高效推理，並引入測試時縮放方法CLR進一步提升效能。

VibeThinker-3B僅有3B引數，MIT許可證開源，基於Qwen2.5-Coder-3B構建，專攻可驗證推理。
在AIME26上得分94.3，與671B的DeepSeek V3.2和1T的Kimi K2.5相當。

華為晶片助力DeepSeek模型精調，中國AI自主可控邁出重要一步

2026-06-20 01:33 UTC+8

華為使用其昇騰910C晶片成功完成對DeepSeek-V4-Pro模型的後訓練，這是中國半導體產業在複雜AI模型訓練領域取得的關鍵突破。該專案由華為與多家研究機構合作，利用1000多顆晶片叢集實現了1.6萬億引數模型的全引數後訓練，展示了國產晶片從推理到訓練的能力跨越。此舉有助於提升中國AI產業鏈的自主性，在美製裁背景下推動國內替代方案的發展。

華為與多家機構合作，使用昇騰910C晶片成功完成DeepSeek-V4-Pro模型的後訓練。
專案採用至少1000顆晶片叢集，對1.6萬億引數模型進行全引數精調。

Show HN: Wolffish – 一個作業系統的個人桌面AI代理

2026-06-19 19:32 UTC+8

Wolffish是一款桌面AI代理應用，安裝即用，無需伺服器或複雜設定，支援多種模型，包括DeepSeek、GLM、Claude、GPT等，並能完全離線執行。它注重隱私和安全，所有資料保留在本地，開源免費。

Wolffish是一款簡單易用的桌面AI代理，無需複雜設定。
它支援多種AI模型，包括本地模型，確保資料隱私。

微軟在中國銷售OpenAI模型，而OpenAI和Anthropic拒絕

2026-06-18 17:00 UTC+8

微軟已成為中國市場上OpenAI模型的主要供應商，向字節跳動、螞蟻集團、美團和騰訊等大型網際網路公司銷售GPT系列模型，儘管OpenAI和Anthropic出於智慧財產權和濫用風險拒絕直接進入中國市場。該業務為微軟帶來獨特優勢，使其成為唯一一家向中國銷售美國AI模型的美國供應商。據彭博社報道，微軟Azure在中國的AI收入增長迅猛，2025財年約增長三倍。微軟透過其與OpenAI的獨家合同提供這些模型，並採取監控措施防止模型蒸餾，但中國客戶面臨審查有限。同時，微軟也在測試中國模型DeepSeek用於西方企業，形成雙向貿易。

微軟透過其與OpenAI的獨家合同，向中國大型網際網路公司提供GPT模型，而OpenAI和Anthropic拒絕直接銷售。
字節跳動是微軟最大的AI客戶，年度支出超過10億美元；螞蟻集團、美團和騰訊也透過Azure購買AI模型。

歸因引導與覆蓋最大化的結構化MoE剪枝方法

2026-06-18 12:00 UTC+8

本文提出一種面向混合專家模型的結構化剪枝框架，透過將剪枝比率分配轉化為通道分數覆蓋最大化問題，並利用基於歸因的近似方法高效求解。實驗表明，在50%或25%結構化剪枝結合4位量化條件下，該方法在DeepSeek和Qwen MoE模型上保持了模型精度，並在Qwen3-30B-A3B上實現5.27倍記憶體壓縮，超越現有基準。

發現MoE專家內部資訊集中在少數通道，存在顯著冗餘
提出通道級結構化剪枝框架，將剪枝比率分配建模為覆蓋最大化問題

專為本地LLM和DeepSeek v4最佳化的原生編碼代理，具備向量記憶功能

2026-06-17 06:36 UTC+8

cwcode是一個基於Go語言的終端編碼代理，利用DeepSeek V4 Pro等模型，提供檔案編輯、子代理、語義記憶和自動恢復等功能。它強調低成本（每小時約0.40美元）、高效快取（85%以上命中率），並支援本地模型和多種API。

基於Go的終端編碼代理，支援DeepSeek V4 Pro、Qwen3.6-27B等模型
採用雜湊錨定編輯和粘性字首快取，降低令牌消耗和成本

跨主流AI平臺的令牌使用與訂閱追蹤

2026-06-14 12:09 UTC+8

Tokens 4 Breakfast 是一款 macOS 選單欄應用，用於即時追蹤和監控AI工具（如 Claude、OpenAI、Cursor、Copilot、Gemini、DeepSeek、Mistral 等）的令牌使用、訂閱費用和速率限制，幫助開發者避免意外超支。應用提供免費版（支援單一供應商）和一次性付費的 Pro 版（$7.99），所有資料本地處理，無需登入或雲服務。

即時選單欄顯示AI使用成本、速率限制和訂閱支出。
支援8大AI供應商，包括 Claude、OpenAI、Cursor 等。

中國打擊西方AI模型，美國公司卻湧入DeepSeek

2026-06-13 10:51 UTC+8

中國國家安全部警告使用西方AI模型存在安全風險，同時美國企業因成本優勢紛紛採用中國開源模型。雙方在AI領域相互牽制，使用者繞道訪問對方模型的現象加劇了技術博弈。

中國國家安全部警告透過第三方工具訪問美國AI模型可能帶來安全風險
美國企業因成本優勢大量使用DeepSeek、阿里Qwen等中國開源模型

Pythagoras-Prover: 透過增強型Lean形式化推進高效形式化證明

2026-06-12 12:00 UTC+8

Pythagoras-Prover是一個計算高效的Lean定理證明器家族，包含4B和32B的自迴歸模型以及4B的擴散模型。它透過分層課程SFT和動態證明過濾提高訓練效率，並引入增強型Lean形式化(ALF)擴充套件驗證語料庫。實驗顯示，4B模型在MiniF2F-Test上以86.1%的pass@32超越DeepSeek-Prover-V2-671B（82.4%），而32B模型達到93.0%的新開源最佳水平，並在PutnamBench上解決93個問題。

Pythagoras-Prover包含4B和32B自迴歸模型及4B擴散模型，擴散模型在推理時迭代細化證明。
透過分層課程SFT和動態證明過濾實現訓練效率提升，保持8k token上下文預算。

深度求索讓AI變便宜，現在卻需要數十億來維持低價

2026-06-08 20:36 UTC+8

深度求索（DeepSeek）曾以低成本AI模型震驚業界，但現在美國評估顯示其模型落後前沿約8個月，儘管價格更低。公司正進行大規模融資，估值高達600億美元，以維持其在AI競賽中的競爭力。

美國CAISI評估認為DeepSeek V4 Pro是最強中國模型，但落後美國前沿約8個月。
DeepSeek正進行超過500億元人民幣（約74億美元）的融資，估值接近600億美元。

Deepseek在2026年6月位列Ramp熱門軟體供應商榜首，美國企業尋求更便宜的AI

2026-06-08 00:06 UTC+8

2026年6月，Deepseek成為Ramp平臺上最受歡迎的付費軟體供應商，美國企業直接向其傳送資料。Ramp首席經濟學家Ara Kharazian指出成本意識是驅動因素，但警告使用中國模型的安全風險。

Deepseek在2026年6月成為Ramp熱門軟體供應商第一名。
美國企業為降低成本轉向使用Deepseek的付費AI服務。

職位搜尋器：AI驅動的求職助手

2026-06-06 23:36 UTC+8

職位搜尋器是一款為應屆畢業生設計的AI工具，透過分析簡歷自動生成LinkedIn搜尋查詢，並基於技能、經驗、教育、行業和資歷五個維度對職位進行評分。該專案使用DeepSeek V4 Pro作為教師模型生成標籤，Qwen3-8B作為學生模型進行推理，訓練資料包括2500份簡歷和約10000個職位。所有程式碼、資料集和模型均已開源。

自動簡歷分析並生成LinkedIn搜尋查詢
基於五個維度的職位匹配評分

DeepSWE 結果不可靠——同一模型解決了全部 3/3 個“失敗”任務

2026-06-05 00:32 UTC+8

對 DeepSWE 基準測試的審計發現，deepseek-v4-pro 的報告結果（8% 解決率，平均成本 4.22 美元）存在多個問題：成本因忽略快取定價膨脹約 5 倍，所有三個失敗任務均被同一模型成功解決，OpenRouter 隱私設定預設阻止 DeepSeek 導致 404 錯誤，且模型未像競品一樣進行推理努力調優。

成本膨脹約 5 倍：基準測試對所有輸入令牌按快取未命中率計費，忽略 78% 的快取命中（99.2% 折扣）。
三個“失敗”任務全部解決：使用相同模型 deepseek-v4-pro，總成本約 0.86 美元。

DigitalOcean 成為 OpenRouter AI 模型提供商

2026-06-03 16:25 UTC+8

DigitalOcean 宣佈成為 OpenRouter 的模型提供商，提供 DeepSeek V3.2、Kimi K2.6 和 DeepSeek V4 Flash 模型。此舉表明該公司正從雲基礎設施擴充套件到 AI 推理領域。

DigitalOcean 在 X 上宣佈成為 OpenRouter 的模型提供商
首批模型包括 DeepSeek V3.2、Kimi K2.6 和 DeepSeek V4 Flash

Dropstone 1.5：每月15美元，兩倍於Claude Code的使用量

2026-06-03 11:59 UTC+8

Dropstone 1.5 是一款終端中的AI程式設計代理，每月重新評估頂級模型並切換至最佳者。當前基於DeepSeek和Kimi模型，美國伺服器託管，不儲存資料。每月15美元提供約450次深度程式設計會話，約為Claude Code Pro的兩倍（後者20美元）。注重安全，所有操作需確認。

每月15美元，約450次深度程式設計會話，是Claude Code Pro的兩倍。
使用DeepSeek V4 Flash、V4 Pro和Kimi K2.6模型，美國伺服器託管。

Show HN：Tkcore AI – 支援自定義知識庫的多模型工作空間

2026-06-02 15:26 UTC+8

Tkcore AI 是一個多模型工作空間，整合了 DeepSeek、Qwen、GLM、Kimi 和 MiniMax 等多種 AI 模型，提供低延遲響應、長上下文、多模態輸入以及透過檔案上傳實現自定義知識庫功能。

支援 DeepSeek、Qwen、GLM、Kimi 和 MiniMax 等多個模型，適用於不同任務。
低延遲、高吞吐量文本處理，支援影像/影片等多模態輸入。

新綜述論文：程式碼不僅是AI智慧體的產物，更是其思考與行動的方式

2026-05-29 21:10 UTC+8

一篇新綜述論文指出，自主AI智慧體的真正瓶頸並非語言模型本身，而是圍繞其構建的軟體層。工具、記憶、測試和許可權邊界將無狀態模型轉變為可工作的智慧體。Deepseek已在北京組建專門的“Harness”團隊，其核心公式驗證了該論點：模型加Harness等於AI智慧體。

論文強調AI智慧體的瓶頸在於軟體封裝層，而非語言模型。
工具、記憶、測試和許可權管理是將模型轉化為智慧體的關鍵。

PPIO入選非凡產研「2026 Global AI 100」，以AI實力領跑出海新浪潮

2026-05-29 19:24 UTC+8

PPIO 入選非凡產研發布的「2026 Global AI 100」榜單，該榜單由非凡大賞年度 AI 全球化增長峰會評選，旨在發掘全球化 AI 原生公司。PPIO 以全球化分散式算力基礎設施、全棧雲服務、模型平臺（支援 DeepSeek、GLM 等）及 Agent 沙箱等創新產品，為出海企業提供低時延、高可用的算力網路。截至 2026 年 4 月，PPIO 整合全球 4800+ 節點，日均 Token 呼叫量超 10000 億，開發者使用者超 57 萬。同時獲評上海市數字出海服務平臺試點單位及 GDA 領航服務站。

PPIO 入選「2026 Global AI 100」榜單，彰顯其在 AI 出海領域的領先地位。
提供全球化分散式算力基礎設施，覆蓋 GPU 全型號，支援大規模訓練與推理。

Show HN：我將一個 Python AI 代理和 Vue 儀表盤打包成了一個 Electron 應用

2026-05-28 18:12 UTC+8

Hermes Desktop 是一個跨平臺的桌面應用，它將 Python 執行時、hermes-agent（自改進 AI 代理）和 hermes-web-ui（Vue 3 + Koa 聊天儀表盤）打包到一個 Electron 應用中，使用者無需單獨安裝 Python 或 Node。應用整合了 DingTalk 並透過 DeepSeek 驅動。

打包了 Python 執行時和 hermes-agent，實現無需依賴即可執行
使用 Electron 作為外殼，整合 hermes-web-ui 前端

DeepSeek陳德里開發自動研究Skill，寫一篇論文人類只動腦2小時

2026-05-27 09:14 UTC+8

DeepSeek研究員陳德里使用自研的DeliAutoResearch技能，與DeepSeek-V4-Pro和GPT-Image2合作，在6天內完成了一篇46頁的論文。論文提出了L1-L5自主研究智慧體分類體系，分析了四種架構模式和17個主流系統，並指出了六大開放問題。陳德里表示，人類僅需投入不到2小時的“CPU時間”，其餘工作由AI Agent完成。

陳德里開發自動研究技能DeliAutoResearch，論文99%由Agent撰寫。
論文提出L1-L5自主研究智慧體分類，類比自動駕駛SAE級別。

AI週刊第496期：Anthropic的國防級模型現已全民可用

2026-05-27 08:00 UTC+8

本週AI新聞要點：Anthropic公開了此前僅限國防承包商使用的頂級模型Mythos，使五角大樓級AI能力向開發者開放；DeepMind CEO哈薩比斯將AGI時間線提前至2029年；Starlette框架爆出嚴重認證繞過漏洞，影響數百萬AI代理；CrowdStrike等聯合摧毀Glassworm殭屍網路；法國巴黎銀行與Mistral達成主權AI安全合作；中國限制阿里和深度求索頂尖AI工程師出境；Uber AI預算超支、ClickUp裁員並引入數千AI代理，同時MIT技術評論資料顯示AI暴露崗位失業率更低，奧特曼撤回白領失業預言。

Anthropic釋出Mythos模型，原本僅限NSA和五角大樓使用，現可透過標準API訪問。
深度思維CEO哈薩比斯將AGI實現時間從5-10年縮短至2029年。

據報道中國要求頂尖AI研究人員出國前需獲批准

2026-05-26 22:25 UTC+8

中國正在限制阿里巴巴和DeepSeek等私營公司的頂尖AI研究人員出國旅行，他們需要獲得官方批准才能離境。北京擔心資料洩露、技術盜竊和人才挖角，正在加強對國內AI行業的管控。

中國要求頂尖AI研究人員出國前需獲得許可。
該政策適用於阿里巴巴和DeepSeek等私營公司。

Cited AI Workspace：無需重複上傳檔案

2026-05-26 10:18 UTC+8

UUMuse 是一個雲端AI知識庫平臺，只需上傳一次檔案，即可在GPT、Claude、DeepSeek、Qwen等多個模型中進行帶有引用的問答、生成內容和部署。支援透過API和MCP供代理和應用呼叫，提供永久記憶、多專家辯論（Spark）、代理模式等功能，並可將知識庫部署為文件網站、小部件、API端點等。

一次上傳，多模型使用：檔案上傳後，GPT、Claude、DeepSeek、Qwen等模型均可基於同一知識庫作答並引用來源。
記憶與代理：AI記住你的偏好和專案上下文，代理模式自動規劃並執行任務，無需重複指令。

DeepSeek V4還能更省！新工具快取命中率高達99.82%，2折穩定到手

2026-05-25 12:40 UTC+8

DeepSeek V4系列釋出一個月後，開源社群推出Reasonix工具，專為DeepSeek設計，透過最佳化快取機制將賬單成本降低至原來的五分之一左右。該工具快取命中率高達99.82%，實現4億+token從61美元降至12美元。

Reasonix是專為DeepSeek打造的終端編碼工具，核心目標是降低使用成本。
透過快取優先迴圈、工具呼叫修復和自動上下文壓縮等機制，實現長會話快取命中率超90%。

Deepseek將75%折扣永久化，輸出令牌定價至少比GPT-5.5低34倍

2026-05-24 01:10 UTC+8

Deepseek宣佈其頂級模型V4-Pro的75%折扣永久生效。輸入令牌每百萬僅需0.435美元，至少比GPT-5.5便宜11.5倍，輸出令牌便宜34倍以上。對於令牌消耗巨大的代理系統，這一價格可能對西方供應商造成巨大壓力。

Deepseek永久保留V4-Pro模型75%的折扣。
輸入令牌定價0.435美元/百萬，比GPT-5.5低11.5倍。

阿里最新AI模型自主執行35小時最佳化自有晶片程式碼

2026-05-23 18:17 UTC+8

阿里通義千問團隊釋出Qwen3.7-Max，專為長時間自主代理任務設計。在基準測試中匹配Claude Opus 4.6，超越DeepSeek V4 Pro和Kimi K2.6等中國對手。團隊還展示了該模型操控四足機器人。

Qwen3.7-Max專為長時間自主代理任務設計
基準測試匹配Claude Opus 4.6，超越中國競品

DeepSeek V4價格打骨折，寧王京東網易搶著入場，梁文鋒：目標是AGI

2026-05-23 17:46 UTC+8

DeepSeek宣佈V4-Pro API永久降價，寧德時代、京東、網易等巨頭正洽談參投其首輪融資。梁文鋒明確表示優先追求AGI，堅持開源路線。

DeepSeek-V4-Pro API永久降價至原價的四分之一
寧德時代、京東、網易等公司洽談投資DeepSeek