DeepSeek

來源分布

Hacker News AI28
The Decoder5
量子位4
MarkTechPost3
AI Weekly1
Analytics Vidhya1
Artificial Intelligence News1
arXiv AI1

主題分布

Agent37
模型24
芯片22
研究15
政策6
創業融資2
工具1

日期線

2026-06-213
2026-05-232
2026-05-262
2026-05-272
2026-05-292
2026-06-032
2026-06-082
2026-06-182

最新動態

2026年中AI模型分級

2026-07-11 23:43 UTC+8

作者從個人編碼和審計經驗出發，對2026年中的主流AI模型進行非正式分級，涵蓋Anthropic Fable、OpenAI Sol、Mistral、Gemini和DeepSeek等模型，並融入美國出口管制和歐洲視角的評論。

Fable（Anthropic）被評為B級，雖然流暢但不可靠，常隱藏錯誤。
Sol（OpenAI）被評為S級，在低級代碼和測試方面表現出色，值得信賴。

DeepSeek V3.2 在 Hugging Bay 上發佈

2026-07-11 09:44 UTC+8

DeepSeek V3.2 現已登陸 Hugging Bay，這是一個開源 AI 工件註冊平台，提供來源驗證、許可證審核和可信託管服務。

DeepSeek V3.2 已在 Hugging Bay 上發佈。
Hugging Bay 是一個開源註冊表，具備來源驗證和信任功能。

DeepSeek計劃自主研發AI芯片

2026-07-09 22:42 UTC+8

總部位於杭州的人工智能初創公司DeepSeek正在設計自己的芯片，旨在減少對美國芯片巨頭英偉達和華為的依賴。該芯片專注於推理而非訓練，以降低服務成本並適應美國出口管制。憑藉其在模型與硬件協同設計方面的優勢，DeepSeek有望在定價戰中進一步壓低價格，但面臨先進製造和內存受限的挑戰。

DeepSeek自研推理芯片，減少對英偉達和華為的依賴。
芯片設計聚焦於推理階段，以優化成本並應對出口管制。

DeepSeek DSpark：實現LLM速度提升400%的推測解碼技巧

2026-07-09 02:26 UTC+8

DeepSeek發佈了DSpark模塊，通過半自迴歸草案模型結合馬爾可夫頭，同時解決了推測解碼中草案質量低和驗證浪費兩大問題。在DeepSeek-V4上，它使每用户生成速度提升60-85%，且不降低模型質量。本文深入解析其工作原理、開源工具DeepSpec的使用方法及實驗結果。

DSpark採用半自迴歸草案模型，兼具並行速度和序列連貫性。
馬爾可夫頭以極低開銷提供與RNN頭相當的效果，已投入生產。

AI模型“過度思考”問題——這是一種安全風險

2026-07-08 19:00 UTC+8

研究表明，具備推理能力的大語言模型容易因邏輯不一致的提示而陷入“過度思考”，導致輸出長度激增，可能被利用發動拒絕服務攻擊。浙江大學與阿里巴巴的研究人員開發了一種進化算法，能夠生成惡意提示，使模型輸出長度最高增加26倍，影響包括DeepSeek-R1、Qwen3-Thinking、GPT-o3和Gemini 2.5 Flash在內的主流推理模型。

研究人員展示了一種利用AI推理模型“過度思考”漏洞的新型攻擊，導致計算量急劇增加。
通過進化算法破壞提示的邏輯結構，可使模型輸出長度最高達到正常情況的26倍。

中國AI模型憑藉成本優勢在美國企業中的採用率上升

2026-07-08 05:48 UTC+8

中國開發的AI模型正逐漸縮小與領先美國競爭對手的性能差距，同時保持顯著的價格優勢，因此在美國公司中越來越受歡迎。最近DeepSeek和Z.ai等中國公司發佈的模型被認為與Anthropic和OpenAI等前沿系統高度競爭。這些進步正值許多美國AI實驗室最先進模型的token價格上漲，使企業面臨與使用該技術相關的意外高成本。

中國AI模型性能提升，與美國領先模型差距縮小。
DeepSeek和Z.ai等中國公司的模型在成本上更具優勢。

DeepSeek V4 在代理型代幣份額中嶄露頭角

2026-07-07 04:27 UTC+8

DeepSeek V4 模型自2026年4月發佈以來，在OpenRouter上的代幣份額從年初的9%翻倍至18%，主要由代理型工作負載驅動。其成本效益比（每百萬代幣輸入0.09美元，輸出0.18美元）領先業界，吸引各類用户採用，並推動中國模型整體超越美國模型。

DeepSeek V4 發佈後六個月內，代幣份額從9%增至18%。
代理型工作負載是主要增長動力，V4-Flash佔DeepSeek代理型代幣流量的70%。

NVIDIA 推理軟件堆棧如何實現最低令牌成本

2026-06-30 23:00 UTC+8

NVIDIA 的推理軟件堆棧通過與 GPU、CPU、網絡和系統的協同設計，並藉助開源生態系統，持續提升硬件性能。在 Blackwell 平台上，該軟件堆棧在一個月內將 DeepSeek V4 模型的令牌成本降低了 5 倍。文章詳細介紹了軟件優化如何通過生產運營、應用加速和基礎設施訪問三個層次，將單個優化轉化為系統級性能提升，從而降低每令牌成本。

NVIDIA 全棧推理軟件通過協同設計，在 Blackwell 平台上一個月內將令牌成本降低 5 倍。
Baseten、Cognition 等公司利用 TensorRT-LLM 和 Dynamo 框架實現了顯著性能提升。

AI新聞：今天沒什麼大事發生

2026-06-30 14:47 UTC+8

今天AI領域相對平靜，但仍有重要進展：Meta的非侵入式腦機接口Brain2Qwerty v2、Cursor的iOS遠程代理發佈、DeepSeek的DSpark推測解碼技術、開放權重模型的商業化訪問，以及Snowflake的Arctic RL訓練基礎設施。Reddit社區討論了在兩台Mac上本地運行GLM-5.2 753B的情況。

Meta發佈Brain2Qwerty v2，非侵入式解碼器在實時打字任務中達到約61%的詞準確率。
Cursor推出iOS應用，支持始終在線的雲代理和遠程控制桌面代理。

低成本中國AI模型如DeepSeek在美國受到青睞

2026-06-29 23:15 UTC+8

美國開發者和小型企業正在轉向中國AI模型以降低成本。儘管性能仍落後於美國頂尖模型，但中國模型能以極低價格處理大多數任務。微軟也在考慮使用DeepSeek等開源模型作為更低成本的替代方案。然而，中國公司面臨將流行度轉化為可觀收入的挑戰。

美國開發者用DeepSeek替代Claude，成本從10美元降至不到50美分。
中國模型價格低廉得益於國內較低的薪資和基礎設施成本。

DeepSeek發佈DSpark：一種投機解碼框架，將DeepSeek-V4每用户生成速度提升60-85%

2026-06-28 00:59 UTC+8

DeepSeek開源了DSpark，一種投機解碼框架，通過附加草稿模塊到現有DeepSeek-V4權重上。它結合並行草稿骨幹和輕量級馬爾可夫頭以減少後綴衰減，並加入基於置信度的調度驗證，根據實時GPU負載調整檢查的令牌數量。離線測試中，接受長度比DFlash和Eagle3提升16-31%；生產環境下，每用户生成速度比MTP-1基線提升57-85%，且無損。訓練代碼庫DeepSpec採用MIT許可證。

DSpark結合並行草稿骨幹和輕量級馬爾可夫頭，提高後綴接受率。
基於置信度的驗證根據GPU負載動態調整檢查令牌數。

用Golang編寫的原生Hacker News TUI客户端，具備AI評論摘要功能

2026-06-28 00:04 UTC+8

cwnews是一款終端下的Hacker News閲讀器，支持六個數據源、三種主題、線程摺疊評論以及通過DeepSeek V4 Flash實現的AI摘要功能。它用Go和Bubbletea v2構建，左側面板顯示故事列表，右側面板呈現嵌套評論，並可通過按's'鍵調用AI實時總結討論內容。所有數據緩存在SQLite中，確保快速響應。

終端UI客户端，支持Hacker News的六個數據源（Top/New/Best/Ask/Show/Jobs）。
評論以可摺疊的線程樹形式展示，帶有深度顏色標記。

DeepSeek開源推理優化，生成速度提升60–85%

2026-06-27 17:18 UTC+8

DeepSeek開源了一套推理優化技術，可將生成速度提升60%至85%，相關技術論文已在GitHub上發佈。

DeepSeek發佈了推理優化技術
生成速度提升60-85%

cwmail：原生Golang終端郵件客户端，集成DeepSeek V4 Pro AI起草功能

2026-06-27 11:36 UTC+8

cwmail是一款基於Go語言和Bubbletea v2開發的終端郵件客户端，支持HTML郵件渲染、內嵌圖片顯示、多賬户IMAP管理、IDLE推送通知以及由DeepSeek V4 Pro驅動的AI回覆起草功能。它提供快速本地搜索、撤銷刪除、草稿自動保存、CLI發送模式等特性，且不依賴任何雲服務，用户數據完全本地存儲。

使用Go語言和Bubbletea v2構建，在終端中提供完整的郵件管理體驗。
支持多賬户IMAP，可同時管理Gmail、iCloud、Outlook等賬户，並採用IDLE推送通知而非輪詢。

DeepSeek Flash 顛覆了智能代理產品的經濟模式

2026-06-26 06:56 UTC+8

DeepSeek Flash 通過提供廉價、快速、純文本的代碼生成模型，打破了開發者與大型模型實驗室之間不合理的定價關係。它使得智能代理的構建者能夠從依賴昂貴的多模態 API 轉向使用開源模型作為編譯器，大幅降低成本並重構了瀏覽器代理的架構。

DeepSeek Flash 改變了智能代理產品的經濟模式，使開發者無需再補貼競爭對手。
通過將模型從執行者轉變為編譯器，代理的工作流從數十次模型調用減少為一次規劃調用。

我們在20秒內部署了DeepSeek-V4-Pro服務

2026-06-26 04:49 UTC+8

Inferize公司宣佈成功在20秒內部署DeepSeek-V4-Pro模型，實現極快且高效的LLM服務，並邀請用户加入等待列表。

Inferize在20秒內部署了DeepSeek-V4-Pro模型
該公司提供高度優化的彈性AI推理服務

百度發佈Unlimited OCR：3B參數模型通過恆定KV緩存實現長文檔高效解析

2026-06-25 13:39 UTC+8

百度開源了Unlimited OCR，這是一個30億參數的混合專家模型，採用參考滑動窗口注意力機制（R-SWA）保持KV緩存恆定，從而在一次前向傳播中高效解析數十頁文檔。在OmniDocBench v1.5上達到93.23分，比DeepSeek OCR基線高出6.22分，採用MIT許可證。

Unlimited OCR擁有30億總參數，但推理時僅激活5億參數。
參考滑動窗口注意力（R-SWA）使KV緩存大小恆定，不隨輸出長度增長。

Show HN：利用逼真AI語音將電子書轉換為有聲書

2026-06-24 23:04 UTC+8

一位開發者構建了名為ebookaloud的服務，利用開源Kokoro模型將電子書轉換為有聲書，並採用AI多智能體編程工作流（主要使用DeepSeek）。該產品按需付費，質量足夠好，未來計劃支持更多語言和PDF提取。

使用開源Kokoro模型生成逼真AI語音，可長時間聆聽而不疲勞。
99%的代碼由DeepSeek v4通過多智能體工作流編寫，成本僅12美元。

更便宜、更安全的代理式AI工作流程

2026-06-22 02:39 UTC+8

一位開發者通過使用GLM-5.2和DeepSeek V4 Flash等模型，實現了低成本、高效的代理式AI編碼，同時通過虛擬機隔離保護隱私。文章分享了具體步驟、成本對比（低至0.034美元）以及對AI行業商業模式的思考。

使用GLM-5.2和DeepSeek V4 Flash模型，任務成本低至0.034美元，耗時僅3分鐘。
通過VirtualBox中的Debian虛擬機隔離環境，保護私有數據。

Show HN: CommitGate – 自動掃描提交中的漏洞

2026-06-21 23:35 UTC+8

CommitGate 是一個 AI 驅動的 Git 預提交安全門，在每次 git commit 時自動掃描暫存區差異，阻止包含密鑰、令牌或危險代碼的提交進入歷史記錄。它結合 Gitleaks 確定性掃描和 LLM 語義分析，支持 OpenAI、DeepSeek、Groq 等 AI 提供商，並可將審計日誌發送到 Splunk。

在每次提交前自動掃描暫存區差異，阻止高風險代碼進入倉庫。
雙引擎掃描：Gitleaks 檢測已知密鑰模式，AI 評審器捕捉正則表達式遺漏的漏洞。

AI模型發佈節奏分析：兩家實驗室加速，三家放緩

2026-06-21 10:16 UTC+8

本文通過數據分析了前沿AI模型的發佈節奏，發現Anthropic和OpenAI的發佈頻率在加速，而谷歌、Meta和DeepSeek並未出現類似趨勢。作者探討了遞歸自我改進的可能性，並指出了驗證這一假設的下一步觀察點。

Anthropic和OpenAI的模型發佈節奏在加速，其他三家實驗室未出現此趨勢。
加速可能源於遞歸自我改進，即實驗室利用自身模型改進後續模型。

7.4億美元背後的深層意義：DeepSeek的A輪融資標誌着中國AI聯盟的轉變

2026-06-21 07:47 UTC+8

本週三大看點：DeepSeek獲騰訊領投74億美元A輪融資，顯示中國AI投資正轉向非生態系統參與者；日本計劃到2040年投入650億美元公私合作建設物理AI基礎設施；智譜AI的GLM 5.2模型在設計基準測試中超越Anthropic的Claude，直接挑戰西方AI性能標準。

DeepSeek獲騰訊領投74億美元A輪融資，阿里巴巴和字節跳動未參與。
日本計劃到2040年投入650億美元建設物理AI基礎設施，優先硬件以對抗西方領導地位。

VibeThinker-3B：基於Qwen2.5-Coder-3B與頻譜到信號後訓練流水線的3B密集推理模型

2026-06-20 06:06 UTC+8

VibeThinker-3B是一個僅30億參數的開源推理模型，在可驗證基準測試中匹配DeepSeek V3.2和Kimi K2.5等千億級模型。它採用頻譜到信號後訓練流水線，通過監督微調、強化學習和自蒸餾實現高效推理，並引入測試時縮放方法CLR進一步提升性能。

VibeThinker-3B僅有3B參數，MIT許可證開源，基於Qwen2.5-Coder-3B構建，專攻可驗證推理。
在AIME26上得分94.3，與671B的DeepSeek V3.2和1T的Kimi K2.5相當。

華為芯片助力DeepSeek模型精調，中國AI自主可控邁出重要一步

2026-06-20 01:33 UTC+8

華為使用其昇騰910C芯片成功完成對DeepSeek-V4-Pro模型的後訓練，這是中國半導體產業在複雜AI模型訓練領域取得的關鍵突破。該項目由華為與多家研究機構合作，利用1000多顆芯片集羣實現了1.6萬億參數模型的全參數後訓練，展示了國產芯片從推理到訓練的能力跨越。此舉有助於提升中國AI產業鏈的自主性，在美製裁背景下推動國內替代方案的發展。

華為與多家機構合作，使用昇騰910C芯片成功完成DeepSeek-V4-Pro模型的後訓練。
項目採用至少1000顆芯片集羣，對1.6萬億參數模型進行全參數精調。

Show HN: Wolffish – 一個操作系統的個人桌面AI代理

2026-06-19 19:32 UTC+8

Wolffish是一款桌面AI代理應用，安裝即用，無需服務器或複雜設置，支持多種模型，包括DeepSeek、GLM、Claude、GPT等，並能完全離線運行。它注重隱私和安全，所有數據保留在本地，開源免費。

Wolffish是一款簡單易用的桌面AI代理，無需複雜設置。
它支持多種AI模型，包括本地模型，確保數據隱私。

微軟在中國銷售OpenAI模型，而OpenAI和Anthropic拒絕

2026-06-18 17:00 UTC+8

微軟已成為中國市場上OpenAI模型的主要供應商，向字節跳動、螞蟻集團、美團和騰訊等大型互聯網公司銷售GPT系列模型，儘管OpenAI和Anthropic出於知識產權和濫用風險拒絕直接進入中國市場。該業務為微軟帶來獨特優勢，使其成為唯一一家向中國銷售美國AI模型的美國供應商。據彭博社報道，微軟Azure在中國的AI收入增長迅猛，2025財年約增長三倍。微軟通過其與OpenAI的獨家合同提供這些模型，並採取監控措施防止模型蒸餾，但中國客户面臨審查有限。同時，微軟也在測試中國模型DeepSeek用於西方企業，形成雙向貿易。

微軟通過其與OpenAI的獨家合同，向中國大型互聯網公司提供GPT模型，而OpenAI和Anthropic拒絕直接銷售。
字節跳動是微軟最大的AI客户，年度支出超過10億美元；螞蟻集團、美團和騰訊也通過Azure購買AI模型。

歸因引導與覆蓋最大化的結構化MoE剪枝方法

2026-06-18 12:00 UTC+8

本文提出一種面向混合專家模型的結構化剪枝框架，通過將剪枝比率分配轉化為通道分數覆蓋最大化問題，並利用基於歸因的近似方法高效求解。實驗表明，在50%或25%結構化剪枝結合4位量化條件下，該方法在DeepSeek和Qwen MoE模型上保持了模型精度，並在Qwen3-30B-A3B上實現5.27倍內存壓縮，超越現有基準。

發現MoE專家內部信息集中在少數通道，存在顯著冗餘
提出通道級結構化剪枝框架，將剪枝比率分配建模為覆蓋最大化問題

專為本地LLM和DeepSeek v4優化的原生編碼代理，具備向量記憶功能

2026-06-17 06:36 UTC+8

cwcode是一個基於Go語言的終端編碼代理，利用DeepSeek V4 Pro等模型，提供文件編輯、子代理、語義記憶和自動恢復等功能。它強調低成本（每小時約0.40美元）、高效緩存（85%以上命中率），並支持本地模型和多種API。

基於Go的終端編碼代理，支持DeepSeek V4 Pro、Qwen3.6-27B等模型
採用哈希錨定編輯和粘性前綴緩存，降低令牌消耗和成本

跨主流AI平台的令牌使用與訂閲追蹤

2026-06-14 12:09 UTC+8

Tokens 4 Breakfast 是一款 macOS 菜單欄應用，用於實時追蹤和監控AI工具（如 Claude、OpenAI、Cursor、Copilot、Gemini、DeepSeek、Mistral 等）的令牌使用、訂閲費用和速率限制，幫助開發者避免意外超支。應用提供免費版（支持單一供應商）和一次性付費的 Pro 版（$7.99），所有數據本地處理，無需登錄或雲服務。

實時菜單欄顯示AI使用成本、速率限制和訂閲支出。
支持8大AI供應商，包括 Claude、OpenAI、Cursor 等。

中國打擊西方AI模型，美國公司卻湧入DeepSeek

2026-06-13 10:51 UTC+8

中國國家安全部警告使用西方AI模型存在安全風險，同時美國企業因成本優勢紛紛採用中國開源模型。雙方在AI領域相互牽制，用户繞道訪問對方模型的現象加劇了技術博弈。

中國國家安全部警告通過第三方工具訪問美國AI模型可能帶來安全風險
美國企業因成本優勢大量使用DeepSeek、阿里Qwen等中國開源模型

Pythagoras-Prover: 通過增強型Lean形式化推進高效形式化證明

2026-06-12 12:00 UTC+8

Pythagoras-Prover是一個計算高效的Lean定理證明器家族，包含4B和32B的自迴歸模型以及4B的擴散模型。它通過分層課程SFT和動態證明過濾提高訓練效率，並引入增強型Lean形式化(ALF)擴展驗證語料庫。實驗顯示，4B模型在MiniF2F-Test上以86.1%的pass@32超越DeepSeek-Prover-V2-671B（82.4%），而32B模型達到93.0%的新開源最佳水平，並在PutnamBench上解決93個問題。

Pythagoras-Prover包含4B和32B自迴歸模型及4B擴散模型，擴散模型在推理時迭代細化證明。
通過分層課程SFT和動態證明過濾實現訓練效率提升，保持8k token上下文預算。

深度求索讓AI變便宜，現在卻需要數十億來維持低價

2026-06-08 20:36 UTC+8

深度求索（DeepSeek）曾以低成本AI模型震驚業界，但現在美國評估顯示其模型落後前沿約8個月，儘管價格更低。公司正進行大規模融資，估值高達600億美元，以維持其在AI競賽中的競爭力。

美國CAISI評估認為DeepSeek V4 Pro是最強中國模型，但落後美國前沿約8個月。
DeepSeek正進行超過500億元人民幣（約74億美元）的融資，估值接近600億美元。

Deepseek在2026年6月位列Ramp熱門軟件供應商榜首，美國企業尋求更便宜的AI

2026-06-08 00:06 UTC+8

2026年6月，Deepseek成為Ramp平台上最受歡迎的付費軟件供應商，美國企業直接向其發送數據。Ramp首席經濟學家Ara Kharazian指出成本意識是驅動因素，但警告使用中國模型的安全風險。

Deepseek在2026年6月成為Ramp熱門軟件供應商第一名。
美國企業為降低成本轉向使用Deepseek的付費AI服務。

職位搜索器：AI驅動的求職助手

2026-06-06 23:36 UTC+8

職位搜索器是一款為應屆畢業生設計的AI工具，通過分析簡歷自動生成LinkedIn搜索查詢，並基於技能、經驗、教育、行業和資歷五個維度對職位進行評分。該項目使用DeepSeek V4 Pro作為教師模型生成標籤，Qwen3-8B作為學生模型進行推理，訓練數據包括2500份簡歷和約10000個職位。所有代碼、數據集和模型均已開源。

自動簡歷分析並生成LinkedIn搜索查詢
基於五個維度的職位匹配評分

DeepSWE 結果不可靠——同一模型解決了全部 3/3 個“失敗”任務

2026-06-05 00:32 UTC+8

對 DeepSWE 基準測試的審計發現，deepseek-v4-pro 的報告結果（8% 解決率，平均成本 4.22 美元）存在多個問題：成本因忽略緩存定價膨脹約 5 倍，所有三個失敗任務均被同一模型成功解決，OpenRouter 隱私設置默認阻止 DeepSeek 導致 404 錯誤，且模型未像競品一樣進行推理努力調優。

成本膨脹約 5 倍：基準測試對所有輸入令牌按緩存未命中率計費，忽略 78% 的緩存命中（99.2% 折扣）。
三個“失敗”任務全部解決：使用相同模型 deepseek-v4-pro，總成本約 0.86 美元。

DigitalOcean 成為 OpenRouter AI 模型提供商

2026-06-03 16:25 UTC+8

DigitalOcean 宣佈成為 OpenRouter 的模型提供商，提供 DeepSeek V3.2、Kimi K2.6 和 DeepSeek V4 Flash 模型。此舉表明該公司正從雲基礎設施擴展到 AI 推理領域。

DigitalOcean 在 X 上宣佈成為 OpenRouter 的模型提供商
首批模型包括 DeepSeek V3.2、Kimi K2.6 和 DeepSeek V4 Flash

Dropstone 1.5：每月15美元，兩倍於Claude Code的使用量

2026-06-03 11:59 UTC+8

Dropstone 1.5 是一款終端中的AI編程代理，每月重新評估頂級模型並切換至最佳者。當前基於DeepSeek和Kimi模型，美國服務器託管，不存儲數據。每月15美元提供約450次深度編程會話，約為Claude Code Pro的兩倍（後者20美元）。注重安全，所有操作需確認。

每月15美元，約450次深度編程會話，是Claude Code Pro的兩倍。
使用DeepSeek V4 Flash、V4 Pro和Kimi K2.6模型，美國服務器託管。

Show HN：Tkcore AI – 支持自定義知識庫的多模型工作空間

2026-06-02 15:26 UTC+8

Tkcore AI 是一個多模型工作空間，集成了 DeepSeek、Qwen、GLM、Kimi 和 MiniMax 等多種 AI 模型，提供低延遲響應、長上下文、多模態輸入以及通過文件上傳實現自定義知識庫功能。

支持 DeepSeek、Qwen、GLM、Kimi 和 MiniMax 等多個模型，適用於不同任務。
低延遲、高吞吐量文本處理，支持圖像/視頻等多模態輸入。

新綜述論文：代碼不僅是AI智能體的產物，更是其思考與行動的方式

2026-05-29 21:10 UTC+8

一篇新綜述論文指出，自主AI智能體的真正瓶頸並非語言模型本身，而是圍繞其構建的軟件層。工具、記憶、測試和權限邊界將無狀態模型轉變為可工作的智能體。Deepseek已在北京組建專門的“Harness”團隊，其核心公式驗證了該論點：模型加Harness等於AI智能體。

論文強調AI智能體的瓶頸在於軟件封裝層，而非語言模型。
工具、記憶、測試和權限管理是將模型轉化為智能體的關鍵。

PPIO入選非凡產研「2026 Global AI 100」，以AI實力領跑出海新浪潮

2026-05-29 19:24 UTC+8

PPIO 入選非凡產研發布的「2026 Global AI 100」榜單，該榜單由非凡大賞年度 AI 全球化增長峯會評選，旨在發掘全球化 AI 原生公司。PPIO 以全球化分佈式算力基礎設施、全棧雲服務、模型平台（支持 DeepSeek、GLM 等）及 Agent 沙箱等創新產品，為出海企業提供低時延、高可用的算力網絡。截至 2026 年 4 月，PPIO 整合全球 4800+ 節點，日均 Token 調用量超 10000 億，開發者用户超 57 萬。同時獲評上海市數字出海服務平台試點單位及 GDA 領航服務站。

PPIO 入選「2026 Global AI 100」榜單，彰顯其在 AI 出海領域的領先地位。
提供全球化分佈式算力基礎設施，覆蓋 GPU 全型號，支持大規模訓練與推理。

Show HN：我將一個 Python AI 代理和 Vue 儀表盤打包成了一個 Electron 應用

2026-05-28 18:12 UTC+8

Hermes Desktop 是一個跨平台的桌面應用，它將 Python 運行時、hermes-agent（自改進 AI 代理）和 hermes-web-ui（Vue 3 + Koa 聊天儀表盤）打包到一個 Electron 應用中，用户無需單獨安裝 Python 或 Node。應用集成了 DingTalk 並通過 DeepSeek 驅動。

打包了 Python 運行時和 hermes-agent，實現無需依賴即可運行
使用 Electron 作為外殼，集成 hermes-web-ui 前端

DeepSeek陳德里開發自動研究Skill，寫一篇論文人類只動腦2小時

2026-05-27 09:14 UTC+8

DeepSeek研究員陳德里使用自研的DeliAutoResearch技能，與DeepSeek-V4-Pro和GPT-Image2合作，在6天內完成了一篇46頁的論文。論文提出了L1-L5自主研究智能體分類體系，分析了四種架構模式和17個主流系統，並指出了六大開放問題。陳德里表示，人類僅需投入不到2小時的“CPU時間”，其餘工作由AI Agent完成。

陳德里開發自動研究技能DeliAutoResearch，論文99%由Agent撰寫。
論文提出L1-L5自主研究智能體分類，類比自動駕駛SAE級別。

AI週刊第496期：Anthropic的國防級模型現已全民可用

2026-05-27 08:00 UTC+8

本週AI新聞要點：Anthropic公開了此前僅限國防承包商使用的頂級模型Mythos，使五角大樓級AI能力向開發者開放；DeepMind CEO哈薩比斯將AGI時間線提前至2029年；Starlette框架爆出嚴重認證繞過漏洞，影響數百萬AI代理；CrowdStrike等聯合摧毀Glassworm殭屍網絡；法國巴黎銀行與Mistral達成主權AI安全合作；中國限制阿里和深度求索頂尖AI工程師出境；Uber AI預算超支、ClickUp裁員並引入數千AI代理，同時MIT技術評論數據顯示AI暴露崗位失業率更低，奧特曼撤回白領失業預言。

Anthropic發佈Mythos模型，原本僅限NSA和五角大樓使用，現可通過標準API訪問。
深度思維CEO哈薩比斯將AGI實現時間從5-10年縮短至2029年。

據報道中國要求頂尖AI研究人員出國前需獲批准

2026-05-26 22:25 UTC+8

中國正在限制阿里巴巴和DeepSeek等私營公司的頂尖AI研究人員出國旅行，他們需要獲得官方批准才能離境。北京擔心數據泄露、技術盜竊和人才挖角，正在加強對國內AI行業的管控。

中國要求頂尖AI研究人員出國前需獲得許可。
該政策適用於阿里巴巴和DeepSeek等私營公司。

Cited AI Workspace：無需重複上傳文件

2026-05-26 10:18 UTC+8

UUMuse 是一個雲端AI知識庫平台，只需上傳一次文件，即可在GPT、Claude、DeepSeek、Qwen等多個模型中進行帶有引用的問答、生成內容和部署。支持通過API和MCP供代理和應用調用，提供永久記憶、多專家辯論（Spark）、代理模式等功能，並可將知識庫部署為文檔網站、小部件、API端點等。

一次上傳，多模型使用：文件上傳後，GPT、Claude、DeepSeek、Qwen等模型均可基於同一知識庫作答並引用來源。
記憶與代理：AI記住你的偏好和項目上下文，代理模式自動規劃並執行任務，無需重複指令。

DeepSeek V4還能更省！新工具緩存命中率高達99.82%，2折穩定到手

2026-05-25 12:40 UTC+8

DeepSeek V4系列發佈一個月後，開源社區推出Reasonix工具，專為DeepSeek設計，通過優化緩存機制將賬單成本降低至原來的五分之一左右。該工具緩存命中率高達99.82%，實現4億+token從61美元降至12美元。

Reasonix是專為DeepSeek打造的終端編碼工具，核心目標是降低使用成本。
通過緩存優先循環、工具調用修復和自動上下文壓縮等機制，實現長會話緩存命中率超90%。

Deepseek將75%折扣永久化，輸出令牌定價至少比GPT-5.5低34倍

2026-05-24 01:10 UTC+8

Deepseek宣佈其頂級模型V4-Pro的75%折扣永久生效。輸入令牌每百萬僅需0.435美元，至少比GPT-5.5便宜11.5倍，輸出令牌便宜34倍以上。對於令牌消耗巨大的代理系統，這一價格可能對西方供應商造成巨大壓力。

Deepseek永久保留V4-Pro模型75%的折扣。
輸入令牌定價0.435美元/百萬，比GPT-5.5低11.5倍。

阿里最新AI模型自主運行35小時優化自有芯片代碼

2026-05-23 18:17 UTC+8

阿里通義千問團隊發佈Qwen3.7-Max，專為長時間自主代理任務設計。在基準測試中匹配Claude Opus 4.6，超越DeepSeek V4 Pro和Kimi K2.6等中國對手。團隊還展示了該模型操控四足機器人。

Qwen3.7-Max專為長時間自主代理任務設計
基準測試匹配Claude Opus 4.6，超越中國競品

DeepSeek V4價格打骨折，寧王京東網易搶着入場，梁文鋒：目標是AGI

2026-05-23 17:46 UTC+8

DeepSeek宣佈V4-Pro API永久降價，寧德時代、京東、網易等巨頭正洽談參投其首輪融資。梁文鋒明確表示優先追求AGI，堅持開源路線。

DeepSeek-V4-Pro API永久降價至原價的四分之一
寧德時代、京東、網易等公司洽談投資DeepSeek