Show HN:我將一個 Python AI 代理和 Vue 儀表盤打包成了一個 Electron 應用 2026-05-28 Hermes Desktop 是一個跨平臺的桌面應用,它將 Python 執行時、hermes-agent(自改進 AI 代理)和 hermes-web-ui(Vue 3 + Koa 聊天儀表盤)打包到一個 Electron 應用中,使用者無需單獨安裝 Python 或 Node。應用整合了 DingTalk 並透過 DeepSeek 驅動。
打包了 Python 執行時和 hermes-agent,實現無需依賴即可執行 使用 Electron 作為外殼,整合 hermes-web-ui 前端 DeepSeek陳德里開發自動研究Skill,寫一篇論文人類只動腦2小時 2026-05-27 DeepSeek研究員陳德里使用自研的DeliAutoResearch技能,與DeepSeek-V4-Pro和GPT-Image2合作,在6天內完成了一篇46頁的論文。論文提出了L1-L5自主研究智慧體分類體系,分析了四種架構模式和17個主流系統,並指出了六大開放問題。陳德里表示,人類僅需投入不到2小時的“CPU時間”,其餘工作由AI Agent完成。
陳德里開發自動研究技能DeliAutoResearch,論文99%由Agent撰寫。 論文提出L1-L5自主研究智慧體分類,類比自動駕駛SAE級別。 AI週刊第496期:Anthropic的國防級模型現已全民可用 2026-05-27 本週AI新聞要點:Anthropic公開了此前僅限國防承包商使用的頂級模型Mythos,使五角大樓級AI能力向開發者開放;DeepMind CEO哈薩比斯將AGI時間線提前至2029年;Starlette框架爆出嚴重認證繞過漏洞,影響數百萬AI代理;CrowdStrike等聯合摧毀Glassworm殭屍網路;法國巴黎銀行與Mistral達成主權AI安全合作;中國限制阿里和深度求索頂尖AI工程師出境;Uber AI預算超支、ClickUp裁員並引入數千AI代理,同時MIT技術評論資料顯示AI暴露崗位失業率更低,奧特曼撤回白領失業預言。
Anthropic釋出Mythos模型,原本僅限NSA和五角大樓使用,現可透過標準API訪問。 深度思維CEO哈薩比斯將AGI實現時間從5-10年縮短至2029年。 據報道中國要求頂尖AI研究人員出國前需獲批准 2026-05-26 中國正在限制阿里巴巴和DeepSeek等私營公司的頂尖AI研究人員出國旅行,他們需要獲得官方批准才能離境。北京擔心資料洩露、技術盜竊和人才挖角,正在加強對國內AI行業的管控。
中國要求頂尖AI研究人員出國前需獲得許可。 該政策適用於阿里巴巴和DeepSeek等私營公司。 Cited AI Workspace:無需重複上傳檔案 2026-05-26 UUMuse 是一個雲端AI知識庫平臺,只需上傳一次檔案,即可在GPT、Claude、DeepSeek、Qwen等多個模型中進行帶有引用的問答、生成內容和部署。支援透過API和MCP供代理和應用呼叫,提供永久記憶、多專家辯論(Spark)、代理模式等功能,並可將知識庫部署為文件網站、小部件、API端點等。
一次上傳,多模型使用:檔案上傳後,GPT、Claude、DeepSeek、Qwen等模型均可基於同一知識庫作答並引用來源。 記憶與代理:AI記住你的偏好和專案上下文,代理模式自動規劃並執行任務,無需重複指令。 DeepSeek V4還能更省!新工具快取命中率高達99.82%,2折穩定到手 2026-05-25 DeepSeek V4系列釋出一個月後,開源社群推出Reasonix工具,專為DeepSeek設計,透過最佳化快取機制將賬單成本降低至原來的五分之一左右。該工具快取命中率高達99.82%,實現4億+token從61美元降至12美元。
Reasonix是專為DeepSeek打造的終端編碼工具,核心目標是降低使用成本。 透過快取優先迴圈、工具呼叫修復和自動上下文壓縮等機制,實現長會話快取命中率超90%。 Deepseek將75%折扣永久化,輸出令牌定價至少比GPT-5.5低34倍 2026-05-23 Deepseek宣佈其頂級模型V4-Pro的75%折扣永久生效。輸入令牌每百萬僅需0.435美元,至少比GPT-5.5便宜11.5倍,輸出令牌便宜34倍以上。對於令牌消耗巨大的代理系統,這一價格可能對西方供應商造成巨大壓力。
Deepseek永久保留V4-Pro模型75%的折扣。 輸入令牌定價0.435美元/百萬,比GPT-5.5低11.5倍。 阿里最新AI模型自主執行35小時最佳化自有晶片程式碼 2026-05-23 阿里通義千問團隊釋出Qwen3.7-Max,專為長時間自主代理任務設計。在基準測試中匹配Claude Opus 4.6,超越DeepSeek V4 Pro和Kimi K2.6等中國對手。團隊還展示了該模型操控四足機器人。
Qwen3.7-Max專為長時間自主代理任務設計 基準測試匹配Claude Opus 4.6,超越中國競品 DeepSeek V4價格打骨折,寧王京東網易搶著入場,梁文鋒:目標是AGI 2026-05-23 DeepSeek宣佈V4-Pro API永久降價,寧德時代、京東、網易等巨頭正洽談參投其首輪融資。梁文鋒明確表示優先追求AGI,堅持開源路線。
DeepSeek-V4-Pro API永久降價至原價的四分之一 寧德時代、京東、網易等公司洽談投資DeepSeek 【AINews】所有模型實驗室現在都是智慧體實驗室 2026-05-23 在OpenAI即將上市之際,行業巨頭紛紛從純模型轉向智慧體產品。DeepSeek永久降價75%,MCP協議簡化,谷歌推出全天候智慧體,Anthropic發現上萬高危漏洞。智慧體化成為AI新常態。
Greg Brockman表示模型不再是產品,模型+智慧體+工作流才是關鍵 DeepSeek V4 Pro永久降價75%,推理成本大幅降低 據報道,Deepseek優先考慮AGI研究而非短期利潤,儘管獲得數十億美元融資 2026-05-22 Deepseek正籌集約100億美元資金,估值約450億美元。創始人梁文峰向投資者表示,將通用人工智慧(AGI)研究置於短期盈利之上。
Deepseek即將完成約100億美元融資,估值約450億美元。 創始人梁文峰強調AGI研究優先於短期利潤。 融資700億!DeepSeek Code真要來了,ACM金牌大神崔添翼掛帥 2026-05-22 DeepSeek融資額達700億元,計劃推出自家Code產品。資深研究員Deli Chen發帖招聘Harness團隊,前TSY Capital聯合創始人崔添翼或將出任負責人。
DeepSeek融資700億元,優先AI研究而非商業化。 DeepSeek Code產品確認開發中,招聘Agent Harness團隊。 非同步Python客戶端:私有DeepSeek API的高效能封裝 2026-05-21 aiodeepseek是一個高效能的非同步Python客戶端,專為私有DeepSeek API設計。支援流式響應、影像上傳、多輪對話和新賬戶註冊。客戶端自動解決工作量證明挑戰,採用C++和AVX2最佳化,效能出色。
非同步Python客戶端,支援流式輸出和影像上傳 多輪對話和賬戶註冊功能 基於扁平度的理論最優量化 2026-05-20 本文提出一種新的量化指標“扁平度”來衡量異常值分佈,並據此推匯出理論最優解。作者進一步提出雙向對角量化(BDQ)框架,透過學習到的對角操作將異常值分散到矩陣維度中,顯著提升了大語言模型低位寬量化的效能。實驗表明,BDQ在LLaMA-3-8B上W4A4量化精度下降不足1%,在DeepSeek-R1-Distill-LLaMA-70B的W2A4KV16任務中效能差距縮小39.1%。
提出Flatness指標量化異常值分佈,並推導理論最優解 BDQ框架透過雙向對角變換分散異常值 HELLoRA:混合專家模型的熱門專家層層級低秩適配方法 2026-05-20 HELLoRA是一種針對混合專家(MoE)模型的高效微調方法,僅對每層最活躍的專家附加LoRA模組,從而減少可訓練引數和介面卡帶來的計算量,同時提升下游任務效能。在OlMoE、Mixtral和DeepSeekMoE等模型上,HELLoRA在數學推理、程式碼生成和安全對齊任務中均優於現有方法,例如在OlMoE上僅使用15.7%的引數,減少38.7%的FLOPs,吞吐量提升1.9倍,準確率提高9.2%。
HELLoRA僅對MoE模型每層最頻繁啟用的專家附加LoRA模組,實現引數高效微調。 在多種MoE模型上,HELLoRA顯著減少可訓練引數和計算開銷,同時提升效能。 2025年十大人工智慧研究論文 2026-05-18 2025年AI研究從聊天機器人轉向推理系統、自主代理和多模態系統。十大論文包括DeepSeek-R1(強化學習)、Gemini 2.5(多模態推理)、Qwen2.5(開源模型)、Large Concept Models(概念級語言建模)、ESG分析抗漂綠、VideoWorld(世界模型)、AI Scientist-v2(自主研究)、SWE-Lancer(編碼代理基準)、OLMo 2(完全開源)和Mixture-of-Recursions(高效推理)。
DeepSeek-R1將強化學習後訓練方法公開,顯著提升推理和編碼能力。 Gemini 2.5引入“思考模式”,擴充套件多模態理解和長上下文。 GQLA:面向硬體自適應的大語言模型解碼的分組查詢潛在注意力機制 2026-05-18 研究人員提出了分組查詢潛在注意力(GQLA),這是對DeepSeek多頭潛在注意力(MLA)的改進,在不重新訓練的情況下提供兩種硬體自適應的解碼路徑。該方法能在H100和H20 GPU上實現高效推理,幷包含TransGQLA用於轉換預訓練的GQA模型。
GQLA在DeepSeek的MLA基礎上擴充套件出雙解碼路徑(MQA吸收和GQA),以適應不同硬體的roofline模型。 同一組GQLA權重既可用於H100(MQA路徑),也可用於H20(GQA路徑配合多token預測)。 最新開放製品(#21):開放模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1等。關於CAISI對V4的評估。 2026-05-16 本月開放前沿實驗室紛紛釋出新模型,包括DeepSeek V4、Gemma 4、Kimi K2.6等。CAISI評估指出開放模型落後於美國前沿,且差距在擴大,但評估方法受到質疑,實際能力差距可能被高估。文章還介紹了多個亮點模型。
DeepSeek、Google、Moonshot AI等釋出多個開放模型。 CAISI評估顯示開放模型與封閉模型的Elo差距巨大,但基準測試方法存在爭議。 LLM架構最新發展:KV共享、mHC與壓縮注意力 2026-05-16 從Gemma 4到DeepSeek V4,本文探討了新的開源LLM如何透過跨層KV共享、逐層嵌入、注意力預算、壓縮卷積注意力和mHC等架構技術降低長上下文成本。
Gemma 4引入跨層KV共享,將KV快取大小減半,同時保持模型質量。 逐層嵌入(PLE)透過增加小型嵌入引數提高模型容量,而不顯著增加計算成本。 不同模型解決數論競賽問題 2026-05-15 在一場AI機器人競賽中,參賽者需要計算第n個迴文素數二進位制展開中最長連續1位的長度。DeepSeek V4-Pro以73分奪冠,ChatGPT和Grok因誤解規則未能參賽,而Kimi因一個bug意外在最後一輪獲勝。本文詳細分析了各機器人的策略、演算法細節和比賽結果。
DeepSeek以73分獲得第一,Claude和GLM分列二三名。 ChatGPT和Grok因在註冊視窗內未完成預計算而被判未參賽。 我們測試了DeepSeek V4 Pro和Flash與Claude Opus 4.7及Kimi K2.6的對比 2026-05-15 我們對DeepSeek V4 Pro和Flash進行了與Claude Opus 4.7和Kimi K2.6相同的FlowGraph基準測試。Pro得分77/100,價格$2.25;Flash得分60/100,價格$0.02。Pro在效能上介於Opus(91)和Kimi(68)之間,但存在構建和租賃處理問題。Flash成本極低,但輸出缺少關鍵部分。
DeepSeek V4 Pro以77分和$2.25的價格位於Opus和Kimi之間。 DeepSeek V4 Flash以$0.02的成本獲得60分,但存在構建失敗和路由錯誤。 Violin:打破語言障礙的開源影片翻譯技能 2026-05-14 Violin是一個完全開源的AI影片翻譯工具,結合語音識別、大型語言模型翻譯和語音合成,使影片內容跨越語言障礙。它提供網路應用、命令列介面和代理技能,支援影片內容問答和個性化語音選擇。使用Together API,利用Whisper、DeepSeek和Cartesia等模型,以MIT許可證釋出。
Violin將語音識別、LLM翻譯和語音合成整合為開源影片翻譯工具。 支援網路應用、CLI和代理技能,適合不同使用者群體。 騰訊計劃增加AI支出,因中國晶片供應據稱改善 2026-05-13 騰訊宣佈計劃在2026年下半年大幅增加AI基礎設施支出,原因是國內晶片製造商正在提升AI晶片產量。公司還公佈了強勁的第一季度業績,並正在談判入股Deepseek。
騰訊將在2026年下半年增加AI基礎設施支出。 中國晶片製造商正提升國內AI晶片產量。 美國正在贏得人工智慧競賽 2026-05-13 美國在AI商業化方面領先,擁有強大的雲基礎設施、資料平臺和能源優勢。儘管中國有DeepSeek等競爭者,但美國在收入、採用率、工具和覆蓋範圍上明顯領先。歐洲缺乏雲規模和生態系統,難以追趕。AI競賽也是安全競賽,涉及武器化AI和封閉式技術棧。
自2025年1月DeepSeek R1衝擊市場後,美國公司加速推進AI商業化,在收入、採用率和工具方面領先。 美國擁有AWS、Azure和Google Cloud等全球超大規模雲平臺,以及YouTube、GitHub等資料平臺,形成完整的AI生態。 新研究發現:AI健康回答近半有誤,儘管聽起來令人信服 2026-05-12 一項發表在《BMJ Open》上的新研究測試了五種主流AI聊天機器人(ChatGPT、Gemini、Grok、Meta AI和DeepSeek)在50個健康問題上的表現,發現近20%的回答高度有問題,一半的回答有問題,30%存在一定問題。Grok表現最差,開放性問題風險尤其高。研究強呼叫戶不應視AI為權威醫療來源,需驗證資訊。
研究測試了ChatGPT、Gemini、Grok、Meta AI和DeepSeek五個聊天機器人,各回答50個健康問題。 近20%的回答被專家評為高度有問題,一半被評為有問題,僅30%部分有問題。 筆記型電腦本地AI的兩年:開源模型超越摩爾定律 2026-05-11 2024年5月至2026年5月,最貴的MacBook Pro記憶體仍為128GB,硬體幾乎未變。但可執行的開源模型在人工智慧分析指數上從10分提升至47分(DeepSeek V4 Flash),效能提升4.7倍,每10.7個月翻一番,速度是摩爾定律的兩倍以上。進步源於稀疏混合專家模型、激進量化技術和推理最佳化的小型密集模型。
128GB MacBook Pro上執行的開源模型智慧指數兩年內從10升至47,翻倍速度超過摩爾定律。 兩大突破:稀疏MoE模型(如gpt-oss-120B)和小型密集推理模型(如Qwen3.6 27B)。 思考越多,偏見越多:推理模型中長度驅動的立場偏差 2026-05-11 該論文挑戰了鏈式思維推理能減少偏見的普遍假設,透過實驗表明在多選題中,推理軌跡越長,立場偏差(位置偏好)越嚴重。研究涵蓋13種配置,發現12種顯示軌跡長度與立場偏差分數正相關,截斷實驗證明因果關係,且671B引數的DeepSeek-R1雖整體偏差低,但長軌跡下仍存在偏差。此外,直接回答的立場偏差是獨立現象。論文建議不應預設推理模型對選項順序魯棒,並提供了診斷工具包。
推理軌跡長度與立場偏差分數正相關,控制準確率後仍顯著。 截斷實驗表明,從軌跡後期繼續推理會增加選擇位置偏好選項的機率(16%-32%)。 序列雷達 #857:上週AI速覽:機器內部,文本框之外 2026-05-10 本週AI領域呈現科學化、產品化和投機化並存的趨勢。Anthropic釋出了自然語言自編碼器,實現模型內部狀態的語言化解釋;OpenAI推出新語音模型,推動AI向原生介面演進;SubQ聲稱擁有1200萬token上下文視窗,挑戰現有RAG架構;中國AI實驗室DeepSeek和Moonshot估值飆升,市場將AI公司視為戰略資產。整體而言,AI正從模型競賽轉向基礎設施競賽。
Anthropic的自然語言自編碼器將模型啟用壓縮為自然語言,開創了可解釋性的新正規化 OpenAI語音模型使AI從文本介面轉向即時語音代理,使用者體驗發生質變 百度釋出文心 5.1:搜尋能力登頂國內,預訓練成本僅為業界 6% 2026-05-09 百度正式釋出新一代基礎大模型文心大模型 5.1,採用“多維彈性預訓練”技術,以業界同規模模型約 6% 的預訓練成本實現基礎效果領先,登上 LMArena 搜尋榜國內第一、全球第四。Agent 能力顯著提升,超越 DeepSeek-V4-Pro,創意寫作與 Gemini 3.1 Pro 相當。
文心 5.1 採用多維彈性預訓練,成本僅為業界同規模模型的 6%。 以 1223 分位列 LMArena 搜尋榜國內第一、全球第四,是唯一上榜的國產模型。 梁文鋒出資200億!DeepSeek首輪創紀錄融資500億,V4.1定檔6月 2026-05-09 DeepSeek首輪融資目標最高500億元,梁文鋒個人出資200億,估值飆升至3500億元。同時,V4.1模型定檔6月釋出,公司從理想主義實驗室轉向商業化運營。
DeepSeek首輪融資最高500億元,梁文鋒個人出資200億元。 估值21天內從100億美元漲至500億美元。 DeepSeek以450億美元估值尋求融資,中國支援本土AI競爭對手 2026-05-08 DeepSeek正在以450億美元的估值進行首次外部融資,反映了中國對本土人工智慧公司的大力支援。
DeepSeek首次尋求外部投資,估值達450億美元。 融資凸顯中國政府對本土AI產業的支援。 AI資金持續湧入:Deepseek計劃創紀錄融資,Core Automation估值數週內翻四倍 2026-05-08 Deepseek計劃進行高達73.5億美元的融資,創中國AI公司歷史紀錄,其V4.1版本將於6月釋出。與此同時,由前OpenAI研究員Jerry Tworek僅六週前創立的Core Automation,估值目標已達40億美元。
Deepseek計劃73.5億美元融資,為中國AI公司最大規模。 Deepseek V4.1預計於6月釋出。 Show HN:Stagewise – 專為您的Z.ai/DeepSeek/Moonshot訂閱打造的智慧IDE 2026-05-08 Stagewise 是一款面向開發者的開源智慧IDE,內建程式碼代理,可直接訪問瀏覽器控制台和偵錯程式。它支援自帶金鑰,接入Z.ai、DeepSeek、Moonshot等主流AI提供商,讓開發者無需切換上下文即可瀏覽和構建。
開源智慧IDE,內建程式碼代理 支援自帶API金鑰,接入多種AI提供商 華為預計AI晶片收入達120億美元,中國本土代工廠產能吃緊 2026-05-08 華為預計AI晶片收入到2026年將達到120億美元,受阿里巴巴、字節跳動和騰訊等大客戶訂單推動,而輝達在中國AI加速器市場份額已降至零。主要挑戰包括中芯國際先進製程產能有限、良率低和週期長。昇騰950PR現已成為中國雲服務商的首選AI晶片,得益於DeepSeek V4針對華為架構的最佳化。
華為預計AI晶片收入2026年達120億美元,較2025年的75億美元增長超60%。 輝達CEO黃仁勳表示其在中國AI加速器市場份額已降至零,歸因於美國出口限制和北京推動本土採購。 Redis之父下場,給DeepSeek V4單獨造了一臺推理引擎 2026-05-08 Redis創始人antirez為DeepSeek V4 Flash打造專用推理引擎ds4.c,在Mac上實現本地高效能執行,支援2-bit量化、KV快取硬碟化及API相容層,引發對模型專屬推理框架的討論。
Redis之父antirez釋出專為DeepSeek V4 Flash設計的推理引擎ds4.c,基於Metal框架,僅支援Apple Silicon。 透過非對稱量化、KV快取外接和API相容層實現128GB Mac上284B模型可用推理速度。 所有實驗室都怕位元組,所有人都在誇DeepSeek!美國研究員36小時中國AI行 2026-05-08 艾倫研究所研究員Nathan Lambert的中國之行揭示了中美AI文化的巨大差異。中國實驗室強調合作,學生深度參與,開源文化盛行,而美國實驗室則陷入內鬥和明星文化。
中國AI實驗室文化更注重合作,學生直接參與核心研發。 所有實驗室都對字節跳動保持警惕,但對DeepSeek一致敬佩。 ZAYA1-8B技術報告 2026-05-08 ZAYA1-8B是一款基於MoE++架構的推理型混合專家模型,啟用引數僅7億,總引數80億,在AMD全棧計算平臺上訓練。它在數學和程式設計基準測試中與DeepSeek-R1-0528相當甚至超越,並提出了Markovian RSA測試時計算方法,進一步提升推理效能。
ZAYA1-8B擁有7億啟用引數和80億總引數,在AMD平臺上完整訓練。 在多個數學和程式設計基準測試中,表現與DeepSeek-R1-0528持平或更優。 部署DeepSeek-V4:為何百萬Token上下文是推理系統的問題 2026-05-08 DeepSeek-V4透過混合注意力設計(CSA、HCA、SWA)壓縮KV快取,將百萬Token上下文從模型挑戰轉變為推理系統挑戰。Together AI在NVIDIA HGX B200上的早期部署經驗展示了快取策略、字首快取和端點配置對長上下文工作負載效能的關鍵影響。
DeepSeek-V4的壓縮稀疏注意力(CSA)和高度壓縮注意力(HCA)減小了KV快取大小,但推理引擎需要管理多種快取佈局。 滑動視窗注意力(SWA)在長上下文時成為效能瓶頸,需謹慎選擇儲存策略。 Zyphra釋出ZAYA1-8B:基於AMD硬體訓練的小型推理MoE模型,效能遠超其體量 2026-05-07 Zyphra AI釋出了ZAYA1-8B,一款僅有7.6億活躍引數的小型混合專家(MoE)語言模型,但在數學和程式設計基準測試中擊敗了多個體量更大的開源模型。該模型採用MoE++架構,包含壓縮卷積注意力(CCA)、MLP路由器和PID控制器偏置平衡等創新,並引入了馬爾可夫遞迴自聚合(Markovian RSA)測試時計算方法,在HMMT'25上超越Claude 4.5 Sonnet,逼近DeepSeek-V3.2。模型完全在AMD Instinct MI300硬體上訓練,並以Apache 2.0許可釋出。
ZAYA1-8B僅有7.6億活躍引數,總引數84億,但在數學和編碼任務上超越多個更大模型。 採用MoE++架構,包括8倍KV快取壓縮的CCA、MLP路由器及PID偏置平衡、學習殘差縮放。 Token需求狂飆千倍,22億熱錢湧向這家AGI Infra頭號玩家 2026-05-07 隨著AI進入Agent時代,Token需求爆發。無問芯穹作為國內中立AGI基礎設施頭部廠商,累計融資超22億元,日均Token呼叫量較2025年底增長超20倍。該公司支撐Kimi、GLM、MiniMax、DeepSeek等主流國產模型,成為Token經濟的關鍵樞紐。
Agent時代使單次任務Token消耗從數百飆升至百萬級,基礎設施面臨三重顛覆。 無問芯穹日均Token呼叫量每兩週翻一番,增速遠超全國平均水平。 Deepseek估值接近450億美元,中國國家晶片基金領投 2026-05-06 據英國《金融時報》報道,Deepseek即將完成一輪融資,估值約450億美元。中國國家積體電路產業投資基金(大基金)領投,騰訊也在洽談入股。創始人梁文峰持有89.5%股份,可能個人投資。估值在數週內從200億美元攀升。
Deepseek估值約450億美元,中國大基金領投 騰訊也在洽談入股 Show HN:Token用量儀表盤——12家提供商與程式設計代理 2026-05-05 qlaud推出包含qcode程式設計代理、Router API閘道器和Platform託管後端的全棧AI工具集。qcode在桌面本地執行,支援Claude、GPT、DeepSeek、Llama等前沿模型,保障程式碼隱私;Router提供統一的API介面,具備故障轉移和延遲監控;Platform提供持久化執行緒、MCP聯結器和向量搜尋等能力。
qcode是本地執行的程式設計代理,支援多種前沿模型,程式碼不出本地。 Router提供統一API,整合故障轉移和延遲監控。 亞馬遜透過支援Llama、Qwen、Deepseek和Nova為SageMaker帶來智慧微調 2026-05-05 亞馬遜SageMaker AI現在包含一個AI代理,幫助開發者用自然語言描述用例,自動推薦訓練方法、準備資料、啟動訓練並提供可編輯的Jupyter筆記本程式碼。支援Llama、Qwen、Deepseek和Nova等模型系列。
SageMaker AI新增Kiro AI代理,支援自然語言描述用例並自動完成微調工作流。 代理預裝在開發環境中,也可使用Claude Code等其他代理。 上週AI #340 - OpenAI vs Musk + Microsoft, DeepSeek v4, 視覺香蕉 2026-05-05 馬斯克訴奧特曼案第一週庭審結束,馬斯克證詞佔據主導;微軟與OpenAI重新談判合作關係,終止獨家權利;DeepSeek釋出V4預覽版,號稱縮小與前沿模型差距;谷歌DeepMind推出視覺香蕉模型,統一影像生成與視覺理解。
馬斯克訴奧特曼案庭審首周,馬斯克承認xAI部分使用了OpenAI模型進行蒸餾訓練。 微軟與OpenAI修改合作協議,微軟失去獨家雲服務權利,OpenAI可自由選擇AWS等供應商。 LWiAI播客第243期:GPT-5.5、DeepSeek V4、AI安全破壞 2026-05-04 本期播客回顧了上週AI領域的重要新聞,包括OpenAI釋出GPT-5.5、xAI推出Grok Voice Think Fast 1.0、DeepSeek開源V4模型、Google計劃向Anthropic投資高達400億美元等。此外還討論了AI安全研究中的破壞行為、文件委託腐蝕等新研究。
OpenAI釋出GPT-5.5,顯著提升編碼能力,系統卡討論了思維鏈可監控性和對齊測試 xAI推出Grok Voice Think Fast 1.0,在即時語音代理基準測試中領先 “DeepSeek版Claude Code”,Github 2.3k星 2026-05-04 DeepSeek-TUI是一個基於Rust的終端程式設計Agent,專門為DeepSeek模型最佳化。近日因DeepSeek-V4釋出和作者中文宣傳而爆火,登頂GitHub熱榜。支援思維鏈顯示、上下文壓縮、RLM多子Agent並行、多種模型切換等功能。
DeepSeek-TUI是一個類似Claude Code的終端程式設計工具,專為DeepSeek最佳化,已獲2.3k星標。 專案由獨立開發者Hunter Bown發起,採用Rust編寫,MIT協議開源。 DeepSeek V4最大的遺憾 2026-05-03 DeepSeek V4的技術報告中缺少了Engram模組,引發熱議。Engram是一種為Transformer設計的原生知識查表模組,旨在分離靜態知識檢索與深度推理。儘管未在V4中出現,但後續有三篇論文探索了其在CXL記憶體池化、無衝突熱層最佳化及視覺模態的應用。
DeepSeek V4未包含此前備受期待的Engram模組。 Engram透過雜湊查詢機制實現靜態知識的高效檢索,釋放深層網路用於推理。 [AINews] AI工程師世界博覽會——自動研究、記憶、世界模型、Token最大化、代理商業以及垂直AI演講者徵集 2026-05-02 本文宣佈AI工程師世界博覽會第二波演講者徵集活動,涵蓋自動研究、記憶、世界模型、Token最大化、代理商業以及法律、醫療、GTM和金融領域的垂直AI等新主題。此外,還總結了近期AI領域的重要動態,包括Grok 4.3釋出、DeepSeek V4 Pro進展、Codex vs Claude Code競爭、代理基礎設施研究以及本地LLM社群的熱門討論。
AI工程師世界博覽會第二波演講者徵集啟動,新增多個技術主題軌道。 Grok 4.3釋出,效能提升但可靠性存疑;DeepSeek V4 Pro成為最可信的開源編碼/代理模型之一。 AI週刊第488期:OpenAI五天內失去了三樣東西 2026-04-30 本週OpenAI遭遇三重打擊:馬斯克訴訟威脅其非營利轉營利模式、營收未達預期引發市場連鎖反應、AWS合作終結微軟獨家分發權。同時,DeepSeek價格戰、科技巨頭裁員、白宮擬繞過Anthropic安全評估等事件標誌AI行業定價權轉移與監管環境變化。
馬斯克訴訟要求OpenAI返回非營利狀態,將定義AI領域營利化轉換的法律標準。 OpenAI營收未達Oracle 3000億美元計算合約的抵押預期,晶片股隨之下跌。 本週AI序列#851:DeepSeek-V4與百萬Token智慧架構 2026-04-29 DeepSeek-V4不僅僅是又一款前沿模型,它透過新的記憶體層次結構、注意力機制和訓練穩定器,解決了如何經濟有效地利用百萬Token上下文視窗的問題,使長上下文推理變得實用。
DeepSeek-V4支援百萬Token上下文視窗,但重點在於經濟地使用這些上下文,而非單純輸入大量文本。 該模型引入了新的記憶體層次結構、注意力機制、訓練穩定器、最佳化器選擇、量化方案和服務堆疊,以實現實用的長上下文推理。