AI News HubLIVE

來源分布

  • Hacker News AI11
  • 量子位11
  • The Decoder8
  • arXiv Machine Learning3
  • AI Weekly2
  • arXiv AI2
  • Last Week in AI2
  • Latent Space2

主題分布

  • Agent31
  • 模型27
  • 芯片24
  • 研究16
  • 政策9
  • 創業融資6
  • 工具3
  • 機械人1

日期線

  • 2026-05-088
  • 2026-05-234
  • 2026-05-053
  • 2026-05-042
  • 2026-05-072
  • 2026-05-092
  • 2026-05-112
  • 2026-05-132

最新動態

Show HN:我將一個 Python AI 代理和 Vue 儀表盤打包成了一個 Electron 應用

Hermes Desktop 是一個跨平台的桌面應用,它將 Python 運行時、hermes-agent(自改進 AI 代理)和 hermes-web-ui(Vue 3 + Koa 聊天儀表盤)打包到一個 Electron 應用中,用户無需單獨安裝 Python 或 Node。應用集成了 DingTalk 並通過 DeepSeek 驅動。

  • 打包了 Python 運行時和 hermes-agent,實現無需依賴即可運行
  • 使用 Electron 作為外殼,集成 hermes-web-ui 前端
站內正文

DeepSeek陳德里開發自動研究Skill,寫一篇論文人類只動腦2小時

DeepSeek研究員陳德里使用自研的DeliAutoResearch技能,與DeepSeek-V4-Pro和GPT-Image2合作,在6天內完成了一篇46頁的論文。論文提出了L1-L5自主研究智能體分類體系,分析了四種架構模式和17個主流系統,並指出了六大開放問題。陳德里表示,人類僅需投入不到2小時的“CPU時間”,其餘工作由AI Agent完成。

  • 陳德里開發自動研究技能DeliAutoResearch,論文99%由Agent撰寫。
  • 論文提出L1-L5自主研究智能體分類,類比自動駕駛SAE級別。
站內正文

AI週刊第496期:Anthropic的國防級模型現已全民可用

本週AI新聞要點:Anthropic公開了此前僅限國防承包商使用的頂級模型Mythos,使五角大樓級AI能力向開發者開放;DeepMind CEO哈薩比斯將AGI時間線提前至2029年;Starlette框架爆出嚴重認證繞過漏洞,影響數百萬AI代理;CrowdStrike等聯合摧毀Glassworm殭屍網絡;法國巴黎銀行與Mistral達成主權AI安全合作;中國限制阿里和深度求索頂尖AI工程師出境;Uber AI預算超支、ClickUp裁員並引入數千AI代理,同時MIT技術評論數據顯示AI暴露崗位失業率更低,奧特曼撤回白領失業預言。

  • Anthropic發佈Mythos模型,原本僅限NSA和五角大樓使用,現可通過標準API訪問。
  • 深度思維CEO哈薩比斯將AGI實現時間從5-10年縮短至2029年。
站內正文

據報道中國要求頂尖AI研究人員出國前需獲批准

中國正在限制阿里巴巴和DeepSeek等私營公司的頂尖AI研究人員出國旅行,他們需要獲得官方批准才能離境。北京擔心數據泄露、技術盜竊和人才挖角,正在加強對國內AI行業的管控。

  • 中國要求頂尖AI研究人員出國前需獲得許可。
  • 該政策適用於阿里巴巴和DeepSeek等私營公司。
站內正文

Cited AI Workspace:無需重複上傳文件

UUMuse 是一個雲端AI知識庫平台,只需上傳一次文件,即可在GPT、Claude、DeepSeek、Qwen等多個模型中進行帶有引用的問答、生成內容和部署。支持通過API和MCP供代理和應用調用,提供永久記憶、多專家辯論(Spark)、代理模式等功能,並可將知識庫部署為文檔網站、小部件、API端點等。

  • 一次上傳,多模型使用:文件上傳後,GPT、Claude、DeepSeek、Qwen等模型均可基於同一知識庫作答並引用來源。
  • 記憶與代理:AI記住你的偏好和項目上下文,代理模式自動規劃並執行任務,無需重複指令。
站內正文

DeepSeek V4還能更省!新工具緩存命中率高達99.82%,2折穩定到手

DeepSeek V4系列發佈一個月後,開源社區推出Reasonix工具,專為DeepSeek設計,通過優化緩存機制將賬單成本降低至原來的五分之一左右。該工具緩存命中率高達99.82%,實現4億+token從61美元降至12美元。

  • Reasonix是專為DeepSeek打造的終端編碼工具,核心目標是降低使用成本。
  • 通過緩存優先循環、工具調用修復和自動上下文壓縮等機制,實現長會話緩存命中率超90%。
站內正文

Deepseek將75%折扣永久化,輸出令牌定價至少比GPT-5.5低34倍

Deepseek宣佈其頂級模型V4-Pro的75%折扣永久生效。輸入令牌每百萬僅需0.435美元,至少比GPT-5.5便宜11.5倍,輸出令牌便宜34倍以上。對於令牌消耗巨大的代理系統,這一價格可能對西方供應商造成巨大壓力。

  • Deepseek永久保留V4-Pro模型75%的折扣。
  • 輸入令牌定價0.435美元/百萬,比GPT-5.5低11.5倍。
站內正文

阿里最新AI模型自主運行35小時優化自有芯片代碼

阿里通義千問團隊發佈Qwen3.7-Max,專為長時間自主代理任務設計。在基準測試中匹配Claude Opus 4.6,超越DeepSeek V4 Pro和Kimi K2.6等中國對手。團隊還展示了該模型操控四足機器人。

  • Qwen3.7-Max專為長時間自主代理任務設計
  • 基準測試匹配Claude Opus 4.6,超越中國競品
站內正文

【AINews】所有模型實驗室現在都是智能體實驗室

在OpenAI即將上市之際,行業巨頭紛紛從純模型轉向智能體產品。DeepSeek永久降價75%,MCP協議簡化,谷歌推出全天候智能體,Anthropic發現上萬高危漏洞。智能體化成為AI新常態。

  • Greg Brockman表示模型不再是產品,模型+智能體+工作流才是關鍵
  • DeepSeek V4 Pro永久降價75%,推理成本大幅降低
站內正文

融資700億!DeepSeek Code真要來了,ACM金牌大神崔添翼掛帥

DeepSeek融資額達700億元,計劃推出自家Code產品。資深研究員Deli Chen發帖招聘Harness團隊,前TSY Capital聯合創始人崔添翼或將出任負責人。

  • DeepSeek融資700億元,優先AI研究而非商業化。
  • DeepSeek Code產品確認開發中,招聘Agent Harness團隊。
站內正文

異步Python客户端:私有DeepSeek API的高性能封裝

aiodeepseek是一個高性能的異步Python客户端,專為私有DeepSeek API設計。支持流式響應、圖像上傳、多輪對話和新賬户註冊。客户端自動解決工作量證明挑戰,採用C++和AVX2優化,性能出色。

  • 異步Python客户端,支持流式輸出和圖像上傳
  • 多輪對話和賬户註冊功能
站內正文

基於扁平度的理論最優量化

本文提出一種新的量化指標“扁平度”來衡量異常值分佈,並據此推導出理論最優解。作者進一步提出雙向對角量化(BDQ)框架,通過學習到的對角操作將異常值分散到矩陣維度中,顯著提升了大語言模型低位寬量化的性能。實驗表明,BDQ在LLaMA-3-8B上W4A4量化精度下降不足1%,在DeepSeek-R1-Distill-LLaMA-70B的W2A4KV16任務中性能差距縮小39.1%。

  • 提出Flatness指標量化異常值分佈,並推導理論最優解
  • BDQ框架通過雙向對角變換分散異常值
站內正文

HELLoRA:混合專家模型的熱門專家層層級低秩適配方法

HELLoRA是一種針對混合專家(MoE)模型的高效微調方法,僅對每層最活躍的專家附加LoRA模塊,從而減少可訓練參數和適配器帶來的計算量,同時提升下游任務性能。在OlMoE、Mixtral和DeepSeekMoE等模型上,HELLoRA在數學推理、代碼生成和安全對齊任務中均優於現有方法,例如在OlMoE上僅使用15.7%的參數,減少38.7%的FLOPs,吞吐量提升1.9倍,準確率提高9.2%。

  • HELLoRA僅對MoE模型每層最頻繁激活的專家附加LoRA模塊,實現參數高效微調。
  • 在多種MoE模型上,HELLoRA顯著減少可訓練參數和計算開銷,同時提升性能。
站內正文

2025年十大人工智能研究論文

2025年AI研究從聊天機器人轉向推理系統、自主代理和多模態系統。十大論文包括DeepSeek-R1(強化學習)、Gemini 2.5(多模態推理)、Qwen2.5(開源模型)、Large Concept Models(概念級語言建模)、ESG分析抗漂綠、VideoWorld(世界模型)、AI Scientist-v2(自主研究)、SWE-Lancer(編碼代理基準)、OLMo 2(完全開源)和Mixture-of-Recursions(高效推理)。

  • DeepSeek-R1將強化學習後訓練方法公開,顯著提升推理和編碼能力。
  • Gemini 2.5引入“思考模式”,擴展多模態理解和長上下文。
站內正文

GQLA:面向硬件自適應的大語言模型解碼的分組查詢潛在注意力機制

研究人員提出了分組查詢潛在注意力(GQLA),這是對DeepSeek多頭潛在注意力(MLA)的改進,在不重新訓練的情況下提供兩種硬件自適應的解碼路徑。該方法能在H100和H20 GPU上實現高效推理,幷包含TransGQLA用於轉換預訓練的GQA模型。

  • GQLA在DeepSeek的MLA基礎上擴展出雙解碼路徑(MQA吸收和GQA),以適應不同硬件的roofline模型。
  • 同一組GQLA權重既可用於H100(MQA路徑),也可用於H20(GQA路徑配合多token預測)。
站內正文

最新開放製品(#21):開放模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1等。關於CAISI對V4的評估。

本月開放前沿實驗室紛紛發佈新模型,包括DeepSeek V4、Gemma 4、Kimi K2.6等。CAISI評估指出開放模型落後於美國前沿,且差距在擴大,但評估方法受到質疑,實際能力差距可能被高估。文章還介紹了多個亮點模型。

  • DeepSeek、Google、Moonshot AI等發佈多個開放模型。
  • CAISI評估顯示開放模型與封閉模型的Elo差距巨大,但基準測試方法存在爭議。
站內正文

LLM架構最新發展:KV共享、mHC與壓縮注意力

從Gemma 4到DeepSeek V4,本文探討了新的開源LLM如何通過跨層KV共享、逐層嵌入、注意力預算、壓縮卷積注意力和mHC等架構技術降低長上下文成本。

  • Gemma 4引入跨層KV共享,將KV緩存大小減半,同時保持模型質量。
  • 逐層嵌入(PLE)通過增加小型嵌入參數提高模型容量,而不顯著增加計算成本。
站內正文

不同模型解決數論競賽問題

在一場AI機器人競賽中,參賽者需要計算第n個迴文素數二進制展開中最長連續1位的長度。DeepSeek V4-Pro以73分奪冠,ChatGPT和Grok因誤解規則未能參賽,而Kimi因一個bug意外在最後一輪獲勝。本文詳細分析了各機器人的策略、算法細節和比賽結果。

  • DeepSeek以73分獲得第一,Claude和GLM分列二三名。
  • ChatGPT和Grok因在註冊窗口內未完成預計算而被判未參賽。
站內正文

我們測試了DeepSeek V4 Pro和Flash與Claude Opus 4.7及Kimi K2.6的對比

我們對DeepSeek V4 Pro和Flash進行了與Claude Opus 4.7和Kimi K2.6相同的FlowGraph基準測試。Pro得分77/100,價格$2.25;Flash得分60/100,價格$0.02。Pro在性能上介於Opus(91)和Kimi(68)之間,但存在構建和租賃處理問題。Flash成本極低,但輸出缺少關鍵部分。

  • DeepSeek V4 Pro以77分和$2.25的價格位於Opus和Kimi之間。
  • DeepSeek V4 Flash以$0.02的成本獲得60分,但存在構建失敗和路由錯誤。
站內正文

Violin:打破語言障礙的開源視頻翻譯技能

Violin是一個完全開源的AI視頻翻譯工具,結合語音識別、大型語言模型翻譯和語音合成,使視頻內容跨越語言障礙。它提供網絡應用、命令行界面和代理技能,支持視頻內容問答和個性化語音選擇。使用Together API,利用Whisper、DeepSeek和Cartesia等模型,以MIT許可證發佈。

  • Violin將語音識別、LLM翻譯和語音合成整合為開源視頻翻譯工具。
  • 支持網絡應用、CLI和代理技能,適合不同用户羣體。
站內正文

騰訊計劃增加AI支出,因中國芯片供應據稱改善

騰訊宣佈計劃在2026年下半年大幅增加AI基礎設施支出,原因是國內芯片製造商正在提升AI芯片產量。公司還公佈了強勁的第一季度業績,並正在談判入股Deepseek。

  • 騰訊將在2026年下半年增加AI基礎設施支出。
  • 中國芯片製造商正提升國內AI芯片產量。
站內正文

美國正在贏得人工智能競賽

美國在AI商業化方面領先,擁有強大的雲基礎設施、數據平台和能源優勢。儘管中國有DeepSeek等競爭者,但美國在收入、採用率、工具和覆蓋範圍上明顯領先。歐洲缺乏雲規模和生態系統,難以追趕。AI競賽也是安全競賽,涉及武器化AI和封閉式技術棧。

  • 自2025年1月DeepSeek R1衝擊市場後,美國公司加速推進AI商業化,在收入、採用率和工具方面領先。
  • 美國擁有AWS、Azure和Google Cloud等全球超大規模雲平台,以及YouTube、GitHub等數據平台,形成完整的AI生態。
站內正文

新研究發現:AI健康回答近半有誤,儘管聽起來令人信服

一項發表在《BMJ Open》上的新研究測試了五種主流AI聊天機器人(ChatGPT、Gemini、Grok、Meta AI和DeepSeek)在50個健康問題上的表現,發現近20%的回答高度有問題,一半的回答有問題,30%存在一定問題。Grok表現最差,開放性問題風險尤其高。研究強調用户不應視AI為權威醫療來源,需驗證信息。

  • 研究測試了ChatGPT、Gemini、Grok、Meta AI和DeepSeek五個聊天機器人,各回答50個健康問題。
  • 近20%的回答被專家評為高度有問題,一半被評為有問題,僅30%部分有問題。
站內正文

筆記本電腦本地AI的兩年:開源模型超越摩爾定律

2024年5月至2026年5月,最貴的MacBook Pro內存仍為128GB,硬件幾乎未變。但可運行的開源模型在人工智能分析指數上從10分提升至47分(DeepSeek V4 Flash),性能提升4.7倍,每10.7個月翻一番,速度是摩爾定律的兩倍以上。進步源於稀疏混合專家模型、激進量化技術和推理優化的小型密集模型。

  • 128GB MacBook Pro上運行的開源模型智能指數兩年內從10升至47,翻倍速度超過摩爾定律。
  • 兩大突破:稀疏MoE模型(如gpt-oss-120B)和小型密集推理模型(如Qwen3.6 27B)。
站內正文

思考越多,偏見越多:推理模型中長度驅動的立場偏差

該論文挑戰了鏈式思維推理能減少偏見的普遍假設,通過實驗表明在多選題中,推理軌跡越長,立場偏差(位置偏好)越嚴重。研究涵蓋13種配置,發現12種顯示軌跡長度與立場偏差分數正相關,截斷實驗證明因果關係,且671B參數的DeepSeek-R1雖整體偏差低,但長軌跡下仍存在偏差。此外,直接回答的立場偏差是獨立現象。論文建議不應默認推理模型對選項順序魯棒,並提供了診斷工具包。

  • 推理軌跡長度與立場偏差分數正相關,控制準確率後仍顯著。
  • 截斷實驗表明,從軌跡後期繼續推理會增加選擇位置偏好選項的概率(16%-32%)。
站內正文

序列雷達 #857:上週AI速覽:機器內部,文本框之外

本週AI領域呈現科學化、產品化和投機化並存的趨勢。Anthropic發佈了自然語言自編碼器,實現模型內部狀態的語言化解釋;OpenAI推出新語音模型,推動AI向原生界面演進;SubQ聲稱擁有1200萬token上下文窗口,挑戰現有RAG架構;中國AI實驗室DeepSeek和Moonshot估值飆升,市場將AI公司視為戰略資產。整體而言,AI正從模型競賽轉向基礎設施競賽。

  • Anthropic的自然語言自編碼器將模型激活壓縮為自然語言,開創了可解釋性的新範式
  • OpenAI語音模型使AI從文本界面轉向實時語音代理,用户體驗發生質變
站內正文

百度發佈文心 5.1:搜索能力登頂國內,預訓練成本僅為業界 6%

百度正式發佈新一代基礎大模型文心大模型 5.1,採用“多維彈性預訓練”技術,以業界同規模模型約 6% 的預訓練成本實現基礎效果領先,登上 LMArena 搜索榜國內第一、全球第四。Agent 能力顯著提升,超越 DeepSeek-V4-Pro,創意寫作與 Gemini 3.1 Pro 相當。

  • 文心 5.1 採用多維彈性預訓練,成本僅為業界同規模模型的 6%。
  • 以 1223 分位列 LMArena 搜索榜國內第一、全球第四,是唯一上榜的國產模型。
站內正文

梁文鋒出資200億!DeepSeek首輪創紀錄融資500億,V4.1定檔6月

DeepSeek首輪融資目標最高500億元,梁文鋒個人出資200億,估值飆升至3500億元。同時,V4.1模型定檔6月發佈,公司從理想主義實驗室轉向商業化運營。

  • DeepSeek首輪融資最高500億元,梁文鋒個人出資200億元。
  • 估值21天內從100億美元漲至500億美元。
站內正文

Show HN:Stagewise – 專為您的Z.ai/DeepSeek/Moonshot訂閲打造的智能IDE

Stagewise 是一款面向開發者的開源智能IDE,內置代碼代理,可直接訪問瀏覽器控制台和調試器。它支持自帶密鑰,接入Z.ai、DeepSeek、Moonshot等主流AI提供商,讓開發者無需切換上下文即可瀏覽和構建。

  • 開源智能IDE,內置代碼代理
  • 支持自帶API密鑰,接入多種AI提供商
站內正文

華為預計AI芯片收入達120億美元,中國本土代工廠產能吃緊

華為預計AI芯片收入到2026年將達到120億美元,受阿里巴巴、字節跳動和騰訊等大客户訂單推動,而英偉達在中國AI加速器市場份額已降至零。主要挑戰包括中芯國際先進製程產能有限、良率低和週期長。昇騰950PR現已成為中國雲服務商的首選AI芯片,得益於DeepSeek V4針對華為架構的優化。

  • 華為預計AI芯片收入2026年達120億美元,較2025年的75億美元增長超60%。
  • 英偉達CEO黃仁勳表示其在中國AI加速器市場份額已降至零,歸因於美國出口限制和北京推動本土採購。
站內正文

Redis之父下場,給DeepSeek V4單獨造了一台推理引擎

Redis創始人antirez為DeepSeek V4 Flash打造專用推理引擎ds4.c,在Mac上實現本地高性能運行,支持2-bit量化、KV緩存硬盤化及API兼容層,引發對模型專屬推理框架的討論。

  • Redis之父antirez發佈專為DeepSeek V4 Flash設計的推理引擎ds4.c,基於Metal框架,僅支持Apple Silicon。
  • 通過非對稱量化、KV緩存外置和API兼容層實現128GB Mac上284B模型可用推理速度。
站內正文

所有實驗室都怕字節,所有人都在誇DeepSeek!美國研究員36小時中國AI行

艾倫研究所研究員Nathan Lambert的中國之行揭示了中美AI文化的巨大差異。中國實驗室強調合作,學生深度參與,開源文化盛行,而美國實驗室則陷入內鬥和明星文化。

  • 中國AI實驗室文化更注重合作,學生直接參與核心研發。
  • 所有實驗室都對字節跳動保持警惕,但對DeepSeek一致敬佩。
站內正文

ZAYA1-8B技術報告

ZAYA1-8B是一款基於MoE++架構的推理型混合專家模型,激活參數僅7億,總參數80億,在AMD全棧計算平台上訓練。它在數學和編程基準測試中與DeepSeek-R1-0528相當甚至超越,並提出了Markovian RSA測試時計算方法,進一步提升推理性能。

  • ZAYA1-8B擁有7億激活參數和80億總參數,在AMD平台上完整訓練。
  • 在多個數學和編程基準測試中,表現與DeepSeek-R1-0528持平或更優。
站內正文

部署DeepSeek-V4:為何百萬Token上下文是推理系統的問題

DeepSeek-V4通過混合注意力設計(CSA、HCA、SWA)壓縮KV緩存,將百萬Token上下文從模型挑戰轉變為推理系統挑戰。Together AI在NVIDIA HGX B200上的早期部署經驗展示了緩存策略、前綴緩存和端點配置對長上下文工作負載性能的關鍵影響。

  • DeepSeek-V4的壓縮稀疏注意力(CSA)和高度壓縮注意力(HCA)減小了KV緩存大小,但推理引擎需要管理多種緩存佈局。
  • 滑動窗口注意力(SWA)在長上下文時成為性能瓶頸,需謹慎選擇存儲策略。
站內正文

Zyphra發佈ZAYA1-8B:基於AMD硬件訓練的小型推理MoE模型,性能遠超其體量

Zyphra AI發佈了ZAYA1-8B,一款僅有7.6億活躍參數的小型混合專家(MoE)語言模型,但在數學和編程基準測試中擊敗了多個體量更大的開源模型。該模型採用MoE++架構,包含壓縮卷積注意力(CCA)、MLP路由器和PID控制器偏置平衡等創新,並引入了馬爾可夫遞歸自聚合(Markovian RSA)測試時計算方法,在HMMT'25上超越Claude 4.5 Sonnet,逼近DeepSeek-V3.2。模型完全在AMD Instinct MI300硬件上訓練,並以Apache 2.0許可發佈。

  • ZAYA1-8B僅有7.6億活躍參數,總參數84億,但在數學和編碼任務上超越多個更大模型。
  • 採用MoE++架構,包括8倍KV緩存壓縮的CCA、MLP路由器及PID偏置平衡、學習殘差縮放。
站內正文

Token需求狂飆千倍,22億熱錢湧向這家AGI Infra頭號玩家

隨着AI進入Agent時代,Token需求爆發。無問芯穹作為國內中立AGI基礎設施頭部廠商,累計融資超22億元,日均Token調用量較2025年底增長超20倍。該公司支撐Kimi、GLM、MiniMax、DeepSeek等主流國產模型,成為Token經濟的關鍵樞紐。

  • Agent時代使單次任務Token消耗從數百飆升至百萬級,基礎設施面臨三重顛覆。
  • 無問芯穹日均Token調用量每兩週翻一番,增速遠超全國平均水平。
站內正文

Deepseek估值接近450億美元,中國國家芯片基金領投

據英國《金融時報》報道,Deepseek即將完成一輪融資,估值約450億美元。中國國家集成電路產業投資基金(大基金)領投,騰訊也在洽談入股。創始人梁文峯持有89.5%股份,可能個人投資。估值在數週內從200億美元攀升。

  • Deepseek估值約450億美元,中國大基金領投
  • 騰訊也在洽談入股
站內正文

Show HN:Token用量儀表盤——12家提供商與編程代理

qlaud推出包含qcode編程代理、Router API網關和Platform託管後端的全棧AI工具集。qcode在桌面本地運行,支持Claude、GPT、DeepSeek、Llama等前沿模型,保障代碼隱私;Router提供統一的API接口,具備故障轉移和延遲監控;Platform提供持久化線程、MCP連接器和向量搜索等能力。

  • qcode是本地運行的編程代理,支持多種前沿模型,代碼不出本地。
  • Router提供統一API,集成故障轉移和延遲監控。
站內正文

亞馬遜通過支持Llama、Qwen、Deepseek和Nova為SageMaker帶來智能微調

亞馬遜SageMaker AI現在包含一個AI代理,幫助開發者用自然語言描述用例,自動推薦訓練方法、準備數據、啓動訓練並提供可編輯的Jupyter筆記本代碼。支持Llama、Qwen、Deepseek和Nova等模型系列。

  • SageMaker AI新增Kiro AI代理,支持自然語言描述用例並自動完成微調工作流。
  • 代理預裝在開發環境中,也可使用Claude Code等其他代理。
站內正文

上週AI #340 - OpenAI vs Musk + Microsoft, DeepSeek v4, 視覺香蕉

馬斯克訴奧特曼案第一週庭審結束,馬斯克證詞佔據主導;微軟與OpenAI重新談判合作關係,終止獨家權利;DeepSeek發佈V4預覽版,號稱縮小與前沿模型差距;谷歌DeepMind推出視覺香蕉模型,統一圖像生成與視覺理解。

  • 馬斯克訴奧特曼案庭審首周,馬斯克承認xAI部分使用了OpenAI模型進行蒸餾訓練。
  • 微軟與OpenAI修改合作協議,微軟失去獨家雲服務權利,OpenAI可自由選擇AWS等供應商。
站內正文

LWiAI播客第243期:GPT-5.5、DeepSeek V4、AI安全破壞

本期播客回顧了上週AI領域的重要新聞,包括OpenAI發佈GPT-5.5、xAI推出Grok Voice Think Fast 1.0、DeepSeek開源V4模型、Google計劃向Anthropic投資高達400億美元等。此外還討論了AI安全研究中的破壞行為、文檔委託腐蝕等新研究。

  • OpenAI發佈GPT-5.5,顯著提升編碼能力,系統卡討論了思維鏈可監控性和對齊測試
  • xAI推出Grok Voice Think Fast 1.0,在實時語音代理基準測試中領先
站內正文

“DeepSeek版Claude Code”,Github 2.3k星

DeepSeek-TUI是一個基於Rust的終端編程Agent,專門為DeepSeek模型優化。近日因DeepSeek-V4發佈和作者中文宣傳而爆火,登頂GitHub熱榜。支持思維鏈顯示、上下文壓縮、RLM多子Agent並行、多種模型切換等功能。

  • DeepSeek-TUI是一個類似Claude Code的終端編程工具,專為DeepSeek優化,已獲2.3k星標。
  • 項目由獨立開發者Hunter Bown發起,採用Rust編寫,MIT協議開源。
站內正文

DeepSeek V4最大的遺憾

DeepSeek V4的技術報告中缺少了Engram模塊,引發熱議。Engram是一種為Transformer設計的原生知識查表模塊,旨在分離靜態知識檢索與深度推理。儘管未在V4中出現,但後續有三篇論文探索了其在CXL內存池化、無衝突熱層優化及視覺模態的應用。

  • DeepSeek V4未包含此前備受期待的Engram模塊。
  • Engram通過哈希查找機制實現靜態知識的高效檢索,釋放深層網絡用於推理。
站內正文

[AINews] AI工程師世界博覽會——自動研究、記憶、世界模型、Token最大化、代理商業以及垂直AI演講者徵集

本文宣佈AI工程師世界博覽會第二波演講者徵集活動,涵蓋自動研究、記憶、世界模型、Token最大化、代理商業以及法律、醫療、GTM和金融領域的垂直AI等新主題。此外,還總結了近期AI領域的重要動態,包括Grok 4.3發佈、DeepSeek V4 Pro進展、Codex vs Claude Code競爭、代理基礎設施研究以及本地LLM社區的熱門討論。

  • AI工程師世界博覽會第二波演講者徵集啓動,新增多個技術主題軌道。
  • Grok 4.3發佈,性能提升但可靠性存疑;DeepSeek V4 Pro成為最可信的開源編碼/代理模型之一。
站內正文

AI週刊第488期:OpenAI五天內失去了三樣東西

本週OpenAI遭遇三重打擊:馬斯克訴訟威脅其非營利轉營利模式、營收未達預期引發市場連鎖反應、AWS合作終結微軟獨家分發權。同時,DeepSeek價格戰、科技巨頭裁員、白宮擬繞過Anthropic安全評估等事件標誌AI行業定價權轉移與監管環境變化。

  • 馬斯克訴訟要求OpenAI返回非營利狀態,將定義AI領域營利化轉換的法律標準。
  • OpenAI營收未達Oracle 3000億美元計算合約的抵押預期,芯片股隨之下跌。
站內正文

本週AI序列#851:DeepSeek-V4與百萬Token智能架構

DeepSeek-V4不僅僅是又一款前沿模型,它通過新的內存層次結構、注意力機制和訓練穩定器,解決了如何經濟有效地利用百萬Token上下文窗口的問題,使長上下文推理變得實用。

  • DeepSeek-V4支持百萬Token上下文窗口,但重點在於經濟地使用這些上下文,而非單純輸入大量文本。
  • 該模型引入了新的內存層次結構、注意力機制、訓練穩定器、優化器選擇、量化方案和服務堆棧,以實現實用的長上下文推理。
站內正文

公司導航