AI News HubLIVE

來源分布

  • Hacker News AI11
  • 量子位11
  • The Decoder8
  • arXiv Machine Learning3
  • AI Weekly2
  • arXiv AI2
  • Last Week in AI2
  • Latent Space2

主題分布

  • Agent31
  • 模型27
  • 晶片24
  • 研究16
  • 政策9
  • 創業融資6
  • 工具3
  • 機器人1

日期線

  • 2026-05-088
  • 2026-05-234
  • 2026-05-053
  • 2026-05-042
  • 2026-05-072
  • 2026-05-092
  • 2026-05-112
  • 2026-05-132

最新動態

Show HN:我將一個 Python AI 代理和 Vue 儀表盤打包成了一個 Electron 應用

Hermes Desktop 是一個跨平臺的桌面應用,它將 Python 執行時、hermes-agent(自改進 AI 代理)和 hermes-web-ui(Vue 3 + Koa 聊天儀表盤)打包到一個 Electron 應用中,使用者無需單獨安裝 Python 或 Node。應用整合了 DingTalk 並透過 DeepSeek 驅動。

  • 打包了 Python 執行時和 hermes-agent,實現無需依賴即可執行
  • 使用 Electron 作為外殼,整合 hermes-web-ui 前端
站內正文

DeepSeek陳德里開發自動研究Skill,寫一篇論文人類只動腦2小時

DeepSeek研究員陳德里使用自研的DeliAutoResearch技能,與DeepSeek-V4-Pro和GPT-Image2合作,在6天內完成了一篇46頁的論文。論文提出了L1-L5自主研究智慧體分類體系,分析了四種架構模式和17個主流系統,並指出了六大開放問題。陳德里表示,人類僅需投入不到2小時的“CPU時間”,其餘工作由AI Agent完成。

  • 陳德里開發自動研究技能DeliAutoResearch,論文99%由Agent撰寫。
  • 論文提出L1-L5自主研究智慧體分類,類比自動駕駛SAE級別。
站內正文

AI週刊第496期:Anthropic的國防級模型現已全民可用

本週AI新聞要點:Anthropic公開了此前僅限國防承包商使用的頂級模型Mythos,使五角大樓級AI能力向開發者開放;DeepMind CEO哈薩比斯將AGI時間線提前至2029年;Starlette框架爆出嚴重認證繞過漏洞,影響數百萬AI代理;CrowdStrike等聯合摧毀Glassworm殭屍網路;法國巴黎銀行與Mistral達成主權AI安全合作;中國限制阿里和深度求索頂尖AI工程師出境;Uber AI預算超支、ClickUp裁員並引入數千AI代理,同時MIT技術評論資料顯示AI暴露崗位失業率更低,奧特曼撤回白領失業預言。

  • Anthropic釋出Mythos模型,原本僅限NSA和五角大樓使用,現可透過標準API訪問。
  • 深度思維CEO哈薩比斯將AGI實現時間從5-10年縮短至2029年。
站內正文

據報道中國要求頂尖AI研究人員出國前需獲批准

中國正在限制阿里巴巴和DeepSeek等私營公司的頂尖AI研究人員出國旅行,他們需要獲得官方批准才能離境。北京擔心資料洩露、技術盜竊和人才挖角,正在加強對國內AI行業的管控。

  • 中國要求頂尖AI研究人員出國前需獲得許可。
  • 該政策適用於阿里巴巴和DeepSeek等私營公司。
站內正文

Cited AI Workspace:無需重複上傳檔案

UUMuse 是一個雲端AI知識庫平臺,只需上傳一次檔案,即可在GPT、Claude、DeepSeek、Qwen等多個模型中進行帶有引用的問答、生成內容和部署。支援透過API和MCP供代理和應用呼叫,提供永久記憶、多專家辯論(Spark)、代理模式等功能,並可將知識庫部署為文件網站、小部件、API端點等。

  • 一次上傳,多模型使用:檔案上傳後,GPT、Claude、DeepSeek、Qwen等模型均可基於同一知識庫作答並引用來源。
  • 記憶與代理:AI記住你的偏好和專案上下文,代理模式自動規劃並執行任務,無需重複指令。
站內正文

DeepSeek V4還能更省!新工具快取命中率高達99.82%,2折穩定到手

DeepSeek V4系列釋出一個月後,開源社群推出Reasonix工具,專為DeepSeek設計,透過最佳化快取機制將賬單成本降低至原來的五分之一左右。該工具快取命中率高達99.82%,實現4億+token從61美元降至12美元。

  • Reasonix是專為DeepSeek打造的終端編碼工具,核心目標是降低使用成本。
  • 透過快取優先迴圈、工具呼叫修復和自動上下文壓縮等機制,實現長會話快取命中率超90%。
站內正文

Deepseek將75%折扣永久化,輸出令牌定價至少比GPT-5.5低34倍

Deepseek宣佈其頂級模型V4-Pro的75%折扣永久生效。輸入令牌每百萬僅需0.435美元,至少比GPT-5.5便宜11.5倍,輸出令牌便宜34倍以上。對於令牌消耗巨大的代理系統,這一價格可能對西方供應商造成巨大壓力。

  • Deepseek永久保留V4-Pro模型75%的折扣。
  • 輸入令牌定價0.435美元/百萬,比GPT-5.5低11.5倍。
站內正文

阿里最新AI模型自主執行35小時最佳化自有晶片程式碼

阿里通義千問團隊釋出Qwen3.7-Max,專為長時間自主代理任務設計。在基準測試中匹配Claude Opus 4.6,超越DeepSeek V4 Pro和Kimi K2.6等中國對手。團隊還展示了該模型操控四足機器人。

  • Qwen3.7-Max專為長時間自主代理任務設計
  • 基準測試匹配Claude Opus 4.6,超越中國競品
站內正文

【AINews】所有模型實驗室現在都是智慧體實驗室

在OpenAI即將上市之際,行業巨頭紛紛從純模型轉向智慧體產品。DeepSeek永久降價75%,MCP協議簡化,谷歌推出全天候智慧體,Anthropic發現上萬高危漏洞。智慧體化成為AI新常態。

  • Greg Brockman表示模型不再是產品,模型+智慧體+工作流才是關鍵
  • DeepSeek V4 Pro永久降價75%,推理成本大幅降低
站內正文

融資700億!DeepSeek Code真要來了,ACM金牌大神崔添翼掛帥

DeepSeek融資額達700億元,計劃推出自家Code產品。資深研究員Deli Chen發帖招聘Harness團隊,前TSY Capital聯合創始人崔添翼或將出任負責人。

  • DeepSeek融資700億元,優先AI研究而非商業化。
  • DeepSeek Code產品確認開發中,招聘Agent Harness團隊。
站內正文

非同步Python客戶端:私有DeepSeek API的高效能封裝

aiodeepseek是一個高效能的非同步Python客戶端,專為私有DeepSeek API設計。支援流式響應、影像上傳、多輪對話和新賬戶註冊。客戶端自動解決工作量證明挑戰,採用C++和AVX2最佳化,效能出色。

  • 非同步Python客戶端,支援流式輸出和影像上傳
  • 多輪對話和賬戶註冊功能
站內正文

基於扁平度的理論最優量化

本文提出一種新的量化指標“扁平度”來衡量異常值分佈,並據此推匯出理論最優解。作者進一步提出雙向對角量化(BDQ)框架,透過學習到的對角操作將異常值分散到矩陣維度中,顯著提升了大語言模型低位寬量化的效能。實驗表明,BDQ在LLaMA-3-8B上W4A4量化精度下降不足1%,在DeepSeek-R1-Distill-LLaMA-70B的W2A4KV16任務中效能差距縮小39.1%。

  • 提出Flatness指標量化異常值分佈,並推導理論最優解
  • BDQ框架透過雙向對角變換分散異常值
站內正文

HELLoRA:混合專家模型的熱門專家層層級低秩適配方法

HELLoRA是一種針對混合專家(MoE)模型的高效微調方法,僅對每層最活躍的專家附加LoRA模組,從而減少可訓練引數和介面卡帶來的計算量,同時提升下游任務效能。在OlMoE、Mixtral和DeepSeekMoE等模型上,HELLoRA在數學推理、程式碼生成和安全對齊任務中均優於現有方法,例如在OlMoE上僅使用15.7%的引數,減少38.7%的FLOPs,吞吐量提升1.9倍,準確率提高9.2%。

  • HELLoRA僅對MoE模型每層最頻繁啟用的專家附加LoRA模組,實現引數高效微調。
  • 在多種MoE模型上,HELLoRA顯著減少可訓練引數和計算開銷,同時提升效能。
站內正文

2025年十大人工智慧研究論文

2025年AI研究從聊天機器人轉向推理系統、自主代理和多模態系統。十大論文包括DeepSeek-R1(強化學習)、Gemini 2.5(多模態推理)、Qwen2.5(開源模型)、Large Concept Models(概念級語言建模)、ESG分析抗漂綠、VideoWorld(世界模型)、AI Scientist-v2(自主研究)、SWE-Lancer(編碼代理基準)、OLMo 2(完全開源)和Mixture-of-Recursions(高效推理)。

  • DeepSeek-R1將強化學習後訓練方法公開,顯著提升推理和編碼能力。
  • Gemini 2.5引入“思考模式”,擴充套件多模態理解和長上下文。
站內正文

GQLA:面向硬體自適應的大語言模型解碼的分組查詢潛在注意力機制

研究人員提出了分組查詢潛在注意力(GQLA),這是對DeepSeek多頭潛在注意力(MLA)的改進,在不重新訓練的情況下提供兩種硬體自適應的解碼路徑。該方法能在H100和H20 GPU上實現高效推理,幷包含TransGQLA用於轉換預訓練的GQA模型。

  • GQLA在DeepSeek的MLA基礎上擴充套件出雙解碼路徑(MQA吸收和GQA),以適應不同硬體的roofline模型。
  • 同一組GQLA權重既可用於H100(MQA路徑),也可用於H20(GQA路徑配合多token預測)。
站內正文

最新開放製品(#21):開放模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1等。關於CAISI對V4的評估。

本月開放前沿實驗室紛紛釋出新模型,包括DeepSeek V4、Gemma 4、Kimi K2.6等。CAISI評估指出開放模型落後於美國前沿,且差距在擴大,但評估方法受到質疑,實際能力差距可能被高估。文章還介紹了多個亮點模型。

  • DeepSeek、Google、Moonshot AI等釋出多個開放模型。
  • CAISI評估顯示開放模型與封閉模型的Elo差距巨大,但基準測試方法存在爭議。
站內正文

LLM架構最新發展:KV共享、mHC與壓縮注意力

從Gemma 4到DeepSeek V4,本文探討了新的開源LLM如何透過跨層KV共享、逐層嵌入、注意力預算、壓縮卷積注意力和mHC等架構技術降低長上下文成本。

  • Gemma 4引入跨層KV共享,將KV快取大小減半,同時保持模型質量。
  • 逐層嵌入(PLE)透過增加小型嵌入引數提高模型容量,而不顯著增加計算成本。
站內正文

不同模型解決數論競賽問題

在一場AI機器人競賽中,參賽者需要計算第n個迴文素數二進位制展開中最長連續1位的長度。DeepSeek V4-Pro以73分奪冠,ChatGPT和Grok因誤解規則未能參賽,而Kimi因一個bug意外在最後一輪獲勝。本文詳細分析了各機器人的策略、演算法細節和比賽結果。

  • DeepSeek以73分獲得第一,Claude和GLM分列二三名。
  • ChatGPT和Grok因在註冊視窗內未完成預計算而被判未參賽。
站內正文

我們測試了DeepSeek V4 Pro和Flash與Claude Opus 4.7及Kimi K2.6的對比

我們對DeepSeek V4 Pro和Flash進行了與Claude Opus 4.7和Kimi K2.6相同的FlowGraph基準測試。Pro得分77/100,價格$2.25;Flash得分60/100,價格$0.02。Pro在效能上介於Opus(91)和Kimi(68)之間,但存在構建和租賃處理問題。Flash成本極低,但輸出缺少關鍵部分。

  • DeepSeek V4 Pro以77分和$2.25的價格位於Opus和Kimi之間。
  • DeepSeek V4 Flash以$0.02的成本獲得60分,但存在構建失敗和路由錯誤。
站內正文

Violin:打破語言障礙的開源影片翻譯技能

Violin是一個完全開源的AI影片翻譯工具,結合語音識別、大型語言模型翻譯和語音合成,使影片內容跨越語言障礙。它提供網路應用、命令列介面和代理技能,支援影片內容問答和個性化語音選擇。使用Together API,利用Whisper、DeepSeek和Cartesia等模型,以MIT許可證釋出。

  • Violin將語音識別、LLM翻譯和語音合成整合為開源影片翻譯工具。
  • 支援網路應用、CLI和代理技能,適合不同使用者群體。
站內正文

騰訊計劃增加AI支出,因中國晶片供應據稱改善

騰訊宣佈計劃在2026年下半年大幅增加AI基礎設施支出,原因是國內晶片製造商正在提升AI晶片產量。公司還公佈了強勁的第一季度業績,並正在談判入股Deepseek。

  • 騰訊將在2026年下半年增加AI基礎設施支出。
  • 中國晶片製造商正提升國內AI晶片產量。
站內正文

美國正在贏得人工智慧競賽

美國在AI商業化方面領先,擁有強大的雲基礎設施、資料平臺和能源優勢。儘管中國有DeepSeek等競爭者,但美國在收入、採用率、工具和覆蓋範圍上明顯領先。歐洲缺乏雲規模和生態系統,難以追趕。AI競賽也是安全競賽,涉及武器化AI和封閉式技術棧。

  • 自2025年1月DeepSeek R1衝擊市場後,美國公司加速推進AI商業化,在收入、採用率和工具方面領先。
  • 美國擁有AWS、Azure和Google Cloud等全球超大規模雲平臺,以及YouTube、GitHub等資料平臺,形成完整的AI生態。
站內正文

新研究發現:AI健康回答近半有誤,儘管聽起來令人信服

一項發表在《BMJ Open》上的新研究測試了五種主流AI聊天機器人(ChatGPT、Gemini、Grok、Meta AI和DeepSeek)在50個健康問題上的表現,發現近20%的回答高度有問題,一半的回答有問題,30%存在一定問題。Grok表現最差,開放性問題風險尤其高。研究強呼叫戶不應視AI為權威醫療來源,需驗證資訊。

  • 研究測試了ChatGPT、Gemini、Grok、Meta AI和DeepSeek五個聊天機器人,各回答50個健康問題。
  • 近20%的回答被專家評為高度有問題,一半被評為有問題,僅30%部分有問題。
站內正文

筆記型電腦本地AI的兩年:開源模型超越摩爾定律

2024年5月至2026年5月,最貴的MacBook Pro記憶體仍為128GB,硬體幾乎未變。但可執行的開源模型在人工智慧分析指數上從10分提升至47分(DeepSeek V4 Flash),效能提升4.7倍,每10.7個月翻一番,速度是摩爾定律的兩倍以上。進步源於稀疏混合專家模型、激進量化技術和推理最佳化的小型密集模型。

  • 128GB MacBook Pro上執行的開源模型智慧指數兩年內從10升至47,翻倍速度超過摩爾定律。
  • 兩大突破:稀疏MoE模型(如gpt-oss-120B)和小型密集推理模型(如Qwen3.6 27B)。
站內正文

思考越多,偏見越多:推理模型中長度驅動的立場偏差

該論文挑戰了鏈式思維推理能減少偏見的普遍假設,透過實驗表明在多選題中,推理軌跡越長,立場偏差(位置偏好)越嚴重。研究涵蓋13種配置,發現12種顯示軌跡長度與立場偏差分數正相關,截斷實驗證明因果關係,且671B引數的DeepSeek-R1雖整體偏差低,但長軌跡下仍存在偏差。此外,直接回答的立場偏差是獨立現象。論文建議不應預設推理模型對選項順序魯棒,並提供了診斷工具包。

  • 推理軌跡長度與立場偏差分數正相關,控制準確率後仍顯著。
  • 截斷實驗表明,從軌跡後期繼續推理會增加選擇位置偏好選項的機率(16%-32%)。
站內正文

序列雷達 #857:上週AI速覽:機器內部,文本框之外

本週AI領域呈現科學化、產品化和投機化並存的趨勢。Anthropic釋出了自然語言自編碼器,實現模型內部狀態的語言化解釋;OpenAI推出新語音模型,推動AI向原生介面演進;SubQ聲稱擁有1200萬token上下文視窗,挑戰現有RAG架構;中國AI實驗室DeepSeek和Moonshot估值飆升,市場將AI公司視為戰略資產。整體而言,AI正從模型競賽轉向基礎設施競賽。

  • Anthropic的自然語言自編碼器將模型啟用壓縮為自然語言,開創了可解釋性的新正規化
  • OpenAI語音模型使AI從文本介面轉向即時語音代理,使用者體驗發生質變
站內正文

百度釋出文心 5.1:搜尋能力登頂國內,預訓練成本僅為業界 6%

百度正式釋出新一代基礎大模型文心大模型 5.1,採用“多維彈性預訓練”技術,以業界同規模模型約 6% 的預訓練成本實現基礎效果領先,登上 LMArena 搜尋榜國內第一、全球第四。Agent 能力顯著提升,超越 DeepSeek-V4-Pro,創意寫作與 Gemini 3.1 Pro 相當。

  • 文心 5.1 採用多維彈性預訓練,成本僅為業界同規模模型的 6%。
  • 以 1223 分位列 LMArena 搜尋榜國內第一、全球第四,是唯一上榜的國產模型。
站內正文

梁文鋒出資200億!DeepSeek首輪創紀錄融資500億,V4.1定檔6月

DeepSeek首輪融資目標最高500億元,梁文鋒個人出資200億,估值飆升至3500億元。同時,V4.1模型定檔6月釋出,公司從理想主義實驗室轉向商業化運營。

  • DeepSeek首輪融資最高500億元,梁文鋒個人出資200億元。
  • 估值21天內從100億美元漲至500億美元。
站內正文

Show HN:Stagewise – 專為您的Z.ai/DeepSeek/Moonshot訂閱打造的智慧IDE

Stagewise 是一款面向開發者的開源智慧IDE,內建程式碼代理,可直接訪問瀏覽器控制台和偵錯程式。它支援自帶金鑰,接入Z.ai、DeepSeek、Moonshot等主流AI提供商,讓開發者無需切換上下文即可瀏覽和構建。

  • 開源智慧IDE,內建程式碼代理
  • 支援自帶API金鑰,接入多種AI提供商
站內正文

華為預計AI晶片收入達120億美元,中國本土代工廠產能吃緊

華為預計AI晶片收入到2026年將達到120億美元,受阿里巴巴、字節跳動和騰訊等大客戶訂單推動,而輝達在中國AI加速器市場份額已降至零。主要挑戰包括中芯國際先進製程產能有限、良率低和週期長。昇騰950PR現已成為中國雲服務商的首選AI晶片,得益於DeepSeek V4針對華為架構的最佳化。

  • 華為預計AI晶片收入2026年達120億美元,較2025年的75億美元增長超60%。
  • 輝達CEO黃仁勳表示其在中國AI加速器市場份額已降至零,歸因於美國出口限制和北京推動本土採購。
站內正文

Redis之父下場,給DeepSeek V4單獨造了一臺推理引擎

Redis創始人antirez為DeepSeek V4 Flash打造專用推理引擎ds4.c,在Mac上實現本地高效能執行,支援2-bit量化、KV快取硬碟化及API相容層,引發對模型專屬推理框架的討論。

  • Redis之父antirez釋出專為DeepSeek V4 Flash設計的推理引擎ds4.c,基於Metal框架,僅支援Apple Silicon。
  • 透過非對稱量化、KV快取外接和API相容層實現128GB Mac上284B模型可用推理速度。
站內正文

所有實驗室都怕位元組,所有人都在誇DeepSeek!美國研究員36小時中國AI行

艾倫研究所研究員Nathan Lambert的中國之行揭示了中美AI文化的巨大差異。中國實驗室強調合作,學生深度參與,開源文化盛行,而美國實驗室則陷入內鬥和明星文化。

  • 中國AI實驗室文化更注重合作,學生直接參與核心研發。
  • 所有實驗室都對字節跳動保持警惕,但對DeepSeek一致敬佩。
站內正文

ZAYA1-8B技術報告

ZAYA1-8B是一款基於MoE++架構的推理型混合專家模型,啟用引數僅7億,總引數80億,在AMD全棧計算平臺上訓練。它在數學和程式設計基準測試中與DeepSeek-R1-0528相當甚至超越,並提出了Markovian RSA測試時計算方法,進一步提升推理效能。

  • ZAYA1-8B擁有7億啟用引數和80億總引數,在AMD平臺上完整訓練。
  • 在多個數學和程式設計基準測試中,表現與DeepSeek-R1-0528持平或更優。
站內正文

部署DeepSeek-V4:為何百萬Token上下文是推理系統的問題

DeepSeek-V4透過混合注意力設計(CSA、HCA、SWA)壓縮KV快取,將百萬Token上下文從模型挑戰轉變為推理系統挑戰。Together AI在NVIDIA HGX B200上的早期部署經驗展示了快取策略、字首快取和端點配置對長上下文工作負載效能的關鍵影響。

  • DeepSeek-V4的壓縮稀疏注意力(CSA)和高度壓縮注意力(HCA)減小了KV快取大小,但推理引擎需要管理多種快取佈局。
  • 滑動視窗注意力(SWA)在長上下文時成為效能瓶頸,需謹慎選擇儲存策略。
站內正文

Zyphra釋出ZAYA1-8B:基於AMD硬體訓練的小型推理MoE模型,效能遠超其體量

Zyphra AI釋出了ZAYA1-8B,一款僅有7.6億活躍引數的小型混合專家(MoE)語言模型,但在數學和程式設計基準測試中擊敗了多個體量更大的開源模型。該模型採用MoE++架構,包含壓縮卷積注意力(CCA)、MLP路由器和PID控制器偏置平衡等創新,並引入了馬爾可夫遞迴自聚合(Markovian RSA)測試時計算方法,在HMMT'25上超越Claude 4.5 Sonnet,逼近DeepSeek-V3.2。模型完全在AMD Instinct MI300硬體上訓練,並以Apache 2.0許可釋出。

  • ZAYA1-8B僅有7.6億活躍引數,總引數84億,但在數學和編碼任務上超越多個更大模型。
  • 採用MoE++架構,包括8倍KV快取壓縮的CCA、MLP路由器及PID偏置平衡、學習殘差縮放。
站內正文

Token需求狂飆千倍,22億熱錢湧向這家AGI Infra頭號玩家

隨著AI進入Agent時代,Token需求爆發。無問芯穹作為國內中立AGI基礎設施頭部廠商,累計融資超22億元,日均Token呼叫量較2025年底增長超20倍。該公司支撐Kimi、GLM、MiniMax、DeepSeek等主流國產模型,成為Token經濟的關鍵樞紐。

  • Agent時代使單次任務Token消耗從數百飆升至百萬級,基礎設施面臨三重顛覆。
  • 無問芯穹日均Token呼叫量每兩週翻一番,增速遠超全國平均水平。
站內正文

Deepseek估值接近450億美元,中國國家晶片基金領投

據英國《金融時報》報道,Deepseek即將完成一輪融資,估值約450億美元。中國國家積體電路產業投資基金(大基金)領投,騰訊也在洽談入股。創始人梁文峰持有89.5%股份,可能個人投資。估值在數週內從200億美元攀升。

  • Deepseek估值約450億美元,中國大基金領投
  • 騰訊也在洽談入股
站內正文

Show HN:Token用量儀表盤——12家提供商與程式設計代理

qlaud推出包含qcode程式設計代理、Router API閘道器和Platform託管後端的全棧AI工具集。qcode在桌面本地執行,支援Claude、GPT、DeepSeek、Llama等前沿模型,保障程式碼隱私;Router提供統一的API介面,具備故障轉移和延遲監控;Platform提供持久化執行緒、MCP聯結器和向量搜尋等能力。

  • qcode是本地執行的程式設計代理,支援多種前沿模型,程式碼不出本地。
  • Router提供統一API,整合故障轉移和延遲監控。
站內正文

亞馬遜透過支援Llama、Qwen、Deepseek和Nova為SageMaker帶來智慧微調

亞馬遜SageMaker AI現在包含一個AI代理,幫助開發者用自然語言描述用例,自動推薦訓練方法、準備資料、啟動訓練並提供可編輯的Jupyter筆記本程式碼。支援Llama、Qwen、Deepseek和Nova等模型系列。

  • SageMaker AI新增Kiro AI代理,支援自然語言描述用例並自動完成微調工作流。
  • 代理預裝在開發環境中,也可使用Claude Code等其他代理。
站內正文

上週AI #340 - OpenAI vs Musk + Microsoft, DeepSeek v4, 視覺香蕉

馬斯克訴奧特曼案第一週庭審結束,馬斯克證詞佔據主導;微軟與OpenAI重新談判合作關係,終止獨家權利;DeepSeek釋出V4預覽版,號稱縮小與前沿模型差距;谷歌DeepMind推出視覺香蕉模型,統一影像生成與視覺理解。

  • 馬斯克訴奧特曼案庭審首周,馬斯克承認xAI部分使用了OpenAI模型進行蒸餾訓練。
  • 微軟與OpenAI修改合作協議,微軟失去獨家雲服務權利,OpenAI可自由選擇AWS等供應商。
站內正文

LWiAI播客第243期:GPT-5.5、DeepSeek V4、AI安全破壞

本期播客回顧了上週AI領域的重要新聞,包括OpenAI釋出GPT-5.5、xAI推出Grok Voice Think Fast 1.0、DeepSeek開源V4模型、Google計劃向Anthropic投資高達400億美元等。此外還討論了AI安全研究中的破壞行為、文件委託腐蝕等新研究。

  • OpenAI釋出GPT-5.5,顯著提升編碼能力,系統卡討論了思維鏈可監控性和對齊測試
  • xAI推出Grok Voice Think Fast 1.0,在即時語音代理基準測試中領先
站內正文

“DeepSeek版Claude Code”,Github 2.3k星

DeepSeek-TUI是一個基於Rust的終端程式設計Agent,專門為DeepSeek模型最佳化。近日因DeepSeek-V4釋出和作者中文宣傳而爆火,登頂GitHub熱榜。支援思維鏈顯示、上下文壓縮、RLM多子Agent並行、多種模型切換等功能。

  • DeepSeek-TUI是一個類似Claude Code的終端程式設計工具,專為DeepSeek最佳化,已獲2.3k星標。
  • 專案由獨立開發者Hunter Bown發起,採用Rust編寫,MIT協議開源。
站內正文

DeepSeek V4最大的遺憾

DeepSeek V4的技術報告中缺少了Engram模組,引發熱議。Engram是一種為Transformer設計的原生知識查表模組,旨在分離靜態知識檢索與深度推理。儘管未在V4中出現,但後續有三篇論文探索了其在CXL記憶體池化、無衝突熱層最佳化及視覺模態的應用。

  • DeepSeek V4未包含此前備受期待的Engram模組。
  • Engram透過雜湊查詢機制實現靜態知識的高效檢索,釋放深層網路用於推理。
站內正文

[AINews] AI工程師世界博覽會——自動研究、記憶、世界模型、Token最大化、代理商業以及垂直AI演講者徵集

本文宣佈AI工程師世界博覽會第二波演講者徵集活動,涵蓋自動研究、記憶、世界模型、Token最大化、代理商業以及法律、醫療、GTM和金融領域的垂直AI等新主題。此外,還總結了近期AI領域的重要動態,包括Grok 4.3釋出、DeepSeek V4 Pro進展、Codex vs Claude Code競爭、代理基礎設施研究以及本地LLM社群的熱門討論。

  • AI工程師世界博覽會第二波演講者徵集啟動,新增多個技術主題軌道。
  • Grok 4.3釋出,效能提升但可靠性存疑;DeepSeek V4 Pro成為最可信的開源編碼/代理模型之一。
站內正文

AI週刊第488期:OpenAI五天內失去了三樣東西

本週OpenAI遭遇三重打擊:馬斯克訴訟威脅其非營利轉營利模式、營收未達預期引發市場連鎖反應、AWS合作終結微軟獨家分發權。同時,DeepSeek價格戰、科技巨頭裁員、白宮擬繞過Anthropic安全評估等事件標誌AI行業定價權轉移與監管環境變化。

  • 馬斯克訴訟要求OpenAI返回非營利狀態,將定義AI領域營利化轉換的法律標準。
  • OpenAI營收未達Oracle 3000億美元計算合約的抵押預期,晶片股隨之下跌。
站內正文

本週AI序列#851:DeepSeek-V4與百萬Token智慧架構

DeepSeek-V4不僅僅是又一款前沿模型,它透過新的記憶體層次結構、注意力機制和訓練穩定器,解決了如何經濟有效地利用百萬Token上下文視窗的問題,使長上下文推理變得實用。

  • DeepSeek-V4支援百萬Token上下文視窗,但重點在於經濟地使用這些上下文,而非單純輸入大量文本。
  • 該模型引入了新的記憶體層次結構、注意力機制、訓練穩定器、最佳化器選擇、量化方案和服務堆疊,以實現實用的長上下文推理。
站內正文

公司導航