[AINews] 創始人與前向部署工程師 2026-05-30 在消化Anthropic重大新聞的間隙,我們重點介紹了AIE的新前向部署工程師計劃和創始人計劃,以及5月28-29日的AI新聞。主要話題包括:Claude Opus 4.8發佈及其基準測試爭議、多輪強化學習中的tokenization錯誤、開源模型與工具鏈進展、Google和OpenAI的Agent產品擴展,以及值得關注的研究論文。
Claude Opus 4.8帶來增量改進,但基準測試未顯示絕對優勢,定價仍是主要痛點。 多輪強化學習訓練中的tokenization錯誤被指出,需嚴格遵循“Token-In, Token-Out”規則。 StepFun 發佈 Step 3.7 Flash:面向編碼智能體和搜索工作流的 198B MoE 視覺語言模型 2026-05-29 Step 3.7 Flash 是一款 198B 稀疏 MoE 模型,擁有約 11B 活躍參數、原生視覺能力和 256K 上下文窗口。在編碼基準測試上相比前代大幅提升,支持 Advisor Mode 實現高性價比的智能體推理,並以 Apache 2.0 許可證開源。
198B MoE 視覺語言模型,活躍參數約 11B,上下文窗口 256K。 SWE-Bench Pro 得分 56.26%,較前代 51.3% 提升,且跨框架方差縮小。 DDS Vibe Academy – 47個免費AI編程大師課程,由AI代理構建 2026-05-29 DDS Vibe Academy 提供47個免費AI編程大師課程,全部由AI代理構建。創始人Robert McCullock僅設計約束條件,未編寫一行代碼。課程涵蓋基礎、開發、應用和精通四個級別,涉及Claude、Antigravity、MCP等技術。
47個免費AI編程大師課程,由AI代理構建 創始人聲稱未編寫任何代碼,僅設計約束 今日下載:解鎖鋰資源與控制埃博拉疫情 2026-05-29 新方法有望以更低成本從硅酸鹽礦物中提取鋰,同時獲得氧化鋁和二氧化硅等副產品,MIT教授稱其可成為全球最低成本的鋰來源。剛果民主共和國爆發致命埃博拉疫情,四名醫護人員四天內死亡,控制難度大。教皇新通諭《Magnifica Humanitas》指出技術非中立,呼籲個人和機構以勇氣和團結應對AI時代。另有Anthropic估值達9650億美元、藍色起源火箭測試爆炸、JWST改變天文學等最新科技動態。
新鋰提取技術使用弱酸溶解硅酸鹽礦物,成本低且環保,Rock Zero公司正商業化。 剛果(金)埃博拉疫情由Bundibugyo病毒引起,控制困難。 4nm!比亞迪自研AI芯片來了:製程對齊英偉達,算力拉爆特斯拉 2026-05-29 比亞迪發佈了中國首顆車規級4納米智駕芯片璇璣A3,採用自研NPU架構,三顆組合算力超2100 TOPS,單位功耗比同類低20%,算力利用率提升100%。王傳福承諾智駕事故全額賠付。
比亞迪發佈中國首顆4nm智駕芯片璇璣A3,全自研設計 採用專用NPU架構,功耗低20%,算力利用率翻倍 新綜述論文:代碼不僅是AI智能體的產物,更是其思考與行動的方式 2026-05-29 一篇新綜述論文指出,自主AI智能體的真正瓶頸並非語言模型本身,而是圍繞其構建的軟件層。工具、記憶、測試和權限邊界將無狀態模型轉變為可工作的智能體。Deepseek已在北京組建專門的“Harness”團隊,其核心公式驗證了該論點:模型加Harness等於AI智能體。
論文強調AI智能體的瓶頸在於軟件封裝層,而非語言模型。 工具、記憶、測試和權限管理是將模型轉化為智能體的關鍵。 光帆科技與騰訊出行服務達成戰略合作 開啓新一輪預售 2026-05-29 光帆科技與騰訊出行服務合作,將AI全感穿戴設備接入出行平台,該設備曾登頂京東熱賣榜並售罄,現已開啓新一輪預售。
光帆科技與騰訊出行服務達成戰略合作,AI穿戴設備將接入出行服務。 光帆AI全感穿戴設備首發售罄,連續8天京東熱賣榜第一。 PPIO入選非凡產研「2026 Global AI 100」,以AI實力領跑出海新浪潮 2026-05-29 PPIO 入選非凡產研發布的「2026 Global AI 100」榜單,該榜單由非凡大賞年度 AI 全球化增長峯會評選,旨在發掘全球化 AI 原生公司。PPIO 以全球化分佈式算力基礎設施、全棧雲服務、模型平台(支持 DeepSeek、GLM 等)及 Agent 沙箱等創新產品,為出海企業提供低時延、高可用的算力網絡。截至 2026 年 4 月,PPIO 整合全球 4800+ 節點,日均 Token 調用量超 10000 億,開發者用户超 57 萬。同時獲評上海市數字出海服務平台試點單位及 GDA 領航服務站。
PPIO 入選「2026 Global AI 100」榜單,彰顯其在 AI 出海領域的領先地位。 提供全球化分佈式算力基礎設施,覆蓋 GPU 全型號,支持大規模訓練與推理。 面壁智能「開源周」:一場定義端側 AI 終局的系統性「亮劍」 2026-05-29 面壁智能於5月25日至29日舉辦端側大模型開源周,發佈五項技術成果,涵蓋訓練框架、模型壓縮、數據集和智能體操作系統,展現全鏈路系統性創新。MiniCPM5-1B性能超越GPT-4o部分版本,端側AI終局之戰聚焦系統工程。
面壁智能在2026年5月25-29日舉辦端側大模型開源周,每日發佈一項關鍵技術。 五項成果包括BitCPM-CANN、MiniCPM5-1B、ForgeTrain、PilotDeck和UltraData,形成全棧閉環。 5億Tokens白送!全球首個商用AI主機發布,終於能放開燒Token了 2026-05-29 聯想發佈全球首款商用AI主機系列,專為一人公司(OPC)和成長型企業設計,通過本地+雲端混合架構解決Token成本高和數據安全問題,並贈送大量Tokens,開箱即用。
聯想發佈三款AI主機:mini 100、300、Pro 700,覆蓋個人到團隊。 本地推理+雲端彈性,Token成本可降低70%-95%。 下限零基礎,上限肝大作!騰訊這個AI遊戲創作平台,太野了 2026-05-29 下一波AI創作浪潮正在遊戲領域發生,騰訊發佈AI遊戲創作平台「代號Craft」,用户可通過自然語言生成可運行的遊戲,2D/3D均支持,內置AIGC工具和免費資產,極大降低遊戲創作門檻。
騰訊發佈AI遊戲創作平台「代號Craft」,支持自然語言生成遊戲 平台同時覆蓋2D和3D遊戲,內置完整AIGC管線與免費資產 創意設計版WorkBuddy來了!騰訊發佈智能體創意工作室Miora 2026-05-29 騰訊發佈Miora,一款集圖像、視頻、UI/UX和3D生成於一體的AI創意工作室。它具備記憶系統、多模態畫布和可定製的Skills,讓一個人擁有整個創意工作室。
騰訊發佈Miora,一款全場景創意智能體工作室 支持圖像、視頻、UI/UX、3D等多模態內容生成 首份教皇關於人工智能的通諭大量由AI撰寫的證據 2026-05-29 文章作者通過文本分析、統計證據和AI檢測工具,論證了教皇利奧一世的首份通諭《Magnifica Humanitas》中有大量內容是由AI(特別是Claude)撰寫的。作者指出,通諭中使用的破折號、詞語“genuinely”的頻率遠高於以前的通諭,且Pangram檢測器標記部分段落為AI生成。作者認為,儘管個別證據可能被解釋,但多重證據的吻合難以忽視。
通諭中大量使用破折號和“genuinely”等AI常用詞彙,頻率遠超此前通諭。 Pangram檢測器將多個段落標記為40%-100%AI生成,而此前通諭無一被標記。 清華系團隊給大模型織了一張“智能算力電網” 2026-05-29 清華系創業公司是石科技通過自主研發的並行優化技術,構建異構算力資源池與推理優化引擎,實現單位Token成本降低40%,旨在打造國產Token調優工廠,降低AI落地門檻。
是石科技成立於2021年,源於國家超算無錫中心,創始人閆博文為清華博士後。 通過全域異構算力池和深度國產化適配,將閒置國產芯片轉化為可用算力。 如何優化您的AI令牌使用量:repo-brain 工具介紹 2026-05-29 repo-brain 是一款開源工具,能將整個代碼庫壓縮成單個Markdown上下文文件,實現高達96%的壓縮率,大幅減少AI令牌使用量。它支持多種編程語言的靜態分析、架構分析和語義關係發現,併兼容多家AI提供商。
將整個代碼庫壓縮為單個Markdown上下文文件,減少AI令牌使用量 在262個文件的代碼庫上實現96%壓縮率(從154,229降至6,487令牌) 強化學習是一個基礎設施問題 2026-05-29 本文探討了強化學習在大型語言模型後訓練中的實際應用,指出當前的瓶頸並非算法而是基礎設施。Modal分享了大規模運行RL後訓練的經驗,介紹了其開源庫如何幫助團隊解決多節點訓練、環境管理和GPU利用率等關鍵問題。
強化學習後訓練LLM的瓶頸是基礎設施,包括訓練引擎、推理沙箱和環境隔離。 多節點訓練中,權重同步耗時巨大,RDMA和增量壓縮顯著降低延遲。 Claude 4.8炸場!部分能力超過Mythos,支持數百子智能體並行 2026-05-28 Claude最新旗艦Opus 4.8發佈,部分能力超過Mythos,支持動態工作流,可拆解任務給數百個子智能體並行執行,人類無需頻繁檢查。誠實性大幅提升,代碼缺陷漏報率降至前代四分之一。
Claude 4.8發佈,終端工程和知識工作能力進步,部分超越Mythos 動態工作流:Claude生成編排腳本,數百個子智能體並行處理任務 DeepSWE:基於原創、長期工程任務的編碼智能體評測 2026-05-28 DeepSWE是一個新的基準測試,用於評估AI編碼智能體在全新、複雜的軟件工程任務上的表現。它避免了數據污染,覆蓋了多樣化的代碼庫,需要大量代碼修改,並使用手工編寫的驗證器。領先模型表現差異顯著,GPT-5.5以70%的準確率位居榜首。
DeepSWE是一個無數據污染的基準測試,任務均為原創。 任務涵蓋5種編程語言中的91個代碼庫。 世界模型接棒語言模型,這家公司全球首創物理AGI“雙金字塔”體系,通用機器人進入“家庭時代” 2026-05-28 極佳視界發佈全球首創物理AGI“雙金字塔”體系,推出家庭機器人拾光S1,獲百台家庭訂單,計劃12個月內實現物理AGI的“GPT-3時刻”。
極佳視界首創“雙金字塔”體系,包括數據金字塔和算法金字塔。 家庭機器人拾光S1採用輪臂構型,獲得百台真實家庭訂單。 Show HN:我將一個 Python AI 代理和 Vue 儀表盤打包成了一個 Electron 應用 2026-05-28 Hermes Desktop 是一個跨平台的桌面應用,它將 Python 運行時、hermes-agent(自改進 AI 代理)和 hermes-web-ui(Vue 3 + Koa 聊天儀表盤)打包到一個 Electron 應用中,用户無需單獨安裝 Python 或 Node。應用集成了 DingTalk 並通過 DeepSeek 驅動。
打包了 Python 運行時和 hermes-agent,實現無需依賴即可運行 使用 Electron 作為外殼,集成 hermes-web-ui 前端 沙鋼簽約釘釘,讓悟空成為每一位“鋼鐵人”的生產力工具 2026-05-28 沙鋼與釘釘簽署戰略合作協議,以悟空AI為核心,推動AI在鋼鐵行業規模化落地,打造AI時代的工作方式。
沙鋼與釘釘簽約,共同推進AI在鋼鐵行業的應用 以悟空AI為引擎,打造全集團協同辦公平台 5篇AI生成的數學論文被接收!00後創始人洪樂潼融資14個億 2026-05-28 Axiom Math公司由00後華人洪樂潼創立,其AI系統AxiomProver生成的8篇數學論文中已有5篇被學術期刊接收。該公司於今年3月完成2億美元融資,估值達16億美元。
Axiom Math的AI系統AxiomProver生成的8篇數學論文中,5篇已通過同行評審並發表。 創始人洪樂潼從斯坦福退學創業,公司融資2億美元,估值16億美元。 7B打敗o3、GPT-5!醫學AI智能體讓模型學會“看哪裏、怎麼看” 2026-05-28 上海創智學院LeapQuest團隊聯合多所高校提出醫學AI新範式,讓模型在推理過程中主動調用視覺工具,從被動接收視覺輸入變為主動尋找證據。論文被ICML 2026接收。
LeapQuest團隊提出Ophiuchus和MedScope,分別面向醫學圖像和視頻,採用Think with Images/Videos範式。 Ophiuchus-7B在8個VQA benchmark上平均得分68.0,超越o3(62.2)、GPT-5(59.9)。 AI正在重寫軟件行業?8歲孩子做操作系統,一人公司拿下千萬訂單 2026-05-28 百度秒噠產品總經理朱廣翔在2026中國AIGC產業峯會上分享,AI將編程門檻從寫代碼降低到聊天,87%不懂代碼的用户通過秒噠創建應用。8歲小孩做出操作系統,一人公司(OPC)靠項目經理拿下千萬訂單,石油工程師替代140萬採購平台。Vibe Coding讓需求方變成供給方,實現大眾創業。
第四次編程革命:自然語言編程,門檻降至最低,創造者數量爆發 秒噠用户87%不懂代碼,OPC成最大羣體,16%創業者 [AINews] Cognition融資10億美元,D輪估值260億 2026-05-28 Cognition在D輪融資中籌集10億美元,估值達260億美元,年經常性收入(ARR)預計年底突破10億美元。文章還涵蓋了推理效率優化、智能體工程、持續學習、新基準測試、模型發佈以及編碼代理產品化等AI領域的最新進展。
Cognition完成10億美元D輪融資,估值260億美元,ARR預計年底超10億美元。 推理優化轉向架構層面:EAGLE 3.1、DeepSeek V4-Pro混合注意力、小米MiMo緩存管理等。 「斯隆獎」得主戴亮全職加盟復旦 2026-05-28 斯隆獎得主、UC Berkeley物理系助理教授戴亮加盟復旦大學,出任物理學系、天文與天體物理研究中心教授。復旦近年引進多名頂尖人才,包括蘇昊、袁峯、季索清等。
戴亮(2021年斯隆獎得主)全職加入復旦大學 曾在UC Berkeley任助理教授,北大物理系校友 清華有了新老師:黃仁勳 2026-05-28 黃仁勳受邀加入清華大學經管學院顧問委員會,該委員會由蘋果CEO蒂姆·庫克擔任主席,成員包括馬斯克、納德拉、馬雲等全球商業領袖。此外,他剛獲得卡內基梅隆大學榮譽博士學位,並分享名言“AI不會取代你,但善用AI的人會”。
黃仁勳加入清華大學經管學院顧問委員會 委員會由庫克任主席,匯聚全球頂尖企業家 ITBench-AA:前沿模型在企業IT智能體任務基準測試中得分低於50%——由Artificial Analysis與IBM聯合發佈 2026-05-27 Artificial Analysis與IBM聯合推出ITBench-AA,這是首個針對企業IT智能體任務的基準測試,專注於站點可靠性工程(SRE)。前沿模型得分均低於50%,其中Claude Opus 4.7以47%領先。該基準測試評估模型在Kubernetes事件響應中的表現,要求從日誌和追蹤中診斷故障。
Claude Opus 4.7以47%領先,GPT-5.5為46%,Qwen3.7 Max為42%。 所有前沿模型得分低於50%,使ITBench-AA成為飽和度最低的智能體基準之一。 AI 是一場軍備競賽,美國需要 90 億美元的英偉達超級芯片來跟上步伐 2026-05-27 美國情報機構秘密申請 90 億美元採購英偉達 GB10 超級芯片,以幫助 CIA 和 NSA 追趕 Anthropic、OpenAI 等 AI 巨頭的步伐。這筆資金尚待國會批准,同時國防預算已調撥 8 億美元用於雲算力。文章詳細介紹了芯片規格、成本以及 AI 硬件競賽的升級趨勢。
美國政府秘密申請 90 億美元為 CIA 和 NSA 購買英偉達 GB10 超級芯片。 GB10 芯片功耗僅 140 瓦,卻提供 1 petaflop FP4 性能,可微調 700 億參數模型。 Show HN: Mneme HQ – 面向AI編碼代理的倉庫原生架構規則 2026-05-27 Mneme HQ 提供AI輔助開發的架構治理層,在代碼生成前強制執行約束,防止架構漂移,減少審查負擔。它直接集成到AI編碼代理的工作流中,攔截禁止的框架、跨邊界調用和過時決策,同時支持多種編碼助手和代理框架。
在AI生成代碼之前強制執行架構規則,從源頭阻止違規 支持Claude Code、Cursor、GitHub Copilot等主流AI編碼工具 南非擁有AI槓桿,但其政策草案將其閒置 2026-05-27 南非擁有全球88%的鉑族金屬儲量,是非洲最大的數據中心市場,並處於中美AI基礎設施競爭的前沿。然而,其AI政策草案因包含AI幻覺引用而被撤回,未能利用這些優勢來談判有利條件。文章分析了南非的結構性槓桿、三種潛在的AI基礎設施未來(中國、美國和本地開放權重),以及制定具有約束力的治理框架的必要性。
南非的鉑族金屬和可再生能源資源提供了獨特的AI槓桿,但政策草案未設定最低投資條款、數據主權或技術轉讓條件。 中美科技公司(華為和微軟等)正在南非爭奪AI基礎設施控制權,而南非的政策未明確其回報要求。 雷鳥雙品齊發:GT 系列、V4 同台亮相,次世代 AI 眼鏡雷鳥 iO 提前預告 2026-05-27 5月27日,雷鳥創新舉辦夏季新品發佈會,推出行業首款專業影視級AR眼鏡雷鳥GT系列(1899元起),以及新一代AI拍攝眼鏡雷鳥V4(2199元起),並預告次世代AI眼鏡雷鳥iO將於第三季度亮相。
雷鳥GT系列:專業影視級AR眼鏡,59°視場角、杜比視界支持、78g重量,1899元起。 雷鳥V4:AI拍攝眼鏡,0.2秒喚醒、2.1秒響應、11.5小時音樂播放、IP67防水、38g,2199元起。 5秒完成3D場景編輯,北大&港中文&上海AI Lab搞出VGGT-Edit,120倍加速太炸了 2026-05-27 來自北京大學、香港中文大學、上海AI Lab等機構的研究團隊提出了VGGT-Edit,一種原生3D編輯框架,能夠在約5秒內完成場景編輯,相比傳統方法實現高達120倍的加速,並在語義一致性、多視角穩定性和推理速度上超越現有方法。
VGGT-Edit是首個原生3D編輯框架,直接在3D空間中進行編輯,避免2D方法帶來的多視角不一致問題。 通過殘差場預測,模型只修改局部變化,保持背景穩定,實現快速、高質量的編輯。 上週AI資訊#341 - 馬斯克敗訴OpenAI,Google IO更新,OpenAI解決埃爾德什問題 2026-05-27 本週AI頭條:馬斯克對OpenAI的1500億美元訴訟被駁回;Google I/O 2026發佈多項AI更新,包括Gemini 3.5 Flash和Gemini Spark;OpenAI的AI解決了一個80年曆史的數學問題;美國《Take It Down Act》生效,要求平台48小時內刪除深度偽造內容;SpaceX IPO後計劃以600億美元收購AI編碼初創公司Cursor。
馬斯克對OpenAI的1500億美元訴訟被陪審團駁回,OpenAI準備IPO。 Google I/O 2026推出Gemini 3.5 Flash、Gemini Spark、Gemini Omni等重大AI更新。 下載:戳破AI就業恐慌 2026-05-27 儘管AI對白領工作的威脅日益引起恐慌,但數據顯示AI尚未對勞動力市場產生大規模影響。實際上,AI高暴露職業的失業率反而低於低暴露職業。然而,斯坦福大學的一項研究發現,AI可能正在悄悄削弱初級職位,年輕工作者在AI暴露職業中的就業率大幅下降。本文還涵蓋了教皇呼籲監管AI、SpaceX發射、華為芯片突破等其他技術新聞。
AI尚未導致大規模失業,但可能正在削弱初級職位。 斯坦福研究顯示,AI暴露職業的年輕工作者就業率大幅下降。 Show HN: Mirdel – 本地優先的AI工作空間,支持基於UI的代理工作流 2026-05-27 Mirdel是一款本地優先的桌面AI工作空間,將對話、知識庫、筆記、翻譯、圖像和視頻處理、本地模型及可擴展工作流整合到一個長期運行的環境中。它注重數據隱私和用户控制,支持多種雲模型和本地模型,並通過Applet、Skill和MCP協議實現工作流的模塊化和複用。
本地優先:數據、模型和配置默認存儲在本地,敏感信息加密保護。 多模塊工作台:包括聊天、知識庫、筆記、翻譯、圖像和視頻處理等獨立但共享上下文的模塊。 Codex自我蒸餾玩法火了!OpenAI員工親授:複製粘貼就能讓AI消滅重複勞動 2026-05-27 只需一段提示詞,OpenAI員工Vaibhav分享的Codex自我蒸餾法引發熱議。
OpenAI員工Vaibhav發佈提示詞,讓Codex自動查找歷史會話中的重複工作流並打包工具 提示詞有兩個版本,第二版擴展到Memory和Chronicle,覆蓋更多工作場景 [AINews] 新的AI基礎設施十角獸:Fireworks、Baseten(OpenRouter緊隨其後) 2026-05-27 AI基礎設施初創公司Fireworks、Baseten和OpenRouter正在籌集鉅額資金,標誌着推理基礎設施成為關鍵的AI平台層。同時,智能體工程、新基準測試和模型更新主導了AI新聞週期。
Fireworks(150億美元)、Baseten(110億美元)和OpenRouter(1.13億美元)引領推理基礎設施融資浪潮。 智能體工程中的“ harness”正在成為編程智能體的主要差異化因素。 DeepSeek陳德里開發自動研究Skill,寫一篇論文人類只動腦2小時 2026-05-27 DeepSeek研究員陳德里使用自研的DeliAutoResearch技能,與DeepSeek-V4-Pro和GPT-Image2合作,在6天內完成了一篇46頁的論文。論文提出了L1-L5自主研究智能體分類體系,分析了四種架構模式和17個主流系統,並指出了六大開放問題。陳德里表示,人類僅需投入不到2小時的“CPU時間”,其餘工作由AI Agent完成。
陳德里開發自動研究技能DeliAutoResearch,論文99%由Agent撰寫。 論文提出L1-L5自主研究智能體分類,類比自動駕駛SAE級別。 AI週刊第496期:Anthropic的國防級模型現已全民可用 2026-05-27 本週AI新聞要點:Anthropic公開了此前僅限國防承包商使用的頂級模型Mythos,使五角大樓級AI能力向開發者開放;DeepMind CEO哈薩比斯將AGI時間線提前至2029年;Starlette框架爆出嚴重認證繞過漏洞,影響數百萬AI代理;CrowdStrike等聯合摧毀Glassworm殭屍網絡;法國巴黎銀行與Mistral達成主權AI安全合作;中國限制阿里和深度求索頂尖AI工程師出境;Uber AI預算超支、ClickUp裁員並引入數千AI代理,同時MIT技術評論數據顯示AI暴露崗位失業率更低,奧特曼撤回白領失業預言。
Anthropic發佈Mythos模型,原本僅限NSA和五角大樓使用,現可通過標準API訪問。 深度思維CEO哈薩比斯將AGI實現時間從5-10年縮短至2029年。 我放棄了ChatGPT,選擇了免費、隱私、本地的AI——Ollama,原因在此 2026-05-26 Ollama是一款免費、開源、可本地安裝的AI工具,提供隱私保護、離線訪問和靈活性。它運行在你的個人硬件上,減少環境影響,讓你掌控數據。
Ollama免費、私密且開源。 它在本地運行,使用你自己的硬件。 關於接下來會發生什麼的一些想法,2026年5月 2026-05-26 2026年AI領域將繼續快速發展,開源模型在智能體能力上仍落後於閉源模型,谷歌的Gemini尚未對Claude Code和Codex構成有力競爭,美國開源模型正在崛起,Anthropic與OpenAI競爭激烈,現有權力結構開始介入AI發展。
開源模型在智能體能力上落後閉源模型約12個月。 谷歌Gemini在智能體工具方面無明顯競爭優勢。 據報道中國要求頂尖AI研究人員出國前需獲批准 2026-05-26 中國正在限制阿里巴巴和DeepSeek等私營公司的頂尖AI研究人員出國旅行,他們需要獲得官方批准才能離境。北京擔心數據泄露、技術盜竊和人才挖角,正在加強對國內AI行業的管控。
中國要求頂尖AI研究人員出國前需獲得許可。 該政策適用於阿里巴巴和DeepSeek等私營公司。 將DSA注意力引入多模態,快手Keye2.0開啓強化推理新範式 2026-05-26 快手發佈Keye-VL-2.0-30B-A3B多模態大模型,首次將DSA稀疏注意力機制應用於多模態場景,實現256K超長上下文深度感知,並在長視頻時序理解、Agent協作等方面取得突破,為視頻理解和智能調度提供新範式。
首次將DSA引入多模態,突破長視頻理解瓶頸 在TimeLens等基準上實現SOTA,長上下文準確率逆勢提升 BODHI: 精確的操作系統內核規範推斷 2026-05-26 研究人員提出BODHI方法,通過領域知識提示技術大幅提升大型語言模型生成操作系統內核形式化規範的能力。在OSV-Bench基準上,結合Claude Opus 4.6的BODHI方法達到了96.73%的Pass@1,相較於此前最佳結果提升顯著。
BODHI是一種領域知識提示方法,通過結構化C到Python轉換指南輔助LLM生成內核規範。 在OSV-Bench的245個規範生成任務上,BODHI將最佳Pass@1從55.10%提升至96.73%。 Cited AI Workspace:無需重複上傳文件 2026-05-26 UUMuse 是一個雲端AI知識庫平台,只需上傳一次文件,即可在GPT、Claude、DeepSeek、Qwen等多個模型中進行帶有引用的問答、生成內容和部署。支持通過API和MCP供代理和應用調用,提供永久記憶、多專家辯論(Spark)、代理模式等功能,並可將知識庫部署為文檔網站、小部件、API端點等。
一次上傳,多模型使用:文件上傳後,GPT、Claude、DeepSeek、Qwen等模型均可基於同一知識庫作答並引用來源。 記憶與代理:AI記住你的偏好和項目上下文,代理模式自動規劃並執行任務,無需重複指令。 ContextVault – 適用於ChatGPT、Claude、Gemini的本地優先AI對話記錄器 2026-05-26 ContextVault是一款瀏覽器擴展,可在所有主要LLM平台(如ChatGPT、Claude和Gemini)上實時捕獲AI對話,並將其本地存儲在IndexedDB中。支持一鍵導出為Markdown或ZIP格式,確保您的對話數據不會離開您的設備。該工具免費、開源,無需賬户或後端,注重隱私。
實時捕獲來自ChatGPT、Claude、Gemini等7個LLM平台的AI對話。 所有數據本地存儲在IndexedDB中,無雲端同步或第三方訪問。 HTML Deployer:一鍵將AI生成的HTML轉化為在線網站 2026-05-25 HTML Deployer是一款Chrome擴展,可從ChatGPT、Claude和Gemini中提取AI生成的HTML,並提供預覽、下載ZIP或直接發佈到Netlify、GitHub、FTP或自託管服務器的功能。適合開發者、創始人、營銷人員、機構和初學者。
支持從ChatGPT、Claude和Gemini提取HTML代碼塊。 提供預覽、ZIP導出和直接發佈到雲存儲、FTP或自託管服務器。 DeepSeek V4還能更省!新工具緩存命中率高達99.82%,2折穩定到手 2026-05-25 DeepSeek V4系列發佈一個月後,開源社區推出Reasonix工具,專為DeepSeek設計,通過優化緩存機制將賬單成本降低至原來的五分之一左右。該工具緩存命中率高達99.82%,實現4億+token從61美元降至12美元。
Reasonix是專為DeepSeek打造的終端編碼工具,核心目標是降低使用成本。 通過緩存優先循環、工具調用修復和自動上下文壓縮等機制,實現長會話緩存命中率超90%。 Claude 通過率不到4%,SaaS-Bench撕碎了Computer-Use的「全自動辦公」幻想 2026-05-25 UniPat AI 發佈 SaaS-Bench 評測,Claude 等主流大模型在真實辦公任務中完全通過率最高僅 3.8%,AI 全自動辦公遠未落地。
SaaS-Bench 評測顯示,最強模型 Claude Opus 4.7 完全通過率僅 3.8%。 93.4% 的任務跨越至少兩個應用,97.3% 的文本任務操作步數超過 100 步。