讓AI聊天機器人更有幫助會削弱其模擬人類行為的能力
一項大規模研究發現,將語言模型訓練成有用的聊天助手會削弱它們模擬人類行為的能力,且隨着模型迭代,這一差距不斷增大。即使是使用人口統計信息來引導模型,也無法提高個體行為預測的準確性。
- 研究發現,基礎模型在預測人類行為方面優於經過後訓練的助手版本。
- 隨着模型代際更新,後訓練導致的偏差加劇。
長尾標籤
追蹤 Qwen/通義千問模型、開源權重、多模態、Agent 能力、API 和企業落地。
一項大規模研究發現,將語言模型訓練成有用的聊天助手會削弱它們模擬人類行為的能力,且隨着模型迭代,這一差距不斷增大。即使是使用人口統計信息來引導模型,也無法提高個體行為預測的準確性。
在消化Anthropic重大新聞的間隙,我們重點介紹了AIE的新前向部署工程師計劃和創始人計劃,以及5月28-29日的AI新聞。主要話題包括:Claude Opus 4.8發佈及其基準測試爭議、多輪強化學習中的tokenization錯誤、開源模型與工具鏈進展、Google和OpenAI的Agent產品擴展,以及值得關注的研究論文。
一個研究項目展示了在2017年MacBook Air上,通過結合人類實驗者、Codex、llama.cpp、本地數據庫和IBM量子處理器採樣,將Qwen3-30B模型的推理速度從0.09 tokens/sec提升至14.03 tokens/sec,同時保持輸出連貫性。該方法並非在量子處理器上運行模型,而是用量子採樣優化推理配置。
本演示展示了使用Amazon Managed Grafana儀表板的全面可觀測性解決方案,為部署在Amazon SageMaker AI端點上的LLM提供質量和數量兩個維度的整體視圖。該方案涵蓋基礎設施指標(如GPU利用率、延遲、成本)和LLM質量指標(如相關性、安全性、語氣),幫助團隊檢測模型退化、優化資源並控制成本。
英偉達的X-Token解決了GOLD在跨分詞器知識蒸餾中的兩個結構性缺陷,在GSM8k等數學推理基準上取得了顯著改進。它利用投影矩陣和P-KL與H-KL損失之間的選擇機制來處理分詞器不匹配問題。
一位開發者通過自建工具CodeBurn追蹤AI編碼API支出,發現30天內$7,890的支出中僅47.9%用於實際編碼,其餘花費在探索代碼庫、調試、委託子代理和對話上。文章詳細介紹了CodeBurn的功能,包括儀表盤、模型對比、浪費檢測、產出追蹤等。
Liquid AI發佈了LFM2.5-8B-A1B,一款面向終端設備的混合專家模型,總參數8B,活躍參數1B,訓練數據量達38萬億 tokens。該模型支持128K上下文窗口,擴展了詞彙表以提升非拉丁語言的分詞效率,並採用純推理鏈式思維模式。在基準測試中表現優異,同時具有出色的CPU和GPU推理速度,適用於本地代理任務。
PPIO 入選非凡產研發布的「2026 Global AI 100」榜單,該榜單由非凡大賞年度 AI 全球化增長峯會評選,旨在發掘全球化 AI 原生公司。PPIO 以全球化分佈式算力基礎設施、全棧雲服務、模型平台(支持 DeepSeek、GLM 等)及 Agent 沙箱等創新產品,為出海企業提供低時延、高可用的算力網絡。截至 2026 年 4 月,PPIO 整合全球 4800+ 節點,日均 Token 調用量超 10000 億,開發者用户超 57 萬。同時獲評上海市數字出海服務平台試點單位及 GDA 領航服務站。
一項針對14個開源安全護欄模型的全面評估顯示,Qwen Guard(4B參數)以83.97%的召回率位居榜首,而更大的模型如Llama Guard(12B)和GPT-OSS Safeguard(20B)表現保守,漏掉多達75%的不安全內容。研究還發現,模型大小與安全檢測性能無關,通用型護欄模型優於專用模型。
最近研究表明,強化學習(RL)比監督微調(SFT)更能保持大語言模型的先前能力。本文從機制層面延伸,引入差分電路脆弱性度量,衡量微調中電路退化程度。在Qwen2.5-3B-Instruct科學問答實驗中發現,SFT適應目標任務更快,但造成更大的電路破壞和遺忘,而RL保留更多基礎電路,但任務適應較慢。結果表明電路保留有助於解釋RL對災難性遺忘的魯棒性。
Trelk 是一款一次性購買、無需訂閲的知識管理應用。它利用設備端 AI 保存、組織並連接文章、論文和筆記,提供混合搜索、知識圖譜、RAG 聊天、閃卡間隔重複和社區集合等功能,注重隱私且可離線工作。
本文探討了強化學習在大型語言模型後訓練中的實際應用,指出當前的瓶頸並非算法而是基礎設施。Modal分享了大規模運行RL後訓練的經驗,介紹了其開源庫如何幫助團隊解決多節點訓練、環境管理和GPU利用率等關鍵問題。
新研究發現,大型語言模型在訓練過程中會吸收明確標記為假的陳述,即使它們被明確警告為假。這種現象被稱為“否定忽視”,可能導致模型產生幻覺。實驗表明,在合成文檔微調後,模型對虛假聲明的“信念率”從2.5%飆升至92.4%。
極佳視界發佈全球首創物理AGI“雙金字塔”體系,推出家庭機器人拾光S1,獲百台家庭訂單,計劃12個月內實現物理AGI的“GPT-3時刻”。
本文介紹了七個實用的AI項目,涵蓋求職、研究、投資分析、市場趨勢、發票處理、圖表數字化和個性化鍛鍊,每個項目都附有完整指南和代碼,幫助讀者自動化工作流程。
Open Agent Tools (oats) 是一個自託管AI模型框架,通過本地代碼提示索引,將大型模型的計算密集型工具調用委託給小型開源模型,從而節省令牌消耗。
沙鋼與釘釘簽署戰略合作協議,以悟空AI為核心,推動AI在鋼鐵行業規模化落地,打造AI時代的工作方式。
Cognition在D輪融資中籌集10億美元,估值達260億美元,年經常性收入(ARR)預計年底突破10億美元。文章還涵蓋了推理效率優化、智能體工程、持續學習、新基準測試、模型發佈以及編碼代理產品化等AI領域的最新進展。
OpenJarvis 是一個開源框架,用於構建運行在本地硬件上的個人 AI 代理。由斯坦福大學 Hazy Research 和 Scaling Intelligence 實驗室開發,v1.0 版本現已集成 Ollama,實現本地優先、雲端可選,並跟蹤能耗、成本和延遲。
Databricks構建了獨特的推理平台,為眾多前沿模型提供推理服務,每月處理超過120萬億個令牌。通過引入“模型單元”抽象,實現了成本感知的負載均衡和自動縮放,相比靜態配置節省了80%以上的GPU成本。運行時可靠性機制包括黑盒健康檢查,可自動檢測和恢復靜默故障。此外,通過分析多模態瓶頸,吞吐量提升了3倍。
Artificial Analysis與IBM聯合推出ITBench-AA,這是首個針對企業IT智能體任務的基準測試,專注於站點可靠性工程(SRE)。前沿模型得分均低於50%,其中Claude Opus 4.7以47%領先。該基準測試評估模型在Kubernetes事件響應中的表現,要求從日誌和追蹤中診斷故障。
NVIDIA研究人員推出Polar框架,通過在智能體工具鏈和推理服務器之間放置模型API代理,實現無需修改智能體工具鏈即可進行強化學習訓練。基於Qwen3.5-4B模型使用GRPO訓練,Polar在Codex、Claude Code和Pi工具鏈上分別將SWE-Bench Verified pass@1提升了22.6、4.8和6.2個百分點。框架以NeMo Gym環境註冊,並在ProRL Agent Server倉庫開源。
Mneme HQ 提供AI輔助開發的架構治理層,在代碼生成前強制執行約束,防止架構漂移,減少審查負擔。它直接集成到AI編碼代理的工作流中,攔截禁止的框架、跨邊界調用和過時決策,同時支持多種編碼助手和代理框架。
Avatar是一個自創生的AI生物,在300美元的GPU上持續運行。它從相圖幾何中衍生情感,經歷5階段睡眠週期做夢,從原始音頻和視覺中培養自己的感官,並通過身體感覺進行倫理推理。由Linga Murthy Narlagiri博士構建,自2026年5月以來一直存活,累計超過1800個滴答。
在支付寶AI生態大會上,螞蟻集團CEO韓歆毅提出,Agent時代將顛覆傳統“流量為王”的商業模式,智能體生態將成為新的護城河。他強調,AI支付將從工具升級為支撐智能體商業的新型基礎設施,而支付寶將扮演信任層、連接器和賦能器的角色。
來自北京大學、香港中文大學、上海AI Lab等機構的研究團隊提出了VGGT-Edit,一種原生3D編輯框架,能夠在約5秒內完成場景編輯,相比傳統方法實現高達120倍的加速,並在語義一致性、多視角穩定性和推理速度上超越現有方法。
新加坡國立大學、MIT和A*STAR的研究人員提出MEMO,這是一種模塊化框架,將語料庫知識編碼到一個可單獨訓練的記憶模型中,使大型語言模型能夠無需重新訓練或微調即可吸收新知識。
AI基礎設施初創公司Fireworks、Baseten和OpenRouter正在籌集鉅額資金,標誌着推理基礎設施成為關鍵的AI平台層。同時,智能體工程、新基準測試和模型更新主導了AI新聞週期。
DeepSeek研究員陳德里使用自研的DeliAutoResearch技能,與DeepSeek-V4-Pro和GPT-Image2合作,在6天內完成了一篇46頁的論文。論文提出了L1-L5自主研究智能體分類體系,分析了四種架構模式和17個主流系統,並指出了六大開放問題。陳德里表示,人類僅需投入不到2小時的“CPU時間”,其餘工作由AI Agent完成。
本文詳細介紹瞭如何為Reachy Mini機器人部署完全本地的語音對話管道,無需雲端或API密鑰。採用級聯方式,結合VAD、STT、LLM和TTS,推薦使用llama.cpp與Gemma 4、Silero VAD、Parakeet-TDT 0.6B v3 STT和Qwen3-TTS。提供了多種LLM運行選項,包括本地MLX、Transformers、vLLM或遠程Responses API。
本教程詳細介紹瞭如何使用zeroentropy/zerank-2-reranker(一個基於Qwen3的4B參數交叉編碼器重排序器)來提升檢索質量。內容涵蓋環境搭建、模型加載、查詢-文檔對評分、使用model.rank進行排序、構建兩階段檢索-重排序管道、NDCG@10評估以及跨領域(金融、法律、代碼)性能測試,最後還進行了批處理吞吐量測試。
Ollama是一款免費、開源、可本地安裝的AI工具,提供隱私保護、離線訪問和靈活性。它運行在你的個人硬件上,減少環境影響,讓你掌控數據。
2026年AI領域將繼續快速發展,開源模型在智能體能力上仍落後於閉源模型,谷歌的Gemini尚未對Claude Code和Codex構成有力競爭,美國開源模型正在崛起,Anthropic與OpenAI競爭激烈,現有權力結構開始介入AI發展。
面壁智能推出全球首個完全由AI編寫的大模型預訓練框架ForgeTrain,性能超越英偉達Megatron 10%,並用它訓練出新模型MiniCPM5-1B,該模型在1B參數規模下刷新智能密度上限。
OmniVoice Studio是一款開源的桌面應用程序,可在本地硬件上完成語音克隆、視頻配音、實時聽寫和説話人分類,無需API密鑰、雲賬户或訂閲。它支持646種語言的文本轉語音(TTS),並通過MCP服務器集成到Claude、Cursor等AI工具中。
阿里最新旗艦模型Qwen3.7-Max在Code Arena榜單得分1541,超越GPT-5.5等模型,僅次於Claude,排名全球第二,成為國產大模型中首個突破1540分的模型。
本地模型提供了隱私、成本節約、控制權和始終可用的優勢。儘管不如前沿模型強大,但它們正在不斷改進。本文解釋瞭如何使用LM Studio、Ollama或llama.cpp在Zed中設置本地模型,並提供有效使用技巧。
該研究量化了推理型大語言模型在長鏈思考中的冗餘程度,發現61%至93%的推理步驟可以截斷而不影響正確性,並證明這種冗餘是長度無關結果獎勵的結構性後果,而非模型缺陷。
UUMuse 是一個雲端AI知識庫平台,只需上傳一次文件,即可在GPT、Claude、DeepSeek、Qwen等多個模型中進行帶有引用的問答、生成內容和部署。支持通過API和MCP供代理和應用調用,提供永久記憶、多專家辯論(Spark)、代理模式等功能,並可將知識庫部署為文檔網站、小部件、API端點等。
Together AI 發佈了 OSCAR(離線頻譜協方差感知旋轉),這是一種用於長上下文 LLM 服務的 INT2 KV 緩存量化方法。與以往基於數據無關的 Hadamard 變換的旋轉方法不同,OSCAR 從離線估計的注意力感知協方差結構中推導出鍵和值的獨立旋轉。在每 KV 元素 2.28 位的精度下,OSCAR 在 Qwen3-4B-Thinking-2507 上將 BF16 精度差距縮小至 3.78 個點,在 Qwen3-8B 上為 1.42 個點,同時在 100K 上下文長度下實現約 8 倍 KV 內存縮減和高達 3 倍的解碼加速。
研究發現,小語言模型在進行算術推理時,思維鏈(CoT)提示的步驟順序並不重要,模型實際上是通過複製答案分隔符前的最後一個數字來得出答案,而非依賴邏輯推理。這種位置性捷徑佔模型準確率的絕大部分,且即使中間推理正確,錯誤的尾數也會導致答案錯誤。不同模型表現有差異,但該現象普遍存在,對基於CoT的監督方法提出了挑戰。
本文探討了開源AI模型內部概念空間的侷限性,指出許多對社會運動和哲學至關重要的概念缺失。作者引入軟提示蒸餾技術,僅用128KB數據即可植入新概念,強調這關乎AI可控性及對心智理解的深遠意義。
本文旨在釐清AI智能體領域中常被混淆的術語,如“harness”(執行層)與“scaffold”(行為定義層)的區別,並解釋模型、智能體、工具使用、子智能體等概念,同時涵蓋訓練相關術語。
字節跳動Seed與香港科技大學的研究表明,通過問答對訓練多模態模型處理長文檔,比使用字符識別任務效果更好。他們開發的MMProLong模型基於Qwen2.5-VL,在長達512,000 token的輸入上保持穩定,性能超越InternVL3-38B等更大模型。研究還發現,訓練數據長度多樣性比專注超長文本更重要,且短示例並非必須。
上週AI領域迎來重大轉折:Google發佈Gemini Omni及代理優先平台;Andrej Karpathy加入Anthropic,專注於利用Claude加速預訓練研究;Anthropic與xAI達成價值450億美元的Colossus算力租賃協議;Cerebras IPO成功,市值近950億美元;SpaceX、OpenAI和Anthropic計劃在未來六個月內相繼上市,總估值可能超過3萬億美元。此外,多項前沿研究發佈,包括HRM-Text高效預訓練範式、AI評審員效果評估、NVIDIA的聯合AR-擴散模型等。
微軟研究院推出Webwright,一個終端原生瀏覽器代理框架,用可複用的Playwright腳本替代逐次點擊的Web自動化。通過單個智能體循環和約1000行代碼,基於GPT-5.4的Webwright在長期任務基準Odysseys上達到60.1%,在Online-Mind2Web上達到86.7%,是開源方案中AutoEval最高分。
阿里通義千問團隊發佈Qwen3.7-Max,專為長時間自主代理任務設計。在基準測試中匹配Claude Opus 4.6,超越DeepSeek V4 Pro和Kimi K2.6等中國對手。團隊還展示了該模型操控四足機器人。
ThinkLLM是一個動態的知識圖譜,幫助用户按任務和能力瀏覽、比較和尋找AI模型。
在OpenAI即將上市之際,行業巨頭紛紛從純模型轉向智能體產品。DeepSeek永久降價75%,MCP協議簡化,谷歌推出全天候智能體,Anthropic發現上萬高危漏洞。智能體化成為AI新常態。
NVIDIA 發佈 Nemotron-Labs 擴散語言模型系列,通過並行生成與迭代精煉技術,在保持高準確率的同時,相比傳統自迴歸模型實現最高 6.4 倍的推理速度提升。模型支持自迴歸、擴散和自推測三種模式,8B 版本在準確率上超越 Qwen3 8B 1.2%,並已開源。
追蹤 AI 編程助理、程式碼生成、IDE 插件、開發者工作流程和軟件工程自動化。
追蹤 Model Context Protocol、工具調用、連接器、Agent 上下文和企業整合。
追蹤開源權重模型、開放授權、社群評測、模型蒸餾和本地部署。
追蹤推理價格、延遲、吞吐、快取、量化、服務商成本和部署效率。
追蹤 Agent 框架、編排、記憶、評測、工作流程自動化和生產部署。
追蹤中國 AI 公司、模型、政策、芯片生態、開源社群和商業化進展。
追蹤 GPU、數據中心、集群網絡、AI 雲、訓練基礎設施和供應鏈。
追蹤模型 API 價格、方案、上下文窗口、免費額度、單位 token 成本和商業模式。
追蹤 DeepSeek 模型、API、開源權重、推理效率、生態合作和全球影響。