AI News HubLIVE

DeepSeek動態

[AINews] 創始人與前向部署工程師

在消化Anthropic重大新聞的間隙,我們重點介紹了AIE的新前向部署工程師計劃和創始人計劃,以及5月28-29日的AI新聞。主要話題包括:Claude Opus 4.8釋出及其基準測試爭議、多輪強化學習中的tokenization錯誤、開源模型與工具鏈進展、Google和OpenAI的Agent產品擴充套件,以及值得關注的研究論文。

  • Claude Opus 4.8帶來增量改進,但基準測試未顯示絕對優勢,定價仍是主要痛點。
  • 多輪強化學習訓練中的tokenization錯誤被指出,需嚴格遵循“Token-In, Token-Out”規則。
站內正文

StepFun 釋出 Step 3.7 Flash:面向編碼智慧體和搜尋工作流的 198B MoE 視覺語言模型

Step 3.7 Flash 是一款 198B 稀疏 MoE 模型,擁有約 11B 活躍引數、原生視覺能力和 256K 上下文視窗。在編碼基準測試上相比前代大幅提升,支援 Advisor Mode 實現高價效比的智慧體推理,並以 Apache 2.0 許可證開源。

  • 198B MoE 視覺語言模型,活躍引數約 11B,上下文視窗 256K。
  • SWE-Bench Pro 得分 56.26%,較前代 51.3% 提升,且跨框架方差縮小。
站內正文

DDS Vibe Academy – 47個免費AI程式設計大師課程,由AI代理構建

DDS Vibe Academy 提供47個免費AI程式設計大師課程,全部由AI代理構建。創始人Robert McCullock僅設計約束條件,未編寫一行程式碼。課程涵蓋基礎、開發、應用和精通四個級別,涉及Claude、Antigravity、MCP等技術。

  • 47個免費AI程式設計大師課程,由AI代理構建
  • 創始人聲稱未編寫任何程式碼,僅設計約束
站內正文

今日下載:解鎖鋰資源與控制埃博拉疫情

新方法有望以更低成本從矽酸鹽礦物中提取鋰,同時獲得氧化鋁和二氧化矽等副產品,MIT教授稱其可成為全球最低成本的鋰來源。剛果民主共和國爆發致命埃博拉疫情,四名醫護人員四天內死亡,控制難度大。教皇新通諭《Magnifica Humanitas》指出技術非中立,呼籲個人和機構以勇氣和團結應對AI時代。另有Anthropic估值達9650億美元、藍色起源火箭測試爆炸、JWST改變天文學等最新科技動態。

  • 新鋰提取技術使用弱酸溶解矽酸鹽礦物,成本低且環保,Rock Zero公司正商業化。
  • 剛果(金)埃博拉疫情由Bundibugyo病毒引起,控制困難。
站內正文

4nm!比亞迪自研AI晶片來了:製程對齊輝達,算力拉爆特斯拉

比亞迪釋出了中國首顆車規級4奈米智駕晶片璇璣A3,採用自研NPU架構,三顆組合算力超2100 TOPS,單位功耗比同類低20%,算力利用率提升100%。王傳福承諾智駕事故全額賠付。

  • 比亞迪釋出中國首顆4nm智駕晶片璇璣A3,全自研設計
  • 採用專用NPU架構,功耗低20%,算力利用率翻倍
站內正文

新綜述論文:程式碼不僅是AI智慧體的產物,更是其思考與行動的方式

一篇新綜述論文指出,自主AI智慧體的真正瓶頸並非語言模型本身,而是圍繞其構建的軟體層。工具、記憶、測試和許可權邊界將無狀態模型轉變為可工作的智慧體。Deepseek已在北京組建專門的“Harness”團隊,其核心公式驗證了該論點:模型加Harness等於AI智慧體。

  • 論文強調AI智慧體的瓶頸在於軟體封裝層,而非語言模型。
  • 工具、記憶、測試和許可權管理是將模型轉化為智慧體的關鍵。
站內正文

光帆科技與騰訊出行服務達成戰略合作 開啟新一輪預售

光帆科技與騰訊出行服務合作,將AI全感穿戴裝置接入出行平臺,該裝置曾登頂京東熱賣榜並售罄,現已開啟新一輪預售。

  • 光帆科技與騰訊出行服務達成戰略合作,AI穿戴裝置將接入出行服務。
  • 光帆AI全感穿戴裝置首發售罄,連續8天京東熱賣榜第一。
站內正文

PPIO入選非凡產研「2026 Global AI 100」,以AI實力領跑出海新浪潮

PPIO 入選非凡產研發布的「2026 Global AI 100」榜單,該榜單由非凡大賞年度 AI 全球化增長峰會評選,旨在發掘全球化 AI 原生公司。PPIO 以全球化分散式算力基礎設施、全棧雲服務、模型平臺(支援 DeepSeek、GLM 等)及 Agent 沙箱等創新產品,為出海企業提供低時延、高可用的算力網路。截至 2026 年 4 月,PPIO 整合全球 4800+ 節點,日均 Token 呼叫量超 10000 億,開發者使用者超 57 萬。同時獲評上海市數字出海服務平臺試點單位及 GDA 領航服務站。

  • PPIO 入選「2026 Global AI 100」榜單,彰顯其在 AI 出海領域的領先地位。
  • 提供全球化分散式算力基礎設施,覆蓋 GPU 全型號,支援大規模訓練與推理。
站內正文

面壁智慧「開源周」:一場定義端側 AI 終局的系統性「亮劍」

面壁智慧於5月25日至29日舉辦端側大模型開源周,釋出五項技術成果,涵蓋訓練框架、模型壓縮、資料集和智慧體作業系統,展現全鏈路系統性創新。MiniCPM5-1B效能超越GPT-4o部分版本,端側AI終局之戰聚焦系統工程。

  • 面壁智慧在2026年5月25-29日舉辦端側大模型開源周,每日釋出一項關鍵技術。
  • 五項成果包括BitCPM-CANN、MiniCPM5-1B、ForgeTrain、PilotDeck和UltraData,形成全棧閉環。
站內正文

5億Tokens白送!全球首個商用AI主機發布,終於能放開燒Token了

聯想釋出全球首款商用AI主機系列,專為一人公司(OPC)和成長型企業設計,透過本地+雲端混合架構解決Token成本高和資料安全問題,並贈送大量Tokens,開箱即用。

  • 聯想釋出三款AI主機:mini 100、300、Pro 700,覆蓋個人到團隊。
  • 本地推理+雲端彈性,Token成本可降低70%-95%。
站內正文

下限零基礎,上限肝大作!騰訊這個AI遊戲創作平臺,太野了

下一波AI創作浪潮正在遊戲領域發生,騰訊釋出AI遊戲創作平臺「代號Craft」,使用者可透過自然語言生成可執行的遊戲,2D/3D均支援,內建AIGC工具和免費資產,極大降低遊戲創作門檻。

  • 騰訊釋出AI遊戲創作平臺「代號Craft」,支援自然語言生成遊戲
  • 平臺同時覆蓋2D和3D遊戲,內建完整AIGC管線與免費資產
站內正文

創意設計版WorkBuddy來了!騰訊釋出智慧體創意工作室Miora

騰訊釋出Miora,一款集影像、影片、UI/UX和3D生成於一體的AI創意工作室。它具備記憶系統、多模態畫布和可定製的Skills,讓一個人擁有整個創意工作室。

  • 騰訊釋出Miora,一款全場景創意智慧體工作室
  • 支援影像、影片、UI/UX、3D等多模態內容生成
站內正文

首份教皇關於人工智慧的通諭大量由AI撰寫的證據

文章作者透過文本分析、統計證據和AI檢測工具,論證了教皇利奧一世的首份通諭《Magnifica Humanitas》中有大量內容是由AI(特別是Claude)撰寫的。作者指出,通諭中使用的破折號、詞語“genuinely”的頻率遠高於以前的通諭,且Pangram檢測器標記部分段落為AI生成。作者認為,儘管個別證據可能被解釋,但多重證據的吻合難以忽視。

  • 通諭中大量使用破折號和“genuinely”等AI常用詞彙,頻率遠超此前通諭。
  • Pangram檢測器將多個段落標記為40%-100%AI生成,而此前通諭無一被標記。
站內正文

清華系團隊給大模型織了一張“智慧算力電網”

清華系創業公司是石科技透過自主研發的並行最佳化技術,構建異構算力資源池與推理最佳化引擎,實現單位Token成本降低40%,旨在打造國產Token調優工廠,降低AI落地門檻。

  • 是石科技成立於2021年,源於國家超算無錫中心,創始人閆博文為清華博士後。
  • 透過全域異構算力池和深度國產化適配,將閒置國產晶片轉化為可用算力。
站內正文

如何最佳化您的AI令牌使用量:repo-brain 工具介紹

repo-brain 是一款開源工具,能將整個程式碼庫壓縮成單個Markdown上下文檔案,實現高達96%的壓縮率,大幅減少AI令牌使用量。它支援多種程式語言的靜態分析、架構分析和語義關係發現,併相容多家AI提供商。

  • 將整個程式碼庫壓縮為單個Markdown上下文檔案,減少AI令牌使用量
  • 在262個檔案的程式碼庫上實現96%壓縮率(從154,229降至6,487令牌)
站內正文

強化學習是一個基礎設施問題

本文探討了強化學習在大型語言模型後訓練中的實際應用,指出當前的瓶頸並非演算法而是基礎設施。Modal分享了大規模執行RL後訓練的經驗,介紹了其開源庫如何幫助團隊解決多節點訓練、環境管理和GPU利用率等關鍵問題。

  • 強化學習後訓練LLM的瓶頸是基礎設施,包括訓練引擎、推理沙箱和環境隔離。
  • 多節點訓練中,權重同步耗時巨大,RDMA和增量壓縮顯著降低延遲。
站內正文

Claude 4.8炸場!部分能力超過Mythos,支援數百子智慧體並行

Claude最新旗艦Opus 4.8釋出,部分能力超過Mythos,支援動態工作流,可拆解任務給數百個子智慧體並行執行,人類無需頻繁檢查。誠實性大幅提升,程式碼缺陷漏報率降至前代四分之一。

  • Claude 4.8釋出,終端工程和知識工作能力進步,部分超越Mythos
  • 動態工作流:Claude生成編排指令碼,數百個子智慧體並行處理任務
站內正文

DeepSWE:基於原創、長期工程任務的編碼智慧體評測

DeepSWE是一個新的基準測試,用於評估AI編碼智慧體在全新、複雜的軟體工程任務上的表現。它避免了資料汙染,覆蓋了多樣化的程式碼庫,需要大量程式碼修改,並使用手工編寫的驗證器。領先模型表現差異顯著,GPT-5.5以70%的準確率位居榜首。

  • DeepSWE是一個無資料汙染的基準測試,任務均為原創。
  • 任務涵蓋5種程式語言中的91個程式碼庫。
站內正文

Show HN:我將一個 Python AI 代理和 Vue 儀表盤打包成了一個 Electron 應用

Hermes Desktop 是一個跨平臺的桌面應用,它將 Python 執行時、hermes-agent(自改進 AI 代理)和 hermes-web-ui(Vue 3 + Koa 聊天儀表盤)打包到一個 Electron 應用中,使用者無需單獨安裝 Python 或 Node。應用整合了 DingTalk 並透過 DeepSeek 驅動。

  • 打包了 Python 執行時和 hermes-agent,實現無需依賴即可執行
  • 使用 Electron 作為外殼,整合 hermes-web-ui 前端
站內正文

5篇AI生成的數學論文被接收!00後創始人洪樂潼融資14個億

Axiom Math公司由00後華人洪樂潼創立,其AI系統AxiomProver生成的8篇數學論文中已有5篇被學術期刊接收。該公司於今年3月完成2億美元融資,估值達16億美元。

  • Axiom Math的AI系統AxiomProver生成的8篇數學論文中,5篇已透過同行評審並發表。
  • 創始人洪樂潼從斯坦福退學創業,公司融資2億美元,估值16億美元。
站內正文

7B打敗o3、GPT-5!醫學AI智慧體讓模型學會“看哪裡、怎麼看”

上海創智學院LeapQuest團隊聯合多所高校提出醫學AI新正規化,讓模型在推理過程中主動呼叫視覺工具,從被動接收視覺輸入變為主動尋找證據。論文被ICML 2026接收。

  • LeapQuest團隊提出Ophiuchus和MedScope,分別面向醫學影像和影片,採用Think with Images/Videos正規化。
  • Ophiuchus-7B在8個VQA benchmark上平均得分68.0,超越o3(62.2)、GPT-5(59.9)。
站內正文

AI正在重寫軟體行業?8歲孩子做作業系統,一人公司拿下千萬訂單

百度秒噠產品總經理朱廣翔在2026中國AIGC產業峰會上分享,AI將程式設計門檻從寫程式碼降低到聊天,87%不懂程式碼的使用者透過秒噠建立應用。8歲小孩做出作業系統,一人公司(OPC)靠專案經理拿下千萬訂單,石油工程師替代140萬採購平臺。Vibe Coding讓需求方變成供給方,實現大眾創業。

  • 第四次程式設計革命:自然語言程式設計,門檻降至最低,創造者數量爆發
  • 秒噠使用者87%不懂程式碼,OPC成最大群體,16%創業者
站內正文

[AINews] Cognition融資10億美元,D輪估值260億

Cognition在D輪融資中籌集10億美元,估值達260億美元,年經常性收入(ARR)預計年底突破10億美元。文章還涵蓋了推理效率最佳化、智慧體工程、持續學習、新基準測試、模型釋出以及編碼代理產品化等AI領域的最新進展。

  • Cognition完成10億美元D輪融資,估值260億美元,ARR預計年底超10億美元。
  • 推理最佳化轉向架構層面:EAGLE 3.1、DeepSeek V4-Pro混合注意力、小米MiMo快取管理等。
站內正文

「斯隆獎」得主戴亮全職加盟復旦

斯隆獎得主、UC Berkeley物理系助理教授戴亮加盟復旦大學,出任物理學系、天文與天體物理研究中心教授。復旦近年引進多名頂尖人才,包括蘇昊、袁峰、季索清等。

  • 戴亮(2021年斯隆獎得主)全職加入復旦大學
  • 曾在UC Berkeley任助理教授,北大物理系校友
站內正文

清華有了新老師:黃仁勳

黃仁勳受邀加入清華大學經管學院顧問委員會,該委員會由蘋果CEO蒂姆·庫克擔任主席,成員包括馬斯克、納德拉、馬雲等全球商業領袖。此外,他剛獲得卡內基梅隆大學榮譽博士學位,並分享名言“AI不會取代你,但善用AI的人會”。

  • 黃仁勳加入清華大學經管學院顧問委員會
  • 委員會由庫克任主席,匯聚全球頂尖企業家
站內正文

ITBench-AA:前沿模型在企業IT智慧體任務基準測試中得分低於50%——由Artificial Analysis與IBM聯合釋出

Artificial Analysis與IBM聯合推出ITBench-AA,這是首個針對企業IT智慧體任務的基準測試,專注於站點可靠性工程(SRE)。前沿模型得分均低於50%,其中Claude Opus 4.7以47%領先。該基準測試評估模型在Kubernetes事件響應中的表現,要求從日誌和追蹤中診斷故障。

  • Claude Opus 4.7以47%領先,GPT-5.5為46%,Qwen3.7 Max為42%。
  • 所有前沿模型得分低於50%,使ITBench-AA成為飽和度最低的智慧體基準之一。
站內正文

AI 是一場軍備競賽,美國需要 90 億美元的輝達超級晶片來跟上步伐

美國情報機構秘密申請 90 億美元採購輝達 GB10 超級晶片,以幫助 CIA 和 NSA 追趕 Anthropic、OpenAI 等 AI 巨頭的步伐。這筆資金尚待國會批准,同時國防預算已調撥 8 億美元用於雲算力。文章詳細介紹了晶片規格、成本以及 AI 硬體競賽的升級趨勢。

  • 美國政府秘密申請 90 億美元為 CIA 和 NSA 購買輝達 GB10 超級晶片。
  • GB10 晶片功耗僅 140 瓦,卻提供 1 petaflop FP4 效能,可微調 700 億引數模型。
站內正文

Show HN: Mneme HQ – 面向AI編碼代理的倉庫原生架構規則

Mneme HQ 提供AI輔助開發的架構治理層,在程式碼生成前強制執行約束,防止架構漂移,減少審查負擔。它直接整合到AI編碼代理的工作流中,攔截禁止的框架、跨邊界呼叫和過時決策,同時支援多種編碼助手和代理框架。

  • 在AI生成程式碼之前強制執行架構規則,從源頭阻止違規
  • 支援Claude Code、Cursor、GitHub Copilot等主流AI編碼工具
站內正文

南非擁有AI槓桿,但其政策草案將其閒置

南非擁有全球88%的鉑族金屬儲量,是非洲最大的資料中心市場,並處於中美AI基礎設施競爭的前沿。然而,其AI政策草案因包含AI幻覺引用而被撤回,未能利用這些優勢來談判有利條件。文章分析了南非的結構性槓桿、三種潛在的AI基礎設施未來(中國、美國和本地開放權重),以及制定具有約束力的治理框架的必要性。

  • 南非的鉑族金屬和可再生能源資源提供了獨特的AI槓桿,但政策草案未設定最低投資條款、資料主權或技術轉讓條件。
  • 中美科技公司(華為和微軟等)正在南非爭奪AI基礎設施控制權,而南非的政策未明確其回報要求。
站內正文

雷鳥雙品齊發:GT 系列、V4 同臺亮相,次世代 AI 眼鏡雷鳥 iO 提前預告

5月27日,雷鳥創新舉辦夏季新品釋出會,推出行業首款專業影視級AR眼鏡雷鳥GT系列(1899元起),以及新一代AI拍攝眼鏡雷鳥V4(2199元起),並預告次世代AI眼鏡雷鳥iO將於第三季度亮相。

  • 雷鳥GT系列:專業影視級AR眼鏡,59°視場角、杜比視界支援、78g重量,1899元起。
  • 雷鳥V4:AI拍攝眼鏡,0.2秒喚醒、2.1秒響應、11.5小時音樂播放、IP67防水、38g,2199元起。
站內正文

5秒完成3D場景編輯,北大&港中文&上海AI Lab搞出VGGT-Edit,120倍加速太炸了

來自北京大學、香港中文大學、上海AI Lab等機構的研究團隊提出了VGGT-Edit,一種原生3D編輯框架,能夠在約5秒內完成場景編輯,相比傳統方法實現高達120倍的加速,並在語義一致性、多視角穩定性和推理速度上超越現有方法。

  • VGGT-Edit是首個原生3D編輯框架,直接在3D空間中進行編輯,避免2D方法帶來的多視角不一致問題。
  • 透過殘差場預測,模型只修改區域性變化,保持背景穩定,實現快速、高質量的編輯。
站內正文

上週AI資訊#341 - 馬斯克敗訴OpenAI,Google IO更新,OpenAI解決埃爾德什問題

本週AI頭條:馬斯克對OpenAI的1500億美元訴訟被駁回;Google I/O 2026釋出多項AI更新,包括Gemini 3.5 Flash和Gemini Spark;OpenAI的AI解決了一個80年曆史的數學問題;美國《Take It Down Act》生效,要求平臺48小時內刪除深度偽造內容;SpaceX IPO後計劃以600億美元收購AI編碼初創公司Cursor。

  • 馬斯克對OpenAI的1500億美元訴訟被陪審團駁回,OpenAI準備IPO。
  • Google I/O 2026推出Gemini 3.5 Flash、Gemini Spark、Gemini Omni等重大AI更新。
站內正文

下載:戳破AI就業恐慌

儘管AI對白領工作的威脅日益引起恐慌,但資料顯示AI尚未對勞動力市場產生大規模影響。實際上,AI高暴露職業的失業率反而低於低暴露職業。然而,斯坦福大學的一項研究發現,AI可能正在悄悄削弱初級職位,年輕工作者在AI暴露職業中的就業率大幅下降。本文還涵蓋了教皇呼籲監管AI、SpaceX發射、華為晶片突破等其他技術新聞。

  • AI尚未導致大規模失業,但可能正在削弱初級職位。
  • 斯坦福研究顯示,AI暴露職業的年輕工作者就業率大幅下降。
站內正文

Show HN: Mirdel – 本地優先的AI工作空間,支援基於UI的代理工作流

Mirdel是一款本地優先的桌面AI工作空間,將對話、知識庫、筆記、翻譯、影像和影片處理、本地模型及可擴充套件工作流整合到一個長期執行的環境中。它注重資料隱私和使用者控制,支援多種雲模型和本地模型,並透過Applet、Skill和MCP協議實現工作流的模組化和複用。

  • 本地優先:資料、模型和配置預設儲存在本地,敏感資訊加密保護。
  • 多模組工作臺:包括聊天、知識庫、筆記、翻譯、影像和影片處理等獨立但共享上下文的模組。
站內正文

[AINews] 新的AI基礎設施十角獸:Fireworks、Baseten(OpenRouter緊隨其後)

AI基礎設施初創公司Fireworks、Baseten和OpenRouter正在籌集鉅額資金,標誌著推理基礎設施成為關鍵的AI平臺層。同時,智慧體工程、新基準測試和模型更新主導了AI新聞週期。

  • Fireworks(150億美元)、Baseten(110億美元)和OpenRouter(1.13億美元)引領推理基礎設施融資浪潮。
  • 智慧體工程中的“ harness”正在成為程式設計智慧體的主要差異化因素。
站內正文

DeepSeek陳德里開發自動研究Skill,寫一篇論文人類只動腦2小時

DeepSeek研究員陳德里使用自研的DeliAutoResearch技能,與DeepSeek-V4-Pro和GPT-Image2合作,在6天內完成了一篇46頁的論文。論文提出了L1-L5自主研究智慧體分類體系,分析了四種架構模式和17個主流系統,並指出了六大開放問題。陳德里表示,人類僅需投入不到2小時的“CPU時間”,其餘工作由AI Agent完成。

  • 陳德里開發自動研究技能DeliAutoResearch,論文99%由Agent撰寫。
  • 論文提出L1-L5自主研究智慧體分類,類比自動駕駛SAE級別。
站內正文

AI週刊第496期:Anthropic的國防級模型現已全民可用

本週AI新聞要點:Anthropic公開了此前僅限國防承包商使用的頂級模型Mythos,使五角大樓級AI能力向開發者開放;DeepMind CEO哈薩比斯將AGI時間線提前至2029年;Starlette框架爆出嚴重認證繞過漏洞,影響數百萬AI代理;CrowdStrike等聯合摧毀Glassworm殭屍網路;法國巴黎銀行與Mistral達成主權AI安全合作;中國限制阿里和深度求索頂尖AI工程師出境;Uber AI預算超支、ClickUp裁員並引入數千AI代理,同時MIT技術評論資料顯示AI暴露崗位失業率更低,奧特曼撤回白領失業預言。

  • Anthropic釋出Mythos模型,原本僅限NSA和五角大樓使用,現可透過標準API訪問。
  • 深度思維CEO哈薩比斯將AGI實現時間從5-10年縮短至2029年。
站內正文

關於接下來會發生什麼的一些想法,2026年5月

2026年AI領域將繼續快速發展,開源模型在智慧體能力上仍落後於閉源模型,谷歌的Gemini尚未對Claude Code和Codex構成有力競爭,美國開源模型正在崛起,Anthropic與OpenAI競爭激烈,現有權力結構開始介入AI發展。

  • 開源模型在智慧體能力上落後閉源模型約12個月。
  • 谷歌Gemini在智慧體工具方面無明顯競爭優勢。
站內正文

據報道中國要求頂尖AI研究人員出國前需獲批准

中國正在限制阿里巴巴和DeepSeek等私營公司的頂尖AI研究人員出國旅行,他們需要獲得官方批准才能離境。北京擔心資料洩露、技術盜竊和人才挖角,正在加強對國內AI行業的管控。

  • 中國要求頂尖AI研究人員出國前需獲得許可。
  • 該政策適用於阿里巴巴和DeepSeek等私營公司。
站內正文

將DSA注意力引入多模態,快手Keye2.0開啟強化推理新正規化

快手釋出Keye-VL-2.0-30B-A3B多模態大模型,首次將DSA稀疏注意力機制應用於多模態場景,實現256K超長上下文深度感知,並在長影片時序理解、Agent協作等方面取得突破,為影片理解和智慧排程提供新正規化。

  • 首次將DSA引入多模態,突破長影片理解瓶頸
  • 在TimeLens等基準上實現SOTA,長上下文準確率逆勢提升
站內正文

BODHI: 精確的作業系統核心規範推斷

研究人員提出BODHI方法,透過領域知識提示技術大幅提升大型語言模型生成作業系統核心形式化規範的能力。在OSV-Bench基準上,結合Claude Opus 4.6的BODHI方法達到了96.73%的Pass@1,相較於此前最佳結果提升顯著。

  • BODHI是一種領域知識提示方法,透過結構化C到Python轉換指南輔助LLM生成核心規範。
  • 在OSV-Bench的245個規範生成任務上,BODHI將最佳Pass@1從55.10%提升至96.73%。
站內正文

Cited AI Workspace:無需重複上傳檔案

UUMuse 是一個雲端AI知識庫平臺,只需上傳一次檔案,即可在GPT、Claude、DeepSeek、Qwen等多個模型中進行帶有引用的問答、生成內容和部署。支援透過API和MCP供代理和應用呼叫,提供永久記憶、多專家辯論(Spark)、代理模式等功能,並可將知識庫部署為文件網站、小部件、API端點等。

  • 一次上傳,多模型使用:檔案上傳後,GPT、Claude、DeepSeek、Qwen等模型均可基於同一知識庫作答並引用來源。
  • 記憶與代理:AI記住你的偏好和專案上下文,代理模式自動規劃並執行任務,無需重複指令。
站內正文

ContextVault – 適用於ChatGPT、Claude、Gemini的本地優先AI對話記錄器

ContextVault是一款瀏覽器擴充套件,可在所有主要LLM平臺(如ChatGPT、Claude和Gemini)上即時捕獲AI對話,並將其本地儲存在IndexedDB中。支援一鍵匯出為Markdown或ZIP格式,確保您的對話資料不會離開您的裝置。該工具免費、開源,無需賬戶或後端,注重隱私。

  • 即時捕獲來自ChatGPT、Claude、Gemini等7個LLM平臺的AI對話。
  • 所有資料本地儲存在IndexedDB中,無雲端同步或第三方訪問。
站內正文

HTML Deployer:一鍵將AI生成的HTML轉化為線上網站

HTML Deployer是一款Chrome擴充套件,可從ChatGPT、Claude和Gemini中提取AI生成的HTML,並提供預覽、下載ZIP或直接釋出到Netlify、GitHub、FTP或自託管伺服器的功能。適合開發者、創始人、營銷人員、機構和初學者。

  • 支援從ChatGPT、Claude和Gemini提取HTML程式碼塊。
  • 提供預覽、ZIP匯出和直接釋出到雲端儲存、FTP或自託管伺服器。
站內正文

DeepSeek V4還能更省!新工具快取命中率高達99.82%,2折穩定到手

DeepSeek V4系列釋出一個月後,開源社群推出Reasonix工具,專為DeepSeek設計,透過最佳化快取機制將賬單成本降低至原來的五分之一左右。該工具快取命中率高達99.82%,實現4億+token從61美元降至12美元。

  • Reasonix是專為DeepSeek打造的終端編碼工具,核心目標是降低使用成本。
  • 透過快取優先迴圈、工具呼叫修復和自動上下文壓縮等機制,實現長會話快取命中率超90%。
站內正文

更多增長標籤