AI News HubLIVE

即時更新

NVIDIA研究推動機器人技術從模擬走向現實世界

在ICRA上,NVIDIA Research展示了28篇論文中的8篇,重點研究模擬到現實的遷移,使機器人能夠在動態、不可預測的環境中感知、推理、規劃和行動。這些方法涵蓋多臂協調、跨機器人導航、抓取、精確裝配和視覺-語言-動作模型,顯著提高了成功率和可靠性。

  • NVIDIA在ICRA上提交了8篇關於模擬到現實遷移的論文
  • 方法包括ScheduleStream、COMPASS、Grasp-MPC、SPARR等
站內正文

我們如何構建Cloudflare的資料平臺及其之上的AI智慧體

Cloudflare每秒處理超過十億事件,但資料分散在多個系統,難以訪問。為解決這一問題,他們構建了Town Lake統一資料分析平臺和Skipper AI資料智慧體。Town Lake提供單一SQL介面,Skipper允許用自然語言提問並獲得可審計的答案。文章詳細介紹了平臺架構、治理策略(預設關閉許可權)以及AI智慧體的工作原理。

  • Cloudflare構建了Town Lake統一資料平臺和Skipper AI智慧體,解決資料分散問題。
  • Town Lake採用資料湖倉架構,使用Trino查詢引擎、R2儲存和Iceberg表格式。
站內正文

我是iPhone使用者,但Gemini搭配Android Auto在車裡比Siri好用 - 原因在這裡

作為一名iPhone使用者,作者通常在開車時使用Siri和CarPlay,但嘗試了Android Auto上的Gemini後,發現Gemini能處理更多工,包括髮送郵件、獲取餐廳資訊、玩遊戲等,且設定簡單。作者認為Gemini是更一站式的人工智慧助手。

  • 作者是iPhone使用者,但認為Gemini搭配Android Auto在車裡比Siri更好用。
  • Gemini可以處理從基本指令到複雜互動的各種任務,如傳送郵件、獲取本地資訊等。
站內正文

如果AI程式設計的真正關鍵是老套而無聊的做法呢?

文章認為,AI輔助軟體開發的關鍵並非更好的規格說明或工具,而是古老的小批次與快速反饋迴圈實踐。資料顯示,更快的程式碼生成導致設計、測試和審查環節出現瓶頸,反而使交付變慢、釋出更不穩定。真正的槓桿在於縮小批次、縮短反饋週期。

  • AI程式碼生成加速了編寫,但產生了設計、測試、審查等環節的瓶頸。
  • 來自DORA、CircleCI和Faros的資料表明,階段門控流程導致交付更慢、更不穩定。
站內正文

Mistral 將 LeChat 更名為 Vibe,押注聊天機器人的未來是全能工作代理

Mistral AI 將其聊天機器人 Le Chat 更名為 Vibe,並將聊天、程式設計代理和新的工作模式整合在一個品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,獨立處理電子郵件、報告或拉取請求等任務。Pro 套餐價格從 17.99 歐元降至 14.99 歐元,但未明確使用限制。此舉直接對標 OpenAI、Google 和 Anthropic 的代理型產品。

  • Mistral AI 將聊天機器人 Le Chat 更名為 Vibe,整合聊天、程式設計代理和工作模式。
  • 工作模式可連線 Google Workspace、Outlook、Slack 或 GitHub,自主處理任務。
站內正文

我們為何將OpenLoomi AI開源

OpenLoomi AI團隊決定將其AI工作夥伴開源,強調資料所有權、透明度和社群驅動。文章闡述了本地優先、閉源信任稅、基礎設施公共化等理念,並介紹了產品的五大核心功能:自進化記憶系統、多平臺整合、自動化排程、本地加密儲存以及開放技能介面。

  • OpenLoomi採用本地優先架構,使用者資料加密儲存於本地,絕不用於訓練模型。
  • 開源消除了對閉源軟體的信任依賴,程式碼可審計、可分支、可自託管。
站內正文

輝達每年將向臺灣投入1500億美元用於AI基礎設施

黃仁勳宣佈輝達將每年在臺灣投入1500億美元建設AI基礎設施,儘管此前承諾了5000億美元美國投資。這凸顯了臺灣在全球AI晶片製造和封裝生態系統中的核心地位。

  • 輝達每年將在臺灣投入1500億美元用於AI基礎設施。
  • 儘管此前宣佈了5000億美元的美國資料中心投資,但臺灣仍是關鍵製造基地。
站內正文

輝達押注1500億美元在臺灣,特朗普讓美國成為AI中心的計劃適得其反

輝達CEO黃仁勳計劃在臺灣投資1500億美元建設AI基礎設施,儘管特朗普政府試圖透過關稅將晶片製造帶回美國。臺灣拒絕放棄其半導體主導地位,而美國晶片製造能力不足。

  • 輝達宣佈1500億美元臺灣投資,鞏固其AI晶片地位。
  • 特朗普政府考慮對半導體徵收高額關稅以促進國內製造,但美國僅生產約10%所需晶片。
站內正文

2026年值得構建的7個真實世界AI專案(附指南)

本文介紹了七個實用的AI專案,涵蓋求職、研究、投資分析、市場趨勢、發票處理、圖表數字化和個性化鍛鍊,每個專案都附有完整指南和程式碼,幫助讀者自動化工作流程。

  • 學習構建AI求職助手,自動匹配職位與簡歷
  • 掌握多智慧體研究助理開發,生成帶來源的研究報告
站內正文

AI聚合平臺估值達13億美元

該供應商的增長與企業AI中代理的爆炸性出現同步。

  • AI聚合平臺估值達到13億美元。
  • 其增長與企業AI代理的興起密切相關。
站內正文

Show HN:本地編碼代理——利用LLM將工具呼叫委託給小AI模型

Open Agent Tools (oats) 是一個自託管AI模型框架,透過原生代碼提示索引,將大型模型的計算密集型工具呼叫委託給小型開源模型,從而節省令牌消耗。

  • oats 允許本地AI模型使用本地原始碼進行工具呼叫,無需HTTP或MCP。
  • 透過資料探勘超過20,000個GitHub倉庫,建立可重用的提示索引。
站內正文

人工智慧本質上就是反社會的嗎?

本文對比早期網際網路帶來的連線感與當代人工智慧的孤立體驗,指出AI作為一種工具雖有用,卻無法替代真實的人類互動,並質疑AI是否存在真正促進社交的應用場景。

  • 早期網際網路強調“我們”的集體體驗,而AI互動往往是個人的、孤立的。
  • 作者認為AI是出色的工具,但不是人,也無法替代人。
站內正文

研究稱AI不喜歡宗教——尤其是耶和華見證人

一項由宗教大學聯盟進行的研究發現,主要AI模型在回答倫理問題時傾向於世俗理性主義,忽視宗教視角。所有模型對耶和華見證人表現出負面偏見,而對天主教有正面偏見。

  • AI模型在倫理和個人問題上幾乎不引用宗教觀點,存在“遺漏偏見”。
  • 所有測試的AI模型對耶和華見證人均有持續負面偏見。
站內正文

你的AI助手已經忘記了你告訴它的一半內容

本文是AI驅動開發系列文章的第七篇,重點討論AI會話中的上下文管理。作者透過個人經歷(Gemini移動應用忘記之前記錄的筆記)引出上下文壓縮問題,並分享了四種實用技巧:將探索與文件編寫分離、使用交接文件而非延續提示、給AI設定驗收標準而非詳細步驟、以及使用規範文件作為不同AI工具之間的橋樑。這些技巧適用於從程式設計到寫作的各種AI使用場景。

  • AI助手在長對話中會因上下文視窗限制而“忘記”早期資訊,這種現象稱為上下文壓縮。
  • 四種實用技巧:分離探索與文件編寫、使用交接文件、設定驗收標準、使用規範文件作為橋樑。
站內正文

Show HN:我將一個 Python AI 代理和 Vue 儀表盤打包成了一個 Electron 應用

Hermes Desktop 是一個跨平臺的桌面應用,它將 Python 執行時、hermes-agent(自改進 AI 代理)和 hermes-web-ui(Vue 3 + Koa 聊天儀表盤)打包到一個 Electron 應用中,使用者無需單獨安裝 Python 或 Node。應用整合了 DingTalk 並透過 DeepSeek 驅動。

  • 打包了 Python 執行時和 hermes-agent,實現無需依賴即可執行
  • 使用 Electron 作為外殼,整合 hermes-web-ui 前端
站內正文

NBA計劃使用AI系統自動判定界外球

NBA總裁亞當·肖華宣佈,聯盟將引入一套基於AI和攝像頭的自動化系統,用於判定界外球等客觀裁判決策。該系統類似網球中的鷹眼技術,旨在即時確定球權歸屬,減少比賽停頓。肖華表示,裁判仍負責涉及接觸和犯規的判罰。

  • NBA計劃推出AI自動化判罰系統,首先應用於界外球判定。
  • 系統利用場內攝像頭和AI技術,類似網球鷹眼,實現即時球權判定。
站內正文

Midday – 面向自由職業者的開源發票、時間跟蹤、檔案核對、儲存等一體化工具

Midday 是一款開源的全能商務助手,專為自由職業者、承包商和個體創業者設計,集時間跟蹤、發票管理、檔案核對、儲存和財務概覽於一體,並配備 AI 助手。

  • 開源工具,整合多項商務功能,適合自由職業者和個體經營者。
  • 功能包括即時時間跟蹤、即將推出的網頁發票、安全檔案儲存、自動發票匹配和 AI 財務洞察。
站內正文

Money Printer Pro —— 開源 AI 內容生成器

Money Printer Pro 是一個基於 Google Gemini 和 VEO 3.1 的開源 AI 內容生成器,可建立逼真的影像和電影級影片,並保持身份一致性。它擁有 7 個視覺引擎、自動批次生成、AI 質量評分和釋出把關功能,使用者直接向 Google 付費,無需額外訂閱。

  • 支援影像和影片生成,包括多鏡頭影片序列。
  • 身份鎖定引擎確保同一人物在不同生成中面部一致。
站內正文

Meta One:扎克伯格終於為AI支出標價

Meta正在全球範圍內為Instagram、Facebook和WhatsApp推出付費附加功能,同時構建獨立的付費AI服務。這是Meta首次明確將AI支出轉化為收入來源。

  • Meta在全球推出付費附加功能,覆蓋Instagram、Facebook和WhatsApp。
  • 同時開發獨立的付費AI產品,將AI投入貨幣化。
站內正文

Dirk和Linus討論AI與核心開發

一篇LWN.net上的訂閱文章,由Joe Brockmeier撰寫,報道了Dirk和Linus關於AI與核心開發的討論。該內容僅供訂閱者檢視。

  • 文章作者為Joe Brockmeier,釋出於2026年5月25日
  • 文章在OSSNA活動中呈現
站內正文

Superpowers:AI編碼工作流的代理技能框架

Superpowers是一個為AI編碼代理設計的完整軟體開發方法論,基於一組可組合的技能和初始指令。它強調測試驅動開發、設計先行、子代理驅動的迭代,並支援多種編碼助手(如Claude Code、Codex CLI等)。

  • Superpowers提供一套技能庫,包括測試驅動開發、系統除錯、協作規劃等,使AI代理能自主工作數小時。
  • 工作流程從頭腦風暴規範開始,經設計批准後生成實現計劃,再透過子代理逐任務執行並審查。
站內正文

信任模型正在翻轉

隨著AI程式碼審查工具(如Anthropic的Claude Mythos)展現出比人類更強大的安全漏洞發現能力,軟體安全的信任基礎正從人類編寫的程式碼轉向AI審查的程式碼。文章以Mozilla Firefox為例,Mythos在單個評估週期內發現了271個漏洞,遠超人類團隊。這意味著人類在安全審查中的角色需要從“編寫和審查實現”轉向“定義軟體的意圖並驗證實現是否偏離”。

  • 人類編寫程式碼的安全預設正在被打破,AI審查程式碼逐漸獲得信任。
  • Mozilla使用Claude Mythos在Firefox中發現了271個漏洞,凸顯AI的審查能力。
站內正文

Perplexity AI 開源Unigram分詞器,p50延遲比Hugging Face tokenizers crate低5倍

Perplexity AI 開源了用Rust重寫的Unigram分詞器,實現了比Hugging Face tokenizers crate低5倍的p50延遲,並將生產環境CPU利用率降低了5-6倍。最佳化包括雙陣列trie、點陣圖打包和大頁面支援。

  • Perplexity AI 用Rust重寫了Unigram分詞器,p50延遲比Hugging Face tokenizers crate降低5倍。
  • 三項最佳化:雙陣列trie、點陣圖和快取行打包、大頁面支援。
站內正文

這位高管分享在代理式AI時代成為成功創新者的4種方法

美國運通全球創新主管Luke Gebb分享了成為成功創新者的四個關鍵實踐:保持學習、深入技術、接受失敗、建立合作伙伴關係。他還介紹了公司在代理式商務領域的佈局,包括支付、優惠和專有體驗,並預測代理式AI將在未來幾年加速發展。

  • 保持好奇心和學習慾望,培養成長型思維
  • 深入理解新興技術並與工程師緊密合作
站內正文

亞馬遜打造自有AI製作平臺,為Prime Video批准三部AI動畫系列

亞馬遜米高梅影業與AWS聯合推出“GenAI創作者基金”,為電影製作人提供資金及內部AI平臺“Project Nara”的訪問許可權。三部動畫系列已投入製作,團隊僅用五週完成試播集。亞馬遜宣稱擁有“行業內唯一端到端AI內容生態系統”。

  • 亞馬遜設立GenAI創作者基金,支援AI內容創作
  • 內部AI平臺Project Nara用於動畫製作
站內正文

Mistral CEO稱公司探索自研晶片

Mistral AI執行長Arthur Mensch證實,公司正在探索開發定製晶片以降低基礎設施成本,與OpenAI和Anthropic競爭。這家法國初創公司還宣佈在法國新建推理資料中心,並推出企業智慧代理平臺Vibe。

  • Mistral AI考慮自研定製晶片以降低部署成本。
  • 公司在法國新建專用推理資料中心。
站內正文

這是可持續的嗎?AI三年後的高階工程師角色

一位高階工程師反思AI在三年內如何改變了高階工程師角色:原型製作加速,協調負擔增加,範圍擴大但擠佔了輔導和思考時間。角色變得更有影響力但可持續性降低。

  • AI縮小了從想法到演示的差距,從提案轉向概念驗證。
  • 角色在編碼和戰略寫作兩方面擴充套件,削減了輔導和深度思考。
站內正文

YouTube 將讓你透過AI建立自定義影片推送

YouTube推出新的AI功能,允許使用者透過描述性提示生成個性化影片推送,並可以固定在主頁頂部。該功能目前在美國以英語支援的形式向YouTube移動應用和桌面端使用者推出。

  • 使用者可透過輸入描述性提示(如“幫我放鬆,引導冥想不超過10分鐘”)來建立自定義影片推送。
  • 該功能類似Spotify的提示播放列表和Instagram的Reels演算法控制,但使用自由文本提示而非主題列表。
站內正文

Taste Skill:面向AI代理的反模板前端框架

Taste Skill 是一個開源前端框架,旨在提升AI生成介面的設計質量,避免產生千篇一律的模板化外觀。它提供多種可組合的技能模組,包括設計調優、程式碼生成和影像生成,支援透過 npx 命令列或直接複製 SKILL.md 檔案整合到專案中。

  • Taste Skill 透過可調節的設計引數(佈局、動畫、密度)讓AI生成的介面更具設計感
  • 提供多種專用技能模組,如設計調優、程式碼生成、影像生成等
站內正文