AI News HubLIVE

即時更新

識別和理解文本中的人類價值:一種可定製的基於LLM的架構

本文介紹了一種基於大型語言模型(LLM)的架構,用於檢測和量化文本中人類價值的強度。該架構包含三個協調模組,可適應多種價值理論,並在ValueEval資料集上表現出良好的檢測效能。

  • 提出了一種模組化的LLM架構,用於從文本中識別人類價值,避免了對特定價值理論或複雜提示工程的依賴。
  • 架構包括三個模組:生成結構化價值規範、標註文本、基於修辭和語義證據分配支援或反對等級。
站內正文

兩大支柱:AI後軟體工作的概念框架

一篇論文認為,隨著生成式AI消除了人類編寫正確程式碼的能力這一約束,軟體工作圍繞兩大支柱重組:混音模式(人類像音響工程師一樣連續操作多個判斷軸)和元軟體(觀察、驗證、上下文化和治理其他軟體的軟體)。這兩個支柱不可分割,借鑑了從手工藝到統計控制的批次生產的歷史轉型。

  • 由於生成式AI,程式碼生產不再是軟體組織中的主導問題。
  • 混音模式描述了從業者持續操作多個判斷軸的新人類角色。
站內正文

你未來的工作將是讓AI保持專注

諾亞·史密斯認為,隨著AI能力增強,人類將從技術工作轉向確保AI對齊——使AI專注於人類目標。他將其與《上班一條蟲》類比,並警告AI生成內容“汙泥”正在泛濫。

  • 人類需要維護AI對齊,確保AI不偏離任務。
  • 作者將未來人類角色比作《上班一條蟲》中的“朗伯”經理。
站內正文

Safescript – 面向人工智慧時代的程式語言

Safescript 是一種為 AI 代理設計的程式語言,透過靜態分析在執行前證明所有安全屬性,無需沙箱或虛擬機器,徹底消除供應鏈攻擊。它編譯成有向無環圖(DAG),可追蹤資料流和宿主機呼叫,效能開銷為零,啟動時間為零。

  • Safescript 透過靜態分析確保程式碼安全,無需執行時沙箱。
  • 編譯器生成靜態 DAG,可追蹤所有資料流和宿主機呼叫。
站內正文

AIPass – 具有身份、記憶和電子郵件的持久化智慧體工作空間

AIPass 是一個基於命令列的開源框架,為 AI 智慧體提供永續性記憶、身份標識和協作能力。智慧體共享檔案系統,透過 JSON 檔案儲存記憶,無需雲服務或額外 API 金鑰。專案包含 13 個核心智慧體,支援多智慧體協作、任務排程、質量審計和即時監控。

  • AIPass 是一個 CLI 原生的智慧體框架,為 AI 智慧體新增永續性記憶、身份和協調能力。
  • 所有智慧體共享本地檔案系統,使用 JSON 檔案儲存記憶,無需雲端依賴。
站內正文

伊利諾伊州議員透過了美國最強人工智慧安全法案

伊利諾伊州參議院第315號法案(SB 315)要求人工智慧實驗室聘請獨立審計師驗證其安全承諾,該法案現已提交州長JB·普利茲克簽署。普利茲克表示計劃簽署,稱需要讓大型科技公司負責。此舉在聯邦層面缺乏AI監管的背景下,凸顯了州級立法的重要性。

  • SB 315 要求獨立審計師核查AI實驗室是否遵守自身安全標準。
  • 該法案是美國最嚴格的AI安全法規,超越了加州和紐約的相關法律。
站內正文

AI作弊 [PDF]

這是一份關於AI作弊的PDF報告,但無法直接解析內容。

  • 無法從PDF中提取文本
  • 報告可能來自METR組織
站內正文

Sakana AI 提出 DiffusionBlocks:一種將殘差網路轉換為可獨立訓練去噪模組的塊狀訓練框架

來自Sakana AI和東京大學的研究人員提出了DiffusionBlocks,這是一種塊狀訓練框架,可將Transformer網路劃分為獨立訓練的塊,從而將訓練記憶體減少B倍(B為塊數),同時在不同架構上保持效能。該方法透過將殘差連線解釋為擴散模型中的尤拉步驟,利用分數匹配目標實現塊級獨立訓練。

  • DiffusionBlocks透過將網路劃分為B個獨立訓練的塊,將訓練記憶體減少B倍,適用於多種架構。
  • 核心創新在於將殘差連線視為反向擴散過程的尤拉離散化步驟,從而為每個塊提供原則性的區域性訓練目標。
站內正文

我用這個免費應用深入挖掘Oura Ring資料——發現如下

Simple Wearable Report利用AI從Oura Ring資料中提取更多見解。本文介紹了作者如何使用它,以及它如何與Gemini等AI工具配合提供詳細分析。

  • Simple Wearable Report能將Oura資料轉化為實驗室風格報告,便於醫生檢視或上傳至AI聊天機器人。
  • 與Oura內建AI顧問相比,Gemini等工具提供更具體、量化的資料分析。
站內正文

Robinhood將允許AI代理交易——這可能成為一種趨勢

股票交易應用Robinhood在高度監管的行業中率先允許AI代理進行交易,此舉可能推動其他金融公司效仿。

  • Robinhood將允許AI代理在其平臺上進行交易
  • 此舉在高度監管的金融行業中是重大突破
站內正文

授權悖論:誰掌控著你的AI鑰匙?[影片]

本文探討了AI系統中的授權悖論問題,即誰真正擁有對AI系統的控制權。文章以影片形式呈現,討論了相關的安全和隱私問題。

  • AI系統中的授權問題日益突出
  • 誰擁有AI的'鑰匙'是關鍵
站內正文

蘋果在CVPR 2026展示最新研究成果

蘋果將在2026年6月3日至7日于丹佛舉行的CVPR大會上贊助並展示多項研究,包括影片生成、多模態理解、影像壓縮等領域,並在展位進行海報演示。

  • 蘋果將在CVPR 2026展示STARFlow-V、AToken、Velox等多項創新研究。
  • 活動包括主題演講、邀請演講、海報展示及展位演示。
站內正文

OpenAI的前沿治理框架

探索OpenAI的前沿治理框架,瞭解我們的人工智慧安全、安保和風險實踐如何與新興的歐盟和加利福尼亞法規保持一致。

  • OpenAI釋出了前沿治理框架,旨在確保AI安全、安保和風險管理。
  • 該框架與歐盟和加利福尼亞即將出臺的法規保持對齊。
站內正文

Show HN: Liiists —— 一款基於Markdown、支援iOS和命令列的列表應用

Liiists 是一款基於Markdown的列表應用,可在終端、iOS裝置和AI代理上透過MCP伺服器使用,所有操作都基於相同的純文本.md檔案。它提供了命令列工具、原生iOS應用(支援分享擴充套件和Siri)以及用於AI整合的MCP伺服器。無需賬戶、無鎖定,支援iCloud同步或指向任何資料夾(包括Obsidian vault)。

  • 在終端、iOS裝置和AI代理上使用相同的Markdown檔案
  • 用Go編寫的CLI,無依賴
站內正文

SQLite 的 AGENTS.md

SQLite 新增了 AGENTS.md 檔案,明確了其對 AI 生成貢獻的政策:不接受未經事先同意的拉取請求,不接受代理生成的程式碼,但歡迎附帶可重現測試用例的 bug 報告。由於 AI 生成的 bug 報告氾濫,論壇現已拆分出專門的 bug 論壇。

  • SQLite 新增 AGENTS.md 以定義 AI 貢獻政策
  • 拉取請求需要事先同意和法律檔案
站內正文

構建無障礙技術的未來:走進 Uvilox AI

Uvilox AI 透過下一代視覺 AI 技術,提供即時手語翻譯、緊急響應和無障礙通話,延遲低於 80 毫秒,準確率高達 97.4%,支援 200 多種手語變體,並具備軍事級安全保護和 HIPAA/GDPR 合規架構。目前正開放 Beta 測試,早期會員可免費永久使用。

  • 即時手語識別與翻譯,延遲低於 80 毫秒,準確率 97.4%。
  • 支援 200 多種 ASL 和 BSL 手語變體,低光照和雜亂背景下穩定工作。
站內正文

NeuralAgent 2.5:個人AI助手,語音控制與並行代理驚豔登場

NeuralAgent 2.5 帶來了語音模式、觀察學習與並行代理三大功能,讓AI助手能聽、能看、能同時處理多項任務。使用者可透過自然語言指揮它操作整個電腦,無需鍵盤滑鼠。新版還最佳化了工作流、@提及和記憶系統。

  • NeuralAgent 2.5 新增語音模式,使用者說話即可讓AI執行操作並語音回覆。
  • 觀察學習功能允許使用者演示一次任務,AI即可儲存為工作流自動重複。
站內正文

在生產環境中修復代理故障:Interrupt 2026 回顧 | LangChain 新聞通訊

LangChain 在 Interrupt 2026 大會上釋出了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。

  • LangSmith Engine 自動分析生產軌跡、聚類故障並推薦修復方案。
  • LangSmith Sandboxes 正式釋出,提供安全的代理程式碼執行環境。
站內正文

大規模可靠LLM推理

Databricks構建了獨特的推理平臺,為眾多前沿模型提供推理服務,每月處理超過120萬億個令牌。透過引入“模型單元”抽象,實現了成本感知的負載均衡和自動縮放,相比靜態配置節省了80%以上的GPU成本。執行時可靠性機制包括黑盒健康檢查,可自動檢測和恢復靜默故障。此外,透過分析多模態瓶頸,吞吐量提升了3倍。

  • Databricks推理平臺為多種前沿模型提供服務,每月處理120T令牌。
  • 引入“模型單元”抽象,實現跨工作負載的容量管理和成本感知負載均衡。
站內正文

BI接入要點:最佳化效能與總擁有成本

您的BI儀表盤速度緩慢,調優消耗大量時間和金錢。本文從物理佈局到治理語義層,逐步介紹Databricks的BI接入棧,提供改善查詢效能和降低總擁有成本的實用指導。

  • 星型模式與託管表構成BI效能的基礎。
  • 液簇與預測最佳化自動進行資料最佳化。
站內正文

Snowflake承諾向AWS投入60億美元,深入AI領域

Snowflake與AWS簽署五年60億美元合作協議,使用AWS Graviton和GPU例項進行AI訓練和推理,並擴充套件至10個新區域。此舉表明Snowflake在AI時代的雄心,同時透過Cortex AI產品套件推動企業AI應用。

  • Snowflake承諾五年內向AWS投資60億美元,用於Graviton計算和AI基礎設施。
  • 合作涵蓋AWS的ARM Graviton處理器和GPU加速EC2例項,用於AI模型訓練和推理。
站內正文

使用Amazon Bedrock AgentCore構建企業支援AI代理

AWS生成式AI創新中心與Works Human Intelligence合作,利用Amazon Bedrock AgentCore構建了兩個AI代理,分別用於通勤津貼審批和瀏覽器操作,實現了高達97%的成本降低並提升了運營效率。

  • AI代理自動化HR例行任務,如通勤津貼審批和瀏覽器操作。
  • 透過遷移至AgentCore和Strand Agents架構,成本降低97%。
站內正文

從資料過載到可操作洞察:Verizon Connect如何將智慧代理AI擴充套件至10萬使用者

Verizon Connect利用AWS構建智慧代理AI解決方案,每天將超過5000萬資料點轉化為10萬使用者的可操作洞察。本文詳細介紹了其架構決策、實施挑戰和可衡量的成果,包括使用無伺服器統計模型進行異常檢測、採用Strands Agents實現動態推理、以及透過Amazon Nova Lite將輸入令牌成本降低70%。

  • Verizon Connect透過智慧代理AI處理每日5億資料點,為10萬使用者提供洞察。
  • 採用無伺服器統計模型進行異常檢測,避免LLM處理原始表格資料的侷限性。
站內正文

AWS SMGS如何利用基於Amazon Bedrock AgentCore的AI對話助手轉變業務管理

AWS SMGS使用NarrateAI(基於Amazon Bedrock AgentCore構建的智慧對話解決方案)實現大規模商業智慧。該方案採用雙層架構:批次敘事生成和即時互動,透過專用AI代理進行路由和驗證,支援自然語言查詢、行級安全及個性化角色體驗,顯著提升決策效率。

  • NarrateAI透過雙層架構(批次處理+即時互動)解決傳統BI的延遲和資料碎片化問題。
  • 使用Amazon Bedrock AgentCore實現多代理編排,支援自然語言查詢和上下文感知響應。
站內正文

微軟MAI-Image-2.5在基準測試中與谷歌Nano Banana 2持平

微軟的MAI-Image-2.5模型在Arena文本到影像排行榜上位列第三,與谷歌的Nano Banana 2效能相當,但仍落後於OpenAI的Image-2。該模型在影像內文本渲染和商業視覺內容方面有明顯改進。

  • MAI-Image-2.5在Arena排行榜上排名第三,與谷歌Nano Banana 2持平
  • 模型在文本渲染和商業視覺內容方面有顯著提升
站內正文

這款無AI的谷歌替代品人氣飆升 - 快來親自體驗

DuckDuckGo作為一款無AI的搜尋替代品,因谷歌AI概覽的興起而使用者激增。本文介紹瞭如何無AI地使用DuckDuckGo進行私密搜尋和瀏覽。

  • DuckDuckGo在谷歌I/O 2026後安裝量激增,iOS應用增幅最高達69.9%。
  • DuckDuckGo提供無AI搜尋和AI聊天選項,使用者可自由選擇。
站內正文

利用 Amazon Bedrock AgentCore 賦能代理型 AI 銷售策略

AWS 銷售團隊使用 Amazon Bedrock AgentCore 構建了 Field Advisor,以編排超過 20 個領域特定代理,減輕銷售代表認知負擔並提高效率。該解決方案每週為每位代表節省最多 2 小時,並將延遲降低 41%。

  • Field Advisor 透過單一對話介面編排 20 多個專業代理。
  • 人工參與的工作流確保資料準確性和問責制。
站內正文

Robinhood 允許 AI 代理為客戶交易股票和使用信用卡購買

Robinhood 透過 MCP 讓客戶連線 Anthropic 的 Claude 等 AI 代理,這些代理可以自主交易股票。美國券商監管機構 FINRA 已將其視為新的風險領域,警告不可控的決策。Robinhood 也承認該產品並非適合所有人。

  • Robinhood 推出功能,客戶可透過 MCP 連線 AI 代理(如 Claude)進行股票交易和使用信用卡購買。
  • AI 代理可以自主決策,無需客戶逐一確認。
站內正文

“Tokenmaxxing 是真實的、昂貴的,而且正在蔓延”:新工具遏制AI預算爆炸

Tokenmaxxing(無節制使用AI token)導致企業預算失控。以Uber為例,其CTO稱AI預算已超支。新興公司Lanai推出Token Tuner工具,透過將token消耗對映到具體工作流程和業務成果,幫助企業最佳化模型選擇、降低浪費,推動從“tokenmaxxing”向“outcomemaxxing”轉變。

  • Tokenmaxxing使企業AI預算爆炸,Uber等公司已出現嚴重超支。
  • Lanai推出Token Tuner,透過追蹤token與工作流程、成果的關聯,提供效率評分和模型推薦。
站內正文