AI News HubLIVE

即時更新

識別和理解文本中的人類價值:一種可定製的基於LLM的架構

本文介紹了一種基於大型語言模型(LLM)的架構,用於檢測和量化文本中人類價值的強度。該架構包含三個協調模塊,可適應多種價值理論,並在ValueEval數據集上表現出良好的檢測性能。

  • 提出了一種模塊化的LLM架構,用於從文本中識別人類價值,避免了對特定價值理論或複雜提示工程的依賴。
  • 架構包括三個模塊:生成結構化價值規範、標註文本、基於修辭和語義證據分配支持或反對等級。
站內正文

兩大支柱:AI後軟件工作的概念框架

一篇論文認為,隨着生成式AI消除了人類編寫正確代碼的能力這一約束,軟件工作圍繞兩大支柱重組:混音模式(人類像音響工程師一樣連續操作多個判斷軸)和元軟件(觀察、驗證、上下文化和治理其他軟件的軟件)。這兩個支柱不可分割,借鑑了從手工藝到統計控制的批量生產的歷史轉型。

  • 由於生成式AI,代碼生產不再是軟件組織中的主導問題。
  • 混音模式描述了從業者持續操作多個判斷軸的新人類角色。
站內正文

你未來的工作將是讓AI保持專注

諾亞·史密斯認為,隨着AI能力增強,人類將從技術工作轉向確保AI對齊——使AI專注於人類目標。他將其與《上班一條蟲》類比,並警告AI生成內容“污泥”正在泛濫。

  • 人類需要維護AI對齊,確保AI不偏離任務。
  • 作者將未來人類角色比作《上班一條蟲》中的“朗伯”經理。
站內正文

Safescript – 面向人工智能時代的編程語言

Safescript 是一種為 AI 代理設計的編程語言,通過靜態分析在運行前證明所有安全屬性,無需沙箱或虛擬機,徹底消除供應鏈攻擊。它編譯成有向無環圖(DAG),可追蹤數據流和宿主機調用,性能開銷為零,啓動時間為零。

  • Safescript 通過靜態分析確保代碼安全,無需運行時沙箱。
  • 編譯器生成靜態 DAG,可追蹤所有數據流和宿主機調用。
站內正文

AIPass – 具有身份、記憶和電子郵件的持久化智能體工作空間

AIPass 是一個基於命令行的開源框架,為 AI 智能體提供持久性記憶、身份標識和協作能力。智能體共享文件系統,通過 JSON 文件存儲記憶,無需雲服務或額外 API 密鑰。項目包含 13 個核心智能體,支持多智能體協作、任務調度、質量審計和實時監控。

  • AIPass 是一個 CLI 原生的智能體框架,為 AI 智能體添加持久性記憶、身份和協調能力。
  • 所有智能體共享本地文件系統,使用 JSON 文件存儲記憶,無需雲端依賴。
站內正文

伊利諾伊州議員通過了美國最強人工智能安全法案

伊利諾伊州參議院第315號法案(SB 315)要求人工智能實驗室聘請獨立審計師驗證其安全承諾,該法案現已提交州長JB·普利茲克簽署。普利茲克表示計劃簽署,稱需要讓大型科技公司負責。此舉在聯邦層面缺乏AI監管的背景下,凸顯了州級立法的重要性。

  • SB 315 要求獨立審計師核查AI實驗室是否遵守自身安全標準。
  • 該法案是美國最嚴格的AI安全法規,超越了加州和紐約的相關法律。
站內正文

AI作弊 [PDF]

這是一份關於AI作弊的PDF報告,但無法直接解析內容。

  • 無法從PDF中提取文本
  • 報告可能來自METR組織
站內正文

Sakana AI 提出 DiffusionBlocks:一種將殘差網絡轉換為可獨立訓練去噪模塊的塊狀訓練框架

來自Sakana AI和東京大學的研究人員提出了DiffusionBlocks,這是一種塊狀訓練框架,可將Transformer網絡劃分為獨立訓練的塊,從而將訓練內存減少B倍(B為塊數),同時在不同架構上保持性能。該方法通過將殘差連接解釋為擴散模型中的歐拉步驟,利用分數匹配目標實現塊級獨立訓練。

  • DiffusionBlocks通過將網絡劃分為B個獨立訓練的塊,將訓練內存減少B倍,適用於多種架構。
  • 核心創新在於將殘差連接視為反向擴散過程的歐拉離散化步驟,從而為每個塊提供原則性的局部訓練目標。
站內正文

我用這個免費應用深入挖掘Oura Ring數據——發現如下

Simple Wearable Report利用AI從Oura Ring數據中提取更多見解。本文介紹了作者如何使用它,以及它如何與Gemini等AI工具配合提供詳細分析。

  • Simple Wearable Report能將Oura數據轉化為實驗室風格報告,便於醫生查看或上傳至AI聊天機器人。
  • 與Oura內置AI顧問相比,Gemini等工具提供更具體、量化的數據分析。
站內正文

Robinhood將允許AI代理交易——這可能成為一種趨勢

股票交易應用Robinhood在高度監管的行業中率先允許AI代理進行交易,此舉可能推動其他金融公司效仿。

  • Robinhood將允許AI代理在其平台上進行交易
  • 此舉在高度監管的金融行業中是重大突破
站內正文

授權悖論:誰掌控着你的AI鑰匙?[視頻]

本文探討了AI系統中的授權悖論問題,即誰真正擁有對AI系統的控制權。文章以視頻形式呈現,討論了相關的安全和隱私問題。

  • AI系統中的授權問題日益突出
  • 誰擁有AI的'鑰匙'是關鍵
站內正文

蘋果在CVPR 2026展示最新研究成果

蘋果將在2026年6月3日至7日于丹佛舉行的CVPR大會上贊助並展示多項研究,包括視頻生成、多模態理解、圖像壓縮等領域,並在展位進行海報演示。

  • 蘋果將在CVPR 2026展示STARFlow-V、AToken、Velox等多項創新研究。
  • 活動包括主題演講、邀請演講、海報展示及展位演示。
站內正文

OpenAI的前沿治理框架

探索OpenAI的前沿治理框架,瞭解我們的人工智能安全、安保和風險實踐如何與新興的歐盟和加利福尼亞法規保持一致。

  • OpenAI發佈了前沿治理框架,旨在確保AI安全、安保和風險管理。
  • 該框架與歐盟和加利福尼亞即將出台的法規保持對齊。
站內正文

Show HN: Liiists —— 一款基於Markdown、支持iOS和命令行的列表應用

Liiists 是一款基於Markdown的列表應用,可在終端、iOS設備和AI代理上通過MCP服務器使用,所有操作都基於相同的純文本.md文件。它提供了命令行工具、原生iOS應用(支持分享擴展和Siri)以及用於AI集成的MCP服務器。無需賬户、無鎖定,支持iCloud同步或指向任何文件夾(包括Obsidian vault)。

  • 在終端、iOS設備和AI代理上使用相同的Markdown文件
  • 用Go編寫的CLI,無依賴
站內正文

SQLite 的 AGENTS.md

SQLite 新增了 AGENTS.md 文件,明確了其對 AI 生成貢獻的政策:不接受未經事先同意的拉取請求,不接受代理生成的代碼,但歡迎附帶可重現測試用例的 bug 報告。由於 AI 生成的 bug 報告氾濫,論壇現已拆分出專門的 bug 論壇。

  • SQLite 添加 AGENTS.md 以定義 AI 貢獻政策
  • 拉取請求需要事先同意和法律文件
站內正文

構建無障礙技術的未來:走進 Uvilox AI

Uvilox AI 通過下一代視覺 AI 技術,提供實時手語翻譯、緊急響應和無障礙通話,延遲低於 80 毫秒,準確率高達 97.4%,支持 200 多種手語變體,並具備軍事級安全保護和 HIPAA/GDPR 合規架構。目前正開放 Beta 測試,早期會員可免費永久使用。

  • 實時手語識別與翻譯,延遲低於 80 毫秒,準確率 97.4%。
  • 支持 200 多種 ASL 和 BSL 手語變體,低光照和雜亂背景下穩定工作。
站內正文

NeuralAgent 2.5:個人AI助手,語音控制與並行代理驚豔登場

NeuralAgent 2.5 帶來了語音模式、觀察學習與並行代理三大功能,讓AI助手能聽、能看、能同時處理多項任務。用户可通過自然語言指揮它操作整個電腦,無需鍵盤鼠標。新版還優化了工作流、@提及和記憶系統。

  • NeuralAgent 2.5 新增語音模式,用户説話即可讓AI執行操作並語音回覆。
  • 觀察學習功能允許用户演示一次任務,AI即可保存為工作流自動重複。
站內正文

在生產環境中修復代理故障:Interrupt 2026 回顧 | LangChain 新聞通訊

LangChain 在 Interrupt 2026 大會上發佈了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。

  • LangSmith Engine 自動分析生產軌跡、聚類故障並推薦修復方案。
  • LangSmith Sandboxes 正式發佈,提供安全的代理代碼執行環境。
站內正文

大規模可靠LLM推理

Databricks構建了獨特的推理平台,為眾多前沿模型提供推理服務,每月處理超過120萬億個令牌。通過引入“模型單元”抽象,實現了成本感知的負載均衡和自動縮放,相比靜態配置節省了80%以上的GPU成本。運行時可靠性機制包括黑盒健康檢查,可自動檢測和恢復靜默故障。此外,通過分析多模態瓶頸,吞吐量提升了3倍。

  • Databricks推理平台為多種前沿模型提供服務,每月處理120T令牌。
  • 引入“模型單元”抽象,實現跨工作負載的容量管理和成本感知負載均衡。
站內正文

BI接入要點:優化性能與總擁有成本

您的BI儀表盤速度緩慢,調優消耗大量時間和金錢。本文從物理佈局到治理語義層,逐步介紹Databricks的BI接入棧,提供改善查詢性能和降低總擁有成本的實用指導。

  • 星型模式與託管表構成BI性能的基礎。
  • 液簇與預測優化自動進行數據優化。
站內正文

Snowflake承諾向AWS投入60億美元,深入AI領域

Snowflake與AWS簽署五年60億美元合作協議,使用AWS Graviton和GPU實例進行AI訓練和推理,並擴展至10個新區域。此舉表明Snowflake在AI時代的雄心,同時通過Cortex AI產品套件推動企業AI應用。

  • Snowflake承諾五年內向AWS投資60億美元,用於Graviton計算和AI基礎設施。
  • 合作涵蓋AWS的ARM Graviton處理器和GPU加速EC2實例,用於AI模型訓練和推理。
站內正文

使用Amazon Bedrock AgentCore構建企業支持AI代理

AWS生成式AI創新中心與Works Human Intelligence合作,利用Amazon Bedrock AgentCore構建了兩個AI代理,分別用於通勤津貼審批和瀏覽器操作,實現了高達97%的成本降低並提升了運營效率。

  • AI代理自動化HR例行任務,如通勤津貼審批和瀏覽器操作。
  • 通過遷移至AgentCore和Strand Agents架構,成本降低97%。
站內正文

從數據過載到可操作洞察:Verizon Connect如何將智能代理AI擴展至10萬用户

Verizon Connect利用AWS構建智能代理AI解決方案,每天將超過5000萬數據點轉化為10萬用户的可操作洞察。本文詳細介紹了其架構決策、實施挑戰和可衡量的成果,包括使用無服務器統計模型進行異常檢測、採用Strands Agents實現動態推理、以及通過Amazon Nova Lite將輸入令牌成本降低70%。

  • Verizon Connect通過智能代理AI處理每日5億數據點,為10萬用户提供洞察。
  • 採用無服務器統計模型進行異常檢測,避免LLM處理原始表格數據的侷限性。
站內正文

AWS SMGS如何利用基於Amazon Bedrock AgentCore的AI對話助手轉變業務管理

AWS SMGS使用NarrateAI(基於Amazon Bedrock AgentCore構建的智能對話解決方案)實現大規模商業智能。該方案採用雙層架構:批量敍事生成和實時交互,通過專用AI代理進行路由和驗證,支持自然語言查詢、行級安全及個性化角色體驗,顯著提升決策效率。

  • NarrateAI通過雙層架構(批量處理+實時交互)解決傳統BI的延遲和數據碎片化問題。
  • 使用Amazon Bedrock AgentCore實現多代理編排,支持自然語言查詢和上下文感知響應。
站內正文

微軟MAI-Image-2.5在基準測試中與谷歌Nano Banana 2持平

微軟的MAI-Image-2.5模型在Arena文本到圖像排行榜上位列第三,與谷歌的Nano Banana 2性能相當,但仍落後於OpenAI的Image-2。該模型在圖像內文本渲染和商業視覺內容方面有明顯改進。

  • MAI-Image-2.5在Arena排行榜上排名第三,與谷歌Nano Banana 2持平
  • 模型在文本渲染和商業視覺內容方面有顯著提升
站內正文

AI編程助手Devin開發商Cognition估值九個月內翻倍至260億美元

Cognition公司為其AI軟件開發工具Devin融資超10億美元,估值達260億美元,顯示了投資者對AI編程工具的熱情,儘管其實際價值仍存爭議。

  • Cognition融資超10億美元,估值九個月內翻倍至260億美元。
  • 投資者對AI編程代理興趣濃厚。
站內正文

這款無AI的谷歌替代品人氣飆升 - 快來親自體驗

DuckDuckGo作為一款無AI的搜索替代品,因谷歌AI概覽的興起而用户激增。本文介紹瞭如何無AI地使用DuckDuckGo進行私密搜索和瀏覽。

  • DuckDuckGo在谷歌I/O 2026後安裝量激增,iOS應用增幅最高達69.9%。
  • DuckDuckGo提供無AI搜索和AI聊天選項,用户可自由選擇。
站內正文

利用 Amazon Bedrock AgentCore 賦能代理型 AI 銷售策略

AWS 銷售團隊使用 Amazon Bedrock AgentCore 構建了 Field Advisor,以編排超過 20 個領域特定代理,減輕銷售代表認知負擔並提高效率。該解決方案每週為每位代表節省最多 2 小時,並將延遲降低 41%。

  • Field Advisor 通過單一對話界面編排 20 多個專業代理。
  • 人工參與的工作流確保數據準確性和問責制。
站內正文

Robinhood 允許 AI 代理為客户交易股票和使用信用卡購買

Robinhood 通過 MCP 讓客户連接 Anthropic 的 Claude 等 AI 代理,這些代理可以自主交易股票。美國券商監管機構 FINRA 已將其視為新的風險領域,警告不可控的決策。Robinhood 也承認該產品並非適合所有人。

  • Robinhood 推出功能,客户可通過 MCP 連接 AI 代理(如 Claude)進行股票交易和使用信用卡購買。
  • AI 代理可以自主決策,無需客户逐一確認。
站內正文

“Tokenmaxxing 是真實的、昂貴的,而且正在蔓延”:新工具遏制AI預算爆炸

Tokenmaxxing(無節制使用AI token)導致企業預算失控。以Uber為例,其CTO稱AI預算已超支。新興公司Lanai推出Token Tuner工具,通過將token消耗映射到具體工作流程和業務成果,幫助企業優化模型選擇、降低浪費,推動從“tokenmaxxing”向“outcomemaxxing”轉變。

  • Tokenmaxxing使企業AI預算爆炸,Uber等公司已出現嚴重超支。
  • Lanai推出Token Tuner,通過追蹤token與工作流程、成果的關聯,提供效率評分和模型推薦。
站內正文