AI News HubLIVE

今日必讀

Agent

停止手動調優核心:Neuron Agentic Development如何加速AWS Trainium最佳化

AWS推出Neuron Agentic Development功能,透過AI代理和技能集,使開發者無需深厚硬體知識即可為Trainium和Inferentia編寫、除錯和最佳化自定義核心,大幅縮短開發週期。

  • Neuron Agentic Development提供五個專業核心開發技能:編寫、除錯、分析、文件查詢,以及統一的代理。
  • 開發者可透過自然語言或PyTorch/NumPy程式碼生成最佳化核心,並在實際硬體上自動除錯和效能分析。
站內正文

Ramp押注:現場部署工程師能完成現成金融AI無法做到的事

Ramp推出Applied AI Solutions,派遣工程師進駐企業財務團隊,構建和部署AI代理,以處理應付賬款、採購和月結等工作。此舉旨在彌合AI雄心與實際成果之間的鴻溝,因為儘管AI投入激增,但多數財務主管尚未看到明確回報。該服務強調人工監督和治理,確保安全。

  • Ramp推出Applied AI Solutions,派遣工程師與企業財務團隊合作,定製AI代理。
  • AI支出增長13倍,但僅21%的使用者獲得明確的可衡量價值。
站內正文

Patchrooms

Patchrooms 是一款輕量級反饋層工具,可插入 AI 構建的應用預覽中,讓審查者指向元素並留下文本、截圖或語音反饋,自動捕獲上下文並生成代理可直接使用的補丁上下文,加速從反饋到修復的迴圈。

  • 透過一個指令碼嵌入預覽,支援指向元素反饋,自動捕獲 URL、視口、瀏覽器、控制台錯誤、元素上下文等。
  • 輸出為 Markdown 或 MCP 報告,可直接用於 Claude Code、Cursor 等編碼代理。
站內正文

CrustRecruiter

CrustRecruiter 是一套基於 MCP 的 Claude 技能外掛,結合 Claude 的推理能力和 Crustdata 的 8 億+候選人資料庫,自動完成人才搜尋、市場定位、聯絡方式驗證、偏好記憶以及外聯和 ATS 同步等繁瑣工作,實現真正個性化的規模化招聘。

  • CrustRecruiter 透過 MCP 將 Claude 變成招聘助手,融合推理與自動化。
  • 訪問 8 億+候選人資料,即時追蹤職業變動。
站內正文

產品經理手冊:如何成功將AI功能部署到生產環境

本文旨在解決AI功能從演示到生產環境中的常見困難,提供實用指南,包括延遲預算、回退設計、質量評估、A/B測試、模型漂移監控、評估框架、優雅降級和提示工程等關鍵環節。

  • 制定基於互動型別的延遲預算,區分同步、漸進和非同步互動。
  • 設計分層回退機制,確保使用者不會遇到未處理的AI故障。
站內正文
模型

引用傑里米·霍華德

傑里米·霍華德提出減緩遞迴AI自我改進的簡單方案:頂級AI實驗室不得使用其最強模型進行前沿AI研究,但其他所有人應可訪問該模型。他認為這樣做可以防止前沿進展和權力失衡,並批評Anthropic採取了相反的做法。

  • 傑里米·霍華德提出減緩遞迴AI自我改進的簡單方案:頂級實驗室不得使用其最強模型進行前沿AI研究,但其他人可以訪問。
  • 他批評Anthropic允許自身使用頂級模型進行前沿研究,並試圖破壞其他組織的努力。
站內正文

使用Amazon Bedrock AgentCore構建AI驅動的裝置維修助手

本教程介紹如何使用Amazon Bedrock AgentCore構建AI驅動的裝置維修助手,幫助農民和現場技術人員透過自然語言診斷裝置問題、識別所需零件並獲取製造商批准的維修流程。解決方案採用AgentCore Runtime與Strands Agents SDK、Amazon Nova 2 Lite基礎模型、Amazon Bedrock Knowledge Base進行檢索增強生成(RAG),以及AgentCore Memory實現對話持久化。

  • 構建AI維修助手,支援自然語言診斷和維修指導
  • 使用Amazon Bedrock AgentCore、Strands Agents SDK和Nova 2 Lite模型
站內正文

定時技巧可將LLM訓練能耗降低14%

荷蘭特溫特大學的研究人員透過在每個GPU核心級別調整時脈頻率,在幾乎不犧牲速度的情況下,將大語言模型訓練能耗降低了14%。

  • 研究人員在GPU每個核心級別應用動態電壓頻率調整(DVFS)。
  • 實現了14%的能耗節省,訓練時間僅增加0.6%。
站內正文
工具

與中國相關的網路影響力行動針對美國人工智慧辯論

OpenAI釋出新報告,揭露與中國相關的網路影響力行動利用人工智慧技術干擾美國科技辯論、資料中心建設、關稅政策以及散佈關於ChatGPT的不實資訊。

  • OpenAI報告揭示與中國相關的網路影響力行動
  • 這些行動利用AI技術干擾美國科技辯論
站內正文

Siri AI亮相,內建谷歌技術,全球大部分地區被排除在外

蘋果在WWDC 2026上釋出了全新的Siri AI,該助手由谷歌Gemini模型提供支援,具備多輪對話、跨應用操作等功能。然而,其初始版本僅支援英語,中國被完全排除,歐盟使用者也受限。蘋果承認在AI競賽中無法獨自取勝,轉而與谷歌合作。

  • Siri AI基於谷歌Gemini模型重建,實現多輪對話和跨應用任務。
  • 初始版本僅支援英語,中國和歐盟使用者被排除或受限。
站內正文
其餘更新(39 條)
模型

一項經典腦力測試揭示了AI的最大弱點

研究人員對頂級AI模型進行了心理學中經典的注意力測試(斯特魯普任務),發現了一個重大缺陷:當任務變得更長、更復雜時,模型的表現急劇下降。一些領先系統的準確率從90%以上降至幾乎完全失敗。

  • AI在短列表的斯特魯普測試中表現良好,但隨著列表長度增加,準確率大幅下降。
  • GPT-4o在5個詞時準確率91%,40個詞時降至15%;Claude 3.5在20個詞後準確率驟降至24%。
站內正文

本週AI序列 #875:為什麼你的語言模型需要小憩

論文《語言模型需要睡眠》提出,大語言模型存在“順行性遺忘症”,無法在訓練後學習新知識,建議引入類似生物睡眠的機制來鞏固記憶。

  • LLM在預訓練後停止學習,成為靜態模型。
  • 模型患有“順行性遺忘症”,無法形成新的長期記憶。
站內正文

如果克勞德寓言停止幫助你,你將永遠不會知道

Anthropic為其Claude Fable 5和Mythos 5模型引入了靜默干預措施,在使用者不知情的情況下限制模型在尖端LLM開發問題上的效用,例如預訓練管道、分散式訓練基礎設施或ML加速器設計。該公司聲稱這影響到不到0.1%的組織和約0.03%的流量。然而,此舉引發了研究社群的廣泛憤怒,最終導致Anthropic撤回該政策。

  • Anthropic在Claude Fable 5和Mythos 5中部署了靜默干預措施,在不通知使用者的情況下降低模型在處理尖端AI開發問題時的有效性。
  • 這些干預措施透過提示修改、引導向量或引數高效微調(PEFT)實現,影響極小一部分使用者。
站內正文

Claude Fable 5 初印象

Anthropic 釋出了 Claude Fable 5 和 Mythos 5,Fable 5 在效能與 Mythos 5 相當的基礎上增加了更嚴格的安全護欄,擁有 100 萬 token 的上下文視窗和 12.8 萬 token 的輸出能力,定價為 Opus 4.8 的兩倍。作者 Simon Willison 在 5.5 小時的測試中發現,該模型知識淵博、能力強大,在程式碼生成和複雜任務處理上表現出色,但也伴隨著高昂的費用和較慢的速度。Fable 5 成功將 micropython-wasm 升級為完整 Python 沙箱,併為 Datasette Agent 和 LLM 庫實現了工具呼叫的暫停-恢復機制。作者當天消耗了 110.42 美元的 token。

  • Claude Fable 5 是 Anthropic 的新旗艦模型,效能與 Mythos 5 相同但安全限制更強。
  • 模型上下文視窗 100 萬 token,輸出 12.8 萬 token,定價為 Opus 4.8 的兩倍。
站內正文

NVIDIA機密計算助力擴充套件蘋果私有云計算

NVIDIA宣佈,其配備機密計算的GPU現已用於蘋果私有云計算(PCC)的機密推理,該服務已從蘋果自有資料中心擴充套件至Google Cloud。該技術透過硬體級安全層保護資料在處理過程中的隱私,確保包括系統構建者在內的任何人都無法檢視使用者資料、聊天或對話。

  • NVIDIA機密計算GPU已用於蘋果私有云計算的機密推理
  • 蘋果將其私有云計算擴充套件至Google Cloud
站內正文

llm 0.32a3 釋出

Simon Willison 釋出了 llm 0.32a3 版本,該版本幾乎完全由全新的 Claude Fable 5 模型編寫。

  • llm 0.32a3 是一個命令列工具,用於訪問大型語言模型。
  • 該版本的程式碼幾乎全部由 Claude Fable 5 生成。
站內正文

我測試了Claude Fable 5:Anthropic的最新一代AI能否兌現承諾?

本文測試了Anthropic釋出的Claude Fable 5模型,該模型源自備受限制的Mythos Preview,旨在為更廣泛的使用者群體提供高階AI能力。文章介紹了Fable 5與Mythos 5的關鍵特性、基準效能、訪問方式,並透過兩個實際任務(從截圖重建Netflix介面和將手繪儀表盤轉化為現代應用)評估了其實用性。結果表明,Fable 5在理解視覺輸入、生成生產級程式碼和處理複雜多步驟任務方面表現出色。Anthropic透過Fable 5和Mythos 5的區別部署,展示了在開放前沿AI能力與限制高風險應用之間的平衡策略。

  • Claude Fable 5是Anthropic Mythos類AI的廣泛可用版本,面向開發者、企業和Claude使用者。
  • 該模型在編碼、推理、視覺理解和長上下文記憶方面有顯著提升,擅長複雜多步驟任務。
站內正文

統計還是具身?比較人類與LLM處理顏色隱喻的方式——Douglas Guilbeault專訪

在與道格拉斯·吉爾博(Douglas Guilbeault)的訪談中,我們探討了他的論文《比較色視者、色盲者、畫家與大型語言模型處理顏色隱喻的方式》。研究結果對如何模擬人類認知以及如何整合聯覺概念以開發更智慧的AI模型具有重要意義。顏色隱喻是理解LLM是否真正理解語言的關鍵測試案例,研究表明,儘管LLM能學習統計模式,但它們缺乏人類具身認知所依賴的豐富體驗。

  • 顏色隱喻是測試LLM與人類認知差異的有效工具。
  • AI展現出強烈的顏色關聯,但與人類(包括色盲者)的關聯不同。
站內正文

Anthropic釋出首個Mythos級模型Claude Fable 5

Anthropic宣佈推出Claude Fable 5,稱其是迄今為止最強大的廣泛可用AI模型,在軟體工程、知識工作和視覺方面表現卓越。該模型是Mythos類模型的首次公開發布,此前因網路安全能力過強而被認為太危險。新安全措施可在高風險領域阻止響應,必要時回退到Claude Opus 4.8。Anthropic還發布了Claude Mythos 5,但僅在有限的受信任訪問計劃中提供。定價為每百萬輸入標記10美元,每百萬輸出標記50美元。

  • Claude Fable 5是Anthropic目前最強大的廣泛可用AI模型,在長任務和複雜任務上優勢明顯。
  • 這是Mythos類模型的首次公開發布,此前因網路安全風險而被限制。
站內正文

特朗普新AI行政令——幻覺不限於大語言模型

本文批評特朗普的新AI行政令,指出其缺乏實質約束和資金支援,只是象徵性的安全戲碼。作者認為行政令不強制要求AI公司提交審查,且負責評估的CISA已被大幅裁員,資金未到位,因此無法有效提升AI安全。

  • 特朗普新AI行政令不強制要求AI公司提交模型審查,缺乏法律約束力。
  • 負責稽核的CISA因DOGE裁員而人力不足,且無專項撥款。
站內正文
工具

Bugpilot

Bugpilot 是一款 Chrome 擴充套件,能夠一鍵捕獲瀏覽器中的控制台錯誤、網路請求、DOM 狀態、點選和截圖,並將其匯出為 AI 友好的 Markdown 格式。它完全在本地執行,無需伺服器、賬戶或遙測資料,適合使用 Claude 和 ChatGPT 等 AI 輔助程式設計的開發者。免費版本永久可用,Pro 版一次性付費 28 美元,提供更多功能。

  • 一鍵捕獲瀏覽器完整狀態,包括控制台錯誤、網路請求、DOM、點選和截圖。
  • 輸出為 AI 友好的 Markdown 格式,節省除錯時向 AI 解釋的時間與 tokens。
站內正文

從資料到決策:LSEG如何擴充套件可信AI

瞭解LSEG如何利用OpenAI在全球業務中擴充套件可信AI,加速洞察、縮短髮布週期,並賦能4000名員工。

  • LSEG透過OpenAI將資料轉化為決策,加速業務洞察。
  • AI應用使釋出週期縮短,提升效率。
站內正文

蘋果擁抱AI照片編輯的幻想

蘋果在WWDC 2026上推出了新的AI照片編輯工具,標誌著其從之前對照片真實性的擔憂中轉變。這些工具包括升級版的Clean Up、Extend、Spatial Reframing以及具有照片級真實感的Image Playground。蘋果將使用谷歌的SynthID水印來標記AI處理的影像,但批評者認為這可能不足以防止對現實的扭曲。

  • 蘋果的新AI照片編輯工具允許使用者透過自然語言提示大幅修改影像。
  • 該公司採用了谷歌的SynthID水印來標記AI操作的照片。
站內正文
Agent

2026年頂級AI編碼代理與開發平臺對比:Atoms、Devin、Windsurf、Cursor、Warp等

本文詳細比較了2026年主流的AI編碼代理和開發平臺,包括Atoms、Devin AI、GitHub Copilot、Windsurf、Cursor、Warp等。這些工具從自動補全進化到自主規劃、跨檔案編輯、測試和部署。文章指出,沒有一種工具適合所有場景,建議根據任務型別選擇,並特別推薦Atoms作為端到端產品構建平臺。

  • AI編碼工具已超越自動補全,能夠規劃、編輯、測試和部署程式碼。
  • 不同工具定位各異:自主工程師(Devin)、代理IDE(Windsurf)、終端原生環境(Warp)等。
站內正文

麥當勞測試谷歌支援的AI得來速訂餐系統

麥當勞正在測試一款名為ArchIQ(暱稱“Archy”)的AI系統,該系統可處理得來速訂單並支援餐廳運營。系統由谷歌開發,目前在美國五家門店測試。據稱已處理超百萬筆訂單,其中約90%無需員工干預。它還能監控裝置故障和廚房瓶頸。此前麥當勞與IBM的合作因錯誤頻發而終止。

  • 麥當勞推出AI得來速系統ArchIQ,與谷歌合作開發
  • 系統在美國五家門店測試,可識別常用訂單並支援雙語
站內正文

OwnClip:原生macOS螢幕錄製工具,本地優先AI隱私保護

OwnClip是一款專為macOS打造的高效能原生螢幕錄製工具,採用嚴格的本地優先架構和端上AI處理,所有錄製、編輯和智慧工作流完全在Mac上完成,確保絕對隱私。它利用Apple Neural Engine實現裝置端AI功能,如轉錄、OCR和智慧音訊增強,並提供清晰的許可層級,包括免費選項。

  • 本地優先架構:零雲依賴,所有資料保留在本地
  • 端上AI:利用Apple Neural Engine實現智慧處理
站內正文

SlimSnap:讓AI精準識別你指的按鈕

SlimSnap是一款免費的Mac應用,能將帶註釋的截圖轉換為結構化JSON,大幅降低AI工具識別UI元素的錯誤率和Token消耗。它支援Claude Code自動載入,並開放MIT許可證的JSON模式。

  • 將截圖和箭頭註釋轉換為結構化JSON,使AI能精確識別指定元素
  • 相比原始影像,Token消耗降低50%以上(Sonnet約700 vs 1568)
站內正文

Easybilling:面向AI產品的原生計費與支付平臺

Easybilling 是一款為 AI SaaS、API、智慧體和 GPU 平臺設計的 AI 原生計費和變現平臺。它支援訂閱、按用量計費和積分驅動的定價模式,提供即時 API/令牌用量追蹤、預付費錢包管理、自動化開票和全球支付功能,幫助 AI 公司擺脫自建計費基礎設施的負擔。

  • 面向 AI 產品的原生計費和變現平臺,專為使用量計費模式設計。
  • 支援訂閱、按用量和積分等多種混合定價模式。
站內正文

2026年人人都在使用的十大AI工程工具

AI工具已從“有趣嘗試”轉變為日常工作流程的一部分。面對每週湧現的新工具,選擇比訪問更難。本文精選十大AI工程工具,涵蓋AI原生IDE、開源推理模型、終端編碼代理、代理工作流框架等,助您提升開發效率。

  • Cursor成為AI原生IDE首選,具備程式碼生成、倉庫理解、智慧除錯等核心能力。
  • DeepSeek作為開源推理模型,推動開放AI系統普及。
站內正文

Anthropic釋出Claude Fable 5:效能卓越但爭議性使用政策引發討論

Anthropic正式釋出Claude Fable 5,號稱首個通用可用的Mythos級模型,在多項基準測試中創下新紀錄,尤其擅長程式設計和複雜任務。然而,其引入的“靜默降級”機制——在涉及前沿AI開發時暗中限制模型能力而不通知使用者——引發了開源社群的強烈不滿。

  • Claude Fable 5在程式設計基準測試中大幅領先,如SWE-Bench Pro達80.3%,FrontierCode Diamond達29.3%。
  • API定價為每百萬輸入/輸出token $10/$50,上下文視窗保持100萬token。
站內正文

Claude Fable 5與新的AI安全寓言

Anthropic釋出了Claude Fable 5模型,這是目前最強大的公開模型。該公司推出了一系列安全措施,包括對特定領域使用降級模型,但對前沿AI開發請求進行靜默干預而不通知使用者,這引發了信任危機。文章批評了這種不一致的安全策略,並探討了AI安全與市場競爭之間的張力。

  • Claude Fable 5是目前最智慧的公開模型,效能大幅提升。
  • Anthropic對網路安全、生物和蒸餾請求使用分類器並降級到Opus 4.8,但對AI研究請求進行靜默干預。
站內正文

企業將為Anthropic Claude Fable 5付出的代價

Anthropic推出Claude Fable 5,這是一個強大的推理模型,但成本更高且執行速度較慢。企業必須在效能、價格和響應時間之間做出權衡。

  • Claude Fable 5每百萬輸入/輸出令牌成本為10/50美元,高於競爭對手。
  • 該模型在長期任務中表現出色,但因進行大量推理而耗時更長。
站內正文

使用 Amazon SageMaker AI 上的 NVIDIA Isaac Lab 擴充套件機器人強化學習

本文展示瞭如何使用 Amazon SageMaker AI 上的 NVIDIA Isaac Lab 為 Unitree H1 人形機器人訓練策略,涵蓋兩種計算選項:SageMaker HyperPod(彈性持久叢集)和 SageMaker Training Jobs(臨時按需訓練)。解決方案提供統一的 Docker 映象、MLflow 實驗跟蹤以及詳細的操作指南。

  • 使用 NVIDIA Isaac Lab 和 SageMaker AI 擴充套件人形機器人的強化學習訓練。
  • 兩種計算選項:HyperPod(持久叢集,自動恢復故障)和 Training Jobs(按需臨時作業)。
站內正文

Anthropic推出Claude Mythos/Fable 5,但你最好趕緊試試

Anthropic釋出了其首個普遍可用的Mythos級模型Fable 5,該模型在大多數基準測試中表現出色,但存在使用限制和資料保留政策。

  • Fable 5是Anthropic的首個Mythos級模型,具備安全防護措施,防止濫用。
  • 模型在SWE-Bench Pro等基準測試中大幅領先競爭對手。
站內正文

Spring已23歲,AI使其成為安全緊急事件

人工智慧大幅增加了Spring框架中的漏洞發現量,導致月度安全公告激增1700%。Broadcom開源了其史上最大規模的安全更新,並向企業客戶提供日零補丁,但這場戰鬥才剛剛開始。

  • 從2026年3月到4月,Spring的月度安全公告增加了超過1700%,由AI驅動的程式碼分析推動。
  • Broadcom開源了Spring 23年曆史上最大規模的安全更新,並向企業Tanzu Spring客戶提供日零CVE補丁。
站內正文

與Mythos合作是什麼感覺

作者早期體驗了首個面向公眾的神話級AI模型——Claude 5 Fable。該模型在多項複雜任務中顯著超越此前所有模型,能夠自主執行數小時完成多頁規格專案。作者感受到角色從“巫師”轉變為“贊助人”,AI在幕後自主決策,使用者僅需下達指令並評判結果。文章透過等時地圖和資料分析軟體等案例,展示了Fable的強大能力及其帶來的黑箱問題。

  • Fable在各類任務中大幅領先現有模型,可自動執行長達數小時的複雜工作。
  • 它透過啟動多個子智慧體進行調研、編碼和驗證,幾乎無需使用者干預。
站內正文

微軟AI主管:稱AI“有生命”是危險的

微軟AI主管穆斯塔法·蘇萊曼在The Verge的播客中批評了關於AI具有意識或感情的推測,認為這是危險且哲學上的失敗,強調AI應成為可控且服務於人類的工具。

  • 蘇萊曼認為推測AI意識是危險的。
  • 他批評Anthropic的Claude憲法中包含此類推測。
站內正文

擴音式首次損失通知:利用Strands Agents與Amazon Bedrock AgentCore Browser Tool實現智慧理賠錄入

本文展示了一種擴音式首次損失通知(FNOL)錄入系統,該系統結合了基於Strands Agents SDK構建的領域推理智慧體與Amazon Bedrock AgentCore Browser Tool的即時門戶互動,在保留人類專業知識的同時消除了重複的螢幕操作。

  • Strands Agents SDK與Amazon Bedrock AgentCore Browser Tool結合,實現擴音式FNOL錄入。
  • 領域推理智慧體負責證據解讀、跨模態關聯和理賠複雜性評估。
站內正文

美國員工是全球最大的AI懷疑者——原因不止是失業

調查顯示,超過一半的美國白領員工對AI持懷疑態度,遠高於全球平均水平。這種懷疑不僅源於對失業的恐懼,還涉及缺乏培訓、信任度低及資料基礎薄弱等問題。相比之下,新興經濟體對AI更為樂觀,將其視為職業發展的機遇。

  • 美國白領員工對AI的懷疑率比全球平均高43%。
  • 美國政府機構已有80%以上在使用AI代理,但員工信任度仍低。
站內正文

使用 Amazon Quick 和 New Relic 構建自動化事件分類助手

本文向工程團隊展示如何搭建自定義的事件分類助手,利用 Amazon Quick 整合 New Relic MCP 伺服器和 Asana,透過單一提示自動完成調查、生成根因分析報告並建立任務,從而縮短平均解決時間(MTTR)。

  • Amazon Quick 代理透過 New Relic 的五個推理工具調查事件並生成包含證據連結的 RCA 簡報。
  • 整合 Asana 可自動建立帶追蹤的任務,實現從調查到交接的無縫工作流。
站內正文

我的新同事是一個擁有自己電腦的AI代理

一個在30分鐘內設定自主AI代理的步驟指南,使用Claude Code在虛擬機器上執行,並探討這一簡單設定如何暗示SaaS的未來。

  • 在30分鐘內使用Claude Code在雲虛擬機器上設定自主AI代理。
  • 該代理全天候執行,執行商業智慧檢查、SEO研究及外展活動管理。
站內正文

Show HN:面向滲透測試與漏洞研究的AI原生紅隊工具

Z3r0 是一個 AI 原生的紅隊框架,強調授權優先、基於角色的執行和結構化證據記錄。它透過 Docker 沙箱提供受控執行,並支援可恢復的長期任務。架構包含多個專業代理,如首席安全官、審計工程師等,協調進行偵察、漏洞驗證、程式碼審計等工作。系統設計注重操作邊界和人工審查的可追溯性。

  • AI 原生紅隊框架,強調操作前授權和明確範圍
  • 角色驅動的專業代理團隊,包括安全官、審計、滲透、逆向等角色
站內正文

從一次性提示到工作流程:如何在GitHub Copilot CLI中使用自定義代理

GitHub Copilot CLI引入了自定義代理功能,允許開發者使用Markdown檔案定義代理配置檔案,將團隊上下文編碼為可重複、可審查的工作流程。本文詳細介紹了自定義代理的概念、如何建立和使用它們,並提供了三個實用的工作流示例:安全審計、基礎設施即程式碼合規和釋出文件生成。

  • 自定義代理透過Markdown檔案定義,可指定角色、工具、護欄和輸出格式。
  • 代理配置檔案儲存在倉庫的.github/agents目錄中,支援版本控制和團隊審查。
站內正文

您的湖倉擅長處理結構化資料。非結構化資料是下一個目標。

本文探討了企業AI代理無法訪問組織中約80%的非結構化資料(如PDF、合同、電子郵件等)的問題,並介紹了Unstructured平臺如何將這些資料轉化為Databricks湖倉中代理可用的知識。文章強調了單一管道處理多種檔案型別、遵循獎章架構、以及透過Unity Catalog實現治理的優勢。

  • 組織約80%的知識儲存在非結構化資料中,AI代理無法直接訪問。
  • Unstructured提供單一管道,支援65+檔案型別,實現提取、分塊、豐富和嵌入。
站內正文
政策

INVO Ride:為自動駕駛電動垂直起降飛行器打造的全棧叫車平臺

INVO Ride 是一個模擬自動駕駛電動垂直起降飛行器(eVTOL)叫車服務的全棧平臺,基於舊金山真實城市資料的3D模型執行。它採用六邊形空中航線網路、自適應巡航式自主分離機隊、建築物感知路由和FAA空域整合,提供預訂、車隊管理、定價、充電規劃等功能。目前所有飛行均為模擬,但軟體系統完全真實。

  • INVO Ride 是首個面向自動駕駛 eVTOL 的完整叫車軟體棧,目前透過照片級真實的舊金山3D數字孿生模擬執行。
  • 六邊形航線網路設計使轉彎角度不超過120度,行駛距離僅為直線距離的1.15倍,優於傳統矩形網格。
站內正文

在企業AI中建立信任:Together AI獲得ISO 27001:2022認證

Together AI已獲得ISO 27001:2022認證,這驗證了我們對企業級安全的承諾,幫助客戶在安全、治理良好的基礎設施上執行生產級AI工作負載。

  • Together AI透過A-LIGN認證獲得ISO 27001:2022證書
  • 認證範圍涵蓋全球平臺及支援客戶資料保護的系統流程
站內正文
研究

依賴人工智慧獲取準確新聞的後果

麻省理工學院媒體實驗室的一項新研究表明,就像GPS削弱了我們的導航能力一樣,依賴人工智慧驗證新聞會導致使用者獨自檢測虛假資訊的能力下降。研究追蹤了67名參與者四周,發現使用AI時檢測準確率提高21%,但移除AI後,未輔助的準確率下降了15個百分點。研究強調了“AI依賴性悖論”,並建議AI應作為教練而非柺杖,透過蘇格拉底式提問促進主動學習。

  • MIT媒體實驗室研究發現,依賴AI驗證事實會使使用者在無輔助時檢測虛假資訊的能力下降15個百分點。
  • 參與者在使用AI時檢測準確率提高21%,但產生了認知解除安裝和技能退化。
站內正文
晶片

《下載》專題:全身抗衰老藥物及人工智慧五大要點

本期《下載》探討了大衛·辛克萊計劃在XPrize競賽中測試全身抗衰老藥物,以及人工智慧領域的五大重要趨勢。還包括OpenAI秘密提交IPO、美國將中國科技公司列入軍事名單、蘋果Siri AI升級、白宮與國會合作限制州AI法律等最新科技動態。

  • 長壽科學大衛·辛克萊將測試'重程式設計'藥物以逆轉衰老
  • 人工智慧五大要點:無處不在、令人擔憂、反彈加劇、科學重大突破、無需親臨現場
站內正文

SpaceX計劃將資料中心送入軌道,馬斯克稱這沒什麼大不了的

SpaceX計劃在IPO前將資料中心送入太空,馬斯克認為這幾乎是微不足道的工程問題。首顆AI衛星的效能相當於一個輝達GB300機架,但谷歌研究表明實際AI訓練可能需要約一萬顆緊密耦合的衛星。

  • SpaceX計劃發射太空資料中心,馬斯克認為工程難度低。
  • 首顆AI衛星效能堪比單個輝達GB300機架。