AI News HubLIVE
公開文章 132採集文章 180可信度 86刷新頻率 60 分鐘
健康狀態 健康來源類型 官方原文權限 官方原文最近入庫 2026-06-26ID databricks-blog運行狀態 已啟用

Official data and AI platform feed; confirm reuse terms before full body display.

最新公開文章

Databricks如何將影片轉化為可搜尋、可操作的情報

Databricks提出了一種將影片視為資料工程問題的創新方法,利用視覺語言模型(VLM)、無伺服器GPU和Lakeflow管道,實現對大量影片的自動分析、摘要和搜尋。該方案模型無關、可擴充套件,適用於公共安全、基礎設施檢查等多個場景。

  • Databricks將影片分析作為資料工程問題處理,使用VLM、無伺服器GPU和Lakeflow管道。
  • 管道可自動檢測、擷取和摘要關鍵影片片段,支援自然語言查詢。
站內正文

英國學生事務辦公室如何利用Databricks提升高等教育標準並改善學生成果

英國學生事務辦公室(OfS)透過遷移至Databricks平臺,統一管理數百萬條學生記錄,大幅縮短資料處理時間,加速分析流程,並支援基於AI的決策輔助,從而提升高等教育監管效率和學生成果。

  • Databricks將處理3億條資料記錄的時間從8小時縮短至幾分鐘。
  • 學生細分分析從兩週減少到半天完成。
站內正文

為AI應用選擇無伺服器資料庫時應關注什麼

這份買家指南涵蓋了評估AI工作負載無伺服器資料庫的關鍵標準,包括計算與儲存分離、開放標準相容性、按需伸縮、連線架構和AI原生能力。

  • 計算與儲存分離是實現真正無伺服器架構的關鍵。
  • 開放標準如PostgreSQL確保可移植性和避免供應商鎖定。
站內正文

什麼是無伺服器 PostgreSQL?

無伺服器 PostgreSQL 是一種完全託管的雲資料庫模型,將計算和儲存分離,實現獨立自動伸縮。它適用於突發性或不可預測的工作負載,但不太適合始終線上、對延遲敏感的應用程式。文章還介紹了基於無伺服器 Postgres 的 Lakebase 架構,該架構統一了事務和分析工作負載,減少資料重複,簡化了對 AI 和即時應用程式的訪問。

  • 無伺服器 PostgreSQL 將計算和儲存解耦,按需自動伸縮,按實際使用計費。
  • 與傳統 Postgres 相比,它降低了運維開銷,但存在冷啟動延遲和連線管理問題。
站內正文

大金應用美洲公司如何藉助Genie Code大規模構建一致的資料管道

大金應用美洲公司使用Databricks Genie Code重新設計其資料工程運營模型,採用MECE技能框架和勳章架構來確保一致性。這種AI輔助方法加快了管道開發速度,同時保持了治理和與業務概念的協調。

  • 使用MECE技能和勳章架構標準化管道開發。
  • Genie Code加速迭代並減少樣板程式碼。
站內正文

如果答案已經存在於你的資料中呢?

Kythera Labs 在 Databricks 上構建了 AI 原生的醫療戰略平臺,使任何醫療系統都能獲得專家級智慧,透過 AI 代理以自然語言回答戰略問題,並提供了實際案例:路易斯安那州一家醫療系統在10天內上線,實現了患者就診可見性提高150%、漏診減少22%、年化價值380萬美元。

  • Kythera Labs 利用 Databricks 構建 AI 代理,將醫療資料分析專家經驗封裝,使醫療系統領導能用自然語言提問。
  • 該平臺基於3390億醫療和處方索賠資料,重建患者就診旅程,提供可信答案。
站內正文

Databricks連續第二年位居Gartner魔力象限執行最高和願景最遠

Databricks在2026年Gartner資料科學與機器學習AI平臺魔力象限中被評為領導者,在執行能力和願景完整性上均獲最高分。這反映了企業從模型構建轉向規模化部署代理應用的趨勢,強調統一資料、AI和治理的重要性。

  • Databricks連續第二年位居Gartner魔力象限執行能力最高和願景最遠。
  • 企業正快速部署代理應用,需要統一資料、AI和治理平臺。
站內正文

Genesis Workbench:由Databricks和NVIDIA驅動的生命科學行業AI藍圖

Genesis Workbench是一個開放的Databricks藍圖,整合了NVIDIA的加速計算工具(包括BioNeMo和Parabricks),為端到端藥物發現提供安全、無程式碼的介面,透過Unity Catalog治理保護智慧財產權。

  • 模組化藍圖整合Databricks治理與NVIDIA加速計算,覆蓋基因組學、單細胞、大/小分子等階段。
  • 無程式碼點選介面使實驗科學家無需程式設計即可執行復雜任務。
站內正文

智慧體系統與AI智慧體指南

智慧體AI是一種自主軟體平臺,能夠感知環境、推理目標、執行多步驟任務並從結果中學習,幾乎無需人工干預。本文詳細介紹了智慧體AI與生成式AI的區別、工作原理、核心元件、編排方式以及企業治理要點。

  • 智慧體AI系統自主規劃並執行多步驟工作流,區別於單次響應的生成式AI。
  • 核心迴圈:感知-推理-行動-學習,LLM作為推理引擎,配合外部工具和記憶。
站內正文

推動公司增長的十大AI業務解決方案

獲得最高AI回報的公司是將投資與具體業務成果掛鉤,並基於乾淨、受治理的資料。本文總結了十大經過驗證的AI業務解決方案及成功所需的條件。

  • AI創造價值的三種形式:生產力提升、自動化和業務重塑。
  • 資料質量佔AI解決方案成功因素的75%。
站內正文

端到端RAG工作流:檢索增強生成的工作原理

檢索增強生成(RAG)是一種AI架構模式,透過五階段流水線——資料攝入、嵌入、檢索、增強和生成——將大語言模型與外部知識庫連線,無需重新訓練模型即可提供準確、領域特定的答案。生產級RAG需要選擇合適的嵌入模型、配置向量資料庫索引和分塊策略,並實施結合語義向量搜尋與關鍵詞回退的混合搜尋以最大化檢索質量。RAG評估必須獨立測量檢索精度和生成保真度,因為強大的LLM效能無法彌補資訊檢索元件的薄弱,且持續資料更新對於防止知識過時至關重要。

  • RAG透過五階段工作流連線LLM與外部知識,避免重新訓練模型。
  • 混合搜尋(語義+關鍵詞)和分塊策略對檢索質量至關重要。
站內正文

什麼是向量搜尋?

向量搜尋是一種基於意義和上下文而非精確關鍵詞匹配的搜尋技術。它透過嵌入向量來識別相似文本、影像、音訊等內容,解決了關鍵詞搜尋的侷限性,常用於RAG、企業搜尋、推薦系統和異常檢測。生產系統通常結合向量和關鍵詞搜尋以獲得更強結果,而託管服務如Databricks AI Search可新增重排序、後設資料過濾、自動索引更新和治理功能。

  • 向量搜尋透過嵌入向量比較內容的意義,而非精確匹配關鍵詞。
  • 它支援跨語言、跨格式搜尋,並能處理同義詞和概念關聯。
站內正文

資料湖與雲資料倉儲:資料科學家的實用指南

本文對比了資料湖和雲資料倉儲的差異,指出資料湖適合儲存原始多格式資料以支援機器學習和高階分析,雲資料倉儲則最佳化了結構化報表的高併發SQL效能。資料湖屋(Lakehouse)透過開放表格式(如Delta Lake)統一了兩者優勢,有望成為企業分析的主流架構。

  • 資料湖以低成本儲存原始資料,支援所有資料型別,適合機器學習。
  • 雲資料倉儲提供快速SQL查詢和高併發能力,但僅適用於結構化資料。
站內正文

資料科學家:推動人工智慧與分析未來的核心力量

資料科學家處於分析、機器學習和人工智慧的交匯點,將原始資料轉化為預測模型、實驗和建議,以指導業務決策。本文探討了該角色的演變、所需核心技能、面臨的挑戰以及如何透過統一平臺加速從探索到部署的過程。

  • 資料科學家將原始資料轉化為驅動業務成果的預測模型、實驗和建議。
  • 角色已擴充套件至大語言模型、生成式AI應用及生產級部署。
站內正文

Stagwell如何在Databricks上構建隱私安全的ID匹配

Stagwell利用Databricks Clean Rooms和Marketplace應用開發了一種隱私安全的身份匹配解決方案。品牌可以在自己的環境中安裝該應用,與Stagwell的身份脊進行匹配,而無需暴露原始資料,並透過其代理定位系統啟用受眾。該方法將部署時間從數月縮短至數分鐘,並確保了合規性。

  • 品牌在安全地將第一方資料與身份圖譜匹配時面臨挑戰。
  • Databricks Marketplace應用支援在品牌自己的工作區即插即用部署。
站內正文

什麼是人工智慧(AI)?

人工智慧(AI)是電腦科學的一個分支,使機器能夠執行通常需要人類智慧的任務。本文涵蓋了AI的工作原理、主要型別、實際應用、侷限性以及歷史背景。

  • AI透過從資料中學習模式來做出預測或決策,而非透過明確程式設計。
  • 現代AI主要屬於“有限記憶”類別,包括聊天機器人和推薦系統。
站內正文

AI資料工程:資料專業人士實用指南

資料工程是人工智慧系統的基礎。本文為資料專業人士提供了構建AI就緒資料基礎設施的全面指南,涵蓋資料架構、特徵工程、生成式AI整合、合規性及職業發展。

  • 資料工程的焦點從傳統BI轉向管理大規模、非結構化和即時資料管道,以支援機器學習和生成式AI模型。
  • 自動化、可觀測性和統一資料架構成為資料團隊追求生產級AI解決方案的核心能力。
站內正文

資料倉儲型別:架構與用例完全指南

資料倉儲是集中式儲存結構歷史資料的倉庫,支援複雜查詢和商業智慧。本文介紹三種主要型別:企業資料倉儲(EDW)、資料集市和運算元據儲存(ODS),以及現代雲端計算、混合和湖倉架構。幫助您根據需求選擇合適的資料倉儲。

  • 資料倉儲分為企業資料倉儲(EDW)、資料集市(Data Mart)和運算元據儲存(ODS)三種型別。
  • EDW提供跨組織的單一真實來源,適合複雜治理需求,但傳統架構擴充套件成本高。
站內正文

支付欺詐檢測:銀行與企業如何阻止欺詐交易

支付欺詐檢測結合基於規則的系統、機器學習和即時監控來阻止未經授權的交易。瞭解信用卡欺詐、賬戶接管、卡片測試、友好欺詐和授權推送支付欺詐等主要型別,以及行為分析、裝置指紋識別和即時風險評分等檢測技術,還有令牌化、3D Secure 2和分層防禦模型等預防策略。

  • 主要欺詐型別包括信用卡欺詐、賬戶接管、卡片測試、友好欺詐和授權推送支付欺詐。
  • 檢測使用行為分析、裝置指紋識別和即時風險評分。
站內正文

什麼是AI代理框架?

AI代理框架是圍繞大型語言模型(LLM)的軟體基礎設施,使其能夠執行任務而不僅僅是響應提示。本文介紹框架的核心元件——工具、記憶體、沙箱和護欄,以及它們如何透過推理-行動-觀察迴圈實現可靠操作。還討論了八個關鍵構建模組,如系統提示、工具執行、反饋迴圈等,以及常見故障模式如上下文腐爛、工具過載和缺乏護欄。最後強調,在企業AI戰略中,共享框架基礎設施對於擴充套件和管理代理至關重要。

  • AI代理框架將模型推理轉化為可靠行動,包括工具、記憶體、沙箱和護欄等元件。
  • 框架設計直接影響代理效能,強大的上下文管理、編排和驗證與底層模型同等重要。
站內正文

Databricks與NVIDIA:共建智慧體時代

Databricks和NVIDIA宣佈擴大合作,推出端到端AI平臺,加速模型訓練、推理和智慧體AI開發。新功能包括AI Runtime中的多節點訓練、Free Edition GPU支援、模型服務增強,以及NVIDIA Agent Toolkit整合。客戶可在Databricks內直接使用NVIDIA的行業專用AI框架,應用於醫療、生命科學、供應鏈、機器人等領域。

  • Databricks與NVIDIA合作提供全棧AI平臺,覆蓋訓練、推理和智慧體開發。
  • 新增AI Runtime多節點訓練、Free Edition GPU支援及模型服務增強。
站內正文

合作伙伴良好架構框架:新增內容與未來展望

Databricks 合作伙伴良好架構框架 (PWAF) 提供 AI 就緒架構指南、技術標準和實施最佳實踐。自2月釋出以來,新增了 AI 合作伙伴開發工具包、擴充套件的架構模式以及開源參考應用 Firefly,幫助合作伙伴加速開發、簡化整合並採用經過驗證的設計模式。隨著 Databricks 平臺和 AI 市場的發展,PWAF 持續演進,助力合作伙伴構建差異化產品、衡量採用影響並解鎖增長機會。

  • PWAF 提供基於 Databricks 的三種合作伙伴架構(內建、連線、資料協作)的 AI 就緒指南
  • 新增 AI 合作伙伴開發工具包,包含 15+ 經過測試的技能,可供編碼代理使用
站內正文

Free Edition 迎來重大更新:五大新產品助力資料與AI學習

Databricks 正在擴充套件其 Free Edition,新增了五大產品:Genie Code、無伺服器 GPU、Lakebase、Agent Bricks 和 Lakeflow Designer,為使用者提供構建資料與AI專案的完整工具包。自推出以來,已有超過50萬名使用者使用 Free Edition,新功能覆蓋資料工程、機器學習、應用開發和AI代理等核心實踐領域。

  • 超過50萬使用者已使用Databricks Free Edition。
  • 新增五大產品:Genie Code、無伺服器GPU、Lakebase、Agent Bricks和Lakeflow Designer。
站內正文

成為地球上最全面的資料與人工智慧生態系統

Databricks 宣佈擴充套件其資料與人工智慧合作伙伴生態系統,推出 Marketplace 承諾支出提取、Apps 分發、OpenSharing 協議和 Genie Agent 共享等新功能,幫助合作伙伴更高效地構建、分發和商業化解決方案。

  • Databricks Marketplace 現允許合作伙伴訪問客戶的預承諾支出,加速交易。
  • 合作伙伴可以透過 Marketplace 分發 Databricks Apps,觸及超過 20,000 家客戶。
站內正文

在AI/BI中設計美觀的儀表盤

本文介紹瞭如何在Databricks的AI/BI平臺上設計美觀且符合品牌形象的儀表盤,涵蓋主題定製、佈局組織、字型選擇、UI色彩搭配和視覺化調色盤等最佳實踐。

  • 使用儀表盤主題自定義字型、顏色和視覺化調色盤,確保品牌一致性。
  • 根據受眾需求佈局網格,採用F型或Z型掃描模式突出關鍵資訊。
站內正文

Data + AI Summit 2026 上 Genie Code 的新功能

Genie Code 是 Databricks 上用於資料和機器學習工作的專業代理。過去一年,Genie 產品增長超過 10 倍,被 90% 的客戶使用。本次峰會推出了全新的全頁命令中心,用於管理多執行緒工作;增強了機器學習工作流程的代理能力,包括與 MLflow、模型服務和計算感知的原生整合;即將推出定時任務,實現自主工作;以及 Genie ZeroOps 將自動化擴充套件到生產運維。

  • 全新全頁命令中心,支援多執行緒管理、狀態跟蹤和快速訪問指令、技能和聯結器。
  • Genie Code 為機器學習擴充套件了代理開發能力,利用 Genie Ontology 學習團隊模式,並與 MLflow、模型服務和計算感知整合。
站內正文

Databricks 平臺在 Data + AI Summit 2026 上推出的安全和合規新功能

在 Data + AI Summit 2026 上,Databricks 釋出了新的安全和合規能力,包括 Entra ID 和 Okta 的自動身份管理 (AIM)、基於上下文的入口、私有網路閘道器、對 Lakebase 的擴充套件 Private Link 支援,以及新的合規認證如 HITRUST、ISMAP 和即將推出的 Azure Commercial 上的 FedRAMP High。

  • Entra ID 的 AIM 在 AWS 和 GCP 上正式可用,Okta 的 AIM 進入公開預覽。
  • 基於上下文的入口為零信任訪問策略提供了支援。
站內正文

藉助 Unity AI Gateway 構建開放的 AI 治理生態系統

Databricks 在 Data + AI Summit 2026 上釋出了 Unity AI Gateway 合作伙伴生態系統,整合了多家安全、身份和治理供應商,幫助企業在 AI 執行時實現安全監控、身份治理和風險監測。

  • Unity AI Gateway 擴充套件了 Unity Catalog 的治理能力,覆蓋模型、代理、MCP 伺服器等執行時互動。
  • 新整合的合作伙伴包括 Alice、CrowdStrike、Cyera 等,提供即時 AI 安全防護。
站內正文

AI平臺新功能:ML工程智慧體、深度學習平臺及即時ML新能力

Databricks在2026年資料+AI峰會上宣佈了AI平臺的多項新功能,包括用於機器學習的Genie Code智慧體、公開預覽的AI Runtime(無伺服器GPU訓練環境),以及增強的即時ML支援(低延遲、高QPS的特徵儲存和模型服務)。這些功能旨在加速從實驗到生產的AI應用開發。

  • Genie Code for ML:整合Databricks ML元件的編碼智慧體,加速特徵工程、模型訓練、部署和監控。
  • AI Runtime(公開預覽):無伺服器GPU訓練平臺,支援研究級深度學習和大規模微調,無需管理基礎設施。
站內正文

Agentic CDP:為AI代理新時代打造的新型客戶資料平臺

Databricks提出了Agentic CDP概念,這是一種針對AI代理時代重新設計的客戶資料平臺。與傳統CDP不同,它提供“黃金上下文”(Golden Context)和“無限營銷活動”(Infinity Campaigns),嵌入資料基礎架構,實現毫秒級即時個性化。文章認為,買家已轉由AI代理進行決策,傳統CDP因速度慢、缺乏上下文和無法做到真正的1:1個性化而失效。

  • 傳統CDP無法滿足AI代理時代對速度、個性化和上下文的需求
  • Agentic CDP引入黃金上下文(融合客戶、業務和決策即時訊號)
站內正文

全部來源