AI News HubLIVE
公開記事 132収集記事 180信頼度 86更新頻度 60 分
稼働状態 正常ソース種別 公式全文利用権限 公式全文最終取り込み 2026-06-26ID databricks-blog状態 有効

Official data and AI platform feed; confirm reuse terms before full body display.

最新公開記事

Databricksが動画を検索可能で実用的なインテリジェンスに変える方法

Databricksは、動画をデータエンジニアリングの問題として捉え、視覚言語モデル(VLM)、サーバーレスGPU、Lakeflowパイプラインを活用して、大量の動画を自動分析、要約、検索可能にする革新的なアプローチを提案している。モデルに依存しないアーキテクチャにより、公共安全、インフラ点検など様々なシナリオに対応可能。

  • Databricksは動画分析をデータエンジニアリング問題として扱い、VLM、サーバーレスGPU、Lakeflowパイプラインを使用。
  • パイプラインは自動的に重要な動画部分を検出、切り取り、要約し、自然言語クエリをサポート。
サイト内本文

英国学生事務局がDatabricksを活用して高等教育基準を向上させ、学生の成果を改善する方法

英国学生事務局(Office for Students)はDatabricksに移行し、数百万件の学生記録を統合管理することでデータ処理時間を大幅に短縮し、分析を加速。AIによる意思決定支援を可能にし、高等教育の規制効率と学生の成果向上を実現した。

  • 3億件のデータ処理時間が8時間から数分に短縮。
  • 学生セグメンテーション分析が2週間から半日に短縮。
サイト内本文

AIアプリケーション向けサーバーレスデータベースに求める重要なポイント

このバイヤーズガイドでは、AIワークロード向けサーバーレスデータベースを評価するための主要な基準(コンピュートとストレージの分離、オープンスタンダードの互換性、スケールトゥゼロ、接続アーキテクチャ、AIネイティブ機能など)を説明します。

  • コンピュートとストレージの分離が真のサーバーレスアーキテクチャの鍵です。
  • PostgreSQLなどのオープンスタンダードにより移植性が高まり、ベンダーロックインを回避できます。
サイト内本文

サーバーレスPostgreSQLとは?

サーバーレスPostgreSQLは、コンピュートとストレージを分離し、独立して自動スケーリングするフルマネージドクラウドデータベースモデルです。バースト的なワークロードや予測不可能なワークロードに適していますが、常時稼働でレイテンシに敏感なアプリケーションには適していません。この記事では、サーバーレスPostgresを基盤とするLakebaseアーキテクチャについても紹介しており、トランザクションと分析ワークロードを統合し、データの重複を減らし、AIやリアルタイムアプリケーションへのアクセスを簡素化します。

  • サーバーレスPostgreSQLはコンピュートとストレージを分離し、オンデマンドで自動スケーリングし、実使用量に基づいて課金される。
  • 従来のPostgresと比較して運用オーバーヘッドが削減されるが、コールドスタートレイテンシと接続管理の課題がある。
サイト内本文

Daikin Applied AmericasがGenie Codeで一貫性のあるデータパイプラインを大規模に構築する方法

Daikin Applied Americasは、Databricks Genie Codeを使用してデータエンジニアリングの運用モデルを再設計し、MECEスキルフレームワークとメダリオンアーキテクチャを実装して一貫性を確保しています。このAI支援アプローチは、ガバナンスを維持しながらパイプライン開発を加速し、ビジネスコンセプトとの整合性を向上させます。

  • MECEスキルとメダリオンアーキテクチャを使用した標準化されたパイプライン開発。
  • Genie Codeにより反復が高速化し、定型的なコードが削減。
サイト内本文

もし答えがすでにあなたのデータの中にあったら?

Kythera Labs は Databricks 上に AI ネイティブのヘルスケア戦略プラットフォームを構築し、どの医療システムでも専門家レベルの知能にアクセスできるようにしました。AI エージェントが平易な言語で戦略的質問に回答し、実際の事例では、ルイジアナ州の医療システムが10日で稼働し、患者受診の可視性150%向上、漏洩22%削減、年間380万ドルの価値を実現しました。

  • Kythera Labs は Databricks 上で AI エージェントを構築し、医療データ分析の専門知識をパッケージ化し、自然言語で戦略的質問が可能に。
  • プラットフォームは3390億件の医療・処方箋請求データに基づき、患者の旅を再構築し、信頼できる回答を提供。
サイト内本文

Databricks、2年連続でGartnerマジック・クアドラントにおいて実行力最高、ビジョン最遠に位置づけ

Databricksは、2026年Gartnerデータサイエンス・機械学習向けAIプラットフォームのマジック・クアドラントでリーダーに選出され、実行能力とビジョンの完全性で最高評価を獲得しました。これは、エンタープライズがモデル構築からエージェンティックアプリケーションの本番展開へ移行し、統一されたデータ、AI、ガバナンスの重要性が高まっていることを反映しています。

  • Databricksが2年連続で実行力最高、ビジョン最遠に位置づけ。
  • 企業はエージェンティックアプリを迅速に展開し、統一データ・AI・ガバナンスプラットフォームが必要。
サイト内本文

Genesis Workbench:DatabricksとNVIDIAが支えるライフサイエンス向け業界AIのブループリント

Genesis Workbenchは、NVIDIAのアクセラレーテッドコンピューティングツール(BioNeMo、Parabricksなど)を統合したオープンなDatabricksブループリントであり、Unity Catalogによるガバナンスで知的財産を保護しながら、実験科学者向けにノーコードのインターフェースを提供します。

  • DatabricksのガバナンスとNVIDIAのアクセラレーテッドコンピューティングを統合したモジュール型ブループリント。
  • ノーコードのポイント&クリックUIで、科学者がプログラミングなしでゲノミクスや分子設計タスクを実行可能。
サイト内本文

エージェントシステムとAIエージェントのガイド

エージェントAIは、環境を認識し、目標を推論し、マルチステップのタスクを実行し、結果から学習する自律型ソフトウェアプラットフォームであり、人間の介入は最小限です。本ガイドでは、生成AIとの違い、動作原理、主要コンポーネント、オーケストレーション、企業ガバナンスの要点を解説します。

  • エージェントAIは単発応答の生成AIとは異なり、自律的にマルチステップワークフローを計画・実行する。
  • 中核ループ:認識→推論→行動→学習。LLMを推論エンジンとし、外部ツールと連携する。
サイト内本文

企業成長を促進するトップ10のAIビジネスソリューション

最高のAI投資収益を得ている企業は、具体的なビジネス成果に結びついた意図的な投資を行い、クリーンでガバナンスされたデータに基づいています。この記事では、実証済みの10のAIビジネスソリューションと成功の条件を紹介します。

  • AIが価値を生む3つの方法:生産性向上、自動化、ビジネスの再構築。
  • データ品質はAIソリューション成功の75%を占める。
サイト内本文

エンドツーエンドRAGワークフロー:検索拡張生成の仕組み

検索拡張生成(RAG)は、大規模言語モデルを外部知識ベースに接続するAIアーキテクチャパターンであり、インジェスト、埋め込み、検索、拡張、生成の5段階パイプラインを通じて、モデルを再トレーニングすることなく正確でドメイン固有の回答を可能にします。本番RAGワークフローでは、適切な埋め込みモデルの選択、ベクターデータベースのインデックス作成とチャンク戦略の構成、およびセマンティックベクトル検索とキーワードフォールバックを組み合わせたハイブリッド検索の実装が必要です。RAG評価は、検索精度と生成忠実度を独立して測定する必要があります。なぜなら、強力なLLM性能は情報検索コンポーネントの弱さを補償できず、知識の陳腐化による応答精度低下を防ぐために継続的なデータ更新が不可欠だからです。

  • RAGは5段階パイプラインでLLMと外部知識を接続し、モデルの再トレーニングを不要にします。
  • ハイブリッド検索(セマンティック+キーワード)と適切なチャンク戦略が検索品質に重要です。
サイト内本文

ベクトル検索とは?

ベクトル検索は、意味や文脈に基づいて結果を見つける検索技術で、キーワードの正確な一致ではなく、埋め込みベクトルを使用してテキスト、画像、音声などの類似コンテンツを識別します。キーワードのみの検索の限界を解決し、同義語の認識、言語や形式を超えた検索を可能にし、RAG、エンタープライズ検索、レコメンデーション、異常検知などのユースケースで活用されています。本番システムでは、多くの場合ベクトル検索とキーワード検索を組み合わせ、Databricks AI Searchのようなマネージドサービスは、再ランキング、メタデータフィルタリング、自動インデックス更新、ガバナンスを追加して関連性を向上させ、運用を簡素化します。

  • ベクトル検索は埋め込みベクトルを比較して意味ベースの一致を見つけ、同義語や異言語・異形式の検索に優れています。
  • 埋め込みの作成、インデックス構築、近似最近傍(ANN)検索によるクエリマッチングの3段階で動作し、スケーラビリティを実現します。
サイト内本文

データレイク vs クラウドデータウェアハウス:データサイエンティストのための実践ガイド

本記事ではデータレイクとクラウドデータウェアハウスの違いを比較し、データレイクは機械学習や高度な分析に適した生データを低コストで保存する一方、クラウドデータウェアハウスは構造化レポート向けに高同時実行SQLパフォーマンスを最適化することを解説します。データレイクハウスはDelta Lakeなどのオープンテーブル形式に基づき両者の利点を統合し、企業分析の主流になると予測されています。

  • データレイクは生データを低コストで保存し、全データ型をサポートし、機械学習に最適。
  • クラウドデータウェアハウスは高速SQLクエリと高同時実行性を提供するが、構造化データに限定。
サイト内本文

データサイエンティスト:AIとアナリティクスの未来を支える

データサイエンティストは、アナリティクス、機械学習、AIの交差点に位置し、生データを予測モデル、実験、推奨事項に変換してビジネス上の意思決定を導きます。本稿では、この役割の進化、必要な中核スキル、直面する課題、そして最新のプラットフォームが探索からデプロイメントへの経路をどのように加速するかを探ります。

  • データサイエンティストは生データをビジネス成果を促進する予測モデル、実験、推奨事項に変換します。
  • 役割は大規模言語モデル、生成AI、プロダクションデプロイメントにまで拡大しています。
サイト内本文

StagwellがDatabricks上でプライバシーセーフなIDマッチングを構築した方法

StagwellはDatabricks Clean RoomsとMarketplaceアプリを活用し、プライバシーに配慮したアイデンティティマッチングソリューションを開発しました。ブランドは自社の環境にアプリをインストールし、StagwellのID Spineと照合して生データを公開せずに、Agentic Targeting Systemを通じてオーディエンスをアクティベートできます。このアプローチにより、デプロイ時間が数か月から数分に短縮され、コンプライアンスが確保されます。

  • ブランドは自社データをIDグラフと安全にマッチングする課題に直面している。
  • Databricks Marketplaceアプリにより、ブランドのワークスペースにプラグアンドプレイで導入可能。
サイト内本文

人工知能(AI)とは何か?

人工知能(AI)は、コンピュータサイエンスの一分野で、人間の知能を必要とするタスクを機械に実行させるものです。この記事では、AIの仕組み、主な種類、実際の例、限界、歴史について説明します。

  • AIはデータからパターンを学習し、明示的にプログラムされることなく予測や意思決定を行う。
  • 現代のAIの多くは「有限記憶」カテゴリーに属し、チャットボットやレコメンデーションエンジンを動かしている。
サイト内本文

AIのためのデータエンジニアリング:データプロフェッショナルのための実践ガイド

データエンジニアリングは人工知能システムの基盤です。本ガイドは、データプロフェッショナル向けに、データアーキテクチャ、特徴量エンジニアリング、生成AI統合、コンプライアンス、キャリア開発まで、AIのためのデータエンジニアリングの完全なライフサイクルをカバーします。

  • AIのためのデータエンジニアリングは、機械学習や生成AIを支える大規模で非構造化、リアルタイムのデータパイプラインの管理に焦点を移します。
  • 自動化、可観測性、統一データアーキテクチャは、本番グレードのAIに不可欠です。
サイト内本文

データウェアハウスの種類:アーキテクチャとユースケースの完全ガイド

データウェアハウスは、構造化された履歴データを一元管理し、複雑なクエリやビジネスインテリジェンスを支援するリポジトリです。この記事では、エンタープライズデータウェアハウス(EDW)、データマート、オペレーショナルデータストア(ODS)の3つの主要タイプと、クラウド、ハイブリッド、レイクハウスなどの最新アーキテクチャについて解説し、ニーズに合った選択を支援します。

  • データウェアハウスの主要なタイプは、EDW、データマート、ODSの3つ。
  • EDWは組織全体の単一の真実のソースとして機能するが、従来型は拡張性に課題。
サイト内本文

支払い詐欺検出:銀行と企業が不正取引を阻止する方法

支払い詐欺検出は、ルールベースのシステム、機械学習、リアルタイム監視を組み合わせて不正取引を阻止します。クレジットカード詐欺、アカウント乗っ取り、カードテスト、フレンドリーフラウド、承認済みプッシュペイメント詐欺などの主要な種類、行動分析、デバイスフィンガープリンティング、リアルタイムリスクスコアリングなどの検出技術、そしてトークン化、3Dセキュア2、多層防御モデルなどの予防戦略について学びます。

  • 主な詐欺の種類は、クレジットカード詐欺、アカウント乗っ取り、カードテスト、フレンドリーフラウド、承認済みプッシュペイメント詐欺です。
  • 検出には、行動分析、デバイスフィンガープリンティング、リアルタイムリスクスコアリングが使用されます。
サイト内本文

AIエージェントハーネスとは?

AIエージェントハーネスは、大規模言語モデル(LLM)をラップして、プロンプトに応答するだけでなくタスクを実行できるようにするソフトウェアインフラストラクチャです。この記事では、コアコンポーネント(ツール、メモリ、サンドボックス、ガードレール)と、それらが推論-行動-観察ループを通じて信頼性の高い行動を可能にする仕組みを説明します。また、8つのビルディングブロック、一般的な障害モード、およびエンタープライズAI戦略におけるハーネス設計の重要性についても取り上げます。

  • AIエージェントハーネスはモデルの推論を信頼性の高い行動に変換し、ツール、メモリ、実行環境、ガードレールを提供します。
  • ハーネスの設計はエージェントのパフォーマンスに直接影響し、コンテキスト管理、オーケストレーション、検証が基礎となるモデルと同じくらい重要です。
サイト内本文

DatabricksとNVIDIA:エージェンティック時代の構築

DatabricksとNVIDIAは、ガバナンスされたエンタープライズデータ上でモデルトレーニング、推論、エージェンティックAI開発を加速するエンドツーエンドのAIプラットフォームを提供するために協業を拡大しています。新機能には、AI Runtimeのマルチノードトレーニング、Free EditionのGPUサポート、Model Servingの強化、NVIDIA Agent Toolkitのサポートが含まれます。お客様はDatabricks内でNVIDIAの業界固有AIフレームワークを直接活用し、ヘルスケア、ライフサイエンス、サプライチェーン、ロボティクス、デジタルツイン、ドキュメントインテリジェンスなどのユースケースを加速できます。

  • DatabricksとNVIDIAがパートナーシップを拡大し、トレーニング、推論、エージェンティック開発をカバーするエンドツーエンドのAIプラットフォームを実現。
  • 新機能:AI Runtimeのマルチノードトレーニング、Free EditionのGPUサポート、Model Servingの強化、NVIDIA Agent Toolkitの統合。
サイト内本文

パートナー Well-Architected フレームワーク:新機能と今後の展望

Databricks のパートナー Well-Architected フレームワーク (PWAF) は、AI 対応のアーキテクチャガイダンス、技術標準、およびベストプラクティスを提供します。2月のローンチ以来、AI パートナー Dev Kit、拡張されたアーキテクチャパターン、オープンソースのリファレンスアプリケーション Firefly が追加され、パートナーは開発を加速し、実証済みの設計パターンを採用できるようになりました。PWAF は Databricks プラットフォームと AI 市場とともに進化し、パートナーが差別化された製品を構築し、採用の影響を測定し、成長機会を開くことを可能にします。

  • PWAF は、Built-On、Connected、Data Collaboration の3つのパートナーアーキテクチャ向けに AI 対応ガイダンスを提供
  • 新しい AI パートナー Dev Kit には、コーディングエージェントが使用できる15以上のスキルが含まれている
サイト内本文

Free Edition の次の展開:5つの新機能でデータとAI学習を完全サポート

Databricks は Free Edition を拡張し、Genie Code、サーバーレスGPU、Lakebase、Agent Bricks、Lakeflow Designer の5つの新製品を追加しました。これにより、ユーザーはデータエンジニアリングからAIエージェントまでエンドツーエンドのプロジェクトを構築するための完全な無料ツールキットを利用できます。すでに50万人以上のユーザーが Free Edition を活用しています。

  • 50万人以上が Databricks Free Edition を利用。
  • 5つの新製品:Genie Code、サーバーレスGPU、Lakebase、Agent Bricks、Lakeflow Designer。
サイト内本文

地球上で最も包括的なデータ&AIエコシステムへ

Databricks は、パートナーエコシステムを拡大し、Marketplace、Apps、OpenSharing、Genie Agent などの新機能を提供します。これにより、パートナーはソリューションの構築、配布、共有、収益化をより効果的に行えるようになります。

  • Databricks Marketplace により、パートナーは顧客の事前コミット済み支出にアクセスして取引を加速できます。
  • パートナーは Marketplace で Databricks Apps を公開し、20,000 以上の顧客にリーチできます。
サイト内本文

AI/BIで美しいダッシュボードをデザインする

Databricks AI/BIプラットフォーム上で、ブランドに合った美しいダッシュボードをデザインする方法を紹介します。テーマのカスタマイズ、レイアウト、フォント選択、UIカラー、視覚化パレットなどのベストプラクティスを解説します。

  • ダッシュボードテーマを使用してフォント、色、視覚化パレットをカスタマイズし、ブランドの一貫性を確保します。
  • 対象ユーザーに応じてグリッドレイアウトを構成し、FパターンまたはZパターンのスキャン方式で重要な情報を強調します。
サイト内本文

Data + AI Summit 2026 での Genie Code の新機能

Genie Code は、Databricks 上のデータおよびMLワークのための専門エージェントです。過去1年間で Genie 製品は10倍以上に成長し、顧客の90%が使用しています。今回のサミットでは、複雑なマルチスレッドワークを管理するための全ページコマンドセンター、MLflow、モデルサービング、コンピュート認識とのネイティブ統合によるMLワークフローのエージェント機能強化、自律動作を可能にするスケジュールタスク、そして運用自動化を拡張する Genie ZeroOps が発表されました。

  • 新しい全ページコマンドセンターにより、スレッドステータス、レビューポイント、指示、スキル、コネクタへの迅速なアクセスで複雑なマルチスレッドワークを管理。
  • Genie Code はMLワークフローに拡張され、Genie Ontology でチームのパターンを学習し、MLflow、モデルサービング、コンピュート認識とネイティブ統合。
サイト内本文

Databricks プラットフォームのセキュリティとコンプライアンスの新機能 – Data + AI Summit 2026

Data + AI Summit 2026 で、Databricks は新しいセキュリティおよびコンプライアンス機能を発表しました。Entra ID と Okta 向けの自動 ID 管理 (AIM)、コンテキストベースのイングレス、プライベートネットワークゲートウェイ、Lakebase 向けの Private Link の拡張、および HITRUST、ISMAP、Azure Commercial での FedRAMP High などの新しいコンプライアンス認定が含まれます。

  • Entra ID 向け AIM が AWS および GCP で一般提供開始、Okta 向けはパブリックプレビュー。
  • コンテキストベースのイングレスにより、AI エクスペリエンス向けのゼロトラストアクセスポリシーが可能に。
サイト内本文

Unity AI Gateway による AI ガバナンスのためのオープンエコシステムの構築

Databricks は Data + AI Summit 2026 で Unity AI Gateway パートナーエコシステムを発表し、セキュリティ、アイデンティティ、ガバナンスのベンダーと統合して、ランタイムでの AI インタラクションの監視、保護、ガバナンスを実現します。

  • Unity AI Gateway は Unity Catalog のガバナンスをモデル、エージェント、MCP サーバー、ツール間のランタイムインタラクションに拡張します。
  • Alice、CrowdStrike、Cyera などの新パートナーがリアルタイム AI セキュリティを提供します。
サイト内本文

AIプラットフォームの新機能:MLエンジニアリングのためのエージェント、ディープラーニングプラットフォーム、リアルタイムMLの新機能

DatabricksはData+AI Summit 2026で、ML用Genie Codeエージェント、パブリックプレビュー版のAI Runtime(サーバーレスGPUトレーニング環境)、および強化されたリアルタイムMLサポート(低レイテンシ・高QPSのFeature StoreとModel Serving)など、AIプラットフォームの新機能を発表しました。これらの機能は、実験から本番環境へのパスを加速します。

  • Genie Code for ML:Databricks MLコンポーネントと統合されたコーディングエージェント。特徴エンジニアリング、モデルトレーニング、デプロイ、モニタリングを高速化。
  • AI Runtime(パブリックプレビュー):サーバーレスGPUトレーニング環境。インフラ管理不要で研究レベルの深層学習とファインチューニングが可能。
サイト内本文

エージェンティックCDP:エージェントの新時代のための新しい種類のCDP

Databricksは、AIエージェントの時代に向けて再設計された新しい顧客データプラットフォームである「エージェンティックCDP」の概念を提唱しています。従来のCDPとは異なり、このプラットフォームは「ゴールデンコンテキスト」と「インフィニティキャンペーン」を提供し、データ基盤に組み込まれ、ミリ秒単位のリアルタイムパーソナライゼーションを実現します。本記事では、従来のCDPが速度、コンテキスト、真の1対1パーソナライゼーションの面で不十分であると論じています。

  • 従来のCDPは、AIエージェント主導の購買に必要な速度、パーソナライゼーション、コンテキストの要求を満たせない
  • エージェンティックCDPは、ゴールデンコンテキスト(顧客、ビジネス、意思決定のリアルタイムシグナル)を導入
サイト内本文

全ソース