AI News HubLIVE
公開記事 26収集記事 28信頼度 76更新頻度 120 分
稼働状態 正常ソース種別 コミュニティ全文利用権限 サイト内リライト最終取り込み 2026-06-24ID machine-learning-mastery状態 有効

Machine learning education and applied AI source; summary-only unless authorization is obtained.

最新公開記事

コンテキストウィンドウは記憶ではない:AIエージェント開発者が理解すべきこと

この記事では、大きなコンテキストウィンドウがエージェントの記憶と同じではない理由と、検索、圧縮、要約の技術がエージェントの認知スタックでどのように連携するかを説明し、真の記憶の永続化を実現する方法を紹介します。

  • コンテキストウィンドウはステートレスの一時的な作業領域であり、永続的な記憶ではない。
  • 検索拡張生成(RAG)は関連データを取得するが、矛盾が生じる可能性があり、タイムスタンプによる優先順位付けが必要。
サイト内本文

LLM埋め込みとHDBSCANによる非構造化テキストのクラスタリング

大規模言語モデルの埋め込みとHDBSCANを組み合わせて、ラベルなしテキストデータから自動的にトピックを発見するテキストクラスタリングパイプラインの構築方法を紹介。埋め込み生成、UMAPによる次元削減、HDBSCANによるクラスタリングを解説。

  • sentence-transformersを使用してテキスト埋め込みを生成
  • UMAPで埋め込みの次元を削減
サイト内本文

Pythonでブラウザを使用するAIエージェントを構築する

この記事では、Playwright、browser-use、LangGraphを使用して、実際のWebサイトを閲覧・操作できるAIエージェントをPythonで構築する方法を解説します。トピックは、PlaywrightがSeleniumよりも優れている理由(30~50%高速、永続的WebSocket、内蔵自動待機、リアルなイベント)、環境設定手順、動的ページのスクレイピング、複数ステップのフォーム入力、アンチボット検出対策、セッション永続化、Dockerへのデプロイです。コード例を通じて、Webサイトをナビゲートし、フォームに記入し、構造化データを抽出し、LLMで意思決定を行う実用的なブラウザエージェントを作成します。

  • Playwrightは、永続的なWebSocket接続によりSeleniumより30~50%高速で、内蔵の自動待機と実際のマウス/キーボードイベントを備えている。
  • 環境設定はPython 3.10+、OpenAI APIキー、pipインストール(Playwrightブラウザバイナリを含む)のみで完了する。
サイト内本文

Scikit-LLMを使用したエンドツーエンドの感情分析パイプラインの構築

Scikit-LLMとGroq APIを介して提供されるオープンソースの大規模言語モデルを使用して、セットアップからIMDBデータセットでの評価まで、感情分析パイプラインを構築する方法を学びます。

  • Scikit-LLMは古典的なscikit-learnパイプラインと最新のLLM API呼び出しを橋渡しします
  • Groq APIを使用してLlama 3.1 8Bなどのオープンソースモデルをゼロショット分類に利用
サイト内本文

AIエンジニアが習得すべきPythonの概念

ローカル実験から本番AIシステムへの移行には、Pythonの書き方の転換が必要です。本記事では、ジェネレータと遅延評価、コンテキストマネージャ、非同期プログラミング、データクラスとPydantic、マジックメソッドの5つの重要な概念を紹介します。

  • ジェネレータにより、一定のメモリオーバーヘッドで大規模データセットをストリーミングできます(例:5万レコードでメモリ25MB→14MB)。
  • コンテキストマネージャはリソースの安全な後始末と状態復元を保証し、InferenceProfilerクラスでモデルモード切替とレイテンシ記録を安全に実行。
サイト内本文

Scikit-LLMを使ったマルチラベルテキスト分類

本記事では、Scikit-LLMと大規模言語モデルを活用し、ラベル付き学習データなしでマルチラベルテキスト分類を実行する方法を紹介します。Groqが提供する無料のオープンソースLLMをゼロショット推論に使用し、scikit-learnライクなワークフローを実現します。セットアップ、分類器の初期化、go_emotionsデータセットの読み込み、複数の感情ラベルをテキストに割り当てる予測手順を解説します。

  • Scikit-LLMはLLMによるゼロショットマルチラベル分類を可能にし、学習は不要。
  • Groqの無料APIとllama-3.3-70b-versatileモデルを使用。
サイト内本文

Transformers.jsを使用した画像と音声のマルチモーダルブラウザAI

この記事では、Transformers.jsを使用してブラウザ内で完全に実行されるマルチモーダルAI機能(画像分類、画像キャプション、音声文字起こし)を構築する方法を説明します。サーバーやAPIキーは不要で、ユーザーのデバイスからデータが外部に出ることはありません。詳細なコード例とプロジェクト構成が含まれています。

  • ブラウザ内で画像分類、画像キャプション、音声文字起こしを実装。
  • Transformers.jsを使用し、すべてのモデルがクライアント側で実行されるため、データはデバイスから離れません。
サイト内本文

AgentOps実践ガイド

AgentOpsは、自律型AIエージェントを本番環境で運用するためのフレームワークであり、可観測性、評価、コストガバナンス、安全性、継続的改善の5本柱をカバーします。本ガイドでは、AgentOpsが従来のLLMモニタリングとどのように異なるか、ツールエコシステム、完全な動作コード例、およびセッションリプレイを使用したエージェント障害のデバッグ方法を説明します。

  • AgentOpsは自律型エージェントに運用の厳格さをもたらし、説明可能性、測定可能性、ビジネス目標との整合性を確保します。
  • AgentOpsの5本柱:可観測性、評価、コストガバナンス、安全性、継続的改善。
サイト内本文

Scikit-LLMとオープンソースLLMの使用

この記事では、OllamaとScikit-LLM Pythonライブラリを使用して、Llama 3、Mistral、Gemmaなどのローカルでホストされたオープンソース大規模言語モデルを無料でテキスト分類に利用する方法を学びます。

  • Ollamaをインストールし、オープンソースLLMをローカルで実行。
  • Scikit-LLMをローカルのOllamaエンドポイントに設定。
サイト内本文

Scikit-LLM vs 従来のテキスト分類器:LLMを使うべきタイミングは?

本記事では、TF-IDF+ロジスティック回帰、ゼロショットBART、GroqのLLMを用いたScikit-LLMの3つのテキスト分類手法をベンチマークしました。合成カスタマーサポートデータセットにおいて、Scikit-LLMは最高精度(87%)を達成し、BARTよりも低レイテンシでした。少量データで深い言語理解が必要なタスクに最適です。

  • TF-IDF+ロジスティック回帰は最速だが精度は最低(約53%)
  • ゼロショットBARTは低速で精度は中程度(約67%)
サイト内本文

LLMOpsをマスターするためのロードマップ:2026年版

本記事では、オブザーバビリティ、評価、コスト管理、エージェントオーケストレーションをカバーする構造化された6ステップのLLMOpsロードマップを紹介し、本番環境向けLLMシステムの構築方法を解説します。LLMOps市場は2024年の19.7億ドルから2028年には49億ドルに成長する見込みです(CAGR42%)。

  • LLMOpsは従来のMLOpsと異なり、プロンプトのバージョン管理、非決定的な出力評価、コスト最適化が重要。
  • 必要な基礎スキル:Python、LLMの基本、クラウドインフラ、バージョン管理。
サイト内本文

長期実行エージェントのためのコンテキストプルーニングパイプラインの構築

この記事では、長期実行AIエージェントのためのコンテキストプルーニングパイプラインを実装し、セマンティック類似性を使用して対話メモリを効率的に管理する方法を説明します。センテンストランスフォーマー埋め込みモデルの使用、類似度の計算、プルーニングされたコンテキストウィンドウの構築をカバーしています。

  • 長期実行エージェントでの無制限の会話履歴はトークンコストを増加させ、推論を低下させます。
  • コンテキストプルーニングパイプラインは、現在のプロンプト、最新のターン、および意味的に類似した過去のターンのTop-Kを保持します。
サイト内本文

トークン選択の統計:Logits、温度、Top-Pの解説

本記事では、大規模言語モデルにおけるlogits、温度、top-pサンプリングがどのように連携して次のトークン予測を制御するかを詳しく解説します。logitsの役割、温度とtop-pが確率分布に与える影響、そしてそれらが順次パイプラインを形成する仕組みを説明します。実際のユースケースに応じたパラメータ値の選択に関する実践的なアドバイスも提供します。

  • Logitsはトランスフォーマーの最終線形層から出力される生の非正規化スコアであり、softmaxにより確率に変換される。
  • 温度はsoftmaxの前にlogitsをスケーリングし、ランダム性を制御する:高温度は分布を平坦化して創造性を高め、低温度は分布を鋭くして決定論性を高める。
サイト内本文

エラー回復機能を備えたマルチツールGemma 4エージェントの構築

この記事では、基本的なツール呼び出しスクリプトを、誤動作するツール、不正なモデル出力、利用不可なサービスに対して優雅に障害処理を行う堅牢なエージェントに変える方法を学びます。反復エージェントループ、ツール呼び出しの4つの障害カテゴリ、モデルが回復するための情報豊富なエラーメッセージの設計について説明します。

  • 最大反復回数制限付きの反復エージェントループを構築する方法を学ぶ。
  • エージェントがツールを呼び出す際に遭遇する4つの障害カテゴリとその対処法を理解する。
サイト内本文

RAGにおけるハイブリッドセマンティック・レキシカル検索の実装

本記事では、BM25によるレキシカル検索とセマンティック検索を組み合わせ、Reciprocal Rank Fusion(RRF)でランキングを融合するハイブリッド検索戦略をRAGシステムに実装する方法を説明します。Pythonコードを用いたステップバイステップの実装、データセットの読み込み、BM25およびセマンティック検索関数の作成、ハイブリッド検索の統合を紹介します。小規模データセットでの実験では、単独の手法よりも優れた結果が得られました。

  • ハイブリッド検索はBM25のレキシカル検索とセマンティック検索を組み合わせ、お互いの盲点を補う。
  • Reciprocal Rank Fusion(RRF)を使用して両方の検索結果のランキングを融合する。
サイト内本文

PythonでLLM埋め込みとメタデータを使ったコンテキスト認識検索の構築

この記事では、埋め込みベースの類似性と構造化メタデータフィルタリングを組み合わせたコンテキスト認識セマンティック検索エンジンの構築方法を、埋め込みの生成からインデックスの永続化まで解説します。

  • ローカルの事前学習モデルで384次元の埋め込みを生成
  • スコアリング前にメタデータでフィルタリングして効率化
サイト内本文

非決定論的エージェントのための統計的ガードレールの実装

非決定論的エージェントとは、同じ入力に対して複数回の実行で異なる出力が得られるエージェントです。本記事では、統計的ガードレールを使用してそれらの動作を監視・評価し、信頼性と安全性を確保する方法について説明します。

  • 非決定論的エージェントは同じ入力でも異なる出力を生成する。
  • 統計的ガードレールは異常な出力を防ぐためにエージェントの動作を監視する。
サイト内本文

エージェンティックRAGを難易度別に3段階で解説

本記事では、エージェンティックRAG(検索拡張生成)を初心者、中級者、上級者の3つの難易度レベルで説明します。基本概念、技術アーキテクチャ、最先端の研究をカバーし、自律的な意思決定によって従来のRAGを強化する方法を理解するのに役立ちます。

  • エージェンティックRAGは、外部知識を取得するタイミングをエージェントが決定する検索と生成を組み合わせる。
  • 記事は3つのレベル(簡単な比喩、技術的実装、高度な研究)で構成されている。
サイト内本文

TurboQuantによる効率的なKV圧縮

Googleは、大規模言語モデル(LLM)およびベクトル検索エンジンに高度な量子化と圧縮を適用するための新しいアルゴリズムスイートおよびライブラリ「TurboQuant」を発表しました。これはRAGシステムに不可欠な要素です。

  • TurboQuantは、LLMとベクトル検索エンジンの量子化と圧縮のためのGoogleの新しいアルゴリズムスイートとライブラリです。
  • RAGシステムのベクトル検索を最適化し、効率を向上させます。
サイト内本文

Pydantic AIでPythonでAIエージェントを構築する

Pydantic AIフレームワークを使用して、構造化出力、カスタムツール、依存性注入、Web検索や拡張推論などの組み込み機能を備えた本番環境対応のAIエージェントをPythonで構築する方法を学びます。

  • 型安全なエージェント出力のためにPydanticモデルを定義し、フレームワークが自動検証・リトライ。
  • @agent.tool_plainまたは@agent.toolデコレータでPython関数をツールとして登録。
サイト内本文

AIエージェントのための効果的なコンテキストエンジニアリング:開発者ガイド

本記事では、コンテキストウィンドウを制約のあるリソースとして扱い、静的・動的コンテキストの分離、会話履歴の管理、検索の予算設計、本番環境での品質評価を通じて、AIエージェントの信頼性、コスト効率、精度を向上させる方法を解説します。

  • コンテキストウィンドウをRAMと見なし、財務コストと認知コストのバランスを取る。
  • 静的コンテキストと動的コンテキストを分離し、プレフィックスキャッシングを活用する。
サイト内本文

Scikit-LLMを使ったテキスト要約

本記事では、Scikit-LLMライブラリのテキスト要約機能を使用して、機械学習パイプラインで大量のテキストを処理する方法を紹介します。カスタムトランスフォーマーでHugging Faceの事前学習済み要約モデルを統合し、scikit-learnパイプラインに組み込んで、長文から分類までのエンドツーエンドのフローを実現します。

  • Scikit-LLMは従来の機械学習と大規模言語モデルを橋渡しし、ゼロショット/少数ショット分類やテキスト要約を提供します。
  • カスタムHuggingFaceSummarizerクラスはBaseEstimatorとTransformerMixinを継承し、事前学習済み要約モデルをロードして要約を生成します。
サイト内本文

ローカル小型言語モデルでAIエージェントを構築する

この記事では、インターネット接続やAPI費用を必要とせず、自分のマシン上で完全にローカルに動作するAIエージェントを小型言語モデル(SLM)を使って構築する方法を解説します。AIエージェントとSLMの概念、ローカル実行の利点、OllamaとLangChainのセットアップ、エージェントの段階的構築、メモリとツールの追加、そしてSLMの限界について説明します。

  • AIエージェントは、言語モデルを使用して推論し行動するプログラムで、単なるチャットボットよりも強力です。
  • Phi-3やMistral 7Bのような小型言語モデルは標準的なハードウェアで動作し、プライバシーとゼロコストを提供します。
サイト内本文

FastAPI で Scikit-learn モデルをトレーニング、提供、デプロイする

このガイドでは、Scikit-learn 分類器のトレーニング、FastAPI を使用した推論サーバーの構築、ローカルテスト、FastAPI Cloud へのデプロイまでを詳しく説明します。乳がんデータセットとランダムフォレストモデルを使用します。

  • プロジェクト構造のセットアップと依存関係のインストール
  • 乳がんデータセットでランダムフォレストをトレーニングし、joblib で保存
サイト内本文

AIエージェントメモリを3つの難易度で解説

この記事では、AIエージェントのメモリを3つの難易度で説明します。ステートレスなLLMエージェントの根本的なメモリ問題、主要なメモリタイプ(コンテキスト内メモリ、外部メモリ)、そしてスケーラブルなアーキテクチャ(書き込み戦略、検索方法、減衰処理、マルチエージェントの一貫性)について解説します。時間とともに改善するエージェント構築のための実践的な洞察を提供します。

  • ステートレスなLLMエージェントは永続的なメモリを持たず、マルチステップタスクやパーソナライゼーションが困難。
  • コンテキスト内メモリはコンテキストウィンドウを使用して即時状態を管理し、外部メモリは検索(ベクトル検索、構造化クエリ)を通じて永続ストレージを実現。
サイト内本文

ゼロショットテキスト分類入門

ゼロショットテキスト分類は、タスク固有のトレーニングデータなしでテキストにラベルを付ける方法であり、ラベルを自然言語のステートメントに変換し、事前学習済みモデルがテキストがそのステートメントをサポートするかどうかを判断します。この記事では、その仕組み、facebook/bart-large-mnliを使用した単一ラベルおよびマルチラベル分類、カスタム仮説テンプレートによるパフォーマンス向上について説明します。

  • ゼロショット分類はラベルを自然言語のステートメントに変換し、推論タスクとしてラベル付けを行います。
  • Hugging Faceパイプラインと事前学習済みモデル(例:facebook/bart-large-mnli)で簡単に実装できます。
サイト内本文

全ソース