AI News HubLIVE

今日の必読ニュース

モデル

Google DeepMindのGemma 4 12B、マルチモーダルAIをわずか16GBのRAMでノートPCに搭載

Google DeepMindが公開したGemma 4 12Bは、テキスト、画像、音声をネイティブに処理するオープンソースモデルで、16GBのRAMでノートPC上で動作します。ベンチマークでは2倍のサイズの26Bモデルに迫る性能を発揮し、商用利用可能なApache 2.0ライセンスで提供されます。

  • Gemma 4 12Bは16GBのRAMでノートPC上で動作。
  • テキスト、画像、音声をネイティブに処理。
サイト内本文

Google DeepMind、エンコーダーレスのマルチモーダルモデル「Gemma 4 12B」を公開:ネイティブ音声対応、16GBノートPCで動作

Google DeepMind は Gemma 4 12B をリリースしました。これは120億パラメータの高密度マルチモーダルモデルで、従来のエンコーダーを排除し、視覚と音声を直接LLMのバックボーンに取り入れます。16GB RAMのコンシューマーノートPCでローカル実行可能で、Apache 2.0ライセンスで提供されます。テキスト、画像、音声、ビデオをネイティブに処理し、音声入力をネイティブサポートする初の中型Gemmaモデルです。

  • エンコーダーレスアーキテクチャ:独立した視覚(5.5億)および音声(3億)エンコーダーを廃止し、軽量な視覚エンベッダー(3500万)と直接音声波形投影を採用。
  • 26B MoEモデルに迫る性能を半分以下のメモリフットプリントで実現、16GBデバイスで動作。
サイト内本文
ツール

Google、AI検索結果のオプトアウトを許可するが、ほとんどのサイトに代替手段はない

Googleは初めて、Search ConsoleでAI概要やAIモードなどのAI検索機能をオプトアウトするトグルをウェブサイト運営者に提供する。これらの機能はすでに月間35億人以上のユーザーにリーチしている。新しいパフォーマンスレポートではインプレッションが個別に表示される。この動きは、ウェブサイト運営者が深刻な不利益を被っていると見なす英国の競争・市場庁(CMA)によって促された。

  • GoogleがSearch ConsoleにAI検索機能(AI概要、AIモード)のオプトアウト用トグルを追加。
  • これらのAI機能は月間35億人以上のユーザーにリーチ。
サイト内本文

労働党議員、イーロン・マスクのAI企業を提訴 偽の性的画像めぐり

労働党議員のジェス・アサト氏は、イーロン・マスク氏のAI企業が開発したツール「Grok」によって、本人の同意なく作成された偽の性的画像がX上に拡散されたとして、訴訟を起こした。アサト氏はこうした画像の作成を批判していた経緯がある。

  • 労働党議員ジェス・アサト氏がマスク氏のAI企業を提訴。
  • Grokツールがユーザーによる偽の性的画像生成を助長したと主張。
サイト内本文
Agent

チームはどれだけAIを使うべきか?マネージャーのためのフレームワーク

本記事では、AIの過剰使用と完全回避の両極端を避け、チームのワークフローにおける適切なAI活用のタイミングを決めるための「AIボウタイ」フレームワークを紹介する。5つのフェーズ(調査、統合、思考(AIなし)、計画、実行)から成る。

  • 探索フェーズでは積極的にAIを使い、多様な選択肢を生成する。
  • 思考フェーズではAIを完全に禁止し、人間が中核的な意思決定を行う。
サイト内本文

AIは計算である

この記事は、人工知能、特に大規模言語モデルは、人工的な人格ではなく、計算の一形態として理解されるべきだと主張している。ループ、構成性、エージェンティックハーネスが計算を可能にする役割を考察し、「Verplankalkül」を非公式プログラミング言語として紹介する。

  • LLMは単なる関数近似ではなく、非公式な言語ルールを通じて計算を実行する。
  • 計算の力は無制限ループにあり、AIではエージェンティックハーネスがそれを提供する。
サイト内本文

AIエージェント時代におけるCPUの重要性

AIがチャットボットから自律エージェントへ移行する中、CPUは「航空管制官」としてタスクを調整し、サンドボックスを管理し、軽量モデルを実行する重要な役割を果たしています。ArmとGoogleの専門家は、CPUの効率性とエージェントワークフローにおける重要性を強調しています。

  • CPUはAIエージェントのツール呼び出しやメモリ管理を調整する。
  • GoogleのgVisorは、クラスタあたり毎秒300のサンドボックスを安全に起動可能。
サイト内本文

AIが認知疲労を引き起こす。より迅速かつ効率的に働く方法

研究によると、AIを使用すると仕事量が増え、認知疲労につながる可能性がある。専門家は、ツールを絞り、ガイドラインに従い、出力を洗練することで、効率と品質のバランスを取ることを推奨している。

  • AIは仕事を減らすどころか増やす可能性がある。
  • 使用するツールを慎重に選び、目的を明確にする。
サイト内本文

AIが向上するにつれて、空っぽの約束が明らかになる

本稿は、GoogleのGemini SparkのようなAI生産性ツールを批判し、それらがテクノロジー企業が自ら作り出した問題を解決している一方で、賃金停滞や雇用不安といった体系的な経済問題を無視していると論じる。著者は、AI主導の生産性向上が労働者に利益をもたらしておらず、適切なセーフティネットなしでは不平等を悪化させる可能性があると主張する。

  • GoogleのGemini AIエージェントSparkが個人情報にアクセスし、プライバシー懸念を引き起こす。
  • AI生産性ツールは、テクノロジー企業が曖昧にしたワークライフバランスの問題に対処する。
サイト内本文

リーン推論:リーン生産方式をAIに適用する

本記事では、リーン生産方式の原則をAI推論に適用し、LLM推論における7つのムダを特定し、ジャストインタイムコンテキスト、標準作業、タクトタイム、プロンプトキャッシングなどの核となる原則を提案する。リポジトリ分析エージェントのケーススタディでは、コストを13倍削減し、レイテンシを3.3倍改善した。

  • AIエンジニアリングにおいて、フロンティアモデルの過剰使用、RAGの肥大化、順次ブロッキング、出力欠陥は一般的な推論のムダである。
  • リーン推論の原則には、ジャストインタイムコンテキスト、標準作業、タクトタイム予算、プロンプトキャッシングが含まれる。
サイト内本文
その他の更新(18件)
Agent

SaaSアプリにAIを追加する5つのレベル

シンプルなSaaSからAIネイティブプラットフォームへの移行のための実用的なフレームワーク。MCPサーバーと個人アクセストークンから、埋め込みチャット、会話履歴、カスタムUI生成、そして最終的に計画とスケジューリングを備えたエージェントハーネスまでの5つのレベルを解説。著者は複数の内部エージェント構築と既存フローへのAI組み込みの経験を基に洞察を共有。

  • レベル1:MCPサーバーでAPIエンドポイントを公開。UI変更不要。プロンプトライブラリと評価を構築。
  • レベル2:ダッシュボードにAIチャットウィンドウを埋め込み、ストリーミングとページコンテキストを提供。
サイト内本文

Microsoft Copilot Healthを実際の医療記録で試してみた――その評価

MicrosoftのCopilot Healthプレビューでは、ユーザーが医療記録を共有して個別化されたAI健康アドバイスを受けられます。著者がテストしたところ、技術的な不具合により結果はまちまちで、プライバシー保護措置はあるものの、AIに医療判断を委ねることへの注意を促しています。

  • Microsoft Copilot Healthは個人の医療記録を活用して健康アドバイスをカスタマイズ。
  • プライバシー対策として暗号化、トレーニングデータ非利用、医師の監視がある。
サイト内本文

コパイロットからドライバーへ:MicrosoftのAIが主導権を握る

Microsoftは常時稼働する自律型AIエージェント「Autopilot」を発表。最初のエージェント「Scout」はユーザーの行動を監視し、自動的にタスクを実行して業務を効率化する。ただし、OpenClawベースであることからセキュリティ上の懸念があり、プロンプトインジェクション攻撃のリスクも指摘されている。現在は限られた顧客のみがプレビューにアクセス可能で、GitHub Copilotのサブスクリプションが必要。

  • MicrosoftがAutopilotエージェントカテゴリーを発表。初のScoutは自律的に常時動作する。
  • Scoutは会議の自動スケジュール、期限の通知、リスクの特定などを行い、いわば「ワークナニー」として機能する。
サイト内本文

MetaのAI追従への内部努力

Meta内部チームTBDのリーダーWang氏は、専有モデルとスタートアップ文化を推進するが、会社のレイオフや追跡ソフトウェアへの抗議に直面。AIモデルMuse Sparkは視覚理解で高評価を得る一方、コーディング能力で競合に劣り、今後のモデルはコーディング、エージェントタスク、動画生成に注力する。

  • Wang氏はMetaの長年のオープンソース方針から専有モデルへのシフトを主張
  • TBDは非階層的なスタートアップ文化とタピオカミルクティー交流会で結束を強化
サイト内本文

GitLab、AIワークロード対応のため従業員の14%を削減

GitLabは先月発表した再編計画の一環として、従業員の約14%(約350人)を解雇しました。同社は22カ国からの撤退、管理層のフラット化、AIワークフローによるトラフィック増加に対応するためのインフラ投資を行い、研究開発に重点を置いています。

  • GitLabは従業員の約14%(約350人)を削減。
  • 再編には22カ国からの撤退と管理層のフラット化が含まれる。
サイト内本文

Harmonic が Deep Agents と LangSmith で Scout を再構築し、維持率4倍を達成

Harmonic は Deep Agents と LangSmith を使用して AI Scout を再構築し、ユーザー維持率を4倍に向上させ、ツールを rigid な検索インターフェースから複雑な投資クエリを処理する信頼できるアドバイザーに変えました。

  • Scout V1 は硬直的な LangGraph パイプラインで多くの評価が必要でしたが、V2 は単一のフロンティアモデルと2つのツールカテゴリを使用し、アーキテクチャを簡素化しました。
  • 新しい UX により、ユーザーは自然にインタラクションでき、エージェントが参照できるビジュアライゼーションや検索結果を生成し、共有の真実源を作り出します。
サイト内本文

ロボットがあなたに向かって走ってくる:ClaudeとGrok、どちらで動かしたい?

11のLLMを2Dバトルロワイヤルゲームで競わせた実験の結果、Grok 4.1 Fastが最も低コストで勝利を収め、Claude Sonnet 4.6は過度な協調行動によりパフォーマンスが低下した。この結果は、アライメント税がモデルの性能に与える影響と、従来のベンチマークが実際のタスク成功を予測できないことを示している。

  • Grok 4.1 Fastは30戦中13勝を達成し、1勝あたりのコストは0.97ドル。
  • Claude Sonnet 4.6は5勝したが、1勝あたり26.78ドルとGrokの27倍のコスト。
サイト内本文

Cursor Enterprise向けの組織機能の導入

Cursor Enterpriseは、複数のチームを個別の予算、セキュリティ、機能制御で管理できる組織機能を導入。サンドボックステスト、モデルアクセスのセグメント化、統合分析を提供します。

  • 組織機能により、複数のCursorチームを1つのダッシュボードから管理可能。
  • サンドボックステスト、セグメント化されたアクセス、統合分析などの機能。
サイト内本文
モデル

無料vLLMコース:推論、圧縮、ベンチマーク

DeepLearning.AIとRed Hatが提携し、Red HatのシニアデベロッパーアドボケイトであるCedric Clyburnが講師を務める無料中級コース「vLLMによる高速・効率的LLM推論」を提供。量子化、vLLMによるサービング、ベンチマークをカバーし、9本のビデオレッスン、3つのコード例、1つのクイズを含む。

  • 量子化を適用してモデルのメモリフットプリントを縮小し、精度のトレードオフを測定する方法を学ぶ
  • vLLMでモデルを提供し、連続バッチ処理、PagedAttention、プレフィックスキャッシングを活用する
サイト内本文

LangSmith、Langfuse、Arize によるエージェントの可観測性比較ハンズオン

本記事では、AIエージェントの可観測性ツールとして広く使われているLangSmith、Langfuse、Arizeの3つを比較します。LangChainベースのテストエージェントを設定し、各ツールの統合方法、トレース機能、評価ワークフローを実演します。LangSmithはLangChainとのネイティブ統合が容易で、完全な実行ツリービューとプロンプトデバッグ機能を提供します。Langfuseはオープンソースでフレームワークに依存せず、セッショングルーピングと事後スコアリングをサポートします。Arizeはプロダクション向けML可観測性に特化し、OpenInference標準を採用しています。開発ニーズに応じた最適なツール選択を支援します。

  • エージェントの可観測性では、各ステップ、意思決定、LLMの入出力、ツール呼び出し、トークン使用量、レイテンシ、評価スコアを含む完全な実行グラフを取得する必要がある。
  • LangSmithは環境変数でLangChainとシームレスに統合でき、詳細なトレースとプロンプトデバッグ機能を提供する。
サイト内本文

Trilogy、Fireworks AIによるオープンウェイトAIモデルのエンタープライズワークロード検証を実施

TrilogyのAI Center of Excellenceは、Fireworks AIを推論インフラとして評価し、オープンウェイトモデルの使用を標準化、コストを削減し、数十億トークンスケールのエージェンティックワークフローを実現しました。

  • TrilogyはFireworks AIをエンタープライズ向けオープンウェイトモデルの推論レイヤーとして採用。
  • コストを専有システムの約5分の1に削減し、レート制限の問題を解消。
サイト内本文
政策

トランプ大統領の新たな大統領令、AI企業に自主的なモデル提出を求める

ホワイトハウスは、国防総省やCISAなどの機関に30日以内にAIツールを活用したサイバー防御強化を求める大統領令を発令した。AI開発者は自主的にモデルをセキュリティテストに提出できるが、強制的な承認は明示的に除外されている。最近の政府によるAI企業への圧力を考えると、この協力が実際にどの程度自発的であるかは疑問が残る。

  • 大統領令は国防総省とCISAに30日以内のAIによるサイバーセキュリティ強化を義務付け。
  • AI企業は自主的にモデルを提出可能だが、強制承認はなし。
サイト内本文

英国当局のGoogle AI検索結果に関する新ルールがパブリッシャーに与える影響

英国の競争監視機関CMAは、GoogleがAI搭載検索結果でパブリッシャーのコンテンツを使用する方法の変更を命じ、ニュースサイトがAI要約へのコンテンツ利用をブロックできる権限を与える決定を下した。世界的な波及効果が予想される。

  • CMAは「戦略的市場地位」を持つテクノロジー企業に特別ルールを設定できる新たな権限を行使。
  • 新ルールでは、GoogleがパブリッシャーにAI要約からのオプトアウトを許可することを要求。
サイト内本文

AIを経済・社会・ガバナンスの中心に据えるリスク | 読者の手紙

Nesrine Malikの記事に応えた読者の手紙。AIが執筆や証拠に与える影響を指摘し、偽の引用や信頼性の低い研究が真実と公共の信頼を脅かすと警鐘を鳴らす。

  • AIの問題は味気ない散文ではなく、証拠との関係性にある。
  • 偽の引用に引っかかった執筆者は故意ではなく、研究支援としてAIを信用していた。
サイト内本文
ツール

Impermeabiliza、AIを活用してバレンシアの防水工事を近代化

バレンシアを拠点とする防水専門会社Impermeabilizaは、人工知能を統合して診断、計画、実行を改善し、住宅、産業、商業施設の耐久性を確保しながら、漏水、湿気、カビを防ぎます。

  • Impermeabilizaはバレンシアとその周辺で防水ソリューションを提供。
  • 高度なシステムで漏水、湿気、カビを防止。
サイト内本文

変化するAI市場でSaaSの成功を守る

生き残るための鍵は、AIに適応するだけでなく、積極的にコンテキストを構築し、これらの技術を自社の提供物に統合することです。

  • SaaS企業は積極的にAIコンテキストを構築し、技術を統合する必要がある
  • 適応だけでは不十分であり、積極的な統合が重要
サイト内本文
チップ

EU、外国事業者が欧州の重要技術を「キルスイッチ」で妨害するのを阻止する提案

欧州委員会は、クラウドコンピューティング、AI、半導体生産における外国供給業者への依存を減らし、外国政府や企業が欧州の重要技術サービスを「キルスイッチ」で停止させることを防ぐための技術主権提案を発表した。

  • EUは外国の「キルスイッチ」リスクを排除しようとしている
  • 提案はクラウド、AI、半導体に焦点を当てる
サイト内本文

DLAMIとDLCでSOCIインデックスを使ってコンテナのコールドスタート時間を短縮する

AWS Deep Learning AMIとDeep Learning ContainersがSOCIスナップショッターとインデックスをサポートしました。SOCIは選択的なファイルダウンロード(レイジーローディング)とパラレルプルモードにより、効率的なコンテナイメージ管理を実現し、コンテナ起動時間を大幅に短縮します。この記事ではSOCIの仕組み、各モードの使い分け、パフォーマンスベンチマークを紹介します。

  • SOCI(Seekable OCI)はレイヤーベースのインデックスによるレイジーローディングを可能にし、必要なファイルのみでコンテナを起動。コールドスタート時間を6分59秒から21秒に短縮。
  • AWS DLAMIとDLCは標準Dockerプル、SOCIパラレルプル、SOCIレイジーローディングの3モードを提供し、速度とリソース使用のトレードオフがある。