AI News HubLIVE

今日の必読ニュース

モデル

Microsoft Build 2026:7つの最大の発表

Build 2026において、マイクロソフトは新しいハードウェア、AIモデル、開発者ツールを発表しました。Surface RTX Spark Dev Box、Scoutアシスタント、MAI-Thinking-1推論モデル、量子コンピューティングの進展などが含まれます。

  • Surface RTX Spark Dev Box:ローカルAI開発向けミニPC、Nvidia Armチップと128GBメモリ搭載。
  • Scoutアシスタント:OpenClawベースの常時稼働アシスタント、カレンダー管理や経費報告などを自動化。
サイト内本文

トランプ大統領、AIモデルの公開前審査を指示する大統領令に署名

トランプ大統領は、AI企業が公開前に最先端モデルを連邦政府と共有するための「自主的枠組み」を創設する大統領令に署名した。安全な革新を促進し、重要インフラのサイバーセキュリティを強化することを目的とする。この指令は複数の連邦機関に対し、モデル公開前にその高度なサイバー能力を評価する枠組みを策定するよう求めており、企業は自主的に参加できるが、選択した場合には秘密保護措置が受けられる。

  • トランプ大統領がAIモデルの公開前審査のための大統領令に署名。
  • 連邦機関がAIモデルのサイバー能力を評価し、企業は自主的に参加可能。
サイト内本文

Microsoft初の高度推論AIが登場

MicrosoftはBuild 2026で、新しい旗艦推論モデル「MAI-Thinking-1」を含む一連の社内AIモデルを発表しました。このモデルはクリーンデータでゼロから訓練され、主要なソフトウェアエンジニアリングベンチマークで最先端の性能を達成しています。さらに、画像生成、文字起こし、音声、コーディング向けのモデルも発表され、OpenAIからの依存度を低減する動きが鮮明です。

  • Microsoftが初の高度推論AIモデル「MAI-Thinking-1」を発表。
  • 第三者モデルからの蒸留なし、クリーンデータで訓練。
サイト内本文
Agent

NVIDIA、マイクロソフトと協業し、Windowsデバイスからクラウド、ローカルまでエージェント型AI展開のための統合スタックを提供

Microsoft BuildでNVIDIAとマイクロソフトは、Windowsデバイス、Azureクラウド、ローカル展開向けにエージェント型AIを提供する拡張パートナーシップを発表。RTX SparkとDGX Station for Windows、Microsoft Foundry上のNVIDIAオープンモデル、GitHub CopilotへのOpenShell統合など。

  • NVIDIAとマイクロソフト、RTX SparkとDGX Station for Windowsを発表し、Windows PCでエージェントAIをネイティブに実行。
  • NVIDIA Nemotron 3 UltraなどのオープンモデルがMicrosoft Foundryで利用可能に。
サイト内本文

Build 2026:MicrosoftのMDASHがプレビュー終了、100以上の専門的な脅威ハンティングAIエージェントを発表

MicrosoftはBuild 2026で、マルチモデルエージェント型スキャンハーネス「MDASH」のプレビューを終了し、DefenderやGitHubと連携するエンタープライズセキュリティコントロールプレーンに統合すると発表した。MDASHは100以上の専門AIエージェントを使用して脆弱性をトリアージし、ノイズから真に悪用可能なリスクを優先することで、開発者が迅速に修正できるようにする。

  • MDASHは100以上の専門AIエージェントによるアンサンブルで脆弱性をトリアージし、ノイズから真のリスクを優先する。
  • CyberGymベンチマークで先月の88.45%から96.55%にスコアを向上。
サイト内本文

AIがAIに販売するようになると何が起きるか?

AIはすでに営業メールの作成、CRMシステムの更新、提案書の作成、RFPへの対応を行っている。次のフェーズはさらに破壊的になる可能性がある:人間が会話に参加する前にAIエージェント同士が交渉する。このエピソードでは、AIがエンタープライズセールス、調達、ビジネス関係をどのように変革し、人間の判断と信頼の重要性が持続するかを探る。

  • AIはCRM更新やRFP対応などの管理業務を自動化し、営業担当者が関係構築に集中できるようにする。
  • エージェンティックAIはコールドアウトリーチやデューデリジェンスを処理する可能性があるが、エンタープライズセールスでは人間の信頼が依然として重要。
サイト内本文

マイクロソフト、Buildで初の推論モデルを含む7つのAIモデルを発表 - 現時点で判明していること

マイクロソフトは年次開発者会議Buildで、初の推論モデルを含む7つの新しいAIモデルを発表しました。推論モデル「MAI-Thinking-1」はエンタープライズグレードのクリーンなライセンスデータでトレーニングされました。新しいコードモデル、画像モデル、音声モデルも発表されました。同社はすべてのモデルに透かしが組み込まれ、コスト効率が改善されたと強調しました。また、メイヨークリニックと医療AIのための協力関係も発表しました。

  • マイクロソフトはBuildで7つの新しいAIモデルを発表、初の推論モデルMAI-Thinking-1を含む。
  • MAI-Thinking-1は350億パラメータの推論モデルで、エンタープライズデータでトレーニング。
サイト内本文

私が最も試してみたい4台のNvidia RTX Spark搭載ノートPC – Microsoftの新型Ultraを含む

NvidiaはComputex 2026で、Intel、AMD、Qualcommと競合する新しいRTX Spark CPUを発表しました。Armベースのこのチップは、最大1 petaflopのAIパフォーマンスと128GBのユニファイドメモリを提供します。Microsoft Surface Laptop Ultra、Dell XPS 16 Creator Edition、Asus ProArt P14/P16、MSI Prestige N16 Flip AI Plusが注目モデルで、今秋発売予定、価格は2,000ドル超と見られます。

  • NvidiaがノートPC向けRTX Spark CPUを発表、Armアーキテクチャ採用。
  • 最大1 petaflopのAI性能と128GBユニファイドメモリを搭載。
サイト内本文
チップ

「攻撃が成功すれば壊滅的」:Anthropic、Claude Mythosへのアクセスを拡大

AnthropicはProject Glasswingを拡大し、約150の新たなパートナーにClaude Mythos Previewへのアクセスを提供。このAIモデルは数千の重大な脆弱性を発見したが、透明性の欠如に対する批判もある。

  • AnthropicはProject Glasswingを電力、水道、医療、ハードウェアなどの業界から約150の新組織に拡大。
  • Claude Mythosモデルは主要なOSやブラウザを含むコードベースで1万以上の重大な脆弱性を発見。
サイト内本文
スタートアップ

OpenAI、Codexに役割特化型プラグインを追加し、非開発者向け汎用アプリへ

OpenAIはCodexにデータ分析、営業、投資銀行向けの役割特化型プラグインを追加している。同社によると、週間利用者は500万人で、その5人に1人は開発者ではない。非開発者グループの成長率は開発者の3倍で、OpenAIがCodexを汎用的な作業アプリとして位置づけていることを示している。

  • OpenAIはCodexにデータ分析、営業、投資銀行向けの役割特化型プラグインを導入。
  • Codexの週間アクティブユーザーは500万人で、うち20%が非開発者。
サイト内本文
その他の更新(18件)
Agent

AnthropicのIPO申請、AIのエンタープライズユーティリティへの成熟を示す

AnthropicのIPO申請は、生成AIが研究中心のベンチャー段階から安定したエンタープライズユーティリティへと移行することを示し、価格設定、ライセンス、市場統合に影響を与える。

  • Anthropicの上場は、エンジニアリング目標を企業調達と整合させ、構造化されたリリーススケジュールと価格設定フレームワークを導入する。
  • エンタープライズユーザーは、正式化された価格階層とAPI制限を計画に組み込めるが、厳格なライセンスやモデルの廃止に直面する可能性がある。
サイト内本文

Microsoft Scout:OpenClawを基盤とした新しいAIパーソナルアシスタント

マイクロソフトは、Microsoft 365に統合された常時稼働のAIアシスタント「Scout」を発表。スケジュール管理や経費報告などのタスクを自動化。交通情報やカレンダーを監視し、Teamsやメールから学習。デスクトッププレビュー版が米国のFrontier顧客向けに提供開始。

  • Microsoft ScoutはOpenClawを基盤とした新しいAIパーソナルアシスタントで、Microsoft 365に統合。
  • 交通情報やカレンダーを監視し、Teamsやメールから学習してアクションを提案。
サイト内本文

GitHubが開発者を再び引き寄せる方法

AIコード生成による前例のない成長により、GitHubは障害に見舞われています。同社はインフラを拡張し、Azureに移行し、コアシステムを再構築して信頼性を回復しています。

  • 過去1年間、AIツールによる予想外の成長でGitHubは数百回の障害が発生。
  • 同社は現在の30倍のトラフィックを処理するためにスケーリングし、Azureに移行、中核システムを再構築中。
サイト内本文

Microsoftは本当に本当に本当に開発者にWindowsを再び愛してほしい

Build開発者会議で、Microsoftは開発者向けの多数の新機能を発表しました。デフォルトでダークモードが有効な開発者向け最適化Windows 11エクスペリエンス、プリコンフィギュアされたツール、PowerShellでのネイティブUnixユーティリティ、WSLコンテナ、エージェントペインを備えたインテリジェントターミナル、AIエージェント実行用のポリシー駆動型実行コンテナなどが含まれます。また、Windows AI APIをCPUとGPUに拡張し、2つのオンデバイスAIモデルを導入します。これらの動きは、 distractions を減らし、使い慣れた環境を提供することで、開発者をMacやLinuxから引き離そうとするものです。

  • Microsoftはダークモード、通知オフ、VS Codeなどプリインストールの開発者最適化Windows 11エクスペリエンスを発表。
  • PowerShellでのネイティブUnixコマンド、WSLコンテナ、AIエージェント統合のインテリジェントターミナル、エージェント実行コンテナ(MXC)などの新機能。
サイト内本文

Microsoft、Intelligent TerminalでWindowsターミナルを再発明

MicrosoftはIntelligent Terminal(実験的機能)を発表。AIエージェントをWindows 11のターミナルに直接統合し、GitHub CopilotやClaude Codeなどのエージェントをサポート。エラーを自動検出し、ワンクリックで修正提案を行うことで開発者のワークフローを効率化する。

  • MicrosoftがIntelligent Terminalを発表、AIエージェントをWindows 11ターミナルに統合。
  • GitHub Copilot、Claude Code、Codexなどのエージェントプロトコルに対応。
サイト内本文

マイクロソフトのProject SolaraはAIエージェントデバイス向けOS

マイクロソフトはBuild 2026で、AIエージェントを実行するガジェット向けの新しいOS「Project Solara」を発表した。WindowsではなくAndroidベースで構築されている。2つのコンセプトデバイス(デスク型とバッジ型)が公開されたが、マイクロソフトはこれらを実際に販売せず、参考設計として提供する。AccuWeather、Best Buy、CVS Healthcare、Targetなどがパイロットを計画している。

  • マイクロソフトがBuild 2026でProject Solaraを発表。AndroidベースのAIエージェントOS。
  • デスク型とバッジ型の2つのコンセプトデバイスをデモ。
サイト内本文

AI脆弱性インテリジェンスエージェント:CVEを実用的なセキュリティレポートに変換

CVE AI Agentは、CVEデータを継続的に取り込み、強化し、トリアージする自律型脆弱性インテリジェンスエンジンです。n8n、Jira、Slack、Splunkなどのサードパーティツールを介して発見結果をプラットフォームに配信します。トークン効率の高いアーキテクチャを採用し、決定論的最小化ロジックでノイズを除去、プロンプトは平均1,000トークンに抑えられています。エージェントは厳格な2パスアーキテクチャに従います:パス1では測定可能なすべてのデータを決定論的に抽出し、パス2ではLLMを使用して定性的なセクションを埋めます。Gemini、OpenAI、Claude、Groq、Ollamaなど複数のLLMプロバイダをサポートし、Webダッシュボードも提供します。

  • CVE AI Agentは、SOCグレードの監査可能な脆弱性インテリジェンスのための自律型パイプラインです。
  • 2パスアーキテクチャを採用:決定論的エンジンがデータを抽出し、LLMは定性的な部分のみを担当し、幻覚のリスクを低減します。
サイト内本文

Work IQ:マイクロソフトのエージェントファーストエンタープライズITへの大きな賭け、疑問あり

マイクロソフトのWork IQはエンタープライズAIエージェントを劇的に賢くする可能性があるが、エージェントファーストITへの移行にはコスト、ガバナンス、データ暴露、運用リスクに関する深刻な疑問が伴う。

  • マイクロソフトWork IQはエンタープライズソフトウェアを再設計し、エージェントが動的にデータ構造を発見できるようにする。
  • エージェントはgetSchemaを使用して、事前定義モデルなしで実行時にデータ構造を理解する。
サイト内本文

本番コーディングエージェント向けモデル評価方法

本稿では、LLMコードベンチマークと実際の本番環境との間のギャップを分析し、リーダーボードのスコアのみに依存する問題点を指摘する。HumanEval、SWE-benchなどの主要ベンチマークが実際に測定する内容を分類し、品質指標の定義、タスクに合ったベンチマークの選択、内部評価の実施、重み付けスコアリング、継続的評価の5ステップからなる評価フレームワークを提案する。単一ベンチマークへの過度な依存、実行ベース評価の無視、インフラオーバーヘッドの考慮漏れなどの落とし穴にも警鐘を鳴らす。最終的に、実際のコードベースから構築した内部評価セットが最も信頼できる選択基準であると結論づける。

  • ベンチマークスコアと本番パフォーマンスには大きな乖離があり、批判的な解釈が必要
  • 様々なベンチマークは異なる能力を測定し、単一のベンチマークでは不十分
サイト内本文

マイクロソフト、クアルコムが実現できなかったミニSurface開発ボックスを開発

マイクロソフトは、開発者向けミニPC「Surface RTX Spark Dev Box」を発表。NvidiaのArmベースRTX Sparkチップを搭載し、128GBのユニファイドメモリを備え、最大1200億パラメータのモデルをローカル実行可能。Visual Studio CodeやGitHub Copilotなどのツールをプリインストールし、年内に米国で発売予定。

  • Surface RTX Spark Dev Boxは、Xbox Series Xの上部に似たアルミシャーシがヒートシンクを兼ね、熱設計電力は100W。
  • 128GBのユニファイドメモリを搭載し、最大1200億パラメータのモデルをローカルで実行可能。
サイト内本文

OpenAIのCodexがナレッジワーカー向け新ツール「Sites」「Annotations」、プラグインを追加

OpenAIは、Codexの週間アクティブユーザー500万人の20%がプログラマーではなくナレッジワーカーであることを受け、新機能を発表。Sites(インタラクティブなWebサイト作成・共有)、Annotations(文書内の特定箇所を指定してAIに修正させる)、データ分析や営業向けプラグインなど。

  • Codexユーザーの20%がナレッジワーカーに。
  • Sitesでコード不要のWebサイト作成・共有が可能に。
サイト内本文
政策

Google Phoneアプリが連絡先を装う詐欺師を警告

GoogleはPhoneアプリに新機能を導入し、AIなりすまし詐欺から保護します。エンドツーエンド暗号化RCSを利用し、連絡先の番号を偽装した電話を警告。FBIによると2025年に米国人はAI詐欺で8億9300万ドル以上を失いました。この機能はAndroid 12以降のPixel端末でデフォルト有効で、双方がGoogle Phoneを使用する必要があります。その他、子供の安全、AirDrop対応、AI試着などのアップデートも。

  • Google PhoneアプリがAI音声クローンを使った連絡先装う詐欺電話を検出。
  • FBI報告:2025年にAI詐欺で8億9300万ドルの被害。
サイト内本文

Amazon Nova 2 Liteを使用した物体検出

この記事では、Amazon Nova 2 Liteを使用した物体検出の実装方法を説明します。Amazon Bedrock、AWS Lambda、Amazon API Gatewayを使用してアプリケーションをデプロイし、効果的なプロンプトの作成、構造化JSON出力の処理、結果の可視化を学びます。製造業、農業、物流における実用的なアプリケーションを探ります。

  • Amazon Nova 2 Liteは自然言語プロンプトで物体を検出し、トレーニング不要。
  • Amazon Bedrock、Lambda、API Gatewayでサーバーレスアプリをデプロイ。
サイト内本文

AIで各職種に履歴書を最適化 | Show HN

Refer MeがAIを用いた履歴書調整ツールを発表。求人情報に基づいて自動で最適化し、ATS(採用管理システム)の通過率を高め、競争の激しい就職市場で差別化を図ります。

  • 求人情報に合わせてAIが自動で履歴書を調整
  • ATS(採用管理システム)に対応した最適化を実施
サイト内本文
ツール

ハンマーと釘:データアナリストにとってAIができることとできないこと

本記事は、データ分析におけるAIの実際の有用性と限界を探る。AIはコード作成とデータ資産開発を大幅に加速するが、アドホックなデータ質問への回答や指標変化の分析には一貫性がなく(精度約86%)、多大なデータ準備が必要である。AIは人間のアナリストが提供する判断力、文脈知識、組織知を代替できない。著者は、AIが役立つ場面では活用し、欠点については冷静に認識するバランスの取れたアプローチを提唱する。

  • AIはコード作成とデータ資産構築の効率を大幅に向上させる。
  • AIのアドホックデータ質問への精度は約86%で、ダッシュボードを置き換えるにはまだ信頼性が不十分。
サイト内本文
モデル

マイクロソフト、クラウドコストなしでLLMを実行するSurface RTX Spark Dev Boxを発表

マイクロソフトはBuild 2026で、NvidiaのBlackwellアーキテクチャ採用RTX Sparkプロセッサと128GBユニファイドメモリを搭載したコンパクトデスクトップ「Surface RTX Spark Dev Box」を発表。1 petaflopのAI演算能力を提供し、開発者は1200億パラメータ以上のモデルをローカルで実行可能。クラウドAPIのトークン単位の課金モデルに挑戦する。

  • 1200億パラメータ以上のAIモデルをローカル実行
  • Nvidia Blackwell RTX Sparkプロセッサと128GBユニファイドメモリを搭載
サイト内本文

MythosとGPT-5.5は多くの脆弱性を見つけるだろう。それで十分か?

MythosやGPT-5.5のような最先端AIモデルは現実の脆弱性を発見できるが、エンタープライズ向けの攻撃的セキュリティには、バグ発見以上のもの、すなわちカバレッジ、検証、安全性、ガバナンス、運用統合が必要である。

  • AIモデルは脆弱性を発見できるが、企業の防御には完全なカバレッジと検証が必要。
  • マルチステップ推論、持続的なカバレッジ、安全性がAIセキュリティシステムの主要な課題。
サイト内本文

トランプ大統領、新たなAIリリースへの早期アクセスを求める大統領令に署名

トランプ大統領は、強力なAIモデルの公開前に連邦政府が審査する自主的な枠組みを創設する大統領令に署名した。公開最大30日前に企業がモデルを提出し、サイバーセキュリティや国家安全保障の脅威に対処する狙いがある。これは、これまでの規制緩和の姿勢からの転換となる。

  • トランプ大統領、AIモデルの公開前審査の自主的枠組みを創設する大統領令に署名
  • 企業は公開最大30日前にモデルを提出