AI News HubLIVE
公開記事 105収集記事 109信頼度 78更新頻度 30 分
稼働状態 正常ソース種別 メディア全文利用権限 サイト内リライト最終取り込み 2026-06-26ID the-new-stack-ai状態 有効

Technical media source; summary-only unless authorization is obtained.

最新公開記事

Fable 5禁止後、Anthropicと19の組織がオープンソースセキュリティ組織を立ち上げ

Linux Foundationは、オープンソースの脆弱性開示を調整する組織Akritesを立ち上げました。創設メンバーにはAnthropic、AWS、Google、Microsoftなど20の組織が含まれます。この取り組みは、AIによる脆弱性発見の加速に対応するため、既存の調整モデルを超えることを目的としています。

  • AnthropicはFable 5禁止後、他の19組織と共に、Linux Foundation傘下のオープンソースセキュリティ調整組織Akritesを立ち上げました。
  • Akritesは共有SIRTを通じて脆弱性レポートを統合し、重複を減らし、重要なオープンソースプロジェクトの修正を加速します。
サイト内本文

米国政府、OpenAIに対し次期GPT-5.6モデルの利用者を制限するよう指示

米国政府はセキュリティ上の懸念から、OpenAIに対し次期GPT-5.6モデルのアクセスを政府承認パートナーに限定するよう指示した。この動きはセキュリティとオープンイノベーションの対立を引き起こし、専門家は開発者が代替モデルに移行し、米国のAI優位性が弱まる可能性を警告している。

  • ホワイトハウスはOpenAIに対し、GPT-5.6のアクセスを少数の政府承認パートナーに制限するよう義務付けた。
  • OpenAIのCEOサム・アルトマンはこの措置に不満を示し、長期的なモデルではないと述べた。
サイト内本文

「コードはメンテナンスするのではなく、再生成すべき」:Codeplainが仕様駆動開発を主張

Codeplainは、コードをメンテナンスするのではなく、仕様から再生成するアプローチを提唱。オープンソースの仕様言語Plainが唯一の真実の情報源となり、新たなエージェンティックフレームワークplain-forgeによりAIエージェントが対話的に仕様をドラフトできる。同社は300万ドルを調達し、仕様こそが保守すべき資産だと主張する。

  • Codeplainはコードをメンテナンスするのではなく、仕様から再生成すべきと提唱。
  • 新フレームワークplain-forgeにより、AIエージェントが対話を通じて仕様を自動ドラフト。
サイト内本文

Azul、AIの前に未パッチのJVMを見つけ出す

Azul Systemsは、AI支援型攻撃者に悪用される前にJavaランタイムの露出を発見するための無料JVM脆弱性リスク評価ツールを提供している。このツールはネットワークをスキャンしてJVMインスタンス(組み込み型や管理外のランタイムを含む)を特定し、CISA KEVやNVDに基づいた優先順位付きの修復ロードマップを返す。Azulはまた、セキュリティパッチのみを提供するアプローチを強調し、リスクを低減する。記事ではAI脅威、特にAnthropicのMythosモデルについて言及しているが、Azulは実際にそのモデルをテストしていない。

  • Azulは無料のJVM脆弱性評価を提供し、ネットワークをスキャンして未パッチのインスタンスを特定する。
  • ツールはCISA KEVとNVDに基づいたセキュリティダッシュボードと修復ロードマップを出力する。
サイト内本文

Anthropic、@Claude を Slack チャンネルに常駐させる

Anthropic は Claude Tag を発表しました。これは Claude を Slack に永続的で共有可能なチームメンバーとして直接埋め込み、時間の経過とともに組織の知識を蓄積し、非同期に作業し、プロンプトなしで行動できる新製品です。Enterprise および Team プランの顧客向けにベータ版で提供され、以前の Claude in Slack アプリを置き換えます。

  • Claude Tag により、Claude は Slack チャンネルの永続的なメンバーとなり、長期タスクを実行しコンテキストを蓄積できる。「エージェントアイデンティティ」により安全なツールアクセスを実現。
  • 複数ユーザーがリアルタイムでタスクを誘導でき、Claude はスケジュールタスクで自律的に動作可能。
サイト内本文

OpenClawとHermesはエージェントの定義で一致するが、その制御方法で意見が分かれる

OpenClawとHermes Agentは、ゲートウェイを重視するかメモリを重視するかでアプローチが異なる。前者はマイクロソフトやエヌビディアに採用され、後者は開発者に広く使われている。両者の違いは制御層にあり、企業はシナリオに応じて選択する必要がある。

  • OpenClawはゲートウェイ優先設計で複数チャネルに対応、マイクロソフトとエヌビディアがバックアップ。
  • Hermesは永続メモリと自己改善スキルで開発者のコンテキストを重視。
サイト内本文

開発者は自分が書いていないコードを検証している——そしておそらく理解もしていない

GitLabのAIアカウンタビリティレポートによると、開発者の43%がAI生成コードと人間作成コードを確実に区別できず、85%がAIによってコード作成からレビューへとボトルネックが移行したと回答しています。このレポートは、AI生成コードを管理するためのガバナンスと統合ツールチェーンの必要性を強調しています。

  • 91%の組織が2つ以上のAIコーディングツールを使用している。
  • 43%がAIコードと人間のコードを確実に区別できない。
サイト内本文

DNSはAIエージェントのアイデンティティの基盤になり得るか?

Linux Foundationは、AIエージェントに検証可能なアイデンティティを提供するオープンスタンダード「Agent Name Service(ANS)」の立ち上げを発表した。これは、DNSを介してエージェントをインターネットのドメイン名システムに結び付けるものだ。2025年のOWASPの研究論文に端を発し、既存のDNSインフラと認証局を活用する。別の検出標準「DNS-AID」がエージェントの発見を担当する。複数の提案が存在するが、主要なAI企業はまだ参加していない。

  • Linux FoundationがANSを発表、DNSに基づくAIエージェントの検証可能なアイデンティティを提供。
  • ANSはACMEを使用してドメイン管理を証明し、証明書を発行、変更をログに記録。
サイト内本文

CursorがGitHub Copilotの代替オープンソースコードアシスタントContinueを静かに買収

AI開発者ツールの統合が加速する中、CursorがオープンソースのコーディングアシスタントContinueを買収し、同製品は廃止されました。Continueはデータ管理に重点を置いたGitHub Copilotのオープンソース代替として位置づけられていました。これはCursorによる18ヶ月にわたる一連の買収の一環ですが、Continueは事実上の買収ハイヤーであり、共同創業者のNate SestiがCursorに加わります。

  • CursorがオープンソースコードアシスタントContinueを買収、製品は廃止。
  • ContinueはY Combinator出身のオープンソースコードアシスタントで、データプライバシーを重視。
サイト内本文

Qodoがクロスリポジトリレビューをリリース:AI過多チームにとっての重要性

Qodoがクロスリポジトリコードレビューなどの新機能を発表。AI生成コードの増加に伴うガバナンス課題に対応。AIによるPRはサイズが大きく、レビューに時間がかかり、バグも増加。Qodoはコーディングパターンの自動発見とルールの集中管理でチームを支援。

  • Qodoはクロスリポジトリレビュー、カスタムルールマイナー、スキルレビュー基準の3機能を発表。
  • AI生成のPRは人間のものより154%大きく、レビューに91%長くかかり、9%多くのバグを含む(DORA報告)。
サイト内本文

バグ修正のバックポートは終了、Valkey プロジェクトはボットを投入

Valkey プロジェクトはバージョン 9.1 で AI エージェントを使用してバグ修正のバックポートを自動化し、メンテナーに多くの時間を節約させました。さらに、Provenance Guard というツールでコードの整合性を保ちます。

  • Valkey 9.1 は AI エージェントを導入し、バグ修正のバックポート、CI テスト、マージ競合を自動処理。
  • Provenance Guard がプルリクエストを自動スキャンし、許可されていないコードの混入を防止。
サイト内本文

Checkmarxの新しいSASTエンジンはLLMが重要ではない。その後の処理が重要だ。

Checkmarxは、決定論的ルールベースのスキャナー、セキュリティデータで訓練されたLLM、そして結果が開発チームに届く前に真陽性か偽陽性かを分類する第3のエンジンを組み合わせた新しいSASTエンジンを発表した。同社はF1スコアが0.499で、業界平均の0.20を大きく上回り、テストでは最先端モデルが見逃した327件の真陽性を発見したと主張している。アーキテクチャの中核はオーケストレーション層であり、3つのエンジンを自動的に統合し、顧客が独自にマルチエンジンワークフローを構築する必要をなくす。

  • Checkmarxの新しいSASTエンジンは、決定論的ルールスキャナー、LLM、および結果が開発者に届く前に偽陽性をフィルタリングする「発見分析エンジン(FAE)」の3つのエンジンで構成される。
  • 同社はF1スコアが0.499で、業界平均(0.20)の2倍以上であり、テストでは最先端モデルが見逃した327件の真陽性を発見したと主張。
サイト内本文

Anthropic、Claude Design を改良してハンドオフを改善、デザイナーとエンジニアの意見は分かれる

Anthropic は Claude Design を大幅に改良し、双方向のデザイン・コード統合、ブランド一貫性、共有使用制限を導入してデザイナーとエンジニア間のハンドオフを簡素化した。デザイナーの Alfie Martin はトークン効率の問題が残り、ハンドオフは改善されていないと批判する一方、エンジニアの Roman Martynenko は統合に楽観的で、ハイブリッドワークフローを予測している。

  • Anthropic は Claude Design をアップデートし、双方向のデザイン・コード統合、ブランドガイドラインへの準拠、新しいエディタ、および追加のコネクタを導入した。
  • デザイナーの Alfie Martin はトークン効率を批判し、ハンドオフは変わらず、完全なAI自動化には警告を発している。
サイト内本文

MCP、不足していたエンタープライズ認証レイヤーを獲得

Model Context Protocol(MCP)にエンタープライズ管理認証拡張機能が追加され、企業は既存のIDプロバイダーを通じてMCPサーバーへのアクセスを集中管理できるようになりました。AnthropicとMicrosoftが最初にサポートし、Oktaが最初のIDプロバイダーです。同意画面なしでトークンを交換するために、新興のOAuth拡張機能ID-JAGを利用します。

  • AnthropicとMicrosoftはClaude、VS Codeなどでエンタープライズ管理認証をサポート。
  • 拡張機能はID-JAGプロトコルを使用し、IDプロバイダーを通じて同意なしのトークン交換を実現。
サイト内本文

Cursor、GitLab、Zedが「GitHubは壊れつつある」で一致。再構築方法では意見が分かれる

SpaceXがCursorを600億ドルで買収した同日、Cursorの共同創業者Tomas Reimersが、AIエージェント中心の世界のために設計されたGit互換のコードホスティングプラットフォーム「Origin」を発表。GitLabとZedもそれぞれの代替案を発表し、AIが生成するコードの重みでGitHubが悲鳴を上げているという認識が広がっている。

  • SpaceXによるCursor買収と同時に、GitHubに代わるプラットフォーム「Origin」が公開された。
  • GitLabはエージェント実行を高速化するためにアーキテクチャを再設計した「Project Switch」を発表。
サイト内本文

Vercel、エージェントをディレクトリとして扱うオープンソースフレームワーク「eve」を発表

Vercel は、AI エージェントを構築するためのオープンソースフレームワーク「eve」を発表しました。各エージェントをファイルのディレクトリとして扱い、Next.js に似たアプローチを採用。耐久性のあるワークフロー、サンドボックス、ツールへの人間の承認機能を備え、Slack や Discord などのチャネルと統合可能。Vercel 社内では 100 以上のエージェントが稼働中。

  • eve は Vercel が開発したオープンソースフレームワークで、AI エージェントを Next.js のアプリと同様にディレクトリとして定義する。
  • 耐久性のあるワークフロー、サンドボックス分離、ツールの人間承認機能を内蔵し、Slack や Discord などのチャネルと統合できる。
サイト内本文

Block社がSlackからAIコーディングエージェント群を管理する方法

Block(Square、Cash Appなどを運営)は、オープンソースのGooseフレームワーク上にBuilderBotを開発し、エンジニアがSlackスレッドで@builderbotをタグ付けすることで、AIコーディングエージェントのフリートを管理できるようにした。BuilderBotは数百のサービスと数億行のコードにわたって、リサーチ、計画、コーディングを処理し、LinearやJiraからチケットを取得し、ブランチを作成し、PRを発行し、CIを監視してフィードバックに基づいて反復する。顧客データや支払い情報には決してアクセスしない。システムは1日あたり20万以上の操作を実行し、週に約1,500のPRをマージしており、これは全プロダクションコード変更の約15%に相当する。BlockはGooseをLinux Foundationに寄贈し、Anthropicと共同でMCPプロトコルを開発した。大規模な人員削減(40%以上)を経て、AIネイティブなエンジニアリングへの移行を進めている。

  • BlockはBuilderBotを使い、SlackスレッドからAIコーディングエージェントを管理し、複数のサービスやリポジトリにまたがる作業を可能に。
  • BuilderBotはチケット処理、ブランチ作成、PR発行、CI監視を自動化。
サイト内本文

Chainguard エージェントスキルが成熟:1000以上の強化されたエージェントスキルを公開レジストリで提供

Chainguard は、AI コーディングエージェントのセキュリティを拡張し、1000以上の強化されたエージェントスキルを備えた公開レジストリ、プライベートレジストリ、および内部スキル向けの強化サービスを提供開始。エージェントスキルを第一級のソフトウェアアーティファクトとして扱い、継続的な強化、監査証跡、Claude Code、Cursor、GitHub Copilot、Gemini CLI などのツールをサポート。また、バージョン管理とアクセス制御により、組織内のエージェントスキルの散乱を解決する。

  • Chainguard は1000以上の強化されたエージェントスキルを公開レジストリで提供し、毎週更新。
  • プライベートレジストリと組織固有のスキル向けの強化サービス(クローズドベータ)を提供。
サイト内本文

AWSがマージキューにAIバウンサーを導入

AWSはニューヨークサミットでDevOps Agentにリリース管理機能を追加したことを発表。AIが生成するコードの増加によるデリバリーボトルネックに対応するため、リリース準備レビューと自律リリーステストを提供開始。

  • AWS DevOps Agentにリリース準備レビューと自律リリーステスト機能が追加され、プレビュー提供中。
  • リリース準備レビューはコード変更を本番要件に対して評価し、リポジトリ間の依存リスクを検出。
サイト内本文

Google、Microsoft、OpenAIが連携し、AIに欠ける信頼層の構築を支援

Linux Foundation傘下のAppia Foundationが設立され、AIサプライチェーン全体で信頼性を検証するためのオープンな仕様策定を目指します。Google、Microsoft、OpenAIを含む13の創設メンバーが参加し、国際標準を具体化した適合仕様を開発。異なる組織間で検証証拠を引き継げる仕組みを提供します。

  • Appia Foundationは、AIの信頼性検証のためのオープンでモジュール化された仕様を策定します。
  • 創設メンバーにはGoogle、Microsoft、OpenAI、Arm、シーメンス、マスターカードなどが名を連ねています。
サイト内本文

AIは壊れていない。データが問題だ

企業はAIに数十億ドルを注ぎ込んでいるが、ゴミのような結果しか得られていない。新興企業Clarioはその理由を知っており、データのROT(冗長、旧式、些末なファイル)を修正する最初のプラットフォームを構築したと主張する。600万ドルのシード資金でステルスモードからローンチしたClarioは、エンタープライズファイルシステムに接続し、メタデータをスキャンしてジャンクを特定し、クリーンアップのワークフローをトリガーする。アクションが行われた場合のみ課金する。初期顧客では最大60%のガベージ率が見られ、AIプロジェクトの品質に影響を与えている。

  • Clarioはストレージコストを膨らませAIプロジェクトを汚染するデータROT(冗長、旧式、些末なファイル)に対処する。
  • 同社は600万ドルのシード資金を調達し、成果ベースの価格モデルを採用している。
サイト内本文

Databricks、企業が運用する2つのデータベースを統合へ

Databricksはデータ+AIサミットでLTAPアーキテクチャを発表し、トランザクション処理と分析システムの乖離を解消、AIエージェント向けにデータ基盤を再構築する。

  • LTAPはトランザクションデータと分析データを単一ストレージ層に統合し、AIエージェントがリアルタイムデータと履歴コンテキストを同時に扱えるようにする。
  • Lakehouse//RTはミリ秒単位のリアルタイム分析を提供し、追加のデータコピーを不要にする。
サイト内本文

AWSの請求額が急増した理由は?新たなエージェントが回答

AWSはFinOpsエージェントのパブリックプレビューを開始。自然言語でクラウドコストを分析し、異常を特定、自動でチケットを作成。FinOpsを定期的なレビューから継続的なワークフローへと移行する。

  • FinOpsエージェントはAWSの3つ目のIT運用向けAIエージェントで、クラウド請求管理に特化。
  • 自然言語での質問が可能で、CloudTrailログと連携してコスト急増の根本原因と責任者を特定。
サイト内本文

Anthropic、Claude Agent SDKのサブスクリプション変更を発効日に一時停止

Anthropicは、Claude Agent SDKを有料サブスクリプションで使用する開発者向けの請求変更を、発効予定日当日に一時停止しました。同社は5月に、Agent SDKの使用量を標準サブスクリプションから分離し、別の月間上限を設定すると発表していました。この停止は、米政府の輸出規制により2つのモデルを撤回した後の動きで、開発者コミュニティをなだめる狙いがあります。

  • Anthropicは6月15日発効予定のClaude Agent SDKの請求変更を一時停止した。
  • 変更案では、Agent SDKの使用量を標準サブスクリプションから分離し、別の月間上限を設定する予定だった。
サイト内本文

Anthropic Fableの混乱を解説

金曜日以来、Anthropic、Mythos、Fableモデルをめぐる論争が話題となっています。本記事では、国防総省との確執、Mythosモデルの発表、ホワイトハウスとの意見の相違、Fable 5のリリースとその安全規制に対する批判、そしてトランプ政権による輸出管理措置に至るまでのタイムラインを整理します。賛否両論を分析し、筆者はAnthropicの対応はおおむね適切であり、結果的にFableの広告になっていると結論づけています。

  • Anthropicが軍事利用に制限を設けたことで、サプライチェーンリスクとみなされる。
  • Mythosモデルのサイバーセキュリティ能力を受け、Project Glasswingを開始。
サイト内本文

Cohere、エンタープライズ向けに Sovereign AI を販売した後、初のコーディングモデルで開発者をターゲットに

Cohere は、Apache 2.0 ライセンスの初のオープンウェイトコーディングモデル North Mini Code をリリース。AI インフラを所有・管理したい開発者を対象とし、30B MoE モデルは H100 GPU 1枚で動作し、エージェンティックコーディングタスクで Mistral、Qwen、Gemma と競合する。

  • Cohere が North Mini Code を発表。300億パラメータの MoE モデルで、アクティブパラメータは30億、Apache 2.0 で提供。
  • モデルは NVIDIA H100 GPU 1枚で動作し、開発者がセルフホスティングを実用的に利用可能。
サイト内本文

AI生成アプリはベンダーのクラウドで動作する——それが問題だ

AIコード生成ツールはプロンプトからアプリを即座に生成できるが、大半がベンダーのクラウド上で実行され、ロックインを引き起こす。本番環境では可観測性、テスト、コンプライアンス、インフラ分断といった課題が生じる。本記事ではLovable、Base44、Replitなどのロックイン度合いを分析し、AIアプリビルダーを評価する基準(可観測性、テスト、コンプライアンス、移植性)を提案する。

  • AIアプリビルダーは素早くアプリを生成するが、デフォルトでベンダーのクラウド上で動作しロックインを招く。
  • 本番環境では、可観測性、テスト、コンプライアンス、インフラ分断の問題が顕在化する。
サイト内本文

Fable 5とMythos 5は停止中:「ボールはAnthropicのコートにある」

先週金曜の夜、Anthropicは新フラッグシップモデルFable 5とMythos 5を突然無効化した。米国政府がFable 5に対する特定の脱獄方法を認識し、輸出管理命令を出したためだ。Anthropicは軽微な脆弱性と主張するが、ホワイトハウスのAI責任者David Sacks氏やAmazonの関与により事態は複雑化し、AI安全規制の前例となっている。

  • 米国政府がFable 5に輸出管理命令を出し、Anthropicはモデルを無効化せざるを得なくなった。
  • Amazon CEOのAndy Jassy氏が研究者が発見した脱獄方法を当局に報告した。
サイト内本文

JetBrainsはAIがスキルギャップを広げる前にIDEスキルの差を埋められるか?

JetBrainsは「コースクリエイタープログラム」を開始し、オンラインのプログラミング教育と業界実践のギャップを埋めるため、プロフェッショナルなIDEにハンズオンコーディング演習を組み込むことを可能にしました。まだ初期段階で、5人のクリエイターのみが統合を完了していますが、AI支援時代における基礎的な開発スキルとIDE習熟度の重要性を強調しています。

  • JetBrainsがコースクリエイタープログラムを発表。UdemyやCourseraなどのプラットフォームからIDE内コーディング演習を埋め込める。
  • オンライン教育における理論と実践のギャップを対象とするが、現時点で統合を完了したクリエイターは5人のみ。
サイト内本文

Fable 5 vs Opus 4.8:本当の勝負は仕様表ではなく実力

Anthropicが新モデルFable 5を発表。Opus 4.8より高性能とされるが、価格は2倍で安全制限もあり。実際のテストでは両者の性能差は小さく、Opus 4.8のコストパフォーマンスが高いことが示された。

  • Fable 5の価格はOpus 4.8の2倍で、安全分類器により機密プロンプトはOpusにルーティングされる。
  • テストでは、Fable 5の分析がわずかに優れていたが、Opus 4.8は半額で同等の結果を提供した。
サイト内本文

全ソース