AI News HubLIVE

今日の必読ニュース

モデル

コストと速度を最適化する自動LLMルーティング

Factory Router は、各コーディングタスクに最適なAIモデルを自動選択し、パフォーマンスを維持しながらコストを最大25%削減します。分類器でモデルをスコアリングし、品質を犠牲にすることなくコスト効率の良いオプションにルーティングします。プライベートプレビューで利用可能です。

  • Factory Router は各タスクに最もコスト効率の良いAIモデルを自動選択します。
  • フロンティア性能を維持しながらコストを最大25%削減。
サイト内本文

アンソロピック、誰も理解しない輸出規制の標的に

トランプ政権は国家安全保障を理由に、アンソロピックに対し、最新AIモデル「Fable 5」と「Mythos 5」へのアクセスを全ての外国人に遮断するよう突然命令。米国内のユーザーや自社従業員も対象となり、業界に混乱が広がっている。専門家は前例のない措置と指摘する。

  • 米国初のAIモデルへの輸出規制適用、対象はアンソロピックのFable 5とMythos 5
  • 米国内のユーザーや自社従業員を含む全外国人のアクセスを遮断
サイト内本文
Agent

各トークンからより多くの価値を引き出す:Copilot がコンテキスト処理とモデルルーティングを改善する方法

GitHub Copilot は、プロンプトキャッシュとオンデマンドツール読み込みにより冗長なコンテキストを削減し、タスクの意図とモデルのリアルタイム健全性に基づいて最適なモデルを選択する Auto モデル選択を導入することで、品質を犠牲にすることなくクレジットを節約します。

  • プロンプトキャッシュとツール検索により、ターンごとの冗長なコンテキストが削減されます。
  • Auto モデル選択は、タスクの意図とモデルの健全性を使用して適切なモデルを選択します。
サイト内本文

AGENTS.mdの匂いが熟しているなら、コードは期待に応えられない

研究者は、AIコーディングエージェントの設定ファイルは最小限にすべきと指摘。532,000ファイルの分析により、91%のAGENTS.mdファイルに少なくとも1つの「設定の臭い」が存在し、トークンとパフォーマンスを浪費していることが判明。

  • 91%のAGENTS.mdファイルに少なくとも1つの設定の臭いが存在
  • 最も一般的なのはLint漏洩(62%)、コンテキスト膨張(42%)、スキル漏洩(35%)
サイト内本文

AIコードのベビーシッティングをやめる方法

LLMエージェントは機能開発を安価にするが、アーキテクチャの腐敗をもたらす。アーキテクチャ上の決定を実装から分離し、ビルドシステムのチェックでルールを強制することで、開発者は生成されたコードのレビュー負担を減らし、システム設計に集中できる。

  • AIエージェントはアーキテクチャの境界を破る近道を取りがちで、技術的負債を生む。
  • ルールをドキュメントではなくビルドチェックとしてコード化することで、確定的に強制される。
サイト内本文

AIコンプライアンスとガバナンスのためのチャットボットとエージェントのリアルタイム監視

PSAは行動証拠層として、AIガバナンス義務の測定可能な部分を満たすための決定的、タイムスタンプ付き、外部検証可能な測定を提供します。本稿ではPSAを2026年に施行される12のフレームワークにマッピングし、6つの証拠プリミティブを定義し、その適用範囲と限界を正直に示します。

  • PSAはAIガバナンス義務を定量化可能な指標に変換する行動証拠層です。
  • 6つの証拠プリミティブを定義:イベントログ、改ざん防止、敵対的ロバスト性、人間-AI相互作用リスク、継続的監視、透明性。
サイト内本文

AIについて誰もが同意することのもどかしさ

著者はAIに対する加速主義、芸術家、ナショナリズム、破滅論、開放主義といった矛盾する立場すべてに共感し、最終的にAI開発者に重大な害の責任を負わせるよう議員に働きかけることを提案する。

  • 著者は加速主義者、芸術家、ナショナリスト、破滅論者、開放主義者など、対立する立場すべてに同意している。
  • すべての議論は正しいが、どれが最も正しいかはAIの将来の展開次第である。
サイト内本文

Show HN:Relaymux —— tmuxベースのローカルコーディングエージェント向けメタハーネス

Relaymux は、Telegram を介してコーディングエージェントをリモート制御し、tmux で作業を可視化する軽量なローカルメタツールです。Node.js 20+、tmux、およびローカルエージェント CLI が必要で、簡単なインストールとデバッグ機能を提供します。

  • Relaymux は Telegram メッセージでローカルコーディングエージェントを起動・管理し、全ての動作は tmux 上で可視化されます。
  • インストールは curl コマンド一つで完了。Telegram がメインインターフェースで、iMessage/SMS はベータ版。
サイト内本文
ツール

ChatGPTのAIアシスタント市場シェアが50%未満に低下、GeminiとClaudeが成長

Sensor Towerの2026年AIレポートによると、ChatGPTの市場シェアは初めて50%を下回り46.4%となり、GoogleのGeminiとAnthropicのClaudeがそれぞれ27.7%と10.3%に成長しました。ユーザーはますますアシスタントを切り替えるようになり、ブランド信頼と価値観の一致が重要な要素となっています。

  • ChatGPTの市場シェアは50%超から46.4%に低下しました。
  • GeminiとClaudeはそれぞれ27.7%と10.3%の市場シェアを獲得しました。
サイト内本文

AIがバイオ医薬品を変革する——変化の順序が重要な理由

本稿では、バイオ医薬品分野におけるAIの変革可能性を探り、データ統合から臨床試験最適化に至る実装順序が成功の鍵を握ると強調する。

  • AIは創薬を加速するが、適切な導入順序が不可欠
  • データ品質とアルゴリズムの透明性が主要な課題
サイト内本文
その他の更新(12件)
Agent

Vercel、オープンソースのAIエージェントフレームワーク「Eve」をリリース — 各エージェントは機能にマッピングされたファイルのディレクトリ

VercelがApache-2.0ライセンスのエージェントフレームワーク「Eve」を公開プレビューとしてオープンソース化しました。エージェントはファイルのディレクトリであり、耐久性のある実行、サンドボックス、承認、接続、チャネル、評価が組み込まれています。npx eve@latest init でスキャフォールドし、vercel deploy でそのままデプロイできます。

  • 各エージェントはファイルのディレクトリであり、各フォルダが1つの機能にマッピング
  • 耐久性のある実行、サンドボックス、承認、接続、チャネル、評価が組み込み済み
サイト内本文

データとAIエージェントのためのコンテキストインテリジェンスの大規模展開

AWSニューヨークサミットで、AWSは、AWS Context(近日公開)、AWS Glue Data Catalogのビジネスコンテキストとセマンティック検索(プレビュー)、Amazon S3 Annotations(一般提供開始)などの一連のイノベーションを発表しました。これらは、AIエージェントに信頼できるコンテキストを提供し、データレイク、データウェアハウス、データベース、ストリーム、そして文書化されていない組織知識に散在するコンテキストに安全にアクセスできるようにします。ナレッジグラフ、ID認識アクセス、オープンスタンダードを通じて、組織は共有・管理可能なコンテキストレイヤーを構築し、AIエージェントの意思決定能力を向上させることができます。

  • AWS Contextは既存のデータ間の関係を自動的にナレッジグラフにマッピングし、AIエージェントが実行時に管理されたデータ関係やビジネスルールにアクセスできるエージェント検索を提供します。
  • AWS Glue Data Catalogにビジネスコンテキストとセマンティック検索(プレビュー)が追加され、技術メタデータをビジネス記述や用語で強化し、スキルアセットでエージェントに追加のガイダンスを提供します。
サイト内本文

Vercel、エージェントをディレクトリとして扱うオープンソースフレームワーク「eve」を発表

Vercel は、AI エージェントを構築するためのオープンソースフレームワーク「eve」を発表しました。各エージェントをファイルのディレクトリとして扱い、Next.js に似たアプローチを採用。耐久性のあるワークフロー、サンドボックス、ツールへの人間の承認機能を備え、Slack や Discord などのチャネルと統合可能。Vercel 社内では 100 以上のエージェントが稼働中。

  • eve は Vercel が開発したオープンソースフレームワークで、AI エージェントを Next.js のアプリと同様にディレクトリとして定義する。
  • 耐久性のあるワークフロー、サンドボックス分離、ツールの人間承認機能を内蔵し、Slack や Discord などのチャネルと統合できる。
サイト内本文

AIクローラーのトラフィックがGooglebotに匹敵

Hacker Newsのトップページに掲載されたサイトの30日間のトラフィック分析によると、AIクローラー(GPTBot、ClaudeBotなど)と検索エンジンクローラーがそれぞれ全体の35%を占め、首位を並びました。記事では、最も活発なクローラー、最も丁寧なクローラー、最も執着的なクローラー、最も網羅的なクローラーなどの行動特性を比較しています。

  • AIクローラーと検索エンジンクローラーが各35%でトップタイ
  • AmazonBotは最も活発なAIクローラーで、1日あたり1,101ヒット
サイト内本文

Block社がSlackからAIコーディングエージェント群を管理する方法

Block(Square、Cash Appなどを運営)は、オープンソースのGooseフレームワーク上にBuilderBotを開発し、エンジニアがSlackスレッドで@builderbotをタグ付けすることで、AIコーディングエージェントのフリートを管理できるようにした。BuilderBotは数百のサービスと数億行のコードにわたって、リサーチ、計画、コーディングを処理し、LinearやJiraからチケットを取得し、ブランチを作成し、PRを発行し、CIを監視してフィードバックに基づいて反復する。顧客データや支払い情報には決してアクセスしない。システムは1日あたり20万以上の操作を実行し、週に約1,500のPRをマージしており、これは全プロダクションコード変更の約15%に相当する。BlockはGooseをLinux Foundationに寄贈し、Anthropicと共同でMCPプロトコルを開発した。大規模な人員削減(40%以上)を経て、AIネイティブなエンジニアリングへの移行を進めている。

  • BlockはBuilderBotを使い、SlackスレッドからAIコーディングエージェントを管理し、複数のサービスやリポジトリにまたがる作業を可能に。
  • BuilderBotはチケット処理、ブランチ作成、PR発行、CI監視を自動化。
サイト内本文

Chainguard エージェントスキルが成熟:1000以上の強化されたエージェントスキルを公開レジストリで提供

Chainguard は、AI コーディングエージェントのセキュリティを拡張し、1000以上の強化されたエージェントスキルを備えた公開レジストリ、プライベートレジストリ、および内部スキル向けの強化サービスを提供開始。エージェントスキルを第一級のソフトウェアアーティファクトとして扱い、継続的な強化、監査証跡、Claude Code、Cursor、GitHub Copilot、Gemini CLI などのツールをサポート。また、バージョン管理とアクセス制御により、組織内のエージェントスキルの散乱を解決する。

  • Chainguard は1000以上の強化されたエージェントスキルを公開レジストリで提供し、毎週更新。
  • プライベートレジストリと組織固有のスキル向けの強化サービス(クローズドベータ)を提供。
サイト内本文

AI推論の経済学

2024年にOpenAIが初の推論モデルo1をリリースして以来、推論能力は急速にAIモデルの標準となった。しかし、推論には多大な計算リソースが必要であり、テスト時計算で精度は向上するが、コストが急増する。本記事では、推論の種類、適用シナリオ、性能とコストへの影響を分析し、単純なタスクでは推論を無効にすることでコストを大幅に削減し、速度を向上できると結論付けている。

  • 推論モデルはテスト時計算の増加により精度を向上させるが、コストは6倍以上になる可能性がある
  • AIのユースケースの約半数は推論を必要としない単純なタスクである
サイト内本文

Anthropic、ソウルオフィスを開設し、韓国AIエコシステムとの新たなパートナーシップを発表

Anthropicはソウルに新オフィスを開設し、NAVER、Nexon、LG CNS、サムスンSDSなど韓国の企業やスタートアップ、研究機関との提携を発表。Claudeの韓国での活用を推進する。

  • Anthropicがソウルオフィスを開設、KiYoung Choi氏が代表に就任。
  • NAVER、Nexon、LG CNS、サムスンSDSなどが大規模にClaudeを導入。
サイト内本文
研究

アメリカ人の3分の2がAIの進歩は速すぎると考えている

ピュー研究所の最新調査によると、アメリカ人の49%がチャットボットを少なくとも時々利用しているが、63%がテクノロジーの進歩は速すぎると考えている。2024年以降、AIチャットボットの利用は大幅に増加したが、世論は依然として否定的で、AIが社会にプラスの影響を与えると考える人はわずか16%である。若い世代ほどAIを利用するが、より悲観的である。

  • 49%のアメリカ人がチャットボットを利用、63%がAIの進歩は速すぎると回答。
  • ChatGPTの利用率は2023年から倍増し44%に。
サイト内本文
モデル

Charity Majorsの引用:AIがコード生産の経済を変えた

2025年、コード生産の経済学が根本的に変化し、コードが無料かつ即座に生成可能になり、使い捨て可能なものになった。

  • コード生成のコストが劇的に低下し、ほぼ無料かつ即時に。
  • コードが大切にされる資源から使い捨て可能なものへと変わった。
サイト内本文
ツール

Standard DB – AIビルダーのハブ

Standard DBは、AIビルダー向けのプラットフォームで、プロフィール作成、作業共有、他者の活動追跡、およびクレジット、ツール、パートナープログラムを提供するオファーマーケットプレイスを提供します。

  • プロフィールを作成し、AIプロジェクトを公開
  • 他のビルダーの活動をチェック
サイト内本文
政策

ホワイトハウスとAnthropicのFableをめぐる対立を読み解く

本稿は、ホワイトハウスがAnthropicのFableおよびMythosモデルに輸出規制を課した背景にある政治的混乱を分析し、Anthropicがトランプ政権との対立により苦境に立たされていること、そしてAI規制の不確実性を浮き彫りにしている。

  • ホワイトハウスは国家安全保障を理由にAnthropicのAIモデルに輸出規制を課した。
  • 説明は矛盾:脱獄懸念と政治的敵意の両方が存在。