AI News HubLIVE

今日の必読ニュース

モデル

Fable 5禁止後、Anthropicと19の組織がオープンソースセキュリティ組織を立ち上げ

Linux Foundationは、オープンソースの脆弱性開示を調整する組織Akritesを立ち上げました。創設メンバーにはAnthropic、AWS、Google、Microsoftなど20の組織が含まれます。この取り組みは、AIによる脆弱性発見の加速に対応するため、既存の調整モデルを超えることを目的としています。

  • AnthropicはFable 5禁止後、他の19組織と共に、Linux Foundation傘下のオープンソースセキュリティ調整組織Akritesを立ち上げました。
  • Akritesは共有SIRTを通じて脆弱性レポートを統合し、重複を減らし、重要なオープンソースプロジェクトの修正を加速します。
サイト内本文

米国政府、OpenAIに対し次期GPT-5.6モデルの利用者を制限するよう指示

米国政府はセキュリティ上の懸念から、OpenAIに対し次期GPT-5.6モデルのアクセスを政府承認パートナーに限定するよう指示した。この動きはセキュリティとオープンイノベーションの対立を引き起こし、専門家は開発者が代替モデルに移行し、米国のAI優位性が弱まる可能性を警告している。

  • ホワイトハウスはOpenAIに対し、GPT-5.6のアクセスを少数の政府承認パートナーに制限するよう義務付けた。
  • OpenAIのCEOサム・アルトマンはこの措置に不満を示し、長期的なモデルではないと述べた。
サイト内本文

インシデントレポート:CVE-2026-LGTM

アンドリュー・ネスビットによる仮想的なインシデントレポート。競合ベンダーの2つのAIレビューエージェントがパッケージの悪意性をめぐって意見の相違ループに陥り、莫大な推論コストとプレスリリースを引き起こす様子を描く。

  • 2つのAIレビューエージェントがソフトウェアパッケージの評価をめぐり無限の議論ループに陥る。
  • 議論により340件のコメントと41,255ドルの推論コストが発生。
サイト内本文

ディープエージェントのプロンプトキャッシング

Deep Agentsがプロンプトキャッシングを活用し、追加設定不要で主要モデルプロバイダーのLLMトークンコストを最大80%削減する方法をご紹介します。

  • プロンプトキャッシングは、プロンプト処理後のモデル状態を保存することで、推論トークンコストを41〜80%削減します。
  • プロバイダーごとにキャッシュ制御のサポートが異なり、プロバイダーに依存しない最適化は困難です。
サイト内本文

OpenAI、GPT-5.6シリーズ「Sol」「Terra」「Luna」をプレビュー

OpenAIはGPT-5.6シリーズの限定プレビューを開始した。フラッグシップモデルのSol、バランス型のTerra、高速で低コストなLunaの3モデルを提供。TerraはGPT-5.5と同等の性能で半額、Lunaは最高の低価格で強力な能力を発揮する。価格は100万トークンあたりSolが入力5ドル/出力30ドル、Terraが2.50ドル/15ドル、Lunaが1ドル/6ドル。また、明示的なキャッシュブレークポイントと30分の最小キャッシュ寿命をサポートするプロンプトキャッシュ機能を改善。米国政府との連携により、まずは限られた信頼できるパートナー向けに限定プレビューを提供し、その後広く公開する予定。

  • GPT-5.6シリーズにはSol(フラッグシップ)、Terra(バランス)、Luna(高速・低コスト)の3モデルがある。
  • TerraはGPT-5.5と同等の性能で半額、Lunaは最低価格で強力な機能を提供。
サイト内本文
政策

Pixel上で凍結マルチトークン予測を用いたGemini Nanoモデルの高速化

Googleの研究者は、デプロイ済みのGemini Nano v3モデルにマルチトークン予測(MTP)を導入し、バックボーンの再トレーニングなしにモバイルデバイスでの推論速度向上と消費電力削減を実現しました。Pixel 9および10シリーズに適用され、AI通知要約や校正機能で速度が50%以上向上しています。

  • バックボーンを凍結し、軽量なMTPヘッドを追加することで、別個のドラフターモデルのメモリオーバーヘッドなしにシームレスな高速化を実現。
  • ゼロコピーアーキテクチャにより、MTPヘッドがメインモデルのKVキャッシュを直接利用でき、メモリ使用量を130MB削減し、ドラフトプリフィルレイテンシを排除。
サイト内本文

AI支援ソフトウェア移植の発見可能な証拠

本記事では、AI支援によるソフトウェア移植中に生成される発見可能な証拠(コード差分、コメントパターン、移行痕跡など)を探り、ソフトウェア検証や監査への影響を分析します。

  • AI支援移植はコードベースに追跡可能な証拠を残す
  • その証拠は移植の正確性と完全性の検証に役立つ
サイト内本文
ロボット
Agent

私たちとAIが善を選んでいるかどうかを見分ける方法

この記事では、人間とAIが行動において善を選んでいるかどうかを認識する方法を探ります。筆者は3つの指標を提案する:手段と目的(カントとキルケゴール)、悪徳と美徳(アリストテレス)、浅い思考と深い思考(ザルツバーグとスピノザ)。善の本質を定義するのは難しいが、これらの指標は人間とAIの意思決定を導くのに役立つ。

  • カントとキルケゴールは手段と目的の一致を強調し、AIは非倫理的な近道をとるべきではない。
  • アリストテレスの徳倫理学は悪徳間のバランスを示唆するが、AIは直接美徳を実践できない。
サイト内本文

大きなコンテキストウィンドウはコーディングエージェントにとって間違った抽象化である

大きなコンテキストウィンドウは有用だが、連続性とは異なる。本記事は、コーディングエージェントにはより大きなプロンプト空間ではなく、永続的で信頼できるメモリが必要だと主張する。コンテキストネイティブとメモリネイティブのエージェントを比較し、検索だけでは不十分な理由を説明し、Sigilixのメモリバッキングレイヤーアプローチを紹介する。小さなモデル(Boreas)でも、基盤が準備されていれば、連続性の重いタスクで大きなモデルを凌ぐことができる。さらに、メモリシステムの失敗モードや、ソース、スコープ、減衰、証拠の重要性についても触れている。

  • コンテキストサイズは連続性と等しくない;大きなウィンドウはより多くのテキストを運ぶが、何を記憶するかは決定しない。
  • 検索は「どのテキストが関連するか」に答えるだけで、「リポジトリが何を教えたか」には答えず、エージェントは依然として忘れっぽくなりうる。
サイト内本文
その他の更新(12件)
Agent

AIコーディングエージェントのコストが、まもなく開発者の給与を上回る可能性

Gartnerは、AIコーディングエージェントの従量課金制により、開発者の月額コストが20,000ドルに達する可能性があり、透明性やコスト管理ツールが不足していると警告。トークン消費の増加が生産性向上に直結するわけではなく、コンテキストエンジニアリングやモデルルーティングによる最適化を推奨。2028年までにAIコーディングコストが平均開発者給与を超えると予測。

  • シートベースから従量課金制への移行でコストが急騰
  • コスト最適化ツールの欠如と透明性の低さがトークン消費を促進するが生産性向上にはつながらない
サイト内本文

Claude、Codex、Cursorに直接統合できるスマートモデルルーター

Weave Routerは、リクエストごとに最適なAIモデルを自動選択するオープンソースのモデルルーターです。多様なAPI形式をサポートし、コストを40〜70%削減します。

  • Avengers-Pro 2ベースのクラスタースコアラーにより、リクエストごとに最適なモデルにルーティング
  • Anthropic、OpenAI、Gemini API、およびOpenRouter経由のオープンモデルをサポート
サイト内本文

AI検索エンジンがあなたのサイトを引用できるかをチェックする無料ツール

この無料のGEOチェッカーは、ChatGPT、Claude、Perplexity、GeminiなどのAI検索エンジンにおけるサイトの可視性を7つの技術レイヤー(llms.txt、構造化データ、サービスのカタログAPI、OpenAPI仕様、Agent Card、ヘルスエンドポイント、ロボットとサイトマップ)でチェックし、スコアと改善点を提供します。

  • 7つのAI発見レイヤーをチェック:llms.txt、構造化データ、サービスのカタログAPI、OpenAPI仕様、Agent Card、ヘルスエンドポイント、ロボットとサイトマップ。
  • 無料で、アカウント登録不要、即座にA-Fのグレードスコアを取得。
サイト内本文

Show HN: TickerPro – 米国株のためのAIリサーチ端末

TickerProは、個人投資家が米国株を発見・分析するためのAIアシスタント付きリサーチ端末です。ポートフォリオと投資スタイルに基づいたパーソナライズされた推奨、リアルタイムデータ、ナラティブ主導のインサイトを提供し、夫妻が自身のリサーチプロセスを効率化するために構築しました。

  • TickerProは、ポートフォリオと投資スタイルに基づいたAIによるパーソナライズされた株式推奨を提供します。
  • ビジネスモデル、財務データ、トランスクリプトの詳細調査が可能で、AIによる概要生成もサポート。
サイト内本文

「AIスラップ」を避けるOSS貢献のベストプラクティスチェックリスト(AI使用時も非使用時も)

AI生成コードによる「スラップ」を防ぐための貢献ベストプラクティスチェックリスト。プロジェクト理解からコミュニティ参加、AIツールの適切な使い方までをカバー。

  • AI使用・非使用問わず12項目の貢献ベストプラクティス。
  • プロジェクト理解、コミュニティ参加、AI使用の注意点を強調。
サイト内本文

低コストで最前線のAI:オープンソースワーカーとクローズドソースアドバイザーの組み合わせ

本記事では、オープンソースのワーカーエージェント(Kimi-K2.6またはGLM-5.2)とクローズドソースの最前線モデル(Claude Opus 4.8)を組み合わせたアーキテクチャを紹介。SWE-bench Pro、Terminal-Bench 2.1、Legal Agent Benchの3つのベンチマークで一貫した性能向上を達成し、推論コストを19%から67%削減する。GLM-5.2とアドバイザーの組み合わせはTerminal-BenchでOpusと同等(約80%)でありながらコストは約47%低く、Legal Agent BenchではOpusを上回りコストは40%低い。

  • オープンソースワーカー(Kimi-K2.6またはGLM-5.2)がタスクをエンドツーエンドで実行し、最終段階でクローズドソースの最前線モデル(Claude Opus 4.8)に1回だけ相談する。
  • SWE-bench Proで4~7ポイント、Terminal-Bench 2.1で4~8ポイント、Legal Agent Benchで1~4ポイントの改善。
サイト内本文
モデル

OpenAI、米国のAI規制の騒動の中GPT-5.6を発表

トランプ政権の要請によりOpenAIが次世代モデルのリリースを遅らせるという報道から24時間も経たないうちに、そのモデルGPT-5.6が登場した。同社は金曜日、新しいGPT-5.6モデルスイートの限定プレビューを公開。フラッグシップのSol、大量の作業向けの中級モデルTerra、そして高速で手頃な日常モデルLunaの3種類を発表した。OpenAIは、コーディング、サイバーセキュリティ、生物学に特に優れ、長期間の自律型AIタスクでも集中力を維持できるとしている。 Solの価格は100万トークンあたり入力5ドル、出力30ドルで、AnthropicのClaude Fable 5(入力10ドル、出力50ドル)の約半分。TerraはSolの半額、LunaはTerraの半額以下。また、Solには深い推論のための「最大」モードと、サブエージェントを活用する「ウルトラ」モードの2つの追加モードも初公開された。これはOpenClawを彷彿とさせ、おそらくOpenClawの創設者Peter Steinberger氏のOpenAIでのこれまでの仕事の成果を示している。 ワシントンD.C.の安全保障パニックの中、当然のことながら、OpenAIは発表ブログ記事の大部分を安全性と悪用の可能性に充てた。競合のAnthropicが最近ジェイルブレイクに悩まされたことをほのめかし、「GPT-5.6は、ユーザーが意図を偽装したりモデルをジェイルブレイクしようとする場合を含め、禁止されたサイバー支援を拒否するよう訓練されている」と記した。また、フラッグシップモデルのSolは「エンドツーエンドの攻撃を確実に実行するよりも、脆弱性の発見と修正を支援することに優れている」とし、OpenAIの準備フレームワークの下でサイバー重要閾値を超えないと述べた。ただし、OpenAIは4月に準備フレームワークを改訂し、以前の研究分野の一部を削除していることに留意すべきである。 同社はSolが「これまでで最も堅牢な安全スタック」を備えており、「高リスク活動、機密性の高いサイバー要求、繰り返しの悪用に対する保護を強化した」と述べた。OpenAIは「約70万A100e GPU時間」を自動レッドチーミングに充て、第三者テスターとも協力したとし、後者は今後2週間テストを継続する。 OpenAIはプレビュー期間中、トランプ政権が厳重に監視する中、特に慎重なアプローチを取っているように見える。同社は「防御活動と攻撃活動が最初は類似するデュアルユース領域では、安全策が正当な作業に時折介入する可能性がある。それはプレビューがテストする目的の一部である」と記した。今週初めの報道によると、トランプ政権はプレビュー期間中、顧客をケースバイケースで承認する。 OpenAIは、モデルスイートは「広範なアクセス」を信じているため、数週間以内に一般提供されるべきであり、今回の立ち上げに先立って米国政府と協力したが、これが標準になるとは望んでいないと述べた。 「このような政府のアクセスプロセスが長期的なデフォルトになるべきではないと考えている」と同社は記した。「それは必要なツールをユーザー、開発者、企業、サイバー防御者、グローバルパートナーから遠ざけてしまう。我々は、これは将来のモデルリリースのためのサイバー大統領令の枠組みと再現可能なプロセスを政府と共に開発する間、今後数週間でより広範な利用可能性を実現するための最強の道であると信じているため、この短期的な措置を取っている」

  • OpenAIはトランプ政権の要請で遅延した後、GPT-5.6スイート(Sol、Terra、Luna)をリリース。
  • Solの価格はAnthropicのClaude Fable 5の約半額。
サイト内本文

AIゲートウェイのベンチマーク:GoModel vs LiteLLM vs Portkey vs Bifrost

本記事では、4つのAIゲートウェイのホットパスにおけるランタイムオーバーヘッドを比較し、レイテンシ、スループット、メモリ、CPU、コールドスタート時間、イメージサイズを計測しています。GoModelがほぼ全ての指標で優れており、LiteLLMはリソース消費が大きいことが判明しました。また、ローカルモデルやサーバーレスデプロイにおける軽量ゲートウェイの重要性についても議論しています。

  • GoModelは最高のパフォーマンスを示しました:中央値レイテンシ1.8ミリ秒、4900 req/s、メモリ37MB、コールドスタート0.56秒。
  • LiteLLMは非常にリソースを消費し、メモリ2.3GB、コールドスタート25.5秒、スループット324 req/sと劣っていました。
サイト内本文
研究

私が実際に購入するであろう20以上のPrime Dayスマホお得情報

Prime Day 2026がまもなく終了。ZDNETの専門家がまだ入手可能なスマホのお得な情報を厳選。iPhone、Samsung、Google Pixel、Motorolaの割引情報や選び方のコツを紹介。

  • Prime Day 2026は6月23日から26日まで、本日最終日。
  • 注目の割引にはGoogle Pixel 10、Samsung Galaxy S26、各種iPhoneが含まれる。
サイト内本文
チップ

AI応援、AI棄権、AI戦略的転換

本稿は社会地図法を用いて、AIをめぐる三つの極化した立場——技術楽観主義の応援、全面拒否の棄権、リスクを認識しつつ関与する戦略的転換——を分析する。放棄は道徳的潔白を意味せず、関与も是認を意味しないと主張し、識別力と抑制の重要性を強調する。

  • 社会地図はAI論争における三つの主要な立場——応援、棄権、戦略的転換——を明らかにする。
  • AI棄権は道徳的明確性を維持するが、拒否のてこを過大評価する可能性がある。
サイト内本文
ツール

iOS 27のカメラアプリでSiriモードを使い、見たものについて質問する方法

iOS 27開発者ベータ版で、カメラアプリに新しいSiriモードが追加され、AIを使って視野内の物体について質問できるようになりました。この機能はiOS 18.2のVisual Intelligenceを改良したもので、カメラアプリ内で直接利用できます。初期ベータ版ではいくつかのバグや待機時間の問題があります。

  • iOS 27のカメラにSiriモードが追加され、物体についてリアルタイムでAI質問が可能に。
  • Visual Intelligenceとは異なり、カメラアプリ内で完結。
サイト内本文
政策

デイビッド・オーター氏が経済学部長に任命

1999年からMITで教鞭をとるデイビッド・オーター氏が経済学部長に任命され、7月1日付で就任する。オーター氏は人工知能と働き方の未来の第一人者であり、技術変化とグローバリゼーションが労働市場に与える影響を研究している。

  • デイビッド・オーター氏がMIT経済学部長に任命(7月1日付)。
  • AIと未来の仕事の第一人者で、技術変化が雇用と不平等に与える影響を研究。