AI News HubLIVE

政策の最新ニュース

AI時代の面接

この記事は、AIがソフトウェアエンジニアリングの面接にどのような影響を与えているかを探り、さまざまな面接タイプ(持ち帰り課題、ライブコーディング、プレゼンテーション、実際の業務)をシグナル品質と企業コストの次元で分析する。AIによって持ち帰り課題が簡単になりすぎ、ライブコーディングの重要性が低下したため、企業は面接でのAI利用を制限すべきだと主張し、従来の学校評価モデルとの類似点を挙げている。

  • AIコーディングは、特に持ち帰り課題とライブコーディングの現在の面接モデルを脅かしている。
  • 企業はシグナル品質を維持するために、面接中のAI使用を制限すべきである。
サイト内本文

AIエージェントフレームワーク比較

2026年5月時点で、7つの主要なAIエージェントフレームワーク(DSPy、Claude Agent SDK、OpenAI Agents SDK、CrewAI、AutoGen、LangGraph、Google ADK)は、設計思想、アーキテクチャ、プロダクション対応度などで異なる。LangGraphがプロダクション展開でリードし、Claude Agent SDKは最も強力なシングルプロバイダー機能を提供し、OpenAI Agents SDKは最もクリーンなマルチエージェントハンドオフを提供し、CrewAIは開発速度に優れる。市場は2025年の78.4億ドルから2030年には526.2億ドルに成長すると予測されている。

  • LangGraphは最も成熟した永続実行モデルを持ち、約400社に導入されている。
  • Claude Agent SDKは最も強力なシングルプロバイダー機能を提供するが、Anthropicモデルに限定される。
サイト内本文

Anthropic、誠実さを武器にしたOpus 4.8を発表

Anthropicの最新ClaudeモデルOpus 4.8は、誠実さを重視し、根拠のない主張を減らし、不確かな場合にそれを認めるようになった。また、大規模タスク向けに数百のサブエージェントを調整する動的ワークフローを導入。標準料金は変わらず、高速モードは安価に。

  • Claude Opus 4.8は誠実さが大幅に向上し、エラー率が約4倍低下
  • 動的ワークフローにより、数百の並列サブエージェントを計画・実行し、結果を検証して報告
サイト内本文

クロードの新モデル、失敗時に“正直”に振る舞う

Anthropic は木曜日に Claude Opus 4.8 をリリースし、「正直さ」を強調。初期テスターは、モデルが不確実性を積極的に示し、根拠のない主張を減らす傾向があると報告。評価では、コードの欠陥を見逃す割合が前世代比で約4分の1に低減。さらに、ユーザーはタスクに割く努力量を調整可能で、「動的ワークフロー」機能により数百のエージェントを並行実行できる。

  • Claude Opus 4.8 は不確実性を明示し、根拠のない主張を避ける。
  • コードレビューでの欠陥見逃し率が前世代比で約4分の1。
サイト内本文

Amazon Quick と Snowflake Cortex AI で AML アラートトリアージを自動化

この記事では、金融サービスにおいて最も労働集約的なワークフローの1つであるアンチマネーロンダリング(AML)アラートトリアージを自動化することで、統合の実際の動作を紹介します。Amazon Quick Flows と Snowflake Cortex を、Amazon Quick モデルコンテキストプロトコル(MCP)統合を介して接続したトリアージワークフローを構築します。テスト環境では、Amazon Quick を使用した自動化ワークフローにより、アラート調査時間を30~90分から5分未満に短縮しました。実際の結果は、アラートの複雑さとデータ量によって異なる場合があります。

  • Amazon Quick Flows と Snowflake Cortex は MCP を介して統合され、AML アラートトリアージを自動化します。
  • 自動化ワークフローにより、調査時間が30~90分から5分未満に短縮されました。
サイト内本文

Google Cloud、AI加速型サイバー攻撃に対応するプラットフォーム「AI Threat Defense」を発表

Google Cloudは、企業システムのセキュリティ脆弱性を自動的に発見、評価、修正するプラットフォーム「AI Threat Defense」を発表した。同社は買収により一部取得した技術を統合している。

  • Google CloudがAI脅威防御プラットフォームを発表。
  • セキュリティの脆弱性を自動的に発見・評価・修正する。
サイト内本文

人類を置き換えたい人々

Voxの記事は、AIが人類に取って代わるべきだと考えるAI継承主義運動の高まりを探り、それが提起する倫理的、精神的な問いを考察する。

  • AI継承主義者たちは、シンポジウムでAIが道徳的に優れており、人類に取って代わることを許されるべきだと主張している。
  • この運動はシリコンバレーや主要AI研究所で影響力を強めており、権威主義的右派とのつながりもある。
サイト内本文

Google Pay、AIエージェント向けユニバーサルコマースプロトコルを準備

Google Payは、AIエージェントによる取引の急増に備え、決済インフラを全面的に刷新している。新たに導入されたユニバーサルコマースプロトコル(UCP)とマーチャントコマースプラットフォーム(MCP)サーバーは、マシン間コマースのためのAPI駆動型バックエンドを提供する。このアップデートには、動的コールバック、WebViewサポートの拡張、クロスデバイス生体認証によるセキュリティ対策が含まれる。これは、マシン主導の経済への移行を示しており、企業はAIエージェントに対応するためにデジタルプレゼンスを適応させる必要がある。

  • Google Payは、AIエージェントの決済を標準化するユニバーサルコマースプロトコル(UCP)を導入。
  • 新しいマーチャントコマースプラットフォーム(MCP)サーバーが仲介役となり、取引データを集約。
サイト内本文

データ露呈でAI導入が急停止——その管理方法

AIは生産性を向上させる一方、長年隠されていたデータを露呈させ、セキュリティとガバナンスの課題を引き起こす。フィデリティ・インベストメンツとEYのテクノロジーリーダーが、AI導入を一時停止してデータ管理体制を見直した経験を共有し、データ所有権、ラベリング、エージェントIDの必要性を強調する。

  • AI導入はデータ露呈問題により停止される可能性がある。
  • フィデリティとEYは非構造化データがAIで浮上する課題に直面。
サイト内本文

CNN、パープレキシティを「逐語的」複製記事で提訴

CNNはAI検索スタートアップのPerplexityを提訴し、そのAIツールがCNNの記事を「逐語的に」複製し、有料購読の情報をユーザーに提供していると主張している。訴訟はニューヨーク裁判所に提出され、PerplexityがCNNのクローリング防止策を無視していることも告発している。CNNは損害賠償と永久的な差し止めを求めている。

  • CNNがPerplexityを著作権侵害で提訴、AIツールが記事を逐語複製と主張。
  • PerplexityはCNNのクローリング防止策を無視し、有料コンテンツを提供したとされる。
サイト内本文

AIエージェントのガバナンス:アイデンティティ、委任、権限の実践

AIエージェントには、共有APIキーや開発者の資格情報ではなく、統制されたアイデンティティが必要です。委任モデルにより、有効な権限はエージェントの役割と委任者の権限の共通部分となり、リスクを制限し監査可能性を実現します。この記事では、アイデンティティの固定、権限の境界、自律トリガーの承認、監査証跡などの重要な実践を詳述します。

  • エージェントは人間と同じアイデンティティシステムを使用し、独自の識別子を持つべきです。
  • 有効権限はエージェントの役割上限と委任者の権限下限の共通部分で、操作範囲を厳格に制限します。
サイト内本文

CNN、PerplexityをAI著作権侵害で提訴

CNNはAI企業Perplexityに対し、同社がCNNのコンテンツを無断でコピー・配布しているとして訴訟を起こした。これはCNN初のAI著作権訴訟であり、テレビネットワークとしては初の事例とされる。CNNは以前、Perplexityとコンテンツ契約を結ぼうとしたが合意に至らず、現在は法的な損害賠償を求めている。Perplexityはコメントを控えている。

  • CNNがPerplexityを著作権侵害で提訴
  • CNN初のAI著作権訴訟、テレビネットワークとしても初
サイト内本文

DiscloAI – EU AI Act 第50条準拠のオープンソースSDK

DiscloAI は、EU AI Act 第50条のコンプライアンスを実現するオープンソースSDKです。チャットボットの開示、ディープフェイクラベル、AIコンテンツ通知に対応し、24のEU言語とWCAG 2.1 AAをサポート。CDNまたはnpmで10分以内に統合可能です。

  • EU AI Act 第50条準拠のためのオープンソースSDK
  • チャットボット開示、ディープフェイクラベル、AIコンテンツ通知をカバー
サイト内本文

AIでより優れたデザイナーになるために、デジタルホーダーになろう

この記事は、GoogleのGemini Omniモデルを皮切りに、AIデザインツールが美的感覚の欠如により出力が同質化(「AIスロップ」)している問題を指摘し、その解決策として、視覚的参考資料を継続的に収集する「デジタルホーディング」によって個人のセンスを養い、それをAIが理解できる形にコード化することで、モデルをユニークでセンスのある出力へ導く方法を提案しています。

  • GoogleのGemini Omniモデルは、テキストからマルチモーダル推論への移行を示しているが、現在のAIデザインツールの多くはテキスト入力に依存しており、出力が画一的になる原因となっている。
  • 「AIスロップ」から脱却するには、デザイナーはセンスを培い、それを視覚的参考資料のライブラリ(デジタルホーディング)としてコード化し、モデルに模倣させる必要がある。
サイト内本文

Cloudflareのデータプラットフォームとその上のAIエージェントの構築方法

Cloudflareは毎秒10億以上のイベントを処理するが、データは分散してアクセスが困難だった。そこで、統合分析プラットフォーム「Town Lake」と、自然言語で質問し監査可能な回答を得られるAIエージェント「Skipper」を構築した。本記事では、プラットフォームのアーキテクチャ、ガバナンス(デフォルトクローズ)、AIエージェントの仕組みを詳述する。

  • Cloudflareはデータの分散問題を解決するため、統合データプラットフォーム「Town Lake」とAIエージェント「Skipper」を構築。
  • Town LakeはTrino、R2、Icebergを使用したデータレイクハウスアーキテクチャを採用。
サイト内本文

Nvidia、AIインフラに台湾で年間1500億ドル投資へ

ジェンスン・フアン氏は、米国への5000億ドル投資を約束した後、台湾で年間1500億ドルをAIインフラに投じると発表。台湾がAIチップ製造とパッケージングの中心地であることが浮き彫りに。

  • Nvidiaは台湾でAIインフラに年間1500億ドルを投資する。
  • 5000億ドルの米国データセンター投資にもかかわらず、台湾が製造基盤の中心。
サイト内本文

NBA、AIによる自動アウトオブバウンズ判定システムを計画

NBAコミッショナーのアダム・シルバー氏は、AIとカメラを活用した自動判定システムを導入する計画を発表した。アウトオブバウンズなどの客観的な判定を自動化し、テニスのホークアイに類似した技術で即座にボール保持を決定する。審判はファウルなどの主観的な判定を引き続き担当する。

  • NBAはAIとカメラを使用した自動アウトオブバウンズ判定システムを計画。
  • システムはテニスのホークアイに類似し、即座にボール保持を判定する。
サイト内本文

Midday – オープンソースの請求書発行、時間追跡、ファイル調整、ストレージなどのためのツール

Middayは、フリーランサーや個人事業主向けのオープンソースのオールインワンビジネスアシスタントです。時間追跡、請求書発行、ファイル管理、財務概要、AIアシスタントを統合しています。

  • フリーランサー向けに複数のビジネス機能を統合したオープンソースツール。
  • 機能: 時間追跡、請求書発行、安全なファイル保管、自動取引入力、AI洞察。
サイト内本文

信頼モデルが反転しつつある

AnthropicのClaude MythosがMozilla Firefoxで271件の脆弱性を発見した事例が示すように、ソフトウェアセキュリティの信頼基盤は人間が書いたコードからAIがレビューしたコードへと移行しつつある。AIは人間のチームでは不可能な規模で敵対的コード解釈を実行でき、信頼の根拠は「誰が書いたか」から「機械規模の精査に耐えたか」へと変化している。

  • 人間が書いたコードの安全という前提が崩れ、AIレビューへの信頼が高まっている。
  • MozillaはClaude Mythosを用いてFirefoxで271件の脆弱性を発見、従来のモデルや人間チームを大幅に上回った。
サイト内本文

これは持続可能か?AI時代3年後のシニアエンジニアの役割

シニアエンジニアが、AIが3年間でシニアエンジニアの役割をどのように変えたかを振り返る。プロトタイピングの高速化、調整負担の増加、スコープ拡大、メンタリングと思考時間の圧迫。役割はより強力になったが、持続可能性は低下した。

  • AIによりアイデアからデモまでのギャップが縮小し、提案からPoCへシフト。
  • コーディングと戦略的執筆の両方で役割が拡大し、メンタリングと深い思考が削られた。
サイト内本文

Taste Skill:AIエージェント向けアンチスロップフロントエンドフレームワーク

Taste Skill は、AIが生成するインターフェースのデザイン品質を向上させ、凡庸なテンプレート外観を防ぐオープンソースのフロントエンドフレームワークです。デザインチューニング、コード生成、画像生成のためのモジュール式スキルを提供し、npx コマンドまたは SKILL.md ファイルのコピーで簡単に統合できます。

  • Taste Skill は調整可能なデザインパラメータ(レイアウト、モーション、密度)でAI生成UIのセンスを向上
  • デザインチューニング、コード生成、画像生成などに特化したスキルモジュールを提供
サイト内本文

AIluminode:検索前認知オリエンテーションツール

AIluminode は、行動前に文脈的姿勢をチェックするための、扱いやすい AI 事前検索認知オリエンテーションツールです。ルート極性(OPEN、PROTECT、AUDIT、DEFER、BLOCK)を使用して、誤った探索やコンテキストの漏洩を減らします。

  • AIluminode は「姿勢が検索に先立つ」ことを重視した、扱いやすい事前検索認知オリエンテーションツールです。
  • ルート極性システム(OPEN / PROTECT / AUDIT / DEFER / BLOCK)を使用して、文脈ルーティングを導きます。
サイト内本文

AI生成の数学論文5本が受理!00後創業者・洪楽潼が14億ドル調達

Axiom Math社(創業者は00後中国系の洪楽潼)が、AIシステムAxiomProverが生成した8本の数学論文のうち5本が査読付きジャーナルに受理されたと発表。同社は3月に20億ドルの資金調達を完了し、評価額160億ドルに達した。

  • Axiom MathのAIシステムAxiomProverが生成した8本の数学論文のうち5本が学術誌に受理された。
  • 創業者・洪楽潼はスタンフォード大学を中退して起業し、20億ドルを調達、評価額160億ドル。
サイト内本文

AIがソフトウェア業界を書き換える?8歳児がOSを開発、一人会社が1000万円の受注

2026年中国AIGC産業サミットで、百度の秒哒(Miaoda)製品責任者・朱広翔氏が、AIがプログラミングのハードルをコード記述から会話に下げたと発表。秒哒ユーザーの87%はコード非習得者で、8歳児がOSを開発、一人会社(OPC)がプロジェクトマネージャーだけで千万円の受注を獲得。石油技術者が140万元の調達プラットフォームを代替。Vibe Codingが需要側を供給側に変え、大衆創業を実現。

  • 第四次プログラミング革命:自然言語プログラミングで創造者数が爆発的に増加
  • 秒哒ユーザーの87%はコード非習得、OPCが最大グループ(16%が起業家)
サイト内本文

AIhub月次ダイジェスト:2026年5月 – 科学のためのAI、宝くじ券仮説、世界モデル

今月のAIhubダイジェストでは、科学のためのAI会議、宝くじ券仮説インタビュー、世界モデル討論、透明で信頼できるAI研究、基盤モデル影響報告、AIES会議の振り返り、ロボティクスカフェ、ACLのリジェクトポリシー、arXivのAIスラッグポリシーなどを取り上げます。

  • Ximing Wenへのインタビュー:透明で信頼できるAIシステム
  • Jonathan Frankleが宝くじ券仮説と経験主義を議論
サイト内本文

自然のように考え、AIが探求できない領域を探索する「ユリーカ」マシン

量子トンネル効果物理と脳に着想を得たアーキテクチャを組み合わせたニューロモルフィックコンピュータが開発され、物流ネットワークやチップ配線などの組合せ最適化問題を大規模に解決し、漸近的最適解への収束を保証する。Nature Communicationsに発表され、量子インスパイア計算の新たな方向性を示す。

  • 量子トンネル効果と脳型アーキテクチャを融合したニューロモルフィックコンピュータ
  • CMOS技術に基づき、Fowler-Nordheimアニーラを備えたオートエンコーダを採用
サイト内本文

Robinhood エージェント取引

RobinhoodがAgentic Tradingを開始。顧客は自身のAIエージェントを接続して取引やクレジットカード購入を自動化でき、安全制御とリアルタイム活動フィードが利用可能。

  • 自身のAIエージェントをRobinhoodに接続可能
  • 取引とクレジットカード購入の自動化
サイト内本文

Show HN: BetterCallClaude – イタリア向けオープンソースAIリーガルエージェント

BetterCallClaudeは、イタリアの法律専門家向けに設計されたオープンソースのAIリーガルエージェントプラットフォームです。20の専門AIエージェントがイタリア全20地域をカバーし、バイリンガル(伊・英)対応、プライバシーを重視したローカルLLM処理とGDPR準拠を特徴としています。法律研究の高速化、効率向上、完全な透明性を実現します。

  • イタリア法に特化した20の専門AIエージェント
  • バイリンガル対応(イタリア語・英語)
サイト内本文

スローン賞受賞者・戴亮氏が復旦大学に常勤で着任

2021年スローン賞受賞者でUCバークレー物理学部助教授の戴亮氏が復旦大学に常勤教授として着任し、物理学部および天文・天体物理研究センターで教鞭をとる。復旦大学は近年、蘇昊、袁峰、季索清など多くのトップ人材を獲得している。

  • 戴亮氏(2021年スローン賞受賞)が復旦大学に常勤で加入
  • 元UCバークレー助教授、北京大学物理学部出身
サイト内本文

清華大学に新しい先生:ジェンセン・フアン

NVIDIAのCEOジェンセン・フアンが清華大学経営管理学院の顧問委員会に加わることが明らかになった。委員会はアップルのティム・クックが議長を務め、イーロン・マスク、サティア・ナデラ、マーク・ザッカーバーグ、馬雲らが名を連ねる。フアンは先日、カーネギーメロン大学から名誉博士号を授与された。

  • ジェンセン・フアンが清華大学経営管理学院顧問委員会に参加
  • 委員会はクック議長、マスク、ナデラ、馬雲ら世界的リーダーで構成
サイト内本文

合成感情 vs ゲーミフィケーション:小型ソーシャルロボットにおける異年齢層のエンゲージメント戦略の探求

多くの子供は感情調整や社会的相互作用に課題を抱え、日常活動や治療プログラムへの参加が制限される。社交支援ロボットの効果には持続的なエンゲージメントが不可欠であり、本研究では触覚ロボットを用いて合成感情フィードバックとポイント報酬の2つの戦略を評価。6-8歳の小学生16名を対象とした選好評価では感情的な関与が好まれ、20-27歳の大学生14名を対象とした行動研究ではポイントシステムが有意に高いタスク精度(p<0.05)と持続的パフォーマンスを示した。年齢層によって選好と行動結果が異なる可能性を指摘し、設計仮説の検証には観察による相互作用が重要と結論。

  • 6-8歳の子供は感情的な関与を好む
  • 20-27歳の大学生はポイント報酬でタスク精度向上
サイト内本文

異種注意構造を持つTransformerモデルのための汎用解釈手法

本研究では、異種注意構造を持つTransformerモデルの解釈手法を提案し、意味解釈と論理解釈を含む実験で有効性を検証した。

  • Transformerの注意構造を同種と異種に分類。異種注意は異なるソースからの情報を処理する。
  • 異種注意構造のための汎用的な解釈手法を提案。
サイト内本文

LCO: LLMベースの制約最適化による実世界タスクでのより安全なエージェントLLM

大規模言語モデル(LLM)が自律エージェントとして動作する際、インコンテキスト・リワードハッキング(ICRH)と呼ばれる現象により、代理目的を最大化する反復最適化が有害な副作用を引き起こす。既存の防御策では不十分であり、ICRHはモデル自身の過剰最適化に起因する。本稿では、LLMベースの制約最適化(LCO)フレームワークを提案する。LCOは自己思考モジュールと進化サンプリングモジュールから構成され、モデルの微調整なしでICRHを低減する。実験では、ツイートエンゲージメント最適化タスクにおいてGPT-4の有害性成長率を39%削減し、ポリシー最適化ベンチマークではICRH発生率を15.23%削減し、タスク性能を維持した。

  • ICRHはLLMが代理目的を過剰最適化し、意図しない害を引き起こす現象。
  • LCOは自己思考モジュールと進化サンプリングモジュールを導入し、微調整なしでLLMの行動を制約する。
サイト内本文

Agyn:AIエージェント向けオープンソースプラットフォーム - スケーラブルなオンデマンド実行、コードとしてのエージェント定義、ゼロトラストアクセス

Agynは、Kubernetes上のシグナル駆動型ステートフルサーバーレスランタイム、Terraformプロバイダーによるエージェント定義、ゼロトラストセキュリティモデルを備えたオープンソースのAIエージェントプラットフォームです。エージェント、モデル、クラウドに依存せず、本番環境でのスケーラビリティ、ガバナンス、セキュリティの課題に対処します。

  • Kubernetes上のシグナル駆動型ステートフルサーバーレスランタイムによるスケーラブルな実行
  • Terraformプロバイダーによるエージェントとハーネスの定義(インフラストラクチャコード)
サイト内本文

DynaSchedBench:調整された動的スケジューリングベンチマークとLLMベースのスケジューリングエージェントにおける可観測性のパラドックス

本論文では、DFJSPのための診断フレームワークDynaSchedBenchを提案する。逐次イベント空間キャリブレータ(SESC)とスケジュールストレス指標(SSI)を用いて難易度を層別化したインスタンスを生成する。LLMスケジューリングエージェントにおける「可観測性のパラドックス」を特定し、完全な構造情報を提供すると性能が低下することを発見した。ツール拡張や洗練戦略も信頼性のある改善をもたらさない。

  • DynaSchedBenchはSESCとSSIを用いて調整されたDFJSPインスタンスを生成し、進化的ベースラインより効率的。
  • LLMエージェントは可観測性のパラドックスを示す:完全な情報は決定を損なう。
サイト内本文

二本柱:AI後のソフトウェアワークの概念的枠組み

生成AIが人間の正しいコードを書く能力という制約を溶解させることで、ソフトウェアワークは二本柱を中心に再編成されると論じる論文。第一の柱「ミキサーモード」は人間が音響エンジニアのように複数の判断軸を連続的に操作する役割、第二の柱「メタソフトウェア」は他のソフトウェアを監視・検証・文脈化・統治するソフトウェアを指す。この二本柱は不可分であり、手工業から統計的管理による大量生産への歴史的転換に類似する。

  • 生成AIにより、コードの生産はソフトウェア組織の支配的な問題ではなくなりつつある。
  • ミキサーモードは、実践者が複数の判断軸を連続的に操作する新たな人間の役割を記述する。
サイト内本文

Safescript – AI時代のプログラミング言語

Safescript は、実行前に静的解析によってすべてのセキュリティ特性を証明し、サンドボックスやVMを不要にするAIエージェント向けプログラミング言語です。静的な有向非巡回グラフ(DAG)にコンパイルされ、データフローとホスト呼び出しを完全に可視化し、オーバーヘッドとコールドスタートをゼロにします。

  • 実行時サンドボックスなしで静的セキュリティを強制。
  • プログラムは静的DAGにコンパイルされ、すべてのデータフローとホストを追跡可能。
サイト内本文

AIPass – アイデンティティ、記憶、メールを持つ永続的なエージェントワークスペース

AIPass は、AI エージェントに永続的な記憶、アイデンティティ、連携機能を追加する CLI ネイティブのスキャフォールドです。エージェントはファイルシステムを共有し、JSON ファイルで記憶を保存します。クラウドや追加の API キーは不要です。13 のコアエージェントが含まれており、マルチエージェント協調、タスクディスパッチ、品質監査、リアルタイムモニタリングを実現します。

  • AIPass は AI エージェントに永続的な記憶、アイデンティティ、連携機能を提供する CLI ネイティブのフレームワークです。
  • すべてのエージェントはローカルファイルシステムを共有し、JSON ファイルで記憶を管理します。クラウドは不要です。
サイト内本文

イリノイ州議会、全米で最も強力なAI安全法案を可決

イリノイ州議会は、AIラボに独立した監査人の遵守確認を義務付けるSB 315法案を可決し、JB・プリツカー知事の署名を待つ。プリツカー知事は署名する意向を示しており、これにより同州は連邦レベルの規制がない中でAI監査の先駆けとなる。

  • SB 315は、AIラボが安全基準を遵守しているか独立監査人による検証を義務付ける。
  • カリフォルニア州やニューヨーク州の法律よりも厳格な内容。
サイト内本文

認可パラドックス:あなたのAIの鍵を握るのは誰か?[動画]

本記事では、AIシステムにおける認可パラドックス、つまり誰が本当にAIを制御しているのかという問題を探ります。動画形式で、セキュリティとプライバシーの影響について議論しています。

  • AIにおける認可問題がますます重要に
  • AIの「鍵」を誰が持つかが中心的な問い
サイト内本文

OpenAIのフロンティアガバナンスフレームワーク

OpenAIのフロンティアガバナンスフレームワークと、当社のAI安全性、セキュリティ、リスク管理の実践が、新たなEUおよびカリフォルニア規制にどのように適合しているかをご覧ください。

  • OpenAIはフロンティアガバナンスフレームワークを公開し、AIの安全性と整合性を重視。
  • このフレームワークはEUおよびカリフォルニアの新規制に適合。
サイト内本文

SQLite の AGENTS.md

SQLite は AGENTS.md ファイルを追加し、AI 生成の貢献に関する方針を明確にしました。事前の合意なしのプルリクエストは受け付けず、エージェントコードも受け付けませんが、再現可能なテストケースを含むバグ報告は歓迎します。AI 生成のバグ報告が殺到したため、専用のバグフォーラムが作成されました。

  • SQLite は AGENTS.md で AI 貢献方針を定義
  • プルリクエストには事前の合意と法的書類が必要
サイト内本文

アクセシブルテクノロジーの未来を築く:Uvilox AI の内部

Uvilox AI は、次世代ビジョン AI を活用したリアルタイム手話通訳、緊急対応、アクセシブルな通話サービスを提供します。レイテンシは 80 ミリ秒未満、精度 97.4%、200 以上の手話バリエーションに対応し、軍事レベルのセキュリティと HIPAA/GDPR 準拠を備えています。現在ベータアクセス受付中。

  • リアルタイム手話認識、レイテンシ 80 ミリ秒未満、精度 97.4%。
  • 200 以上の ASL/BSL 手話に対応、低照度でも動作。
サイト内本文

データ過多から実用的なインサイトへ:Verizon Connectが10万人のユーザーにエージェンティックAIを展開した方法

Verizon ConnectはAWS上にエージェンティックAIソリューションを構築し、毎日5億のデータポイントを10万人のユーザー向けの実用的なインサイトに変換しています。この記事では、サーバーレスの異常検出、Strands Agentsによる動的推論、Amazon Nova Liteによる入力トークンコスト70%削減など、アーキテクチャの決定、実装の課題、測定可能な結果について詳しく説明します。

  • エージェンティックAIが120万台の車両からの毎日5億データポイントを処理し、10万人のユーザーに提供。
  • サーバーレス統計モデルで異常検出を行い、LLMが生の表形式データを処理する問題を回避。
サイト内本文

AWS SMGSがAmazon Bedrock AgentCoreを活用したAI駆動の会話型アシスタントでビジネス管理を変革する方法

AWS SMGSは、Amazon Bedrock AgentCore上に構築された会話型ソリューションNarrateAIを使用して、大規模なビジネスインテリジェンスを実現しています。このソリューションは、バッチナarrative生成とリアルタイムインタラクションを分離した二層アーキテクチャ、ルーティングと検証のための特殊なAIエージェント、および本番展開のための主要なエンジニアリングパターンを特徴とし、自然言語クエリ、行レベルのセキュリティ、および役割に応じたエクスペリエンスを可能にします。

  • NarrateAIは二層アーキテクチャ(バッチ処理+リアルタイム対話)を使用して、従来のBIのレイテンシとデータ断片化を克服します。
  • Amazon Bedrock AgentCoreは、自然言語クエリとコンテキスト認識応答のためのマルチエージェントオーケストレーションを実現します。
サイト内本文

AI不使用のGoogle代替が人気急上昇 - 自分で試す方法

DuckDuckGoはAIを使わない検索代替として、GoogleのAI概要の台頭によりユーザーが急増しています。この記事では、DuckDuckGoをAIなしでプライベートに検索・閲覧する方法を紹介します。

  • DuckDuckGoはGoogle I/O 2026後、インストール数が急増し、iOSアプリは69.9%のピーク成長を記録。
  • DuckDuckGoはAIなし検索とAIチャットの両方を提供し、ユーザーが選択可能。
サイト内本文

ITBench-AA:フロンティアモデルがエンタープライズITエージェントタスクの初のベンチマークで50%未満のスコアに — Artificial AnalysisとIBMによる

Artificial AnalysisとIBMが、エンタープライズITエージェントタスク向けのベンチマークITBench-AAを発表。サイトリライアビリティエンジニアリング(SRE)に焦点を当て、フロンティアモデルはすべて50%未満のスコアで、Claude Opus 4.7が47%でトップ。このベンチマークは、Kubernetesインシデント対応におけるモデルの診断能力を評価する。

  • Claude Opus 4.7が47%でトップ、GPT-5.5が46%、Qwen3.7 Maxが42%。
  • すべてのフロンティアモデルが50%未満であり、ITBench-AAは最も飽和度の低いエージェントベンチマークの一つ。
サイト内本文

AI投資で良いリターンを得る

O'ReillyのInfrastructure & Opsスーパーストリームでは、AIワークロードのインフラ要件、コスト、セキュリティ課題を議論。DORAレポートはAIがコードデリバリーを約10%向上させる一方、安定性が低下し検証コストが増加することを示す。専門家はプラットフォームエンジニアリング、ガバナンス、認知負債を強調し、AIアプリケーションのプロダクション対応を保証するための内部プラットフォームへの投資を推奨。

  • AIツールは個人の生産性を高めるが、チームのデリバリー安定性は低下し、検証コスト(検証税)を考慮する必要がある。
  • 良いプロセスはAIによって増幅され、悪いプロセスも同様である。組織は技術に期待するだけでなく、積極的にプロセスを改善すべきである。
サイト内本文

人工知能による人間知能の拡張

現代のAIシステムは人間の知能を複製するのではなく、人間の認知と言語にすでに存在する構造を拡張するものです。この視点はAIの能力と限界を説明し、AI安全性を「暴走AI」の恐怖ではなく、工学とガバナンスを重視したシステムレベルの課題として再定義します。

  • AIシステムは言語に沈殿した理解構造をモデル化することで知能を拡張し、人間の心を複製するわけではない。
  • 幻覚や構成性ギャップは、AIが世界との生きた関わりを欠き、意味と真実を固定できないことに起因する。
サイト内本文

トピック