AI News HubLIVE

トップ記事

AI時代の面接

この記事は、AIがソフトウェアエンジニアリングの面接にどのような影響を与えているかを探り、さまざまな面接タイプ(持ち帰り課題、ライブコーディング、プレゼンテーション、実際の業務)をシグナル品質と企業コストの次元で分析する。AIによって持ち帰り課題が簡単になりすぎ、ライブコーディングの重要性が低下したため、企業は面接でのAI利用を制限すべきだと主張し、従来の学校評価モデルとの類似点を挙げている。

  • AIコーディングは、特に持ち帰り課題とライブコーディングの現在の面接モデルを脅かしている。
  • 企業はシグナル品質を維持するために、面接中のAI使用を制限すべきである。
サイト内本文

注目ニュース

AIエージェントフレームワーク比較

2026年5月時点で、7つの主要なAIエージェントフレームワーク(DSPy、Claude Agent SDK、OpenAI Agents SDK、CrewAI、AutoGen、LangGraph、Google ADK)は、設計思想、アーキテクチャ、プロダクション対応度などで異なる。LangGraphがプロダクション展開でリードし、Claude Agent SDKは最も強力なシングルプロバイダー機能を提供し、OpenAI Agents SDKは最もクリーンなマルチエージェントハンドオフを提供し、CrewAIは開発速度に優れる。市場は2025年の78.4億ドルから2030年には526.2億ドルに成長すると予測されている。

  • LangGraphは最も成熟した永続実行モデルを持ち、約400社に導入されている。
  • Claude Agent SDKは最も強力なシングルプロバイダー機能を提供するが、Anthropicモデルに限定される。
サイト内本文

AIは思考を変えているが、置き換えてはいない | 読者の手紙

リチャード・サッカリーとフィル・スネルがウェンディ・リューのAIに関する記事に応答し、AIは好奇心を減退させるどころか、むしろ高めていると主張する。

  • ウェンディ・リューはAIによる労働力の冗長化、誇大広告、環境コストを懸念している。
  • AIを多用するリチャード・サッカリーは、AIによってより好奇心が強くなり、未知の領域を探求できるようになったと述べている。
サイト内本文

その他の更新

教皇の呼びかけに応えて:人工知能の世界で人間性を最優先に | 手紙

スーザン・オマン博士が、AIをめぐる議論から一般市民が排除されていると指摘。英国議会のAIに関する超党派グループに証拠を提出し、AIへの懸念が2年間で10%上昇し、91%が経済的利益よりも公平性を優先すべきと考えていることを示した。

  • 一般市民はAIの議論から一貫して除外されている
  • AIへの公衆の懸念が2年で10%増加
サイト内本文

Anthropic、誠実さを武器にしたOpus 4.8を発表

Anthropicの最新ClaudeモデルOpus 4.8は、誠実さを重視し、根拠のない主張を減らし、不確かな場合にそれを認めるようになった。また、大規模タスク向けに数百のサブエージェントを調整する動的ワークフローを導入。標準料金は変わらず、高速モードは安価に。

  • Claude Opus 4.8は誠実さが大幅に向上し、エラー率が約4倍低下
  • 動的ワークフローにより、数百の並列サブエージェントを計画・実行し、結果を検証して報告
サイト内本文

クロードの新モデル、失敗時に“正直”に振る舞う

Anthropic は木曜日に Claude Opus 4.8 をリリースし、「正直さ」を強調。初期テスターは、モデルが不確実性を積極的に示し、根拠のない主張を減らす傾向があると報告。評価では、コードの欠陥を見逃す割合が前世代比で約4分の1に低減。さらに、ユーザーはタスクに割く努力量を調整可能で、「動的ワークフロー」機能により数百のエージェントを並行実行できる。

  • Claude Opus 4.8 は不確実性を明示し、根拠のない主張を避ける。
  • コードレビューでの欠陥見逃し率が前世代比で約4分の1。
サイト内本文

Amazon Quick と Snowflake Cortex AI で AML アラートトリアージを自動化

この記事では、金融サービスにおいて最も労働集約的なワークフローの1つであるアンチマネーロンダリング(AML)アラートトリアージを自動化することで、統合の実際の動作を紹介します。Amazon Quick Flows と Snowflake Cortex を、Amazon Quick モデルコンテキストプロトコル(MCP)統合を介して接続したトリアージワークフローを構築します。テスト環境では、Amazon Quick を使用した自動化ワークフローにより、アラート調査時間を30~90分から5分未満に短縮しました。実際の結果は、アラートの複雑さとデータ量によって異なる場合があります。

  • Amazon Quick Flows と Snowflake Cortex は MCP を介して統合され、AML アラートトリアージを自動化します。
  • 自動化ワークフローにより、調査時間が30~90分から5分未満に短縮されました。
サイト内本文

2000ドルのAI生成映画、トライベッカで初上映へ

来月のトライベッカ・フェスティバルで、AI生成映画『ドリームズ・オブ・ヴァイオレッツ』が初公開されます。75分のこの作品は、イラン政府による1月の抗議者大量殺害を架空のドラマ化したもので、人物や画像はすべてAIで作成されています。制作費は2000ドルで、イラン出身の兄弟が複数のAIツールを用いて制作しました。

  • 『ドリームズ・オブ・ヴァイオレッツ』は75分のAI生成映画で、トライベッカで初上映。制作費は2000ドル。
  • イラン政府の抗議者大量殺害を題材に、すべての映像をAIで生成。
サイト内本文

タイ警察、スパンコールドレス姿で手錠かけられた容疑者と撮影の画像はAI偽造と判明

派手なフェスティバルドレスを着たタイ警察官が麻薬密売人を取り囲む衝撃的な画像が世界中で拡散されたが、実際には警察署のFacebookアカウント管理者がより親しみやすいイメージを作るためにAIで生成したものだった。

  • タイ警察が発表した華やかなドレス姿の警察官と容疑者の写真は、実際にはAI生成画像だった。
  • 画像は警察署のFacebook管理者が親しみやすいイメージ作りを目的に作成したもの。
サイト内本文

YouTube、本格的なポッドキャストアプリへの第一歩

YouTubeがPremium加入者向けにポッドキャスト視聴を改善する新機能を発表。音声優先の「オン・ザ・ゴー・モード」、自動速度調整、AIポッドキャストレコメンデーションなどを含む。

  • YouTubeが「オン・ザ・ゴー・モード」を導入。動画インターフェースを音声優先に切り替え、移動中の視聴に最適化。
  • 新しい自動速度調整機能がコンテンツに応じて再生速度を動的に変更。
サイト内本文

Google AI Overviewsでお気に入りのニュースソースを優先表示させる方法

Googleは「Preferred Sources」機能をAI OverviewsとAI Modeに拡張し、ユーザーがお気に入りのサイトを設定してAI検索結果で目立たせることができるようにしました。新しいソースカルーセルや「Highly Cited」バッジも追加されました。

  • Googleの「Preferred Sources」機能がAI OverviewsとAI Modeで利用可能に。
  • お気に入りのニュースサイトを追加し、AI検索結果で優先表示させることができます。
サイト内本文

メディア・アドバイザリー:MITが地域量子ハブを設立

MITとマサチューセッツ州は、量子システム研究所(QSL)を設立する計画を発表。州からの2500万ドルの投資により、全州の研究者に開放される共有施設となり、量子研究の加速を目指す。

  • MITとマサチューセッツ州が量子システム研究所(QSL)を共同設立、2500万ドル投資
  • QSLは量子コンピュータ、センサー、相互接続を備えた世界初の共有施設
サイト内本文

Data Formulator 0.7:エンタープライズデータ向けAI搭載データ分析

Data Formulator 0.7は、データ接続、エージェントガイドによる探索、ビジュアライゼーションの改善を共有ワークスペースで統合した、エンタープライズデータ分析向けのオープンソースAIシステムです。

  • エンタープライズデータ分析向けのオープンソースAIシステム
  • データコネクタ機能により、多様なデータソースへの管理・再利用可能な接続をサポート
サイト内本文

Google Cloud、AI加速型サイバー攻撃に対応するプラットフォーム「AI Threat Defense」を発表

Google Cloudは、企業システムのセキュリティ脆弱性を自動的に発見、評価、修正するプラットフォーム「AI Threat Defense」を発表した。同社は買収により一部取得した技術を統合している。

  • Google CloudがAI脅威防御プラットフォームを発表。
  • セキュリティの脆弱性を自動的に発見・評価・修正する。
サイト内本文

人類を置き換えたい人々

Voxの記事は、AIが人類に取って代わるべきだと考えるAI継承主義運動の高まりを探り、それが提起する倫理的、精神的な問いを考察する。

  • AI継承主義者たちは、シンポジウムでAIが道徳的に優れており、人類に取って代わることを許されるべきだと主張している。
  • この運動はシリコンバレーや主要AI研究所で影響力を強めており、権威主義的右派とのつながりもある。
サイト内本文

Claudeverse – 並列Claudeコードワーカーのためのミッションコントロール

Claudeverseは、開発者が複数のClaude AIワーカーを並行管理するためのコマンドセンターです。並列ワーカー管理、ワーカーエスカレーション、レビューキュー、トレーサビリティ、iPadミラーリング、モデルニュートラルエンジンなどの機能を提供します。現在は招待制のベータ版です。

  • Claudeverseは、複数のClaudeワーカーを同時に管理する統一コマンドセンターを提供します。
  • 主な機能には、並列ワーカー管理、ワーカーエスカレーション、レビューキュー、トレーサビリティ、iPadミラーリングがあります。
サイト内本文

Meta、Instagram、Facebook、WhatsAppのサブスクリプションを開始

Metaは、主力アプリInstagram、Facebook、WhatsAppで消費者向けサブスクリプションをグローバルに展開し、月額2.99~3.99ドルで追加機能を提供する。同時に、ビジネス、クリエイター、Meta AIユーザー向けの新サブスクリプションのテストも開始。

  • MetaがInstagram Plus(月3.99ドル)、Facebook Plus(月3.99ドル)、WhatsApp Plus(月2.99ドル)を全世界で提供開始
  • 加入者はプロフィールカスタマイズ、スーパーリアクション、ストーリーインサイトなどが利用可能
サイト内本文

I/O 2026の12の主要な瞬間を振り返る

Google I/O 2026の基調講演では、Gemini Omni、Gemini 3.5 Flash、情報エージェント、ユニバーサルカート、Neural Expressiveデザイン言語、スマートグラスなど、多くの重要な発表がありました。本記事では12の注目すべき瞬間をまとめています。

  • Gemini Omniは任意の入力からコンテンツを生成でき、まずは動画に対応。
  • Gemini 3.5 Flashはエージェントやコーディングにおいて最先端の性能を発揮。
サイト内本文

Google Pay、AIエージェント向けユニバーサルコマースプロトコルを準備

Google Payは、AIエージェントによる取引の急増に備え、決済インフラを全面的に刷新している。新たに導入されたユニバーサルコマースプロトコル(UCP)とマーチャントコマースプラットフォーム(MCP)サーバーは、マシン間コマースのためのAPI駆動型バックエンドを提供する。このアップデートには、動的コールバック、WebViewサポートの拡張、クロスデバイス生体認証によるセキュリティ対策が含まれる。これは、マシン主導の経済への移行を示しており、企業はAIエージェントに対応するためにデジタルプレゼンスを適応させる必要がある。

  • Google Payは、AIエージェントの決済を標準化するユニバーサルコマースプロトコル(UCP)を導入。
  • 新しいマーチャントコマースプラットフォーム(MCP)サーバーが仲介役となり、取引データを集約。
サイト内本文

iOS 27の新レンダリング、Siriの大規模リデザインを示唆

Appleが長らく待望していたSiriの大幅な見直しは、iOS 27で登場する見込みで、ChatGPTにLiquid Glassの要素を加えたような外観になる可能性があります。Bloombergのレンダリングは、iOS 27の新機能として、Siriの新しいアプリとチャットインターフェースをプレビューしています。レンダリングはBloombergが見た情報と計画を知る関係者に基づいており、Appleの最終デザインとは異なる可能性があります。Appleは6月のWWDCで最終デザインを公開する予定です。

  • iOS 27のSiriはChatGPT風のインターフェースを採用し、Dynamic Islandから薬莢形のチャットバブルが表示される。
  • ドロップダウンメニューからAsk、Siri、ChatGPTを選択可能。
サイト内本文

Google、Gemma 3をローカル実行する小型ボードを発表

GoogleはI/OでCoral Boardを発表。これはデバイス上のAI向けのコンパクトなシングルボードコンピュータで、RISC-VベースのNPUを搭載し、Gemma 3 270Mをローカル実行可能。

  • Coral BoardはヘッドホンやARグラスなどの小型機器向けAIボード
  • Synaptics Astra SL2619チップとRISC-VベースのCoral NPUを搭載
サイト内本文

AGIのタイムラインはどのラボが支配的かで変動する

最新の分析によると、トップのAI予測者は現在どのラボが業界をリードしているかに応じてAGI(汎用人工知能)のタイムラインを調整しており、支配的ラボがChatGPTからxAI/Meta/Gemini、そしてAnthropicへと移るにつれて、予測は早期化と後期化を繰り返している。

  • ほとんどの認知労働が自動化される(AGI)時期の予測は、現在支配的なAIラボによって大きく変動する。
  • 2023年から2025年にかけて、多くの研究者はAGIタイムラインを早めたが、2025年から2026年にかけては遅らせ、2026年初頭にはAnthropicの急速な進歩により再び早めている。
サイト内本文

データ露呈でAI導入が急停止——その管理方法

AIは生産性を向上させる一方、長年隠されていたデータを露呈させ、セキュリティとガバナンスの課題を引き起こす。フィデリティ・インベストメンツとEYのテクノロジーリーダーが、AI導入を一時停止してデータ管理体制を見直した経験を共有し、データ所有権、ラベリング、エージェントIDの必要性を強調する。

  • AI導入はデータ露呈問題により停止される可能性がある。
  • フィデリティとEYは非構造化データがAIで浮上する課題に直面。
サイト内本文

DeepSWE:オリジナルかつ長期のエンジニアリングタスクにおけるコーディングエージェントの評価

DeepSWEは、AIコーディングエージェントを未踏の複雑なソフトウェアエンジニアリングタスクで評価する新しいベンチマークです。データ汚染を回避し、多様なリポジトリをカバーし、大幅なコード変更を必要とし、手書きの検証器を使用します。最先端モデル間で性能に大きな差が見られ、GPT-5.5が70%の精度でリードしています。

  • DeepSWEはオリジナルタスクによる汚染フリーのベンチマークです。
  • タスクは5言語、91リポジトリにわたります。
サイト内本文

CNN、パープレキシティを「逐語的」複製記事で提訴

CNNはAI検索スタートアップのPerplexityを提訴し、そのAIツールがCNNの記事を「逐語的に」複製し、有料購読の情報をユーザーに提供していると主張している。訴訟はニューヨーク裁判所に提出され、PerplexityがCNNのクローリング防止策を無視していることも告発している。CNNは損害賠償と永久的な差し止めを求めている。

  • CNNがPerplexityを著作権侵害で提訴、AIツールが記事を逐語複製と主張。
  • PerplexityはCNNのクローリング防止策を無視し、有料コンテンツを提供したとされる。
サイト内本文

IBMとRed Hat、AI時代のオープンソースの未来を再定義するために50億ドルを投入

IBMとRed Hatは、Project Lightwellを発表。50億ドルのコミットメントのもと、AIと2万人以上のエンジニアを活用し、オープンソースソフトウェアのセキュリティを強化するための信頼できるエンタープライズクリアリングハウスを設立する。

  • Project Lightwellは、IBMとRed Hatによる50億ドルのオープンソースセキュリティイニシアチブ。
  • AIと2万人以上のエンジニアを組み合わせ、脆弱性を大規模に発見・修正する。
サイト内本文

リビアンのソフトウェア責任者はCarPlayもボタンも不要と考えている

Decoderポッドキャストのインタビューで、リビアンのチーフソフトウェア責任者Wassym BensaidがVWとの合弁事業、新しいAI搭載リビアンアシスタント、そしてなぜ音声インターフェースがボタンに取って代わりCarPlayが不要になるのかについて語った。

  • リビアンとフォルクスワーゲンの合弁事業(RV Tech)は、リビアンのソフトウェア文化とVWの規模を融合させる。
  • リビアンアシスタントは、車両のゾーンアーキテクチャに深く統合されたAIエージェント。
サイト内本文

AIエージェントがDNS上に独自の電話帳を取得

DNS-AIDプロジェクトは、DNSインフラを活用してAIエージェント間の発見を可能にし、新たな中央集権的なレジストリの作成を回避します。Linux Foundationが管理し、MCPやA2Aなどのプロトコルをサポートし、名前、機能、ドメインでエージェントを検索できます。

  • DNS-AIDはオープンソースプロジェクトで、DNSを使ってAIエージェントを発見します。
  • 既存のDNSインフラを基盤とし、SVCBやDNSSECなどの技術を利用。
サイト内本文

人間にとっての親しみやすさを無視した、AI向けの理想言語

PactはAIエージェント向けに設計されたプログラミング言語であり、人間の読みやすさよりも機械可読な仕様と制約を重視します。S式ベースで、来歴証明、副作用追跡、完全性保証、レイテンシ予算などの機能を備え、Rustコードにコンパイルされます。ツールチェーンはYAML仕様からのコード生成やWebプロジェクトの足場構築をサポートします。サービス契約には強いが、アルゴリズム仕様には制限があります。

  • PactはAIエージェント向けのS式言語で、メタデータと形式的仕様を重視する。
  • 主な機能:来歴証明、副作用追跡、完全性、レイテンシ予算。
サイト内本文

AIエージェントのガバナンス:アイデンティティ、委任、権限の実践

AIエージェントには、共有APIキーや開発者の資格情報ではなく、統制されたアイデンティティが必要です。委任モデルにより、有効な権限はエージェントの役割と委任者の権限の共通部分となり、リスクを制限し監査可能性を実現します。この記事では、アイデンティティの固定、権限の境界、自律トリガーの承認、監査証跡などの重要な実践を詳述します。

  • エージェントは人間と同じアイデンティティシステムを使用し、独自の識別子を持つべきです。
  • 有効権限はエージェントの役割上限と委任者の権限下限の共通部分で、操作範囲を厳格に制限します。
サイト内本文