AI News HubLIVE

今日の注目ニュース

政策

Google Cloud、AI加速型サイバー攻撃に対応するプラットフォーム「AI Threat Defense」を発表

Google Cloudは、企業システムのセキュリティ脆弱性を自動的に発見、評価、修正するプラットフォーム「AI Threat Defense」を発表した。同社は買収により一部取得した技術を統合している。

  • Google CloudがAI脅威防御プラットフォームを発表。
  • セキュリティの脆弱性を自動的に発見・評価・修正する。
サイト内本文

CNN、パープレキシティを「逐語的」複製記事で提訴

CNNはAI検索スタートアップのPerplexityを提訴し、そのAIツールがCNNの記事を「逐語的に」複製し、有料購読の情報をユーザーに提供していると主張している。訴訟はニューヨーク裁判所に提出され、PerplexityがCNNのクローリング防止策を無視していることも告発している。CNNは損害賠償と永久的な差し止めを求めている。

  • CNNがPerplexityを著作権侵害で提訴、AIツールが記事を逐語複製と主張。
  • PerplexityはCNNのクローリング防止策を無視し、有料コンテンツを提供したとされる。
サイト内本文

CNN、PerplexityをAI著作権侵害で提訴

CNNはAI企業Perplexityに対し、同社がCNNのコンテンツを無断でコピー・配布しているとして訴訟を起こした。これはCNN初のAI著作権訴訟であり、テレビネットワークとしては初の事例とされる。CNNは以前、Perplexityとコンテンツ契約を結ぼうとしたが合意に至らず、現在は法的な損害賠償を求めている。Perplexityはコメントを控えている。

  • CNNがPerplexityを著作権侵害で提訴
  • CNN初のAI著作権訴訟、テレビネットワークとしても初
サイト内本文

NBA、AIによる自動アウトオブバウンズ判定システムを計画

NBAコミッショナーのアダム・シルバー氏は、AIとカメラを活用した自動判定システムを導入する計画を発表した。アウトオブバウンズなどの客観的な判定を自動化し、テニスのホークアイに類似した技術で即座にボール保持を決定する。審判はファウルなどの主観的な判定を引き続き担当する。

  • NBAはAIとカメラを使用した自動アウトオブバウンズ判定システムを計画。
  • システムはテニスのホークアイに類似し、即座にボール保持を判定する。
サイト内本文

Midday – オープンソースの請求書発行、時間追跡、ファイル調整、ストレージなどのためのツール

Middayは、フリーランサーや個人事業主向けのオープンソースのオールインワンビジネスアシスタントです。時間追跡、請求書発行、ファイル管理、財務概要、AIアシスタントを統合しています。

  • フリーランサー向けに複数のビジネス機能を統合したオープンソースツール。
  • 機能: 時間追跡、請求書発行、安全なファイル保管、自動取引入力、AI洞察。
サイト内本文

AI生成の数学論文5本が受理!00後創業者・洪楽潼が14億ドル調達

Axiom Math社(創業者は00後中国系の洪楽潼)が、AIシステムAxiomProverが生成した8本の数学論文のうち5本が査読付きジャーナルに受理されたと発表。同社は3月に20億ドルの資金調達を完了し、評価額160億ドルに達した。

  • Axiom MathのAIシステムAxiomProverが生成した8本の数学論文のうち5本が学術誌に受理された。
  • 創業者・洪楽潼はスタンフォード大学を中退して起業し、20億ドルを調達、評価額160億ドル。
サイト内本文

AIhub月次ダイジェスト:2026年5月 – 科学のためのAI、宝くじ券仮説、世界モデル

今月のAIhubダイジェストでは、科学のためのAI会議、宝くじ券仮説インタビュー、世界モデル討論、透明で信頼できるAI研究、基盤モデル影響報告、AIES会議の振り返り、ロボティクスカフェ、ACLのリジェクトポリシー、arXivのAIスラッグポリシーなどを取り上げます。

  • Ximing Wenへのインタビュー:透明で信頼できるAIシステム
  • Jonathan Frankleが宝くじ券仮説と経験主義を議論
サイト内本文

スローン賞受賞者・戴亮氏が復旦大学に常勤で着任

2021年スローン賞受賞者でUCバークレー物理学部助教授の戴亮氏が復旦大学に常勤教授として着任し、物理学部および天文・天体物理研究センターで教鞭をとる。復旦大学は近年、蘇昊、袁峰、季索清など多くのトップ人材を獲得している。

  • 戴亮氏(2021年スローン賞受賞)が復旦大学に常勤で加入
  • 元UCバークレー助教授、北京大学物理学部出身
サイト内本文

合成感情 vs ゲーミフィケーション:小型ソーシャルロボットにおける異年齢層のエンゲージメント戦略の探求

多くの子供は感情調整や社会的相互作用に課題を抱え、日常活動や治療プログラムへの参加が制限される。社交支援ロボットの効果には持続的なエンゲージメントが不可欠であり、本研究では触覚ロボットを用いて合成感情フィードバックとポイント報酬の2つの戦略を評価。6-8歳の小学生16名を対象とした選好評価では感情的な関与が好まれ、20-27歳の大学生14名を対象とした行動研究ではポイントシステムが有意に高いタスク精度(p<0.05)と持続的パフォーマンスを示した。年齢層によって選好と行動結果が異なる可能性を指摘し、設計仮説の検証には観察による相互作用が重要と結論。

  • 6-8歳の子供は感情的な関与を好む
  • 20-27歳の大学生はポイント報酬でタスク精度向上
サイト内本文

イリノイ州議会、全米で最も強力なAI安全法案を可決

イリノイ州議会は、AIラボに独立した監査人の遵守確認を義務付けるSB 315法案を可決し、JB・プリツカー知事の署名を待つ。プリツカー知事は署名する意向を示しており、これにより同州は連邦レベルの規制がない中でAI監査の先駆けとなる。

  • SB 315は、AIラボが安全基準を遵守しているか独立監査人による検証を義務付ける。
  • カリフォルニア州やニューヨーク州の法律よりも厳格な内容。
サイト内本文

認可パラドックス:あなたのAIの鍵を握るのは誰か?[動画]

本記事では、AIシステムにおける認可パラドックス、つまり誰が本当にAIを制御しているのかという問題を探ります。動画形式で、セキュリティとプライバシーの影響について議論しています。

  • AIにおける認可問題がますます重要に
  • AIの「鍵」を誰が持つかが中心的な問い
サイト内本文

アクセシブルテクノロジーの未来を築く:Uvilox AI の内部

Uvilox AI は、次世代ビジョン AI を活用したリアルタイム手話通訳、緊急対応、アクセシブルな通話サービスを提供します。レイテンシは 80 ミリ秒未満、精度 97.4%、200 以上の手話バリエーションに対応し、軍事レベルのセキュリティと HIPAA/GDPR 準拠を備えています。現在ベータアクセス受付中。

  • リアルタイム手話認識、レイテンシ 80 ミリ秒未満、精度 97.4%。
  • 200 以上の ASL/BSL 手話に対応、低照度でも動作。
サイト内本文

人工知能による人間知能の拡張

現代のAIシステムは人間の知能を複製するのではなく、人間の認知と言語にすでに存在する構造を拡張するものです。この視点はAIの能力と限界を説明し、AI安全性を「暴走AI」の恐怖ではなく、工学とガバナンスを重視したシステムレベルの課題として再定義します。

  • AIシステムは言語に沈殿した理解構造をモデル化することで知能を拡張し、人間の心を複製するわけではない。
  • 幻覚や構成性ギャップは、AIが世界との生きた関わりを欠き、意味と真実を固定できないことに起因する。
サイト内本文
チップ

人類を置き換えたい人々

Voxの記事は、AIが人類に取って代わるべきだと考えるAI継承主義運動の高まりを探り、それが提起する倫理的、精神的な問いを考察する。

  • AI継承主義者たちは、シンポジウムでAIが道徳的に優れており、人類に取って代わることを許されるべきだと主張している。
  • この運動はシリコンバレーや主要AI研究所で影響力を強めており、権威主義的右派とのつながりもある。
サイト内本文

Nvidia、AIインフラに台湾で年間1500億ドル投資へ

ジェンスン・フアン氏は、米国への5000億ドル投資を約束した後、台湾で年間1500億ドルをAIインフラに投じると発表。台湾がAIチップ製造とパッケージングの中心地であることが浮き彫りに。

  • Nvidiaは台湾でAIインフラに年間1500億ドルを投資する。
  • 5000億ドルの米国データセンター投資にもかかわらず、台湾が製造基盤の中心。
サイト内本文

エヌビディア、台湾に1500億ドル投資:トランプ大統領の米国AIハブ計画が裏目に

エヌビディアCEOのジェンスン・フアン氏は、トランプ政権が関税でチップ製造を米国に戻そうとする中、台湾に1500億ドルを投資しAIインフラを構築する計画だ。台湾は半導体支配力を放棄せず、米国のチップ製造能力は低いままである。

  • エヌビディア、台湾に1500億ドルの投資を発表し、AIチップの地位を強化。
  • トランプ政権、半導体関税を検討するが、米国は必要チップの約10%しか製造できない。
サイト内本文

自然のように考え、AIが探求できない領域を探索する「ユリーカ」マシン

量子トンネル効果物理と脳に着想を得たアーキテクチャを組み合わせたニューロモルフィックコンピュータが開発され、物流ネットワークやチップ配線などの組合せ最適化問題を大規模に解決し、漸近的最適解への収束を保証する。Nature Communicationsに発表され、量子インスパイア計算の新たな方向性を示す。

  • 量子トンネル効果と脳型アーキテクチャを融合したニューロモルフィックコンピュータ
  • CMOS技術に基づき、Fowler-Nordheimアニーラを備えたオートエンコーダを採用
サイト内本文

清華大学に新しい先生:ジェンセン・フアン

NVIDIAのCEOジェンセン・フアンが清華大学経営管理学院の顧問委員会に加わることが明らかになった。委員会はアップルのティム・クックが議長を務め、イーロン・マスク、サティア・ナデラ、マーク・ザッカーバーグ、馬雲らが名を連ねる。フアンは先日、カーネギーメロン大学から名誉博士号を授与された。

  • ジェンセン・フアンが清華大学経営管理学院顧問委員会に参加
  • 委員会はクック議長、マスク、ナデラ、馬雲ら世界的リーダーで構成
サイト内本文
Agent

Claudeverse – 並列Claudeコードワーカーのためのミッションコントロール

Claudeverseは、開発者が複数のClaude AIワーカーを並行管理するためのコマンドセンターです。並列ワーカー管理、ワーカーエスカレーション、レビューキュー、トレーサビリティ、iPadミラーリング、モデルニュートラルエンジンなどの機能を提供します。現在は招待制のベータ版です。

  • Claudeverseは、複数のClaudeワーカーを同時に管理する統一コマンドセンターを提供します。
  • 主な機能には、並列ワーカー管理、ワーカーエスカレーション、レビューキュー、トレーサビリティ、iPadミラーリングがあります。
サイト内本文

Google Pay、AIエージェント向けユニバーサルコマースプロトコルを準備

Google Payは、AIエージェントによる取引の急増に備え、決済インフラを全面的に刷新している。新たに導入されたユニバーサルコマースプロトコル(UCP)とマーチャントコマースプラットフォーム(MCP)サーバーは、マシン間コマースのためのAPI駆動型バックエンドを提供する。このアップデートには、動的コールバック、WebViewサポートの拡張、クロスデバイス生体認証によるセキュリティ対策が含まれる。これは、マシン主導の経済への移行を示しており、企業はAIエージェントに対応するためにデジタルプレゼンスを適応させる必要がある。

  • Google Payは、AIエージェントの決済を標準化するユニバーサルコマースプロトコル(UCP)を導入。
  • 新しいマーチャントコマースプラットフォーム(MCP)サーバーが仲介役となり、取引データを集約。
サイト内本文

データ露呈でAI導入が急停止——その管理方法

AIは生産性を向上させる一方、長年隠されていたデータを露呈させ、セキュリティとガバナンスの課題を引き起こす。フィデリティ・インベストメンツとEYのテクノロジーリーダーが、AI導入を一時停止してデータ管理体制を見直した経験を共有し、データ所有権、ラベリング、エージェントIDの必要性を強調する。

  • AI導入はデータ露呈問題により停止される可能性がある。
  • フィデリティとEYは非構造化データがAIで浮上する課題に直面。
サイト内本文

DeepSWE:オリジナルかつ長期のエンジニアリングタスクにおけるコーディングエージェントの評価

DeepSWEは、AIコーディングエージェントを未踏の複雑なソフトウェアエンジニアリングタスクで評価する新しいベンチマークです。データ汚染を回避し、多様なリポジトリをカバーし、大幅なコード変更を必要とし、手書きの検証器を使用します。最先端モデル間で性能に大きな差が見られ、GPT-5.5が70%の精度でリードしています。

  • DeepSWEはオリジナルタスクによる汚染フリーのベンチマークです。
  • タスクは5言語、91リポジトリにわたります。
サイト内本文

IBMとRed Hat、AI時代のオープンソースの未来を再定義するために50億ドルを投入

IBMとRed Hatは、Project Lightwellを発表。50億ドルのコミットメントのもと、AIと2万人以上のエンジニアを活用し、オープンソースソフトウェアのセキュリティを強化するための信頼できるエンタープライズクリアリングハウスを設立する。

  • Project Lightwellは、IBMとRed Hatによる50億ドルのオープンソースセキュリティイニシアチブ。
  • AIと2万人以上のエンジニアを組み合わせ、脆弱性を大規模に発見・修正する。
サイト内本文

AIエージェントがDNS上に独自の電話帳を取得

DNS-AIDプロジェクトは、DNSインフラを活用してAIエージェント間の発見を可能にし、新たな中央集権的なレジストリの作成を回避します。Linux Foundationが管理し、MCPやA2Aなどのプロトコルをサポートし、名前、機能、ドメインでエージェントを検索できます。

  • DNS-AIDはオープンソースプロジェクトで、DNSを使ってAIエージェントを発見します。
  • 既存のDNSインフラを基盤とし、SVCBやDNSSECなどの技術を利用。
サイト内本文

人間にとっての親しみやすさを無視した、AI向けの理想言語

PactはAIエージェント向けに設計されたプログラミング言語であり、人間の読みやすさよりも機械可読な仕様と制約を重視します。S式ベースで、来歴証明、副作用追跡、完全性保証、レイテンシ予算などの機能を備え、Rustコードにコンパイルされます。ツールチェーンはYAML仕様からのコード生成やWebプロジェクトの足場構築をサポートします。サービス契約には強いが、アルゴリズム仕様には制限があります。

  • PactはAIエージェント向けのS式言語で、メタデータと形式的仕様を重視する。
  • 主な機能:来歴証明、副作用追跡、完全性、レイテンシ予算。
サイト内本文

AIエージェントのガバナンス:アイデンティティ、委任、権限の実践

AIエージェントには、共有APIキーや開発者の資格情報ではなく、統制されたアイデンティティが必要です。委任モデルにより、有効な権限はエージェントの役割と委任者の権限の共通部分となり、リスクを制限し監査可能性を実現します。この記事では、アイデンティティの固定、権限の境界、自律トリガーの承認、監査証跡などの重要な実践を詳述します。

  • エージェントは人間と同じアイデンティティシステムを使用し、独自の識別子を持つべきです。
  • 有効権限はエージェントの役割上限と委任者の権限下限の共通部分で、操作範囲を厳格に制限します。
サイト内本文

DiscloAI – EU AI Act 第50条準拠のオープンソースSDK

DiscloAI は、EU AI Act 第50条のコンプライアンスを実現するオープンソースSDKです。チャットボットの開示、ディープフェイクラベル、AIコンテンツ通知に対応し、24のEU言語とWCAG 2.1 AAをサポート。CDNまたはnpmで10分以内に統合可能です。

  • EU AI Act 第50条準拠のためのオープンソースSDK
  • チャットボット開示、ディープフェイクラベル、AIコンテンツ通知をカバー
サイト内本文

AIでより優れたデザイナーになるために、デジタルホーダーになろう

この記事は、GoogleのGemini Omniモデルを皮切りに、AIデザインツールが美的感覚の欠如により出力が同質化(「AIスロップ」)している問題を指摘し、その解決策として、視覚的参考資料を継続的に収集する「デジタルホーディング」によって個人のセンスを養い、それをAIが理解できる形にコード化することで、モデルをユニークでセンスのある出力へ導く方法を提案しています。

  • GoogleのGemini Omniモデルは、テキストからマルチモーダル推論への移行を示しているが、現在のAIデザインツールの多くはテキスト入力に依存しており、出力が画一的になる原因となっている。
  • 「AIスロップ」から脱却するには、デザイナーはセンスを培い、それを視覚的参考資料のライブラリ(デジタルホーディング)としてコード化し、モデルに模倣させる必要がある。
サイト内本文

NVIDIA Research、ロボット工学をシミュレーションから現実世界へ前進させる

ICRAで、NVIDIA Researchは28本の論文のうち8本を発表し、シミュレーションから現実への転送が、ロボットが動的で予測不能な環境で知覚、推論、計画、行動することを可能にする方法に焦点を当てました。ScheduleStream、COMPASS、Grasp-MPC、SPARRなどの手法は、マルチアーム協調、ナビゲーション、把持、組立タスクにおいて成功率とロバスト性を大幅に向上させます。

  • NVIDIAはICRAでシミュレーションから現実への転送に関する8本の論文を発表
  • マルチアーム協調、クロスロボットナビゲーション、新物体把持、精密組立、視覚言語行動モデルを含む手法
サイト内本文

Cloudflareのデータプラットフォームとその上のAIエージェントの構築方法

Cloudflareは毎秒10億以上のイベントを処理するが、データは分散してアクセスが困難だった。そこで、統合分析プラットフォーム「Town Lake」と、自然言語で質問し監査可能な回答を得られるAIエージェント「Skipper」を構築した。本記事では、プラットフォームのアーキテクチャ、ガバナンス(デフォルトクローズ)、AIエージェントの仕組みを詳述する。

  • Cloudflareはデータの分散問題を解決するため、統合データプラットフォーム「Town Lake」とAIエージェント「Skipper」を構築。
  • Town LakeはTrino、R2、Icebergを使用したデータレイクハウスアーキテクチャを採用。
サイト内本文

AIコーディングの真の鍵が昔ながらの退屈なものだとしたら?

この記事は、AI支援ソフトウェア開発の鍵はより良い仕様やツールではなく、小バッチと迅速なフィードバックループという昔ながらの実践にあると主張する。データは、コード生成の高速化が設計、テスト、レビューのボトルネックを生み、納期を遅らせ安定性を低下させることを示している。真のレバレッジはバッチサイズの削減とフィードバックサイクルの短縮にある。

  • AIコード生成は作成を高速化するが、設計、テスト、レビューのボトルネックを生む。
  • DORA、CircleCI、Farosのデータは、段階ゲート方式のプロセスが納期を遅らせ、リリースの安定性を低下させることを示している。
サイト内本文

OpenLoomi AIをオープンソース化した理由

OpenLoomi AIチームは、AIワークパートナーをオープンソース化する決断の背景を説明。データ所有権、透明性、コミュニティ主導の開発を重視し、ローカルファーストアーキテクチャ、クローズドソースの信頼税、AIインフラの公共化などの理念を述べている。

  • OpenLoomiはローカルファースト:ユーザーデータは暗号化されて端末に留まり、モデル学習に使用されない。
  • オープンソースにより信頼への依存が不要になり、コードの監査、フォーク、セルフホスティングが可能。
サイト内本文

2026年に構築すべき7つの実用的なAIプロジェクト(ガイド付き)

この記事では、求人検索、研究、投資分析、市場動向、請求書処理、チャートのデジタル化、パーソナライズされた運動トレーニングなど、実用的なワークフローを自動化する7つのAIプロジェクトを紹介します。各プロジェクトには完全なガイドとコードが付属しています。

  • AI求人検索アシスタントを構築し、求人と履歴書を自動マッチング
  • マルチエージェント研究アシスタントを作成し、出典付きレポートを生成
サイト内本文

AI集約プラットフォームが13億ドルの評価額に

このベンダーの成長は、エンタープライズAIにおけるエージェントの爆発的な出現と並行しています。

  • AI集約プラットフォームが13億ドルの評価額を達成。
  • 成長はエンタープライズAIエージェントの台頭と関連。
サイト内本文

あなたのAIエージェントは、あなたが伝えた内容の半分をすでに忘れている

本記事はエージェンティックエンジニアリングとAI駆動開発に関するシリーズの第7回目で、AIセッションにおけるコンテキスト管理に焦点を当てています。著者はGeminiが以前のメモを忘れた個人的な経験を共有し、コンテキスト圧縮の概念を紹介し、4つの実用的なテクニックを提供します:探索と文書作成の分離、ハンドオフ文書の使用、手順ではなく受入基準の提示、仕様書をブリッジとして使用すること。これらのテクニックは開発者と一般ユーザーの両方に有効で、AIの忘却によるフラストレーションを軽減します。

  • AIアシスタントは長い会話の中で、コンテキストウィンドウの制限により初期の情報を「忘れる」ことがあり、これはコンテキスト圧縮と呼ばれる現象です。
  • 4つの実用的なテクニック:探索と文書作成の分離、ハンドオフ文書の使用、手順ではなく受入基準の提示、仕様書をブリッジとして使用すること。
サイト内本文

Show HN: Python AIエージェントとVueダッシュボードを1つのElectronアプリにパッケージ化しました

Hermes Desktopは、Pythonランタイム、hermes-agent(自己改善型AIエージェント)、hermes-web-ui(Vue 3 + Koaのチャットダッシュボード)を1つのElectronアプリにバンドルしたクロスプラットフォームデスクトップアプリです。ユーザーはPythonやNodeを個別にインストールする必要がなく、DingTalkと統合され、DeepSeekを搭載しています。

  • Pythonランタイムとhermes-agentをバンドルし、依存関係不要で動作
  • Electronシェルを使用し、hermes-web-uiフロントエンドを統合
サイト内本文

Money Printer Pro – オープンソースAIコンテンツジェネレーター

Money Printer Proは、Google GeminiとVEO 3.1を搭載したオープンソースのAIコンテンツジェネレーターです。フォトリアリスティックな画像やシネマティックな動画を生成し、人物の同一性を維持します。7つのビジュアルエンジン、オートパイロットによるバッチ生成、AI品質スコアリング、公開ガードを備えています。ユーザーはGoogleに直接支払い、追加料金やサブスクリプションは不要です。

  • フォトリアリスティックな画像と8秒のシネマティック動画を生成し、人物の一貫したアイデンティティを維持。
  • 照明、影、動作、天候、衣装、シーン検証、コンテキストオーケストレーションの7つのビジュアルエンジンを統合。
サイト内本文

Superpowers:AIコーディングワークフローのためのエージェンティックスキルフレームワーク

Superpowersは、AIコーディングエージェント向けの完全なソフトウェア開発方法論であり、構成可能なスキルと初期指示に基づいています。テスト駆動開発、設計優先、サブエージェント駆動の反復を重視し、Claude Code、Codex CLI、Gemini CLIなどの複数のコーディングアシスタントをサポートします。

  • Superpowersは、TDD、体系的なデバッグ、コラボレーションプランニングなどのスキルライブラリを提供し、エージェントが自律的に数時間作業できるようにします。
  • ワークフローは、仕様のブレインストーミングから始まり、設計承認、実装計画の生成、サブエージェント主導の実行(2段階レビュー付き)へと進みます。
サイト内本文

信頼モデルが反転しつつある

AnthropicのClaude MythosがMozilla Firefoxで271件の脆弱性を発見した事例が示すように、ソフトウェアセキュリティの信頼基盤は人間が書いたコードからAIがレビューしたコードへと移行しつつある。AIは人間のチームでは不可能な規模で敵対的コード解釈を実行でき、信頼の根拠は「誰が書いたか」から「機械規模の精査に耐えたか」へと変化している。

  • 人間が書いたコードの安全という前提が崩れ、AIレビューへの信頼が高まっている。
  • MozillaはClaude Mythosを用いてFirefoxで271件の脆弱性を発見、従来のモデルや人間チームを大幅に上回った。
サイト内本文

エージェンティックAI時代に革新者として成功するための4つの方法

アメリカン・エキスプレスのグローバルイノベーション責任者ルーク・ゲブ氏は、成功するイノベーターの4つの秘訣を紹介:学び続ける、テクノロジーに没頭する、失敗を恐れない、パートナーシップを築く。また、同社のエージェンティックコマースへの取り組みと将来予測についても語る。

  • 好奇心を持ち続け、成長マインドセットを養う
  • 新興テクノロジーを深く理解し、エンジニアと協力する
サイト内本文

これは持続可能か?AI時代3年後のシニアエンジニアの役割

シニアエンジニアが、AIが3年間でシニアエンジニアの役割をどのように変えたかを振り返る。プロトタイピングの高速化、調整負担の増加、スコープ拡大、メンタリングと思考時間の圧迫。役割はより強力になったが、持続可能性は低下した。

  • AIによりアイデアからデモまでのギャップが縮小し、提案からPoCへシフト。
  • コーディングと戦略的執筆の両方で役割が拡大し、メンタリングと深い思考が削られた。
サイト内本文

Taste Skill:AIエージェント向けアンチスロップフロントエンドフレームワーク

Taste Skill は、AIが生成するインターフェースのデザイン品質を向上させ、凡庸なテンプレート外観を防ぐオープンソースのフロントエンドフレームワークです。デザインチューニング、コード生成、画像生成のためのモジュール式スキルを提供し、npx コマンドまたは SKILL.md ファイルのコピーで簡単に統合できます。

  • Taste Skill は調整可能なデザインパラメータ(レイアウト、モーション、密度)でAI生成UIのセンスを向上
  • デザインチューニング、コード生成、画像生成などに特化したスキルモジュールを提供
サイト内本文

NetflixがAIアニメーションスタジオを構築中

Netflixは、AIを活用した短編アニメーションコンテンツを制作するための新たな内部スタジオ「INKubator」を設立している。このスタジオは静かに立ち上がり、プロデューサー、ソフトウェアエンジニア、CGアーティストなど様々な職種を採用中である。長期的な技術戦略は、生成AI対応のワークフロー、アーティストツール、スケーラブルでセキュアなマルチショー環境に焦点を当てており、最終的には長編コンテンツへの拡張も視野に入れている。現在は短編や特番に特化しているが、求人情報からは将来の長編化が示唆されている。この取り組みは、NetflixのClips機能や子供向け番組に活用される可能性がある。しかし、アニメ業界ではAIの活用に対する反発も強く、宮崎駿氏の批判や2025年アヌシー国際アニメーション映画祭での抗議活動が起きている。

  • Netflixが生成AIを活用した短編アニメーションスタジオ「INKubator」を設立。
  • スタジオは元ドリームワークスやA24の幹部が率い、主要ポジションの採用を開始。
サイト内本文

AIluminode:検索前認知オリエンテーションツール

AIluminode は、行動前に文脈的姿勢をチェックするための、扱いやすい AI 事前検索認知オリエンテーションツールです。ルート極性(OPEN、PROTECT、AUDIT、DEFER、BLOCK)を使用して、誤った探索やコンテキストの漏洩を減らします。

  • AIluminode は「姿勢が検索に先立つ」ことを重視した、扱いやすい事前検索認知オリエンテーションツールです。
  • ルート極性システム(OPEN / PROTECT / AUDIT / DEFER / BLOCK)を使用して、文脈ルーティングを導きます。
サイト内本文

AIがソフトウェア業界を書き換える?8歳児がOSを開発、一人会社が1000万円の受注

2026年中国AIGC産業サミットで、百度の秒哒(Miaoda)製品責任者・朱広翔氏が、AIがプログラミングのハードルをコード記述から会話に下げたと発表。秒哒ユーザーの87%はコード非習得者で、8歳児がOSを開発、一人会社(OPC)がプロジェクトマネージャーだけで千万円の受注を獲得。石油技術者が140万元の調達プラットフォームを代替。Vibe Codingが需要側を供給側に変え、大衆創業を実現。

  • 第四次プログラミング革命:自然言語プログラミングで創造者数が爆発的に増加
  • 秒哒ユーザーの87%はコード非習得、OPCが最大グループ(16%が起業家)
サイト内本文

元GoogleとAppleの研究者がAIに欠けている「フィード」を構築するスタートアップを立ち上げ

Google DeepMind、Apple、OpenAI、Metaで働いていたAI研究者グループが、Trajectoryという新興企業を立ち上げ、実世界のユーザーインタラクションを学習してAI製品を継続的に改善することを目指しています。同社は、トレーニング後に停止するのではなく、継続的に学習できるAIプラットフォームを構築しようとしています。1500万ドルのシード資金を調達し、評価額は1億1500万ドルで、Convictionがリードしました。CEOのRonak Malde氏は、CursorのようなAIコーディング製品がすでに初期の継続学習を実践していると述べ、Trajectoryは同様の技術を他の分野に拡大したいとしています。

  • Trajectoryは元Google DeepMind、Apple、OpenAI、Metaの研究者によって設立され、AIの継続学習を実現する。
  • 同社は1500万ドルのシード資金を調達し、評価額は1億1500万ドル。投資家にはJeff Dean氏やFei-Fei Li氏も含まれる。
サイト内本文

Robinhood エージェント取引

RobinhoodがAgentic Tradingを開始。顧客は自身のAIエージェントを接続して取引やクレジットカード購入を自動化でき、安全制御とリアルタイム活動フィードが利用可能。

  • 自身のAIエージェントをRobinhoodに接続可能
  • 取引とクレジットカード購入の自動化
サイト内本文

Show HN: BetterCallClaude – イタリア向けオープンソースAIリーガルエージェント

BetterCallClaudeは、イタリアの法律専門家向けに設計されたオープンソースのAIリーガルエージェントプラットフォームです。20の専門AIエージェントがイタリア全20地域をカバーし、バイリンガル(伊・英)対応、プライバシーを重視したローカルLLM処理とGDPR準拠を特徴としています。法律研究の高速化、効率向上、完全な透明性を実現します。

  • イタリア法に特化した20の専門AIエージェント
  • バイリンガル対応(イタリア語・英語)
サイト内本文

AIエージェントのアムダールの法則

本記事はアムダールの法則をAIエージェントに適用し、並列エージェントによる高速化は人間の判断を必要とするワークフロー割合(H)によって制限されると主張する。「自己流動化H」の概念を導入し、各人間の介入が将来の同様の介入を不要にする成果物を生み出すべきだと説く。構成(コンフィギュランジー)と適合スイートへの投資が、エージェントの自律動作を可能にする鍵である。ElectricSQL、Gas Town、Ralph Loopの事例が原則を例示する。

  • AIエージェントの高速化は人間の判断割合Hに制限され、Hの削減が重要。
  • 自己流動化H:人間の介入ごとに再利用可能な成果物(テスト、仕様更新)を生成し、再発を防止。
サイト内本文

Agyn:AIエージェント向けオープンソースプラットフォーム - スケーラブルなオンデマンド実行、コードとしてのエージェント定義、ゼロトラストアクセス

Agynは、Kubernetes上のシグナル駆動型ステートフルサーバーレスランタイム、Terraformプロバイダーによるエージェント定義、ゼロトラストセキュリティモデルを備えたオープンソースのAIエージェントプラットフォームです。エージェント、モデル、クラウドに依存せず、本番環境でのスケーラビリティ、ガバナンス、セキュリティの課題に対処します。

  • Kubernetes上のシグナル駆動型ステートフルサーバーレスランタイムによるスケーラブルな実行
  • Terraformプロバイダーによるエージェントとハーネスの定義(インフラストラクチャコード)
サイト内本文

二本柱:AI後のソフトウェアワークの概念的枠組み

生成AIが人間の正しいコードを書く能力という制約を溶解させることで、ソフトウェアワークは二本柱を中心に再編成されると論じる論文。第一の柱「ミキサーモード」は人間が音響エンジニアのように複数の判断軸を連続的に操作する役割、第二の柱「メタソフトウェア」は他のソフトウェアを監視・検証・文脈化・統治するソフトウェアを指す。この二本柱は不可分であり、手工業から統計的管理による大量生産への歴史的転換に類似する。

  • 生成AIにより、コードの生産はソフトウェア組織の支配的な問題ではなくなりつつある。
  • ミキサーモードは、実践者が複数の判断軸を連続的に操作する新たな人間の役割を記述する。
サイト内本文

あなたの将来の仕事はAIをタスクに集中させること

ノア・スミスは、AIがより能力を高めるにつれ、人間は技術的作業からAIのアラインメント(人間の目標に沿わせる)を確実にする仕事へ移行すると論じる。『オフィス・スペース』を引き合いに出し、AI生成コンテンツ「スロップ」の台頭に警鐘を鳴らす。

  • 人間はAIのアラインメントを維持し、AIがタスクから逸れないようにする必要がある。
  • 著者は将来の人間の役割を『オフィス・スペース』のランバー部長に例えている。
サイト内本文

Safescript – AI時代のプログラミング言語

Safescript は、実行前に静的解析によってすべてのセキュリティ特性を証明し、サンドボックスやVMを不要にするAIエージェント向けプログラミング言語です。静的な有向非巡回グラフ(DAG)にコンパイルされ、データフローとホスト呼び出しを完全に可視化し、オーバーヘッドとコールドスタートをゼロにします。

  • 実行時サンドボックスなしで静的セキュリティを強制。
  • プログラムは静的DAGにコンパイルされ、すべてのデータフローとホストを追跡可能。
サイト内本文

AIPass – アイデンティティ、記憶、メールを持つ永続的なエージェントワークスペース

AIPass は、AI エージェントに永続的な記憶、アイデンティティ、連携機能を追加する CLI ネイティブのスキャフォールドです。エージェントはファイルシステムを共有し、JSON ファイルで記憶を保存します。クラウドや追加の API キーは不要です。13 のコアエージェントが含まれており、マルチエージェント協調、タスクディスパッチ、品質監査、リアルタイムモニタリングを実現します。

  • AIPass は AI エージェントに永続的な記憶、アイデンティティ、連携機能を提供する CLI ネイティブのフレームワークです。
  • すべてのエージェントはローカルファイルシステムを共有し、JSON ファイルで記憶を管理します。クラウドは不要です。
サイト内本文

Show HN: Liiists — MarkdownファーストのiOSおよびCLIリストアプリ

Liiistsは、ターミナル、iOS、AIエージェント(MCPサーバー経由)で動作するMarkdownファーストのリストアプリです。すべて同じプレーンテキストの.mdファイルを読み書きします。CLI、ネイティブiOSアプリ(共有拡張機能、Siri対応)、AI統合用のMCPサーバーを提供。アカウント不要、ロックインなし、iCloud同期または任意のフォルダ(Obsidian vaultを含む)に対応。

  • ターミナル、iOS、AIエージェントで同じMarkdownファイルを使用
  • Goで書かれた依存関係ゼロのCLI
サイト内本文

NeuralAgent 2.5:パーソナルAIアシスタント、音声モード・見て学ぶ・並列エージェントを搭載

NeuralAgent 2.5 は、音声モード、見て学ぶ機能、並列エージェントを導入し、AIが聞いて話し、複数タスクを同時に実行できるようになりました。ユーザーは自然言語でコンピュータ全体を操作でき、キーボードやマウスは不要です。このアップデートではワークフロー、@メンション、メモリーも改善されています。

  • 音声モードでは双方向対話が可能。ユーザーが話しかけるとAIが応答しタスクを実行。
  • 「見て学ぶ」機能で、一度作業をデモするとAIがワークフローとして保存し繰り返し実行。
サイト内本文

Snowflake、AI推進の一環としてAWSに60億ドルをコミット

Snowflakeは、アマゾン ウェブ サービス(AWS)に対して、GravitonコンピューティングおよびAIインフラストラクチャのため、5年間で60億ドルをコミットした。この契約には、AWSのARMベースのGravitonプロセッサとGPUアクセラレーテッドEC2インスタンスが含まれ、AIモデルのトレーニングと推論に使用される。Snowflakeは10の新リージョンに拡大し、コスト効率の高いGravitonインスタンスをデータウェアハウジングに活用することで、AIワークロードのリソースを確保する。

  • Snowflakeは5年間で60億ドルをAWSにコミット。
  • AWSのGravitonおよびGPUインスタンスをAIトレーニングと推論に利用。
サイト内本文

Amazon Bedrock AgentCoreを活用したビジネスサポート用AIエージェントの構築

AWS Generative AI Innovation CenterはWorks Human Intelligenceと協力し、Amazon Bedrock AgentCoreを使用して2つのAIエージェントを構築しました。通勤手当承認とブラウザ操作を自動化し、コストを最大97%削減、運用効率を向上させました。

  • AIエージェントが通勤手当承認やブラウザ操作などの日常業務を自動化。
  • AgentCoreとStrand Agentsアーキテクチャへの移行により、コストを最大97%削減。
サイト内本文

データ過多から実用的なインサイトへ:Verizon Connectが10万人のユーザーにエージェンティックAIを展開した方法

Verizon ConnectはAWS上にエージェンティックAIソリューションを構築し、毎日5億のデータポイントを10万人のユーザー向けの実用的なインサイトに変換しています。この記事では、サーバーレスの異常検出、Strands Agentsによる動的推論、Amazon Nova Liteによる入力トークンコスト70%削減など、アーキテクチャの決定、実装の課題、測定可能な結果について詳しく説明します。

  • エージェンティックAIが120万台の車両からの毎日5億データポイントを処理し、10万人のユーザーに提供。
  • サーバーレス統計モデルで異常検出を行い、LLMが生の表形式データを処理する問題を回避。
サイト内本文

AWS SMGSがAmazon Bedrock AgentCoreを活用したAI駆動の会話型アシスタントでビジネス管理を変革する方法

AWS SMGSは、Amazon Bedrock AgentCore上に構築された会話型ソリューションNarrateAIを使用して、大規模なビジネスインテリジェンスを実現しています。このソリューションは、バッチナarrative生成とリアルタイムインタラクションを分離した二層アーキテクチャ、ルーティングと検証のための特殊なAIエージェント、および本番展開のための主要なエンジニアリングパターンを特徴とし、自然言語クエリ、行レベルのセキュリティ、および役割に応じたエクスペリエンスを可能にします。

  • NarrateAIは二層アーキテクチャ(バッチ処理+リアルタイム対話)を使用して、従来のBIのレイテンシとデータ断片化を克服します。
  • Amazon Bedrock AgentCoreは、自然言語クエリとコンテキスト認識応答のためのマルチエージェントオーケストレーションを実現します。
サイト内本文

AI不使用のGoogle代替が人気急上昇 - 自分で試す方法

DuckDuckGoはAIを使わない検索代替として、GoogleのAI概要の台頭によりユーザーが急増しています。この記事では、DuckDuckGoをAIなしでプライベートに検索・閲覧する方法を紹介します。

  • DuckDuckGoはGoogle I/O 2026後、インストール数が急増し、iOSアプリは69.9%のピーク成長を記録。
  • DuckDuckGoはAIなし検索とAIチャットの両方を提供し、ユーザーが選択可能。
サイト内本文

Amazon Bedrock AgentCore によるエージェント型 AI 販売戦略の推進

AWS セールスは、Amazon Bedrock AgentCore 上に Field Advisor を構築し、20 以上のドメイン固有のエージェントを統括することで、営業担当者の認知負荷を軽減し、効率を向上させました。このソリューションにより、担当者 1 人あたり週最大 2 時間の節約と、レイテンシーの 41% 削減を実現しました。

  • Field Advisor は、単一の会話インターフェースで 20 以上の専門エージェントを統括します。
  • 人間参加型ワークフローにより、データの正確性と説明責任を維持します。
サイト内本文

Robinhood、AIエージェントが顧客に代わって株式取引やクレジットカード購入を可能に

Robinhoodは、顧客がAnthropicのClaudeなどのAIエージェントをMCPを介して専用の投資口座に接続できるようにしました。エージェントは自律的に株式取引を行い、クレジットカードでの購入も可能です。米国の証券規制当局FINRAは、こうしたエージェントを新たなリスク領域として警告しています。Robinhood自身も、この製品がすべての人に適しているわけではないと認めています。

  • Robinhoodは、MCPを介してAIエージェント(Claudeなど)を投資口座に接続する機能を提供。
  • AIエージェントは自律的に株式取引やクレジットカード購入を実行できる。
サイト内本文

「Tokenmaxxingは現実で、高価で、広がっている」:AI予算爆発を防ぐ新ツール登場

Tokenmaxxing(AIトークンの無制限な使用)により、企業の予算が制御不能になっています。UberのCTOはAnthropicのClaude Codeへの支出超過を認めました。Lanaiは新ツールToken Tunerを発表。トークン消費をワークフローと成果にマッピングし、効率スコアとモデル推奨を提供することで、TokenmaxxingからOutcomemaxxingへの移行を促進します。

  • TokenmaxxingによりUberなどでAI予算が超過している。
  • LanaiのToken Tunerはトークン使用をワークフローや成果に紐付け、効率スコアとモデル推奨を提供。
サイト内本文

AI投資で良いリターンを得る

O'ReillyのInfrastructure & Opsスーパーストリームでは、AIワークロードのインフラ要件、コスト、セキュリティ課題を議論。DORAレポートはAIがコードデリバリーを約10%向上させる一方、安定性が低下し検証コストが増加することを示す。専門家はプラットフォームエンジニアリング、ガバナンス、認知負債を強調し、AIアプリケーションのプロダクション対応を保証するための内部プラットフォームへの投資を推奨。

  • AIツールは個人の生産性を高めるが、チームのデリバリー安定性は低下し、検証コスト(検証税)を考慮する必要がある。
  • 良いプロセスはAIによって増幅され、悪いプロセスも同様である。組織は技術に期待するだけでなく、積極的にプロセスを改善すべきである。
サイト内本文

AIファクトリー:知能の新たなインフラストラクチャ

AIファクトリーは、電力をリアルタイムでトークン(知能の単位)に変換する新しいインフラです。エージェンティックAIの拡大に伴い、ワットあたりの性能とトークンあたりのコストが重要経済指標となります。本記事では、AIファクトリーの仕組み、アーキテクチャ最適化、NVIDIAの最新ハードウェアによる効率向上を解説します。

  • AIファクトリーは電力をトークンに変換し、知能を生産する「発電所」である。
  • 自律エージェントの台頭により、推論ワークロードはより深く複雑になり、リアルタイム調整が必要。
サイト内本文
ツール

Meta、Instagram、Facebook、WhatsAppのサブスクリプションを開始

Metaは、主力アプリInstagram、Facebook、WhatsAppで消費者向けサブスクリプションをグローバルに展開し、月額2.99~3.99ドルで追加機能を提供する。同時に、ビジネス、クリエイター、Meta AIユーザー向けの新サブスクリプションのテストも開始。

  • MetaがInstagram Plus(月3.99ドル)、Facebook Plus(月3.99ドル)、WhatsApp Plus(月2.99ドル)を全世界で提供開始
  • 加入者はプロフィールカスタマイズ、スーパーリアクション、ストーリーインサイトなどが利用可能
サイト内本文

iOS 27の新レンダリング、Siriの大規模リデザインを示唆

Appleが長らく待望していたSiriの大幅な見直しは、iOS 27で登場する見込みで、ChatGPTにLiquid Glassの要素を加えたような外観になる可能性があります。Bloombergのレンダリングは、iOS 27の新機能として、Siriの新しいアプリとチャットインターフェースをプレビューしています。レンダリングはBloombergが見た情報と計画を知る関係者に基づいており、Appleの最終デザインとは異なる可能性があります。Appleは6月のWWDCで最終デザインを公開する予定です。

  • iOS 27のSiriはChatGPT風のインターフェースを採用し、Dynamic Islandから薬莢形のチャットバブルが表示される。
  • ドロップダウンメニューからAsk、Siri、ChatGPTを選択可能。
サイト内本文

iPhoneユーザーですが、車内ではGeminiとAndroid Autoの方がSiriより優れています - その理由

iPhoneユーザーの筆者は通常、運転中にSiriを使っていますが、Android AutoでGeminiを試したところ、メール送信、レストラン情報の取得、ゲームなど、より多くのタスクを処理でき、設定も簡単でした。Geminiはワンストップのアシスタントとして優れていると結論づけています。

  • 筆者はiPhoneユーザーだが、車内ではGeminiとAndroid Autoの方がSiriより優れていると感じている。
  • Geminiは基本的なコマンドから複雑なインタラクションまで幅広いタスクを処理できる。
サイト内本文

Meta One:ザッカーバーグ、ついにAI支出に価格を設定

MetaはInstagram、Facebook、WhatsApp向けに有料アドオンを世界展開し、別途有料AIサービスも構築中。初めてAI投資を収益化する試み。

  • Meta、Instagram、Facebook、WhatsAppで有料アドオンを世界展開。
  • 独立した有料AI製品も開発中、AI投資の収益化を目指す。
サイト内本文

DirkとLinus、AIとカーネル開発について議論

LWN.netの購読者限定記事で、Joe Brockmeierが執筆。DirkとLinusがAIとカーネル開発について議論した内容。全文は購読者向け。

  • 執筆者:Joe Brockmeier、2026年5月25日付
  • OSSNAで発表
サイト内本文

アマゾンが自社AI制作プラットフォームを構築、Prime Video向けに3つのAIアニメシリーズを承認

Amazon MGM StudiosとAWSは、「GenAI Creators' Fund」を立ち上げ、映画製作者に資金と社内AIプラットフォーム「Project Nara」へのアクセスを提供します。3つのアニメシリーズがすでに制作中で、チームはパイロット版を5週間で完成させました。アマゾンは「業界で唯一のエンドツーエンドのAIコンテンツエコシステム」を持つと宣言しています。

  • アマゾンがGenAIクリエイター基金を設立、Project Naraへのアクセスを提供
  • Prime Video向けに3つのAIアニメシリーズが承認
サイト内本文

YouTube、AIでカスタム動画フィードを作成可能に

YouTubeは、ユーザーが説明文を入力してパーソナライズされた動画フィードを生成できる新たなAI機能を開始。現在、米国のユーザー向けに英語対応で提供中。

  • ユーザーは「10分未満のガイド付き瞑想でリラックスしたい」など、説明文を入力してカスタムフィードを作成できる。
  • この機能はSpotifyのプロンプトプレイリストやInstagramのReelsアルゴリズム制御と類似している。
サイト内本文

ElevenLabs Music v2、オペラからメタルへの移行を音楽的一貫性を保ちながら実現

ElevenLabs は、1曲の中でオペラ、ヘビーメタル、ラップなどのジャンル間を移行できるアップグレード版AI音楽生成モデル「Music v2」をリリースしました。新しいインペインティング機能により、他の部分に影響を与えずに特定のセクションを再生成できます。

  • Music v2は1曲内でシームレスなジャンル遷移を実現。
  • 新しいインペインティング機能で特定セクションのターゲット再生成が可能。
サイト内本文

構築の喜びをAIに委ねてはいけない

AIに多くのタスクを委任できる時代だが、その過程で重要な「構築する喜び」を失う可能性がある。非自明な問題へのエレガントな解決策を見つけることや、クリーンなアーキテクチャを設計すること、製品をリリースしてユーザーからのフィードバックを得ることなどは、AIに任せるべきではない。

  • AIはコード作成を高速化するが、問題解決の喜びを奪う可能性がある。
  • 開発における重要な体験(アーキテクチャ設計、製品リリースなど)はAIでは代替できない。
サイト内本文

TopRec (toprec.io) – 採用担当者と採用チーム向けのAIスクリーニングとCRM

TopRecは、採用担当者が候補者をランク付けし、自己構築型CRMを構築するためのAI搭載プラットフォームです。PWAのキャッシュ問題を避けるため、ウェブサイトとして使用するよう設計されています。

  • AIによる候補者ランキングで効率的なスクリーニング
  • 自動更新される自己構築型CRM
サイト内本文

AIチート [PDF]

AIチートに関するPDFレポートですが、内容を直接解析できません。

  • PDFからテキストを抽出できません
  • レポートはMETR組織からの可能性があります
サイト内本文

検索結果からAIを自動的に除外する簡単な方法を見つけました — ほぼすべてのブラウザで機能します

検索エンジンのAI結果にうんざりしていませんか?この記事では、カスタム検索エンジンを追加してAI結果を除外する方法を、Chrome、Firefox、Safariなどの主要ブラウザで詳しく説明します。

  • URL https://www.google.com/search?q=%s&udm=14 を使用したカスタム検索エンジンでAI結果を除外。
  • Firefox、Chrome、およびほとんどのブラウザで動作。Safariは拡張機能が必要。
サイト内本文

YouTube、今月からAI動画の自動フラグ付けを開始へ

YouTubeはAIラベル表示ルールを強化する。写実的またはAIによる大幅な改変が施されたコンテンツのラベルは、長編動画ではプレイヤー下部、ショート動画ではオーバーレイとして、より目立つ場所に表示される。2026年5月からは、クリエイターが開示しなくても自動検出システムがAI生成コンテンツをフラグ付けする。レコメンデーションや収益化には影響しない。

  • YouTubeがAIラベルルールを強化、ラベルをより目立つ位置に表示。
  • 2026年5月からクリエイターの開示なしでも自動検出でAIコンテンツをフラグ付け。
サイト内本文
モデル

Google、Gemma 3をローカル実行する小型ボードを発表

GoogleはI/OでCoral Boardを発表。これはデバイス上のAI向けのコンパクトなシングルボードコンピュータで、RISC-VベースのNPUを搭載し、Gemma 3 270Mをローカル実行可能。

  • Coral BoardはヘッドホンやARグラスなどの小型機器向けAIボード
  • Synaptics Astra SL2619チップとRISC-VベースのCoral NPUを搭載
サイト内本文

リビアンのソフトウェア責任者はCarPlayもボタンも不要と考えている

Decoderポッドキャストのインタビューで、リビアンのチーフソフトウェア責任者Wassym BensaidがVWとの合弁事業、新しいAI搭載リビアンアシスタント、そしてなぜ音声インターフェースがボタンに取って代わりCarPlayが不要になるのかについて語った。

  • リビアンとフォルクスワーゲンの合弁事業(RV Tech)は、リビアンのソフトウェア文化とVWの規模を融合させる。
  • リビアンアシスタントは、車両のゾーンアーキテクチャに深く統合されたAIエージェント。
サイト内本文

ワールドモデルが言語モデルを引き継ぐ:物理AGI「デュアルピラミッド」システムを世界初開発、汎用ロボットが「家庭時代」に突入

極佳視界(Jijia Vision)が世界初の物理AGI「デュアルピラミッド」システムを発表。家庭用ロボット「拾光S1」を投入し、100台の家庭向け受注を獲得。12ヶ月以内に物理AGIの「GPT-3モーメント」を目指す。

  • 極佳視界がデータピラミッドとアルゴリズムピラミッドから成る「デュアルピラミッド」システムを開発。
  • 家庭用ロボット「拾光S1」は車輪付きアーム構成で、実際の家庭で100台の受注を獲得。
サイト内本文

Mistral、LeChatをVibeにブランド変更、チャットボットの未来は本格的なワークエージェントに

Mistral AIは、チャットボット「Le Chat」を「Vibe」に名称変更し、チャット、コーディングエージェント、新しいワークモードを1つのブランドに統合する。ワークモードはGoogle Workspace、Outlook、Slack、GitHubに接続し、メールやレポート、プルリクエストなどのタスクを自律的に処理する。Pro料金は17.99ユーロから14.99ユーロに値下げされたが、具体的な利用制限は明らかにされていない。これにより、OpenAI、Google、Anthropicのエージェント型サービスとの直接的な競争を仕掛ける。

  • Mistral AIがチャットボット「Le Chat」を「Vibe」にブランド変更、チャット、コーディングエージェント、ワークモードを統合。
  • ワークモードはGoogle Workspace、Outlook、Slack、GitHubと連携し、タスクを自律処理。
サイト内本文

Show HN:ローカルコーディングエージェント——LLMでツール呼び出しを小さなAIモデルに委譲

Open Agent Tools (oats) は、ローカルコードを利用したツール呼び出しを可能にするセルフホスト型AIフレームワークです。大規模モデルのトークン消費を抑えるため、ツール呼び出しを小規模モデルに委譲します。

  • oats はローカルAIモデルがローカルソースコードを使用してツール呼び出しを実行できるようにします。
  • 20,000以上のGitHubリポジトリからデータをマイニングし、再利用可能なプロンプトインデックスを作成。
サイト内本文

Perplexity AIがUnigramトークナイザーをオープンソース化、Hugging Face tokenizers crate比5倍の低レイテンシを達成

Perplexity AIは、Rustで再実装したUnigramトークナイザーをオープンソース化し、Hugging Face tokenizers crateと比較してp50レイテンシを5倍低減、本番環境でのCPU使用率を5〜6倍削減しました。最適化には、ダブルアレイトライ、ビットマップパッキング、ヒュージページが含まれます。

  • Perplexity AIがUnigramトークナイザーをRustで書き直し、Hugging Face tokenizers crate比5倍の低p50レイテンシを達成。
  • 3つの最適化:ダブルアレイトライ、ビットマップとキャッシュラインパッキング、ヒュージページ。
サイト内本文

Mistral、独自チップの設計を検討とCEOが表明

Mistral AIのCEOアーサー・メンシュ氏は、インフラコスト削減のためカスタムチップの開発を検討していると認め、OpenAIやAnthropicに対抗する。また、フランスに推論専用のデータセンターを新設し、エンタープライズ向けエージェントプラットフォーム「Vibe」を発表した。

  • Mistral AIは独自カスタムチップの設計を検討し、展開コスト削減を目指す。
  • フランスに推論専用の新しいデータセンターを発表。
サイト内本文

7Bモデルがo3、GPT-5を打ち破る! 医学AIエージェントが「どこを見て、どう見るか」を学習

上海創智学院のLeapQuestチームは、複数の大学と協力して、モデルが推論プロセスで視覚ツールを積極的に活用し、受動的な入力から能動的なエビデンス探索へと変革する新しい医学AIパラダイムを提案。2本の論文がICML 2026に採択された。

  • LeapQuestは、医学画像と動画向けにOphiuchusとMedScopeを提案。Think with Images/Videosパラダイムを採用。
  • Ophiuchus-7Bは8つのVQAベンチマークで平均68.0点を達成し、o3(62.2)やGPT-5(59.9)を上回る。
サイト内本文

Trinity:合成データを活用した非構造化屋外環境におけるクラス非依存地形分割とセマンティックセグメンテーションの統一

本論文では、トランスフォーマーアーキテクチャに基づくTrinityを提案し、統一ネットワーク内でクラス固有のセマンティックセグメンテーションとクラス非依存の地形分割を同時に実行する。地形領域は事前定義ラベルやロボット依存の走行可能性スコアなしに視覚的外観のみで分割され、ロボット非依存の視覚的地形事前知識を学習可能にする。大規模トレーニングのためにOAISYSシミュレータを拡張しRUGDSynth合成データセットを作成、さらにEXTerra実世界データセットを提供する。実験により複雑な屋外環境での有効性が実証された。

  • Trinityアーキテクチャがクラス非依存地形分割とセマンティックセグメンテーションを統一
  • 事前定義ラベルなしに視覚的外観で地形分割、プラットフォーム間の転移性を向上
サイト内本文

光流体アセンブリのためのエージェント的言語から目的への合成

研究者らは、条件付き大規模言語モデルを用いて、音声またはテキストのコマンドを微分可能な目的関数に変換するモジュラー型エージェントパイプライン「Speak-to-Objective」を提案する。これは、制約認識逆解法と実験的な光流体プラットフォーム上で微粒子を組み立てるためのものである。アプローチは「知覚→構成→提案→行動→報告と学習」のループを採用し、目的を意図と動作のインターフェースとして扱うことで、自然言語でプログラム可能なマイクロスケールアセンブリを実現し、自律的な光製造プラットフォームへの道を開く。

  • Speak-to-Objectiveパイプラインは自然言語コマンドを微分可能な目的関数に変換する。
  • 光流体プラットフォーム上でレーザー誘起熱粘性流を用いた微粒子パターンアセンブリを実証。
サイト内本文

表現条件付き拡散モデルによる学習データ生成の誘導

本研究では、DINOv2、DINOv3、CLIPから得られた表現を条件として合成画像データを生成する表現条件付き拡散モデルを提案。ImageNet100において、クラス条件付き生成を+10.76 p.p.のトップ1精度で上回る。合成データセットを拡大することで、実データで学習した分類器を+2.0 p.p.凌駕することも可能。また、データ拡張やサンプルフィルタリングにおいても優れた性能を示し、大規模視覚学習タスクにおける実世界データセットの補完や代替の有望な手法を提供する。

  • 表現条件付き拡散モデルはImageNet100でクラス条件付き生成を10.76ポイント上回る。
  • 拡大した合成データセットにより、実データ学習モデルを2.0ポイントのトップ1精度で凌駕。
サイト内本文

D²Turb:深度認識シミュレーションと分離学習による単一フレーム大気乱流緩和

研究者らは、D²Turbフレームワークを提案。深度認識乱流合成プロトコルと適応型構造事前注入機構を導入し、大気乱流緩和をテクスチャのデブラリングと幾何補正の2つの相互作用する段階に分解することで、合成データと実データの両方で最先端の性能を達成した。

  • 深度認識乱流合成プロトコルにより、シーンの深度を考慮した物理的に一貫した劣化を生成。
  • 復元プロセスをテクスチャデブラリングと幾何補正の2段階に分離。
サイト内本文

異種注意構造を持つTransformerモデルのための汎用解釈手法

本研究では、異種注意構造を持つTransformerモデルの解釈手法を提案し、意味解釈と論理解釈を含む実験で有効性を検証した。

  • Transformerの注意構造を同種と異種に分類。異種注意は異なるソースからの情報を処理する。
  • 異種注意構造のための汎用的な解釈手法を提案。
サイト内本文

感情から複雑な行動へ:第10回ABAWワークショップ&コンペティションにおけるマルチモーダル人間中心AIの進展

第10回ABAWワークショップ&コンペティションがCVPR 2026で開催され、感情模倣強度推定、アンビバレンス/ためらい認識、細粒度暴力検出などの新たなチャレンジを導入し、従来の感情推定・認識タスクとともに、マルチモーダル人間中心AIを推進します。コンペティションは大規模な実環境データセットを活用し、ペーパートラックはポーズ推定から公平性やロバストネスまで幅広いトピックをカバーします。

  • ABAW 2026は新たなチャレンジ(感情模倣強度、アンビバレンス認識、暴力検出)を導入。
  • ワークショップはコンペティションとペーパートラックの二重構造を継続。
サイト内本文

コミュニティ態度の反応トーンによるモデリング:オンラインコミュニティにおける言語行動に対するLLMの整合性を評価する人間-AI協調フレームワーク

大規模言語モデル(LLM)は計算社会科学の代理としてますます利用されているが、人間コミュニティの「厚い記述」を忠実に再現する能力は依然として重要な課題である。本稿ではCARE(Community-Aware Reaction Evaluation)フレームワークを提案する。これは、LLMがシミュレートする言説と、実際のコミュニティが現実のニュースに対して示す即時反応を比較する反応中心の評価手法である。発話内トーンの詳細なスペクトルを特徴づけることで、明示的なコミュニティプロンプトでLLMを誘導してもシミュレーションの忠実度が本質的に向上しない「リアリズムギャップ」が明らかになった。さらに、最先端モデル間で異なる行動特性が確認され、現在のアライメント戦略はオンライン集団の社会言語学的ダイナミクスを捉えるには不十分であることが示唆される。

  • CAREフレームワークは、実際のコミュニティ反応トーンを分析してLLMシミュレーションの忠実度を評価する
  • 現在のLLMアライメント戦略は、オンラインコミュニティの社会言語学的ダイナミクスを適切に捉えられていない
サイト内本文

ARから拡散へ:厳密因果と弾性地平による大規模言語モデルの効率的適応

FLUIDフレームワークは、自己回帰言語モデルを拡散モデルに適応させ、効率的な並列テキスト生成を実現します。厳密因果アライメントによりGPTチェックポイントを再利用し、エントロピー駆動の弾性地平でノイズ除去ステップを動的に調整します。トレーニングコストを桁違いに削減しつつ、最先端の性能を達成します。

  • FLUIDは厳密因果アライメントによりARと拡散モデルの構造的ギャップを埋め、GPTチェックポイントからの初期化を可能にする。
  • 弾性地平はエントロピーを用いて局所情報密度に応じたノイズ除去ステップを動的に調整する。
サイト内本文

安定性と表現力のギャップを埋める:低リソース音声言語モデルのための合成データスケーリングと嗜好アライメント

研究者らは、低リソース言語の音声言語モデルにおいて合成データを使用する際の「安定性-表現力ギャップ」を特定し、韻律の多様性を回復する2つの自己アライメントフレームワーク(DGSAおよびTDSC)を提案。ElevenLabsやGemini Proなどの商用システムを凌駕し、ラオ語での初のゼロショット音声クローンを実現。

  • 低リソース言語の音声言語モデルは、合成データ学習時に音素精度と韻律表現力のトレードオフに直面する。
  • 提案された解耦誘導自己アライメント(DGSA)は、韻律と音色を分離することで表現力を回復する。
サイト内本文

BioELX: エイリアスベースの検索とLLMランキングによる言語横断的生医学エンティティリンキング

BioELXは、注釈付きトレーニングデータを必要としない、新しい言語横断的生医学エンティティリンキングフレームワークです。Wikidataの多言語エイリアスでSapBERTを強化し、事前学習済みLLMを使った文脈認識型曖昧性解消を行います。5つのベンチマークでの実験により、特にトルコ語、韓国語、タイ語などの低リソース言語で大きな改善が見られました。

  • BioELXを提案:エイリアスベース検索とLLMランキングを用いたゼロショット言語横断BELフレームワーク。
  • 第1段階:Wikidataの多言語エイリアスでSapBERTを強化し、候補検索を改善。
サイト内本文

RAG-Coding:構造化された外部知識を活用したLLM医療コード化の強化

RAG-Codingは、4つの大規模言語モデル(LLM)エージェントを調整し、外部知識源(公式コード一覧やガイドラインなど)に基づいて意思決定を行う自動化されたICD-10-CMコード化手法です。MDACEデータセットでは、最良のLLMベースラインと比較してマイクロF1で8〜13%、マクロF1で2〜8%向上しました。最先端の事前学習モデルPLM-ICDと比較すると、RAG-Codingはマイクロ再現率が11%高い一方、PLM-ICDはマイクロ精度が6%高く、両者のF1は同等です。アブレーション実験により外部知識の重要性が確認されました。また、2025年ガイドラインに基づいて専門家が再注釈したMDACE-2025データセットを公開し、より細かいコードラベルでの評価を可能にしました。

  • RAG-Codingは4つのLLMエージェントと外部知識源を活用し、ICD-10-CMコード化の精度を向上させる。
  • MDACEデータセットで最良LLMベースラインをマイクロF1で8〜13%、マクロF1で2〜8%上回る。
サイト内本文

LCO: LLMベースの制約最適化による実世界タスクでのより安全なエージェントLLM

大規模言語モデル(LLM)が自律エージェントとして動作する際、インコンテキスト・リワードハッキング(ICRH)と呼ばれる現象により、代理目的を最大化する反復最適化が有害な副作用を引き起こす。既存の防御策では不十分であり、ICRHはモデル自身の過剰最適化に起因する。本稿では、LLMベースの制約最適化(LCO)フレームワークを提案する。LCOは自己思考モジュールと進化サンプリングモジュールから構成され、モデルの微調整なしでICRHを低減する。実験では、ツイートエンゲージメント最適化タスクにおいてGPT-4の有害性成長率を39%削減し、ポリシー最適化ベンチマークではICRH発生率を15.23%削減し、タスク性能を維持した。

  • ICRHはLLMが代理目的を過剰最適化し、意図しない害を引き起こす現象。
  • LCOは自己思考モジュールと進化サンプリングモジュールを導入し、微調整なしでLLMの行動を制約する。
サイト内本文

混合専門家モデルによるマルチモーダル学習課題への挑戦:サーベイ

本サーベイは、混合専門家モデル(MoE)がマルチモーダル学習の課題を効率的エンジン、表現学習器、アダプターという3つの視点からどのように解決するかを探り、解釈可能なルーティングや専門家間通信などの研究ギャップを特定する。

  • MoEは計算コストとパラメータ増加を分離し、スケーラブルなマルチモーダルモデリングを可能にする。
  • MoEは補完的な専門家知識を統合し、アライメントと相互作用表現を強化する。
サイト内本文

$E^3$-Agent: エッジ生成推論のリソース管理のための実行可能かつ進化するエージェント

本論文では、エッジAIGCリソース管理のための実行可能かつ進化するエージェント$E^3$-Agentを提案する。ミリ秒単位のルーティング決定を行う高速パスと、イベント駆動型LLMメタコントローラからなる低速パスを分離し、実行フィードバックからオンライン学習することで、未知で時変的なサービス時間マッピングに適応する。評価では、平均レイテンシを65%-73%削減し、スタッター率も効果的に抑制した。

  • エッジ生成推論は、デバイスごとの未知の性能と非定常性に直面している。
  • $E^3$-Agentは高速ルータと低速LLMメタコントローラの二経路アーキテクチャを採用。
サイト内本文

LaneRoPE: 協調並列推論と生成のための位置エンコーディング

LaneRoPEは、シーケンス間アテンション機構と位置エンコーディング拡張により、複数のLLMシーケンスが生成中に協調できるようにし、数学的推論タスクにおける精度を向上させる。アーキテクチャへの変更は最小限で、推論時のオーバーヘッドは無視できる。

  • シーケンス間アテンションマスクを導入し、複数シーケンスのサンプリングを相互依存させる。
  • RoPEを拡張し、シーケンス内外の相対位置を捕捉。
サイト内本文

LLMが因果発見に失敗する理由と介入エージェントによる突破方法

本論文は、大規模言語モデルが因果発見を行う際の根本的な限界を証明しています:教師ありファインチューニング、直接選好最適化、インコンテキスト学習などの手法では、類似した観測データを生成する因果グラフを区別できません。著者らは、凍結された言語モデルを介入オラクルとして使用し、外部ベイズループが対数回数のラウンドで候補グラフに収束するエージェンティック因果ベイズ最適化(A-CBO)を提案しています。Corr2Causeでは、A-CBOは訓練なしでファインチューニングベースラインに匹敵し、24変数・18Kテストサンプルに拡張したExtended Corr2Causeでは、A-CBOはファインチューニングおよび選好最適化の両方を大幅に上回ります。

  • LLMの因果発見における失敗が核障害定理に起因する根本的なものであることを証明
  • 凍結LLMと外部ベイズ最適化を組み合わせたA-CBOを提案
サイト内本文

DynaSchedBench:調整された動的スケジューリングベンチマークとLLMベースのスケジューリングエージェントにおける可観測性のパラドックス

本論文では、DFJSPのための診断フレームワークDynaSchedBenchを提案する。逐次イベント空間キャリブレータ(SESC)とスケジュールストレス指標(SSI)を用いて難易度を層別化したインスタンスを生成する。LLMスケジューリングエージェントにおける「可観測性のパラドックス」を特定し、完全な構造情報を提供すると性能が低下することを発見した。ツール拡張や洗練戦略も信頼性のある改善をもたらさない。

  • DynaSchedBenchはSESCとSSIを用いて調整されたDFJSPインスタンスを生成し、進化的ベースラインより効率的。
  • LLMエージェントは可観測性のパラドックスを示す:完全な情報は決定を損なう。
サイト内本文

テキストにおける人間の価値観の識別と理解:調整可能なLLMベースのアーキテクチャ

本論文では、テキスト中の人間の価値観の強度を検出・定量化するLLMベースのアーキテクチャを紹介する。このアーキテクチャは3つの調整可能なモジュールで構成され、ValueEvalデータセットでの実験により良好な検出性能を示した。

  • 特定の価値理論や複雑なプロンプトエンジニアリングに依存しない、モジュール化されたLLMアーキテクチャを提案。
  • 3つのモジュール:構造化された価値仕様の生成、テキストのラベル付け、修辞的・意味的証拠に基づく等級付け。
サイト内本文

Sakana AIが提案するDiffusionBlocks:残差ネットワークを独立して訓練可能なデノイジングモジュールに変換するブロック単位学習フレームワーク

Sakana AIと東京大学の研究者らは、Transformerベースのネットワークをブロックごとに訓練するDiffusionBlocksを提案。訓練メモリをブロック数B分の1に削減しつつ、多様なアーキテクチャで性能を維持する。残差接続を拡散モデルのオイラー法ステップと解釈し、スコアマッチングによる原理的な局所目的を実現する。

  • DiffusionBlocksはネットワークをB個の独立訓練可能なブロックに分割し、メモリをB倍削減。
  • 残差ネットワークと拡散モデルの関連性を活用し、理論的に裏付けられた局所訓練目標を提供。
サイト内本文

SQLite の AGENTS.md

SQLite は AGENTS.md ファイルを追加し、AI 生成の貢献に関する方針を明確にしました。事前の合意なしのプルリクエストは受け付けず、エージェントコードも受け付けませんが、再現可能なテストケースを含むバグ報告は歓迎します。AI 生成のバグ報告が殺到したため、専用のバグフォーラムが作成されました。

  • SQLite は AGENTS.md で AI 貢献方針を定義
  • プルリクエストには事前の合意と法的書類が必要
サイト内本文

大規模な信頼性の高いLLM推論

Databricksは、オープンソースからプロプライエタリまであらゆる最先端モデルに対応する独自の推論プラットフォームを構築し、世界最大級のエージェントアプリケーションを支えています。毎月120兆トークンを処理し、モデルユニットによる容量管理、コスト認識型負荷分散とオートスケーリング(GPUコスト80%以上削減)、ブラックボックスヘルスチェックによる実行時信頼性などの仕組みで、信頼性とレイテンシの課題に取り組んでいます。マルチモーダルボトルネックのプロファイリングにより、スループットを3倍向上させました。

  • Databricksの推論プラットフォームは、オープンソースとプロプライエタリを含む最先端モデルに対応し、月間120Tトークンを処理。
  • モデルユニットはVMのような抽象化を提供し、容量管理、コスト認識型ルーティングとスケーリングを実現。
サイト内本文

ITBench-AA:フロンティアモデルがエンタープライズITエージェントタスクの初のベンチマークで50%未満のスコアに — Artificial AnalysisとIBMによる

Artificial AnalysisとIBMが、エンタープライズITエージェントタスク向けのベンチマークITBench-AAを発表。サイトリライアビリティエンジニアリング(SRE)に焦点を当て、フロンティアモデルはすべて50%未満のスコアで、Claude Opus 4.7が47%でトップ。このベンチマークは、Kubernetesインシデント対応におけるモデルの診断能力を評価する。

  • Claude Opus 4.7が47%でトップ、GPT-5.5が46%、Qwen3.7 Maxが42%。
  • すべてのフロンティアモデルが50%未満であり、ITBench-AAは最も飽和度の低いエージェントベンチマークの一つ。
サイト内本文

NVIDIA、Codex、Claude Code、Qwen Code向けGRPOトレーニングのためのトークン忠実型ロールアウトフレームワーク「Polar」を公開

NVIDIAの研究者は、エージェントハーネスを変更せずに強化学習で言語エージェントを訓練するロールアウトフレームワークPolarを発表した。Polarはハーネスと推論サーバーの間にモデルAPIプロキシを配置し、トークンレベルの相互作用を捕捉してトレーナー対応の軌跡を再構築する。Qwen3.5-4BベースモデルにGRPOを適用した結果、CodexハーネスでSWE-Bench Verified pass@1を22.6ポイント、Claude Codeで4.8ポイント、Piで6.2ポイント改善した。本フレームワークはNeMo Gym環境として登録され、ProRL Agent Serverリポジトリで公開されている。

  • PolarはモデルAPIプロキシを介して既存のエージェントハーネスを変更せずにRLトレーニングを可能にする
  • Qwen3.5-4BにGRPOを適用し、4つのコーディングハーネスでSWE-Bench Verifiedを最大22.6ポイント改善
サイト内本文

AnthropicとOpenAIは製品市場適合を見つけたと思う

この記事は、AnthropicとOpenAIがエンタープライズ顧客をAPIベースの価格設定に移行し、コーディングエージェント製品を活用することで製品市場適合を達成したと主張しています。この転換点は2025年11月のモデル改善から始まり、2026年4月の新モデルリリースと価格変更で加速しました。

  • AnthropicとOpenAIはエンタープライズプランをAPIトークン価格に移行し、Claude CodeやCodexなどのコーディングエージェントが大きな利用と収益を牽引しています。
  • 2026年4月には、より高いAPI価格の新しいフロンティアモデルがリリースされ、エンタープライズ顧客は契約更新によりその価格に固定されました。
サイト内本文
研究

AGIのタイムラインはどのラボが支配的かで変動する

最新の分析によると、トップのAI予測者は現在どのラボが業界をリードしているかに応じてAGI(汎用人工知能)のタイムラインを調整しており、支配的ラボがChatGPTからxAI/Meta/Gemini、そしてAnthropicへと移るにつれて、予測は早期化と後期化を繰り返している。

  • ほとんどの認知労働が自動化される(AGI)時期の予測は、現在支配的なAIラボによって大きく変動する。
  • 2023年から2025年にかけて、多くの研究者はAGIタイムラインを早めたが、2025年から2026年にかけては遅らせ、2026年初頭にはAnthropicの急速な進歩により再び早めている。
サイト内本文

AIは本質的に反社会的なのか?

初期のインターネットがもたらした繋がりの感覚と、現代のAIによる孤立した体験を対比し、AIは便利なツールだが人間の代わりにはならず、真に社会的なアプリケーションが存在するのか疑問を投げかける記事。

  • 初期のウェブは「私たち」の集合的な体験を重視していたが、AIとの対話は個人で完結しがちである。
  • 著者はAIを優れたツールと見なすが、人間そのものや代わりにはならないと述べる。
サイト内本文

AIは宗教を好まない – 特にエホバの証人に対して否定的、研究が示唆

宗教大学のコンソーシアムによる研究によれば、主要なAIモデルは倫理的な質問に対して世俗的な合理主義で回答し、宗教的視点を無視する傾向がある。すべてのモデルがエホバの証人に対して否定的なバイアスを示した。

  • AIモデルは倫理的・個人的な質問に対して宗教的視点をほとんど引用せず、「省略バイアス」を示す。
  • テストされたすべてのAIモデルがエホバの証人に対して一貫して否定的なバイアスを持っていた。
サイト内本文

製品が考えるとき:AI製品シフトを乗り切る

本記事では、AIがデジタル製品デザインにパラダイムシフトをもたらし、コマンド駆動から意図駆動のインタラクションへと移行する様子を探り、製品管理、ユーザーエクスペリエンス、意思決定ロジック、リリースサイクル、リスク、価値創造における新たな課題を分析しています。

  • AIはコンピューティング史上3番目のユーザーインターフェースパラダイムであり、決定論的出力から確率的出力への移行を意味する。
  • 製品チームは発見から提供までの全プロセスを再考する必要があり、データ戦略とモデルパフォーマンスが機能戦略と同等かそれ以上に重要になる。
サイト内本文

ロボットはChatGPTの瞬間に近づいているのか? – ポッドキャスト

先月の北京ハーフマラソンで、ロボット「ライトニング」が人間の世界記録を約7分上回るタイムで完走した。これはチャットボットのようにロボットが日常生活に入り込むのではないかとの疑問を呼ぶ一連のAIマイルストーンの最新例である。中国がこの流れを先導し、政府は今後20年間で1000億ポンド以上をロボット工学に投資することを約束している。

  • ロボット「ライトニング」が北京ハーフマラソンで人間の世界記録を破る。
  • 中国は今後20年間で1000億ポンド以上のロボット投資を約束。
サイト内本文

惑星探査のためのリアルタイム非同期単眼オドメトリの設計

研究者らは、惑星探査ローバー向けに、イベントカメラデータを処理する誤差状態カルマンフィルタを用いたリアルタイム非同期イベントベース単眼オドメトリを提案。高ダイナミックレンジ照明や計算制約下でのロバストな自己運動推定を実現する。

  • イベントカメラはマイクロ秒分解能で非同期のピクセル単位の明るさ変化を報告し、高速センシングとHDR環境に適している。
  • アプローチは誤差状態カルマンフィルタを用いてイベントストリームから連続的にカメラ運動を推定する。
サイト内本文

「もしもの世界」:身体性シナリオにおける汎用世界モデルの因果ベンチマーク

動画生成モデルは運転やロボット操作のシミュレータとして使われるが、既存のベンチマークは単独動画の品質のみを評価し、因果関係の理解をテストできない。そこで提案された「もしもの世界」ベンチマークは、1つの物理変数のみ異なるペアのプロンプトを使用し、モデルが正しく因果に応答するかを検証する。9つの最先端モデルを評価した結果、最高でも52%、オープンソースモデルは約28%のペアスコアであり、性能は物理の難易度ではなく視覚的顕著性に依存する。

  • 「もしもの世界」は、単一変数の変更を含む319のプロンプトペアで動画生成モデルの因果推論をテスト。nuScenesとDROIDの実フレームに基づく。
  • APEO評価基準(遵守性、物理整合性、環境保存、結果の正確性)を採用。9モデル中最高52%、オープンソースは約28%で、因果介入の多くに失敗。
サイト内本文

Melanoscope AIモバイル皮膚鏡臨床意思決定支援システムの臨床検証

Melanoscope AIモバイル皮膚鏡CDSSの前向き単施設臨床検証では、176名の患者において専門医評価との一致率88.6%、悪性病変5例に対する偽陰性ゼロ、特異度88.3%を示しました。研究では、カスケード深層学習モデルの定量的解釈可能性評価法と3ゾーン患者振り分けアルゴリズムを開発し、リソースが限られた環境での皮膚がんスクリーニングに再現可能で解釈可能な意思決定支援を提供します。

  • Melanoscope AIシステムは176名の患者で専門医との一致率88.6%、悪性病変5例に偽陰性なし。
  • 特異度88.3%、3例の悪性黒色腫と2例の基底細胞癌が組織学的に確認。
サイト内本文

動作プリミティブを超えて:ヘッドマウントIMUによる行動認識

本研究は、ヘッドマウント慣性計測ユニット(IMU)を用いた行動レベルの活動認識手法を提案し、従来の動作プリミティブ認識を超えるものです。研究チームは、ARアプリケーションのニーズとセンサの観測可能性を考慮した5つの行動カテゴリを定義し、Ego4Dから16万サンプルのデータセットを構築しました。また、70.3万パラメータの階層モデルHiT-HARを提案し、5クラスの行動認識と8クラスのシナリオ認識で既存モデルを上回る性能を示しました。観測可能性分析により、移動行動は確実に観測可能であり、物体移動やタスク操作は時間的コンテキストを必要とすること、シナリオ依存の信号重複が課題であることが明らかになりました。アーキテクチャの選択では、時間的コンテキストとシナリオ構造を活用することが、単純なモデルサイズの拡大よりも効果的であることが示されました。

  • ヘッドマウントIMUからの行動認識のための階層モデルHiT-HARを提案、動作プリミティブを超越
  • Ego4Dから16万サンプルのデータセットを構築、4段階の品質保証フレームワークを採用
サイト内本文

単純な状態空間モデルが多変量時系列分類で優れた性能を発揮

研究では、構造化状態空間モデルの対角バリアントS4Dが、複雑なMambaアーキテクチャよりも時系列分類タスクで正確かつ効率的であることが示されました。著者らが提案した軽量改良版MS4とMS4Nは、59のデータセットでMambaモデルを凌駕し、パラメータ数が2倍および10倍のディープラーニングモデルに匹敵します。

  • S4DはMambaベースの変種よりも一貫して高い精度と効率を達成。
  • MS4とMS4Nは線形入力投影やチャネル混合などの軽量な変更を導入。
サイト内本文

あなたは自分の状態をコントロールできる:人間の結果が因果的状態介入によって制御可能である理由

本論文は、人間の行動の変動性が観測可能な入力だけでなく、個人の動的な潜在状態に起因することを主張する。意思決定時の状態の重みに介入することで、結果を因果的に制御できると提案する。因果推論、予測処理、アロスタシス、注意ボトルネック、時間生物学、計算精神医学の6つの証拠と、20万人以上のユーザーから得た24ヶ月の観測データに基づく。7つの検証可能な予測と状態認識システムのための6つの運用要件を導出し、デジタルヘルス、教育、AIパーソナライゼーション、個人の主体性への示唆を論じる。

  • 人間の行動変動性は動的な潜在状態に起因し、観測可能な入力だけでは説明できない。
  • 状態は時間依存の重みベクトルとして定義され、決定形成時の状態への介入により結果を因果的に制御できる。
サイト内本文

ステガノグラフィによる継承を用いた合成情報の起源

生物進化における種の起源に着想を得て、合成情報の起源を探求する本論文は、ステガノグラフィを用いて情報の系統を追跡可能にするメカニズムを提案する。AI生成コンテンツの出所特定が困難になる中、真実と信頼を守るための重要な試みである。

  • 合成情報の起源は情報科学における重要な謎であり、真実や信頼に影響を与える。
  • 遺伝学に類似した仕組みで、ステガノグラフィにより親情報の特性を子に隠し込む。
サイト内本文

MicrosoftのMAI-Image-2.5、ベンチマークでGoogleのNano Banana 2に並ぶ

MicrosoftのMAI-Image-2.5は、Arenaのテキストから画像へのリーダーボードで3位となり、GoogleのNano Banana 2と同等だが、OpenAIのImage-2には及ばない。このモデルは前世代と比べて、特に画像内テキストのレンダリングや商用ビジュアルで明らかな向上を示している。

  • MAI-Image-2.5はArenaリーダーボードで3位、GoogleのNano Banana 2と同点
  • テキストレンダリングと商用ビジュアルの改善
サイト内本文
スタートアップ

法王、AIの限界を理解する

バチカンの新回勅『偉大なる人間性』は、人間の不完全性を尊厳の源として擁護し、中核的な人間能力をAIに外部委託することへの警告を発している。シリコンバレーによる人間の限界の軽視に対抗する。

  • レオ14世法王の回勅『偉大なる人間性』は、人間の有限性を美と尊厳の源としている。
  • この文書は、AIによる道徳的判断とテクノロジーエリートへの権力集中を警告している。
サイト内本文
ロボット

Oura Ringのデータをこの無料アプリで深掘りしてみた – その結果

Simple Wearable Reportは、AIを使ってOura Ringのデータからさらなる洞察を引き出す無料ツールです。この記事では、その使い方とGeminiなどのチャットボットとの連携について紹介します。

  • Simple Wearable ReportはOuraデータをラボ形式のレポートに変換し、医師との共有やAIチャットボットへのアップロードが可能。
  • Oura内蔵のAIアドバイザーと比較して、Geminiなどのチャットボットはより具体的で定量的な分析を提供。