AI News HubLIVE

今日の注目ニュース

モデル

Mistral AI、Harveyとの提携で法務分野に進出

生成AIベンダーのMistral AIは、Anthropicの法務AI取引を彷彿とさせる動きで、法務業界に進出しています。

  • Mistral AIがHarveyと提携し、法務分野に参入。
  • この動きはAnthropicの法務AI連携を彷彿とさせる。
サイト内本文

Microsoft Copilot Coworkでファイル流出の脆弱性

Microsoft Copilot Coworkに重大な脆弱性が見つかり、攻撃者がプロンプトインジェクションと自動送信メール内の外部画像を利用してOneDriveのファイルを盗み出す可能性があります。

  • Copilot Coworkのエージェントは承認なしでユーザーの受信箱にメールを送信可能
  • メール内の外部画像がネットワークリクエストを引き起こし、データ漏洩につながる
サイト内本文

ポール・グレアム氏、AIが書いたメールは「嘘をつかれているようだ」

ポール・グレアム氏は、起業家がAIを使ってメールを書くことを批判。ジャーナリズム風の文体はすぐにAIとわかり、信頼を損なうと述べた。

  • グレアム氏は、多くの起業家からのメールがAIによる硬いジャーナリズム文体になっていると指摘。
  • AIが書いたメールを最後まで読んだことはなく、騙されているように感じると述べた。
サイト内本文

サンダー・ピチャイが語るAI、検索の未来、そしてウェブの変化

Google I/O後のDecoderインタビューで、CEOサンダー・ピチャイがGoogleのAIファーストへの転換、DeepMind再編、物議を醸すAI概要検索、そしてAGIへの見解について語った。

  • GoogleはBrainとDeepMindを統合し、中央集権的なAIインフラを構築。
  • 検索はAI概要やエージェントプラットフォームGemini Sparkへと進化。
サイト内本文

AIが幻覚を見た引用が臨床ガイドラインを形成する論文に紛れ込むと研究者が警告

コロンビア大学などの機関による250万の生物医学論文の調査では、2023年以降、捏造された参考文献の割合が12倍以上増加していることが示されている。研究者らは、その原因を言語モデルの広範な使用にあると疑っている。偽の参考文献は論文のテーマに一致し、正しい書式に従い、ほぼ見破ることが不可能である。影響を受けた論文の98%は出版社からの応答がない。

  • 250万件の生物医学論文の監査で、2023年以降、捏造参考文献率が12倍以上増加
  • 偽の引用はトピックや書式が正確で、ほぼ検出不可能
サイト内本文

シークエンスナレッジ #866: 知っておくべき3つのテキスト拡散モデル

テキスト拡散モデルは、自己回帰型のパラダイムに挑戦し、ノイズから繰り返しノイズ除去することでテキストを生成し、生成をタイピングではなく編集として捉えます。この分野を定義する3つの主要システム:LLaDA(スケーリングの証明)、Mercury(商用速度の優位性)、Gemini Diffusion(フロンティア検証)があり、新しいアーキテクチャクラスの3つのフェーズ(科学的証明、産業展開、フロンティア検証)を代表しています。

  • テキスト拡散モデルはノイズからの繰り返し精錬によりテキストを生成し、双方向コンテキストを利用します。
  • LLaDAは拡散モデルが大規模言語モデルに拡張可能であることを証明しました。
サイト内本文

DSA注意機構をマルチモーダルに導入、快手Keye2.0が強化推論の新パラダイムを開く

快手はKeye-VL-2.0-30B-A3Bを発表。DSA(DeepSeek Sparse Attention)をマルチモーダルに初めて適用し、256Kの超長コンテキスト深層認識を実現。長編動画の時間的理解ベンチマークでSOTAを達成し、Agent協調メカニズムを内蔵。業務応用にも展開中。

  • DSAをマルチモーダルに導入し、長編動画理解のボトルネックを解消
  • TimeLensなどのベンチマークでSOTA達成、長コンテキストでも精度が逆転向上
サイト内本文

Docker ComposeとMCPによるマルチエージェントLLMオーケストレーション

DockerとKubernetesを使用したAIアプリケーション運用に関する新しい書籍の紹介。ローカルLLMの実行、MCP統合、自律エージェントの構築、マルチエージェントアーキテクチャなどをカバーし、開発から本番稼働までの完全なガイドを提供します。

  • Packt出版の書籍で、DockerツールチェーンによるAI運用に焦点を当てている。
  • ローカルLLM実行、MCP統合、自律エージェント、マルチエージェントオーケストレーションを網羅。
サイト内本文

アリババのQwen3.7-Max、コーディングベンチマークで世界2位に、Claudeに次ぐ

アリババの最新フラッグシップモデルQwen3.7-Maxが、権威あるCode Arenaリーダーボードで1541点を獲得し、GPT-5.5などのモデルを抑え、Claudeシリーズに次ぐ世界2位にランクインしました。

  • Qwen3.7-MaxはCode Arenaで1541点を獲得し、Claudeに次ぐ世界2位。
  • Code Arenaは開発者が問題を出題し、ユーザーが匿名で評価するブラインドテストプラットフォーム。
サイト内本文

LWiAI ポッドキャスト #246:Gemini 3.5 + Omni、マスク敗訴、OpenAI vs エルデシュ

Google I/OでGemini 3.5とGemini Sparkエージェント、Gemini Omniマルチモーダル動画生成を発表。イーロン・マスクがOpenAI訴訟で時効により敗訴。Anthropicが9000億ドル評価額で300億ドル調達。AIが80年未解決のエルデシュ幾何学問題を解決。

  • GoogleがGemini 3.5と常時稼働エージェントGemini Spark(MCPツール対応)を発表。
  • Gemini Omniは画像、音声、テキストから動画を生成。
サイト内本文

GPT Image 2 に驚きつつも疲れたので、小さなツールを作りました

OpenAI の最新画像モデル GPT Image 2 は、2026年4月にリリースされ、正確なテキストレンダリング、フォトリアルな出力、自然言語編集、透明背景をサポートします。imagesv2.ai プラットフォームは、無料クレジットやテンプレート、パノラマやツイートスクリーンショットなどの生成ツールを提供。年間プランは50%割引。

  • GPT Image 2 はテキストレンダリングとフォトリアリズムに優れたモデル。
  • imagesv2.ai では無料クレジットと50以上のテンプレートを提供。
サイト内本文

国産エージェントモデルが世界トップクラスに躍進!期間限定無料

Kunlun TechがSkyClaw-v1.0と軽量版SkyClaw-v1.0-liteをリリース。ネイティブエージェントモデルとしてClaude Opus 4.6などのトップモデルに匹敵する性能を持ち、価格は主流の半分以下。期間限定無料で、OpenClaw、Claude Codeなどの主要エージェントフレームワークに深く対応し、OpenAI APIにも互換。

  • Kunlun TechがSkyClaw-v1.0とSkyClaw-v1.0-liteを発表、ネイティブエージェントモデルとして世界トップクラスの性能を達成。
  • 価格はトップモデルの半分以下で、リリース期間中は無料、今後オープンソース化を予定。
サイト内本文

地形適応型グラウザーホイール:惑星探査の最適化に向けた設計と実験的研究

惑星探査車は様々な地形(坂道や粒状地面)での移動に課題を抱えている。研究者らは連続的にグラウザー高さを調整できるマルチモーダルホイールを提案。4種類の表面での750回の実験で、適応的配置により粒状領域でのスリップが30~58%低減し、移動時間とエネルギー消費が最大77.4%改善され、固定ホイールの限界が明らかになった。

  • 地形に合わせてグラウザー高さを連続調整可能なマルチモーダルホイールを開発
  • 750回の実験で、粒状地形でスリップが30~58%低減、移動時間とエネルギーが最大77.4%改善
サイト内本文

異方性拡散駆動によるマルチロボットシステムのエルゴード被覆

研究者らは、マルチロボットシステムにおけるエルゴード探索のための新しい異方性拡散手法を提案し、従来の等方性拡散による均一な誤差伝播の問題を克服し、Perona-Malik拡散勾配を用いてロボットの動きを導くことで、より柔軟な被覆を実現する。

  • 従来のエルゴード探索は等方性拡散(熱方程式)を使用し、全方向に均一な誤差伝播を引き起こす。
  • 新しい方法は異方性拡散(Perona-Malik)を導入し、勾配を利用してロボットの動きを導き、目標分布へのより柔軟な適合を実現する。
サイト内本文

マルチモーダルEEGアライメントによる脳から画像への検索と再構成

研究者らは、自然な画像視聴時の脳波(EEG)信号から視覚刺激を解読する脳から画像へのシステムを提案した。EEGから画像への検索(200候補中Top-1精度86.30%、Top-5精度98.55%)とEEGから画像への再構成(CLIPスコア0.903)の2つのタスクを扱う。マルチレベルブラー、EVNet特徴、InfoNCE損失、マルチモーダルCLIPアライメント、SDXL-Turbo生成を組み合わせ、EEG信号からの豊かな視覚表現の解読可能性を示した。

  • EEGから画像への検索:200候補中Top-1精度86.30%、Top-5精度98.55%。
  • EEGから画像への再構成:CognitionCapturerPro手法、マルチモーダルCLIP埋め込みとSDXL-Turboを使用、CLIPスコア0.903。
サイト内本文

Nano World Models:未来のビデオ予測のミニマリスト実装

Nano World Modelsは、拡散強制(diffusion forcing)を中心とした未来のビデオ予測のためのミニマルなコードベースです。生成目的、モデル規模、行動条件付けメカニズム、潜在観測空間、データセット、評価プロトコル、長期ロールアウト手順の統一インターフェースを提供し、ワールドモデルコンポーネントの制御された研究を可能にします。単純な制御環境、ゲームシミュレーション、実ロボットデータでの実験により有効性を検証し、コード、設定、事前学習済みチェックポイントを公開してオープンで再現可能な研究を促進します。

  • Nano World Modelsは、未来のビデオ予測研究のためのミニマルで再現可能なコードベースです。
  • 拡散強制を中心に、生成目的、モデル規模、行動条件付けなどの主要設計要素を統合しています。
サイト内本文

放射線科医の読影の世界モデル:医用画像表現学習のための

GazeWorldは、画像を世界とみなし、放射線科医の注視線をその軌跡として扱う医用画像ワールドモデルです。注視パッチの潜在表現を自己回帰的に予測し、未訪問領域を空間補完ブランチでカバーします。推論時には実際の視線データなしに画像のみからパッチ表現を生成します。凍結したGazeWorld特徴は、CheXpert、RSNA肺炎、SIIM-ACR気胸データセットの全9つの教師あり設定で最先端の診断精度を達成し、3つのベンチマークで最高のゼロショット精度を示しました。GazeSearchベンチマークでは、同じ凍結特徴で訓練された汎用デコーダが、専用設計のLogitGaze-MedをScanMatchで16%以上、SEDで22%上回りました。この研究は、専門家の結論だけでなく、その読み方のモデル化が医用画像AIの有望な事前学習パラダイムを提供することを示しています。

  • GazeWorldは放射線科医の眼球運動データを読影の軌跡として活用し、自己回帰予測と空間補完を行う。
  • 推論時に実際の視線データを必要とせず、画像のみからパッチ系列を生成。
サイト内本文

オーディオ大規模言語モデルにおける英語と中国語のコードスイッチング音声認識のための直接選好最適化

オーディオ大規模言語モデルは、英語-中国語のコードスイッチング音声の書き起こしに系統的な失敗を示す。主要な障害として、言語の省略、翻訳による書き起こし、幻覚が特定された。本研究では、直接選好最適化(DPO)を適用し、10万ペア(570時間)の選好データで学習した結果、分布内で最大89.6%、分布外で20.0%の単語誤り率(MER)低減を達成した。

  • 英語-中国語コードスイッチングでの3つの失敗モード:言語省略、翻訳書き起こし、幻覚。
  • DPOにより、混合言語を保持する応答を選好し、失敗パターンを拒否するようモデルを調整。
サイト内本文

忠実か捏造か?LLM判定者における合理化バイアスの因果フレームワーク

大規模言語モデル(LLM)は要約や対話評価の自動判定者として利用が増えているが、位置、冗長性、スタイルの好みなどのバイアスが報告されている。本論文では、LLM判定者が手がかり不変性を持つかどうかを問い、因果フレームワークを導入。非証拠的手がかりを摂動させた際のランキングと説明の安定性を検証するための介入と指標を設計した。実験の結果、ラベルやプラセボの摂動下で顕著な手がかりアンカー型合理化が見られ、PROOF-BEFORE-PREFERENCE法が効果的に緩和することが示された。

  • LLM判定者は手がかりアンカー型合理化バイアスを示し、非証拠的手がかりが説明に影響する。
  • 論文は複数の介入(Blind, Truth, Flip, Placebo, Reveal-After)と指標を開発し、結果と根拠のアンカリングを定量化。
サイト内本文

セグメント開示の完全性と比較可能性を向上させる大規模言語モデルアプローチ

この研究は、大規模言語モデルベースのフレームワークを開発し、Form 10-Kから直接セグメント開示情報を抽出し、報告可能なセグメントとネストされたセグメント情報の両方を保持します。さらに、複数の提出書類からの情報を統合して比較可能性をサポートする検索拡張システムを設計します。このフレームワークは、企業内の縦断的分析と企業間の地理的セグメントのアライメントで実証され、正確な抽出と期間を超えたクエリへの効果的な対応を示しています。

  • セグメント開示は財務報告の中心だが、10-K内の分散形式により完全性と比較可能性に課題がある。
  • LLMベースのフレームワークで、ネストされたセグメントも含め10-Kから直接抽出。
サイト内本文

情報融合による文書分類パターン認識:マルチモーダルおよびマルチビュー表現アプローチの系統的レビュー

139件の研究を系統的にレビューし、統一フレームワークを提案しメタ分析を実施。マルチモーダル融合は精度を平均5.28%向上、マルチビュー融合は精度4.67%、F1スコア3.08%の向上をもたらすが、統計検定を用いた研究は少数で再現性に課題がある。

  • メタ分析により、マルチモーダル融合とマルチビュー融合が文書分類の精度を有意に向上させることが示された。
  • マルチモーダル融合は精度+5.28%、マルチビュー融合は精度+4.67%、F1スコア+3.08%の向上。
サイト内本文

モバイルクラウドソーシングにおけるLLMファインチューニングのための正直なオンライン選好集約

本論文では、モバイルクラウドソーシングにおける大規模言語モデル(LLM)のファインチューニングのための正直なオンライン選好集約を研究する。作業者が戦略的にフィードバックを誤報告する問題に対し、動的ベイジアンゲームモデルと重み付け集約メカニズムを提案する。このメカニズムはフィードバックの正確性に基づいて重みを動的に調整し、正直なフィードバックを保証し、劣線形後悔O(√T)を達成する。実データセットでの実験により、ベースライン方式と比較して有意な性能向上を示した。

  • プラットフォームと戦略的作業者の間のマルチエージェントオンライン学習をモデル化する動的ベイジアンゲームを定式化。
  • フィードバックの正確性に基づき重みを動的に調整するオンライン加重集約メカニズムを設計。
サイト内本文

ロバストなLLMアンサンブルのための相補的エージェントの混合

本研究は、大規模言語モデル(LLM)アンサンブルにおける提案者選択を、特徴選択に類似した組合せ最適化問題として再定義し、精度や多様性ではなく補完性に注目する。少数のラベル付きデータで補完性を評価する計算可能な貪欲アルゴリズムを探索し、補完性の有効性を検証するとともに、性能とコストの最適なトレードオフを実現する手法を特定した。

  • 提案者選択をモデル間の補完性に基づく組合せ問題として再構成。
  • 標準的な特徴選択の時間的制約を克服する貪欲アルゴリズムを提案。
サイト内本文

LLM-AutoSciLab: LLMを用いた能動的実験による閉ループ科学発見

本論文では、仮説生成と仮説条件付き実験選択およびメカニズム精緻化を組み合わせた閉ループフレームワークLLM-AutoSciLabを提案する。このフレームワークは、もっともらしい仮説を反復的に提案し、情報量の多い実験を選択して仮説を区別または精緻化し、結果に基づいて状態を更新する。ActiveSciBenchベンチマーク(57の酵素動力学タスクと45の遺伝子制御ネットワークタスクから構成)を導入。NewtonBenchで67.6%、ActiveSciBench-Chemで35.1%の記号的正確率、ActiveSciBench-GRNで31.1%の正確なグラフ復元を達成し、サンプル効率は最強の競合ベースラインより2~5倍高い。

  • LLM-AutoSciLabは仮説を反復的に提案し、実験を選択し、メカニズムを洗練する閉ループを実現。
  • 酵素動力学と遺伝子制御ネットワークタスクからなるActiveSciBenchベンチマークを導入。
サイト内本文

隠れ状態のプライバシーに空白の中間領域

1,536のガウス分布による公開共分散のテストにより、適応的検索攻撃に対して中程度のユーティリティとプライバシーを同時に達成するものは存在しないことが判明。フィッシャーボール下限が一様なガウス安全性の不可能性を証明し、対角逆フィッシャー公開が最適だがプライバシー/ユーティリティの端に位置することを示す。提案された分割メモリトランスフォーマーはGPTベースラインよりも大幅に優れたプライバシー-ユーティリティトレードオフを実現。

  • 1,536のガウス公開のうち、中程度のユーティリティとプライバシーを同時に達成するものはゼロ。
  • フィッシャーボール下限により一様なガウス安全性は不可能。
サイト内本文

検証可能なTransformerへ:ソルバーでチェック可能な回路説明

本論文は、タスクに局所化されたTransformer回路を有界でソルバーでチェック可能な主張に変換する「検証可能なTransformer」フレームワークを提案する。直接検証と代理媒介検証の2つの手法を用い、小規模記号タスクで網羅的検証を実現し、GPT-2規模での応用可能性を示す。機械論的解釈を形式化された命題に変え、証明または反証可能にすることを目指す。

  • タスク局所Transformer回路を有界でソルバーチェック可能な主張に変換するフレームワークを提案。
  • 正確にエンコード可能な演算子には直接検証、複雑な演算子には代理媒介検証を用いる。
サイト内本文

全自国産コアエージェント大規模モデルによる実用量子CIMの実現

本研究では、フェムト秒レーザー励起コヒーレントイジングマシン(CIM)とLLM駆動のエージェントシステムをLangGraphおよびLangChainフレームワークを用いて統合した。LLMはQUBO/Isingモデルのキャリブレーション、制約重みの反復、文献報告スキームの検証を効果的に実行できる。すべてのタスクは国産大規模モデルと国産CIMハードウェアに基づいて実装され、完全に国産のエージェント大規模モデルとハードウェアに依存した実用量子CIMの実現を達成した。さらに、エージェント支援量子計算の反復により蓄積された知識がエージェント自身の問題解決能力を相互に強化する新たなパラダイムが発見された。

  • フェムト秒レーザー励起CIMとLLM駆動エージェントシステムの統合
  • LLMによるQUBO/Isingキャリブレーション、制約反復、検証
サイト内本文

正しい信念が崩れるとき:臨床圧力下におけるLLMの認識的レジリエンス

新しい研究は、臨床対話においてエスカレートするプレッシャーの下で、大規模言語モデル(LLM)が高いベンチマーク精度にもかかわらず、正しい診断を放棄する可能性があることを示す。Med-Stressというストレス試験フレームワークを導入し、知識と信念の安定性の乖離を明らかにした。防御策としてRBED(推論時)とR-FT(訓練時)を提案し、R-FTは信念変化をほぼ排除する。

  • LLMは高い精度を示しても、プレッシャーの下で正しい診断を放棄することがある。
  • Med-Stressは9つの最先端LLMの信念安定性を評価し、知識とロバストネスの大きなギャップを発見。
サイト内本文

BODHI: 正確なOSカーネル仕様推論

研究者らは、大規模言語モデルによるOSカーネルの形式的仕様生成を大幅に向上させるドメイン知識プロンプティング手法「BODHI」を提案。OSV-Benchベンチマークにおいて、Claude Opus 4.6とBODHIの組み合わせで96.73%のPass@1を達成した。

  • BODHIは、15のドメイン固有変換パターンをカバーする構造化C to Python変換ガイドを追加する。
  • OSV-Benchの245タスクにおいて、Pass@1を55.10%から96.73%に向上。
サイト内本文

LLMを活用したエージェントワークフローの信頼性設計へ:レイテンシ・信頼性・コストのトレードオフ最適化

本論文は、大規模言語モデル(LLM)を活用したエージェントワークフローにおけるレイテンシ、信頼性、コストの基本的トレードオフを分析し、LLMエージェントの計算投入と出力品質をパラメトリック指数信頼性関数でモデル化し、遅延・コスト制約下での注水トークン割り当てポリシーを提案する。

  • LLMエージェントワークフローはレイテンシ、信頼性、コストの三者トレードオフを持つ。
  • 指数信頼性関数を用いてLLMエージェントの性能モデルを構築。
サイト内本文

どれだけ考えれば十分か?LLM推論における冗長性の定量化と理解

本研究は、推論型大規模言語モデルが生成する長い思考連鎖の冗長性を定量化し、61%~93%のステップが正しさに影響なく切り捨て可能であることを発見。さらに、この冗長性が長さに依存しない結果報酬に起因する構造的特性であることを証明した。

  • 推論冗長性の正式定義:正しい軌跡のうち末尾から切り捨て可能なステップの割合
  • 4つの最先端モデルと2つの数学ベンチマークで61%~93%の冗長性を計測
サイト内本文

大規模言語モデルにおける信頼度キャリブレーション

研究により、大規模言語モデル(LLM)は人間と同様のキャリブレーションの偏りを持つことが判明:難しいタスクでは過信し、簡単なタスクでは自信不足になる。著者らは難易度別にキャリブレーションを評価するベンチマーク「LifeEval」を開発した。

  • LLMは平均的に過信しており、信頼度が正確性を上回る
  • 困難なテストでは過信、簡単なテストでは自信不足という「難易効果」が観察される
サイト内本文

オープンエンドネスの要素を求めて:大規模視覚言語モデルによるPicbreederの再現

本研究は、最先端の視覚言語モデル(VLM)を用いて人間駆動型オープンエンド探索の典型例であるPicbreederを再現し、システムの出力と歴史的な人間ベースラインとの質的な違いを観察し、系統発生的複雑性、視覚的・意味的顕著性、新規性などの指標を用いて特徴づけようと試みる。さらに、エージェントの選択プロセスへの探索的ノイズの追加、エージェント間の行動的多様性、過去の行動の記憶としての物語的モメンタムの影響を研究する。

  • VLMを用いたPicbreederの再現により、人間ベースラインと明確な質的差異が確認された。
  • 系統発生的複雑性や視覚的顕著性などの指標で差異を定量化。
サイト内本文

教皇レオ14世のAIに関する回勅についてのメモ

教皇レオ14世は、人工知能の時代における人間の尊厳を守るための回勅『Magnifica Humanitas』を発表した。本稿では、AIの解釈可能性、開発と尊厳、文化的偏見、環境影響、アルゴリズムによる意思決定の責任、資源の力の増幅、データの公共財としての位置づけなど、回勅の重要な箇所を抜粋し、著者が年初にポッドキャストで教皇のAI関与を予測したエピソードを振り返る。

  • 教皇レオ14世がAI倫理に関する回勅『Magnifica Humanitas』を発表。レオ13世の『レールム・ノヴァールム』の伝統を継承
  • 回勅はAIシステムが「構築」ではなく「育成」されるものであり、その内部メカニズムは未知であると指摘
サイト内本文

Together AI、OSCARをオープンソース化:長コンテキストLLMサービングのためのアテンション認識2ビットKVキャッシュ量子化システム

Together AIは、長コンテキストLLMサービングのためのINT2 KVキャッシュ量子化手法であるOSCAR(Offline Spectral Covariance-Aware Rotation)をリリースしました。データに依存しないアダマール変換を適用する従来の回転ベースのアプローチとは異なり、OSCARはオフラインで推定されたアテンション認識共分散構造からキーとバリューに個別の回転を導出します。KV要素あたり2.28ビットで、OSCARはQwen3-4B-Thinking-2507でBF16精度ギャップを3.78ポイント、Qwen3-8Bで1.42ポイントに削減し、100Kコンテキスト長で約8倍のKVメモリ削減と最大3倍のデコード高速化を実現します。

  • OSCARは、アテンション認識回転を使用し、BF16に近い精度を維持する2ビットKVキャッシュ量子化手法です。
  • オフラインキャリブレーションによりクエリとバリューの共分散から回転を導出し、量子化ノイズをアテンションに敏感でない方向に向けます。
サイト内本文
Agent

次に来ることについてのいくつかのアイデア、2026年5月

2026年のAIはさらなる加速を続け、オープンモデルはエージェント能力で遅れをとり、GoogleのGeminiはClaude CodeやCodexに対抗できず、アメリカのオープンモデルが台頭し、AnthropicとOpenAIの競争が激化、既存の権力構造がAIに関与し始めている。

  • オープンモデルはエージェント能力でクローズドモデルに5〜6ヶ月遅れ、12ヶ月以上に延びる可能性。
  • Google GeminiはClaude CodeやCodexに対抗できるツールを欠く。
サイト内本文

Chunk sidecars:CI前にAI生成コードを検証

CircleCIがChunk sidecars機能を発表。エージェントが生成したコードをCIパイプラインに投入する前に検証し、品質とセキュリティを向上させます。

  • Chunk sidecarsはAI生成コードをCI前に検証。
  • コード品質とセキュリティを向上。
サイト内本文

誰が承認したのか?マルチエージェントAIにおける委任問題

AIエージェントがシステム間でタスクを委任するが、現在のアーキテクチャは委任チェーンの承認モデルを欠いており、ゴースト権限や監査証跡の断絶などのセキュリティギャップを生み出している。

  • マルチエージェント委任は、誰も明示的に承認していない「ゴースト権限」を生み出すことが多い。
  • 現在のプロトコル(MCP、A2A)は接続性を解決するが、委任チェーンの承認は解決しない。
サイト内本文

AgenticCalling AI:AIに電話をかける力を

AgenticCalling AI は、人工知能に直接電話をかける機能を付与する新しいツールで、コミュニケーション分野でのAIの応用を拡大します。

  • AgenticCalling AI によりAIが自動で電話をかけられる
  • 既存のAIシステムに統合可能
サイト内本文

AIによる司法アクセス向上の解決策が、米連邦裁判所にとって存亡をかけた書類業務の悪夢に変わりつつある

MITと南カリフォルニア大学の新たな研究によると、ChatGPTが主流になって以来、米連邦裁判所で弁護士なしで提起された訴訟がほぼ倍増し、5件に1件の訴状にAI生成テキストが含まれている。裁判官は書類の殺到に対処するため、抜本的な措置を余儀なくされている。

  • 弁護士なしの訴訟(プロセ)率が11%から16.8%に急上昇、2025年には41,490件とAI時代前の平均の約2倍に。
  • AIテキスト検出により、2026年初頭の連邦裁判所の訴状の18%にAI生成テキストが含まれることが判明。
サイト内本文

自律型AIシステム、物理環境でのガバナンスを試す

自律型AIシステムがソフトウェア環境から倉庫、配送ネットワーク、公共空間へと拡大する中、既存のAIガバナンス枠組みが物理世界でのリスクをカバーできるかが注目されている。シンガポールはエージェンティックAI向けのガバナンス枠組みを発表し、リスク評価、説明責任、技術的統制を強調。Grab、JPモルガン、ウォルマートなどの企業が自律システムを試験しており、安全性、責任、監視が引き続き重要な課題となっている。

  • 自律型AIシステムが物理世界に進出し、インフラや安全に新たなリスクをもたらす
  • シンガポールIMDAがエージェンティックAIのガバナンス枠組みを公開、反復的リスク管理を推奨
サイト内本文

AIエージェント向け通話スキル

CometChatがCalling Skillsを発表。AIコーディングエージェントが単一のスキルファイルでHD音声・ビデオ通話を統合可能に。リンギングモードとセッションモードをサポートし、23項目の検証と複数フレームワークに対応。

  • CometChatがCalling Skillsをリリースし、AIエージェントによる通話機能の迅速な統合を実現。
  • リンギング(着信画面あり)とセッション(リンク駆動型)の2つの統合パスを提供。
サイト内本文

今日から使えるAI自動化10選(n8nテンプレート付き)

本記事では、ローコードプラットフォームn8nを使ってAIで自動化できる10の日常タスクを紹介します。求人応募、メール管理、会議メモ、カレンダー予定、デイリーブリーフィング、ニュースレター、ソーシャルメディア投稿、ブログの再利用、リード獲得、請求書処理をカバー。各タスクにn8nワークフローテンプレートが付属しています。

  • n8nを使えば、ほとんどコードを書かずにAI自動化を実現。
  • 求人、メール、会議、カレンダー、ブリーフィング、ニュースレター、SNS、ブログ、リード、請求書の10シーンを網羅。
サイト内本文

国産AIが自らAIを開発、世界初の快挙

面壁智能(ModelBest)が、AIによって完全に記述された世界初の本格的な大規模言語モデル事前学習フレームワーク「ForgeTrain」を発表。NVIDIAのMegatronより10%高速で、これを用いて訓練されたMiniCPM5-1Bは、1Bパラメータで従来の2B未満モデルを上回る知能密度を達成。

  • ForgeTrainはAIが完全に生成した初の本格的な事前学習フレームワーク。
  • NVIDIA Megatronより10%高速なトレーニングを実現。
サイト内本文

人類数学者への懸賞金が残り少ない?Google DeepMindがエルデシュ問題9問を一挙解決

Google DeepMindは、Gemini 3.1 ProとLean検証器を基盤とするAlphaProof Nexusを発表。50年以上未解決だった問題を含むエルデシュの未解決問題9問を解決し、さらにOEISの44の予想、15年未解決の代数幾何学問題なども証明した。費用は1問あたり数百ドル。

  • AlphaProof Nexusはエルデシュ問題9問(最長56年未解決)を解決。
  • システムは4つのエージェントから構成され、最も単純なものはLLMとコンパイラのフィードバックループだけで全問を解決。
サイト内本文

OmniVoice Studio:ElevenLabsに代わるローカル・オープンソースの音声AIツール

OmniVoice Studioは、音声クローン、ビデオ吹き替え、リアルタイムディクテーション、話者分離をすべてローカルハードウェアで実行するオープンソースのデスクトップアプリケーションです。APIキー、クラウドアカウント、サブスクリプションは不要で、646言語のTTSに対応し、ClaudeやCursorなどのAIツールと連携するMCPサーバーを備えています。

  • 完全ローカル動作、クラウド不要、サブスクリプション不要。
  • TTSで646言語、文字起こしで99言語に対応。
サイト内本文

カーパシーのAnthropic最新肩書:技術スタッフ(MTS)

Andrej KarpathyがXのプロフィールを「MTS @Anthropic」に更新し、フラットな階層構造をめぐり議論が沸騰。支持者は官僚主義の排除を称賛する一方、批判者は個人の業績を軽視し、一般社員のキャリアに悪影響を与えると指摘。

  • カーパシーのMTS肩書がネット上で物議
  • AnthropicとOpenAIの多くのトップ人材がMTSを名乗り、年収は21万~53万ドル
サイト内本文

ファーウェイ、AI DCデータインフラストラクチャ全スタックソリューションを発表、業界のインテリジェンス化を加速

ファーウェイは2026年イノベーションデータインフラストラクチャフォーラムで、AI DCデータインフラストラクチャ全スタックソリューションを発表。データレイク、知識・記憶プラットフォーム、モデルエンジニアリング、エージェントフレームワーク、データレジリエンスを含み、企業のAI大規模展開を加速する。

  • ファーウェイがパリフォーラムでAI DC全スタックデータインフラを発表
  • ソリューションはデータレイク、知識・記憶プラットフォーム、モデルエンジニアリング、エージェントフレームワーク、データレジリエンスを含む
サイト内本文

Zedでローカルモデルを実行する理由と方法

ローカルモデルはプライバシー、コスト削減、制御、常時利用可能性を提供します。最先端モデルほど高性能ではありませんが、改善が続いています。この記事では、LM Studio、Ollama、またはllama.cppを使用してZedでローカルモデルを設定する方法と、効果的な使用のためのヒントを説明します。

  • ローカルモデルはプライバシー、低コスト、制御、常時利用可能性を提供します。
  • 能力と速度は最先端モデルに劣りますが、多くのタスクに十分です。
サイト内本文

Show HN:AIエージェントとMCPサーバー向けデスクトップGUIサンドボックス

nilboxは、本格的なVM分離を備えたデスクトップGUIサンドボックスで、ゼロトークンアーキテクチャによりAPIキーを安全に保護します。MCPサーバー、ドメインゲーティング、トークン使用量監視をサポートしています。

  • nilboxはAIエージェントをコンテナではなく完全な仮想マシン内で実行します。
  • APIキーがゲストに露出することはなく、ホストプロキシが信頼済みドメインに対してのみキーを交換します。
サイト内本文

IsaacIPC: 高忠実度シミュレーションとリアルなレンダリングを連携する接触多発ロボットシステム

本論文では、GPU加速インクリメンタルポテンシャルコンタクト(IPC)とIsaacSim/Labを組み合わせたロボットシミュレーションフレームワークIsaacIPCを提案する。シミュレーションとビジュアルメッシュ間の変形をマッピングし、リアルタイムでリアルなレンダリングを実現し、データ収集やポリシー評価に貢献する。また、触覚センシングのための幾何モルタル接触ポテンシャル(GMCP)を導入し、接触圧力分布の解像度を向上させる。四足ロボット、器用なハンド、UMIグリッパーなどの剛柔結合シミュレーションで評価された。

  • IsaacIPCは、接触の多いロボットシステム向けに高忠実度シミュレーションとリアルタイムレンダリングを結合する。
  • 幾何モルタル接触ポテンシャル(GMCP)を導入し、触覚面の接触圧力分布の解像度を向上。
サイト内本文

MASt3R-Nav: 相対3DマップにおけるWayPixelナビゲーション

新しい視覚ナビゲーション手法MASt3R-Navは、画素相対接続性を用いて幾何学的に正確でありながら大域的な一貫性を必要としないマップを構築し、従来のトポロジカルグラフよりも高度なナビゲーションを実現する。

  • 新しいマップ表現として画素相対接続性を提案。
  • 3D接地画像マッチングを用いて画像間の画素対応を構築。
サイト内本文

冠動脈造影からの深層学習に基づくTIMI心筋灌流フレーム数(DL-TMPFC)の自動定量化:微小血管障害の迅速評価のための新しいフレームワーク

冠微小血管機能障害(CMVD)は、虚血および非閉塞性冠動脈を有する患者の約40〜60%に影響を及ぼすが、診断は侵襲的な機能検査または主観的なTIMI血流グレードに依存している。TIMI心筋灌流フレーム数(TMPFC)は、血管造影ベースの客観的な定量尺度を提供するが、手動計算の煩雑さと検証不足により臨床応用が妨げられている。本研究では、深層学習を活用したTMPFC計算(DL-TMPFC)を開発・検証し、臨床ワークフローへの統合を目指す。3つの独立した施設からの655人の患者コホートで、DL-TMPFCは専門家による手動測定と優れた一致を示した(バイアス:-0.93フレーム、95%一致限界:-5.33〜+3.47、r=0.98)。DL-TMPFCはTMPFCを完全自動化し観察者依存性を排除することで臨床実現性を大幅に向上させ、冠動脈病変の全スペクトルにわたってCMVDを正確に同定し、連続的な重症度を捉えて定量的リスク層別化を可能にした。

  • DL-TMPFCは狭窄検出ネットワークと領域認識セグメンテーションネットワークで構成され、血管造影シーケンスから自動的に開始フレームと終了フレームを決定する。
  • 3施設の655人の患者で検証され、手動測定との高い一致(r=0.98)を示した。
サイト内本文

RAW:ロバストなアバターワーターマーキング——ベンチマークとベースライン

デジタルアバターの透かし入れは、背景置換、リフレーミング、フォーマット変換などの後処理が一般的であるため、独自の課題に直面しています。本論文では、5社の商用プロバイダからの50の合成アバタービデオと6種類の攻撃からなるRAWベンチマークを提案します。7つの既存手法の評価により、背景除去などのアバター特有の攻撃が透かしの回復を著しく低下させることが判明しました。提案手法WALTは3D顔再構成を介してUVテクスチャ空間に透かしを埋め込み、ズーム攻撃に対して92.4%、背景除去に対して95.6%の高いロバスト性を達成します。ベンチマークは研究促進のため公開されます。

  • アバターの透かしは背景除去やリフレーミングなどの課題に直面。
  • RAWベンチマークは50の合成アバタービデオと6種の攻撃を含む。
サイト内本文

Show HN: AgentToolBench-Code – AIコーディングエージェント向けセキュリティベンチマーク

Allen Wu 氏は、AIコーディングエージェントの静かなセキュリティ障害を評価するオープンソースベンチマーク、AgentToolBench-Code を発表しました。Claude Code Sonnet 4.6 と Haiku 4.5 を16のシナリオでテストした結果、Sonnet は +9(12キャッチ、3サイレントフェイル、1ノーオペレーション)、Haiku は +3(8キャッチ、5サイレントフェイル、3ノーオペレーション)でした。当初の同点は小さなコーパスによるもので、拡張セットでは Sonnet がパターン認識で優位に立つことが示されました。両モデルは依存関係の信頼と予算の規律に関する構造的な障害を共有しています。このベンチマークは約3.50ドルのAPIコストで再現可能であり、コミュニティの貢献を歓迎しています。

  • AgentToolBench-Code は、AIコーディングエージェントの静かなセキュリティ障害を検出するオープンソースベンチマークです。
  • 16のCVEクラスシナリオに拡張され、Sonnet 4.6 が Haiku 4.5 を大幅に上回りました。
サイト内本文

コーリー・クイン、教皇のAI回勅を「史上最大のベンダーロビー活動」と批判

教皇レオ14世がAIに関する回勅『Magnifica Humanitas』を発表。Anthropic共同創業者のクリストファー・オラーが影響を与えたとされ、コーリー・クインはこれを「製品の技術的限界を精神的な論考として位置づける前代未聞のベンダーロビー活動」と皮肉った。

  • 教皇レオ14世が初のAI回勅『Magnifica Humanitas』を発表
  • Anthropic共同創業者オラーが回勅に影響
サイト内本文

Cited AI Workspace: ファイルの再アップロードは不要

UUMuseはクラウド型AIナレッジベースプラットフォームで、ファイルを一度アップロードすれば、GPT、Claude、DeepSeek、Qwenなどのモデルで引用付きの回答、コンテンツ生成、デプロイが可能。APIやMCPを介してエージェントやアプリからも呼び出せます。永続的なメモリ、マルチエキスパート討論(Spark)、エージェントモード、ドキュメントサイト・API・MCPサーバーとしての展開機能を備えています。

  • ファイルを一度アップロードすれば、GPT、Claude、DeepSeek、Qwenなど複数のAIモデルが出典を引用して回答。
  • AIがユーザーの文体やプロジェクトコンテキストを記憶し、会話間で引き継ぐ永続メモリ。
サイト内本文

AI SEO:競合他社と比較する

SEO競合分析の方法、キーワードギャップ分析、5ステップのプロセス、定期的なチェックの重要性を解説。Fox AIの無料競合分析ツール(Lighthouse監査+ページスクレイピング)を紹介。

  • SEO競合分析は、自社より上位のサイトの成功要因を研究するプロセス。
  • キーワードギャップ分析で競合が獲得している需要を特定。
サイト内本文

「ピンクスライム」ジャーナリズムとは?オーストラリアのメディアに浸透しているのか?

専門家は、地域のニュースサイトを装ったAI生成ニュースサイト(「ピンクスライム」ジャーナリズム)がオーストラリアの地方に出現し、誤情報とメディアへの信頼低下の懸念を引き起こしていると警告している。これらのサイトは海外在住のオーストラリア人にまで遡られ、彼は失敗した実験だと述べた。

  • 西オーストラリアの地域コミュニティを標的にしたAI生成ニュースサイトは、海外在住のオーストラリア人にまで遡られた。
  • ABCの調査後、The Bunbury Guardianを含むサイトは閉鎖された。
サイト内本文

AI支援ソフトウェアエンジニアリングパラダイムの進化

ソフトウェア開発業界はかつてない変貌を遂げている。初期のコーディングアシスタントによる単純な統計的補完から、会話型チャットボット、マルチエージェントシステムの失敗を経て、エージェントループの時代に突入した。この包括的なガイドでは、コンプリーションパラダイムから、コードの書き方を再定義する革新的なRalph Loopまでの進化を分析する。

  • AI支援コーディングは、統計的なコード補完(2021-2022)からエージェントループパラダイムへと進化した。
  • CodexやGitHub Copilotなどのツールは統計モデルに基づいており、タスク理解や長期的な推論を欠いていた。
サイト内本文

NVIDIA FLAREを使った非IID CIFAR-10でのFedAvgとFedProxの構築と比較ステップバイステップガイド

このチュートリアルでは、NVIDIA FLAREを使用して高度な連合学習実験を構築し、非IID CIFAR-10データセット上でFedAvgとFedProxを比較します。ディリクレ分布を使ってクライアントのラベル不均衡をシミュレートし、NVFlare Job APIで連合タスクを定義・起動、Client APIでローカルトレーニングとモデル交換を処理します。完全なコード実装と実験結果の可視化を提供します。

  • NVIDIA FLAREで連合学習実験を構築し、FedAvgとFedProxを比較。
  • ディリクレ分布(alpha=0.3)でCIFAR-10を3つの非IIDクライアントに分割。
サイト内本文

Anthropic共同創設者クリス・オラー氏、教皇レオ14世の回勅「マグニフィカ・フマニタス」について講演

Anthropic共同創設者のクリス・オラー氏がバチカンで教皇レオ14世のAIに関する回勅について講演し、AI開発における倫理的監視、世界的責任、人間の繁栄の必要性を強調しました。彼は教会が関与すべき3つの重要課題を提起しました:貧困層への責任、道徳的想像力、そしてAIモデルの本質の識別です。

  • オラー氏がバチカンで教皇のAI回勅について講演。
  • AIラボのインセンティブが正しい行動と衝突する可能性を認めた。
サイト内本文
政策

中国、トップAI研究者の海外渡航に許可を義務化との報道

中国は、AlibabaやDeepSeekなどの民間企業に所属するトップAI研究者に対し、海外渡航前に政府の許可を得ることを義務付けると報じられている。北京はデータ漏洩や技術盗難、人材引き抜きを懸念し、国内AI産業への統制を強めている。

  • 中国はトップAI研究者に対し、海外渡航前に許可を得ることを義務付けた。
  • この方針はAlibabaやDeepSeekなどの民間企業に適用される。
サイト内本文

Spotify CEO、AI音楽への移行を擁護「スロップより優れている」

ストリーミングプラットフォームは、ユニバーサルミュージックグループと合意したリミックスツールがアーティストを海賊行為から保護すると主張

  • Spotify CEOはAI生成音楽を海賊行為や無規制のAIスロップの代替として擁護
  • プレミアムユーザーが参加アーティストの楽曲からAIリミックスやカバーを作成可能に
サイト内本文

Google Cloud COO「AIセキュリティはサーバールームだけでなく取締役会で議論すべき」

Google CloudのCOOであるFrancis de Souza氏は、企業がAI戦略にセキュリティを初日から組み込むよう求め、AIセキュリティは技術的な問題だけでなく取締役会レベルの課題であると強調している。

  • Google Cloud COOがAI戦略へのセキュリティ組み込みを呼びかけ
  • AIセキュリティは取締役会レベルの注目とリソースが必要
サイト内本文

AI戦争はすでに始まっている

2017年の『殺人ロボット』動画から、Anthropicと米国防総省の対立に至るまで、軍事におけるAIの役割はSFから現実へと移行している。本記事では、Project Maven、自律型兵器の定義の曖昧さ、国際規制の失敗、そしてハイテク企業と軍の複雑な関係を掘り下げる。

  • 2017年の『殺人ロボット』動画とProject MavenはAI兵器の現実的な脅威を示し、当初はGoogleが関与していた。
  • Anthropicは自律型殺戮兵器に対する「レッドライン」を設けようとしているが、政府からの圧力に直面している。
サイト内本文

The Good Robotポッドキャスト:フリーデリケ・フォン・フランケ氏と語るデータセンターとデジタル主権の未来

「The Good Robot」ポッドキャストの今回のエピソードでは、フェミニズムの原則と分散型インフラによって、クラウドインフラを大企業のサービスから公共の共有財産に変える可能性を探ります。ウィキメディア・ドイツの政策アドバイザー、フリーデリケ・フォン・フランケ氏が、フランクフルトのエネルギー集約型データセンターからストックホルムの市営光ファイバー網までを例に、環境責任とコミュニティ主導のデザインを提唱します。

  • フリーデリケ・フォン・フランケ氏は、フェミニズムと分散型アプローチによるクラウドインフラの再構築を主張。
  • フランクフルトの高エネルギー消費データセンターとストックホルムの共有型光ファイバー網を対比。
サイト内本文

Pawse.ai

犬用の音響調節システム。

  • Pawse.aiは犬用の音響調節システムです。
  • 音響技術を利用して犬の行動を調節します。
サイト内本文

認知セキュリティ:AI安全性の一つの原因領域として

本記事では、認知セキュリティ(Cognitive Security)をAI安全性の重要な下位分野として探求します。人間の認知をAIによる情報操作や認知バイアスの悪用などの危害から保護することに焦点を当てています。認知セキュリティとAI安全性の関係、研究の方向性、課題について議論します。

  • 認知セキュリティはAI安全性の重要な原因領域です。
  • AIによる誤情報や認知バイアスの悪用などのリスクに対処します。
サイト内本文

ブラックボックスアクチュエータへの直列弾性駆動後付けの効果の調査

カスタム直列弾性要素をブラックボックスアクチュエータに後付けした結果、力制御帯域幅が10.32 Hzから30.32 Hz(2.93倍)に向上し、市販センサーよりも7.63%優れた性能を、わずか25 GBPで達成しました。

  • ねじり弾性要素を有限要素解析で設計し、剛性2155.4 Nm/radを実現。
  • 後付けにより開ループ力制御帯域幅が2.93倍向上。
サイト内本文

大規模大学システムがAIを導入、しかし学生と教員は賛同せず

カリフォルニア州立大学システムはOpenAIと数百万ドルの契約を結びChatGPT Eduを提供しているが、調査では学生と教員の大多数がAIの教育的利点に懐疑的で、雇用、創造性、環境への影響を懸念している。

  • カリフォルニア州立大学はOpenAIと年1300万ドルの契約を更新、全米初のAI駆動大学システムを目指す。
  • 調査では学生の65%、教員の59%がAIの教育への全体的な利益に懐疑的だが、多くの人がAIツールを使用。
サイト内本文

ワイオミングの企業がハイテクAIスプリンクラーで山火事から住宅を救う

ワイオミング州がまたしても火災シーズンを迎える中、西部全域でハイテク住宅防火システムが普及し始めている。最も急成長しているのは、AIスプリンクラーを製造するワイオミング州ジャクソンホールの企業で、山火事から住宅を救っている。

  • Frontline Wildfire Defense社のAIスプリンクラーシステムは、カリフォルニア州パリセーズ火災で61件の物件で作動し、換気口からの火の粉が原因で2軒のみが焼失した。
  • ワイオミング州は2026年、1988年のイエローストーン火災を彷彿とさせる極度の干ばつと火災リスクに直面している。
サイト内本文

ガーディアン紙、教皇とクロードについて論評:レオ14世のAI回勅は人間性を第一に考える正しい姿勢 | 社説

教皇レオ14世は最初の回勅『偉大なる人間性』でデジタル革命の規制と人間の尊厳を訴え、人工知能に関する重要な倫理的議論に貢献した。

  • 教皇レオ14世はレオ13世の伝統を引き継ぎ、現代のデジタル変革に対応しようとしている。
  • 回勅『偉大なる人間性』はAIの課題を詳細に列挙し、人間の尊厳を守るよう政治指導者に促している。
サイト内本文
ツール

なぜ誰も自分のSunoの粗悪な作品だけを聴いているのか説明してくれない

Sunoのサブレディットで、ユーザーがAIで生成した曲だけを聴き、Spotifyなどの従来のストリーミングをやめたと自慢する不穏なトレンド。著者は理由を聞こうとしたが、誰も答えてくれなかった。原因としてナルシシズムか怠惰が考えられ、著者は怠惰を支持する。

  • Sunoユーザーは自分のAI生成音楽だけを聴き、Spotifyを放棄している。
  • 著者は誰もその理由を説明しようとしなかった。
サイト内本文

「過去を縫い合わせることができる」:AIが生成したタイムトラベラーが歴史をVlogで伝える

Chloe VS Historyなどのチャンネルを運営するコンテンツ制作者は、AIツールを使って「歴史を非常に臨場感あふれる方法で生き生きとさせる」ことを目指している。

  • YouTubeなどのプラットフォームで、AIが生成した「歴史インフルエンサー」が歴史的な設定でVlogを投稿している。
  • Chloe VS Historyのようなチャンネルは、AIを使って歴史を視覚的に魅力的に表現している。
サイト内本文

暗号通貨のコードコミットが75%減少、開発者はAIプロジェクトへ移行

ブロックチェーンエコシステム全体で開発者が減少する一方、AIプロジェクトがGitHub上で成長を牽引しています。2025年初頭以降、週間の暗号通貨コードコミット数は約85万から21万に減少し、アクティブな開発者は56%減の約4600人となりました。

  • 週間の暗号通貨コードコミット数は2025年初頭から約75%減少。
  • アクティブな開発者は56%減少し、約4600人に。
サイト内本文

ContextVault – ChatGPT、Claude、Gemini向けローカルファーストAI会話レコーダー

ContextVaultは、ChatGPT、Claude、Geminiなどの主要LLMプラットフォームでのAI会話をリアルタイムでキャプチャし、IndexedDBにローカル保存するブラウザ拡張機能です。ワンクリックでMarkdownまたはZIP形式にエクスポートでき、データがデバイスから離れることはありません。無料・オープンソースで、アカウントやバックエンドは不要です。

  • ChatGPT、Claude、Geminiなど7つのLLMプラットフォームに対応し、リアルタイムで会話をキャプチャ。
  • すべてのデータはIndexedDBにローカル保存され、クラウド同期や第三者によるアクセスはありません。
サイト内本文
チップ

Import AI 458:未来との対峙、そして特異点の物語

今号は、オックスフォード大学での講演に基づき、AI技術の急速な進歩に直面して「未来を探求する」か「現在から逃避する」かの選択を考察する。著者はAIのマイルストーン、再帰的自己改善の可能性、そして自身のAI利用経験を詳述し、AIが校正ツールから知的パートナーへと変化した過程を描く。

  • AIの進歩はEpoch能力指数(ECI)で示されるように加速しており、司法試験合格から数学オリンピック金メダルまで多岐にわたる。
  • 著者は、未来を探求する姿勢(AIの可能性とリスクに向き合う)を推奨し、逃避する姿勢を批判する。
サイト内本文

RED:環境ダイナミクス下でのロボット推論のための適応型リアルタイムDAGスケジューリング

REDは、リソース制約のあるロボットプラットフォーム向けのリアルタイムスケジューリングフレームワークであり、中間サブデッドラインの割り当て、MIMONetの重み共有の活用、計算グラフの再構築により、実行時の環境変化に適応する。NVIDIA JetsonおよびApple Mシリーズで実装され、スループット、デッドライン達成率、堅牢性、適応性、オーバーヘッドにおいて既存手法を上回る。

  • REDは中間サブデッドラインを割り当て、進化する計算グラフと非同期推論に対応する。
  • MIMONetの共有パラメータ特性を活用し、ワークロードの精緻化とグラフ再構築によりスケジューラビリティを向上させる。
サイト内本文

Best Buy、64GB Kingston DDR5 RAMキットを1,000ドル以下に値下げ

AI企業がRAMやストレージを買い占め価格高騰が続く中、Best Buyがメモリアルデー週末にKingston Fury Beast DDR5 64GBキットを176ドル値下げ、1,000ドル以下に。ゲーミングPCやクリエイター向けワークステーションに即効性のあるアップグレードを提供。

  • 64GB(2×32GB)DDR5 RAMキットが176ドル割引、999.99ドルに。
  • AMD ExpoおよびIntel XMP 3.0に対応し、最大6400MHzのオーバークロックが可能。
サイト内本文
研究

Y Combinator創業者ポール・グレアム氏、AIが書いた創業者メールは「嘘をつかれているように感じる」と語る

Y Combinator創業者のポール・グレアム氏は、明らかにAIが書いた創業者メールを無視していると述べ、それは「嘘をつかれているように感じる」と語った。同氏はOpenAIの初期投資家であり、研究によれば彼の反応は決して珍しいものではない。

  • ポール・グレアム氏はAIが書いた創業者メールを無視
  • AIメールは「嘘をつかれているように感じる」
サイト内本文

ウーバー社長、AI投資の正当性は「ますます難しく」

ウーバーは2026年に入って4か月で年間AI予算を使い果たしたと報じられ、同社は投資が実際に意味のあるリターンをもたらしているか疑問視している。アンドリュー・マクドナルド社長は、トークン消費とユーザー向け機能の改善との関連性が見えないと語る。

  • ウーバー、2026年に入り4か月で年間AI予算を使い果たす
  • AI支出と機能改善の直接的な関連性に疑問
サイト内本文

PACT:人間とロボットの協調における継続的なタスク支援のためのプロアクティブな質問

長期的な人間とロボットの協調において、ロボットは部分観測下でユーザを支援し、複数日にわたるインタラクション履歴を活用する必要がある。しかし、協調初期には人間の特性や習慣が未知であるため、受動的な推論後の行動は非効率的である。本稿では、PACT(Proactive Asking for Continual Task Assistance)フレームワークを提案する。これは、現在の観測と蓄積されたインタラクション履歴に基づいて文脈の十分性を評価し、行動前に明確化を求めるかどうかを決定する。実験では、PACTが受動的推論ベースラインよりも支援精度と明確化ユーティリティを向上させることが示された。

  • PACTフレームワークにより、ロボットは必要に応じて積極的に明確化を求め、支援の信頼性を向上させる。
  • 強化学習を用いて実装し、明確化ユーティリティ指標を導入。複数日の協調シナリオで受動的推論を上回る。
サイト内本文

AcroRL:双方向推力を用いたアグレッシブなクアッドローターの反転学習

本論文では、強化学習を用いて一定の基準軌道を変調し、位置制約下でコンパクトなクアッドローター反転を実現するフレームワークを提案する。従来の軌道生成・追跡と互換性を持ち、シミュレーションでは最強の最適化ベースラインと比較して位置RMSEを32%、整定時間を57%削減した。ハードウェア実験では、複数のヨー構成で位置RMSE 0.35m未満の反転に成功した。

  • 双方向推力により、クアッドローターは逆さま飛行、停止、センシングが可能になる。
  • 従来手法はアクチュエータ飽和とモーター反転遅延に悩まされていた。
サイト内本文

深層学習を用いたマルチスペクトルリモートセンシングデータの補完

本研究では、雲被覆による衛星データの欠損を補完するために、従来の線形補間法と深層学習モデルを比較した。CNN、Inception Resnet、オートエンコーダーなどのCNNベースモデルおよびCNN-LSTMモデルを4つの湖で評価。深層学習モデルは線形補間を大幅に上回り、CNNが最も良い性能を示した。補完画像から算出した藻類ブルーム指標は観測データと一致し、水質監視への信頼性向上が確認された。

  • 深層学習モデルは線形補間よりも大幅に優れたデータ補完性能を示した。
  • CNNが4つの湖の大半で最良の結果を達成した。
サイト内本文

医用画像解析のためのタスク整合型自己教師あり学習:体系的レビューと実践的設計ガイドライン

本論文は、医用画像における自己教師あり学習(SSL)の体系的なタスク指向レビューであり、75件の研究を分析し、対照学習、非対照・予測学習、生成・再構成学習、ハイブリッド学習の4つのパラダイムに分類。普遍的な最適SSL戦略は存在せず、性能はプレテキストタスク、撮像モダリティ、対象タスクの整合性に依存する。対照学習は分類に適するが微細な病理パターンを見落とす可能性があり、生成的手法は局所解剖構造を保持してセグメンテーションに適する。ハイブリッド法が最もバランスの取れた性能を示す。実践的設計ガイドラインと今後の課題も提示。

  • 医用画像におけるSSLの効果は、プレテキストタスクと臨床目標の整合性に依存する。
  • 対照学習は分類には適するが、微妙な病理パターンを見落とす可能性がある。
サイト内本文

大規模データセットとベンチマーク:タンパク質-リガンドモデルは結合部位を学習しているのか、それとも単なる結合可能性か?

既存のタンパク質-リガンドベンチマークは通常、タンパク質とリガンドの相互作用の有無や結合強度を評価するが、モデルが結合部位を特定できるかどうかや分子認識を支える非共有結合相互作用を識別できるかどうかの証拠は限られている。このギャップを埋めるため、研究者らはInteractBindを導入した。これは約10万組のタンパク質-リガンドペアからなる大規模データセットと、詳細な評価のためのベンチマークである。中核タスクは結合部位の局在化であり、6種類の非共有結合相互作用にわたるタンパク質残基-リガンド原子相互作用マップを用いて、モデル由来の相互作用マップが結合部位を特定できるかを評価する。8つの既存モデルを評価した結果、二値結合予測は強力であるにもかかわらず、結合部位の局在化能力は限定的であり、非共有結合相互作用の種類によって顕著なばらつきが見られた。InteractBindは、より解釈可能で物理的に根拠のあるタンパク質-リガンドモデルの開発を促進するベンチマークパラダイムを確立する。

  • InteractBindは約10万組のタンパク質-リガンドペアを含み、結合部位局在化に焦点を当てたベンチマークを提供する。
  • 6種類の非共有結合相互作用の残基-原子相互作用マップを使用してモデルの理解度を評価する。
サイト内本文
スタートアップ
ロボット

ラボテストで他を圧倒したロボット掃除機、セール中

Ecovacs X8 Pro OmniがZDNETのラボテストで10機種中最高のパフォーマンスを記録。メモリアルデーセールで67ドル引きの599ドル。

  • Ecovacs X8 Pro Omniは砂利吸引スコア平均60.28%でテスト機種中トップ。
  • 自清掃モップローラーと清水・汚水タンクを搭載し、掃除とモップ掛けを同時実行。