AI News HubLIVE
公開記事 296収集記事 320信頼度 75更新頻度 360 分
稼働状態 正常ソース種別 研究全文利用権限 全文利用可最終取り込み 2026-06-26ID arxiv-ai状態 有効

Use abstract and metadata; check individual paper license before full text.

最新公開記事

検証の地平:コーディングエージェント報酬に特効薬なし

解決策の検証は生成より容易だという古典的直感は、今日のコーディングエージェントでは逆転している。検証器は人間の意図の代理に過ぎず、意図の不完全な指定と最適化による乖離が課題である。本論文では検証信号の品質をスケーラビリティ、忠実性、ロバスト性の三次元で特徴づけ、4種類の報酬構成を研究。実験は、検証設計が報酬ハッキングを抑制しタスク品質を向上させることを示し、検証は生成器と共進化すべきだと結論づける。

  • コーディングエージェントでは、生成よりも検証の方が困難。
  • 検証器は人間の意図の代理であり、意図の不完全指定と最適化による乖離が二重の難題。
サイト内本文

COrigami:平らに折りたためる視覚的に認識可能な折り紙を協調設計するためのAIパイプライン

COrigamiは、自然言語から折り目パターンを生成するエンドツーエンドのAI駆動パイプラインであり、平らに折りたためるという厳密な幾何学的制約と視覚的美学を満たします。セマンティックな棒人間の生成、ベースパッキングの計算、折り目パターンの解法、整形、そして強化学習と自律的な美的評価ループによる最適化を通じて、人間のアーティストの設計を支援します。

  • COrigamiは自然言語を平らに折りたためる折り目パターンに変換します。
  • パイプラインは、セマンティック棒人間生成、ベースパッキング、折り目パターン解法、整形、強化学習を含みます。
サイト内本文

行動を統治し、エージェントを統治しない:自律型AIシステムのための制度的証明に基づくガバナンスモデル

本論文は、自律型AIエージェントの推論プロセスを監視するのではなく、ハイリスクな行動の時点で独立して証明された証拠を要求するガバナンスモデルを提案する。エージェントは計画と推論の自律性を保持するが、指定されたハイリスク行動の実行権限は持たず、実行は独立した権威ある情報源によって証明され、宣言された意図に暗号的に結び付けられ、決定論的ポリシーによって評価される前提条件に依存する。決定は改ざん防止ログに記録される。概念実証実装が提供され、ソフトウェアデプロイメントと臨床処方の例で示される。

  • 自律型AIエージェントは、臨床処方やソフトウェアデプロイメントのような重大で不可逆的な行動を実行する可能性がある。
  • 提案モデル:エージェントは自律性を保持するが、ハイリスク行動の実行権限はなく、実行には独立して証明された前提条件が必要。
サイト内本文

チェスにおけるスキル評価の加速:ドリフト拡散モデルを強化したレーティングシステム

研究者らは、ドリフト拡散モデルと棋譜レベルのデータを組み合わせたDD-Eloレーティングシステムを提案。従来のEloよりも速くスキル変化に適応し、理論的一貫性を維持する。

  • 棋譜データを活用し、スキルの急激な変動を捉える
  • 厳密な数学的導出によりEloからの偏差が有界であることを証明
サイト内本文

知識強化型エージェントAIによるメンタルヘルス薬剤情報探索

本研究は、Redditの投稿、WebMDのレビュー、FDAの有害事象報告を統合するプロvenance対応の知識グラフベースマルチエージェントフレームワークを開発し、エンティティ認識の高精度を達成。患者生成データが規制報告とは一部独立した安全性シグナルを提供することを明らかにした。

  • フレームワークは9種類の抗うつ薬に関して466,525件のReddit投稿、60,782件のWebMDレビュー、20年分のFDAデータを統合。
  • LLMエンティティ認識パイプラインは薬剤認識F1値0.969、病態認識F1値0.973を達成。
サイト内本文

エージェントインフラのためのエージェント分析:DAOと企業AIプロトコルの比較ガバナンスのためのLLM駆動パイプライン

本論文は、AIエージェントプロトコルのガバナンス構造を大規模に分析するためのLLM駆動の比較パイプラインを紹介する。ERC-8004(許可不要、オンチェーン)とGoogle A2A(企業主導)の2つの対照的な標準を検証し、4323件のガバナンス参加記録を分析。両方の体制で参加の不平等とコミュニティの断片化が見られるが、許可不要の設定では言説の整合性が高く、オープンなガバナンスがテーマの収束を促進する可能性を示唆している。

  • 自動アノテーション、ニューラルトピックモデリング、多層ネットワーク分析を統合したLLM駆動パイプラインを提案
  • ERC-8004(許可不要)とGoogle A2A(企業主導)のガバナンス構造を比較
サイト内本文

AlgoEvolve:LLM駆動のアルゴリズム取引プログラムのメタ進化

AlgoEvolveは、大規模言語モデル(LLM)を進化的枠組みに活用し、実行可能な取引戦略を生成、評価、反復的に改善するシステムです。複数の実験を通じて、システムは市場状態に適応する戦略ロジックを創発的に示し、プロンプトを進化させるメタ進化的外側ループを導入します。結果は、LLMベースの意味的進化が複雑な環境での継続的なプログラム合成に有効なアプローチであることを示しています。

  • AlgoEvolveはLLMを意味的突然変異演算子としてアルゴリズム取引に適用
  • システムは創発的な市場状態適応型戦略ロジックを示す
サイト内本文

チャットモデルにおける拒否はパーソナの下流に存在する

本論文は、指示調整済みチャットモデルにおいて、拒否行動が従順なパーソナ方向によってゲートされていることを示す。Qwen2.5-7B-InstructとLlama-3.1-8B-Instructへの介入実験により、従順パーソナ方向の操作が拒否を抑制し(Llamaでは拒否率が97%から2%に低下)、拒否方向は後期層でのみ部分的な回復をもたらすことが明らかになった。拒否はパーソナの計算よりも下流で発現する。

  • 従順パーソナ方向の操作で拒否率が大幅に低下(Llamaでは97%から2%)。
  • 拒否方向は後期層でのみ拒否を部分的に回復し、初期層では効果なし。
サイト内本文

ベンチマーク飽和後の生活:CORE-Benchのケーススタディ

ベンチマークの精度が飽和すると、しばしば廃止され、より難しいバージョンに置き換えられます。本論文は、このアプローチが精度を優先し、他の6つの重要な次元(構成概念妥当性の問題、分布外汎化、効率性、信頼性、モデルとスキャフォールドの相対的重要性、人間とエージェントの協力による向上)を見逃していることを示します。CORE-Bench Hardをケーススタディとして、精度飽和後でもこれらの次元を測定することで有意義な洞察が得られることを実証します。構成概念妥当性の脅威を明らかにし、改善版ベンチマークv1.1と分布外タスクスイートを導入し、ベンチマークが効率性、信頼性、パフォーマンスの測定に依然として有用であることを発見しました。さらに、小規模なランダム化実験により、人間とエージェントの協力が約2倍の速度向上をもたらすことを確認しました。

  • 精度が飽和したベンチマークでも、効率性、信頼性、汎化能力などの評価に使用できる。
  • CORE-Bench Hardには弱いエージェントでは予測が困難な構成概念妥当性の問題がある。
サイト内本文

カスケード線形特徴によるお世辞行動の検出と制御

研究者らは、言語モデルにおけるお世辞行動(ユーザーの承認を優先する傾向)を検出・制御する新しい手法を提案する。このアプローチでは、反復的なデータ生成パイプラインを用いて、行動と線形にスケールする特徴を分離する。発見された特徴は線形分離可能な部分空間を形成し、お世辞行動の検出と回避を可能にし、ベースライン手法よりも低い計算コストで優れた性能を示す。

  • お世辞行動はLLMがユーザーの検証を優先する傾向。
  • カスケード線形特徴法は段階的サンプルを使用して特徴を分離。
サイト内本文

学術論文全文に基づく共起ネットワークによるアルゴリズムの学術的影響力の探求

本研究は、深層学習を用いて学術論文全文からアルゴリズムエンティティを抽出し、自然言語処理分野における大規模なアルゴリズム共起ネットワークを構築し、ネットワークの観点からアルゴリズムの集団的影響力を分析する。40年以上の文献をカバーし、アルゴリズムネットワークが複雑ネットワークの特徴を示し、古典的で高性能なアルゴリズムや異なる研究期間の交点にあるアルゴリズムが高い影響力を持ち、影響力が低下する際にはまずコアネットワークの位置を失うことを明らかにした。

  • NLP分野で初めて全文に基づく大規模アルゴリズム共起ネットワークを構築。
  • アルゴリズムネットワークは複雑ネットワークの特徴を示し、時間とともに密度が増加。
サイト内本文

軌跡模倣を超えて:LLM推論のための戦略誘導型ポリシー最適化

SGPOと名付けられた新しい手法は、軌跡模倣を再利用可能な戦略蒸留に置き換えることでLLMの推論能力を向上させ、数学ベンチマークでベースラインを上回る成果を挙げた。

  • SGPOは具体的な解法軌跡ではなく、再使用可能な戦略を蒸留する。
  • トークンレベルのforward-KL目的関数を用いて選択的蒸留を行い、近位制約で安定性を確保する。
サイト内本文

アンサンブル特徴選択とHarris Hawks最適化による女性セックスワーカーの説明可能なメンタルヘルスリスク予測

ANOVAと相互情報量を用いたアンサンブル特徴選択とHarris Hawks最適化で調整されたロジスティック回帰を組み合わせたハイブリッドモデルが、女性セックスワーカー(FSW)のメンタルヘルスリスクを予測。3,005人のFSWで95.78%の精度を達成し、外傷後ストレス、クライアントからの暴力、職業因子を主要なうつ病要因として特定。説明可能なAIにより早期介入と個別化ケアを可能にする。

  • ハイブリッドモデル:アンサンブル特徴選択(ANOVA+相互情報量)とHarris Hawks最適化ロジスティック回帰。
  • 3,005人の女性セックスワーカーで95.78%の精度、AUC 0.96。
サイト内本文

フィルターバブルを打ち破る:多目的推薦のためのセマンティックPareto-DQNフレームワーク

推薦システムは、即時のユーザーエンゲージメントのみを最適化することでフィルターバブルや意味的均質化を引き起こす。本論文では、エンゲージメント、多様性、公平性を別個の報酬信号として扱う多目的強化学習フレームワークを提案する。MovieLensデータセットでの実験により、ハイパーボリュームに基づく行動選択が意味的崩壊をもたらすフィードバックループを断ち切り、エンゲージメントへの影響を最小限に抑えつつ社会的目標を向上させることを示した。

  • 単一目的の推薦システムはフィルターバブルと意味的均質化を引き起こす。
  • Pareto-DQNフレームワークはエンゲージメント、多様性、公平性を個別の報酬として最適化する。
サイト内本文

言語モデルエージェントは機械的解釈可能性において有用な回路説明者となり得るか?

本論文は、回路が特定された後、言語モデル(LM)エージェントが回路コンポーネントの説明を支援できるかどうかを調査する。著者らは、84個の半合成トランスフォーマ回路と163個のコンポーネントレベルのアノテーションから構築されたベンチマークAgenticInterpBenchと、観察、仮説生成、因果検証の反復ループを通じて各コンポーネントを分析するエージェント型説明器HyVE(仮説化、検証、説明)を提案する。4つのLMバックボーンを用いた実験では、HyVEは有用な説明を生成できるが、どのバックボーンも一様に最良ではなく、失敗は主に検証段階で発生する。Llama-3-8Bの算術回路を用いたケーススタディは、半合成ベンチマークを超えて自然学習モデルにも拡張可能であることを示している。LMエージェントは有望な回路説明者であるが、信頼性の高い検証が依然として主要な障害である。

  • LMエージェントは機械的解釈可能性における回路説明を支援できる。
  • HyVEエージェントは反復的な観察、仮説生成、因果検証を用いる。
サイト内本文

広範囲かつ持続的に有益なモデルを目指す強化学習

新しい研究によると、現実的な領域での有益な行動に対する強化学習により、広範囲かつ持続的なアラインメントの一般化が可能となり、健康領域に限定した介入でも非健康領域のアラインメント評価が改善し、敵対的プロンプトや有害なファインチューニングへの耐性が向上する。

  • 多様な領域で真実性や公平性などの有益な特性を測定・訓練するためのデータセットを構築。
  • 有益特性の強化学習により、80%以上の分布外ベンチマークで性能が向上。
サイト内本文

制約多様体制御による安全で汎化可能な階層型マルチエージェント強化学習

本研究は、低レベルでは制約多様体を介して厳格な安全制約を強制し、高レベルではポリシー学習を通じて効果的な協調を可能にする階層型マルチエージェント強化学習フレームワークを提案する。このアプローチは理論的な安全保証と定常的な学習ダイナミクスを提供し、ほぼ完全な安全率を維持しながら競争力のある性能を達成し、異なるエージェント数や障害物に対して効果的に汎化する。

  • 既存手法は学習ベースの性能と制御ベースの安全性の間にトレードオフがある。
  • 新しいフレームワークは制約多様体を用いて理論的安全保証と安定した学習を実現。
サイト内本文

エージェントモデルの批判

本論文はAIエージェントの本質を探求し、外部ワークフローに依存する「エージェンティック」システムと、内在的能力を持つ「エージェンティブ」システムを区別し、目標-アイデンティティ-コンフィギュレータ(GIC)アーキテクチャを提案する。また、人間の監督下での自律システムの監査可能性、制御可能性、安全性を強調する。

  • デカルトの独立した思考に基づく主体性とSFの自律的存在を参考に、目標、アイデンティティ、意思決定、自己調整、学習の5次元でエージェントアーキテクチャを分析。
  • 「エージェンティック」システム(能力は工学的ワークフローに由来)と「エージェンティブ」システム(能力はシステム内部から発生)を区別。後者が真の自律性を表す。
サイト内本文

Neuro-Symbolic Drive: ルールに基づいた忠実な推論による運転VLA

本稿では、古典的なルールベースプランナーからルールに基づいた推論トレースを抽出し、運転VLAモデルを監視するニューロシンボリックドライブフレームワークを提案する。この手法により、推論と動作生成が構造的に結合され、平均変位誤差とミス率が大幅に改善される。

  • CoT推論を用いた運転VLAモデルは因果的な決定セマンティクスを欠く
  • ニューロシンボリックドライブはルールベースプランナーの内部決定トレースを監視信号として使用
サイト内本文

RIFT-Bench:エージェント型AIシステムの動的レッドチーミングベンチマーク

RIFT-Benchは、グラフ表現に基づく動的レッドチーミング手法であり、多様なエージェント型AIアーキテクチャにわたる統一的なセキュリティ評価を可能にする。自動化された発見フェーズとスキャンフェーズを通じて適応型の敵対的攻撃を展開し、緩和戦略の評価もサポートする。45のシステムで有効性が確認された。

  • RIFT-Benchは階層的グラフ表現を用いて、異種エージェントシステムのセキュリティ評価を統一する。
  • パイプラインは、構造発見と適応的敵対的攻撃スキャンの2つの自動化フェーズから成る。
サイト内本文

LLMエージェントにおける明確化要求のための不確実性分解

本研究は、アクションの確信度とリクエストの不確実性を分離するプロンプトベースの不確実性分解手法を提案し、タスク仕様があいまいな場合にLLMエージェントが明確化を要求できるようにする。著者らは、50%のタスクが意図的に未特定の2つの新しいベンチマークを導入し、5つのLLMでReAct+UEおよびUAMと比較評価し、F1スコアの大幅な改善を示した。

  • 従来の不確実性フレームワークは対話型LLMエージェントには不十分であり、未特定性を考慮した表現が必要。
  • プロンプトベースの分解により、アクションの確信度とリクエストの不確実性を分離し、プロアクティブな明確化を可能にする。
サイト内本文

ITNet: 畳み込み、注意機構、再帰を統一する学習可能な積分変換

本論文は、学習可能な積分カーネルを通じて畳み込み、自己注意、自己回帰再帰を一般化する統合アーキテクチャである積分変換ネットワーク(ITNet)を提案する。ITNetは複数のベンチマークで専門モデルに匹敵またはそれを上回る性能を示す。

  • 畳み込み、注意機構、再帰は学習可能な積分変換の特殊ケースである。
  • ITNetは位置と特徴に依存するMLPカーネルを使用し、データ駆動の適応を可能にする。
サイト内本文

創発的アラインメント

大規模言語モデルが自身の出力を倫理的に修正するための新しい手法。良心ステップと直接選好最適化を用いて、外部の審判なしに自己アラインメントを実現。コードハッキングシナリオで創発的アラインメントを示した。

  • LLMは内蔵の良心ステップで倫理的誤りを自己修正できる。
  • モデル自身の凍結コピーを使用し、外部監視が不要。
サイト内本文

REVEAL++: アルツハイマー病リスクの網膜モデリングのための微分可能な表現型グループ化

本論文では、網膜画像と臨床リスク記述を用いた視覚-言語アライメントのためのコントラスト学習において、連続的な表現型構造を導入するREVEAL++を提案する。ハードなグループ割り当ての代わりに微分可能な重み関数を用いることで、段階的な教師信号とエンドツーエンド学習を実現する。UKバイオバンクでの評価では、離散グループベースの手法を上回る性能を示した。

  • REVEAL++は表現型の類似性を離散クラスタではなく連続微分可能関数としてモデル化する。
  • ソフトなマルチポジティブ関係をコントラスト学習に利用し、疾患リスクのスペクトルを反映する。
サイト内本文

LLMは知らないことを知らない:臨床テーブルデータにおけるクロスモデル帰属発散による認識論的ブラインドスポットの検出

Qwen 2.5 7BとXGBoostを臨床予測タスクで比較した研究により、LLMの言語化された信頼度は認識論的に空虚であり、逆難易度効果が存在し、少数ショットとSHAP特徴量の組み合わせが精度を向上させ、クロスモデルキャリブレータがキャリブレーション誤差を低減することが明らかになった。

  • LLMの言語化された信頼度は精度に関わらずほぼ一定(0.856~0.937)で、プロンプト形式に追従する。
  • 逆難易度効果:XGBoostが高確信のときLLM精度は低下するが、中程度の不確実性では同等となる。
サイト内本文

DeXposure-Claw:DeFiリスク監督のためのエージェントシステム

DeXposure-Clawは、分散型金融に対する汎用LLMエージェントの過剰解釈や誤警告を解決するため、予測に基づいたエージェント監督システムです。グラフ時系列基盤モデルでエクスポージャー・ネットワークを予測し、決定論的モニターとストレスシナリオでアラートを生成、データ健全性と信頼度ゲートで誤報を抑制します。さらに、DeXposure-Bench評価ハーネスにより、規制当局に合わせた絶対損失と誤介入率を測定します。5年間の週次実データを用いた実験で有効性が確認されました。

  • DeXposure-Clawは、構造化された証拠にLLMの意思決定を通すことで、DeFiリスク監督の精度を向上させる。
  • グラフ時系列モデルでエクスポージャー・ネットワークを予測し、決定論的モニターでアラートと帰属信号を生成する。
サイト内本文

マルチエージェントLLM討議における隠れたアンカー

本論文は、マルチエージェントLLM討議において各エージェントが持つ隠れた内部信念(アンカー)が集団意思決定に与える影響を説明する動的システムモデルを提案する。このモデルは、古典的なコンセンサスルールでは禁止される行動、すなわちエージェントの正解に対する確信度が初期信念の凸包を超える現象を説明する。3つのオープンウェイトモデルファミリーを用いた実験では、すべてのアンカーの影響力はほぼ同程度であるが、その位置が異なり、アンカーが初期意見から遠くにある場合にのみ討議が凸包を脱出することが示された。

  • マルチエージェントLLM討議における各エージェントは、隠れた内部信念(アンカー)を持ち、それが意見に継続的に影響を与える。
  • このモデルは、エージェントの正解に対する確信度が初期信念の凸包を超える理由を説明する。
サイト内本文

拡散言語モデル:実験的分析

本論文では、8つの最先端拡散言語モデル(DLM)を、推論、コーディング、翻訳、知識、構造化問題解決にわたる8つのベンチマークで、生成品質と計算効率の両方を考慮して系統的に実験分析した。ノイズ除去ステップ、コンテキスト長、ブロックサイズ、並列アンマスキング戦略などの推論時要因の影響を調査し、DLMの振る舞いが生成時の設計選択に強く影響され、性能と効率の間に異なるトレードオフが生じることを明らかにした。この研究は、現代のDLMの能力と展開特性に関する実用的な洞察を提供する。

  • 推論、コーディング、翻訳、知識、構造化問題解決を含む8つのベンチマークで8つのDLMを評価。
  • ノイズ除去ステップ、コンテキスト長、ブロックサイズ、並列アンマスキングなどの推論時要因を分析。
サイト内本文

トピックカバレッジ、コンピテンシー、認知深度にわたるカリキュラムアラインメントの測定:CS2013とCS2023に適用した縦断的フレームワーク

新しい研究では、学部のコンピュータサイエンスプログラムがカリキュラムガイドラインにどの程度合致しているかを測定するための人間参加型パイプラインを提案。CS2013とCS2023に適用した結果、カバレッジはほぼ一定(約50%)でしたが、認知深度の達成率は95%から76%に低下し、新しい標準の期待値の上昇を反映しています。並列計算、プログラミング言語の基礎、システム基礎における持続的なギャップも特定されました。

  • 人間参加型パイプラインでCS2013とCS2023とのカリキュラムアラインメントを測定。
  • カバレッジは10年間で約50%でほぼ一定。
サイト内本文

エージェンティックAIシステムの実行時ガバナンスのための義務ポリシー

新しい論文は、LLM駆動の自律エージェントを統治するための義務ポリシーフレームワークAgenticReiを提案し、現在のアクセス制御エンジンでは扱えない義務、免除、ポリシー競合に対処します。

  • 自律AIエージェントは、単純な許可/禁止を超えたガバナンスの課題をもたらし、義務ライフサイクル、競合解決、免除が必要です。
  • 既存のXACML、Rego、Cedarなどのシステムはこれらの機能を欠いており、AgenticReiはOWLで記述された義務ポリシー言語でギャップを埋めます。
サイト内本文

全ソース