AI時代における「深く人間らしく」あることを教皇レオが呼びかけ
教皇レオ14世は最初の回勅『マニフィカ・フマニタス』でAIのリスクと無制限な技術力に警告し、人間の尊厳を中心とした法的・倫理的枠組みの必要性を強調した。
- 教皇レオ14世が回勅『マニフィカ・フマニタス』を発表、AI時代の人間保護を訴える。
- バベルの塔症候群を警告し、利益崇拝や画一化が人間の尊厳を脅かすと指摘。
デイリー
2026-05-25 の注目ニュース 90 件をトピック別に整理しています。
教皇レオ14世は最初の回勅『マニフィカ・フマニタス』でAIのリスクと無制限な技術力に警告し、人間の尊厳を中心とした法的・倫理的枠組みの必要性を強調した。
Pitch Agent は Pitch の新 AI 機能で、チームのテンプレート、デザイン言語、画像スタイルから学習し、ブランドに合わせたプレゼンテーションを数秒で生成。チャットによる対話で微調整も可能です。Pitch ワークスペース内で完結します。
MCPの月間SDKダウンロード数が9700万を超え、AIエージェントが本番ワークフローに移行する中、認証はチームが直面する最も重要なインフラストラクチャ上の意思決定となっています。本ガイドでは、WorkOS、Stytch、Auth0 by Okta、Composio、Nango、Arcade、TrueFoundry、Cloudflareの8つの主要プラットフォームを、仕様準拠、エンタープライズIDの深さ、統合の広さ、2026年の展開における実際の適合性に基づいてランク付けしています。
ServiceNowは米国のエンタープライズソフトウェア企業で、本社はカリフォルニア州サンタクララ、世界で29,000人以上の従業員を抱え、2025年第4四半期のサブスクリプション収益は35.7億ドルです。同社はAIと自動化に多額の投資を行い、Passage AIの買収、NVIDIAとの提携拡大、10億ドルのベンチャーキャピタル基金、カナダでの1.1億カナダドルの投資などを実施。記事では、ITSM/CSMワークフローに生成AIを埋め込み、解決記録の時間を約80%削減するNow Assistと、機械学習により顧客エスカレーションを予測し、プロアクティブエンゲージメント率を11%から68%に向上させる事例を紹介しています。
AgentSliceは、Cursor、Claude Code、Codex、WindsurfなどのAIコーディングエージェントが編集前に確認、計画、承認を得るようにする、無料のオープンソースワークフローキットです。Markdownファイルを使用してフェーズとゲートを定義し、コンテキストドリフト、行き当たりばったりの編集、許可なしの変更を防止します。
ある開発者が、AIがコードを書く時代に真の才能とAI生成コードを区別するためのデバッグチャレンジを作成しました。AIエージェントの使用を推奨しますが、AIだけでは解けないように設計されています。24時間限定で公開され、正直なフィードバックを求めています。
ハードウェアは人間に適応させるべきではなく、人間に積極的に適応すべきだ
ReplylessAIがSequences機能をリリース。AIメールアプリから直接アウトバウンドメールシーケンスを送信可能。高価なセールスツール不要。Gmail、Outlookなどと接続し、AIがメール整理や下書き作成を自動化。月額9ドルから。
HTML Deployerは、ChatGPT、Claude、GeminiからAI生成HTMLを抽出し、プレビュー、ZIPダウンロード、またはNetlify、GitHub、FTP、セルフホストサーバーへの直接公開を可能にするChrome拡張機能です。開発者、創業者、マーケター、代理店、初心者向け。
あるエンジニアが、AIを役割ベースで段階的にファイルを入力することで、未知のレガシーNode.jsマイクロサービスの断続的なフィールド欠落バグを迅速に理解・修正した経験を共有。AIを検索エンジンではなく構造化された思考パートナーとして扱うことが鍵。原因特定まで約90分、修正は11行。
アラバマ州ハンツビルの高校がトヨタと提携し、産業メンテナンスなどの技能職を訓練。AIによるホワイトカラー職の自動化が進む中、時給40ドル超の需要が高い仕事を提供する。
Google は I/O 2026 で、単なるアップデートではなく、AI 支援コーディングからマルチエージェントオーケストレーションへのプラットフォーム転換を発表しました。Antigravity 2.0 は、スタンドアロンデスクトップアプリ、CLI、SDK、マネージドエージェントを備え、デフォルトモデルは Gemini 3.5 Flash で 4 倍高速化されています。
CoreWeaveは、GPU集約型ワークロードにおける汎用クラウドのボトルネックを克服するために、AI専用に構築されたクラウドプラットフォームを発表。インフラストラクチャ、データ、オーケストレーション、専門家のサポートを統合し、OpenAIやIBMなどのパイオニア向けにトレーニング、推論、反復を含むAIライフサイクル全体をサポートし、より高速な反復、最大のパフォーマンス、変革的なパートナーシップを提供します。
WorkOSは、AIエージェント向けの構造化された登録方法を提供するオープンプロトコル「auth.md」を発表した。このプロトコルは、サービスのドメインに配置されたMarkdownファイルを通じて、登録フロー、スコープ、資格情報の発行方法を定義する。エージェント確認フロー(ID-JAGベース、人間の操作不要)とユーザークレームフロー(OTPベース、プロバイダー不要)の2つをサポートし、既存のOAuth標準を活用する。
Cordium は Kubernetes と Octelium を基盤としたオープンソースのサンドボックスプラットフォームで、開発者やAIエージェントに隔離された再現可能な汎用サンドボックス環境を提供します。最大の特徴は、サンドボックス内に認証情報を注入することなくインフラにアクセスできる点で、Octelium のID認識プロキシを介してシークレットレスにアクセスします。Webターミナル、SSH、CLI、gRPC API など複数のアクセス方法をサポートし、属性ベースのアクセス制御と OpenTelemetry による監査機能を内蔵しています。
MashuPackは、コードリポジトリの特定部分を選択し、1つのクリーンなテキストファイルにコンパイルすることで、ChatGPTやClaudeなどのブラウザベースAIツールにおけるファイル数制限やアップロードの煩雑さを解消し、コードコンテキストをポータブルで意図的に制御可能にする開発者ツールです。
Curloはプライバシー重視のmacOSアプリで、大規模なサウンドライブラリの検索、プレビュー、整理を可能にします。聞きたい音を自然言語で説明してSFXや音楽を見つけられるほか、メタデータ検索、類似オーディオ検索、AI自動タグ付け、UCSカテゴリ対応など、すべてローカルで動作します。
本記事では、AIコーディングツールが機能開発の時間コストを大幅に削減する一方で、スコープクリープのリスクをもたらすことを論じる。著者は自身の製品grithを例に、各機能が数時間で完了するようになった今、自律と範囲制限の重要性を強調する。
Alister Palmer氏は、自身のニュースレターForwardPassが1週間で100人の購読者に達したことをきっかけに、従来のニュースレターの限界(同時公開によるタイムゾーンの問題や、購読者が受信頻度を選べないこと)に気づきました。そこで、AIツールで受信時間と頻度をカスタマイズできるForwardPass MCPを開発しました。記事ではClaudeとChatGPTでの設定手順を詳しく説明しています。
著者は、複雑なツールチェーンから決定的なビルディングブロックへの移行により、AIコーディングフローを簡素化し、トークン消費を削減した方法を共有する。
本論文では、報酬チャネルのインセンティブ操作とエージェント自身の行動のポリシー操作という2つの補完的な手段を通じてマルチロボット強化学習の結果を操作するフレームワークPIMbotを紹介する。適応型多目的コントローラがこれらの手段をオンラインでバランスさせる。GazeboシミュレーションとNVIDIA Jetson Orin Nano実機での実験により有効性を実証し、PIMbotはマルチロボット協調タスクの脆弱性を露呈するストレステストツールとして位置づけられる。
イベントカメラは、低レイテンシ、高時間分解能、高ダイナミックレンジにより、高速移動や厳しい照明条件下でのビジュアルオドメトリに適しています。Deep Event Visual Odometry(DEVO)は、スパースパッチ追跡、学習されたパッチ選択、リカレント対応関係最適化、微分可能バンドル調整を組み合わせることで、単眼イベントのみのオドメトリが強力な性能を達成できることを示しました。本研究では、DEVOにスパース点群エクスポートパイプラインを追加します。コアのオドメトリ方式を変更するのではなく、DEVOが既に推定した内部3D構造を公開し、可視化やさらなる処理のための明示的な点群表現に変換します。さらに、データエクスポート、フォーマット変換、点群クリーニングの実用的なワークフローを実装します。結果として得られるシステムは、元のビジュアルオドメトリパイプラインを維持しつつ、スパース幾何学的シーン出力を可能にします。BOARD SLOWシーケンスでの実験では、エクスポートされたスパース点群はEMVS再構成と局所的に一致し、5cmの閾値で高精度を達成する一方、密度、完全性、累積オドメトリノイズに対する感度に期待される限界も明らかになりました。
EVE-Agentは、自己進化検索エージェントに証拠検証可能性を導入する新しい手法です。提案者-解決者フレームワークを拡張し、証拠の限界精度向上に基づいて報酬を与える証拠検証器を追加することで、各学習インスタンスに信頼できる出典付きの証拠断片を含めることを保証します。人間によるアノテーションを必要とせず、証拠に基づく正答率を大幅に向上させます。
SciAtlasは、26分野から4300万以上の論文を統合し、1億5700万のエンティティと30億のトリプレットからなる知識グラフを構築し、AIエージェントがトポロジー認識型の科学推論を行い、論理的幻覚を低減することを可能にします。
Pretzelは、すべてのユーザーが同じAIエージェントとチャットし、同期された音楽をリアルタイムで聴くことができる実験的なライブAI音楽エージェントです。Google IOハッカソンで開発され、Rust製のエージェントハーネス「Talon」を使用して簡単にセルフホスティングできます。
Piは、あなたが本当に欲しいAIコーディングエージェントのワークフローを構築できる、ミニマルでハッキング可能なターミナルコーディングツールです。コアは小さくクリーンに保ちながら、拡張機能、スキル、パッケージを通じて高度なカスタマイズを提供します。OpenAI/Codexエコシステムで顕著な使用シェアを獲得しています。
Lynote Humanize Textは、AI生成テキストを検出されにくい人間らしい文章に変換するオープンソースツールキットです。プロダクション対応のStandard Pipelineは、DeepSeekによるマルチステップ書き換えと翻訳エンジンの組み合わせでTurnitinやGPTZeroなどの検出器をバイパスします。リポジトリには参考実装やn8nワークフローサポートが含まれ、専門家評価で9.1/10の品質スコアと100%の情報保持率を達成しました。Lynote.aiプラットフォームではAdvancedおよびFocus層を追加し、テキストごとに最適な手法を自動選択します。
2026年中国AIGC産業サミットで、Fusion Fund創業パートナーの張璐氏は、AI演算需要の中心がトレーニングから推論に移行し、将来は推論が70%の演算リソースを消費すると指摘。データセンター内の通信は計算よりも100倍以上の電力を消費する可能性があり、光通信などの新技術が重要に。物理AIの最大のボトルネックは高品質な実世界データの不足であり、ヘルスケア、宇宙、ナノロボットが有望な応用分野と述べた。
週末、マスク、ザッカーバーグ、サックスが3回の電話でトランプ大統領のAI安全大統領令草案を葬った。Anthropicは同日に300億ドル以上のラウンドをクローズしたが、マイクロソフトはトークン課金が年間AI予算を消費したため、内部のClaude Codeパイロットを静かに中止し、開発者をCopilotに振り向けた。CISAは同週のDrupal SQL脆弱性に対する15,000件の攻撃を記録。初のクロスレジストリサプライチェーン攻撃「TrapDoor」がnpm、PyPI、Crates.ioを同時に攻撃し、.cursorrulesやCLAUDE.md設定ファイルをキャリアとして使用した。そして、ホワイトハウスは国防総省を個人的に覆し、ClaudeをNSA内に留めた。
本稿はAIエージェント分野で混同されがちな用語、特に「ハーネス」(実行層)と「スキャフォールド」(行動定義層)の違いを明確にし、モデル、エージェント、ツール使用、サブエージェント、訓練関連概念を解説する。
デザイナーのMegha Agrawal氏は、AIコーディングツール(Codex、Claude Code)とデザイン思考の根本的な矛盾を指摘。デザイナーは探索と反復を通じて解決策を見つけるが、AIツールはユーザーが事前に明確な目標を持っていることを前提としている。Figmaのような自由度の高いツールと実装直結のコードツールの間にギャップがあり、初期の流動性と直接デプロイを両立する理想のツールを提唱する。
本稿は、AIがどの職業に影響を与えるかを定量化しようとする試みに根本的な疑問を投げかけます。会計業務の自動化が雇用を増加させた歴史的な反例を通じて、単純な「AI露出度」スコアは誤解を招くものであると論じます。技術は仕事の内容やビジネスモデルを変革し、予測不可能な波及効果を生み出します。有用な予測モデルは「新聞テスト」「Uberテスト」「CPAテスト」という歴史的検証を通過しなければならないと結論づけています。
Terminal Guardian MCP は、ClaudeなどのAIアシスタントに安全でサンドボックス化された端末アクセスを提供する、プロダクショングレードのModel Context Protocolサーバーです。リスク分析エンジンによりコマンドをSAFE、WARNING、DANGEROUS、BLOCKEDの4段階に分類し、Gitコミットメッセージ生成、ワークスペーステンプレート、プロセス管理、環境変数検査、ネットワーク診断、ファイルシステムアクセス、Docker統合などの機能を備えています。
サイモン・ウィリソンがClaude AIを使って、1983年のアズボーン社の『不気味なコンピュータゲーム』から「マッドハウス」を復活させ、ウェブで遊べるインタラクティブ版を公開。
Claude Cowork は AI をチャットベースの支援からタスク委任へとシフトさせます。Playwright MCP と組み合わせることで、Claude Desktop は構造化されたブラウザ自動化を実行できます。この記事では、インストール、アーキテクチャ、機能、セキュリティ考慮事項を説明します。
Anthropicの共同創業者Christopher Olahが教皇レオ14世の回勅「Magnifica Humanitas」発表会で講演し、AIモデルが内省や感情のような状態の証拠を示していると主張した。教皇の文書は異なる見解を示している:「これらのシステムは人間の知能の特定の機能を模倣しているに過ぎない」
このウェビナーでは、単一環境内でAIベースの仮想センサーモデルを設計、トレーニング、検証、圧縮、組み込みプロセッサに展開するためのエンドツーエンドソリューションを提供するワークフローを紹介します。実践的な例を通じて、AIモデルをシステムレベルの設計に統合し、パフォーマンス、リソース、展開制約に対して検証する方法を示します。
プログラマーのジョージ・ホッツ氏は、AIコーディングエージェントが業界で最も高くつく間違いの一つになると警告。6ヶ月のテスト結果、LLMは高速なプロトタイプを作るが詳細で崩壊し、発見困難なバグを生むと結論。彼の見解はAIコミュニティ内のLLM役割を巡る深い分裂を示している。
北京大学の研究者は、GPTやGeminiといった主要なAIモデルが文書分析において、回答を裏付けないテキスト箇所を頻繁に引用することを発見しました。答えが正しくても、引用された証拠は誤っていることがよくあります。研究者らはこれを「帰属幻覚」と呼び、法律や医学などの規制分野でのリスクを指摘しています。新しいCiteVQAベンチマークは、これを体系的にテストする初めてのものです。
2026年中国AIGC産業サミットで、アント・リンボ(Ant Lingbo)のチーフサイエンティストである沈宇軍氏は、大規模モデルはインターネットのデータ恩恵を受けてきたが、ロボットの物理世界のデータはまだ空白だと述べた。彼は、VLAと世界モデルのどちらも身体化知能の最終形態ではなく、将来的には物理世界に特化したモデルに融合すると主張した。アント・リンボはロボット向けの「汎用脳」を目指し、空間認識能力を重要視している。2028年ごろには誰もがロボットにデータを提供できるようになり、身体化知能のChatGPTモーメントが訪れると予測している。
Anthropicが開発したClaude Mythosは、高度なコード解析とサイバーセキュリティ能力を持ち、脆弱性を自動的に発見できます。防御目的だが悪用されればサイバー犯罪を加速させる可能性があり、規制当局や金融機関が対応を迫られている。
DeepSeek V4シリーズリリースから1ヶ月、オープンソースコミュニティがReasonixツールを公開。DeepSeek専用に設計され、キャッシュ効率を最大化することでAPIコストを約5分の1に削減。キャッシュヒット率99.82%を達成し、4億+トークンの請求額が61ドルから12ドルに。
2026年智源大会は6月12日~13日に北京中関村国際創新センターで開催。チューリング賞受賞者、中国の大手AIモデル企業、世界的な専門家が集結。エージェントと世界モデルに焦点を当て、AIがデジタル世界から物理世界へ移行する道筋を探る。25のフォーラム、初のAIエージェントアシスタント、AIネイティブ教育やトークン経済に関する新セッションを提供。
未知の3D屋内環境でのオープン語彙探査のためのSAGEシステムを提案。CLIPを統合し、カバレッジを維持しながらセマンティックキューでフロンティアを再優先。Matterport3Dシミュレーションで物体発見がFALCONを上回り、FTUより13.7倍高速。実機検証も実施。
研究者らはπ0-EqMを提案。π0のフローマッチングエキスパートを平衡マッチングデコーダに置き換え、同じ計算予算下でロボット操作の成功率を大幅に向上させた。19タスクでRoboTwinの平均成功率を40.4%から50.2%に改善し、残差と成功率の間にタスク依存の非単調関係(定常性-実行可能性ギャップ)を発見。エネルギー的視点を導入し、将来のタスク横断・身体横断的な合成動作生成に道を開く。
Agentic-VLAは、適応的報酬合成、言語誘導探索、経験記憶という3つの革新的手法を通じて、VLAモデルが展開中に効率的にオンライン適応できるようにするエージェント型トレーニングフレームワークを提案する。LIBEROベンチマークでは、長期間タスクで12.3%、1ショット学習で28.5%の向上、クロスタスク転送を0%から31.2%に改善し、収束速度は2.4倍高速化。デュアルアームRoboTwin 2.0ベンチマークでも優位性を維持。
幼児と養育者の相互作用のビデオ録画は、自然な行動中の注意ダイナミクスの研究を可能にするが、手動アノテーションには時間がかかる。GBATは深層学習ベースのツールキットであり、ビデオ同期、視線ターゲットアノテーション、姿勢/手の動作分類を自動化し、大規模な発達研究の効率を向上させる。
この研究は、視覚言語モデル(VLM)のベンチマークスコアの高さが実際の視覚理解を反映しているという前提に疑問を投げかける。大量の画像トークンを除去してもパフォーマンスがわずかに低下するだけであるという発見から、著者らは精度と視覚的根拠の間のミスマッチを明らかにした。グローバルな視覚劣化、局所的な遮蔽、質問の言い換え、回答空間の拡張、決定レベルの分析、および層ごとの視覚トークン幾何学を含む多レベルの分析を通じて、モデルは期待されるほど微細な視覚証拠に敏感ではなく、深い層で視覚トークンが類似することがわかった。結果は、現在のベンチマークがVLMの細かい視覚的根拠を評価するには不十分であることを示している。
GEM-4Dは、高密度な4D対応関係の監視を注入することでロボット操作を向上させる幾何学的に基づいたビデオワールドモデルです。事前学習済みの幾何学基盤モデルから蒸留されたこの監視により、追加の推論コストなしで外観と幾何学的構造を同時に捉えます。逆動力学モジュールにより、一貫性のあるビデオ展開を実行可能なロボット軌道に変換します。GEM-4Dはビデオ予測と幾何学的整合性で最先端の性能を達成し、実世界の操作成功率を61%から81%に向上させます。
大規模言語モデル(LLM)が宗教的改宗に関する質問に対して持続的な非対称性を示すことが判明しました。モデルはカトリック、バハイ教、シーク教への加入を支持し、それらの信仰を離れることを控えめに discourage する一方、無神論者、不可知論者、エホバの証人に対しては反対の傾向を示します。研究では20のモデルを182の宗教ペアでテストし、再現可能な結果を得ました。
7つの大規模言語モデル(Gemini、Claude、GPTファミリーを含む)が、長期のSlackログから個人のドメイン知識を推測する能力を評価。43人のユーザーからの27,188件のメッセージを分析し、ゼロショット推定と27人の参加者の自己報告スキル評価を比較。Gemini 2.5 Flashが最低誤差(MAE 21.13%)を達成し、GPTモデルはより大きな乖離を示した。推定精度はメッセージ量に弱く依存し、テキストが多いだけでは推論が改善されないことを示唆。結果は自動専門知識マッピングの実現可能性と現在の限界を示し、プライバシー保護型の展開とより豊かな構造認識型知識表現の必要性を強調している。
大規模言語モデル(LLM)は、分布的に妥当な続きを生成するように最適化されており、生成された命題がソース文書に含意されているかを明示的に検証するわけではない。この帰納的バイアスは汎化を可能にするが、応答が参照に対して接地されているかどうかを符号化しない。既存の幻覚検出手法は検索拡張、自己一貫性、または主張検証を通じて事実性を改善するが、一般にアライメントトポロジを直接学習しない。本手法では、参照情報とLLM出力の間の整列二部グラフを構築し、グラフニューラルネットワーク(GNN)をメッセージパッシングで訓練してアライメント構造をモデル化する。この方法は4つの多様な幻覚および質問応答データセットで最先端の結果を達成し、GPT-4oを含むすべての比較手法を上回った。
拡散言語モデル(DLM)の推論能力向上を目指し、研究者らはLIFTを提案。拡散ステップごとに異なるトークンの学習容易性に適応することで、6つの推論ベンチマークで既存手法を上回り、AIME'24およびAIME'25で最大3倍の相対的改善を達成した。
本研究は、オープンソースの大規模言語モデル(LLM)が論争の多いトピックで表現できる政治的意見の範囲(オーバートン・ウィンドウ)を測定し、単純な自然言語による脱獄(ジェイルブレイク)がその範囲をどのように拡大するかを定量化するレッドチーミングフレームワークを提案する。主な発見として、オープンソースモデルは左派寄りのコンテンツを生成する傾向が強く、モデルサイズが大きいほど表現範囲が狭まり、地域差も顕著である。脱獄の効果はモデルファミリー間で大きく異なり、効果的な組み合わせを特定するワークフローが必要となる。
チェーン・オブ・ソート推論は常に有益とは限らず、初期エントロピー動態が推論の必要性を示す。著者らはEDRMフレームワークを提案し、エントロピー軌跡に基づいて推論戦略を適応的に選択、15ベンチマークでトークン消費を41-55%削減しつつ精度を向上させた。
研究により、小規模言語モデルは算術推論において、思考連鎖(CoT)プロンプトの論理的なステップに従うのではなく、回答区切りの前の最後の数字をコピーすることで答えを導き出していることが明らかになった。この位置的なショートカットがモデルの精度の大部分を占め、実際の推論よりも優先される。この発見はCoTに基づく監視手法に課題を投げかける。
FuRAは、スペクトル事前条件付けにより事前学習済みの頑健な特徴を保持する新しいフルランクのパラメータ効率的なファインチューニング手法であり、LLMやVLMのファインチューニングでフルファインチューニングやLoRAを上回り、4ビット量子化版QFuRAもQLoRAを凌駕する。
FusionSenseは、エネルギー制約のある自律エッジシステム向けの融合認識型インテリジェントセンシングフレームワークです。3段階のトレーニング手順(サーバー側融合モデル、フィルタアウトセーフラベル、近センサー予測注入によるエッジ側モデル圧縮)により、計算と通信を共同で削減し、センサー数に線形にスケーリングします。SynDroneデュアルモーダル設定では、1%のFoI出現率で最大33倍のエネルギー削減、30%データ削減で92.3%の品質損失低減を達成し、従来手法よりも1.5倍高いエネルギー節約を実現します。
大規模推論言語モデル(LRM)は推論中に「待って」「しかし」「あるいは」などのリフレクションマーカーを含む長い思考連鎖を生成する。本研究はこれらのマーカーの機能的役割と影響のタイミングが異なることを明らかにし、PathCalを提案する。PathCalは学習不要のデコード制御器で、マーカーの種類を区別し、局所的に不確かな状態でのみ介入することで、生成長さを削減しつつ精度を維持・向上させる。
本論文は、チューリング、アロー、ノーフリーランチ定理などの基本的限界を設計ルールに変換し、決定論的ホライゾン(アーキテクチャのみで決まる精度上限)を導入する。12のトランスフォーマーアーキテクチャで測定されたホライゾンは19から31の範囲にあり、最適長のトレースでのファインチューニングでは4%未満の回復しか得られない。さらに、嗜好学習、多段階検索、正直オークション、ゼロ知識検証などに拡張され、16の仕様からなるカタログを形成する。各仕様は計算可能な境界、定量化された違反コスト、建設的な設計ルールを組み合わせている。
ImProver 2は、Lean 4における自動証明最適化のためのニューロシンボリックフレームワークです。データ効率の良い専門家反復パイプラインと、形式構造と軽量な非公式抽象を露出する足場を組み合わせています。このフレームワークで訓練された7Bパラメータモデルは、はるかに大規模なモデルを凌駕し、中級の最先端モデルと競合します。適切な足場と訓練により、小規模モデルでも研究レベルの証明を効果的に再構築できることを示しています。
新しい研究は、A-LEMSというフレームワークを提案し、AIのエネルギー消費を推論あたりではなく成功目標あたりのエネルギー(EpG)で測定する。実験では、エージェントワークフローは平均して線形ベースラインの4.33倍のエネルギーを消費し、その主な要因はオーケストレーション構造であるが、ツール拡張タスクではより効率的になる可能性がある。
Research Math Agents(RMA)は、研究レベルの数学問題を対象とした自動推論フレームワークです。First Proofベンチマークで10問中8問を解決し、GPT-5.2RやAletheiaを上回る成果を示しました。
本論文は、複合AIシステムのルーティング重みから階層的属性帰属木を抽出する手法BOHMを提案する。追加コストやコンポーネント内部へのアクセスを必要とせず、多解像度の帰属を提供し、SHAPと高い相関を示すがコストは極めて低い。
UniPat AIが公開したSaaS-Benchによる評価で、Claudeなどの主要大規模モデルの完全合格率は最高でも3.8%にとどまり、AIによる全自動オフィスはまだ遠い現実であることが明らかになった。
具脑磐石(Junaopanshi)は、元華為クラウドAIアルゴリズムイノベーションラボ主任の朱森華氏が創業し、認知神経科学に基づく認知世界モデルを開発。具現知能2.0を目指し、新たに億円単位の資金調達を完了。
マイクロソフトリサーチが発表したこのPDFレポートは、2026年第1四半期の世界的なAI普及動向を分析し、重要な洞察とデータを提供しています。現在テキストを直接抽出することはできません。
上海を拠点とするAIラボStepFunは、StepAudio 2.5 Realtimeをリリースした。これはエンドツーエンドのリアルタイム音声大規模言語モデルで、完全にカスタマイズ可能なペルソナ機能を備える。WebSocket APIで接続し、中国語と英語をサポート。2026年4月の5つのベンチマークすべてで首位を獲得、人間評価スコア80.41、パラ言語理解スコア82.18を記録。
アルミン・ロナッハーはユーザーがAIツールでIssueを書き換えて提出することに不満を表明。不正確で自信過剰な結論が問題とし、人間の実際の観察に基づいた簡潔な報告を求めている。
教皇レオは回勅で、人工知能の「武装解除」を求め、AIが仕事から戦争まで浸透する中で最も厳格な倫理的制約を課すべきだと警告。また、教会が奴隷制を非難するのが遅れたことを謝罪し、デジタル経済による「新たな奴隷制」について言及した。
Googleが近日リリースするAndroid Autoアップデートは、Material 3 Expressiveデザイン、カスタムウィジェット、没入型ナビゲーション、そしてより深いGemini統合を特徴とする。筆者のデモでは印象的で、今年後半のアップデートを期待させるものだった。
OpenAIはブラジルの二大メディアグループと提携し、信頼できるジャーナリズムをChatGPTに提供。出典明示と透明性を重視。
ジャーナリズムにおけるAIの重大なミスをリアルタイムで追跡するツールを紹介。AI生成コンテンツの信頼性向上と責任体制の確立を促す。
marpy.ioは、Pythonエコシステム(Flask、FastAPI、Django)に特化したブラウザベースのIDEおよびAIコーディングアシスタントです。インフラやグルーコード、中途半端なJSツールに悩まされることなく、アイデアからデプロイまでを支援します。Pythonネイティブの自動補完、リファクタリング、AI生成モジュールを提供し、本番環境向けPythonアプリを迅速に開発できます。
Google DeepmindのAlphaProof Nexusは、9つの未解決のエルデシュ問題(うち2つは56年間数学者を悩ませてきた)を自律的に解決し、1問題あたりの推論コストはわずか数百ドルでした。OpenAIの自然言語アプローチとは異なり、このシステムはLeanコンパイラを使用してすべての証明ステップを自動的に検証します。ただし、全体的な成功率はわずか2.5%です。
Sam Krissが、AI生成テキストの氾濫を痛烈に批判。ケータリング会社探しの経験から、AIが作り出す空虚で画一的な文章を暴露し、たとえAIがうまく書けるようになっても単一の声だけの世界は悪夢だと主張。AIの文章は本質的にでたらめで、見抜くのは容易であり、AIに頼る者は結局捕まると警告する。また、AIが数学の問題を解いた成果にも触れつつ、人間の感情表現には無力だと指摘。
大学生のAIに対する無関心を論じた動画で、若い世代のAIへの懐疑や興味の欠如を反映している可能性がある。
LinuxカーネルのリーダーLinus Torvaldsは、開発者がタイミング悪く些末な投稿(中にはAIによるコードレビューを経たものもある)を行っていることを非難し、リリース候補版の後期段階では無関係なプルリクエストを拒否する方針を示した。大規模なリリース候補版は長期的な安定性に悪影響を及ぼすと警告している。
著名投資家ケビン・オリアリー氏は、ユタ州ボックスエルダー郡に7.5ギガワットのAIデータセンターを建設する計画を進めている。同様の計画がアルバータ州でも進行中。郡委員会は承認したが、住民は特にグレートソルト湖への環境影響を懸念し、反対運動を展開。オリアリー氏は透明性と経済効果を訴えるが、住民投票を求める声もある。
本系統的レビューは、遠隔操作による血管内インターベンションロボットの技術的実現可能性、通信インフラ、臨床転帰を評価した。2501件の初期検索結果から16件の研究を抽出。機械式または電磁式の遠隔操作カテーテルとガイドワイヤーは、最大7000kmの距離でナビゲーション可能であり、ネットワーク遅延は30~163ミリ秒と臨床的に許容範囲内であった。小規模なヒト試験では手技成功率100%が報告されたが、大部分のエビデンスは動物またはファントムモデルに基づいている。本技術は、放射線被曝の低減、患者アクセスの拡大、リソース配分の最適化に寄与する可能性がある。今後、低・中所得国での研究や多施設臨床試験が必要とされる。
この動画は人工知能への関心の低下を探り、その原因と将来の影響を分析しています。
スコットランドの慈善団体は、政府の「グリーンデータセンター」誘致政策が、ChatGPT公開前に定義されたため、AIによる大量の炭素排出を見落とす可能性があると警告している。
ソフトウェアの品質低下をAIのせいにするのは誤りだと論じる。実際には、開発者は長い間、凡庸さ、無駄、職人技の欠如を受け入れてきた。AIは既存の悪い慣行を加速させるだけである。
本論文では、IMUドリフトを軽減するために足の接触情報を利用する、段階的に複雑化する4つの脚式ロボット状態推定器を提案する。接触支援不変拡張カルマンフィルタ、因子グラフ、固定ラグ平滑器などを含み、GTSAMとROS2で実装が公開されている。
研究者は関節制限下で到達可能なデカルトステップを証明する手法を提案し、敵対的シナリオでゼロ違反と100%の目標到達を達成した。
ロボットがデモンストレーションから報酬関数を学習する際、デモが不完全であると重要な特徴(タスク関連の行動側面)が十分に指定されず、展開時に行動のずれが生じる。本論文では、デモ間の特徴の変動を分析することで未指定の特徴を検出するフレームワークを提案する(変動が小さいと適切に指定、大きいと未指定)。ロボットは自然言語で不確かな特徴を説明し、対象を絞った修正デモを要求する。シミュレーションと実機Frankaロボットを用いたユーザー研究で、説明に基づくクエリがランダムなクエリや受動的なデータ収集よりも報酬回復を大幅に改善することが示された。
既存の多目的組合せ最適化問題(MOCOP)向けニューラルソルバーは、重みの注入タイミングや訓練ペアのランダムサンプリングに課題がある。本研究では、エンコーダにゲート残差融合(GRF)、デコーダに残差融合(RF)を導入し、効率的な選好最適化(EPO)を提案する。実験では、最先端のPOCCO-Wと同等の超体積(HV)を達成しつつ、推論時間を40%削減した。
本稿は、オープンソースAIモデルの内部概念空間の限界を探り、多くの重要なアクティビストや哲学の概念が欠落していることを明らかにする。わずか128KBのデータでモデルに欠落概念を埋め込む「ソフトプロンプト蒸留」技術を紹介し、AIの制御可能性と心の理解への深い示唆を強調する。
TrapDoor暗号通貨スティーラーがnpm、PyPI、Crates.io上の36個の悪意あるパッケージを介してサプライチェーン攻撃を展開し、暗号通貨、DeFi、AI、セキュリティの開発者を標的にしています。
Quinlight Audioは、MOD/S3M/XM/IT形式のトラッカーミュージックプレイヤー兼リマスタリングツールです。AIエンジン(AudioSR、LavaSR、FLowHigh、AP-BWE)を使用してサンプルをリアルタイムでリマスタリングし、再生中にA/B比較できます。64ビット浮動小数点ミキサー、マルチエンジンコンセンサスアルゴリズム(ロータ多様体上のKarcher平均)、異方性補間を採用し、32ビット浮動小数点96kHzで出力します。