AI News HubLIVE

ロボットの最新ニュース

DiscloAI – EU AI Act 第50条準拠のオープンソースSDK

DiscloAI は、EU AI Act 第50条のコンプライアンスを実現するオープンソースSDKです。チャットボットの開示、ディープフェイクラベル、AIコンテンツ通知に対応し、24のEU言語とWCAG 2.1 AAをサポート。CDNまたはnpmで10分以内に統合可能です。

  • EU AI Act 第50条準拠のためのオープンソースSDK
  • チャットボット開示、ディープフェイクラベル、AIコンテンツ通知をカバー
サイト内本文

Mistral、LeChatをVibeにブランド変更、チャットボットの未来は本格的なワークエージェントに

Mistral AIは、チャットボット「Le Chat」を「Vibe」に名称変更し、チャット、コーディングエージェント、新しいワークモードを1つのブランドに統合する。ワークモードはGoogle Workspace、Outlook、Slack、GitHubに接続し、メールやレポート、プルリクエストなどのタスクを自律的に処理する。Pro料金は17.99ユーロから14.99ユーロに値下げされたが、具体的な利用制限は明らかにされていない。これにより、OpenAI、Google、Anthropicのエージェント型サービスとの直接的な競争を仕掛ける。

  • Mistral AIがチャットボット「Le Chat」を「Vibe」にブランド変更、チャット、コーディングエージェント、ワークモードを統合。
  • ワークモードはGoogle Workspace、Outlook、Slack、GitHubと連携し、タスクを自律処理。
サイト内本文

NBA、AIによる自動アウトオブバウンズ判定システムを計画

NBAコミッショナーのアダム・シルバー氏は、AIとカメラを活用した自動判定システムを導入する計画を発表した。アウトオブバウンズなどの客観的な判定を自動化し、テニスのホークアイに類似した技術で即座にボール保持を決定する。審判はファウルなどの主観的な判定を引き続き担当する。

  • NBAはAIとカメラを使用した自動アウトオブバウンズ判定システムを計画。
  • システムはテニスのホークアイに類似し、即座にボール保持を判定する。
サイト内本文

Money Printer Pro – オープンソースAIコンテンツジェネレーター

Money Printer Proは、Google GeminiとVEO 3.1を搭載したオープンソースのAIコンテンツジェネレーターです。フォトリアリスティックな画像やシネマティックな動画を生成し、人物の同一性を維持します。7つのビジュアルエンジン、オートパイロットによるバッチ生成、AI品質スコアリング、公開ガードを備えています。ユーザーはGoogleに直接支払い、追加料金やサブスクリプションは不要です。

  • フォトリアリスティックな画像と8秒のシネマティック動画を生成し、人物の一貫したアイデンティティを維持。
  • 照明、影、動作、天候、衣装、シーン検証、コンテキストオーケストレーションの7つのビジュアルエンジンを統合。
サイト内本文

Superpowers:AIコーディングワークフローのためのエージェンティックスキルフレームワーク

Superpowersは、AIコーディングエージェント向けの完全なソフトウェア開発方法論であり、構成可能なスキルと初期指示に基づいています。テスト駆動開発、設計優先、サブエージェント駆動の反復を重視し、Claude Code、Codex CLI、Gemini CLIなどの複数のコーディングアシスタントをサポートします。

  • Superpowersは、TDD、体系的なデバッグ、コラボレーションプランニングなどのスキルライブラリを提供し、エージェントが自律的に数時間作業できるようにします。
  • ワークフローは、仕様のブレインストーミングから始まり、設計承認、実装計画の生成、サブエージェント主導の実行(2段階レビュー付き)へと進みます。
サイト内本文

法王、AIの限界を理解する

バチカンの新回勅『偉大なる人間性』は、人間の不完全性を尊厳の源として擁護し、中核的な人間能力をAIに外部委託することへの警告を発している。シリコンバレーによる人間の限界の軽視に対抗する。

  • レオ14世法王の回勅『偉大なる人間性』は、人間の有限性を美と尊厳の源としている。
  • この文書は、AIによる道徳的判断とテクノロジーエリートへの権力集中を警告している。
サイト内本文

惑星探査のためのリアルタイム非同期単眼オドメトリの設計

研究者らは、惑星探査ローバー向けに、イベントカメラデータを処理する誤差状態カルマンフィルタを用いたリアルタイム非同期イベントベース単眼オドメトリを提案。高ダイナミックレンジ照明や計算制約下でのロバストな自己運動推定を実現する。

  • イベントカメラはマイクロ秒分解能で非同期のピクセル単位の明るさ変化を報告し、高速センシングとHDR環境に適している。
  • アプローチは誤差状態カルマンフィルタを用いてイベントストリームから連続的にカメラ運動を推定する。
サイト内本文

Trinity:合成データを活用した非構造化屋外環境におけるクラス非依存地形分割とセマンティックセグメンテーションの統一

本論文では、トランスフォーマーアーキテクチャに基づくTrinityを提案し、統一ネットワーク内でクラス固有のセマンティックセグメンテーションとクラス非依存の地形分割を同時に実行する。地形領域は事前定義ラベルやロボット依存の走行可能性スコアなしに視覚的外観のみで分割され、ロボット非依存の視覚的地形事前知識を学習可能にする。大規模トレーニングのためにOAISYSシミュレータを拡張しRUGDSynth合成データセットを作成、さらにEXTerra実世界データセットを提供する。実験により複雑な屋外環境での有効性が実証された。

  • Trinityアーキテクチャがクラス非依存地形分割とセマンティックセグメンテーションを統一
  • 事前定義ラベルなしに視覚的外観で地形分割、プラットフォーム間の転移性を向上
サイト内本文

合成感情 vs ゲーミフィケーション:小型ソーシャルロボットにおける異年齢層のエンゲージメント戦略の探求

多くの子供は感情調整や社会的相互作用に課題を抱え、日常活動や治療プログラムへの参加が制限される。社交支援ロボットの効果には持続的なエンゲージメントが不可欠であり、本研究では触覚ロボットを用いて合成感情フィードバックとポイント報酬の2つの戦略を評価。6-8歳の小学生16名を対象とした選好評価では感情的な関与が好まれ、20-27歳の大学生14名を対象とした行動研究ではポイントシステムが有意に高いタスク精度(p<0.05)と持続的パフォーマンスを示した。年齢層によって選好と行動結果が異なる可能性を指摘し、設計仮説の検証には観察による相互作用が重要と結論。

  • 6-8歳の子供は感情的な関与を好む
  • 20-27歳の大学生はポイント報酬でタスク精度向上
サイト内本文

「もしもの世界」:身体性シナリオにおける汎用世界モデルの因果ベンチマーク

動画生成モデルは運転やロボット操作のシミュレータとして使われるが、既存のベンチマークは単独動画の品質のみを評価し、因果関係の理解をテストできない。そこで提案された「もしもの世界」ベンチマークは、1つの物理変数のみ異なるペアのプロンプトを使用し、モデルが正しく因果に応答するかを検証する。9つの最先端モデルを評価した結果、最高でも52%、オープンソースモデルは約28%のペアスコアであり、性能は物理の難易度ではなく視覚的顕著性に依存する。

  • 「もしもの世界」は、単一変数の変更を含む319のプロンプトペアで動画生成モデルの因果推論をテスト。nuScenesとDROIDの実フレームに基づく。
  • APEO評価基準(遵守性、物理整合性、環境保存、結果の正確性)を採用。9モデル中最高52%、オープンソースは約28%で、因果介入の多くに失敗。
サイト内本文

動作プリミティブを超えて:ヘッドマウントIMUによる行動認識

本研究は、ヘッドマウント慣性計測ユニット(IMU)を用いた行動レベルの活動認識手法を提案し、従来の動作プリミティブ認識を超えるものです。研究チームは、ARアプリケーションのニーズとセンサの観測可能性を考慮した5つの行動カテゴリを定義し、Ego4Dから16万サンプルのデータセットを構築しました。また、70.3万パラメータの階層モデルHiT-HARを提案し、5クラスの行動認識と8クラスのシナリオ認識で既存モデルを上回る性能を示しました。観測可能性分析により、移動行動は確実に観測可能であり、物体移動やタスク操作は時間的コンテキストを必要とすること、シナリオ依存の信号重複が課題であることが明らかになりました。アーキテクチャの選択では、時間的コンテキストとシナリオ構造を活用することが、単純なモデルサイズの拡大よりも効果的であることが示されました。

  • ヘッドマウントIMUからの行動認識のための階層モデルHiT-HARを提案、動作プリミティブを超越
  • Ego4Dから16万サンプルのデータセットを構築、4段階の品質保証フレームワークを採用
サイト内本文

Oura Ringのデータをこの無料アプリで深掘りしてみた – その結果

Simple Wearable Reportは、AIを使ってOura Ringのデータからさらなる洞察を引き出す無料ツールです。この記事では、その使い方とGeminiなどのチャットボットとの連携について紹介します。

  • Simple Wearable ReportはOuraデータをラボ形式のレポートに変換し、医師との共有やAIチャットボットへのアップロードが可能。
  • Oura内蔵のAIアドバイザーと比較して、Geminiなどのチャットボットはより具体的で定量的な分析を提供。
サイト内本文

教皇の間違い

教皇レオ14世のAI回勅『Magnifica Humanitas』は、アルゴリズムバイアス、水使用、データ主権などの問題を正しく指摘しているが、汎用人工知能や壊滅的リスクに触れておらず、大規模失業への具体策を欠き、時代遅れで失望させるものと批判されている。

  • 教皇レオ14世のAI回勅『Magnifica Humanitas』は、AI時代の重要課題に取り組めず時代遅れと批判される。
  • 回勅はアルゴリズムバイアスや水使用などの問題を挙げるが、AGIと壊滅的リスクの議論が欠けている。
サイト内本文

眼科医がパソコン用メガネの処方を間違え、AIが修正に貢献

通常の遠用処方は良好だったが、パソコン用メガネの処方は完全に間違っていた。ChatGPT、Claude、Geminiの3つのAIが数値を解析し、実際の使用距離に基づいた正しい処方を導き出した体験談。

  • 医師が患者の実際のモニター距離を無視し、読書距離用の処方をパソコン用として提供。
  • 3つのAIが一致して問題を指摘し、修正値を算出。
サイト内本文

AIスクレイパーボットの脅威と戦う

LWNの記事はAIスクレイパーボットの問題を論じ、これらの自動プログラムがウェブサイトのコンテンツを侵害し、対策を模索する内容です。

  • AIスクレイパーボットがモデル訓練のためにウェブサイトコンテンツを大量にスクレイピング
  • ウェブサイト所有者は帯域消費とコンテンツ盗用のリスクに直面
サイト内本文

多ロボットによる箱の協調搬送:異なる表面での分散型役割ベース比例制御

本論文では、複数のロボットが平坦、上り坂、下り坂の異なる摩擦特性を持つ表面で箱を協調して押し搬送するための分散型アプローチR2P2を提案する。ルールに基づいてロボットに役割(押す、支える、防ぐ)を割り当て、比例速度制御を組み合わせることで、通信や同期の必要性を低減する。6台のロボットを用いたシミュレーションで評価し、4台のTurtlebotによる実機実験も成功。従来の仮想リーダー追従法より高い成功率を示した。

  • R2P2はルールベースの役割割り当てと比例制御により分散型搬送を実現。
  • 平坦、上り坂、下り坂の異なる表面と箱質量に対応。
サイト内本文

遠隔操作におけるループの閉鎖: 高品質デモンストレーション収集のためのエピソードレベルのデータ品質評価とフィードバック

遠隔操作はロボットデータ収集に不可欠だが、初心者はタスク成功でも質の低いデモを生成しがち。本論文では、即時フィードバックにより質を向上させるDQAFフレームワークを提案。

  • DQAFフレームワークは各遠隔操作エピソード後に、意味的なタスク進捗とテレメトリに基づく即時フィードバックを提供する。
  • 動作の滑らかさ、停止、運動学限界などの信号を抽出し、構造化された評価と実行可能な自然言語フィードバックに変換する。
サイト内本文

RCSP:安全な動的ロボットナビゲーションのためのリスク感応型推測シナリオ計画

RCSPは、短期的な障害物の未来に対して候補コマンドを評価することで、近未来のコミットメント問題を回避する予測計画層です。MuJoCo、ROS2/Gazebo、DynaBARN/Jackalのシミュレーションでは、RCSPは安全性と経路品質を向上させる一方でレイテンシを増加させ、既存のナビゲーションスタックを補完するモジュールとしての境界を示しました。

  • RCSPは、動的環境で将来の障害物によって通路が閉鎖される問題に対処します。
  • この計画層は軽量な信念を維持し、将来の相互作用をサンプリングし、高リスクのテールをペナルティします。
サイト内本文

β-スパースガウス過程を用いた協調ナビゲーションと探査

帯域幅制約下での異種ロボットの協調ナビゲーションフレームワークを提案。β-スパースガウス過程によりタスク関連ポイントを選択し、探索とタスクのバランスを取る戦略を開発。シミュレーションで経路コスト18%削減、情報転送76%削減を達成。

  • タスク認識誘導点選択のための新しいβ-スパースガウス過程モデル
  • センサーロボットによるマップポイントとナビゲーション行動のオンライン同時選択
サイト内本文

教師付き射影多様体学習によるリー群埋め込みを用いたニューラルダイナミクスの計画

本論文は、リー群埋め込み動的ニューラルネットワーク(LieEDNN)を提案し、随伴作用を用いてリー群と加法演算の非互換性や非ユークリッドダイナミクスを克服し、多様体上での安定学習を実現する。SE(3)上の伸縮マニピュレータ実験で有効性を確認。

  • LieEDNNフレームワークを提案、リー群を多様体対称性の内在的表現として利用
  • 随伴リー群作用によりリー代数上での加法演算を可能に
サイト内本文

Show HN:Hyper、自動運転の会社の脳

HyperはAIを活用した個人知識管理ツールで、NotionやObsidianなどのアプリからコンテキストを統合し、インテリジェントなアシスタンスを提供します。創業者は以前Maticでロボット開発に従事し、2020年にGPT-2の微調整を試みましたが、現在はセルフサービス版をリリースしています。

  • Hyperは個人知識ベースをAIと統合し、自律的な作業支援を実現。
  • 創業者はGPT-2を試みたが時期尚早で、その後ロボット開発に注力。
サイト内本文

AgentWatch: アンビエントエージェントによるプロアクティブなAWSモニタリング

この記事では、AgentWatchの機能を実践的な実装を通じて紹介します。このソリューションは15分ごとにインフラストラクチャチェックを実行し、複数のAWSアカウントにわたるCloudWatchメトリクス、ログ、アラームを要約します。エージェントはSlackに直接アクション可能なレポートを配信し、インフラストラクチャの状態に関する自然言語クエリに応答します。また、自動化を最大化しながら適切な人間の監督を維持する3つのヒューマン・イン・ザ・ループパターンについても探求します。

  • AgentWatchは、AWSリソースをプロアクティブに監視するアンビエントエージェントです。
  • 15分ごとにインフラストラクチャを自動チェックし、Slackに構造化レポートを送信します。
サイト内本文

The Good Robotポッドキャスト:フリーデリケ・フォン・フランケ氏と語るデータセンターとデジタル主権の未来

「The Good Robot」ポッドキャストの今回のエピソードでは、フェミニズムの原則と分散型インフラによって、クラウドインフラを大企業のサービスから公共の共有財産に変える可能性を探ります。ウィキメディア・ドイツの政策アドバイザー、フリーデリケ・フォン・フランケ氏が、フランクフルトのエネルギー集約型データセンターからストックホルムの市営光ファイバー網までを例に、環境責任とコミュニティ主導のデザインを提唱します。

  • フリーデリケ・フォン・フランケ氏は、フェミニズムと分散型アプローチによるクラウドインフラの再構築を主張。
  • フランクフルトの高エネルギー消費データセンターとストックホルムの共有型光ファイバー網を対比。
サイト内本文

PACT:人間とロボットの協調における継続的なタスク支援のためのプロアクティブな質問

長期的な人間とロボットの協調において、ロボットは部分観測下でユーザを支援し、複数日にわたるインタラクション履歴を活用する必要がある。しかし、協調初期には人間の特性や習慣が未知であるため、受動的な推論後の行動は非効率的である。本稿では、PACT(Proactive Asking for Continual Task Assistance)フレームワークを提案する。これは、現在の観測と蓄積されたインタラクション履歴に基づいて文脈の十分性を評価し、行動前に明確化を求めるかどうかを決定する。実験では、PACTが受動的推論ベースラインよりも支援精度と明確化ユーティリティを向上させることが示された。

  • PACTフレームワークにより、ロボットは必要に応じて積極的に明確化を求め、支援の信頼性を向上させる。
  • 強化学習を用いて実装し、明確化ユーティリティ指標を導入。複数日の協調シナリオで受動的推論を上回る。
サイト内本文

地形適応型グラウザーホイール:惑星探査の最適化に向けた設計と実験的研究

惑星探査車は様々な地形(坂道や粒状地面)での移動に課題を抱えている。研究者らは連続的にグラウザー高さを調整できるマルチモーダルホイールを提案。4種類の表面での750回の実験で、適応的配置により粒状領域でのスリップが30~58%低減し、移動時間とエネルギー消費が最大77.4%改善され、固定ホイールの限界が明らかになった。

  • 地形に合わせてグラウザー高さを連続調整可能なマルチモーダルホイールを開発
  • 750回の実験で、粒状地形でスリップが30~58%低減、移動時間とエネルギーが最大77.4%改善
サイト内本文

AcroRL:双方向推力を用いたアグレッシブなクアッドローターの反転学習

本論文では、強化学習を用いて一定の基準軌道を変調し、位置制約下でコンパクトなクアッドローター反転を実現するフレームワークを提案する。従来の軌道生成・追跡と互換性を持ち、シミュレーションでは最強の最適化ベースラインと比較して位置RMSEを32%、整定時間を57%削減した。ハードウェア実験では、複数のヨー構成で位置RMSE 0.35m未満の反転に成功した。

  • 双方向推力により、クアッドローターは逆さま飛行、停止、センシングが可能になる。
  • 従来手法はアクチュエータ飽和とモーター反転遅延に悩まされていた。
サイト内本文

ブラックボックスアクチュエータへの直列弾性駆動後付けの効果の調査

カスタム直列弾性要素をブラックボックスアクチュエータに後付けした結果、力制御帯域幅が10.32 Hzから30.32 Hz(2.93倍)に向上し、市販センサーよりも7.63%優れた性能を、わずか25 GBPで達成しました。

  • ねじり弾性要素を有限要素解析で設計し、剛性2155.4 Nm/radを実現。
  • 後付けにより開ループ力制御帯域幅が2.93倍向上。
サイト内本文

MASt3R-Nav: 相対3DマップにおけるWayPixelナビゲーション

新しい視覚ナビゲーション手法MASt3R-Navは、画素相対接続性を用いて幾何学的に正確でありながら大域的な一貫性を必要としないマップを構築し、従来のトポロジカルグラフよりも高度なナビゲーションを実現する。

  • 新しいマップ表現として画素相対接続性を提案。
  • 3D接地画像マッチングを用いて画像間の画素対応を構築。
サイト内本文

ラボテストで他を圧倒したロボット掃除機、セール中

Ecovacs X8 Pro OmniがZDNETのラボテストで10機種中最高のパフォーマンスを記録。メモリアルデーセールで67ドル引きの599ドル。

  • Ecovacs X8 Pro Omniは砂利吸引スコア平均60.28%でテスト機種中トップ。
  • 自清掃モップローラーと清水・汚水タンクを搭載し、掃除とモップ掛けを同時実行。
サイト内本文

Google DeepmindのAlphaProof Nexusが数十年未解決の数学問題を数百ドルで解決

Google DeepmindのAlphaProof Nexusは、9つの未解決のエルデシュ問題(うち2つは56年間数学者を悩ませてきた)を自律的に解決し、1問題あたりの推論コストはわずか数百ドルでした。OpenAIの自然言語アプローチとは異なり、このシステムはLeanコンパイラを使用してすべての証明ステップを自動的に検証します。ただし、全体的な成功率はわずか2.5%です。

  • AlphaProof Nexusは9つの未解決エルデシュ問題を自律解決、うち2つは56年未解決。
  • 1問題あたりの推論コストは数百ドル。
サイト内本文

もしAIに文章を書かせたら、あなたの家に行って殺してやる

Sam Krissが、AI生成テキストの氾濫を痛烈に批判。ケータリング会社探しの経験から、AIが作り出す空虚で画一的な文章を暴露し、たとえAIがうまく書けるようになっても単一の声だけの世界は悪夢だと主張。AIの文章は本質的にでたらめで、見抜くのは容易であり、AIに頼る者は結局捕まると警告する。また、AIが数学の問題を解いた成果にも触れつつ、人間の感情表現には無力だと指摘。

  • AI生成テキストは空虚で、本物の情報や人間の声が欠けている。
  • AIの文章が上手くなっても、単一のスタイルは文化的な悪夢を招く。
サイト内本文

セマンティック・アウェア・ガイドドローン探査:言語条件付き3D屋内マッピング

未知の3D屋内環境でのオープン語彙探査のためのSAGEシステムを提案。CLIPを統合し、カバレッジを維持しながらセマンティックキューでフロンティアを再優先。Matterport3Dシミュレーションで物体発見がFALCONを上回り、FTUより13.7倍高速。実機検証も実施。

  • SAGEはFALCON探査器をベースにCLIPを統合したセマンティック・アウェアシステム
  • Matterport3Dシミュレーションで物体発見性能がFALCONおよびセマンティックのみのアブレーションを凌駕
サイト内本文

脚式ロボットのための4つの単純な固有受容推定器

本論文では、IMUドリフトを軽減するために足の接触情報を利用する、段階的に複雑化する4つの脚式ロボット状態推定器を提案する。接触支援不変拡張カルマンフィルタ、因子グラフ、固定ラグ平滑器などを含み、GTSAMとROS2で実装が公開されている。

  • 脚式ロボットのIMUはドリフトするが、足先の接触で補正可能。
  • EKFから固定ラグ平滑器まで、複雑度が増す4つの推定器を開発。
サイト内本文

関節空間制約下での検証済みタスク空間運動計画

研究者は関節制限下で到達可能なデカルトステップを証明する手法を提案し、敵対的シナリオでゼロ違反と100%の目標到達を達成した。

  • 標準のBug2プランナーは6-11%のステップで関節制限に違反し、最大18%のシナリオで目標に到達できない。
  • 新しい手法はS手順と半正定値計画を用いて証明済みステップサイズを計算する。
サイト内本文

質問するロボット:対象を絞った説明による報酬関数のずれの回復

ロボットがデモンストレーションから報酬関数を学習する際、デモが不完全であると重要な特徴(タスク関連の行動側面)が十分に指定されず、展開時に行動のずれが生じる。本論文では、デモ間の特徴の変動を分析することで未指定の特徴を検出するフレームワークを提案する(変動が小さいと適切に指定、大きいと未指定)。ロボットは自然言語で不確かな特徴を説明し、対象を絞った修正デモを要求する。シミュレーションと実機Frankaロボットを用いたユーザー研究で、説明に基づくクエリがランダムなクエリや受動的なデータ収集よりも報酬回復を大幅に改善することが示された。

  • 不完全なデモは特徴の未指定を引き起こし、展開時にロボットの行動のずれにつながる。
  • デモ間の変動を測定することで未指定の特徴を検出する手法を提案。
サイト内本文

深層イベントビジュアルオドメトリの拡張:スパース点群エクスポート

イベントカメラは、低レイテンシ、高時間分解能、高ダイナミックレンジにより、高速移動や厳しい照明条件下でのビジュアルオドメトリに適しています。Deep Event Visual Odometry(DEVO)は、スパースパッチ追跡、学習されたパッチ選択、リカレント対応関係最適化、微分可能バンドル調整を組み合わせることで、単眼イベントのみのオドメトリが強力な性能を達成できることを示しました。本研究では、DEVOにスパース点群エクスポートパイプラインを追加します。コアのオドメトリ方式を変更するのではなく、DEVOが既に推定した内部3D構造を公開し、可視化やさらなる処理のための明示的な点群表現に変換します。さらに、データエクスポート、フォーマット変換、点群クリーニングの実用的なワークフローを実装します。結果として得られるシステムは、元のビジュアルオドメトリパイプラインを維持しつつ、スパース幾何学的シーン出力を可能にします。BOARD SLOWシーケンスでの実験では、エクスポートされたスパース点群はEMVS再構成と局所的に一致し、5cmの閾値で高精度を達成する一方、密度、完全性、累積オドメトリノイズに対する感度に期待される限界も明らかになりました。

  • イベントカメラは高速移動や低照度でのオドメトリに適している。
  • DEVOはスパース追跡とバンドル調整により強力な単眼イベントオドメトリを実現。
サイト内本文

GEM-4D:ロボット操作のための幾何学的強化ビデオワールドモデル

GEM-4Dは、高密度な4D対応関係の監視を注入することでロボット操作を向上させる幾何学的に基づいたビデオワールドモデルです。事前学習済みの幾何学基盤モデルから蒸留されたこの監視により、追加の推論コストなしで外観と幾何学的構造を同時に捉えます。逆動力学モジュールにより、一貫性のあるビデオ展開を実行可能なロボット軌道に変換します。GEM-4Dはビデオ予測と幾何学的整合性で最先端の性能を達成し、実世界の操作成功率を61%から81%に向上させます。

  • GEM-4Dは高密度4D対応監視によりビデオワールドモデルの幾何学的整合性を強化。
  • 追加推論コストなしで単一ストリームアーキテクチャを維持。
サイト内本文

FusionSense: ランタイム適応型マルチモーダルエッジインテリジェンスのための3段階ニアセンサー学習

FusionSenseは、エネルギー制約のある自律エッジシステム向けの融合認識型インテリジェントセンシングフレームワークです。3段階のトレーニング手順(サーバー側融合モデル、フィルタアウトセーフラベル、近センサー予測注入によるエッジ側モデル圧縮)により、計算と通信を共同で削減し、センサー数に線形にスケーリングします。SynDroneデュアルモーダル設定では、1%のFoI出現率で最大33倍のエネルギー削減、30%データ削減で92.3%の品質損失低減を達成し、従来手法よりも1.5倍高いエネルギー節約を実現します。

  • サーバー側融合モデル、フィルタアウトセーフラベル、補助信号注入によるエッジ側圧縮の3段階学習手法。
  • ランタイムの決定層が計算と通信を共同最適化し、センサー数に線形にスケール。
サイト内本文

私が選んだメモリアルデー早期セール:ノートパソコン、タブレットなどが大幅割引

メモリアルデーウィークエンドが到来。小売各社が家電、アウトドア、テクノロジーなど様々なカテゴリーでセールを実施。ZDNETのショッピングエディターとして、テスト済みのおすすめ商品を含む厳選ディールを紹介します。Apple、Samsung、Hisense、Ninjaなどのブランドからお得な情報をお届けします。

  • メモリアルデーウィークエンドは夏の非公式な始まりであり、多くのカテゴリーで割引が行われています。
  • ZDNETのディールエディターが、Amazon、Walmart、Best Buyなどの小売店から厳選したお得な情報を提供。
サイト内本文

韓国副首相、AIの富は国民に還元されるべきと発言

韓国のペ・ギョンフン副首相は、人工知能によって生み出された富は国民に還元されるべきだと述べ、AIが格差や失業を悪化させる可能性に懸念を示した。また、サムスン電子での最近の労使紛争はAI時代の傾向の一部であり、「AI包摂社会」の構築が必要だと強調。さらに、テクノロジー株への集中や産業用ロボットの導入についても見解を述べた。

  • ペ副首相、AIの富は国民に還元され、不平等を防ぐべきと強調。
  • サムスン電子のストライキ中断はAI時代の労使対立の兆候。
サイト内本文

フロリダのロボット巣箱、コロニー崩壊を70%削減と主張

フロリダ州のコミュニティがAI搭載のロボット巣箱を導入し、蜂群の健康を監視して脅威から保護し、自然発生率と比較してコロニー崩壊を70%削減したと主張しています。ミツバチはほとんどの作物の受粉に不可欠です。

  • フロリダのコミュニティにAI搭載のBeeHomeシステムが設置され、蜂群を保護。
  • カメラ、センサー、ロボット技術を使用して巣箱の健康を監視し、ヘギイタダニなどの脅威を自動処理。
サイト内本文

バチカンとAnthropicの意外な関係がAI倫理議論を再構築

教皇レオ14世のAIに関する新回勅がAnthropic共同創設者クリス・オラーの参加のもと発表され、議論を呼んでいる。バチカンとテクノロジー企業との10年にわたる関係、およびAnthropicとカトリック倫理学者との協力は、より倫理的なAIを目指すものだが、批判者は「ポープ・ウォッシング」を警告する。

  • 教皇レオ14世のAI回勅発表にAnthropic共同創設者クリス・オラーが参加。
  • バチカンは2016年からテクノロジー企業との関係を構築し、教皇フランシスコが対話を促進。
サイト内本文

ロボット掃除機を専門にテストする私が選ぶ、現在のメモリアルデーのベストセール

メモリアルデーの週末はロボット掃除機を購入する絶好の機会です。レビュアーとして厳選した、今最もお得なロボット掃除機のセール情報をお届けします。

  • メモリアルデーはロボット掃除機やスマートホームデバイスが大幅に値下がりする時期です。
  • ロボット掃除機は高額な投資なので、セールを逃さずチェックすることが重要です。
サイト内本文

レーダーが昆虫種を識別可能に

研究者らはミリ波レーダーシステムと機械学習を組み合わせ、昆虫の羽ばたきによる微小ドップラーシグネチャを解析することで、送粉昆虫を非侵襲的に識別することに成功した。種レベルの精度85%、科レベルの精度96%を達成し、従来の殺虫を用いた方法に代わる低コストな手法を提供する。

  • 新たなミリ波レーダーシステムは、羽ばたきによる微小ドップラー信号を用いて昆虫種を分類する。
  • 機械学習モデルは5種の送粉昆虫に対し種レベル85%、科レベル96%の精度を達成。
サイト内本文

AI-DECLARATION.md:コードにおけるAI使用を宣言するオープンスタンダード

AI-DECLARATION.mdは、ソフトウェアプロジェクトにおけるAIの関与度を宣言することで透明性を高めるオープンな仕様です。AIの使用レベルをnoneからautoまでの6段階で定義し、設計、実装、テストなどのプロセスごとに細かく指定することも可能です。この標準は開発者コミュニティにおける信頼できる社会的契約の確立を目指しています。

  • AI-DECLARATION.mdはプロジェクトのAI利用状況を構造化して宣言する
  • レベルはnone、hint、assist、pair、copilot、autoの6段階
サイト内本文

Google I/O 2026の対話ステージを振り返る

今年のI/Oでは、Googleのリーダー、科学者、クリエイティブな先駆者たちが集まり、AI、量子コンピューティング、ロボティクス、創造性の未来について議論しました。

  • Google CEOサンダー・ピチャイ氏がFuture Forwardのマット・バーマン氏と対談。
  • AIエージェント、量子・AI、科学問題解決、ロボティクスに関するセッション。
サイト内本文

ソフトリニア空気圧アクチュエータの解析的・実験的力解析

本研究では、ウェアラブルロボット向けのリニアソフトスリーブアクチュエータ(LSSA)の力発生挙動を解析的および実験的に解析した。準静的モデルを構築し、125 kPaでの力が伸長0 mmで約112 Nから40 mmでほぼゼロに減少することを確認。静的負荷は力発生を遅らせ、出力を低下させることが示された。

  • LSSAの力発生を記述する準静的解析モデルを開発。圧力、幾何形状、変位、軸剛性を考慮。
  • 125 kPa下で、伸長0 mmでの約112 Nから40 mmでほぼ0 Nへの力低下を実験確認。
サイト内本文

ロボット群のための分散型マルチカバレッジアルゴリズム

本論文は、ドローン群が故障に直面しても重要資産を冗長にカバーし続けるための分散型マルチカバレッジアルゴリズムを提案する。ローカルなセンシングと通信のみで動作し、全体調整を必要としない。ANTS 2026に採択。

  • ロボット群の故障に対応する分散型マルチカバレッジアルゴリズムを提案
  • ローカルなセンシングと通信のみで動作し、全体計画は不要
サイト内本文

トピック