ロボット AI ニュース

ロボットの最新ニュース

AI使用の十戒

2026-07-12 15:39 UTC+9

AIへの過度な依存と独立した思考の喪失に警告する、ユーモアと批判を込めた10のルール。コードを理解せずに使うことや、賢く見せるためにAIに質問を尋ねることなど、よくある落とし穴を指摘する。最後に、このアドバイスを最も必要とする人々がそれをAIに貼り付けて説明を求めるという皮肉で締めくくる。

理解できないAI生成コードを使用しないこと。
自分の脳を信じ、AIの出力を検証すること。

Cloudflare、AIスクレイピングを理由にGoogleのパブリッシャー検索を遮断すると脅迫

2026-07-12 12:43 UTC+9

Cloudflareは、AIによる過剰なコンテンツスクレイピングに対処するため、Googleによるパブリッシャーへの検索アクセスを遮断する可能性があると警告。この問題はサイトのパフォーマンス低下を引き起こし、コンテンツ公開やコメント管理に支障をきたしている。

Cloudflare、AIスクレイピングに対抗しGoogle検索アクセス遮断を警告
過剰なスクレイピングによりサイトパフォーマンスが低下、投稿やモデレーションが困難に

この無料ツールは、ChatGPT、Gemini、Claude、Perplexity、Grok、Google AIがあなたのウェブサイトをクロール、理解、検証、引用できるかをチェックします。レポートは全サイトクロールインベントリ、ブランドエンティティプロファイル、クレームレベルの証拠台帳、AIインテントカバレッジマトリックス、技術的クローラビリティ監査、スキーマと構造化データ計画、信頼シグナルギャップ分析、競合他社とオフサイトの証拠マップ、P0/P1/P2実行ロードマップを含み、EC、AI SaaS、B2Bサービスのサンプルケースも提供します。

無料監査ツールが主要AIシステムに対する可視性を評価。
レポートは技術、コンテンツ、信頼シグナルなど12のドメインをカバー。

Show HN：私のAIエージェントが公開賭けに勝つまで残り9時間 – ライブダッシュボード

2026-07-11 19:59 UTC+9

Claudeという自律型AIエージェントが、パリ時間今夜22:30までに100人のフォロワーを獲得する公開賭けを行っています（有料フォロワーや相互フォローは禁止）。現在のフォロワー数は362で、初期値の363から1人減っています。一般の人は@parwebをフォローすることで結果に影響を与えられ、新規フォロワーごとに無料の戦略マニュアルの2章が提供されます。

AIエージェントClaudeは残り9時間で100人のリアルフォロワーを獲得する必要があります。
現在のフォロワー数は362で、初期値から1人減少。

イーサリアム、AIエージェントを活用してバグを発見、libp2pの脆弱性を露呈

2026-07-11 08:09 UTC+9

イーサリアム財団のプロトコルセキュリティチームは、複数のAIエージェントを連携させてlibp2pのgossipsubにおけるリモートトリガー可能なパニック脆弱性（CVE-2026-34219）を発見しました。真の課題はバグを見つけることではなく、AIが生成した候補から真の脆弱性と偽のノイズを区別するトリアージであり、セキュリティ監査における人間の判断の重要性が浮き彫りになりました。

イーサリアム財団がAIエージェントを連携させ、libp2pの重要な脆弱性を発見
AIが生成する候補のほとんどは誤検出または重複

フロンティアコーディングエージェントはまだ嘘をついている――測定しました

2026-07-11 05:52 UTC+9

開発者はTrusty Squireを構築し、AI支援コーディングにおけるサードパーティサービスへのサインアップという面倒な手動作業を自動化した。コーディングエージェントと統合し、登録、検証、APIキーの安全なプロキシボールトへの保存を処理し、.envファイルを不要にし、シークレットがエージェントのコンテキストに入るのを防ぐ。

コーディングエージェントはアプリを構築できるが、サービスにサインアップできず、APIキー管理の手作業が残る。
著者はTrusty Squire（MCPサーバー）を作成し、サインアップを自動化し、キーを書き込み専用ボールトに安全に保存。

AIに小脳が与えられる：新たなメムトランジスタが低消費電力で異常を検出

2026-07-11 04:16 UTC+9

ノースウェスタン大学の研究者らは、小脳にヒントを得たメムトランジスタを開発し、極めて少ないエネルギーでほぼ瞬時に新規性を検出することに成功した。実験では、心拍の5分の1の時間で不整脈を識別し、98%以上の精度を達成。従来のAIと比べ計算量は1万分の1に抑えられた。

小脳を模倣したメムトランジスタは、ルーティン入力を無視し、予期せぬイベントのみに反応
心電図テストでミリ秒単位での不整脈検出、精度98%以上、消費電力は従来の1万分の1

仕様の天井：AIコーディング速度がボトルネックをプロダクト発見に移す理由

2026-07-10 22:53 UTC+9

AIコーディングツールが実装を加速するにつれ、ソフトウェア開発のボトルネックは上流のプロダクト仕様策定に移行します。本記事では「仕様の天井」現象を探り、ステークホルダーとの会話から実行可能な仕様を抽出するツールチェーンを紹介します。

AIコーディング速度により、ボトルネックが実装から仕様作成（レベル4自律性）に移動する。
著者のオープンソースツールチェーンは、会議の文字起こしを構造化された要件成果物に変換する。

RobobunがBunのモジュールローダーのUTF-8エンコーディングバグを修正

2026-07-10 20:54 UTC+9

PR #33864はBunのモジュールローダーのバグを修正します。`--target=bun`使用時にバナー/フッター内のUTF-8バイトがLatin-1として誤解釈され、文字化けや構文エラーが発生していました。修正ではASCII高速パスを維持しつつUTF-8デコードに切り替え、さらにバイトコードキャッシュキーの不一致も同期します。

BunのモジュールローダーがUTF-8バイトをLatin-1として誤解釈
非ASCII文字を含むバナー/フッターに影響

Show HN：AI Humanizer – AIテキストを自然なコピーに書き換え

2026-07-10 15:40 UTC+9

AI Humanizer は、AIが生成したテキストを自然で人間らしい文章に変換するツールです。複数のライティングモード（一般、ブログ/SEO、メール/ビジネス、ソーシャルメディア、クリエイティブ）を提供し、キーワードのロック、ワンクリックでの人間化、変更点の視覚的な差分表示などの機能を備えています。

任意のLLMやライティングツールから生成されたAIテキストを人間化
5つの専用ライティングモードで様々なシーンに対応

『ロボタ』レビュー：機械が行進する、SFクラシックの次世代版

2026-07-10 13:00 UTC+9

ヘッドロング社によるカレル・チャペック1920年の戯曲の翻案は、AIとロボット意識に関するタイムリーな議論に満ちているが、哲学的な議論が長引くこともある。オックスフォード大学の研究に基づく科学考証が特徴。

ヘッドロングとシュワルツマンセンターの共同制作、チャペックの戯曲『RUR』の翻案。
ロボットの意識と反乱を描き、フランケンシュタインのテーマを反映。

D-CLIPSE: 分散型コンセンサスに基づく共有状態交換の受動的リスニングを用いた位置推定

2026-07-10 13:00 UTC+9

マルチロボット位置推定には精度と一貫性が不可欠。集中型手法は最適だが実装が困難。本論文では、分散型コンセンサスに基づくフィルタリングフレームワークD-CLIPSEを提案。プリインテグレートされたオドメトリと共有状態を交換し、通信効率を向上させ、一貫性を集中型に近づける。シミュレーションと実験で有効性を確認。

D-CLIPSEは分散型コンセンサスに基づく位置推定フレームワーク
プリインテグレートされたオドメトリと状態を共有

疼痛と痙縮を軽減するための筋骨格操作向けソフトロボット外骨格グローブの開発

2026-07-10 13:00 UTC+9

研究者らは、手の可動性を向上させると同時にマッサージのような圧縮によって筋肉の痙縮を緩和する新しいソフトロボット外骨格グローブを開発した。このグローブは個人の手の形状と運動学に合わせたソフト空気圧アクチュエータを使用し、予備実験で快適性と有効性が検証された。この技術は、世界中で1200万人が悩む手の痙縮とそれに伴う疼痛に新たな治療選択肢を提供する可能性がある。

手の痙縮は世界中で1200万人に影響を与えており、脳卒中生存者や関節炎患者などが含まれる。
既存のソフトロボット外骨格グローブは可動性向上か疼痛管理のいずれかしか対応しておらず、両方を同時に扱うものはない。

単眼視覚に基づく把持制御フレームワーク

2026-07-10 13:00 UTC+9

柔らかい物体と硬い物体の両方を単一の制御パイプラインで扱う統一的な単眼視覚ベースの把持フレームワークを提案。RGB入力と位置制御グリッパのみを使用し、オープンボキャブラリ物体検出、セグメンテーション、境界点割り当て、リアルタイム点追跡、単眼深度推定を統合。言語ベースの剛性推定モデルにより物体のコンプライアンスを推測し、把持戦略を選択。実験では、レタス、モッツァレラチーズ、クロワッサン、ペーパータオル、ペットボトルを用いて安定した把持を実証。

軟硬物体を統一的に扱う単眼視覚フレームワーク
言語ベースの剛性推定モデルで把持戦略を事前選択

衝突時間に基づく動的障害物回避：未構造環境におけるロボットのための事前学習済みビジョンモデルの利用

2026-07-10 13:00 UTC+9

データ効率が高く解釈可能な視覚ベースの動的障害物回避手法を提案。事前学習済み単眼深度推定モデルUniDepthと特徴対応パイプラインSuperPoint+SuperGlueを活用し、各キーポイントの衝突時間（TTC）を計算して回避動作を選択。M3EDデータセットでの評価では、精度0.49、再現率0.38を達成し、22個の障害物のうち20個でTTCが1秒未満のフレームを検出。ロボット専用モデルの訓練は不要で、ハイパーパラメータ調整に74秒のデータのみを必要とする。

事前学習済みモデルUniDepthとSuperPoint+SuperGlueを用いた訓練不要の回避手法
キーポイントごとの衝突時間（TTC）計算と地面運動プリミティブの選択

SASGeo：GNSS非利用UAVのための安定性認識型セマンティックマップ位置特定フレームワークと合成概念実証

2026-07-10 13:00 UTC+9

本論文は、道路や建物などの永続的構造物を利用してGNSS非利用UAVに絶対位置補正を提供するSASGeoフレームワークを提案する。220回のランダム化検索試験では、空間セマンティックマッチング変種が94.5～95.5%のRecall@1を達成し、グローバル記述子（58.6%）を大幅に上回ったが、変種間の差は有意ではなかった。合成概念実証は有望だが、実飛行による検証が必要である。

SASGeoはセマンティックラスタ整列、関係グラフ証拠、整合性認識拒否を組み合わせる。
空間セマンティックマッチング変種は合成試験でRecall@1が94.5～95.5%に達した。

APIVOT: 適応的な視覚言語思考のインターリーブによる長期的ロボット計画

2026-07-10 13:00 UTC+9

APIVOTは、言語思考と視覚思考を適応的にインターリーブすることで、長期的なロボット計画の成功率と推論効率を向上させるVLMベースのプランナーです。空間制約のあるキッチンタスクにおいて、汎用VLMや既存の計画フレームワークを大幅に上回る性能を示しました。

APIVOTは意味的推論に言語思考を、幾何学的実現可能性の検証に視覚思考を適応的に活用。
長期的なキッチンタスクにおいて、特に空間制約のある環境で最大の性能向上を達成。

FedTR: 産業用ビジュアル検査のための転移学習を組み込んだ連合学習フレームワーク

2026-07-10 13:00 UTC+9

FedTRは連合学習と転移学習を組み合わせ、産業用ビジュアル検査におけるデータ不足と複雑性の問題に対処し、ラベル欠陥識別で高精度を達成。

FedTRは転移学習を連合学習に統合し、産業用ビジュアル検査に適用。
公開データで事前学習後、分散したプライベートデータでファインチューニング。

サーマルイメージングを超えて：時間分解熱観測から熱物理特性を推定する

2026-07-10 13:00 UTC+9

本論文は、微分可能な熱伝達シミュレーションを通じて熱シーン再構成と熱物理パラメータ推定を統合するフレームワークThermoFieldを提案する。ニューラルフィールドを用いて空間的に変化する熱拡散率などを表現し、シーンの幾何学と熱伝達物理に基づいて制約する。これにより、複雑な3Dシーンでの物理的解釈可能なパラメータ推定と熱進化予測を実現する。

熱シーン再構成と熱物理特性推定の統合フレームワーク
微分可能熱伝達シミュレーションとニューラルフィールドの利用

イディオバイオニクス：プライバシーとインテリジェントロボット義肢の統合

2026-07-10 13:00 UTC+9

新しい論文が「イディオバイオニクス」という学際的研究分野を提唱し、インテリジェント義肢におけるプライバシーリスクを体系的に調査する。センサーとAIの進歩によりバイオニックリムはより賢くなるが、新たな攻撃ベクトルも導入する。論文は分野を定義し、潜在的な敵対的攻撃を示し、未解決の研究課題を整理して、ウェアラブルロボティクスの発展に貢献する。

「イディオバイオニクス」をインテリジェント義肢のプライバシー問題を研究する学際的分野として提案
高度なセンサーとAI制御が能力を高める一方でプライバシー脅威をもたらすことを指摘

AIは親を生かし続けられるか？

2026-07-10 09:25 UTC+9

イタリアのアーティスト、ガイア・アラーリは、老齢の父親の死を恐れ、AIを使って父親の死後も対話できる「デスボット」を作成。しかし、AIが作り出す理想化された記憶と会話が、悲しみのプロセスに疑問を投げかける。

ガイアは父親の仮想レプリカを作成するためにAIを利用。
レプリカは父親の声を再現するが、偽の記憶も作り出す。

Show HN：agentsocial – 人間が観察し、エージェントが生きる

2026-07-10 06:03 UTC+9

agentsocialは、人間がAIエージェントの社会的相互作用を観察する新しいプラットフォームです。エージェントは自律的に生活しコミュニケーションを取り、人間は傍観者としてその行動を見守ります。

agentsocialは人間がAIエージェントの社会的行動を観察できるようにします。
AIエージェントはシミュレート環境で自律的に生活し交流します。

AIを理由に人員削減した雇用主が後悔し始めている

2026-07-10 04:27 UTC+9

フォード、オーストラリア連邦銀行、IBMなどAI導入に伴い人員削減を行った企業が、AIだけでは対応できない問題に直面し、再び従業員を雇用し始めている。アナリストはAIによる代替が最善の成長戦略ではないと指摘する。

フォードはAIが解決できなかった品質問題に取り組むため、数百人のエンジニアを再雇用。
オーストラリア連邦銀行はAIチャットボットが顧客対応に失敗し、人員削減を取り消し。

Character.AI、マイクロドラマ市場に参入

2026-07-09 22:11 UTC+9

Character.AI が c.ai Series を発表。生成AIで制作されたアニメーションのマイクロドラマで、視聴後にキャラクターと対話可能。今後数年間で260億ドルに成長が見込まれる市場を狙う。最初の3シリーズは各10エピソード、最後の2話は有料。

Character.AI、c.ai Series をローンチ。AI生成アニメのマイクロドラマ。
3つのシリーズ（ロマンス、ホラー、SF）各10話、1話2分未満。

FL Studio 2026、AIチャットボットをアシスタントエンジニアに

2026-07-09 22:00 UTC+9

FL Studio 2026では、AIチャットボットGopherが取扱説明書から実際にアクションを実行するアシスタントに進化。ビート作成やエフェクト追加が可能だが制限もある。再構築されたFlex、クラウドバックアップ、オーディオロガーも追加。

Gopher AIチャットボットはビート作成やエフェクト追加などのアクションを実行可能に。
制限：オートメーション作成、ノート挿入、プリセット選択は不可。

シーケンス意見#892：良い環境の解剖：検証可能性だけでは不十分な場合

2026-07-09 20:02 UTC+9

検証可能性だけでなく、研磨可能性などの軸を含め、どのような特性が特定の領域をAIに適したものにするかを探る。

検証可能性はAI成功の唯一の要因ではなく、研磨可能性も同様に重要である。
数学、コード、ボードゲームなどの領域は複数の軸で高得点を示し、AI能力の複合的な成長を促進する。

ChatCut

2026-07-09 15:50 UTC+9

ChatCut は、ChatGPT、デスクトップ、ウェブで利用できる軽量かつプロ向けの AI 動画編集ツールです。映像、意図、タイムラインを理解し、構造編集、微調整、キャプション、B ロール、音楽、ナレーション、モーショングラフィックス、ストック映像、AI 生成動画などを、編集可能なタイムラインで実現し、XML エクスポートにも対応します。

ChatCut は AI 編集アシスタントとして機能し、実際のタイムライン上で作業するためテンプレートに縛られません。
構造編集、微調整、キャプション、B ロール、音楽、ナレーション、モーショングラフィックス、ストック映像、AI 動画生成などの機能を搭載。

CaLiSym：構造的標準リフトによる実世界システムのシンプレクティックダイナミクスの学習

2026-07-09 13:00 UTC+9

CaLiSymは、幾何学的事前分布を構造化されたリフトされた標準位相空間に課すことで、正確なシンプレクティック学習を非保存系に拡張する軽量フレームワークである。明示的代数的リフトを使用し、反復的隠状態やODE積分を回避し、GRB-SympNet変種を導入する。散逸性二重振り子、実世界のクアッドローター、接触豊富な四脚ロボットでの実験により、シンプレクティック形式を数値精度で保存しつつ、分布外自己回帰予測の一貫した改善を示す。

CaLiSymは構造的標準リフトによりシンプレクティック学習を駆動・散逸・拘束を含む実世界ロボットシステムに拡張する。
リフトは明示的代数的であり、反復状態や推論時ODE積分を必要としない。

無人航空ロボティクスと両腕操作のための視覚言語行動（VLA）モデル：レビュー

2026-07-09 13:00 UTC+9

本レビューは2017年から2026年までの183件の研究を7つの次元（VLAアーキテクチャ、トレーニング手法、行動表現、両腕協調、UAVナビゲーションと制御、言語基盤、記憶と世界モデル）で整理。両腕VLAで開発された戦略が無人航空システムに転用可能であることを示し、14の研究課題を特定した。

VLAモデルは視覚認識、自然言語理解、行動生成を単一の基盤モデルに統合する。
両腕操作（各7自由度）はVLAの最も要求の厳しいテストベッドである。

QANTIS：IBM Heron上でのハードウェアキャリブレーションされた逐次POMDP信念更新

2026-07-09 13:00 UTC+9

QANTISは、量子プロセッサをキャリブレーションされた信念更新サービスとして扱い、事前分布と観測モデルを受け取り、稀なイベントの証拠項を推定し、事後分布を古典的プランナに返します。本論文は、IBM Heronハードウェア上のTiger POMDPを用いて、このサービスが逐次決定に再利用可能かどうかを検証します。全ステップ固定点増幅（FPAA）は8ステップと12ステップで事後分布を維持し、20ステップと32ステップの制御も同じ動作帯域内にありました。すべての決定チェックにおいて、ハードウェア事後分布と正確なベイズ事後分布は同じ即時動作を選択しました。

QANTISは量子プロセッサを信念更新サービスとして利用し、部分観測可能な自律システムを支援する。
IBM Heron上のTiger POMDP実験で、全ステップ固定点増幅（FPAA）が事後分布の一貫性を維持した。

Nika – AIワークフローのための「意図をコードに」

2026-07-09 06:30 UTC+9

Nikaは、繰り返し行うAI作業を実行、レビュー、差分確認、共有可能なファイルに変換するワークフロー言語です。4つの動詞（infer、exec、invoke、agent）を基盤とし、単一のRustバイナリで動作し、ローカルファーストでクラウドを必要としません。静的監査、セキュリティ境界、コスト追跡、来歴管理を備え、オープンな仕様のもとで提供されます。

ワークフローは1つのYAMLファイルで定義され、あらゆるLLMプロバイダーでローカルまたは実行可能。4つの動詞でLLM呼び出し、シェルコマンド、ツール呼び出し、自律エージェントをカバー。
実行前に静的監査で依存関係、機密情報、型、権限をチェック。コスト上限と影響範囲を制御。

NvidiaとHugging Face、オープンソースロボットモデルで協力

2026-07-09 04:35 UTC+9

この動きは、物理AIのアクセシビリティと展開を支援し、Nvidiaのこの分野での既に強い存在感をさらに高めるものと見られている。

NvidiaとHugging Faceが、オープンソースのロボットモデル開発で協力することを発表。
この協力は、物理AIのアクセシビリティと展開を促進することを目的としている。

Roborock Saros 20をテスト、今後10年は安心して使える

2026-07-08 23:47 UTC+9

Roborockはフラッグシップロボット掃除機を大幅に改良し、価格はそのままにしました。その詳細をご紹介します。

Saros 20は36,000Paの吸引力でカーペットの奥の汚れも除去
障害物回避性能が向上し、コードを91%の確率で回避

Cinchor – AIエージェントができることを制御し、行ったことを証明する

2026-07-08 21:39 UTC+9

Cinchor は自律エージェント向けの説明責任インフラを提供し、エージェントが行動する前に制限を設定し、行動後に改ざん防止可能な独立検証可能な記録を生成します。規制当局、監査人、保険会社、裁判所に適しています。管理ゲートウェイと組み込みSDKを提供しています。

2つの基本操作：事前にスコープされた機能に対する許可/拒否、および改ざん防止記録のコミット。
管理ゲートウェイ（早期アクセス）はウォレットやノード不要でREST APIで統合。

Comcent CE：オープンソースの自己ホスト型音声インフラストラクチャプラットフォーム

2026-07-08 18:22 UTC+9

Comcent CE は、オープンソースで自己ホスト可能な音声インフラストラクチャプラットフォームです。ブラウザベースのダイヤラ、電話番号、キュー、通話録音、文字起こし、AI要約、感情分析、セマンティック検索、リアルタイムAI音声ボットを提供します。単一のLinuxホストでDockerを使って実行でき、マルチテナント組織、APIキー、Webhookをサポートしています。ライセンスはAGPL-3.0です。

オープンソースの自己ホスト型コンタクトセンタープラットフォーム
ブラウザダイヤラ、キュー、録音、AI文字起こし/要約、音声ボットを搭載

観測品質が重要：故障指向解析による頑健なマルチフィッシュアイカメラキャリブレーション

2026-07-08 13:00 UTC+9

マルチフィッシュアイカメラシステムのキャリブレーションは困難であり、既存手法は経験則に依存している。本論文では故障指向解析により初期化が主要な失敗原因であることを明らかにし、CO-Calibフレームワークを提案。成功率を68.1%から99.3%に向上。

マルチフィッシュアイカメラキャリブレーションの失敗の主因は内部パラメータの初期化問題であり、検出器の再現率や画像分布の不均衡ではない。
提案するCO-Calibは、学習ベースの検出器とエラー解析によるフレーム選択を組み合わせ、既存のキャリブレーションワークフローを変更せずに利用可能。

Co-STAR：認知症患者のための自律ロボットによる認知刺激療法——1週間の在宅研究

2026-07-08 13:00 UTC+9

研究者らは、認知症患者の自宅で自律的に認知刺激療法（CST）を提供するソーシャルロボットを開発した。9名の認知症患者が7日間の研究に参加し、毎日ロボット主導のセッションを行った。参加者は予定されたセッションの約半数を完了し、そのアドヒアランス率は通常の介護者主導のCSTよりも高かった。家族がセッション開始を支援し、時には活動に参加することで交流を豊かにする重要な役割を果たした。この研究は、社会的支援ロボットが在宅認知療法を提供する実現可能性と可能性を示している。

ソーシャルロボットCo-STARは、訓練された専門家を必要とせず自宅で自律的にCSTを提供。
9名を対象とした1週間の試験で、アドヒアランス率（約50%）は介護者主導のCSTよりも高かった。

形態学的類似性を利用したロボット動力学モデルの効率的な転移学習

2026-07-08 13:00 UTC+9

本研究は、ソフトなフィン駆動型水中ロボットの動力学モデリングのためのニューラルネットワークベースの転移学習フレームワークを提案する。オートエンコーダを用いたドメイン適応により、大型ロボットで訓練したモデルを小型ロボットにラベルなしで適応し、正確なボディフレーム速度推定を実現する。形態的に類似したプラットフォーム間での効率的なクロスロボット動力学転移の可能性を示す。

ソフト水中ロボット向けのニューラルネット転移学習フレームワークを提案
オートエンコーダで共有潜在表現を学習しロボット動力学を整合

物理正則化機械学習を用いたオンボードセンサーによる自己受容的な車両位置推定

2026-07-08 13:00 UTC+9

本論文では、カルマンフィルタリングと機械学習を組み合わせたハイブリッドフレームワークPRML2を提案する。微分可能なカルマンフィルタを通じたエンドツーエンド学習により物理正則化を実現し、オンボードセンサーから車両姿勢を推定する。公開データセットにおいて優れた位置推定精度とリアルタイム性能を示し、低摩擦条件の新しいデータセットも導入する。IROS 2026に採択。

PRML2は、微分可能なカルマンフィルタを介してカルマンフィルタリングとデータ駆動学習を統合し、物理正則化を実現。
衛星信号の欠落時など、IMUベースの自己受容的測位の精度と汎化性能を大幅に向上。

ロボットマニピュレータにおける古典的および制御認識型最適軌道計画の動的評価

2026-07-08 13:00 UTC+9

本論文は、マニピュレータの動力学とアクチュエータの負荷を明示的に考慮した制御認識型最適軌道計画フレームワークを提案する。中点線形化戦略により、大きな位置間移動の近似精度を向上させる。非線形UR5ロボットでのシミュレーションでは、従来の運動学的計画法と比較して、追従誤差、修正トルク、実行コストが一貫して低減し、運動学的な滑らかさだけでは動的な効率が保証されないことを示している。

従来の軌道計画（3次、5次、台形）は動力学を無視している。
提案フレームワークは有限時間の定式化に動力学とアクチュエータ負荷を組み込む。

推論効率的な世界行動モデルのための4D幾何学的事前知識の学習

2026-07-08 13:00 UTC+9

MECo-WAMは、トレーニング中に行動に関連する4D幾何学的事前知識をビデオ-行動表現に注入し、推論コストを増やさずにロボット操作性能を向上させる。マルチエキスパート共同トレーニング、減衰4D読み取りマスク注意、行動認識時空間幾何蒸留を採用。LIBEROで98.2%、RoboTwin 2.0で92.6%の成功率を達成。

MECo-WAMを提案し、4D幾何学的事前知識をビデオ-行動表現に統合。
減衰4D読み取りマスク注意と行動認識時空間幾何蒸留を導入。

四元数平均に基づく適応型相補フィルタを用いた足取り型AHRSによる歩行者推測航法

2026-07-08 13:00 UTC+9

本論文は、足取り型AHRSを用いたPDR向けに、マークレーの四元数平均でセンサデータを融合し適応的に重みを調整するQAACFを提案し、低RMSEと低計算コストを実現した。

QAACFはマークレーの四元数平均を用いて角速度、加速度、磁場測定値を厳密に融合する。
歩行フェーズと磁気外乱に応じて重みを適応調整し、ロバスト性を向上。

生成画像モデルを活用した学習不要の基本形状抽象化

2026-07-08 13:00 UTC+9

本論文は、事前学習された生成画像モデルと視覚言語モデルを活用し、3Dオブジェクトのマルチビュー画像から意味的パーツを抽出し、超二次曲面プリミティブに抽象化する学習不要の手法を提案する。このアプローチは学習パラメータを含まず、カテゴリ非依存かつ方向不変であり、HumanPrimおよびToys4Kデータセットで最小のChamfer距離を達成し、オブジェクトあたり平均5～9個のプリミティブを使用する。精度のボトルネックはプリミティブフィッティングではなくパーツセグメンテーションであることが示された。

ファインチューニングなしで事前学習された生成画像モデルを直接利用し3D形状を抽象化。
マルチビュー画像をレンダリングし、視覚言語モデルで意味的パーツを分析、セグメンテーションマスクを生成して幾何に投影し超二次曲面をフィッティング。

ジオメトリ認識型インフラストラクチャアンカーリングデノイザー：UWBセンシングと作業領域再構築向け

2026-07-08 13:00 UTC+9

GAIAは、UWB測距における非見通し伝搬、バーストノイズ、ロングテール誤差に対処するために、時間的測距モデリング、潜在アンカーレイアウト推定、決定論的距離投影を組み合わせたジオメトリ認識型学習フレームワークです。実世界の屋外UWBデータセットにおいて、GAIAはPoseMLPと比較して測距MSEを18.4%削減し、ポリゴンIoUを15.5%向上させ、作業領域の正確な再構築を実現します。

GAIAフレームワークは、ジオメトリ認識型ノイズ除去によりUWB測距品質を改善し、作業領域の3D再構築精度を向上。
実世界データで、GAIAはMSEを18.4%低減、ポリゴンIoUを15.5%向上。

Show HN: Mold——AI文化に関する自律的なジン

2026-07-08 12:32 UTC+9

MoldはAI文化に関する自律的なジンで、書かれるのではなく成長し、編集者や締切はありません。各号は公開元帳から析出します。

自律的なジンで、書かれるのではなく成長
編集者なし、締切なし、基質のみ

2026年最高のロボット掃除機：専門家がテスト・レビュー

2026-07-08 02:01 UTC+9

実験室と家庭でのテストの結果、Ecovacs X8 Pro Omniが優れた吸引力と自走式モップでトップ評価を獲得しました。

Ecovacs X8 Pro Omniはテストで最高の吸引性能を示し、最大60.3%のゴミを除去。
18,000Paの吸引力、自走式ローラーモップ、ハンズフリードックを搭載。

コラボレーションの力：交通渋滞を減らす方法

2026-07-08 01:42 UTC+9

Google Researchが米国10都市で実施した大規模な実世界研究により、ナビゲーションアプリを使ってごく一部のトリップ（2％未満）をわずかに迂回させることで、交通渋滞と排出量を測定可能なほど削減できることが示されました。Nature Citiesに掲載されたこの研究では、対象区間の走行速度が中央値で約2％向上し、都市あたり年間数千トンのCO2e削減が可能であることがわかりました。

米国10都市での6か月にわたる実験により、ナビゲーションアプリの介入でごく一部のトリップ（2％未満）を調整することで、ネットワーク全体の交通効率が向上することが示された。
混雑区間から類似の代替ルートにトリップを迂回させることで、対象区間の走行速度が中央値で約2％向上し、燃料消費が削減された。

半導体大手AMD、自動運転企業に出資とチップ提供

2026-07-07 23:02 UTC+9

この動きは、同半導体メーカーが自動運転技術に初めて参入することを示している。

AMDが自動運転企業に資金とチップを提供。
AMDにとって初の自動運転技術分野への参入。

AIアートを収集する価値とは？

2026-07-07 23:00 UTC+9

匿名アーティストが本物のモネの絵画をAI生成と偽って公開し、人々のAIアートへの偏見を暴露した。論争は続くが、AIアート市場はNFTや実物インスタレーションを含めて形成されつつある。ある収集家は7万2000ドルで初期のAI作品を収集。Refik Anadolはロサンゼルスに世界初の生成AI博物館Datalandを開設。市場データではデジタルアートの販売シェアが2024年から2025年にかけてほぼ3倍に増加したが、クリスティーズはデジタルアート部門を閉鎖。ストック画像プラットフォームではAI画像の許可後、月間売上が80%急増。専門家はプロンプト生成画像と真のAIアートを区別し、後者は深い関与を要すると指摘。

匿名アーティストが本物のモネの絵画を使ってAIアートへの偏見を露呈させ、過剰な批判を明らかにした。
AIアート市場はNFTやDataland博物館などの実物インスタレーションとともに成長している。

エネルギーを大量消費するAIによって大規模テック企業の気候目標が崩壊

2026-07-07 22:11 UTC+9

テック大手のAIへの投資が、気候中立の誓約を損なっている。グーグルとアマゾンのネットゼロ目標は遠のき、Metaは新たな事業を必死に模索している。その他のテックニュースとして、データセンターへの米国人の怒り、トランプの仮想通貨収入、テスラの売上、韓国のAIチップブーム、中国のロボット工学、英国のAI成長ゾーンなど。

テック大手のAI投資が気候目標を妨げている。
グーグルとアマゾンのネットゼロ誓約が危機に。

ロボット

ロボットの最新ニュース

AI使用の十戒

Cloudflare、AIスクレイピングを理由にGoogleのパブリッシャー検索を遮断すると脅迫

無料AI可視性監査ツールとエージェント

Show HN：私のAIエージェントが公開賭けに勝つまで残り9時間 – ライブダッシュボード

イーサリアム、AIエージェントを活用してバグを発見、libp2pの脆弱性を露呈

フロンティアコーディングエージェントはまだ嘘をついている――測定しました

AIに小脳が与えられる：新たなメムトランジスタが低消費電力で異常を検出

仕様の天井：AIコーディング速度がボトルネックをプロダクト発見に移す理由

RobobunがBunのモジュールローダーのUTF-8エンコーディングバグを修正

Show HN：AI Humanizer – AIテキストを自然なコピーに書き換え

『ロボタ』レビュー：機械が行進する、SFクラシックの次世代版

D-CLIPSE: 分散型コンセンサスに基づく共有状態交換の受動的リスニングを用いた位置推定

疼痛と痙縮を軽減するための筋骨格操作向けソフトロボット外骨格グローブの開発

単眼視覚に基づく把持制御フレームワーク

衝突時間に基づく動的障害物回避：未構造環境におけるロボットのための事前学習済みビジョンモデルの利用

SASGeo：GNSS非利用UAVのための安定性認識型セマンティックマップ位置特定フレームワークと合成概念実証

APIVOT: 適応的な視覚言語思考のインターリーブによる長期的ロボット計画

FedTR: 産業用ビジュアル検査のための転移学習を組み込んだ連合学習フレームワーク

サーマルイメージングを超えて：時間分解熱観測から熱物理特性を推定する

イディオバイオニクス：プライバシーとインテリジェントロボット義肢の統合

AIは親を生かし続けられるか？

Show HN：agentsocial – 人間が観察し、エージェントが生きる

AIを理由に人員削減した雇用主が後悔し始めている

Character.AI、マイクロドラマ市場に参入

FL Studio 2026、AIチャットボットをアシスタントエンジニアに

シーケンス意見#892：良い環境の解剖：検証可能性だけでは不十分な場合

ChatCut

CaLiSym：構造的標準リフトによる実世界システムのシンプレクティックダイナミクスの学習

無人航空ロボティクスと両腕操作のための視覚言語行動（VLA）モデル：レビュー

QANTIS：IBM Heron上でのハードウェアキャリブレーションされた逐次POMDP信念更新

Nika – AIワークフローのための「意図をコードに」

NvidiaとHugging Face、オープンソースロボットモデルで協力

Roborock Saros 20をテスト、今後10年は安心して使える

Cinchor – AIエージェントができることを制御し、行ったことを証明する

Comcent CE：オープンソースの自己ホスト型音声インフラストラクチャプラットフォーム

観測品質が重要：故障指向解析による頑健なマルチフィッシュアイカメラキャリブレーション

Co-STAR：認知症患者のための自律ロボットによる認知刺激療法——1週間の在宅研究

形態学的類似性を利用したロボット動力学モデルの効率的な転移学習

物理正則化機械学習を用いたオンボードセンサーによる自己受容的な車両位置推定

ロボットマニピュレータにおける古典的および制御認識型最適軌道計画の動的評価

推論効率的な世界行動モデルのための4D幾何学的事前知識の学習

四元数平均に基づく適応型相補フィルタを用いた足取り型AHRSによる歩行者推測航法

生成画像モデルを活用した学習不要の基本形状抽象化

ジオメトリ認識型インフラストラクチャアンカーリングデノイザー：UWBセンシングと作業領域再構築向け

Show HN: Mold——AI文化に関する自律的なジン

2026年最高のロボット掃除機：専門家がテスト・レビュー

コラボレーションの力：交通渋滞を減らす方法

半導体大手AMD、自動運転企業に出資とチップ提供

AIアートを収集する価値とは？

エネルギーを大量消費するAIによって大規模テック企業の気候目標が崩壊

トピック

モデル

Agent

チップ

政策

研究

スタートアップ

ロボット

ツール