AI News HubLIVE

最新ニュース

NVIDIA Research、ロボット工学をシミュレーションから現実世界へ前進させる

ICRAで、NVIDIA Researchは28本の論文のうち8本を発表し、シミュレーションから現実への転送が、ロボットが動的で予測不能な環境で知覚、推論、計画、行動することを可能にする方法に焦点を当てました。ScheduleStream、COMPASS、Grasp-MPC、SPARRなどの手法は、マルチアーム協調、ナビゲーション、把持、組立タスクにおいて成功率とロバスト性を大幅に向上させます。

  • NVIDIAはICRAでシミュレーションから現実への転送に関する8本の論文を発表
  • マルチアーム協調、クロスロボットナビゲーション、新物体把持、精密組立、視覚言語行動モデルを含む手法
サイト内本文

Cloudflareのデータプラットフォームとその上のAIエージェントの構築方法

Cloudflareは毎秒10億以上のイベントを処理するが、データは分散してアクセスが困難だった。そこで、統合分析プラットフォーム「Town Lake」と、自然言語で質問し監査可能な回答を得られるAIエージェント「Skipper」を構築した。本記事では、プラットフォームのアーキテクチャ、ガバナンス(デフォルトクローズ)、AIエージェントの仕組みを詳述する。

  • Cloudflareはデータの分散問題を解決するため、統合データプラットフォーム「Town Lake」とAIエージェント「Skipper」を構築。
  • Town LakeはTrino、R2、Icebergを使用したデータレイクハウスアーキテクチャを採用。
サイト内本文

iPhoneユーザーですが、車内ではGeminiとAndroid Autoの方がSiriより優れています - その理由

iPhoneユーザーの筆者は通常、運転中にSiriを使っていますが、Android AutoでGeminiを試したところ、メール送信、レストラン情報の取得、ゲームなど、より多くのタスクを処理でき、設定も簡単でした。Geminiはワンストップのアシスタントとして優れていると結論づけています。

  • 筆者はiPhoneユーザーだが、車内ではGeminiとAndroid Autoの方がSiriより優れていると感じている。
  • Geminiは基本的なコマンドから複雑なインタラクションまで幅広いタスクを処理できる。
サイト内本文

AIコーディングの真の鍵が昔ながらの退屈なものだとしたら?

この記事は、AI支援ソフトウェア開発の鍵はより良い仕様やツールではなく、小バッチと迅速なフィードバックループという昔ながらの実践にあると主張する。データは、コード生成の高速化が設計、テスト、レビューのボトルネックを生み、納期を遅らせ安定性を低下させることを示している。真のレバレッジはバッチサイズの削減とフィードバックサイクルの短縮にある。

  • AIコード生成は作成を高速化するが、設計、テスト、レビューのボトルネックを生む。
  • DORA、CircleCI、Farosのデータは、段階ゲート方式のプロセスが納期を遅らせ、リリースの安定性を低下させることを示している。
サイト内本文

Mistral、LeChatをVibeにブランド変更、チャットボットの未来は本格的なワークエージェントに

Mistral AIは、チャットボット「Le Chat」を「Vibe」に名称変更し、チャット、コーディングエージェント、新しいワークモードを1つのブランドに統合する。ワークモードはGoogle Workspace、Outlook、Slack、GitHubに接続し、メールやレポート、プルリクエストなどのタスクを自律的に処理する。Pro料金は17.99ユーロから14.99ユーロに値下げされたが、具体的な利用制限は明らかにされていない。これにより、OpenAI、Google、Anthropicのエージェント型サービスとの直接的な競争を仕掛ける。

  • Mistral AIがチャットボット「Le Chat」を「Vibe」にブランド変更、チャット、コーディングエージェント、ワークモードを統合。
  • ワークモードはGoogle Workspace、Outlook、Slack、GitHubと連携し、タスクを自律処理。
サイト内本文

OpenLoomi AIをオープンソース化した理由

OpenLoomi AIチームは、AIワークパートナーをオープンソース化する決断の背景を説明。データ所有権、透明性、コミュニティ主導の開発を重視し、ローカルファーストアーキテクチャ、クローズドソースの信頼税、AIインフラの公共化などの理念を述べている。

  • OpenLoomiはローカルファースト:ユーザーデータは暗号化されて端末に留まり、モデル学習に使用されない。
  • オープンソースにより信頼への依存が不要になり、コードの監査、フォーク、セルフホスティングが可能。
サイト内本文

Nvidia、AIインフラに台湾で年間1500億ドル投資へ

ジェンスン・フアン氏は、米国への5000億ドル投資を約束した後、台湾で年間1500億ドルをAIインフラに投じると発表。台湾がAIチップ製造とパッケージングの中心地であることが浮き彫りに。

  • Nvidiaは台湾でAIインフラに年間1500億ドルを投資する。
  • 5000億ドルの米国データセンター投資にもかかわらず、台湾が製造基盤の中心。
サイト内本文

エヌビディア、台湾に1500億ドル投資:トランプ大統領の米国AIハブ計画が裏目に

エヌビディアCEOのジェンスン・フアン氏は、トランプ政権が関税でチップ製造を米国に戻そうとする中、台湾に1500億ドルを投資しAIインフラを構築する計画だ。台湾は半導体支配力を放棄せず、米国のチップ製造能力は低いままである。

  • エヌビディア、台湾に1500億ドルの投資を発表し、AIチップの地位を強化。
  • トランプ政権、半導体関税を検討するが、米国は必要チップの約10%しか製造できない。
サイト内本文

2026年に構築すべき7つの実用的なAIプロジェクト(ガイド付き)

この記事では、求人検索、研究、投資分析、市場動向、請求書処理、チャートのデジタル化、パーソナライズされた運動トレーニングなど、実用的なワークフローを自動化する7つのAIプロジェクトを紹介します。各プロジェクトには完全なガイドとコードが付属しています。

  • AI求人検索アシスタントを構築し、求人と履歴書を自動マッチング
  • マルチエージェント研究アシスタントを作成し、出典付きレポートを生成
サイト内本文

AI集約プラットフォームが13億ドルの評価額に

このベンダーの成長は、エンタープライズAIにおけるエージェントの爆発的な出現と並行しています。

  • AI集約プラットフォームが13億ドルの評価額を達成。
  • 成長はエンタープライズAIエージェントの台頭と関連。
サイト内本文

Show HN:ローカルコーディングエージェント——LLMでツール呼び出しを小さなAIモデルに委譲

Open Agent Tools (oats) は、ローカルコードを利用したツール呼び出しを可能にするセルフホスト型AIフレームワークです。大規模モデルのトークン消費を抑えるため、ツール呼び出しを小規模モデルに委譲します。

  • oats はローカルAIモデルがローカルソースコードを使用してツール呼び出しを実行できるようにします。
  • 20,000以上のGitHubリポジトリからデータをマイニングし、再利用可能なプロンプトインデックスを作成。
サイト内本文

AIは本質的に反社会的なのか?

初期のインターネットがもたらした繋がりの感覚と、現代のAIによる孤立した体験を対比し、AIは便利なツールだが人間の代わりにはならず、真に社会的なアプリケーションが存在するのか疑問を投げかける記事。

  • 初期のウェブは「私たち」の集合的な体験を重視していたが、AIとの対話は個人で完結しがちである。
  • 著者はAIを優れたツールと見なすが、人間そのものや代わりにはならないと述べる。
サイト内本文

AIは宗教を好まない – 特にエホバの証人に対して否定的、研究が示唆

宗教大学のコンソーシアムによる研究によれば、主要なAIモデルは倫理的な質問に対して世俗的な合理主義で回答し、宗教的視点を無視する傾向がある。すべてのモデルがエホバの証人に対して否定的なバイアスを示した。

  • AIモデルは倫理的・個人的な質問に対して宗教的視点をほとんど引用せず、「省略バイアス」を示す。
  • テストされたすべてのAIモデルがエホバの証人に対して一貫して否定的なバイアスを持っていた。
サイト内本文

あなたのAIエージェントは、あなたが伝えた内容の半分をすでに忘れている

本記事はエージェンティックエンジニアリングとAI駆動開発に関するシリーズの第7回目で、AIセッションにおけるコンテキスト管理に焦点を当てています。著者はGeminiが以前のメモを忘れた個人的な経験を共有し、コンテキスト圧縮の概念を紹介し、4つの実用的なテクニックを提供します:探索と文書作成の分離、ハンドオフ文書の使用、手順ではなく受入基準の提示、仕様書をブリッジとして使用すること。これらのテクニックは開発者と一般ユーザーの両方に有効で、AIの忘却によるフラストレーションを軽減します。

  • AIアシスタントは長い会話の中で、コンテキストウィンドウの制限により初期の情報を「忘れる」ことがあり、これはコンテキスト圧縮と呼ばれる現象です。
  • 4つの実用的なテクニック:探索と文書作成の分離、ハンドオフ文書の使用、手順ではなく受入基準の提示、仕様書をブリッジとして使用すること。
サイト内本文

Show HN: Python AIエージェントとVueダッシュボードを1つのElectronアプリにパッケージ化しました

Hermes Desktopは、Pythonランタイム、hermes-agent(自己改善型AIエージェント)、hermes-web-ui(Vue 3 + Koaのチャットダッシュボード)を1つのElectronアプリにバンドルしたクロスプラットフォームデスクトップアプリです。ユーザーはPythonやNodeを個別にインストールする必要がなく、DingTalkと統合され、DeepSeekを搭載しています。

  • Pythonランタイムとhermes-agentをバンドルし、依存関係不要で動作
  • Electronシェルを使用し、hermes-web-uiフロントエンドを統合
サイト内本文

NBA、AIによる自動アウトオブバウンズ判定システムを計画

NBAコミッショナーのアダム・シルバー氏は、AIとカメラを活用した自動判定システムを導入する計画を発表した。アウトオブバウンズなどの客観的な判定を自動化し、テニスのホークアイに類似した技術で即座にボール保持を決定する。審判はファウルなどの主観的な判定を引き続き担当する。

  • NBAはAIとカメラを使用した自動アウトオブバウンズ判定システムを計画。
  • システムはテニスのホークアイに類似し、即座にボール保持を判定する。
サイト内本文

Midday – オープンソースの請求書発行、時間追跡、ファイル調整、ストレージなどのためのツール

Middayは、フリーランサーや個人事業主向けのオープンソースのオールインワンビジネスアシスタントです。時間追跡、請求書発行、ファイル管理、財務概要、AIアシスタントを統合しています。

  • フリーランサー向けに複数のビジネス機能を統合したオープンソースツール。
  • 機能: 時間追跡、請求書発行、安全なファイル保管、自動取引入力、AI洞察。
サイト内本文

Money Printer Pro – オープンソースAIコンテンツジェネレーター

Money Printer Proは、Google GeminiとVEO 3.1を搭載したオープンソースのAIコンテンツジェネレーターです。フォトリアリスティックな画像やシネマティックな動画を生成し、人物の同一性を維持します。7つのビジュアルエンジン、オートパイロットによるバッチ生成、AI品質スコアリング、公開ガードを備えています。ユーザーはGoogleに直接支払い、追加料金やサブスクリプションは不要です。

  • フォトリアリスティックな画像と8秒のシネマティック動画を生成し、人物の一貫したアイデンティティを維持。
  • 照明、影、動作、天候、衣装、シーン検証、コンテキストオーケストレーションの7つのビジュアルエンジンを統合。
サイト内本文

Meta One:ザッカーバーグ、ついにAI支出に価格を設定

MetaはInstagram、Facebook、WhatsApp向けに有料アドオンを世界展開し、別途有料AIサービスも構築中。初めてAI投資を収益化する試み。

  • Meta、Instagram、Facebook、WhatsAppで有料アドオンを世界展開。
  • 独立した有料AI製品も開発中、AI投資の収益化を目指す。
サイト内本文

DirkとLinus、AIとカーネル開発について議論

LWN.netの購読者限定記事で、Joe Brockmeierが執筆。DirkとLinusがAIとカーネル開発について議論した内容。全文は購読者向け。

  • 執筆者:Joe Brockmeier、2026年5月25日付
  • OSSNAで発表
サイト内本文

Superpowers:AIコーディングワークフローのためのエージェンティックスキルフレームワーク

Superpowersは、AIコーディングエージェント向けの完全なソフトウェア開発方法論であり、構成可能なスキルと初期指示に基づいています。テスト駆動開発、設計優先、サブエージェント駆動の反復を重視し、Claude Code、Codex CLI、Gemini CLIなどの複数のコーディングアシスタントをサポートします。

  • Superpowersは、TDD、体系的なデバッグ、コラボレーションプランニングなどのスキルライブラリを提供し、エージェントが自律的に数時間作業できるようにします。
  • ワークフローは、仕様のブレインストーミングから始まり、設計承認、実装計画の生成、サブエージェント主導の実行(2段階レビュー付き)へと進みます。
サイト内本文

信頼モデルが反転しつつある

AnthropicのClaude MythosがMozilla Firefoxで271件の脆弱性を発見した事例が示すように、ソフトウェアセキュリティの信頼基盤は人間が書いたコードからAIがレビューしたコードへと移行しつつある。AIは人間のチームでは不可能な規模で敵対的コード解釈を実行でき、信頼の根拠は「誰が書いたか」から「機械規模の精査に耐えたか」へと変化している。

  • 人間が書いたコードの安全という前提が崩れ、AIレビューへの信頼が高まっている。
  • MozillaはClaude Mythosを用いてFirefoxで271件の脆弱性を発見、従来のモデルや人間チームを大幅に上回った。
サイト内本文

Perplexity AIがUnigramトークナイザーをオープンソース化、Hugging Face tokenizers crate比5倍の低レイテンシを達成

Perplexity AIは、Rustで再実装したUnigramトークナイザーをオープンソース化し、Hugging Face tokenizers crateと比較してp50レイテンシを5倍低減、本番環境でのCPU使用率を5〜6倍削減しました。最適化には、ダブルアレイトライ、ビットマップパッキング、ヒュージページが含まれます。

  • Perplexity AIがUnigramトークナイザーをRustで書き直し、Hugging Face tokenizers crate比5倍の低p50レイテンシを達成。
  • 3つの最適化:ダブルアレイトライ、ビットマップとキャッシュラインパッキング、ヒュージページ。
サイト内本文

エージェンティックAI時代に革新者として成功するための4つの方法

アメリカン・エキスプレスのグローバルイノベーション責任者ルーク・ゲブ氏は、成功するイノベーターの4つの秘訣を紹介:学び続ける、テクノロジーに没頭する、失敗を恐れない、パートナーシップを築く。また、同社のエージェンティックコマースへの取り組みと将来予測についても語る。

  • 好奇心を持ち続け、成長マインドセットを養う
  • 新興テクノロジーを深く理解し、エンジニアと協力する
サイト内本文

アマゾンが自社AI制作プラットフォームを構築、Prime Video向けに3つのAIアニメシリーズを承認

Amazon MGM StudiosとAWSは、「GenAI Creators' Fund」を立ち上げ、映画製作者に資金と社内AIプラットフォーム「Project Nara」へのアクセスを提供します。3つのアニメシリーズがすでに制作中で、チームはパイロット版を5週間で完成させました。アマゾンは「業界で唯一のエンドツーエンドのAIコンテンツエコシステム」を持つと宣言しています。

  • アマゾンがGenAIクリエイター基金を設立、Project Naraへのアクセスを提供
  • Prime Video向けに3つのAIアニメシリーズが承認
サイト内本文

Mistral、独自チップの設計を検討とCEOが表明

Mistral AIのCEOアーサー・メンシュ氏は、インフラコスト削減のためカスタムチップの開発を検討していると認め、OpenAIやAnthropicに対抗する。また、フランスに推論専用のデータセンターを新設し、エンタープライズ向けエージェントプラットフォーム「Vibe」を発表した。

  • Mistral AIは独自カスタムチップの設計を検討し、展開コスト削減を目指す。
  • フランスに推論専用の新しいデータセンターを発表。
サイト内本文

これは持続可能か?AI時代3年後のシニアエンジニアの役割

シニアエンジニアが、AIが3年間でシニアエンジニアの役割をどのように変えたかを振り返る。プロトタイピングの高速化、調整負担の増加、スコープ拡大、メンタリングと思考時間の圧迫。役割はより強力になったが、持続可能性は低下した。

  • AIによりアイデアからデモまでのギャップが縮小し、提案からPoCへシフト。
  • コーディングと戦略的執筆の両方で役割が拡大し、メンタリングと深い思考が削られた。
サイト内本文

YouTube、AIでカスタム動画フィードを作成可能に

YouTubeは、ユーザーが説明文を入力してパーソナライズされた動画フィードを生成できる新たなAI機能を開始。現在、米国のユーザー向けに英語対応で提供中。

  • ユーザーは「10分未満のガイド付き瞑想でリラックスしたい」など、説明文を入力してカスタムフィードを作成できる。
  • この機能はSpotifyのプロンプトプレイリストやInstagramのReelsアルゴリズム制御と類似している。
サイト内本文

Taste Skill:AIエージェント向けアンチスロップフロントエンドフレームワーク

Taste Skill は、AIが生成するインターフェースのデザイン品質を向上させ、凡庸なテンプレート外観を防ぐオープンソースのフロントエンドフレームワークです。デザインチューニング、コード生成、画像生成のためのモジュール式スキルを提供し、npx コマンドまたは SKILL.md ファイルのコピーで簡単に統合できます。

  • Taste Skill は調整可能なデザインパラメータ(レイアウト、モーション、密度)でAI生成UIのセンスを向上
  • デザインチューニング、コード生成、画像生成などに特化したスキルモジュールを提供
サイト内本文