AI News HubLIVE
公開記事 19収集記事 23信頼度 92更新頻度 30 分
稼働状態 正常ソース種別 研究全文利用権限 公式全文最終取り込み 2026-06-26ID google-research-blog状態 有効

Official research blog; confirm reuse terms before enabling full body display.

最新公開記事

Pixel上で凍結マルチトークン予測を用いたGemini Nanoモデルの高速化

Googleの研究者は、デプロイ済みのGemini Nano v3モデルにマルチトークン予測(MTP)を導入し、バックボーンの再トレーニングなしにモバイルデバイスでの推論速度向上と消費電力削減を実現しました。Pixel 9および10シリーズに適用され、AI通知要約や校正機能で速度が50%以上向上しています。

  • バックボーンを凍結し、軽量なMTPヘッドを追加することで、別個のドラフターモデルのメモリオーバーヘッドなしにシームレスな高速化を実現。
  • ゼロコピーアーキテクチャにより、MTPヘッドがメインモデルのKVキャッシュを直接利用でき、メモリ使用量を130MB削減し、ドラフトプリフィルレイテンシを排除。
サイト内本文

クラウド経済を最適化する線形弾性キャッシング

Googleの研究者は、キャッシュ管理をスキーレンタル問題として捉え、軽量機械学習でメモリ使用量とキャッシュミスのトレードオフを最適化する線形弾性キャッシングを提案。Spanner本番環境でメモリ使用量15.5%削減、総所有コスト約5%削減を達成。

  • 線形弾性キャッシングはメモリコストを連続変数として扱い、キャッシュサイズを動的に調整。
  • スキーレンタル問題に基づき、各データ項目に対して「レンタル」か「購入」(キャッシュミス)を判断。
サイト内本文

思考は想起を促す:推論がLLMのパラメトリック知識をどのように引き出すか

Google Researchの研究により、単純な事実質問に対しても推論チェーンを生成することで回答精度が向上するという直感に反する現象が明らかになった。2つのメカニズムが特定された:計算バッファ(余分なトークンが追加の計算を提供)と事実プライミング(関連事実の生成が検索を促進する)。

  • 推論は、複雑な手順を必要としない単純な事実の想起にも役立つ。
  • メカニズム1:計算バッファ——無意味な推論トークンでも追加計算により想起が改善。
サイト内本文

AIが皮膚の状態理解を支援する研究

Google Researchが皮膚科AIツールに関する2つの研究を発表。大規模調査ではAI支援によりユーザーが皮膚状態を特定する正確性が3倍近く向上したが、次のステップの判断には改善が見られなかった。地域コミュニティでの定性研究では、アプリがユーザーと臨床医の会話を促進し、92%の臨床医が有用と評価した。

  • AI支援により、ユーザーが皮膚状態を正確に命名する率が8%から23%に約3倍向上。
  • 適切な次の行動(家庭療法か受診か)の判断に関しては有意な改善は見られなかった。
サイト内本文

機械学習の忘却監査のための新しいフレームワーク

Googleの研究者が、機械学習モデルの忘却とプライバシー保護を監査するための「正則化f-ダイバージェンスカーネル検定」フレームワークを提案。適応的に最適なダイバージェンスを選択し、データ漏洩や忘却の失敗をより感度高く検出でき、必要なサンプル数やチューニングが少ない。

  • 従来の二標本検定は大規模モデルで性能低下、新しいフレームワークはより高感度で適応的。
  • f-ダイバージェンス(カイ二乗、KL、ホッキースティック)を利用し、大域的・局所的なデータシフトを検出。
サイト内本文

Gemini Enterprise Agent PlatformのエージェンティックRAGで信頼性の高い応答を実現

Google ResearchとGoogle Cloudが共同で開発したエージェンティックRAGフレームワークは、複数のエージェントが協調して複雑な企業クエリを分解し、十分なコンテキストを反復検索してから信頼性の高い応答を生成します。標準RAGと比較して最大34%の精度向上を達成。

  • 計画、書き換え、ルーティングを行うマルチエージェントアーキテクチャ
  • Sufficient Context Agentがコンテキストが完全になるまで検索を継続
サイト内本文

スマートフォンカメラによるパッシブな心臓健康モニタリングへの取り組み

Google Researchのチームは、スマートフォンのフロントカメラを使って日常使用中に心拍数と安静時心拍数をパッシブに測定するシステムPHRMを開発しました。Nature誌に発表された研究では、心拍数の平均絶対パーセント誤差(MAPE)が心電図(ECG)と比較して10%未満、日次の安静時心拍数の平均絶対誤差(MAE)がウェアラブルデバイスと比較して5 bpm未満という精度を達成。システムは、約700名の参加者から収集した35万本以上のビデオクリップからなる多様なデータセットでトレーニングされ、肌色のバランスが確保されています。PHRMは15の主要な遠隔光電容積脈波法(rPPG)モデルを凌駕し、実環境で全肌色に対して精度基準を満たした唯一のモデルです。

  • GoogleのPHRMシステムは、スマートフォンのフロントカメラを利用し、顔認証後にパッシブに心拍数と安静時心拍数をモニタリングする。
  • Nature研究で、PHRMは全肌色において心拍数MAPE <10%(ECG比)、日次安静時心拍数MAE <5 bpm(ウェアラブル比)を達成。
サイト内本文

イノベーションの新時代:Google ResearchがI/O 2026で発表

2026年のGoogle I/Oで、Google Researchは科学発見、健康、エッジコンピューティング、気象予測における画期的な技術を発表。Gemini for Science(ERA、Co-Scientist)、Google Healthアプリ、Symptom AI、AMIE、Coral NPU、AIによる極端気象予測など、人間の創意工夫を増幅するAIの可能性を示した。

  • GoogleはERAとCo-Scientistを含むGemini for Scienceを発表し、科学発見を加速。
  • 健康分野ではGoogle Healthアプリ、Symptom AI、AMIEが医療を変革。
サイト内本文

実証研究アシスタント(ERA):Nature論文から計算による発見を促進へ

本日Natureに掲載されたERAは、Geminiを使って科学的コードを作成・最適化するAIツールで、複数のベンチマークで専門家レベルの性能を達成。Computational Discoveryプロトタイプを構築し、Google Labsのテストプログラムで提供開始。疫学、水文学、CO2マッピング、太陽エネルギー、小売予測などに応用。

  • ERAはGeminiを活用し、科学者のコード作成・最適化を支援。反復テストの負担を軽減。
  • Nature論文では、ゲノミクス、公衆衛生、神経科学などで専門家レベルの成果。
サイト内本文

グローバルなパートナーシップとオープンリソースによる科学へのインパクトの触発

Google Research は、オープンサイエンスの原則に基づき、オープンソースソフトウェアとデータセットを通じて世界中の研究コミュニティと協力し、ゲノミクス、神経科学、気候、生物多様性、ヘルスケアなどの分野で画期的な発見を推進しています。本記事では、DeepVariant、Neuroglancer、Open Buildings、SpeciesNet、HAI-DEF などのツールと、その実際の応用例を詳述し、オープンサイエンスがどのように世界中の研究者をエンパワーし、ポジティブな社会的影響を生み出しているかを示しています。

  • Google Research は多数の世界的機関と協力し、オープンサイエンスを推進しています。
  • オープンツールとデータセットは、ゲノミクス、神経科学、気候、生物多様性、ヘルスケアなど、複数の科学分野で25万人以上の研究者を支援しています。
サイト内本文

Google Researchの科学者による実証研究支援の4つの活用方法

2025年秋に実証研究支援(ERA)を導入して以来、Google Researchの科学者たちは、疫学、宇宙論、大気モニタリング、神経科学の実際の問題にこれを適用し、科学的発見を加速するAIの変革力を実証しています。

  • ERAはインフルエンザ、COVID-19、RSVの入院予測においてCDCのツールに匹敵またはそれを上回る精度を達成。
  • ERAとGemini Deep Thinkの組み合わせにより、宇宙ひもからの重力放射の未解決問題を解決。
サイト内本文

角度がすべて:写真を再構築する

Google PhotosのAuto frame機能は、機械学習モデルを使って写真を3Dシーンとして解釈し、自動的にカメラアングルを調整して新しい視点を生成します。2段階の手法(3D点群推定と生成インペインティング)により、ポートレートの遠近歪みを補正します。

  • Google PhotosがAuto frame機能を導入、AIで自動的に写真を再構築。
  • 2D写真を3Dシーンとして解釈し、カメラ角度を変更して新たな視点を生成。
サイト内本文

ReasoningBank: エージェントが経験から学習できるようにする

Google Cloudの研究者は、成功と失敗の両方の経験から一般化可能な推論戦略を抽出する新しいエージェント記憶フレームワーク「ReasoningBank」を提案し、展開後の継続的な学習を可能にします。Webおよびソフトウェアエンジニアリングのベンチマークでベースラインを上回る成果を上げました。

  • ReasoningBankは過去の経験からタイトル、説明、内容からなる構造化記憶を抽出します。
  • メモリ対応テスト時スケーリング(MaTTS)により、並列および逐次スケーリングで性能をさらに向上。
サイト内本文

現実世界のための合成データセット設計:メカニズムデザインと第一原理からの推論

GoogleはSimulaフレームワークを発表。合成データ生成をデータセットレベルのメカニズムデザインとして捉え、推論優先のアプローチにより、カバレッジ、複雑性、品質を細かく制御し、プライバシーに敏感な専門領域でのスケーラブルな生成を実現する。

  • Simulaは合成データ生成をデータセットレベルのメカニズムデザインとして再定義する。
  • 生成プロセスをグローバル多様化、ローカル多様化、複雑化、品質チェックの4つの制御可能な軸に分解する。
サイト内本文

AI生成の合成ニューロンが脳マッピングを加速

Google Researchチームは、AIを用いて合成ニューロン形態を生成するMoGenモデルを開発し、脳再構築のエラー率を4.4%低減しました。マウス全脳規模では、157人年の手動校正を節約できます。

  • MoGenは点群フローマッチングによりリアルな3Dニューロン形状を生成し、訓練データを強化。
  • PATHFINDERモデルに10%の合成データを追加することで、再構築エラーが4.4%減少(特にマージエラーが低減)。
サイト内本文

生成AIで未来対応スキルを育成する

Google Researchとニューヨーク大学は、生成AIを活用してコラボレーションや批判的思考などの未来対応スキルを評価するシステム「Vantage」を開発しました。AIアバターとの会話をエグゼクティブLLMが動的に誘導し、評価は人間の専門家と同等の精度を示しています。VantageはGoogle Labsでサインアップ可能です。

  • Vantageは生成AIを用いたシミュレーション環境で未来対応スキルを評価する。
  • エグゼクティブLLMがAIアバターを誘導し、特定のスキルを引き出すチャレンジを導入する。
サイト内本文

ConvApparel:ユーザーシミュレーターのリアリティギャップを測定し埋める

Google Researchは、LLMベースのユーザーシミュレーターにおけるリアリティギャップを定量化し、堅牢な対話エージェントのトレーニングを改善するためのデータセットと評価フレームワークConvApparelを発表しました。デュアルエージェントデータ収集と三本柱の検証により、データ駆動型シミュレーターがプロンプトベースを凌ぐが、ギャップは残ることが示されました。

  • ConvApparelは、親切なエージェントと非協力的なエージェントを用いた4000以上の人間-AI対話を含む。
  • 評価フレームワークは、人口統計的整合性、人間らしさスコア、反実仮想検証の三本柱で構成。
サイト内本文

学術ワークフローの改善:図表作成と査読を向上させる2つのAIエージェントの紹介

Google Cloudの研究チームは、高品質な学術図表を自動生成するPaperVizAgentと、厳格な論文査読を自動化するScholarPeerという2つの革新的なAIエージェントを発表しました。これらのシステムはマルチエージェント協調と反復最適化により、各タスクで既存のベースラインを大幅に上回り、科学研究プロセスに実質的な改善をもたらします。

  • PaperVizAgentは、学術テキストから出版可能な図表(方法論図や統計プロットなど)を生成するマルチエージェントフレームワークです。
  • ScholarPeerはシニア研究者の査読プロセスを模倣し、コンテキスト取得と能動的検証を通じて深い文献に基づくレビューを生成します。
サイト内本文

LLMにおける行動傾向のアライメント評価

Google Researchは、心理学的質問票を状況判断テストに変換し、LLMの行動傾向と人間のコンセンサスとの整合性を定量化するフレームワークを提案。25のモデルをテストした結果、高いコンセンサスシナリオでは良好な性能を示すが、コンセンサスが低いシナリオでは過剰な自信を示し、人間の意見の多様性を反映できないことが明らかになった。

  • 新しいフレームワークは、心理学的質問票を状況判断テストに適応させ、現実的なシナリオでLLMの行動傾向を評価する。
  • 25のLLMは人間のコンセンサスが満場一致の場合にほぼ完璧なアライメントを示すが、コンセンサスが90%未満では80%程度に低下する。
サイト内本文

全ソース