AI News HubLIVE
公開記事 44収集記事 51信頼度 82更新頻度 30 分
稼働状態 正常ソース種別 メディア全文利用権限 サイト内リライト最終取り込み 2026-06-25ID ieee-spectrum-ai状態 有効

Media source; summary-only unless authorization is obtained.

最新公開記事

銀行にチーフサイエンティストが必要な理由

プレム・ナタラジャン氏はアマゾンを離れ、キャピタル・ワンのチーフサイエンティストに就任。詐欺検出からエージェント型カスタマーサービスまで、大規模な実際の金融課題を解決するために深いAI研究を応用している。

  • キャピタル・ワンはAIを単なる導入技術ではなく、科学分野として扱っている。
  • クラウドファーストのインフラにより、大規模なAI研究が可能。
サイト内本文

AIが数学をやる時代に数学者であることの意味

本記事は、AIの数学分野での急速な進歩が伝統的な数学研究に挑戦し、数学者に自身の役割について深い反省を促すことを探る。そして、AIをツール、パートナー、またはオラクルとして扱う三つの未来を分析する。

  • AIが数学オリンピックで金メダルを獲得し、博士レベルの研究を自律的に生成
  • 数学者はAIに取って代わられることへの実存的な恐怖を感じつつ、将来の役割を議論
サイト内本文

人間が想像もできないラジオチップをAIが設計

プリンストン大学の研究者は、強化学習と逆設計を用いて、無線周波数集積回路(RFIC)をゼロから迅速に設計し、人間の設計を上回る性能のチップを記録的な時間で生み出している。AIは従来にないレイアウトを生成して性能限界を押し上げるが、さらなる進歩にはオープンデータセットが必要である。

  • RFIC設計は人間の直感と長年の経験に依存する複雑な「ダークアート」である。
  • 強化学習と逆設計を用いたAIは、ゼロからRFICを高速に設計し、記録的な性能を達成する。
サイト内本文

人工知能70周年を記念して

人工知能(AI)は1956年のダートマス会議で正式に確立されてから70年、初期のニューラルネットワークやエキスパートシステムから、現代の深層学習、大規模言語モデル、生成AIへと進化してきました。本記事ではAIの歴史、強み、リスク、そしてIEEEの貢献を振り返ります。

  • AIは1956年に正式な分野として確立されたが、その知的ルーツはさらに遡る。
  • AIは「AIの冬」と呼ばれる停滞期を経て、近年の深層学習と生成AIで新たな成長期を迎えた。
サイト内本文

IEEE、大規模言語モデルの仮想トレーニングコースを提供開始

大規模言語モデル(LLM)は研究ラボを離れ、エンジニアの日常業務に浸透しています。IEEEは、技術専門家がLLMの構築と展開を習得するための5つのコースからなるオンラインプログラムを提供します。

  • LLM市場は2030年まで年率33%で成長し、習得が技術者の中核要件になりつつある。
  • エンジニアはトランスフォーマーアーキテクチャを理解し、単なる会話ロボットとして扱うのを超える必要がある。
サイト内本文

音波がニューロモルフィックチップに脳を模倣する優位性をもたらす

ニューロモルフィックコンピューティングは脳の動作を模倣し、従来のAIチップより省エネだが、接続数はヒトニューロンに遠く及ばない。新たな研究では、音波(phi-bit)を用いた音響シナプスが生体ニューロンをより忠実に模倣し、高速かつ高効率で動作可能であることが示された。アヤメ分類では39個のパラメータで96.7%の精度を達成し、消費電力は電子ニューロモルフィックハードウェアの10分の1以下で、神経調節物質の模倣も実現した。

  • 音響ニューロモルフィックデバイスがphi-bitを利用した並列計算でシナプス可塑性を模倣
  • アヤメ分類で96.7%の精度、消費電力は従来の1/10
サイト内本文

ミュージシャンがAIトレーニングで報酬を得る方法

生成AIは音楽作品の「使用」の定義を複雑にしている。SureelやSoundVerseなどの企業は、トレーニングデータの使用状況を追跡し、ミュージシャンが作品をAIトレーニングに提供した対価を得られるようにする帰属システムを開発している。これには技術的、倫理的、政策的な課題が伴う。

  • 生成AIは従来の「使用回数に応じた課金」モデルを複雑化し、トレーニングデータの使用が不透明になっている。
  • SureelとSTIMは提携し、メディアファイルに使用指示をラベル付けし、AIトレーニングでの使用を追跡してライセンス料を設定する。
サイト内本文

視覚言語モデルがロボットに人間の感情を読み取る訓練を行う

研究者らは視覚言語モデルを用いて協働ロボットに人間の感情を読み取る訓練を行い、表情だけでなく文脈要因も考慮することで従来のAIよりも優れた性能を示した。しかし、適応的な謝罪は好まれたものの、機能的な失敗による信頼損失は修復できなかった。

  • VLMは感情認識でスコア0.86、従来AIは0.77
  • 40人中31人が感情適応型の謝罪を好んだ
サイト内本文

Google DeepMindスピンオフが隠された創薬ターゲットを追跡する方法

Google DeepMindのスピンオフであるIsomorphic Labsは、AlphaFoldを超える画期的なAIシステムIsoDDEを使用して、タンパク質上の隠れたポケットを発見し、創薬を加速させています。このシステムは、Nature誌に掲載されたcereblonのクリプティックポケットを正確に予測し、その能力を実証しました。

  • IsoDDEはAlphaFoldを超え、構造予測だけでなくタンパク質-リガンド相互作用を予測する。
  • このシステムは、Nature誌のcereblonのクリプティックポケットをタンパク質配列のみから正確に予測した。
サイト内本文

タイミングトリックでLLMトレーニングのエネルギーを最大14%削減

オランダのトゥウェンテ大学の研究者たちは、GPUカーネルごとにクロック周波数を調整することで、速度をほとんど犠牲にせずに大規模言語モデルのトレーニングエネルギーを最大14%削減できることを示しました。

  • 研究者はGPUカーネルごとに動的電圧周波数スケーリング(DVFS)を適用しました。
  • 訓練時間をわずか0.6%増加させながら、14%のエネルギー節約を達成しました。
サイト内本文

AIが世界の縮小する氷河の追跡を支援

氷河の消失速度の監視は気候変動の評価と海面上昇予測に不可欠だが、手動分析は時間がかかる。ドイツのフリードリヒ・アレクサンダー大学エアランゲン・ニュルンベルク(FAU)の研究者らは、氷河ごとに1枚の手動ラベル画像、夏の参照画像、基盤岩マップを提供するだけで、深層学習モデルのキャルビングフロント追跡誤差を1km超から70m未満に削減した。この手法はスヴァールバル諸島の全145氷河に適用され、2015~2024年の月次キャルビングフロント位置を生成。将来は北極のさらに1,500の氷河への拡大が期待される。

  • 新しい手法はわずかな追加データでAIの氷河フロント追跡誤差を1km超から70m未満に削減。
  • 夏の参照画像と基盤岩マップが精度を大幅に向上。
サイト内本文

NvidiaのAIハードウェアがRTX Spark PCでWindowsに登場

Computex 2026で、NvidiaはWindows PC向けBlackwell GB10スーパーチップ「RTX Spark」を発表。Microsoftや複数のPCメーカーが対応デバイスを発表。RTX Sparkは20個のArm CPUコア、6,144個のGPUコア、NPUを搭載し、AI、ゲーム、プロフェッショナルワークをターゲット。Nvidiaのソフトウェア優位性と業界の影響力がWindows on Armの確立に寄与する可能性があるが、x86との競争は依然として課題。

  • NvidiaがComputex 2026でRTX Sparkを発表、Blackwell GB10スーパーチップをWindows PCに提供。
  • Microsoft、Asus、Dell、Lenovo、HP、MSIがRTX Spark搭載デバイスを発表。
サイト内本文

量子コンピュータを動かすための古典的進歩

量子コンピュータはスーパーコンピュータを超える問題解決を約束するが、その動作には古典的な計算が大量に必要である。量子ビット数が増加するにつれて、較正や誤り訂正といったインフラの革新が不可欠となる。NVIDIA、Q-CTRL、IBM、Riverlane、Googleなどの企業が関連するハードウェアとソフトウェアを開発している。

  • 量子コンピュータは較正と誤り訂正に古典計算を依存する
  • 較正には「立ち上げ」と「実行時」の段階があり、現在は手動で時間がかかる
サイト内本文

なぜAIが人間に与える影響を測定しないのか?

AIシステムの能力が向上するにつれ、その性能を測定するために膨大なリソースが投入されているが、人間の認知、関係性、行動への影響については系統的な測定がほとんど行われていない。人道技術センターのイムラン・カーン氏は、AIが人間の基本的な能力を侵食する可能性を指摘し、長期的な研究、データ共有、規制の重要性を訴える。

  • AIの技術的性能測定に偏り、人間への心理社会的影響の測定が不足している
  • 10代の自殺やAI精神病などの深刻な事例がすでに発生している
サイト内本文

AIの「メモリウォール」を突破する新サーバー

AIハードウェアスタートアップのMajestic Labsは、最大128テラバイトのメモリを搭載した新しいAIサーバー「Prometheus」を開発中です。これはNvidiaのDGX B300サーバーの60倍以上です。DRAM中心のアーキテクチャを採用し、専用の銅線ケーブルメモリインターフェースとカスタムメモリ集約チップにより、最大25.6 TB/sの帯域幅を実現します。12個のIgnite AIプロセッサ(ARM + RISC-Vコア)を搭載し、PyTorch、vLLM、Tritonフレームワークをコード変更なしでサポートします。2027年に出荷予定で、資本支出と消費電力を10~50倍削減すると主張しています。

  • Majestic Labsが128TBメモリのAIサーバーPrometheusを発表、Nvidia DGX B300の60倍以上。
  • DRAM中心の設計で、専用銅線インターフェースとメモリ集約チップにより高帯域幅を実現。
サイト内本文

業界で成功するチップデザイナーになる方法

約30年にわたるASIC設計の経験を持ち、アカデミアから業界に転身した著者が、学術と産業におけるチップ設計の根本的な違いを解説。目標、リスク許容度、検証基準、時間軸の違いに焦点を当て、シリコンIPの重要性を強調。ASIC市場が急成長する中、アカデミア出身の設計者にとってこれらの違いを理解することが不可欠。

  • アカデミアは新規性と概念実証を重視するが、業界は信頼性、再現性、大量生産を優先する。
  • 業界は保守的なマージン、徹底的な検証、実証済みソリューションの再利用によりリスクを最小化する。
サイト内本文

南アフリカにはAIのレバレッジがあるが、政策草案はそれを活かせていない

南アフリカは世界の白金族金属埋蔵量の約88%を保有し、アフリカ最大のデータセンター市場を持ち、米中AIインフラ競争の最前線にある。しかし、幻覚的な引用を含むため撤回されたAI政策草案は、これらの優位性を有利な条件のために活用できていない。記事では、南アフリカの構造的レバレッジ、3つの可能性のあるAIインフラの未来(中国、米国、ローカルのオープンウェイト)、および拘束力のあるガバナンス条項の必要性を分析している。

  • 南アフリカの白金族金属と再生可能エネルギーは独自のAIレバレッジを提供するが、政策草案にはハイパースケーラーへの最低条件、データ主権、技術移転条件が欠けている。
  • 米国と中国のテクノロジー企業(マイクロソフト、ファーウェイ)が南アフリカのAIインフラ支配を競う中、政策は南アフリカが見返りに何を求めるかを明示していない。
サイト内本文

モデルベース設計によるAI:仮想センサーモデリング

このウェビナーでは、単一環境内でAIベースの仮想センサーモデルを設計、トレーニング、検証、圧縮、組み込みプロセッサに展開するためのエンドツーエンドソリューションを提供するワークフローを紹介します。実践的な例を通じて、AIモデルをシステムレベルの設計に統合し、パフォーマンス、リソース、展開制約に対して検証する方法を示します。

  • SimulinkにAIモデルを統合しシステムレベルのシミュレーションと検証を実施
  • 形式検証技術を適用してニューラルネットワークの動作を確認
サイト内本文

レーダーが昆虫種を識別可能に

研究者らはミリ波レーダーシステムと機械学習を組み合わせ、昆虫の羽ばたきによる微小ドップラーシグネチャを解析することで、送粉昆虫を非侵襲的に識別することに成功した。種レベルの精度85%、科レベルの精度96%を達成し、従来の殺虫を用いた方法に代わる低コストな手法を提供する。

  • 新たなミリ波レーダーシステムは、羽ばたきによる微小ドップラー信号を用いて昆虫種を分類する。
  • 機械学習モデルは5種の送粉昆虫に対し種レベル85%、科レベル96%の精度を達成。
サイト内本文

マオリ語テキスト読み上げモデル、ビッグテックの価値観を拒否

ワイカト大学の研究者らは、マオリ語の方言向けテキスト読み上げモデルを開発し、データ主権とコミュニティ所有権を重視した。オープンソースツールと少量のデータを使用し、単語誤り率6.78%を達成。他の少数言語コミュニティの再現可能なモデルとなることを目指す。

  • ワイカト大学チームがデータ主権とコミュニティ所有権を重視したマオリ語TTSモデルを開発。
  • オープンソースのPiperアーキテクチャと音素ベースのアプローチを使用、録音時間は7時間45分。
サイト内本文

オープンソースソフトウェアがロボットの思考を支援し始める

オープンソース運動がAIのブレークスルーをロボティクスに持ち込み、参入障壁を低減している。ROSフレームワークからNVIDIA、Hugging Face、Alibabaのモデルまで、ロボットの推論、決定、行動の能力がより多くの人々に利用可能になりつつある。しかし、商業的インセンティブと学術的理想の間の緊張が新たな課題を生んでいる。

  • オープンソースロボティクスソフトウェアは数十年にわたり発展し、ROSがインフラを確立。現在はオープンソースAIモデルがロボットの「頭脳」の進化を推進している。
  • NVIDIA、Hugging Face、Alibabaなどの企業がオープンソースのロボットAIツールとモデルを公開し、参入障壁を大幅に低下させた。
サイト内本文

フィジカルAIの未来は、より賢いロボットではなく、より賢いインターフェースにある

Wetour Roboticsは、フィジカルAIの次のフロンティアはより賢いロボットではなく、人間の身体をコンピューティングネットワークの第一級ノードとして扱うより賢いインターフェースであると主張する。同社のSpatial Intent Fusionプラットフォーム「Orchestra」は、空間位置、視覚的文脈、ジェスチャー意図を組み合わせ、接続デバイスの低遅延・ハンズフリー制御を可能にする。システムはエッジAIと表面筋電図(sEMG)を用いて動作前の意図を感知し、従来のインターフェースが機能しない現実のシナリオに対応する。本記事では、そのアーキテクチャ、トレードオフ、および分野への影響について議論する。

  • Wetour RoboticsのSpatial Intent Fusionは、空間位置、視覚的文脈、ジェスチャー意図を統合し、ハンズフリーのデバイス制御を実現する。
  • OrchestraプラットフォームはエッジAI(NVIDIA Jetson Orin Nano Super)とsEMGを使用し、100ミリ秒未満のレイテンシでユーザーの意図を先読みする。
サイト内本文

ロボットチームのためのエージェンティックAI

本プレゼンテーションでは、ジョンズ・ホプキンス大学応用物理研究所が進める協調ロボットチーム向けエージェンティックAIの最新取り組みを紹介します。異種システム間での自律性、調整、適応性の実現という中核的課題を提起し、マルチロボット環境でのエージェント的行動を支援するスケーラブルなアーキテクチャを提示します。最後に、研究開発で直面した主要な課題と実践的な教訓をまとめます。

  • LLMベースのAIエージェントの紹介
  • LLMベースのAIエージェントをロボットチームに適用するアプローチ
サイト内本文

メルボルンのAIとデータセンターのフライホイールが研究革新を加速する方法

メルボルンは、主権AIコンピューティング、ハイパースケールデータセンター、国際会議の組み合わせにより、研究革新を加速するフライホイールを構築しています。MAVERICスーパーコンピュータ、CDCやNEXTDCのデータセンター投資、そして一連の研究会議が、メルボルンを世界のAI研究の中心に位置づけています。

  • メルボルンはオーストラリア最大の大学ベースAIスーパーコンピュータMAVERICを擁し、特に医学研究の機密データ処理に注力。
  • CDCとNEXTDCによるデータセンター投資は800メガワット以上の主権デジタル容量を提供。
サイト内本文

音声AIシステムは隠れた音声攻撃に対して脆弱

研究によると、人間の耳には聞こえない音声信号でAI音声システムを乗っ取ることが可能で、成功率は最大96%に達する。AudioHijackと呼ばれるこの攻撃は、大規模音声言語モデル(LALM)を標的とし、データ盗難や不正なツール使用などの悪意ある行動を引き起こす可能性がある。

  • AudioHijackは人間の耳で検知できない音声の改変を利用し、平均79~96%の成功率でAI音声モデルを操作する。
  • 攻撃はオープンモデルやMicrosoft、Mistralの商用モデルに有効で、ユーザーの指示に関係なく再利用可能。
サイト内本文

指にはめるAIリングが手話を翻訳

韓国の研究者らが開発したワイヤレス指輪セットは、深層学習システムと組み合わせることで手話をテキストに翻訳できる。7つの指輪それぞれに加速度計を搭載し、手の動きを検出。実験では、米手話と国際手話の単語100語をそれぞれ88.3%、88.5%の精度で認識し、連続した文も翻訳できる。将来的には表情や体の姿勢の統合、スマートフォンでの処理を目指す。

  • 7つのワイヤレス指輪が加速度計で手の動きを捉え、AIがジェスチャーをテキストに翻訳。
  • ASLと国際手話の100語を約88%の精度で認識。
サイト内本文

グラフェン「タトゥー」で植物の葉をセンサーに、ニューラルネットワーク構築へ

テキサス大学オースティン校の研究チームは、グラフェン製の「タトゥー」を植物の葉に直接貼り付け、リアルタイムで水分量を測定するセンサーを開発した。このセンサーは人工シナプスとしても機能し、将来的には植物自体で計算を行うニューラルネットワークの構築が期待される。

  • グラフェンパッチを葉に貼るだけで、電気パルスにより非破壊で水分をリアルタイム検出。
  • センサーはシナプス様の特性(コンダクタンス調整可能、短期記憶)を持ち、ニューラルネットワークに応用可能。
サイト内本文

AIチャットボットは医師のように推論できるか?

Science誌に発表された新しい研究では、OpenAIの大規模言語モデルが臨床推論タスクで医師を上回ったが、信頼性、評価基準、責任ある使用への道筋をめぐる議論も引き起こしている。

  • OpenAIのo1-previewモデルが、実際の救急記録を用いた複数の臨床推論タスクで医師を上回った。
  • チャットボットの信頼性はまちまちで、印象的な診断性能を示す一方、捏造された引用や誤ったアドバイスも見られる。
サイト内本文

アーキビスト、LLMを活用して手書き文字を大規模解読

汎用大規模言語モデルが歴史的な手書き文書の書き起こしで能力を発揮し、Transkribusなどの専門ツールを精度・速度・コストで上回り、これまでアクセス困難だったアーカイブ資料を検索可能にしている。

  • LLMは歴史的手書き文書の文字誤り率を2%未満に抑え、専門ソフトウェアを凌駕。
  • 歴史学者やアーキビスト、連邦準備銀行などが隠れたデータを掘り起こすためにこの技術を活用。
サイト内本文

ギガスケール問題の解決:極度のAIトレーニング負荷における物理的電力パラドックスへの対処法

AIワークロードがギガスケールに達するにつれ、データセンター業界は電力チェーンの動的復元力という物理的な壁に直面しています。GPUクラスターが発生させる高周波パルス負荷は、従来のシステムでは対応できません。AmpaceとEatonは、半固体電池とインテリジェントUPSシステムを用いて、エネルギー貯蔵を受動的なバックアップから能動的な安定化装置へと変革しています。

  • AIトレーニング負荷は電圧低下や周波数不安定を引き起こし、従来の電力システムでは対処困難。
  • AmpaceのPUシリーズ半固体セルは、超低内部抵抗による高速ショックアブソーバーとして機能。
サイト内本文

全ソース