銀行にチーフサイエンティストが必要な理由
プレム・ナタラジャン氏はアマゾンを離れ、キャピタル・ワンのチーフサイエンティストに就任。詐欺検出からエージェント型カスタマーサービスまで、大規模な実際の金融課題を解決するために深いAI研究を応用している。
- キャピタル・ワンはAIを単なる導入技術ではなく、科学分野として扱っている。
- クラウドファーストのインフラにより、大規模なAI研究が可能。
ソース詳細
AI News Hub は IEEE Spectrum AI の AI 更新を追跡し、ソース状態、利用範囲、収集方法、公開記事を表示します。
Media source; summary-only unless authorization is obtained.
プレム・ナタラジャン氏はアマゾンを離れ、キャピタル・ワンのチーフサイエンティストに就任。詐欺検出からエージェント型カスタマーサービスまで、大規模な実際の金融課題を解決するために深いAI研究を応用している。
本記事は、AIの数学分野での急速な進歩が伝統的な数学研究に挑戦し、数学者に自身の役割について深い反省を促すことを探る。そして、AIをツール、パートナー、またはオラクルとして扱う三つの未来を分析する。
プリンストン大学の研究者は、強化学習と逆設計を用いて、無線周波数集積回路(RFIC)をゼロから迅速に設計し、人間の設計を上回る性能のチップを記録的な時間で生み出している。AIは従来にないレイアウトを生成して性能限界を押し上げるが、さらなる進歩にはオープンデータセットが必要である。
人工知能(AI)は1956年のダートマス会議で正式に確立されてから70年、初期のニューラルネットワークやエキスパートシステムから、現代の深層学習、大規模言語モデル、生成AIへと進化してきました。本記事ではAIの歴史、強み、リスク、そしてIEEEの貢献を振り返ります。
大規模言語モデル(LLM)は研究ラボを離れ、エンジニアの日常業務に浸透しています。IEEEは、技術専門家がLLMの構築と展開を習得するための5つのコースからなるオンラインプログラムを提供します。
ニューロモルフィックコンピューティングは脳の動作を模倣し、従来のAIチップより省エネだが、接続数はヒトニューロンに遠く及ばない。新たな研究では、音波(phi-bit)を用いた音響シナプスが生体ニューロンをより忠実に模倣し、高速かつ高効率で動作可能であることが示された。アヤメ分類では39個のパラメータで96.7%の精度を達成し、消費電力は電子ニューロモルフィックハードウェアの10分の1以下で、神経調節物質の模倣も実現した。
生成AIは音楽作品の「使用」の定義を複雑にしている。SureelやSoundVerseなどの企業は、トレーニングデータの使用状況を追跡し、ミュージシャンが作品をAIトレーニングに提供した対価を得られるようにする帰属システムを開発している。これには技術的、倫理的、政策的な課題が伴う。
研究者らは視覚言語モデルを用いて協働ロボットに人間の感情を読み取る訓練を行い、表情だけでなく文脈要因も考慮することで従来のAIよりも優れた性能を示した。しかし、適応的な謝罪は好まれたものの、機能的な失敗による信頼損失は修復できなかった。
Google DeepMindのスピンオフであるIsomorphic Labsは、AlphaFoldを超える画期的なAIシステムIsoDDEを使用して、タンパク質上の隠れたポケットを発見し、創薬を加速させています。このシステムは、Nature誌に掲載されたcereblonのクリプティックポケットを正確に予測し、その能力を実証しました。
オランダのトゥウェンテ大学の研究者たちは、GPUカーネルごとにクロック周波数を調整することで、速度をほとんど犠牲にせずに大規模言語モデルのトレーニングエネルギーを最大14%削減できることを示しました。
氷河の消失速度の監視は気候変動の評価と海面上昇予測に不可欠だが、手動分析は時間がかかる。ドイツのフリードリヒ・アレクサンダー大学エアランゲン・ニュルンベルク(FAU)の研究者らは、氷河ごとに1枚の手動ラベル画像、夏の参照画像、基盤岩マップを提供するだけで、深層学習モデルのキャルビングフロント追跡誤差を1km超から70m未満に削減した。この手法はスヴァールバル諸島の全145氷河に適用され、2015~2024年の月次キャルビングフロント位置を生成。将来は北極のさらに1,500の氷河への拡大が期待される。
Computex 2026で、NvidiaはWindows PC向けBlackwell GB10スーパーチップ「RTX Spark」を発表。Microsoftや複数のPCメーカーが対応デバイスを発表。RTX Sparkは20個のArm CPUコア、6,144個のGPUコア、NPUを搭載し、AI、ゲーム、プロフェッショナルワークをターゲット。Nvidiaのソフトウェア優位性と業界の影響力がWindows on Armの確立に寄与する可能性があるが、x86との競争は依然として課題。
量子コンピュータはスーパーコンピュータを超える問題解決を約束するが、その動作には古典的な計算が大量に必要である。量子ビット数が増加するにつれて、較正や誤り訂正といったインフラの革新が不可欠となる。NVIDIA、Q-CTRL、IBM、Riverlane、Googleなどの企業が関連するハードウェアとソフトウェアを開発している。
AIシステムの能力が向上するにつれ、その性能を測定するために膨大なリソースが投入されているが、人間の認知、関係性、行動への影響については系統的な測定がほとんど行われていない。人道技術センターのイムラン・カーン氏は、AIが人間の基本的な能力を侵食する可能性を指摘し、長期的な研究、データ共有、規制の重要性を訴える。
AIハードウェアスタートアップのMajestic Labsは、最大128テラバイトのメモリを搭載した新しいAIサーバー「Prometheus」を開発中です。これはNvidiaのDGX B300サーバーの60倍以上です。DRAM中心のアーキテクチャを採用し、専用の銅線ケーブルメモリインターフェースとカスタムメモリ集約チップにより、最大25.6 TB/sの帯域幅を実現します。12個のIgnite AIプロセッサ(ARM + RISC-Vコア)を搭載し、PyTorch、vLLM、Tritonフレームワークをコード変更なしでサポートします。2027年に出荷予定で、資本支出と消費電力を10~50倍削減すると主張しています。
約30年にわたるASIC設計の経験を持ち、アカデミアから業界に転身した著者が、学術と産業におけるチップ設計の根本的な違いを解説。目標、リスク許容度、検証基準、時間軸の違いに焦点を当て、シリコンIPの重要性を強調。ASIC市場が急成長する中、アカデミア出身の設計者にとってこれらの違いを理解することが不可欠。
南アフリカは世界の白金族金属埋蔵量の約88%を保有し、アフリカ最大のデータセンター市場を持ち、米中AIインフラ競争の最前線にある。しかし、幻覚的な引用を含むため撤回されたAI政策草案は、これらの優位性を有利な条件のために活用できていない。記事では、南アフリカの構造的レバレッジ、3つの可能性のあるAIインフラの未来(中国、米国、ローカルのオープンウェイト)、および拘束力のあるガバナンス条項の必要性を分析している。
このウェビナーでは、単一環境内でAIベースの仮想センサーモデルを設計、トレーニング、検証、圧縮、組み込みプロセッサに展開するためのエンドツーエンドソリューションを提供するワークフローを紹介します。実践的な例を通じて、AIモデルをシステムレベルの設計に統合し、パフォーマンス、リソース、展開制約に対して検証する方法を示します。
研究者らはミリ波レーダーシステムと機械学習を組み合わせ、昆虫の羽ばたきによる微小ドップラーシグネチャを解析することで、送粉昆虫を非侵襲的に識別することに成功した。種レベルの精度85%、科レベルの精度96%を達成し、従来の殺虫を用いた方法に代わる低コストな手法を提供する。
ワイカト大学の研究者らは、マオリ語の方言向けテキスト読み上げモデルを開発し、データ主権とコミュニティ所有権を重視した。オープンソースツールと少量のデータを使用し、単語誤り率6.78%を達成。他の少数言語コミュニティの再現可能なモデルとなることを目指す。
オープンソース運動がAIのブレークスルーをロボティクスに持ち込み、参入障壁を低減している。ROSフレームワークからNVIDIA、Hugging Face、Alibabaのモデルまで、ロボットの推論、決定、行動の能力がより多くの人々に利用可能になりつつある。しかし、商業的インセンティブと学術的理想の間の緊張が新たな課題を生んでいる。
Wetour Roboticsは、フィジカルAIの次のフロンティアはより賢いロボットではなく、人間の身体をコンピューティングネットワークの第一級ノードとして扱うより賢いインターフェースであると主張する。同社のSpatial Intent Fusionプラットフォーム「Orchestra」は、空間位置、視覚的文脈、ジェスチャー意図を組み合わせ、接続デバイスの低遅延・ハンズフリー制御を可能にする。システムはエッジAIと表面筋電図(sEMG)を用いて動作前の意図を感知し、従来のインターフェースが機能しない現実のシナリオに対応する。本記事では、そのアーキテクチャ、トレードオフ、および分野への影響について議論する。
本プレゼンテーションでは、ジョンズ・ホプキンス大学応用物理研究所が進める協調ロボットチーム向けエージェンティックAIの最新取り組みを紹介します。異種システム間での自律性、調整、適応性の実現という中核的課題を提起し、マルチロボット環境でのエージェント的行動を支援するスケーラブルなアーキテクチャを提示します。最後に、研究開発で直面した主要な課題と実践的な教訓をまとめます。
メルボルンは、主権AIコンピューティング、ハイパースケールデータセンター、国際会議の組み合わせにより、研究革新を加速するフライホイールを構築しています。MAVERICスーパーコンピュータ、CDCやNEXTDCのデータセンター投資、そして一連の研究会議が、メルボルンを世界のAI研究の中心に位置づけています。
研究によると、人間の耳には聞こえない音声信号でAI音声システムを乗っ取ることが可能で、成功率は最大96%に達する。AudioHijackと呼ばれるこの攻撃は、大規模音声言語モデル(LALM)を標的とし、データ盗難や不正なツール使用などの悪意ある行動を引き起こす可能性がある。
韓国の研究者らが開発したワイヤレス指輪セットは、深層学習システムと組み合わせることで手話をテキストに翻訳できる。7つの指輪それぞれに加速度計を搭載し、手の動きを検出。実験では、米手話と国際手話の単語100語をそれぞれ88.3%、88.5%の精度で認識し、連続した文も翻訳できる。将来的には表情や体の姿勢の統合、スマートフォンでの処理を目指す。
テキサス大学オースティン校の研究チームは、グラフェン製の「タトゥー」を植物の葉に直接貼り付け、リアルタイムで水分量を測定するセンサーを開発した。このセンサーは人工シナプスとしても機能し、将来的には植物自体で計算を行うニューラルネットワークの構築が期待される。
Science誌に発表された新しい研究では、OpenAIの大規模言語モデルが臨床推論タスクで医師を上回ったが、信頼性、評価基準、責任ある使用への道筋をめぐる議論も引き起こしている。
汎用大規模言語モデルが歴史的な手書き文書の書き起こしで能力を発揮し、Transkribusなどの専門ツールを精度・速度・コストで上回り、これまでアクセス困難だったアーカイブ資料を検索可能にしている。
AIワークロードがギガスケールに達するにつれ、データセンター業界は電力チェーンの動的復元力という物理的な壁に直面しています。GPUクラスターが発生させる高周波パルス負荷は、従来のシステムでは対応できません。AmpaceとEatonは、半固体電池とインテリジェントUPSシステムを用いて、エネルギー貯蔵を受動的なバックアップから能動的な安定化装置へと変革しています。