銀行為何需要首席科學家?
Prem Natarajan離開亞馬遜,成為第一資本的首席科學家,將深度AI研究應用於解決大規模現實金融挑戰,從欺詐檢測到代理客戶服務。
- 第一資本將AI視為一門科學學科,而不僅僅是部署的技術。
- 該銀行的雲優先基礎設施支援大規模AI研究。
Media source; summary-only unless authorization is obtained.
Prem Natarajan離開亞馬遜,成為第一資本的首席科學家,將深度AI研究應用於解決大規模現實金融挑戰,從欺詐檢測到代理客戶服務。
本文探討了AI在數學領域的快速發展如何挑戰傳統數學研究,引發數學家對自身角色的深刻反思,並分析了三種可能的未來:AI作為工具、合作伙伴或自主研究者。
普林斯頓大學研究人員利用強化學習和逆向設計,從頭開始快速設計射頻積體電路(RFIC),生產出的晶片在創紀錄的時間內超越了人類設計的效能。AI生成的非常規佈局突破了效能極限,但該領域需要開放資料集以進一步推進。
人工智慧自1956年達特茅斯會議正式確立以來,經歷了70年的發展,從早期的神經網路、專家系統到現代深度學習、大語言模型和生成式AI。文章回顧了AI的演變歷程、優勢與風險,並強調了IEEE在推動AI進步與負責任使用方面的貢獻。
大型語言模型(LLM)已從研究實驗室進入工程師的日常工作流程。為幫助技術人員掌握LLM的構建與部署,IEEE推出了一個包含五門課程、總計可獲專業發展學分和數字徽章的線上培訓專案。
神經形態計算透過模仿大腦運作,比傳統AI晶片更節能。但現有裝置連線數量遠少於人腦神經元。新研究表明,利用聲波(phi-bit)可構建更逼真的神經突觸,實現更快運算和更高能效。在鳶尾花分類測試中,聲學突觸以39個引數達到96.7%準確率,功耗僅為電子神經形態硬體的十分之一,並模擬了神經調節機制。
生成式AI模糊了“使用”的定義,初創公司Sureel和SoundVerse正致力於建立訓練資料歸屬機制,讓音樂人在其作品被用於AI訓練時獲得報酬。這涉及複雜的技術和倫理問題,並在版權訴訟之外開闢了新的行業規範可能性。
研究人員利用視覺語言模型訓練協作機器人,透過結合面部表情和情境因素來讀取人類情感。實驗表明,VLM在情感識別上優於傳統AI,個性化道歉雖受歡迎,但無法彌補機器人功能失誤帶來的信任損失。
谷歌DeepMind的分拆公司Isomorphic Labs利用其新型AI系統IsoDDE發現蛋白質上隱藏的藥物結合口袋,超越了AlphaFold。該系統成功預測了cereblon上的隱秘口袋,驗證了其發現新藥物靶點的能力。
荷蘭特溫特大學的研究人員透過在每個GPU核心級別調整時脈頻率,在幾乎不犧牲速度的情況下,將大語言模型訓練能耗降低了14%。
冰川消融速度的監測對評估氣候變化和預測海平面上升至關重要,但傳統人工分析費時費力。德國紐倫堡大學的研究人員開發了一種新方法,透過僅提供每座冰川的一張人工標註影像、夏季無冰磧參考影像和基岩地圖,將深度學習模型的冰川鋒面追蹤誤差從超過1公里降至不到70米。該模型已成功應用於挪威斯瓦爾巴群島的所有145座冰川,生成了2015至2024年的月度鋒面位置資料,未來有望擴充套件到北極其他地區。研究團隊表示,這一方法可部分自動化全球冰川監測,只需少量初始標註資料即可適應新區域。
在2026年臺北國際電腦展上,Nvidia釋出了面向Windows PC的RTX Spark,基於Blackwell GB10超級晶片,並得到微軟及多家PC廠商支援。相比2024年Qualcomm的Copilot+ PC,Nvidia憑藉其行業影響力和軟體生態有望推動Windows on Arm生態發展。RTX Spark整合CPU、GPU和NPU,效能預計接近RTX 5070移動顯示卡,但功耗更低。Nvidia的軟體優勢是關鍵,其GPU市場份額超90%,驅動成熟。微軟強調AI能力,但Windows on Arm的真正考驗仍是能否成為x86的替代品。
量子計算機有望解決超算無法企及的問題,但其執行離不開大量經典計算支援。隨著量子位元數量增加,校準和糾錯等經典任務的基礎設施創新至關重要。NVIDIA、Q-CTRL、IBM、Riverlane、Google等公司正在開發相關軟硬體。
隨著AI系統能力提升,大量資源用於衡量AI效能,但對其對人類認知、關係和行為的影響卻缺乏系統測量。人道技術中心的Imran Khan指出,AI可能重塑人類基本能力,而當前評估體系忽視了最關鍵的指標——人類福祉。文章討論了AI在社交、教育、情感支援等領域的潛在危害,並呼籲長期研究、資料共享和監管改革。
AI硬體初創公司Majestic Labs正在開發一種名為Prometheus的新型AI伺服器,配備高達128TB的記憶體,是Nvidia DGX B300伺服器的60倍以上。該伺服器採用DRAM中心架構,使用專有微型銅纜記憶體介面和自定義記憶體聚合晶片,提供高達25.6TB/s的頻寬。它包含12個Ignite AI處理器,結合ARM和RISC-V核心,支援PyTorch、vLLM和Triton框架,無需修改程式碼。預計2027年發貨,聲稱可將資本支出和功耗降低10至50倍。
本文由一位擁有近三十年經驗的應用型晶片(ASIC)設計師撰寫,他經歷了從學術界到工業界的轉型。文章深入探討了晶片設計在學術與工業環境中的根本差異,包括目標、風險承受能力、驗證標準和時間規劃等方面,並強調了矽智慧財產權(IP)在工業界的重要性。隨著ASIC市場的快速增長,行業需要更多設計師,但來自學術背景的人必須瞭解這些關鍵區別。
南非擁有全球88%的鉑族金屬儲量,是非洲最大的資料中心市場,並處於中美AI基礎設施競爭的前沿。然而,其AI政策草案因包含AI幻覺引用而被撤回,未能利用這些優勢來談判有利條件。文章分析了南非的結構性槓桿、三種潛在的AI基礎設施未來(中國、美國和本地開放權重),以及制定具有約束力的治理框架的必要性。
本次網路研討會展示了一種在單一環境中設計、訓練、驗證、壓縮和部署基於AI的虛擬感測器模型到嵌入式處理器的工作流程。透過實際案例,演示如何將AI模型整合到系統級設計中,並針對效能、資源和部署約束進行驗證。
研究人員開發了一種毫米波雷達系統,結合機器學習,透過分析昆蟲翅膀拍動產生的微多普勒特徵,能夠以85%的準確率區分不同傳粉昆蟲的物種,並且非侵入性地監測它們,有望替代傳統的致命昆蟲捕捉方法。
紐西蘭懷卡託大學的研究人員開發了一種針對毛利語方言的文本轉語音模型,強調資料主權和社群所有權。該模型使用開源工具和少量資料,實現了6.78%的詞錯誤率,旨在為其他少數民族語言社群提供可複製的藍圖。
開源運動正將AI的突破性進展引入機器人領域,降低開發門檻。從ROS框架到輝達、Hugging Face和阿里巴巴的開源模型,機器人推理、決策和行動的能力正變得對更多人可用。但商業激勵與學術初心之間的張力也帶來新挑戰。
Wetour Robotics認為,物理AI的下一個前沿不是更智慧的機器人,而是將人體視為計算網路中的一流節點的更智慧介面。其空間意圖融合平臺Orchestra結合空間位置、視覺背景和手勢意圖,實現低延遲、擴音控制連線裝置。系統使用邊緣AI和表面肌電訊號(sEMG)進行動作前意圖感知,解決了傳統介面在現實場景中的失效問題。文章討論了其架構、權衡及對領域的影響。
本演講重點介紹約翰·霍普金斯大學應用物理實驗室在推進協作機器人團隊自主AI方面的最新成果。從異構系統自主性、協調性和適應性的核心挑戰出發,介紹一個為多機器人環境中自主行為設計的可擴充套件架構,並總結關鍵挑戰和實際經驗。
墨爾本正透過主權AI計算、超大規模資料中心和國際會議的結合,構建一個加速研究創新的飛輪。MAVERIC超級計算機、CDC和NEXTDC的資料中心投資,以及一系列研究會議,共同鞏固了墨爾本作為全球AI研究中心的地位。
研究顯示,透過人耳無法察覺的音訊訊號可以劫持AI語音系統,成功率高達96%。這種名為AudioHijack的攻擊針對大型音訊語言模型(LALM),可引發多種惡意行為,包括資料竊取和未經授權的工具使用。
韓國研究人員開發了一套無線電子戒指,結合深度學習系統,能夠將手語翻譯成文本。該系統使用七枚戒指,每枚戒指配備加速度計,可檢測手部運動,並無線傳輸資料。在實驗中,它能以88.3%和88.5%的準確率識別100個常見美國手語和國際手語詞彙,並能翻譯連續句子。未來計劃包括整合面部表情和身體姿態,以及實現手機端處理。
德克薩斯大學奧斯汀分校的研究人員開發了一種石墨烯“紋身”,可以直接貼在植物葉片上即時監測水分含量。該感測器不僅可用於監測植物健康狀況,還能充當人工突觸,未來有望構建植物的神經網路,實現森林火災和乾旱風險的即時評估。
一項發表在《科學》雜誌上的新研究表明,OpenAI的大型語言模型在臨床推理任務上表現優於醫生,但也引發了關於可靠性、評估標準和對醫療實踐影響的討論。
通用大型語言模型在轉錄歷史手寫文字方面展現出日益強大的能力,在準確性、速度和成本上超越了Transkribus等專用工具,使得以往難以訪問的檔案資料變得可檢索。
隨著AI工作負載達到千兆級規模,資料中心行業面臨電力鏈的動態韌性瓶頸。GPU叢集產生的高頻脈衝負載可導致電壓暫降和頻率不穩,傳統備用電源無法應對毫秒級波動。Ampace與伊頓合作,透過半固態電池技術和先進UPS系統,將儲能從被動備份轉變為主動高速穩定器,解決AI時代的電力悖論。