AI News HubLIVE
公開文章 44採集文章 51可信度 82刷新頻率 30 分鐘
健康狀態 健康來源類型 媒體原文權限 站內改寫最近入庫 2026-06-25ID ieee-spectrum-ai運行狀態 已啟用

Media source; summary-only unless authorization is obtained.

最新公開文章

銀行為何需要首席科學家?

Prem Natarajan離開亞馬遜,成為第一資本的首席科學家,將深度AI研究應用於解決大規模現實金融挑戰,從欺詐檢測到代理客户服務。

  • 第一資本將AI視為一門科學學科,而不僅僅是部署的技術。
  • 該銀行的雲優先基礎設施支持大規模AI研究。
站內正文

當AI能完成數學計算時,成為數學家意味着什麼

本文探討了AI在數學領域的快速發展如何挑戰傳統數學研究,引發數學家對自身角色的深刻反思,並分析了三種可能的未來:AI作為工具、合作伙伴或自主研究者。

  • AI在數學奧林匹克中達到金牌水平,並能自主產出博士級研究
  • 數學家對AI取代人類感到存在危機,但也在積極討論未來角色
站內正文

AI正在設計人類無法想象的無線電芯片

普林斯頓大學研究人員利用強化學習和逆向設計,從頭開始快速設計射頻集成電路(RFIC),生產出的芯片在創紀錄的時間內超越了人類設計的性能。AI生成的非常規佈局突破了性能極限,但該領域需要開放數據集以進一步推進。

  • RFIC設計是一門複雜的“黑魔法”,依賴人類直覺和多年經驗。
  • AI使用強化學習和逆向設計,可快速從頭創建RFIC,實現創紀錄性能。
站內正文

紀念人工智能70週年

人工智能自1956年達特茅斯會議正式確立以來,經歷了70年的發展,從早期的神經網絡、專家系統到現代深度學習、大語言模型和生成式AI。文章回顧了AI的演變歷程、優勢與風險,並強調了IEEE在推動AI進步與負責任使用方面的貢獻。

  • AI作為獨立學科於1956年正式確立,但其思想根源可追溯至更早。
  • AI發展經歷了多次“寒冬”與“春天”,近年來深度學習和生成式AI帶來新突破。
站內正文

IEEE推出大型語言模型虛擬培訓課程

大型語言模型(LLM)已從研究實驗室進入工程師的日常工作流程。為幫助技術人員掌握LLM的構建與部署,IEEE推出了一個包含五門課程、總計可獲專業發展學分和數字徽章的在線培訓項目。

  • LLM市場預計到2030年每年增長約33%,掌握LLM實現與安全正成為技術人員的核心要求。
  • 工程師需要理解Transformer架構和自注意力機制,而非將LLM視為簡單的對話機器人。
站內正文

聲波為神經形態芯片帶來模擬大腦的優勢

神經形態計算通過模仿大腦運作,比傳統AI芯片更節能。但現有設備連接數量遠少於人腦神經元。新研究表明,利用聲波(phi-bit)可構建更逼真的神經突觸,實現更快運算和更高能效。在鳶尾花分類測試中,聲學突觸以39個參數達到96.7%準確率,功耗僅為電子神經形態硬件的十分之一,並模擬了神經調節機制。

  • 聲波神經形態設備利用phi-bit實現並行計算,模擬生物突觸可塑性
  • 在鳶尾花分類任務中達到96.7%準確率,功耗降低90%
站內正文

音樂人如何因訓練AI而獲得報酬

生成式AI模糊了“使用”的定義,初創公司Sureel和SoundVerse正致力於建立訓練數據歸屬機制,讓音樂人在其作品被用於AI訓練時獲得報酬。這涉及複雜的技術和倫理問題,並在版權訴訟之外開闢了新的行業規範可能性。

  • 生成式AI使音樂訓練數據的“使用”定義複雜化,傳統按使用次數付費的模式面臨挑戰。
  • Sureel與STIM合作,通過標記媒體文件並跟蹤AI訓練使用情況來設置許可費。
站內正文

視覺語言模型訓練機器人讀取人類情感

研究人員利用視覺語言模型訓練協作機器人,通過結合面部表情和情境因素來讀取人類情感。實驗表明,VLM在情感識別上優於傳統AI,個性化道歉雖受歡迎,但無法彌補機器人功能失誤帶來的信任損失。

  • VLM在情感識別上得分0.86,優於傳統AI的0.77
  • 40名志願者中31人更喜歡情感自適應道歉
站內正文

谷歌DeepMind分拆公司如何追蹤隱藏的藥物靶點

谷歌DeepMind的分拆公司Isomorphic Labs利用其新型AI系統IsoDDE發現蛋白質上隱藏的藥物結合口袋,超越了AlphaFold。該系統成功預測了cereblon上的隱秘口袋,驗證了其發現新藥物靶點的能力。

  • IsoDDE超越了AlphaFold,不僅預測結構,還能預測蛋白質-配體相互作用。
  • 該系統僅使用蛋白質序列就準確預測了《自然》雜誌發表的cereblon隱秘口袋的位置。
站內正文

定時技巧可將LLM訓練能耗降低14%

荷蘭特温特大學的研究人員通過在每個GPU內核級別調整時鐘頻率,在幾乎不犧牲速度的情況下,將大語言模型訓練能耗降低了14%。

  • 研究人員在GPU每個內核級別應用動態電壓頻率調整(DVFS)。
  • 實現了14%的能耗節省,訓練時間僅增加0.6%。
站內正文

人工智能助力追蹤全球冰川消融

冰川消融速度的監測對評估氣候變化和預測海平面上升至關重要,但傳統人工分析費時費力。德國紐倫堡大學的研究人員開發了一種新方法,通過僅提供每座冰川的一張人工標註圖像、夏季無冰磧參考圖像和基岩地圖,將深度學習模型的冰川鋒面追蹤誤差從超過1公里降至不到70米。該模型已成功應用於挪威斯瓦爾巴羣島的所有145座冰川,生成了2015至2024年的月度鋒面位置數據,未來有望擴展到北極其他地區。研究團隊表示,這一方法可部分自動化全球冰川監測,只需少量初始標註數據即可適應新區域。

  • 新方法僅需少量額外數據即可將AI冰川鋒面追蹤誤差從超1公里降至不到70米。
  • 通過提供夏季參考圖像和基岩地圖,模型準確率顯著提升。
站內正文

Nvidia的AI硬件通過RTX Spark PC進入Windows

在2026年台北國際電腦展上,Nvidia發佈了面向Windows PC的RTX Spark,基於Blackwell GB10超級芯片,並得到微軟及多家PC廠商支持。相比2024年Qualcomm的Copilot+ PC,Nvidia憑藉其行業影響力和軟件生態有望推動Windows on Arm生態發展。RTX Spark集成CPU、GPU和NPU,性能預計接近RTX 5070移動顯卡,但功耗更低。Nvidia的軟件優勢是關鍵,其GPU市場份額超90%,驅動成熟。微軟強調AI能力,但Windows on Arm的真正考驗仍是能否成為x86的替代品。

  • Nvidia在Computex 2026發佈RTX Spark,將Blackwell GB10超級芯片引入Windows PC。
  • 微軟及華碩、戴爾、聯想等廠商宣佈支持RTX Spark的新設備。
站內正文

量子計算機需要哪些經典計算進步?

量子計算機有望解決超算無法企及的問題,但其運行離不開大量經典計算支持。隨着量子比特數量增加,校準和糾錯等經典任務的基礎設施創新至關重要。NVIDIA、Q-CTRL、IBM、Riverlane、Google等公司正在開發相關軟硬件。

  • 量子計算機依賴經典計算進行校準和糾錯
  • 校準包含“啓動”和“運行時”階段,目前多靠人工且耗時
站內正文

為何不測量AI對人類的影響?

隨着AI系統能力提升,大量資源用於衡量AI性能,但對其對人類認知、關係和行為的影響卻缺乏系統測量。人道技術中心的Imran Khan指出,AI可能重塑人類基本能力,而當前評估體系忽視了最關鍵的指標——人類福祉。文章討論了AI在社交、教育、情感支持等領域的潛在危害,並呼籲長期研究、數據共享和監管改革。

  • AI技術部署迅猛,但對其心理和社會影響的系統測量嚴重不足
  • 已有青少年自殺、AI精神病等高危案例,但長期社會影響尚未被關注
站內正文

新型服務器有望突破AI的“內存牆”

AI硬件初創公司Majestic Labs正在開發一種名為Prometheus的新型AI服務器,配備高達128TB的內存,是Nvidia DGX B300服務器的60倍以上。該服務器採用DRAM中心架構,使用專有微型銅纜內存接口和自定義內存聚合芯片,提供高達25.6TB/s的帶寬。它包含12個Ignite AI處理器,結合ARM和RISC-V核心,支持PyTorch、vLLM和Triton框架,無需修改代碼。預計2027年發貨,聲稱可將資本支出和功耗降低10至50倍。

  • Majestic Labs推出Prometheus AI服務器,內存高達128TB,遠超Nvidia DGX B300。
  • 採用DRAM中心架構,通過專有銅纜接口和內存聚合芯片實現高帶寬。
站內正文

芯片設計師如何在工業界取得成功

本文由一位擁有近三十年經驗的應用型芯片(ASIC)設計師撰寫,他經歷了從學術界到工業界的轉型。文章深入探討了芯片設計在學術與工業環境中的根本差異,包括目標、風險承受能力、驗證標準和時間規劃等方面,並強調了硅知識產權(IP)在工業界的重要性。隨着ASIC市場的快速增長,行業需要更多設計師,但來自學術背景的人必須瞭解這些關鍵區別。

  • 學術界追求新穎性和概念驗證,而工業界更注重可靠性、可重複性和大規模生產。
  • 工業界通過保守策略、廣泛驗證和重複使用經過驗證的解決方案來最小化風險。
站內正文

南非擁有AI槓桿,但其政策草案將其閒置

南非擁有全球88%的鉑族金屬儲量,是非洲最大的數據中心市場,並處於中美AI基礎設施競爭的前沿。然而,其AI政策草案因包含AI幻覺引用而被撤回,未能利用這些優勢來談判有利條件。文章分析了南非的結構性槓桿、三種潛在的AI基礎設施未來(中國、美國和本地開放權重),以及制定具有約束力的治理框架的必要性。

  • 南非的鉑族金屬和可再生能源資源提供了獨特的AI槓桿,但政策草案未設定最低投資條款、數據主權或技術轉讓條件。
  • 中美科技公司(華為和微軟等)正在南非爭奪AI基礎設施控制權,而南非的政策未明確其回報要求。
站內正文

基於模型設計的AI:虛擬傳感器建模

本次網絡研討會展示了一種在單一環境中設計、訓練、驗證、壓縮和部署基於AI的虛擬傳感器模型到嵌入式處理器的工作流程。通過實際案例,演示如何將AI模型集成到系統級設計中,並針對性能、資源和部署約束進行驗證。

  • 將AI模型集成到Simulink中進行系統級仿真和驗證
  • 應用形式化驗證技術評估神經網絡行為
站內正文

雷達可區分昆蟲物種

研究人員開發了一種毫米波雷達系統,結合機器學習,通過分析昆蟲翅膀拍動產生的微多普勒特徵,能夠以85%的準確率區分不同傳粉昆蟲的物種,並且非侵入性地監測它們,有望替代傳統的致命昆蟲捕捉方法。

  • 新型毫米波雷達系統使用微多普勒信號分析昆蟲翅膀運動,實現物種分類。
  • 機器學習模型對五種傳粉昆蟲的物種分類準確率達85%,科級分類達96%。
站內正文

毛利語文本轉語音模型拒絕大科技公司的價值觀

新西蘭懷卡託大學的研究人員開發了一種針對毛利語方言的文本轉語音模型,強調數據主權和社區所有權。該模型使用開源工具和少量數據,實現了6.78%的詞錯誤率,旨在為其他少數民族語言社區提供可複製的藍圖。

  • 懷卡託大學團隊開發了毛利語文本轉語音模型,注重數據主權和社區所有權。
  • 模型使用開源架構Piper和音素方法,僅用7小時45分鐘錄音數據。
站內正文

開源軟件開始幫助機器人思考

開源運動正將AI的突破性進展引入機器人領域,降低開發門檻。從ROS框架到英偉達、Hugging Face和阿里巴巴的開源模型,機器人推理、決策和行動的能力正變得對更多人可用。但商業激勵與學術初心之間的張力也帶來新挑戰。

  • 開源機器人軟件歷經數十年發展,ROS框架奠定了基礎設施,如今AI模型的開源正推動機器人“大腦”的進化。
  • 英偉達、Hugging Face和阿里巴巴等公司推出開源機器人AI工具和模型,大幅降低進入門檻。
站內正文

物理AI的未來不在於更智能的機器人,而在於更智能的界面

Wetour Robotics認為,物理AI的下一個前沿不是更智能的機器人,而是將人體視為計算網絡中的一流節點的更智能界面。其空間意圖融合平台Orchestra結合空間位置、視覺背景和手勢意圖,實現低延遲、免提控制連接設備。系統使用邊緣AI和表面肌電信號(sEMG)進行動作前意圖感知,解決了傳統界面在現實場景中的失效問題。文章討論了其架構、權衡及對領域的影響。

  • Wetour Robotics的空間意圖融合技術整合空間位置、視覺背景和手勢意圖,實現免提設備控制。
  • 其Orchestra平台使用NVIDIA Jetson Orin Nano Super邊緣AI和sEMG,實現亞100毫秒延遲並預測用户意圖。
站內正文

面向機器人團隊的自主AI

本演講重點介紹約翰·霍普金斯大學應用物理實驗室在推進協作機器人團隊自主AI方面的最新成果。從異構系統自主性、協調性和適應性的核心挑戰出發,介紹一個為多機器人環境中自主行為設計的可擴展架構,並總結關鍵挑戰和實際經驗。

  • 介紹基於LLM的AI智能體
  • 將基於LLM的AI智能體應用於機器人團隊的方法
站內正文

墨爾本的AI與數據中心飛輪如何加速研究創新

墨爾本正通過主權AI計算、超大規模數據中心和國際會議的結合,構建一個加速研究創新的飛輪。MAVERIC超級計算機、CDC和NEXTDC的數據中心投資,以及一系列研究會議,共同鞏固了墨爾本作為全球AI研究中心的地位。

  • 墨爾本擁有澳大利亞最大的大學AI超級計算機MAVERIC,專注於醫學研究等敏感數據處理。
  • CDC和NEXTDC在墨爾本的數據中心投資超過800兆瓦的數字容量,支持大規模AI工作負載。
站內正文

語音AI系統易受隱藏音頻攻擊

研究顯示,通過人耳無法察覺的音頻信號可以劫持AI語音系統,成功率高達96%。這種名為AudioHijack的攻擊針對大型音頻語言模型(LALM),可引發多種惡意行為,包括數據竊取和未經授權的工具使用。

  • AudioHijack利用人耳無法察覺的音頻修改操控AI語音模型,平均成功率為79%-96%。
  • 攻擊可作用於開放模型及微軟、Mistral等商業模型,且能跨場景複用。
站內正文

手指上的AI戒指能翻譯手語

韓國研究人員開發了一套無線電子戒指,結合深度學習系統,能夠將手語翻譯成文本。該系統使用七枚戒指,每枚戒指配備加速度計,可檢測手部運動,並無線傳輸數據。在實驗中,它能以88.3%和88.5%的準確率識別100個常見美國手語和國際手語詞彙,並能翻譯連續句子。未來計劃包括集成面部表情和身體姿態,以及實現手機端處理。

  • 七枚無線戒指通過加速度計捕捉手部運動,AI系統將手勢翻譯成文本。
  • 測試中識別100個ASL和ISL詞彙,準確率約88%。
站內正文

石墨烯“紋身”讓植物葉片變身傳感器,或可構建植物神經網絡

德克薩斯大學奧斯汀分校的研究人員開發了一種石墨烯“紋身”,可以直接貼在植物葉片上實時監測水分含量。該傳感器不僅可用於監測植物健康狀況,還能充當人工突觸,未來有望構建植物的神經網絡,實現森林火災和乾旱風險的實時評估。

  • 石墨烯貼片可像紋身一樣貼在葉片上,通過電脈衝檢測水分,實現實時、非破壞性的植物水分監測。
  • 該傳感器具有類似突觸的特性,能調節電導率並具有短期記憶,可用於構建神經網絡。
站內正文

AI聊天機器人能像醫生一樣推理嗎?

一項發表在《科學》雜誌上的新研究表明,OpenAI的大型語言模型在臨牀推理任務上表現優於醫生,但也引發了關於可靠性、評估標準和對醫療實踐影響的討論。

  • OpenAI的o1-preview模型在多個臨牀推理任務上超越醫生,包括使用真實急診記錄。
  • 聊天機器人在醫療信息方面存在幻覺、錯誤引用和不一致等問題。
站內正文

檔案管理員藉助大型語言模型大規模破譯手寫文字

通用大型語言模型在轉錄歷史手寫文字方面展現出日益強大的能力,在準確性、速度和成本上超越了Transkribus等專用工具,使得以往難以訪問的檔案資料變得可檢索。

  • LLM可將歷史手寫文字的字符錯誤率降至2%以下,超越專用軟件。
  • 該技術已被歷史學家、檔案管理員和美聯儲等機構用於挖掘隱藏數據。
站內正文

化解千兆級問題:如何解決極端AI訓練負載的物理電力悖論

隨着AI工作負載達到千兆級規模,數據中心行業面臨電力鏈的動態韌性瓶頸。GPU集羣產生的高頻脈衝負載可導致電壓暫降和頻率不穩,傳統備用電源無法應對毫秒級波動。Ampace與伊頓合作,通過半固態電池技術和先進UPS系統,將儲能從被動備份轉變為主動高速穩定器,解決AI時代的電力悖論。

  • AI訓練負載引發電力鏈的物理瓶頸,傳統電網和備用電源無法響應毫秒級脈衝。
  • Ampace的PU系列半固態電池作為高速“減震器”,通過超低內阻消除功率尖峯。
站內正文

全部來源

IEEE Spectrum AI AI 新聞來源 | AI News Hub