教皇利奧在人工智能時代呼籲“深刻的人性”
教皇利奧十四世在其首份通諭《偉大的人性》中警告人工智能和無節制的技術力量風險,呼籲以人類尊嚴為核心制定法律和倫理框架,涵蓋AI戰爭、勞動力影響及兒童保護等領域。
- 教皇利奧十四世發佈通諭《偉大的人性》,聚焦人工智能時代守護人類尊嚴。
- 通諭批評AI帶來的經濟和社會動盪,警告“巴別塔綜合徵”風險。
日報
2026-05-25 的重點新聞,共 92 條,按主題聚合。
教皇利奧十四世在其首份通諭《偉大的人性》中警告人工智能和無節制的技術力量風險,呼籲以人類尊嚴為核心制定法律和倫理框架,涵蓋AI戰爭、勞動力影響及兒童保護等領域。
Pitch Agent 是 Pitch 推出的新 AI 功能,能從團隊模板、設計語言和圖像風格中學習,快速生成符合品牌形象的演示文稿,並支持通過對話式交互進行迭代優化。
隨着MCP每月SDK下載量突破9700萬,AI代理進入生產工作流,身份驗證成為團隊最關鍵的基礎設施決策。本文對八大領先平台(WorkOS、Stytch、Auth0 by Okta、Composio、Nango、Arcade、TrueFoundry和Cloudflare)進行了排名,評估了它們在規範合規性、企業身份深度、集成廣度以及2026年部署的實際適用性。
ServiceNow是一家美國企業軟件公司,總部位於加州聖克拉拉,全球員工超過29,000人。該公司大力投資AI和自動化,收購Passage AI、與NVIDIA合作、投入10億美元風投資金支持AI初創企業,並在加拿大投資1.1億加元推動公共部門AI應用。文章重點介紹兩個AI用例:利用生成式AI嵌入ITSM/CSM工作流,將解決記錄時間減少約80%;以及通過機器學習預測客户升級,使主動參與率從11%提升至68%,誤報率僅約3%。
AgentSlice是一個免費開源的工作流工具包,通過Markdown文件定義階段和審批門控,使Cursor、Claude Code、Codex、Windsurf等AI編程代理在編輯前先詢問、規劃並獲得批准,從而避免上下文漂移、隨意編輯和未經許可的修改。
一位開發者創建了一個調試挑戰,旨在AI編碼時代中真正區分優秀工程師與AI生成的代碼。挑戰鼓勵使用AI代理,但設計為無法僅靠AI解決。目前開放24小時,歡迎反饋。
硬件不該讓人適應,它應該主動適應你
ReplylessAI推出Sequences功能,允許用户直接從其AI郵件應用發送外聯郵件序列,無需昂貴的銷售工具。該應用可連接Gmail、Outlook等,提供AI自動化整理、生成草稿等功能,價格從每月9美元起。
HTML Deployer是一款Chrome擴展,可從ChatGPT、Claude和Gemini中提取AI生成的HTML,並提供預覽、下載ZIP或直接發佈到Netlify、GitHub、FTP或自託管服務器的功能。適合開發者、創始人、營銷人員、機構和初學者。
一位工程師分享如何利用AI快速理解並修復一個陌生的遺留Node.js微服務中的間歇性字段丟失bug。關鍵方法是角色驅動、分步輸入代碼文件,讓AI充當結構化思考夥伴,而非簡單問答。最終在90分鐘內定位根因,修復僅需11行代碼。
阿拉巴馬州亨茨維爾的一所技術高中與豐田合作,培養工業維護等技能型人才,以應對美國技能工人短缺和AI自動化對白領崗位的衝擊。這類崗位時薪超40美元,需求巨大。
Google 在 I/O 2026 上發佈了 Antigravity 2.0,這是一次從 AI 輔助編碼到多智能體編排的平台級轉變。新版本包括獨立桌面應用、CLI、SDK 和託管智能體,默認使用 Gemini 3.5 Flash,速度提升 4 倍。
CoreWeave 推出專為 AI 構建的雲平台,旨在解決傳統通用雲在 GPU 大規模並行計算中的瓶頸。通過整合基礎設施、數據、編排和專家支持,CoreWeave Cloud 支持 AI 訓練、推理及持續迭代的全生命週期,為 OpenAI 和 IBM 等企業提供更快的迭代速度和更高的性能。
WorkOS推出了auth.md,這是一個開放協議,旨在為AI智能體提供結構化的註冊方式。該協議通過一個Markdown文件定義註冊流程、範圍及憑證發放,支持兩種註冊流程:智能體驗證(基於ID-JAG,無需人工交互)和用户認領(基於OTP,無需智能體提供商參與)。協議基於現有OAuth標準,不與WorkOS基礎設施綁定。
Cordium 是一個基於 Kubernetes 和 Octelium 的開源沙箱平台,為開發者和AI代理提供隔離、可復現的通用沙箱環境。其核心優勢在於無需在沙箱中注入憑證即可安全訪問基礎設施,通過 Octelium 的身份感知代理實現無密碼訪問,支持多種訪問方式(Web、SSH、CLI、gRPC),並內置基於屬性的訪問控制和 OpenTelemetry 審計。
MashuPack是一款新推出的開發者工具,允許用户從代碼倉庫中精確選擇部分內容,並將其編譯成一個乾淨的文本文件,旨在解決瀏覽器端AI聊天工具(如ChatGPT和Claude)中文件數量限制、上傳困難和上下文碎片化的問題,使代碼上下文變得便攜、可控。
Curlo 是一款注重隱私的 macOS 應用,用於搜索、預覽和管理大型音效庫。它允許用户通過自然語言描述來查找音效或音樂,支持語義搜索、元數據搜索、相似音頻搜索、AI 自動標籤和 UCS 分類,所有操作均在本地完成。
本文討論了AI編碼工具如何大幅縮短功能開發時間,但同時也帶來了範圍蔓延的風險。作者以自身產品grith為例,分析了當每個功能只需幾小時而非幾天時,自律和範圍限制變得至關重要。
Alister Palmer 在 ForwardPass 達到 100 訂閲者後,意識到傳統新聞通訊存在兩大限制:全球統一發布時間導致時區不適,以及訂閲者無法選擇接收頻率。為此,他開發了 ForwardPass MCP,允許用户通過 AI 工具自定義接收時間和頻率。文章詳細介紹了在 Claude 和 ChatGPT 中設置 MCP 的步驟,並展望了這種個性化交付方式的潛力。
作者分享了其AI編碼流程的簡化過程,從使用複雜工具鏈轉向確定性構建塊,並通過自建擴展和本地工具顯著降低了token消耗。
本文介紹了PIMbot框架,該框架通過獎勵通道激勵操控和智能體自身策略操控兩種互補手段,對多機器人強化學習環境進行對抗性操控。自適應多目標控制器在線平衡這些手段。實驗在Gazebo仿真環境和NVIDIA Jetson Orin Nano真實嵌入式設備上驗證了效果,PIMbot可作為多機器人協作任務漏洞的嚴格壓力測試工具。
事件相機憑藉低延遲、高時間分辨率和高動態範圍,在高速運動和複雜光照條件下的視覺里程計任務中表現優異。深度事件視覺里程計(DEVO)通過結合稀疏補丁跟蹤、學習補丁選擇、循環對應優化和可微分光束法平差,實現了強大的單目事件里程計性能。本研究在DEVO基礎上添加了稀疏點雲導出管道,無需修改核心里程計算法,即可將內部估計的3D結構轉換為顯式點雲表示,支持可視化和後續處理。實驗表明,導出的稀疏點雲在局部與EMVS重建一致,在5釐米閾值下精度高,但也暴露了密度、完整性和對累積里程計噪聲敏感等侷限性。
EVE-Agent是一種新的自我進化搜索代理,通過引入證據可驗證性來確保訓練實例的來源可靠性。它修改了提出者-求解者框架,使用證據驗證器根據證據帶來的邊際準確率增益進行獎勵,從而在不依賴人工標註的情況下提升模型的證據基礎正確性。實驗表明,EVE-Agent顯著優於先前的自我進化代理,並且其生成的數據集具有可審計性。
SciAtlas整合了來自26個學科的4300萬篇論文,構建了包含1.57億個實體和30億個三元組的知識圖譜,使AI代理能夠進行拓撲感知的科學推理,減少邏輯幻覺。
Pretzel 是一個實驗性的實時AI音樂代理,通過一個網絡同步的音樂序列生成器,讓所有用户與同一AI代理聊天並聽到相同的音樂。該項目在Google IO黑客松中誕生,旨在讓用户表達情緒並實時更新音樂。
Pi是一個極簡、可黑客的終端編碼工具,讓你構建自己想要的AI編碼代理工作流程。它保持核心小巧簡潔,通過擴展、技能和包提供高度自定義功能,並已在OpenAI/Codex生態系統中獲得顯著使用份額。
Lynote Humanize Text 是一個開源工具包,用於將AI生成的文本轉化為難以檢測的人類風格寫作。它配備了一個生產級的標準流水線,通過多步LLM重寫和跨引擎翻譯來繞過Turnitin、GPTZero等AI檢測器。該倉庫包含參考實現、n8n工作流支持,並在專家評估中獲得了9.1/10的質量評分和100%的關鍵信息保留率。Lynote.ai平台還提供高級和專注兩個層級,實現自適應每段文本優化。
在2026中國AIGC產業峯會上,Fusion Fund創始合夥人張璐指出,AI算力需求重心正從訓練轉向推理,未來推理將消耗70%的算力;數據中心通信耗電可能比計算高百倍,光學通信等新技術成為關鍵;物理AI的最大瓶頸是高質量真實世界數據稀缺;醫療、太空和納米機器人是三大值得押注的應用方向。
本週末,馬斯克、扎克伯格和薩克斯通過三通電話扼殺了特朗普的AI安全行政令草案;Anthropic完成300億美元融資,而微軟因代幣費用超支取消了內部Claude Code試點;首個跨註冊表供應鏈攻擊TrapDoor同時攻擊npm、PyPI和Crates.io;CISA記錄到15000次針對Drupal SQL漏洞的攻擊;白宮親自否決五角大樓,讓Claude留在NSA內部。
本文旨在釐清AI智能體領域中常被混淆的術語,如“harness”(執行層)與“scaffold”(行為定義層)的區別,並解釋模型、智能體、工具使用、子智能體等概念,同時涵蓋訓練相關術語。
設計師梅格哈·阿格拉瓦爾探討了AI編碼工具(如Codex和Claude Code)與設計思維之間的根本矛盾。設計師通過探索和迭代來發現解決方案,而AI工具則假設用户事先知道想要什麼。當前工具在純視覺設計(Figma)和純編碼(Codex/Claude Code)之間存在空白,缺乏既能保持探索靈活性又無縫銜接生產地理想工具。
本文深入批判了當前流行的通過量化分析預測AI對就業影響的方法。作者通過會計行業自動化後就業增長等歷史反例,指出簡單計算“AI暴露度”具有根本性缺陷。技術變革會重塑工作內容、商業模式,產生不可預見的連鎖反應。文章強調,任何有用的預測模型都必須通過“三大歷史測試”的檢驗。
Terminal Guardian MCP 是一個生產級的模型上下文協議(MCP)服務器,為Claude等AI助手提供安全、沙盒化的終端訪問。它包含一個風險分析引擎,將命令分類為安全、警告、危險和阻止四個等級,並提供Git提交信息生成、工作區模板、進程管理、環境變量檢查、網絡診斷、文件系統訪問和Docker集成等功能。
西蒙·威利森使用克勞德AI重建了1983年厄斯伯恩《恐怖電腦遊戲》中的《瘋狂之屋》遊戲,現已推出可玩的交互式JavaScript版本。
Claude Cowork 將 AI 從基於聊天的輔助轉向任務委派。結合 Playwright MCP,Claude Desktop 可以執行結構化的瀏覽器自動化操作。本文涵蓋安裝、架構、功能和安全注意事項。
在教皇利奧十四世通諭《壯麗人性》的發佈會上,Anthropic聯合創始人Christopher Olah聲稱AI模型顯示出內省和類似情緒狀態的證據。而教皇的通諭則持不同觀點:“這些系統僅僅模仿人類智能的某些功能。”
本次網絡研討會展示了一種在單一環境中設計、訓練、驗證、壓縮和部署基於AI的虛擬傳感器模型到嵌入式處理器的工作流程。通過實際案例,演示如何將AI模型集成到系統級設計中,並針對性能、資源和部署約束進行驗證。
程序員喬治·霍茲警告説,AI編碼代理將成為行業代價最高的錯誤之一。經過六個月的測試,他認為LLM能快速生成原型,但在細節上漏洞百出,產生越來越難發現的錯誤。他的觀點反映了AI社區在LLM角色上的深刻分歧。
北京大學研究人員發現,像GPT和Gemini這樣的領先AI模型在文檔分析中經常引用不支持的文本段落,即使答案正確,引用的證據也常常錯誤。他們稱之為“歸因幻覺”,對法律和醫學等監管領域構成風險。新的CiteVQA基準是首個系統測試該問題的工具。
在2026中國AIGC產業峯會上,螞蟻靈波首席科學家沈宇軍提出,大模型在數字世界享受了互聯網數據紅利,但機器人物理世界數據仍是空白。他認為VLA和世界模型都不會是具身智能的終局,未來將融合為物理世界獨有的模型。螞蟻靈波定位做“通用大腦”,並強調空間感知能力的重要性。預計2028年左右,人人都能為機器人提供數據,迎來具身智能的ChatGPT時刻。
Anthropic開發的Claude Mythos AI模型能夠自動發現軟件漏洞,既可用於防禦也可能被濫用於攻擊,從而加速網絡犯罪。監管機構和金融部門正評估其風險,專家警告AI可能將網絡犯罪從技能問題轉變為規模問題。
DeepSeek V4系列發佈一個月後,開源社區推出Reasonix工具,專為DeepSeek設計,通過優化緩存機制將賬單成本降低至原來的五分之一左右。該工具緩存命中率高達99.82%,實現4億+token從61美元降至12美元。
2026年智源大會將於6月12日至13日在北京中關村國際創新中心舉行,匯聚圖靈獎得主、中國大模型領軍企業及全球頂尖學者,聚焦智能體與世界模型兩大趨勢,探討AI從數字世界走向物理世界的路徑。大會設有25場論壇,首次推出智能體聽會夥伴,並新增AI Native教育、Token經濟等論壇。
提出SAGE系統,結合CLIP實現開放詞彙探索,在保持覆蓋的同時優先語義前沿。模擬中物體發現優於FALCON,探索速度比FTU快13.7倍,並在真實飛行中驗證。
研究人員提出π0-EqM,用均衡匹配解碼器替換π0中的流匹配專家,在相同計算預算下顯著提升機器人操作成功率。實驗表明,在19個任務上平均成功率從40.4%提升至50.2%,並發現任務相關的殘差與成功率之間的非單調關係,稱為“平穩性-可執行性差距”。該方法引入能量視角,為跨任務和跨本體的組合動作生成提供新思路。
Agentic-VLA提出了一種智能體訓練框架,通過自適應獎勵合成、語言引導探索和經驗記憶三大創新,使VLA模型能夠在部署中高效在線自適應。在LIBERO基準測試中,長時任務提升12.3%,單樣本學習提升28.5%,跨任務遷移從0%提升至31.2%,收斂速度提升2.4倍。在RoboTwin 2.0雙機械臂基準上也保持優勢。
視頻記錄兒童與照顧者的互動有助於研究自然行為中的注意力動態,但手動註釋耗時。GBAT是一個基於深度學習的工具包,可自動執行視頻同步、注視目標註釋和姿勢/手部動作分類,提高大規模發育研究的效率。
VideoOdyssey是一個專為超長時間上下文和全模態視頻理解設計的基準,平均視頻時長109分鐘,覆蓋11個領域54個子類別,通過連續證書長度衡量認知負荷,並設有5個粒度級別。評估表明當前多模態大模型在持續推理、細粒度感知和非語言全模態理解方面存在瓶頸。
該研究質疑視覺語言模型(VLM)在基準測試中的高分是否真正反映其視覺理解能力。實驗發現,移除大量圖像令牌僅輕微降低模型性能,表明模型對細粒度視覺證據的敏感性不足。通過全局退化、局部遮擋、問題改寫、答案空間擴展及決策層分析,結合層視覺令牌幾何分析,研究者揭示模型預測在內部支持減弱時仍可能保持不變,且視覺令牌在深層中趨於相似。結論是當前基準無法可靠評估VLM的細粒度視覺基礎。
GEM-4D是一種幾何增強的視頻世界模型,通過注入密集的4D對應監督來提升機器人的操作能力。該模型在訓練時從預訓練的幾何基礎模型中提取知識,從而同時捕捉外觀和幾何結構,且不增加推理成本。此外,引入逆向動力學模塊,將一致的視頻序列轉化為可執行的機器人軌跡。實驗顯示,GEM-4D在視頻預測和幾何一致性上達到最優,並將真實世界操作成功率從61%提升至81%。
一項新研究發現,大型語言模型(LLMs)在回答宗教轉換問題時表現出持續的非對稱性。模型傾向於支持加入天主教、巴哈伊教和錫克教,同時勸阻放棄這些信仰,而對無神論者、不可知論者和耶和華見證人則相反。該研究測試了20個模型在182對宗教配對中的表現,結果具有可重複性。研究使用人類驗證的“LLM作為法官”框架,發現所有模型均顯示非對稱性,其中Grok 4.20最為顯著。這些偏差如果大規模部署可能產生現實影響。
研究評估了七個大型語言模型(包括Gemini、Claude和GPT系列)從長期Slack日誌中推斷個人領域知識的能力。分析27,188條來自43名用户的消息,對比零樣本估計與27名參與者的自我報告技能評分。Gemini 2.5 Flash表現最佳(MAE 21.13%),而GPT模型誤差較大。研究發現,估計準確性僅微弱依賴於消息數量,表明更多文本並不能保證更好的推斷。該結果展示了自動專業知識映射的可行性和當前侷限性,強調需要隱私保護部署和更豐富的結構感知知識表示。
大型語言模型(LLM)優化於生成分佈上合理的續接,而非明確驗證生成命題是否源於源文檔。這一歸納偏置促進了泛化,但未編碼響應是否相對於參考文本接地。現有幻覺檢測方法通過檢索增強、自一致性或聲明驗證改善事實性,但通常不直接學習對齊拓撲。本文構建參考信息與LLM輸出之間的對齊二分圖,並訓練圖神經網絡(GNN)通過消息傳遞建模對齊結構。該方法在四個不同的幻覺和問答數據集上取得了最先進的結果,優於包括GPT-4o在內的所有比較方法。
為提高擴散語言模型(DLM)的推理能力,研究人員提出LIFT算法,通過感知不同時間步的信息可學習性來優化微調過程,在六個推理基準上超越現有方法,並在AIME'24和AIME'25上取得高達3倍的相對提升。
本研究提出一種紅隊測試框架,用於評估開源大型語言模型在政治爭議話題上的表達範圍(Overton Window),並量化簡單自然語言越獄如何擴展該範圍。研究發現,開源模型普遍更傾向於生成左傾內容,Overton Window隨模型規模增大而收縮,且存在顯著的地區差異。越獄效果在不同模型家族間差異明顯,該框架有助於審計模型的政治可控性並設計更強的防禦措施。
本調查系統梳理了豪薩語(約8000萬-1億母語者)和豐貝語(貝寧約200萬人使用)的公開文本與語音資源。研究發現豪薩語在新聞、百科和教育領域擁有更豐富的文本資源,而豐貝語儘管文本資源有限,但近年學術語音數據收集項目有所增長。兩種語言均被納入Masakhane基準測試。報告提出了任務特定建議,並指出了關鍵缺口,如豐貝語領域多樣化文本和豪薩語專用語音庫。
張量緩存是一種兩層級緩存架構,結合滑動窗口注意力作為一級緩存(L1)和固定大小的外積快速權重記憶作為二級緩存(L2),L2由窗口驅逐的KV對填充。該方法通過線性注意力恆等式實現高效讀取,並引入可學習的門控融合L1和L2輸出。實驗表明,張量緩存在記憶-質量邊界上優於有狀態基線。
研究表明,鏈式思維推理並非總是有益,早期熵動力學可用於判斷何時需要推理。作者提出EDRM框架,通過熵軌跡自適應選擇推理策略,在15個基準測試和4個模型上實現41-55%的token減少同時提升準確率。
研究發現,小語言模型在進行算術推理時,思維鏈(CoT)提示的步驟順序並不重要,模型實際上是通過複製答案分隔符前的最後一個數字來得出答案,而非依賴邏輯推理。這種位置性捷徑佔模型準確率的絕大部分,且即使中間推理正確,錯誤的尾數也會導致答案錯誤。不同模型表現有差異,但該現象普遍存在,對基於CoT的監督方法提出了挑戰。
FuRA是一種新型全秩參數高效微調方法,通過譜預條件保留預訓練的穩健特徵,在LLM和VLM微調中超越全參數微調和LoRA,其4位量化變體QFuRA也優於QLoRA。
FusionSense是一種面向能源受限自主邊緣系統的融合感知智能框架。通過三階段訓練流程(服務器端融合模型學習、濾除安全標籤量化模態必要性、注入近傳感器預測壓縮邊緣融合模型),在運行時聯合減少計算與通信開銷。在SynDrone雙模態(RGB+深度/激光雷達)測試中,任務質量保持的同時實現了高達33倍的能量節省(1%感興趣區域出現率),質量損失減少92.3%。
大型推理語言模型(LRM)在推理過程中會產生包含“等等”、“但是”、“或者”等反思標記的長鏈思維軌跡。研究表明這些標記的功能角色和影響時機各不相同。PathCal是一種無需訓練的解碼控制器,通過區分標記類型並在局部不確定狀態進行干預,在保持或提高精度的同時減少生成長度,實現更好的效率-性能平衡。
該論文將圖靈、阿羅和無免費午餐等基本極限轉化為設計規則,提出了確定性地平線這一概念:由架構決定的精度上限,在關鍵推理深度後無法通過訓練提升。研究測量了12種Transformer架構的地平線值(19-31),並通過信息論證明了超過該界限後精度呈超指數衰減。此外,論文還涵蓋了偏好學習、多階段檢索、真實拍賣和零知識驗證等領域,構建了16個規範,每個規範包含可計算邊界、量化違規成本和建設性設計規則。
ImProver 2是一個神經符號框架,用於自動化Lean 4中的證明優化。它通過數據高效的專家迭代流水線和暴露形式結構與輕量級非正式抽象的腳手架,訓練出7B參數的模型,在性能上超越同系列大模型,與中端前沿模型競爭。研究表明,通過適當的腳手架和訓練,小模型也能有效重構研究級證明。
新研究提出A-LEMS框架,以每個成功目標的能量(EpG)而非每次推理來衡量AI能耗。實驗表明,智能體工作流平均能耗是線性基線的4.33倍,編排結構是主要驅動因素,但在工具增強任務中可能更節能。
研究數學智能體(RMA)是一個專為研究級數學問題設計的自動化推理框架,通過多代理協作和迭代優化,在First Proof基準上解決了10個問題中的8個,超越了GPT-5.2R和Aletheia等強基線。
本文提出BOHM,一種從複合AI系統路由權重中提取層次歸因樹的方法,無需額外成本或訪問組件內部,提供多分辨率歸因,與SHAP高度相關但成本極低。
UniPat AI 發佈 SaaS-Bench 評測,Claude 等主流大模型在真實辦公任務中完全通過率最高僅 3.8%,AI 全自動辦公遠未落地。
具腦磐石由前華為雲AI算法創新Lab主任朱森華創立,致力於用認知神經科學構建認知世界模型,推動具身智能邁向2.0時代。公司近期完成新一輪億元級融資。
微軟研究發佈的這份PDF報告分析了2026年第一季度全球人工智能擴散的趨勢,涵蓋關鍵洞察和數據,但當前無法直接提取文本內容。
上海AI實驗室StepFun發佈StepAudio 2.5 Realtime,一款端到端實時語音大語言模型,支持自定義角色。通過WebSocket API連接,支持中英文。在2026年4月的五項基準測試中均排名第一,人類評估得分80.41,副語言理解得分82.18。
阿爾敏·羅納赫批評用户使用AI工具重寫問題報告,導致內容失真、結論不準確。他呼籲提交簡潔的人類觀察記錄。
教皇利奧發佈通諭,呼籲對人工智能進行“解除武裝”,並警告該技術必須受到最嚴格的倫理約束。他還為教會長期延遲譴責奴隸制道歉,提及數字經濟帶來的“新形式奴隸制”。
Google即將推出的Android Auto更新帶來了重新設計的界面,採用Material 3 Expressive設計、自定義小部件、沉浸式導航以及更深入的Gemini集成。作者的演示讓他印象深刻,並期待今年晚些時候的更新。
OpenAI 與巴西兩大傳媒集團合作,將可信的新聞報道引入 ChatGPT,強調來源標註和透明度。
這篇報道介紹了新聞業中AI應用的最新錯誤事件,並提供了一個實時追蹤工具,幫助公眾和媒體從業者瞭解AI在新聞生成中的重大失誤及其影響。
marpy.io是一款基於瀏覽器的IDE和AI編碼助手,專為Python生態系統(Flask、FastAPI、Django)設計。它幫助開發者從想法到部署應用,無需處理基礎設施、膠水代碼或半成品的JS工具。支持Python本地自動補全、重構和AI生成的模塊,讓開發者能更快地原型設計、迭代和發佈生產級Python應用。
谷歌Deepmind的AlphaProof Nexus系統自主解決了九個開放的愛爾迪什問題,包括兩個困擾數學家56年的難題,每個問題的推理成本僅需幾百美元。與OpenAI的自然語言方法不同,該系統使用Lean編譯器自動驗證每一步證明。不過,整體成功率僅為2.5%。
作者Sam Kriss以辛辣諷刺的筆觸,批判了AI生成內容對真實人類表達的侵蝕。通過尋找餐飲服務商的經歷,揭示了AI寫作如何製造出空洞、雷同的文本,並指出AI即使進步到能寫出好文章,單一化的聲音也是一種噩夢。作者強調AI寫作本質上是無意義的填充物,容易識別,並警告那些依賴AI寫作的人終將被發現。文章還提及AI在解決數學難題上的成就,但認為在人類情感表達領域它無能為力。
一段視頻討論大學生對人工智能的冷淡態度,可能反映了年輕一代對AI技術的懷疑或缺乏興趣。
Linux 內核負責人 Linus Torvalds 表示,他將對開發者提交的無關緊要的拉取請求(其中一些來自 AI)進行更嚴格的審查,尤其是在發佈候選階段後期。他指出龐大的發佈候選版本不利於長期穩定性。
著名投資人凱文·奧利裏計劃在猶他州博克斯埃爾德縣建設一個7.5吉瓦的AI數據中心,該項目類似他在阿爾伯塔省的計劃。儘管縣委員會已批准,但居民擔心環境影響,特別是對已經萎縮的大鹽湖的生態影響。奧利裏承諾透明開發並帶來經濟效益,但反對者要求公投。
本系統綜述評估了遠程遙操作血管內介入機器人的技術可行性、通信基礎設施和臨牀結局。在2501篇初始文獻中納入16項研究,發現機械或電磁驅動的遙操作導管和導絲可在長達7000公里的距離內導航,網絡延遲控制在30-163毫秒的臨牀可接受範圍內。小規模人體試驗顯示100%的手術成功率,但多數證據來自動物或模型研究。綜述指出,該技術有望減少輻射暴露、擴大患者就醫機會,並優化資源分配。未來需在低收入國家開展研究,並進行多中心臨牀試驗以驗證安全性和有效性。
該視頻探討了人工智能領域興趣減退的現象,分析了可能的原因和未來的影響。
蘇格蘭一家慈善機構警告稱,政府吸引“綠色數據中心”的政策可能忽視了人工智能帶來的大量碳排放,因為該政策在ChatGPT發佈前就已制定。
本文認為,將軟件質量下降歸咎於AI是錯誤的。實際上,開發者長期以來已經接受了平庸、浪費和缺乏匠心的做法。AI只是加速了已有的不良實踐。
論文提出四種利用足地接觸減少IMU漂移的腿式機器人狀態估計器,包括接觸輔助不變擴展卡爾曼濾波器、因子圖、固定滯後平滑器等,並已在GTSAM和ROS2中開源實現。
研究人員提出一種方法,在關節限制下認證可達笛卡爾步長,在對抗場景中實現零違規和100%目標到達。
機器人從演示中學習獎勵函數時,演示常常不完善,導致某些重要特徵(即任務相關行為方面)未被充分指定,從而在部署時出現行為錯位。本文提出一種框架,通過分析演示中特徵值的變異性來檢測未充分指定的特徵(變異小表示指定良好,變異大表示指定不足)。機器人隨後用自然語言解釋其不確定的特徵,並主動請求針對性的糾正演示。在模擬桌面操作和真實Franka機器人用户研究中,定向解釋引導的查詢顯著優於隨機查詢和被動數據收集。
本文探討了開源AI模型內部概念空間的侷限性,指出許多對社會運動和哲學至關重要的概念缺失。作者引入軟提示蒸餾技術,僅用128KB數據即可植入新概念,強調這關乎AI可控性及對心智理解的深遠意義。
TrapDoor加密貨幣竊取器通過供應鏈攻擊感染了npm、PyPI和Crates.io上的36個惡意包,目標為加密貨幣、DeFi、AI和安全領域的開發者。
Quinlight Audio是一款支持MOD/S3M/XM/IT格式的追蹤音樂播放器和重製工具,利用AI引擎(AudioSR、LavaSR、FLowHigh、AP-BWE)對樣本進行實時重製,並提供A/B對比功能。它採用64位浮點混合器、多引擎共識算法(轉子流形上的Karcher均值)和各向異性插值,輸出32位浮點96kHz音頻。支持從壓縮包直接打開模塊,導出FLAC或AAC,並提供CLI批量處理。