正交性之後:美德倫理智能體與AI對齊
本文論證理性的人沒有目標,理性的AI也不應有目標。人類行為之所以理性,並非因為我們將其指向某些最終“目標”,而是因為我們將行為與實踐對齊。文章提出“幸福理性”概念,認為AI對齊應將AI智能體的審議與基於實踐的邏輯共享相同“類型簽名”,並探討這種框架對AI安全、透明度、可修正性等核心屬性的意義。
- 理性行為源於對實踐的參與,而非追求目標
- 幸福理性是自然且有效的理性形式
Independent publication; summary-only unless authorization is obtained.
本文論證理性的人沒有目標,理性的AI也不應有目標。人類行為之所以理性,並非因為我們將其指向某些最終“目標”,而是因為我們將行為與實踐對齊。文章提出“幸福理性”概念,認為AI對齊應將AI智能體的審議與基於實踐的邏輯共享相同“類型簽名”,並探討這種框架對AI安全、透明度、可修正性等核心屬性的意義。
本文作者認為,通過多模態擴展來實現通用人工智能(AGI)的道路註定失敗。真正的智能需要具身認知和對物理世界的理解,而當前的大型語言模型(LLM)和多模態模型僅從符號處理中學習,缺乏對現實的深層把握。作者主張放棄拼湊多模態的方式,轉向以具身交互為核心的智能研究。
本文探討了數學在機器學習研究中的角色演變。儘管大規模計算和數據驅動的方法取得了顯著成功,但數學仍然至關重要,只是其作用從提供理論保證轉向了事後解釋和高層次設計。文章展示了內在維度、曲率、拓撲學、對稱性和範疇論等數學概念如何幫助理解深度學習的內部機制,並指出純數學領域如拓撲學和幾何學正與機器學習深度融合,為模型分析和設計提供新工具。
文章指出,儘管LLM聊天機器人在基準測試中不斷進步,但用户體驗並未同比提升。當前對話系統缺乏目標感,易出現角色漂移,難以實現長期目標導向的交互。作者提出對話動作令牌(DAT)方法,通過強化學習引導模型進行多輪目標驅動對話,並探討了未來研究方向。
本文探討如何確保AI造福人類,提出應以人類福祉為核心,構建積極願景。儘管福祉定義存在爭議,但公認的要素如親密關係、有意義的工作、成長和積極情緒等可作為基礎。文章強調需要制定衡量AI對福祉影響的指標,訓練模型以支持福祉,並以促進福祉的方式部署AI。
本文探討了大語言模型(LLM)在金融市場中的應用潛力與挑戰。儘管LLM在自然語言處理中表現優異,但在金融時間序列預測中面臨數據稀缺、噪聲多、對抗性環境等問題。文章分析了多模態學習、殘差化、長上下文窗口等技術的可能用途,並指出合成數據生成和基礎分析輔助是更可行的方向。總體保持謹慎樂觀。
本文綜述了AI模型中性別偏見的研究,包括詞嵌入、人臉識別、指代消解、大語言模型和圖像生成模型中的偏見,並討論了研究空白、其他類型的偏見以及解決偏見的方法與哲學問題。
Mamba是一種基於狀態空間模型的新型AI架構,通過選擇性機制實現高效的長序列處理,在語言建模上媲美甚至超越同等規模Transformer,為AI發展開闢了新方向。
探索大型語言模型在自動駕駛中的效用:它們能否被信任用於無人駕駛汽車,關鍵挑戰是什麼?
本文介紹了 vec2text 方法,一種能夠從文本嵌入向量中完美還原原始文本的技術,揭示了當前 RAG 系統和向量數據庫在數據安全方面的重大隱患。