正交性之后:美德伦理智能体与AI对齐
本文论证理性的人没有目标,理性的AI也不应有目标。人类行为之所以理性,并非因为我们将其指向某些最终“目标”,而是因为我们将行为与实践对齐。文章提出“幸福理性”概念,认为AI对齐应将AI智能体的审议与基于实践的逻辑共享相同“类型签名”,并探讨这种框架对AI安全、透明度、可修正性等核心属性的意义。
- 理性行为源于对实践的参与,而非追求目标
- 幸福理性是自然且有效的理性形式
Independent publication; summary-only unless authorization is obtained.
本文论证理性的人没有目标,理性的AI也不应有目标。人类行为之所以理性,并非因为我们将其指向某些最终“目标”,而是因为我们将行为与实践对齐。文章提出“幸福理性”概念,认为AI对齐应将AI智能体的审议与基于实践的逻辑共享相同“类型签名”,并探讨这种框架对AI安全、透明度、可修正性等核心属性的意义。
本文作者认为,通过多模态扩展来实现通用人工智能(AGI)的道路注定失败。真正的智能需要具身认知和对物理世界的理解,而当前的大型语言模型(LLM)和多模态模型仅从符号处理中学习,缺乏对现实的深层把握。作者主张放弃拼凑多模态的方式,转向以具身交互为核心的智能研究。
本文探讨了数学在机器学习研究中的角色演变。尽管大规模计算和数据驱动的方法取得了显著成功,但数学仍然至关重要,只是其作用从提供理论保证转向了事后解释和高层次设计。文章展示了内在维度、曲率、拓扑学、对称性和范畴论等数学概念如何帮助理解深度学习的内部机制,并指出纯数学领域如拓扑学和几何学正与机器学习深度融合,为模型分析和设计提供新工具。
文章指出,尽管LLM聊天机器人在基准测试中不断进步,但用户体验并未同比提升。当前对话系统缺乏目标感,易出现角色漂移,难以实现长期目标导向的交互。作者提出对话动作令牌(DAT)方法,通过强化学习引导模型进行多轮目标驱动对话,并探讨了未来研究方向。
本文探讨如何确保AI造福人类,提出应以人类福祉为核心,构建积极愿景。尽管福祉定义存在争议,但公認的要素如亲密关系、有意义的工作、成长和积极情绪等可作为基础。文章强调需要制定衡量AI对福祉影响的指标,训练模型以支持福祉,并以促进福祉的方式部署AI。
本文探讨了大语言模型(LLM)在金融市场中的应用潜力与挑战。尽管LLM在自然语言处理中表现优异,但在金融时间序列预测中面临数据稀缺、噪声多、对抗性环境等问题。文章分析了多模态学习、残差化、长上下文窗口等技术的可能用途,并指出合成数据生成和基础分析辅助是更可行的方向。总体保持谨慎乐观。
本文综述了AI模型中性別偏见的研究,包括词嵌入、人脸识别、指代消解、大语言模型和图像生成模型中的偏见,并讨论了研究空白、其他类型的偏见以及解决偏见的方法与哲学问题。
Mamba是一种基于状态空间模型的新型AI架构,通过选择性机制实现高效的长序列处理,在语言建模上媲美甚至超越同等规模Transformer,为AI发展开辟了新方向。
探索大型语言模型在自动驾驶中的效用:它们能否被信任用于无人驾驶汽车,关键挑战是什么?
本文介绍了 vec2text 方法,一种能够从文本嵌入向量中完美还原原始文本的技术,揭示了当前 RAG 系统和向量数据库在数据安全方面的重大隐患。