The Gradient AI 新闻来源

公开文章 10采集文章 10可信度 80刷新频率 120 分钟

健康状态健康来源类型研究原文权限 站内改写最近入库 2026-05-05ID the-gradient运行状态 已启用

Independent publication; summary-only unless authorization is obtained.

最新公开文章

正交性之后：美德伦理智能体与AI对齐

2026-02-19 07:25 UTC+8

本文论证理性的人没有目标，理性的AI也不应有目标。人类行为之所以理性，并非因为我们将其指向某些最终“目标”，而是因为我们将行为与实践对齐。文章提出“幸福理性”概念，认为AI对齐应将AI智能体的审议与基于实践的逻辑共享相同“类型签名”，并探讨这种框架对AI安全、透明度、可修正性等核心属性的意义。

理性行为源于对实践的参与，而非追求目标
幸福理性是自然且有效的理性形式

AGI并非多模态

2025-06-04 22:00 UTC+8

本文作者认为，通过多模态扩展来实现通用人工智能（AGI）的道路注定失败。真正的智能需要具身认知和对物理世界的理解，而当前的大型语言模型（LLM）和多模态模型仅从符号处理中学习，缺乏对现实的深层把握。作者主张放弃拼凑多模态的方式，转向以具身交互为核心的智能研究。

当前LLM通过预测下一个token学习，但并未真正理解世界，只是学会了高级的句法规则。
多模态方法将不同模态简单拼接，无法形成连贯的概念，且忽略了人类智能的具身性。

形状、对称与结构：数学在机器学习研究中不断变化的角色

2024-11-17 00:46 UTC+8

本文探讨了数学在机器学习研究中的角色演变。尽管大规模计算和数据驱动的方法取得了显著成功，但数学仍然至关重要，只是其作用从提供理论保证转向了事后解释和高层次设计。文章展示了内在维度、曲率、拓扑学、对称性和范畴论等数学概念如何帮助理解深度学习的内部机制，并指出纯数学领域如拓扑学和几何学正与机器学习深度融合，为模型分析和设计提供新工具。

数学的角色从理论指导转向事后解释和高层次架构设计。
内在维度、曲率和拓扑学等工具用于分析模型隐藏层和权重空间。

LLM聊天机器人缺失的是什么：目标感

2024-09-10 01:28 UTC+8

文章指出，尽管LLM聊天机器人在基准测试中不断进步，但用户体验并未同比提升。当前对话系统缺乏目标感，易出现角色漂移，难以实现长期目标导向的交互。作者提出对话动作令牌（DAT）方法，通过强化学习引导模型进行多轮目标驱动对话，并探讨了未来研究方向。

LLM聊天机器人在MMLU等基准测试上表现优异，但用户满意度未同步提升。
有目的的对话（多轮、目标导向）对有效的人机协作至关重要。

我们需要基于福祉的AI积极愿景

2024-08-04 01:00 UTC+8

本文探讨如何确保AI造福人类，提出应以人类福祉为核心，构建积极愿景。尽管福祉定义存在争议，但公認的要素如亲密关系、有意义的工作、成长和积极情绪等可作为基础。文章强调需要制定衡量AI对福祉影响的指标，训练模型以支持福祉，并以促进福祉的方式部署AI。

AI应以个体福祉和社会健康为根本目标。
需要积极、可行的AI社会愿景，而非单纯防御性措施。

大语言模型在金融市场的应用

2024-04-21 01:57 UTC+8

本文探讨了大语言模型（LLM）在金融市场中的应用潜力与挑战。尽管LLM在自然语言处理中表现优异，但在金融时间序列预测中面临数据稀缺、噪声多、对抗性环境等问题。文章分析了多模态学习、残差化、长上下文窗口等技术的可能用途，并指出合成数据生成和基础分析辅助是更可行的方向。总体保持谨慎乐观。

LLM的自回归特性与量化交易中的自回归结构相似，但金融数据噪声大、信号弱。
金融数据量远小于语言数据，且市场参与者主动消除可预测性。

AI中的性别偏见概述

2024-04-08 23:54 UTC+8

本文综述了AI模型中性別偏见的研究，包括词嵌入、人脸识别、指代消解、大语言模型和图像生成模型中的偏见，并讨论了研究空白、其他类型的偏见以及解决偏见的方法与哲学问题。

AI模型反映并放大了现实世界的性别偏见，需量化并加以缓解。
研究涵盖从词嵌入到LLM和图像生成模型的多種偏见。

Mamba详解：状态空间模型挑战Transformer

2024-03-28 09:24 UTC+8

Mamba是一种基于状态空间模型的新型AI架构，通过选择性机制实现高效的长序列处理，在语言建模上媲美甚至超越同等规模Transformer，为AI发展开辟了新方向。

Mamba用状态空间模型替代注意力机制，克服了Transformer的二次复杂度瓶颈，实现线性缩放。
其选择性机制使模型能动态压缩上下文，在保持高效的同时提升有效性。

Car-GPT：LLM能否最终实现自动驾驶？

2024-03-09 00:55 UTC+8

探索大型语言模型在自动驾驶中的效用：它们能否被信任用于无人驾驶汽车，关键挑战是什么？

LLM通过标记化、Transformer和下一词预测工作，可应用于自动驾驶的感知、规划和生成任务。
感知任务中，LLM能描述场景、检测物体；规划中，结合鸟瞰图进行决策；生成中，可创建训练数据或模拟场景。

文本嵌入并非安全：Vec2Text 可完美还原原始文本

2024-03-06 04:15 UTC+8

本文介绍了 vec2text 方法，一种能够从文本嵌入向量中完美还原原始文本的技术，揭示了当前 RAG 系统和向量数据库在数据安全方面的重大隐患。

文本嵌入模型用于将文本转换为向量以进行相似性搜索，但嵌入向量可被逆向还原。
vec2text 方法通过迭代优化，能高达 92% 的准确率还原 32 token 的文本序列。

The Gradient