AI News HubLIVE

来源分布

  • Hacker News AI11
  • 量子位11
  • The Decoder8
  • arXiv Machine Learning3
  • AI Weekly2
  • arXiv AI2
  • Last Week in AI2
  • Latent Space2

主题分布

  • Agent31
  • 模型27
  • 芯片24
  • 研究16
  • 政策9
  • 创业融资6
  • 工具3
  • 机器人1

日期线

  • 2026-05-088
  • 2026-05-234
  • 2026-05-053
  • 2026-05-042
  • 2026-05-072
  • 2026-05-092
  • 2026-05-112
  • 2026-05-132

最新动态

Show HN:我将一个 Python AI 代理和 Vue 仪表盘打包成了一个 Electron 应用

Hermes Desktop 是一个跨平台的桌面应用,它将 Python 运行时、hermes-agent(自改进 AI 代理)和 hermes-web-ui(Vue 3 + Koa 聊天仪表盘)打包到一个 Electron 应用中,用户无需单独安装 Python 或 Node。应用集成了 DingTalk 并通过 DeepSeek 驱动。

  • 打包了 Python 运行时和 hermes-agent,实现无需依赖即可运行
  • 使用 Electron 作为外壳,集成 hermes-web-ui 前端
站内正文

DeepSeek陈德里开发自动研究Skill,写一篇论文人类只动脑2小时

DeepSeek研究员陈德里使用自研的DeliAutoResearch技能,与DeepSeek-V4-Pro和GPT-Image2合作,在6天内完成了一篇46页的论文。论文提出了L1-L5自主研究智能体分类体系,分析了四种架构模式和17个主流系统,并指出了六大开放问题。陈德里表示,人类仅需投入不到2小时的“CPU时间”,其余工作由AI Agent完成。

  • 陈德里开发自动研究技能DeliAutoResearch,论文99%由Agent撰写。
  • 论文提出L1-L5自主研究智能体分类,类比自动驾驶SAE级别。
站内正文

AI周刊第496期:Anthropic的国防级模型现已全民可用

本周AI新闻要点:Anthropic公开了此前仅限国防承包商使用的顶级模型Mythos,使五角大楼级AI能力向开发者开放;DeepMind CEO哈萨比斯将AGI时间线提前至2029年;Starlette框架爆出严重认证绕过漏洞,影响数百万AI代理;CrowdStrike等联合摧毁Glassworm僵尸网络;法国巴黎银行与Mistral达成主权AI安全合作;中国限制阿里和深度求索顶尖AI工程师出境;Uber AI预算超支、ClickUp裁员并引入数千AI代理,同时MIT技术评论数据显示AI暴露岗位失业率更低,奥特曼撤回白领失业预言。

  • Anthropic发布Mythos模型,原本仅限NSA和五角大楼使用,现可通过标准API访问。
  • 深度思维CEO哈萨比斯将AGI实现时间从5-10年缩短至2029年。
站内正文

据报道中国要求顶尖AI研究人员出国前需获批准

中国正在限制阿里巴巴和DeepSeek等私营公司的顶尖AI研究人员出国旅行,他们需要获得官方批准才能离境。北京担心数据泄露、技术盗窃和人才挖角,正在加强对国内AI行业的管控。

  • 中国要求顶尖AI研究人员出国前需获得许可。
  • 该政策适用于阿里巴巴和DeepSeek等私营公司。
站内正文

Cited AI Workspace:无需重复上传文件

UUMuse 是一个云端AI知识库平台,只需上传一次文件,即可在GPT、Claude、DeepSeek、Qwen等多个模型中进行带有引用的问答、生成内容和部署。支持通过API和MCP供代理和应用调用,提供永久记忆、多专家辩论(Spark)、代理模式等功能,并可将知识库部署为文档网站、小部件、API端点等。

  • 一次上传,多模型使用:文件上传后,GPT、Claude、DeepSeek、Qwen等模型均可基于同一知识库作答并引用来源。
  • 记忆与代理:AI记住你的偏好和项目上下文,代理模式自动规划并执行任务,无需重复指令。
站内正文

DeepSeek V4还能更省!新工具缓存命中率高达99.82%,2折稳定到手

DeepSeek V4系列发布一个月后,开源社区推出Reasonix工具,专为DeepSeek设计,通过优化缓存机制将账单成本降低至原来的五分之一左右。该工具缓存命中率高达99.82%,实现4亿+token从61美元降至12美元。

  • Reasonix是专为DeepSeek打造的终端编码工具,核心目标是降低使用成本。
  • 通过缓存优先循环、工具调用修复和自动上下文压缩等机制,实现长会话缓存命中率超90%。
站内正文

Deepseek将75%折扣永久化,输出令牌定价至少比GPT-5.5低34倍

Deepseek宣布其顶级模型V4-Pro的75%折扣永久生效。输入令牌每百万仅需0.435美元,至少比GPT-5.5便宜11.5倍,输出令牌便宜34倍以上。对于令牌消耗巨大的代理系统,这一价格可能对西方供应商造成巨大压力。

  • Deepseek永久保留V4-Pro模型75%的折扣。
  • 输入令牌定价0.435美元/百万,比GPT-5.5低11.5倍。
站内正文

阿里最新AI模型自主运行35小时优化自有芯片代码

阿里通义千问团队发布Qwen3.7-Max,专为长时间自主代理任务设计。在基准测试中匹配Claude Opus 4.6,超越DeepSeek V4 Pro和Kimi K2.6等中国对手。团队还展示了该模型操控四足机器人。

  • Qwen3.7-Max专为长时间自主代理任务设计
  • 基准测试匹配Claude Opus 4.6,超越中国竞品
站内正文

【AINews】所有模型实验室现在都是智能体实验室

在OpenAI即将上市之际,行业巨头纷纷从纯模型转向智能体产品。DeepSeek永久降价75%,MCP协议简化,谷歌推出全天候智能体,Anthropic发现上万高危漏洞。智能体化成为AI新常态。

  • Greg Brockman表示模型不再是产品,模型+智能体+工作流才是关键
  • DeepSeek V4 Pro永久降价75%,推理成本大幅降低
站内正文

融资700亿!DeepSeek Code真要来了,ACM金牌大神崔添翼挂帅

DeepSeek融资额达700亿元,计划推出自家Code产品。资深研究员Deli Chen发帖招聘Harness团队,前TSY Capital联合创始人崔添翼或将出任负责人。

  • DeepSeek融资700亿元,优先AI研究而非商业化。
  • DeepSeek Code产品确认开发中,招聘Agent Harness团队。
站内正文

异步Python客户端:私有DeepSeek API的高性能封装

aiodeepseek是一个高性能的异步Python客户端,专为私有DeepSeek API设计。支持流式响应、图像上传、多轮对话和新账户注册。客户端自动解决工作量证明挑战,采用C++和AVX2优化,性能出色。

  • 异步Python客户端,支持流式输出和图像上传
  • 多轮对话和账户注册功能
站内正文

基于扁平度的理论最优量化

本文提出一种新的量化指标“扁平度”来衡量异常值分布,并据此推导出理论最优解。作者进一步提出双向对角量化(BDQ)框架,通过学习到的对角操作将异常值分散到矩阵维度中,显著提升了大语言模型低位宽量化的性能。实验表明,BDQ在LLaMA-3-8B上W4A4量化精度下降不足1%,在DeepSeek-R1-Distill-LLaMA-70B的W2A4KV16任务中性能差距缩小39.1%。

  • 提出Flatness指标量化异常值分布,并推导理论最优解
  • BDQ框架通过双向对角变换分散异常值
站内正文

HELLoRA:混合专家模型的热门专家层层级低秩适配方法

HELLoRA是一种针对混合专家(MoE)模型的高效微调方法,仅对每层最活跃的专家附加LoRA模块,从而减少可训练参数和适配器带来的计算量,同时提升下游任务性能。在OlMoE、Mixtral和DeepSeekMoE等模型上,HELLoRA在数学推理、代码生成和安全对齐任务中均优于现有方法,例如在OlMoE上仅使用15.7%的参数,减少38.7%的FLOPs,吞吐量提升1.9倍,准确率提高9.2%。

  • HELLoRA仅对MoE模型每层最频繁激活的专家附加LoRA模块,实现参数高效微调。
  • 在多种MoE模型上,HELLoRA显著减少可训练参数和计算开销,同时提升性能。
站内正文

2025年十大人工智能研究论文

2025年AI研究从聊天机器人转向推理系统、自主代理和多模态系统。十大论文包括DeepSeek-R1(强化学习)、Gemini 2.5(多模态推理)、Qwen2.5(开源模型)、Large Concept Models(概念级语言建模)、ESG分析抗漂绿、VideoWorld(世界模型)、AI Scientist-v2(自主研究)、SWE-Lancer(编码代理基准)、OLMo 2(完全开源)和Mixture-of-Recursions(高效推理)。

  • DeepSeek-R1将强化学习后训练方法公开,显著提升推理和编码能力。
  • Gemini 2.5引入“思考模式”,扩展多模态理解和长上下文。
站内正文

GQLA:面向硬件自适应的大语言模型解码的分组查询潜在注意力机制

研究人员提出了分组查询潜在注意力(GQLA),这是对DeepSeek多头潜在注意力(MLA)的改进,在不重新训练的情况下提供两种硬件自适应的解码路径。该方法能在H100和H20 GPU上实现高效推理,并包含TransGQLA用于转换预训练的GQA模型。

  • GQLA在DeepSeek的MLA基础上扩展出双解码路径(MQA吸收和GQA),以适应不同硬件的roofline模型。
  • 同一组GQLA权重既可用于H100(MQA路径),也可用于H20(GQA路径配合多token预测)。
站内正文

最新开放制品(#21):开放模型盛宴!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1等。关于CAISI对V4的评估。

本月开放前沿实验室纷纷发布新模型,包括DeepSeek V4、Gemma 4、Kimi K2.6等。CAISI评估指出开放模型落后于美国前沿,且差距在扩大,但评估方法受到质疑,实际能力差距可能被高估。文章还介绍了多个亮点模型。

  • DeepSeek、Google、Moonshot AI等发布多个开放模型。
  • CAISI评估显示开放模型与封闭模型的Elo差距巨大,但基准测试方法存在争议。
站内正文

LLM架构最新发展:KV共享、mHC与压缩注意力

从Gemma 4到DeepSeek V4,本文探讨了新的开源LLM如何通过跨层KV共享、逐层嵌入、注意力预算、压缩卷积注意力和mHC等架构技术降低长上下文成本。

  • Gemma 4引入跨层KV共享,将KV缓存大小减半,同时保持模型质量。
  • 逐层嵌入(PLE)通过增加小型嵌入参数提高模型容量,而不显著增加计算成本。
站内正文

不同模型解决数论竞赛问题

在一场AI机器人竞赛中,参赛者需要计算第n个回文素数二进制展开中最长连续1位的长度。DeepSeek V4-Pro以73分夺冠,ChatGPT和Grok因误解规则未能参赛,而Kimi因一个bug意外在最后一轮获胜。本文详细分析了各机器人的策略、算法细节和比赛结果。

  • DeepSeek以73分获得第一,Claude和GLM分列二三名。
  • ChatGPT和Grok因在注册窗口内未完成预计算而被判未参赛。
站内正文

我们测试了DeepSeek V4 Pro和Flash与Claude Opus 4.7及Kimi K2.6的对比

我们对DeepSeek V4 Pro和Flash进行了与Claude Opus 4.7和Kimi K2.6相同的FlowGraph基准测试。Pro得分77/100,价格$2.25;Flash得分60/100,价格$0.02。Pro在性能上介于Opus(91)和Kimi(68)之间,但存在构建和租赁处理问题。Flash成本极低,但输出缺少关键部分。

  • DeepSeek V4 Pro以77分和$2.25的价格位于Opus和Kimi之间。
  • DeepSeek V4 Flash以$0.02的成本获得60分,但存在构建失败和路由错误。
站内正文

Violin:打破语言障碍的开源视频翻译技能

Violin是一个完全开源的AI视频翻译工具,结合语音识别、大型语言模型翻译和语音合成,使视频内容跨越语言障碍。它提供网络应用、命令行界面和代理技能,支持视频内容问答和个性化语音选择。使用Together API,利用Whisper、DeepSeek和Cartesia等模型,以MIT许可证发布。

  • Violin将语音识别、LLM翻译和语音合成整合为开源视频翻译工具。
  • 支持网络应用、CLI和代理技能,适合不同用户群体。
站内正文

腾讯计划增加AI支出,因中国芯片供应据称改善

腾讯宣布计划在2026年下半年大幅增加AI基础设施支出,原因是国内芯片制造商正在提升AI芯片产量。公司还公布了强劲的第一季度业绩,并正在谈判入股Deepseek。

  • 腾讯将在2026年下半年增加AI基础设施支出。
  • 中国芯片制造商正提升国内AI芯片产量。
站内正文

美国正在赢得人工智能竞赛

美国在AI商业化方面领先,拥有强大的云基础设施、数据平台和能源优势。尽管中国有DeepSeek等竞争者,但美国在收入、采用率、工具和覆盖范围上明显领先。欧洲缺乏云规模和生态系统,难以追赶。AI竞赛也是安全竞赛,涉及武器化AI和封闭式技术栈。

  • 自2025年1月DeepSeek R1冲击市场后,美国公司加速推进AI商业化,在收入、采用率和工具方面领先。
  • 美国拥有AWS、Azure和Google Cloud等全球超大规模云平台,以及YouTube、GitHub等数据平台,形成完整的AI生态。
站内正文

新研究发现:AI健康回答近半有误,尽管听起来令人信服

一项发表在《BMJ Open》上的新研究测试了五种主流AI聊天机器人(ChatGPT、Gemini、Grok、Meta AI和DeepSeek)在50个健康问题上的表现,发现近20%的回答高度有问题,一半的回答有问题,30%存在一定问题。Grok表现最差,开放性问题风险尤其高。研究强调用户不应视AI为权威医疗来源,需验证信息。

  • 研究测试了ChatGPT、Gemini、Grok、Meta AI和DeepSeek五个聊天机器人,各回答50个健康问题。
  • 近20%的回答被专家评为高度有问题,一半被评为有问题,仅30%部分有问题。
站内正文

笔记本电脑本地AI的两年:开源模型超越摩尔定律

2024年5月至2026年5月,最贵的MacBook Pro内存仍为128GB,硬件几乎未变。但可运行的开源模型在人工智能分析指数上从10分提升至47分(DeepSeek V4 Flash),性能提升4.7倍,每10.7个月翻一番,速度是摩尔定律的两倍以上。进步源于稀疏混合专家模型、激进量化技术和推理优化的小型密集模型。

  • 128GB MacBook Pro上运行的开源模型智能指数两年内从10升至47,翻倍速度超过摩尔定律。
  • 两大突破:稀疏MoE模型(如gpt-oss-120B)和小型密集推理模型(如Qwen3.6 27B)。
站内正文

思考越多,偏见越多:推理模型中长度驱动的立场偏差

该论文挑战了链式思维推理能减少偏见的普遍假设,通过实验表明在多选题中,推理轨迹越长,立场偏差(位置偏好)越严重。研究涵盖13种配置,发现12种显示轨迹长度与立场偏差分数正相关,截断实验证明因果关系,且671B参数的DeepSeek-R1虽整体偏差低,但长轨迹下仍存在偏差。此外,直接回答的立场偏差是独立现象。论文建议不应默认推理模型对选项顺序鲁棒,并提供了诊断工具包。

  • 推理轨迹长度与立场偏差分数正相关,控制准确率后仍显著。
  • 截断实验表明,从轨迹后期继续推理会增加选择位置偏好选项的概率(16%-32%)。
站内正文

序列雷达 #857:上周AI速览:机器内部,文本框之外

本周AI领域呈现科学化、产品化和投机化并存的趋势。Anthropic发布了自然语言自编码器,实现模型内部状态的语言化解释;OpenAI推出新语音模型,推动AI向原生界面演进;SubQ声称拥有1200万token上下文窗口,挑战现有RAG架构;中国AI实验室DeepSeek和Moonshot估值飙升,市场将AI公司视为战略资产。整体而言,AI正从模型竞赛转向基础设施竞赛。

  • Anthropic的自然语言自编码器将模型激活压缩为自然语言,开创了可解释性的新范式
  • OpenAI语音模型使AI从文本界面转向实时语音代理,用户体验发生质变
站内正文

百度发布文心 5.1:搜索能力登顶国内,预训练成本仅为业界 6%

百度正式发布新一代基础大模型文心大模型 5.1,采用“多维弹性预训练”技术,以业界同规模模型约 6% 的预训练成本实现基础效果领先,登上 LMArena 搜索榜国内第一、全球第四。Agent 能力显著提升,超越 DeepSeek-V4-Pro,创意写作与 Gemini 3.1 Pro 相当。

  • 文心 5.1 采用多维弹性预训练,成本仅为业界同规模模型的 6%。
  • 以 1223 分位列 LMArena 搜索榜国内第一、全球第四,是唯一上榜的国产模型。
站内正文

梁文锋出资200亿!DeepSeek首轮创纪录融资500亿,V4.1定档6月

DeepSeek首轮融资目标最高500亿元,梁文锋个人出资200亿,估值飙升至3500亿元。同时,V4.1模型定档6月发布,公司从理想主义实验室转向商业化运营。

  • DeepSeek首轮融资最高500亿元,梁文锋个人出资200亿元。
  • 估值21天内从100亿美元涨至500亿美元。
站内正文

Show HN:Stagewise – 专为您的Z.ai/DeepSeek/Moonshot订阅打造的智能IDE

Stagewise 是一款面向开发者的开源智能IDE,内置代码代理,可直接访问浏览器控制台和调试器。它支持自带密钥,接入Z.ai、DeepSeek、Moonshot等主流AI提供商,让开发者无需切换上下文即可浏览和构建。

  • 开源智能IDE,内置代码代理
  • 支持自带API密钥,接入多种AI提供商
站内正文

华为预计AI芯片收入达120亿美元,中国本土代工厂产能吃紧

华为预计AI芯片收入到2026年将达到120亿美元,受阿里巴巴、字节跳动和腾讯等大客户订单推动,而英伟达在中国AI加速器市场份额已降至零。主要挑战包括中芯国际先进制程产能有限、良率低和周期长。昇腾950PR现已成为中国云服务商的首选AI芯片,得益于DeepSeek V4针对华为架构的优化。

  • 华为预计AI芯片收入2026年达120亿美元,较2025年的75亿美元增长超60%。
  • 英伟达CEO黄仁勋表示其在中国AI加速器市场份额已降至零,归因于美国出口限制和北京推动本土采购。
站内正文

Redis之父下场,给DeepSeek V4单独造了一台推理引擎

Redis创始人antirez为DeepSeek V4 Flash打造专用推理引擎ds4.c,在Mac上实现本地高性能运行,支持2-bit量化、KV缓存硬盘化及API兼容层,引发对模型专属推理框架的讨论。

  • Redis之父antirez发布专为DeepSeek V4 Flash设计的推理引擎ds4.c,基于Metal框架,仅支持Apple Silicon。
  • 通过非对称量化、KV缓存外置和API兼容层实现128GB Mac上284B模型可用推理速度。
站内正文

所有实验室都怕字节,所有人都在夸DeepSeek!美国研究员36小时中国AI行

艾伦研究所研究员Nathan Lambert的中国之行揭示了中美AI文化的巨大差异。中国实验室强调合作,学生深度参与,开源文化盛行,而美国实验室则陷入内斗和明星文化。

  • 中国AI实验室文化更注重合作,学生直接参与核心研发。
  • 所有实验室都对字节跳动保持警惕,但对DeepSeek一致敬佩。
站内正文

ZAYA1-8B技术报告

ZAYA1-8B是一款基于MoE++架构的推理型混合专家模型,激活参数仅7亿,总参数80亿,在AMD全栈计算平台上训练。它在数学和编程基准测试中与DeepSeek-R1-0528相当甚至超越,并提出了Markovian RSA测试时计算方法,进一步提升推理性能。

  • ZAYA1-8B拥有7亿激活参数和80亿总参数,在AMD平台上完整训练。
  • 在多个数学和编程基准测试中,表现与DeepSeek-R1-0528持平或更优。
站内正文

部署DeepSeek-V4:为何百万Token上下文是推理系统的问题

DeepSeek-V4通过混合注意力设计(CSA、HCA、SWA)压缩KV缓存,将百万Token上下文从模型挑战转变为推理系统挑战。Together AI在NVIDIA HGX B200上的早期部署经验展示了缓存策略、前缀缓存和端点配置对长上下文工作负载性能的关键影响。

  • DeepSeek-V4的压缩稀疏注意力(CSA)和高度压缩注意力(HCA)减小了KV缓存大小,但推理引擎需要管理多种缓存布局。
  • 滑动窗口注意力(SWA)在长上下文时成为性能瓶颈,需谨慎选择存储策略。
站内正文

Zyphra发布ZAYA1-8B:基于AMD硬件训练的小型推理MoE模型,性能远超其体量

Zyphra AI发布了ZAYA1-8B,一款仅有7.6亿活跃参数的小型混合专家(MoE)语言模型,但在数学和编程基准测试中击败了多个体量更大的开源模型。该模型采用MoE++架构,包含压缩卷积注意力(CCA)、MLP路由器和PID控制器偏置平衡等创新,并引入了马尔可夫递归自聚合(Markovian RSA)测试时计算方法,在HMMT'25上超越Claude 4.5 Sonnet,逼近DeepSeek-V3.2。模型完全在AMD Instinct MI300硬件上训练,并以Apache 2.0许可发布。

  • ZAYA1-8B仅有7.6亿活跃参数,总参数84亿,但在数学和编码任务上超越多个更大模型。
  • 采用MoE++架构,包括8倍KV缓存压缩的CCA、MLP路由器及PID偏置平衡、学习残差缩放。
站内正文

Token需求狂飙千倍,22亿热钱涌向这家AGI Infra头号玩家

随着AI进入Agent时代,Token需求爆发。无问芯穹作为国内中立AGI基础设施头部厂商,累计融资超22亿元,日均Token调用量较2025年底增长超20倍。该公司支撑Kimi、GLM、MiniMax、DeepSeek等主流国产模型,成为Token经济的关键枢纽。

  • Agent时代使单次任务Token消耗从数百飙升至百万级,基础设施面临三重颠覆。
  • 无问芯穹日均Token调用量每两周翻一番,增速远超全国平均水平。
站内正文

Deepseek估值接近450亿美元,中国国家芯片基金领投

据英国《金融时报》报道,Deepseek即将完成一轮融资,估值约450亿美元。中国国家集成电路产业投资基金(大基金)领投,腾讯也在洽谈入股。创始人梁文峰持有89.5%股份,可能个人投资。估值在数周内从200亿美元攀升。

  • Deepseek估值约450亿美元,中国大基金领投
  • 腾讯也在洽谈入股
站内正文

Show HN:Token用量仪表盘——12家提供商与编程代理

qlaud推出包含qcode编程代理、Router API网关和Platform托管后端的全栈AI工具集。qcode在桌面本地运行,支持Claude、GPT、DeepSeek、Llama等前沿模型,保障代码隐私;Router提供统一的API接口,具备故障转移和延迟监控;Platform提供持久化线程、MCP连接器和向量搜索等能力。

  • qcode是本地运行的编程代理,支持多种前沿模型,代码不出本地。
  • Router提供统一API,集成故障转移和延迟监控。
站内正文

亚马逊通过支持Llama、Qwen、Deepseek和Nova为SageMaker带来智能微调

亚马逊SageMaker AI现在包含一个AI代理,帮助开发者用自然语言描述用例,自动推荐训练方法、准备数据、启动训练并提供可编辑的Jupyter笔记本代码。支持Llama、Qwen、Deepseek和Nova等模型系列。

  • SageMaker AI新增Kiro AI代理,支持自然语言描述用例并自动完成微调工作流。
  • 代理预装在开发环境中,也可使用Claude Code等其他代理。
站内正文

上周AI #340 - OpenAI vs Musk + Microsoft, DeepSeek v4, 视觉香蕉

马斯克诉奥特曼案第一周庭审结束,马斯克证词占据主导;微软与OpenAI重新谈判合作关系,终止独家权利;DeepSeek发布V4预览版,号称缩小与前沿模型差距;谷歌DeepMind推出视觉香蕉模型,统一图像生成与视觉理解。

  • 马斯克诉奥特曼案庭审首周,马斯克承认xAI部分使用了OpenAI模型进行蒸馏训练。
  • 微软与OpenAI修改合作协议,微软失去独家云服务权利,OpenAI可自由选择AWS等供应商。
站内正文

LWiAI播客第243期:GPT-5.5、DeepSeek V4、AI安全破坏

本期播客回顾了上周AI领域的重要新闻,包括OpenAI发布GPT-5.5、xAI推出Grok Voice Think Fast 1.0、DeepSeek开源V4模型、Google计划向Anthropic投资高达400亿美元等。此外还讨论了AI安全研究中的破坏行为、文档委托腐蚀等新研究。

  • OpenAI发布GPT-5.5,显著提升编码能力,系统卡讨论了思维链可监控性和对齐测试
  • xAI推出Grok Voice Think Fast 1.0,在实时语音代理基准测试中领先
站内正文

“DeepSeek版Claude Code”,Github 2.3k星

DeepSeek-TUI是一个基于Rust的终端编程Agent,专门为DeepSeek模型优化。近日因DeepSeek-V4发布和作者中文宣传而爆火,登顶GitHub热榜。支持思维链显示、上下文压缩、RLM多子Agent并行、多种模型切换等功能。

  • DeepSeek-TUI是一个类似Claude Code的终端编程工具,专为DeepSeek优化,已获2.3k星标。
  • 项目由独立开发者Hunter Bown发起,采用Rust编写,MIT协议开源。
站内正文

DeepSeek V4最大的遗憾

DeepSeek V4的技术报告中缺少了Engram模块,引发热议。Engram是一种为Transformer设计的原生知识查表模块,旨在分离静态知识检索与深度推理。尽管未在V4中出现,但后续有三篇论文探索了其在CXL内存池化、无冲突热层优化及视觉模态的应用。

  • DeepSeek V4未包含此前备受期待的Engram模块。
  • Engram通过哈希查找机制实现静态知识的高效检索,释放深层网络用于推理。
站内正文

[AINews] AI工程师世界博览会——自动研究、记忆、世界模型、Token最大化、代理商业以及垂直AI演讲者征集

本文宣布AI工程师世界博览会第二波演讲者征集活动,涵盖自动研究、记忆、世界模型、Token最大化、代理商业以及法律、医疗、GTM和金融领域的垂直AI等新主题。此外,还总结了近期AI领域的重要动态,包括Grok 4.3发布、DeepSeek V4 Pro进展、Codex vs Claude Code竞争、代理基础设施研究以及本地LLM社区的热门讨论。

  • AI工程师世界博览会第二波演讲者征集启动,新增多个技术主题轨道。
  • Grok 4.3发布,性能提升但可靠性存疑;DeepSeek V4 Pro成为最可信的开源编码/代理模型之一。
站内正文

AI周刊第488期:OpenAI五天内失去了三样东西

本周OpenAI遭遇三重打击:马斯克诉讼威胁其非营利转营利模式、营收未达预期引发市场连锁反应、AWS合作终结微软独家分发权。同时,DeepSeek价格战、科技巨头裁员、白宫拟绕过Anthropic安全评估等事件标志AI行业定价权转移与监管环境变化。

  • 马斯克诉讼要求OpenAI返回非营利状态,将定义AI领域营利化转换的法律标准。
  • OpenAI营收未达Oracle 3000亿美元计算合约的抵押预期,芯片股随之下跌。
站内正文

本周AI序列#851:DeepSeek-V4与百万Token智能架构

DeepSeek-V4不仅仅是又一款前沿模型,它通过新的内存层次结构、注意力机制和训练稳定器,解决了如何经济有效地利用百万Token上下文窗口的问题,使长上下文推理变得实用。

  • DeepSeek-V4支持百万Token上下文窗口,但重点在于经济地使用这些上下文,而非单纯输入大量文本。
  • 该模型引入了新的内存层次结构、注意力机制、训练稳定器、优化器选择、量化方案和服务堆栈,以实现实用的长上下文推理。
站内正文

公司导航