DeepSeek

来源分布

Hacker News AI28
The Decoder5
量子位4
MarkTechPost3
AI Weekly1
Analytics Vidhya1
Artificial Intelligence News1
arXiv AI1

主题分布

Agent37
模型24
芯片22
研究15
政策6
创业融资2
工具1

日期线

2026-06-213
2026-05-232
2026-05-262
2026-05-272
2026-05-292
2026-06-032
2026-06-082
2026-06-182

最新动态

2026年中AI模型分级

2026-07-11 23:43 UTC+8

作者从个人编码和审计经验出发，对2026年中的主流AI模型进行非正式分级，涵盖Anthropic Fable、OpenAI Sol、Mistral、Gemini和DeepSeek等模型，并融入美国出口管制和欧洲视角的评论。

Fable（Anthropic）被评为B级，虽然流畅但不可靠，常隐藏错误。
Sol（OpenAI）被评为S级，在低级代码和测试方面表现出色，值得信赖。

DeepSeek V3.2 在 Hugging Bay 上发布

2026-07-11 09:44 UTC+8

DeepSeek V3.2 现已登陆 Hugging Bay，这是一个开源 AI 工件注册平台，提供来源验证、许可证审核和可信托管服务。

DeepSeek V3.2 已在 Hugging Bay 上发布。
Hugging Bay 是一个开源注册表，具备来源验证和信任功能。

DeepSeek计划自主研发AI芯片

2026-07-09 22:42 UTC+8

总部位于杭州的人工智能初创公司DeepSeek正在设计自己的芯片，旨在减少对美国芯片巨头英伟达和华为的依赖。该芯片专注于推理而非训练，以降低服务成本并适应美国出口管制。凭借其在模型与硬件协同设计方面的优势，DeepSeek有望在定价战中进一步压低价格，但面临先进制造和内存受限的挑战。

DeepSeek自研推理芯片，减少对英伟达和华为的依赖。
芯片设计聚焦于推理阶段，以优化成本并应对出口管制。

DeepSeek DSpark：实现LLM速度提升400%的推测解码技巧

2026-07-09 02:26 UTC+8

DeepSeek发布了DSpark模块，通过半自回归草案模型结合马尔可夫头，同时解决了推测解码中草案质量低和验证浪费两大问题。在DeepSeek-V4上，它使每用户生成速度提升60-85%，且不降低模型质量。本文深入解析其工作原理、开源工具DeepSpec的使用方法及实验结果。

DSpark采用半自回归草案模型，兼具并行速度和序列连贯性。
马尔可夫头以极低开销提供与RNN头相当的效果，已投入生产。

AI模型“过度思考”问题——这是一种安全风险

2026-07-08 19:00 UTC+8

研究表明，具备推理能力的大语言模型容易因逻辑不一致的提示而陷入“过度思考”，导致输出长度激增，可能被利用发动拒绝服务攻击。浙江大学与阿里巴巴的研究人员开发了一种进化算法，能够生成恶意提示，使模型输出长度最高增加26倍，影响包括DeepSeek-R1、Qwen3-Thinking、GPT-o3和Gemini 2.5 Flash在内的主流推理模型。

研究人员展示了一种利用AI推理模型“过度思考”漏洞的新型攻击，导致计算量急剧增加。
通过进化算法破坏提示的逻辑结构，可使模型输出长度最高达到正常情况的26倍。

中国AI模型凭借成本优势在美国企业中的采用率上升

2026-07-08 05:48 UTC+8

中国开发的AI模型正逐渐缩小与领先美国竞争对手的性能差距，同时保持显著的价格优势，因此在美国公司中越来越受欢迎。最近DeepSeek和Z.ai等中国公司发布的模型被认为与Anthropic和OpenAI等前沿系统高度竞争。这些进步正值许多美国AI实验室最先进模型的token价格上涨，使企业面临与使用该技术相关的意外高成本。

中国AI模型性能提升，与美国领先模型差距缩小。
DeepSeek和Z.ai等中国公司的模型在成本上更具优势。

DeepSeek V4 在代理型代币份额中崭露头角

2026-07-07 04:27 UTC+8

DeepSeek V4 模型自2026年4月发布以来，在OpenRouter上的代币份额从年初的9%翻倍至18%，主要由代理型工作负载驱动。其成本效益比（每百万代币输入0.09美元，输出0.18美元）领先业界，吸引各类用户采用，并推动中国模型整体超越美国模型。

DeepSeek V4 发布后六个月内，代币份额从9%增至18%。
代理型工作负载是主要增长动力，V4-Flash占DeepSeek代理型代币流量的70%。

NVIDIA 推理软件堆栈如何实现最低令牌成本

2026-06-30 23:00 UTC+8

NVIDIA 的推理软件堆栈通过与 GPU、CPU、网络和系统的协同设计，并借助开源生态系统，持续提升硬件性能。在 Blackwell 平台上，该软件堆栈在一个月内将 DeepSeek V4 模型的令牌成本降低了 5 倍。文章详细介绍了软件优化如何通过生产运营、应用加速和基础设施访问三个层次，将单个优化转化为系统级性能提升，从而降低每令牌成本。

NVIDIA 全栈推理软件通过协同设计，在 Blackwell 平台上一个月内将令牌成本降低 5 倍。
Baseten、Cognition 等公司利用 TensorRT-LLM 和 Dynamo 框架实现了显著性能提升。

AI新闻：今天没什么大事发生

2026-06-30 14:47 UTC+8

今天AI领域相对平静，但仍有重要进展：Meta的非侵入式脑机接口Brain2Qwerty v2、Cursor的iOS远程代理发布、DeepSeek的DSpark推测解码技术、开放权重模型的商业化访问，以及Snowflake的Arctic RL训练基础设施。Reddit社区讨论了在两台Mac上本地运行GLM-5.2 753B的情况。

Meta发布Brain2Qwerty v2，非侵入式解码器在实时打字任务中达到约61%的词准确率。
Cursor推出iOS应用，支持始终在线的云代理和远程控制桌面代理。

低成本中国AI模型如DeepSeek在美国受到青睐

2026-06-29 23:15 UTC+8

美国开发者和小型企业正在转向中国AI模型以降低成本。尽管性能仍落后于美国顶尖模型，但中国模型能以极低价格处理大多数任务。微软也在考虑使用DeepSeek等开源模型作为更低成本的替代方案。然而，中国公司面临将流行度转化为可观收入的挑战。

美国开发者用DeepSeek替代Claude，成本从10美元降至不到50美分。
中国模型价格低廉得益于国内较低的薪资和基础设施成本。

DeepSeek发布DSpark：一种投机解码框架，将DeepSeek-V4每用户生成速度提升60-85%

2026-06-28 00:59 UTC+8

DeepSeek开源了DSpark，一种投机解码框架，通过附加草稿模块到现有DeepSeek-V4权重上。它结合并行草稿骨干和轻量级马尔可夫头以减少后缀衰减，并加入基于置信度的调度验证，根据实时GPU负载调整检查的令牌数量。离线测试中，接受长度比DFlash和Eagle3提升16-31%；生产环境下，每用户生成速度比MTP-1基线提升57-85%，且无损。训练代码库DeepSpec采用MIT许可证。

DSpark结合并行草稿骨干和轻量级马尔可夫头，提高后缀接受率。
基于置信度的验证根据GPU负载动态调整检查令牌数。

用Golang编写的原生Hacker News TUI客户端，具备AI评论摘要功能

2026-06-28 00:04 UTC+8

cwnews是一款终端下的Hacker News阅读器，支持六个数据源、三种主题、线程折叠评论以及通过DeepSeek V4 Flash实现的AI摘要功能。它用Go和Bubbletea v2构建，左侧面板显示故事列表，右侧面板呈现嵌套评论，并可通过按's'键调用AI实时总结讨论内容。所有数据缓存在SQLite中，确保快速响应。

终端UI客户端，支持Hacker News的六个数据源（Top/New/Best/Ask/Show/Jobs）。
评论以可折叠的线程树形式展示，带有深度颜色标记。

DeepSeek开源推理优化，生成速度提升60–85%

2026-06-27 17:18 UTC+8

DeepSeek开源了一套推理优化技术，可将生成速度提升60%至85%，相关技术论文已在GitHub上发布。

DeepSeek发布了推理优化技术
生成速度提升60-85%

cwmail：原生Golang终端邮件客户端，集成DeepSeek V4 Pro AI起草功能

2026-06-27 11:36 UTC+8

cwmail是一款基于Go语言和Bubbletea v2开发的终端邮件客户端，支持HTML邮件渲染、内嵌图片显示、多账户IMAP管理、IDLE推送通知以及由DeepSeek V4 Pro驱动的AI回复起草功能。它提供快速本地搜索、撤销删除、草稿自动保存、CLI发送模式等特性，且不依赖任何云服务，用户数据完全本地存储。

使用Go语言和Bubbletea v2构建，在终端中提供完整的邮件管理体验。
支持多账户IMAP，可同时管理Gmail、iCloud、Outlook等账户，并采用IDLE推送通知而非轮询。

DeepSeek Flash 颠覆了智能代理产品的经济模式

2026-06-26 06:56 UTC+8

DeepSeek Flash 通过提供廉价、快速、纯文本的代码生成模型，打破了开发者与大型模型实验室之间不合理的定价关系。它使得智能代理的构建者能够从依赖昂贵的多模态 API 转向使用开源模型作为编译器，大幅降低成本并重构了浏览器代理的架构。

DeepSeek Flash 改变了智能代理产品的经济模式，使开发者无需再补贴竞争对手。
通过将模型从执行者转变为编译器，代理的工作流从数十次模型调用减少为一次规划调用。

我们在20秒内部署了DeepSeek-V4-Pro服务

2026-06-26 04:49 UTC+8

Inferize公司宣布成功在20秒内部署DeepSeek-V4-Pro模型，实现极快且高效的LLM服务，并邀请用户加入等待列表。

Inferize在20秒内部署了DeepSeek-V4-Pro模型
该公司提供高度优化的弹性AI推理服务

百度发布Unlimited OCR：3B参数模型通过恒定KV缓存实现长文档高效解析

2026-06-25 13:39 UTC+8

百度开源了Unlimited OCR，这是一个30亿参数的混合专家模型，采用参考滑动窗口注意力机制（R-SWA）保持KV缓存恒定，从而在一次前向传播中高效解析数十页文档。在OmniDocBench v1.5上达到93.23分，比DeepSeek OCR基线高出6.22分，采用MIT许可证。

Unlimited OCR拥有30亿总参数，但推理时仅激活5亿参数。
参考滑动窗口注意力（R-SWA）使KV缓存大小恒定，不随输出长度增长。

Show HN：利用逼真AI语音将电子书转换为有声书

2026-06-24 23:04 UTC+8

一位开发者构建了名为ebookaloud的服务，利用开源Kokoro模型将电子书转换为有声书，并采用AI多智能体编程工作流（主要使用DeepSeek）。该产品按需付费，质量足够好，未来计划支持更多语言和PDF提取。

使用开源Kokoro模型生成逼真AI语音，可长时间聆听而不疲劳。
99%的代码由DeepSeek v4通过多智能体工作流编写，成本仅12美元。

更便宜、更安全的代理式AI工作流程

2026-06-22 02:39 UTC+8

一位开发者通过使用GLM-5.2和DeepSeek V4 Flash等模型，实现了低成本、高效的代理式AI编码，同时通过虚拟机隔离保护隐私。文章分享了具体步骤、成本对比（低至0.034美元）以及对AI行业商业模式的思考。

使用GLM-5.2和DeepSeek V4 Flash模型，任务成本低至0.034美元，耗时仅3分钟。
通过VirtualBox中的Debian虚拟机隔离环境，保护私有数据。

Show HN: CommitGate – 自动扫描提交中的漏洞

2026-06-21 23:35 UTC+8

CommitGate 是一个 AI 驱动的 Git 预提交安全门，在每次 git commit 时自动扫描暂存区差异，阻止包含密钥、令牌或危险代码的提交进入历史记录。它结合 Gitleaks 确定性扫描和 LLM 语义分析，支持 OpenAI、DeepSeek、Groq 等 AI 提供商，并可将审计日志发送到 Splunk。

在每次提交前自动扫描暂存区差异，阻止高风险代码进入仓库。
双引擎扫描：Gitleaks 检测已知密钥模式，AI 评审器捕捉正则表达式遗漏的漏洞。

AI模型发布节奏分析：两家实验室加速，三家放缓

2026-06-21 10:16 UTC+8

本文通过数据分析了前沿AI模型的发布节奏，发现Anthropic和OpenAI的发布频率在加速，而谷歌、Meta和DeepSeek并未出现类似趋势。作者探讨了递归自我改进的可能性，并指出了验证这一假设的下一步观察点。

Anthropic和OpenAI的模型发布节奏在加速，其他三家实验室未出现此趋势。
加速可能源于递归自我改进，即实验室利用自身模型改进后续模型。

7.4亿美元背后的深层意义：DeepSeek的A轮融资标志着中国AI联盟的转变

2026-06-21 07:47 UTC+8

本周三大看点：DeepSeek获腾讯领投74亿美元A轮融资，显示中国AI投资正转向非生态系统参与者；日本计划到2040年投入650亿美元公私合作建设物理AI基础设施；智谱AI的GLM 5.2模型在设计基准测试中超越Anthropic的Claude，直接挑战西方AI性能标准。

DeepSeek获腾讯领投74亿美元A轮融资，阿里巴巴和字节跳动未参与。
日本计划到2040年投入650亿美元建设物理AI基础设施，优先硬件以对抗西方领导地位。

VibeThinker-3B：基于Qwen2.5-Coder-3B与频谱到信号后训练流水线的3B密集推理模型

2026-06-20 06:06 UTC+8

VibeThinker-3B是一个仅30亿参数的开源推理模型，在可验证基准测试中匹配DeepSeek V3.2和Kimi K2.5等千亿级模型。它采用频谱到信号后训练流水线，通过监督微调、强化学习和自蒸馏实现高效推理，并引入测试时缩放方法CLR进一步提升性能。

VibeThinker-3B仅有3B参数，MIT许可证开源，基于Qwen2.5-Coder-3B构建，专攻可验证推理。
在AIME26上得分94.3，与671B的DeepSeek V3.2和1T的Kimi K2.5相当。

华为芯片助力DeepSeek模型精调，中国AI自主可控迈出重要一步

2026-06-20 01:33 UTC+8

华为使用其昇腾910C芯片成功完成对DeepSeek-V4-Pro模型的后训练，这是中国半导体产业在复杂AI模型训练领域取得的关键突破。该项目由华为与多家研究机构合作，利用1000多颗芯片集群实现了1.6万亿参数模型的全参数后训练，展示了国产芯片从推理到训练的能力跨越。此举有助于提升中国AI产业链的自主性，在美制裁背景下推动国内替代方案的发展。

华为与多家机构合作，使用昇腾910C芯片成功完成DeepSeek-V4-Pro模型的后训练。
项目采用至少1000颗芯片集群，对1.6万亿参数模型进行全参数精调。

Show HN: Wolffish – 一个操作系统的个人桌面AI代理

2026-06-19 19:32 UTC+8

Wolffish是一款桌面AI代理应用，安装即用，无需服务器或复杂设置，支持多种模型，包括DeepSeek、GLM、Claude、GPT等，并能完全离线运行。它注重隐私和安全，所有数据保留在本地，开源免费。

Wolffish是一款简单易用的桌面AI代理，无需复杂设置。
它支持多种AI模型，包括本地模型，确保数据隐私。

微软在中国销售OpenAI模型，而OpenAI和Anthropic拒绝

2026-06-18 17:00 UTC+8

微软已成为中国市场上OpenAI模型的主要供应商，向字节跳动、蚂蚁集团、美团和腾讯等大型互联网公司销售GPT系列模型，尽管OpenAI和Anthropic出于知识产权和滥用风险拒绝直接进入中国市场。该业务为微软带来独特优势，使其成为唯一一家向中国销售美国AI模型的美国供应商。据彭博社报道，微软Azure在中国的AI收入增长迅猛，2025财年约增长三倍。微软通过其与OpenAI的独家合同提供这些模型，并采取监控措施防止模型蒸馏，但中国客户面临审查有限。同时，微软也在测试中国模型DeepSeek用于西方企业，形成双向贸易。

微软通过其与OpenAI的独家合同，向中国大型互联网公司提供GPT模型，而OpenAI和Anthropic拒绝直接销售。
字节跳动是微软最大的AI客户，年度支出超过10亿美元；蚂蚁集团、美团和腾讯也通过Azure购买AI模型。

归因引导与覆盖最大化的结构化MoE剪枝方法

2026-06-18 12:00 UTC+8

本文提出一种面向混合专家模型的结构化剪枝框架，通过将剪枝比率分配转化为通道分数覆盖最大化问题，并利用基于归因的近似方法高效求解。实验表明，在50%或25%结构化剪枝结合4位量化条件下，该方法在DeepSeek和Qwen MoE模型上保持了模型精度，并在Qwen3-30B-A3B上实现5.27倍内存压缩，超越现有基准。

发现MoE专家内部信息集中在少数通道，存在显著冗余
提出通道级结构化剪枝框架，将剪枝比率分配建模为覆盖最大化问题

专为本地LLM和DeepSeek v4优化的原生编码代理，具备向量记忆功能

2026-06-17 06:36 UTC+8

cwcode是一个基于Go语言的终端编码代理，利用DeepSeek V4 Pro等模型，提供文件编辑、子代理、语义记忆和自动恢复等功能。它强调低成本（每小时约0.40美元）、高效缓存（85%以上命中率），并支持本地模型和多种API。

基于Go的终端编码代理，支持DeepSeek V4 Pro、Qwen3.6-27B等模型
采用哈希锚定编辑和粘性前缀缓存，降低令牌消耗和成本

跨主流AI平台的令牌使用与订阅追踪

2026-06-14 12:09 UTC+8

Tokens 4 Breakfast 是一款 macOS 菜单栏应用，用于实时追踪和监控AI工具（如 Claude、OpenAI、Cursor、Copilot、Gemini、DeepSeek、Mistral 等）的令牌使用、订阅费用和速率限制，帮助开发者避免意外超支。应用提供免费版（支持单一供应商）和一次性付费的 Pro 版（$7.99），所有数据本地处理，无需登录或云服务。

实时菜单栏显示AI使用成本、速率限制和订阅支出。
支持8大AI供应商，包括 Claude、OpenAI、Cursor 等。

中国打击西方AI模型，美国公司却涌入DeepSeek

2026-06-13 10:51 UTC+8

中国国家安全部警告使用西方AI模型存在安全风险，同时美国企业因成本优势纷纷采用中国开源模型。双方在AI领域相互牵制，用户绕道访问对方模型的现象加剧了技术博弈。

中国国家安全部警告通过第三方工具访问美国AI模型可能带来安全风险
美国企业因成本优势大量使用DeepSeek、阿里Qwen等中国开源模型

Pythagoras-Prover: 通过增强型Lean形式化推进高效形式化证明

2026-06-12 12:00 UTC+8

Pythagoras-Prover是一个计算高效的Lean定理证明器家族，包含4B和32B的自回归模型以及4B的扩散模型。它通过分层课程SFT和动态证明过滤提高训练效率，并引入增强型Lean形式化(ALF)扩展验证语料库。实验显示，4B模型在MiniF2F-Test上以86.1%的pass@32超越DeepSeek-Prover-V2-671B（82.4%），而32B模型达到93.0%的新开源最佳水平，并在PutnamBench上解决93个问题。

Pythagoras-Prover包含4B和32B自回归模型及4B扩散模型，扩散模型在推理时迭代细化证明。
通过分层课程SFT和动态证明过滤实现训练效率提升，保持8k token上下文预算。

深度求索让AI变便宜，现在却需要数十亿来维持低价

2026-06-08 20:36 UTC+8

深度求索（DeepSeek）曾以低成本AI模型震惊业界，但现在美国评估显示其模型落后前沿约8个月，尽管价格更低。公司正进行大规模融资，估值高达600亿美元，以维持其在AI竞赛中的竞争力。

美国CAISI评估认为DeepSeek V4 Pro是最强中国模型，但落后美国前沿约8个月。
DeepSeek正进行超过500亿元人民币（约74亿美元）的融资，估值接近600亿美元。

Deepseek在2026年6月位列Ramp热门软件供应商榜首，美国企业寻求更便宜的AI

2026-06-08 00:06 UTC+8

2026年6月，Deepseek成为Ramp平台上最受欢迎的付费软件供应商，美国企业直接向其发送数据。Ramp首席经济学家Ara Kharazian指出成本意识是驱动因素，但警告使用中国模型的安全风险。

Deepseek在2026年6月成为Ramp热门软件供应商第一名。
美国企业为降低成本转向使用Deepseek的付费AI服务。

职位搜索器：AI驱动的求职助手

2026-06-06 23:36 UTC+8

职位搜索器是一款为应届毕业生设计的AI工具，通过分析简历自动生成LinkedIn搜索查询，并基于技能、经验、教育、行业和资历五个维度对职位进行评分。该项目使用DeepSeek V4 Pro作为教师模型生成标签，Qwen3-8B作为学生模型进行推理，训练数据包括2500份简历和约10000个职位。所有代码、数据集和模型均已开源。

自动简历分析并生成LinkedIn搜索查询
基于五个维度的职位匹配评分

DeepSWE 结果不可靠——同一模型解决了全部 3/3 个“失败”任务

2026-06-05 00:32 UTC+8

对 DeepSWE 基准测试的审计发现，deepseek-v4-pro 的报告结果（8% 解决率，平均成本 4.22 美元）存在多个问题：成本因忽略缓存定价膨胀约 5 倍，所有三个失败任务均被同一模型成功解决，OpenRouter 隐私设置默认阻止 DeepSeek 导致 404 错误，且模型未像竞品一样进行推理努力调优。

成本膨胀约 5 倍：基准测试对所有输入令牌按缓存未命中率计费，忽略 78% 的缓存命中（99.2% 折扣）。
三个“失败”任务全部解决：使用相同模型 deepseek-v4-pro，总成本约 0.86 美元。

DigitalOcean 成为 OpenRouter AI 模型提供商

2026-06-03 16:25 UTC+8

DigitalOcean 宣布成为 OpenRouter 的模型提供商，提供 DeepSeek V3.2、Kimi K2.6 和 DeepSeek V4 Flash 模型。此举表明该公司正从云基础设施扩展到 AI 推理领域。

DigitalOcean 在 X 上宣布成为 OpenRouter 的模型提供商
首批模型包括 DeepSeek V3.2、Kimi K2.6 和 DeepSeek V4 Flash

Dropstone 1.5：每月15美元，两倍于Claude Code的使用量

2026-06-03 11:59 UTC+8

Dropstone 1.5 是一款终端中的AI编程代理，每月重新评估顶级模型并切换至最佳者。当前基于DeepSeek和Kimi模型，美国服务器托管，不存储数据。每月15美元提供约450次深度编程会话，约为Claude Code Pro的两倍（后者20美元）。注重安全，所有操作需确认。

每月15美元，约450次深度编程会话，是Claude Code Pro的两倍。
使用DeepSeek V4 Flash、V4 Pro和Kimi K2.6模型，美国服务器托管。

Show HN：Tkcore AI – 支持自定义知识库的多模型工作空间

2026-06-02 15:26 UTC+8

Tkcore AI 是一个多模型工作空间，集成了 DeepSeek、Qwen、GLM、Kimi 和 MiniMax 等多种 AI 模型，提供低延迟响应、长上下文、多模态输入以及通过文件上传实现自定义知识库功能。

支持 DeepSeek、Qwen、GLM、Kimi 和 MiniMax 等多个模型，适用于不同任务。
低延迟、高吞吐量文本处理，支持图像/视频等多模态输入。

新综述论文：代码不仅是AI智能体的产物，更是其思考与行动的方式

2026-05-29 21:10 UTC+8

一篇新综述论文指出，自主AI智能体的真正瓶颈并非语言模型本身，而是围绕其构建的软件层。工具、记忆、测试和权限边界将无状态模型转变为可工作的智能体。Deepseek已在北京组建专门的“Harness”团队，其核心公式验证了该论点：模型加Harness等于AI智能体。

论文强调AI智能体的瓶颈在于软件封装层，而非语言模型。
工具、记忆、测试和权限管理是将模型转化为智能体的关键。

PPIO入选非凡产研「2026 Global AI 100」，以AI实力领跑出海新浪潮

2026-05-29 19:24 UTC+8

PPIO 入选非凡产研发布的「2026 Global AI 100」榜单，该榜单由非凡大赏年度 AI 全球化增长峰会评选，旨在发掘全球化 AI 原生公司。PPIO 以全球化分布式算力基础设施、全栈云服务、模型平台（支持 DeepSeek、GLM 等）及 Agent 沙箱等创新产品，为出海企业提供低时延、高可用的算力网络。截至 2026 年 4 月，PPIO 整合全球 4800+ 节点，日均 Token 调用量超 10000 亿，开发者用户超 57 万。同时获评上海市数字出海服务平台试点单位及 GDA 领航服务站。

PPIO 入选「2026 Global AI 100」榜单，彰显其在 AI 出海领域的领先地位。
提供全球化分布式算力基础设施，覆盖 GPU 全型号，支持大规模训练与推理。

Show HN：我将一个 Python AI 代理和 Vue 仪表盘打包成了一个 Electron 应用

2026-05-28 18:12 UTC+8

Hermes Desktop 是一个跨平台的桌面应用，它将 Python 运行时、hermes-agent（自改进 AI 代理）和 hermes-web-ui（Vue 3 + Koa 聊天仪表盘）打包到一个 Electron 应用中，用户无需单独安装 Python 或 Node。应用集成了 DingTalk 并通过 DeepSeek 驱动。

打包了 Python 运行时和 hermes-agent，实现无需依赖即可运行
使用 Electron 作为外壳，集成 hermes-web-ui 前端

DeepSeek陈德里开发自动研究Skill，写一篇论文人类只动脑2小时

2026-05-27 09:14 UTC+8

DeepSeek研究员陈德里使用自研的DeliAutoResearch技能，与DeepSeek-V4-Pro和GPT-Image2合作，在6天内完成了一篇46页的论文。论文提出了L1-L5自主研究智能体分类体系，分析了四种架构模式和17个主流系统，并指出了六大开放问题。陈德里表示，人类仅需投入不到2小时的“CPU时间”，其余工作由AI Agent完成。

陈德里开发自动研究技能DeliAutoResearch，论文99%由Agent撰写。
论文提出L1-L5自主研究智能体分类，类比自动驾驶SAE级别。

AI周刊第496期：Anthropic的国防级模型现已全民可用

2026-05-27 08:00 UTC+8

本周AI新闻要点：Anthropic公开了此前仅限国防承包商使用的顶级模型Mythos，使五角大楼级AI能力向开发者开放；DeepMind CEO哈萨比斯将AGI时间线提前至2029年；Starlette框架爆出严重认证绕过漏洞，影响数百万AI代理；CrowdStrike等联合摧毁Glassworm僵尸网络；法国巴黎银行与Mistral达成主权AI安全合作；中国限制阿里和深度求索顶尖AI工程师出境；Uber AI预算超支、ClickUp裁员并引入数千AI代理，同时MIT技术评论数据显示AI暴露岗位失业率更低，奥特曼撤回白领失业预言。

Anthropic发布Mythos模型，原本仅限NSA和五角大楼使用，现可通过标准API访问。
深度思维CEO哈萨比斯将AGI实现时间从5-10年缩短至2029年。

据报道中国要求顶尖AI研究人员出国前需获批准

2026-05-26 22:25 UTC+8

中国正在限制阿里巴巴和DeepSeek等私营公司的顶尖AI研究人员出国旅行，他们需要获得官方批准才能离境。北京担心数据泄露、技术盗窃和人才挖角，正在加强对国内AI行业的管控。

中国要求顶尖AI研究人员出国前需获得许可。
该政策适用于阿里巴巴和DeepSeek等私营公司。

Cited AI Workspace：无需重复上传文件

2026-05-26 10:18 UTC+8

UUMuse 是一个云端AI知识库平台，只需上传一次文件，即可在GPT、Claude、DeepSeek、Qwen等多个模型中进行带有引用的问答、生成内容和部署。支持通过API和MCP供代理和应用调用，提供永久记忆、多专家辩论（Spark）、代理模式等功能，并可将知识库部署为文档网站、小部件、API端点等。

一次上传，多模型使用：文件上传后，GPT、Claude、DeepSeek、Qwen等模型均可基于同一知识库作答并引用来源。
记忆与代理：AI记住你的偏好和项目上下文，代理模式自动规划并执行任务，无需重复指令。

DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

2026-05-25 12:40 UTC+8

DeepSeek V4系列发布一个月后，开源社区推出Reasonix工具，专为DeepSeek设计，通过优化缓存机制将账单成本降低至原来的五分之一左右。该工具缓存命中率高达99.82%，实现4亿+token从61美元降至12美元。

Reasonix是专为DeepSeek打造的终端编码工具，核心目标是降低使用成本。
通过缓存优先循环、工具调用修复和自动上下文压缩等机制，实现长会话缓存命中率超90%。

Deepseek将75%折扣永久化，输出令牌定价至少比GPT-5.5低34倍

2026-05-24 01:10 UTC+8

Deepseek宣布其顶级模型V4-Pro的75%折扣永久生效。输入令牌每百万仅需0.435美元，至少比GPT-5.5便宜11.5倍，输出令牌便宜34倍以上。对于令牌消耗巨大的代理系统，这一价格可能对西方供应商造成巨大压力。

Deepseek永久保留V4-Pro模型75%的折扣。
输入令牌定价0.435美元/百万，比GPT-5.5低11.5倍。

阿里最新AI模型自主运行35小时优化自有芯片代码

2026-05-23 18:17 UTC+8

阿里通义千问团队发布Qwen3.7-Max，专为长时间自主代理任务设计。在基准测试中匹配Claude Opus 4.6，超越DeepSeek V4 Pro和Kimi K2.6等中国对手。团队还展示了该模型操控四足机器人。

Qwen3.7-Max专为长时间自主代理任务设计
基准测试匹配Claude Opus 4.6，超越中国竞品

DeepSeek V4价格打骨折，宁王京东网易抢着入场，梁文锋：目标是AGI

2026-05-23 17:46 UTC+8

DeepSeek宣布V4-Pro API永久降价，宁德时代、京东、网易等巨头正洽谈参投其首轮融资。梁文锋明确表示优先追求AGI，坚持开源路线。

DeepSeek-V4-Pro API永久降价至原价的四分之一
宁德时代、京东、网易等公司洽谈投资DeepSeek