AI 日报 2026-06-29

今日必读

Agent

AI价值捕获

2026-06-29 14:42 UTC+8

代理式AI的快速采用导致代币价值和需求大幅增长，AI实验室如Anthropic捕获了巨大价值。虽然最终用户和推理提供商获益，但台积电和英伟达尚未根据繁荣调整定价。

代理式AI已跨越拐点，推动代币价值实现阶跃变化。
Anthropic年化收入从90亿美元飙升至超过440亿美元，毛利率从38%升至70%。

我从零重建了Siri AI并开源

2026-06-29 14:09 UTC+8

OpenDex是一款开源的桌面AI助手，采用语音优先的交互方式，支持多种模型（包括本地Apple Intelligence）、离线运行、插件化语音组件以及全界面主题。它提供Jarvis HUD等炫酷界面，并且具备权限控制的代理技能，甚至可以控制电脑。

完全开源的语音AI助手，支持唤醒词、对话、工具调用和语音回复
可自定义模型、语音引擎、主题和技能，支持完全离线运行

循环工程：设计可以放手的人工智能循环

2026-06-29 14:07 UTC+8

循环工程是AI编码领域的新趋势，工程师设计自主循环替代手动提示，让系统自动执行任务。本文探讨了循环的起源、构建块、设计方法以及CodeRabbit如何适配，并与传统提示工程、上下文管理和工具工程形成对比。

循环工程让开发者从手动提示转向设计自主运行的系统。
核心构建块包括自动化、工作树、技能、插件/连接器、子代理和状态管理。

Empero-AI/Qwythos-9B-Claude-Mythos-5-1M：基于Qwen3.5的百万上下文推理模型

2026-06-29 13:53 UTC+8

Qwythos-9B是由Empero AI基于深度未审查的Qwen3.5-9B底座进行全参数微调的推理模型，经过超过5亿个token的高质量Claude Mythos和Fable轨迹训练，并采用内部工具rethink生成思维链。该模型拥有1048576 token的上下文窗口，在MMLU、GSM8K等基准测试中大幅超越基础模型，支持原生函数调用，并具备工具辅助的自纠错能力。模型设计上故意未加审查，适用于网络安全、红队方法、生物医学等要求严格技术回答的领域。

基于Qwen3.5-9B的全参数微调模型，使用5亿+token高质量数据进行后训练。
支持1,048,576 token的上下文窗口，适合全代码库推理和多文档研究。

利用Strava数据和健身房照片，用编程代理生成训练回顾

2026-06-29 13:43 UTC+8

作者通过结合Strava的锻炼数据和健身房白板照片，使用Claude Code编程代理自动提取照片中的训练信息，生成半年回顾信息图。整个流程包括数据获取、图片处理、JSON描述生成和信息图创建，展示了AI在个人健身数据整合中的实用价值。

利用Strava API获取活动元数据和照片
使用Claude Code作为视觉层解析健身房白板照片中的训练内容

AI编码代理（Claude、Cursor）提问、分享学习和蓝图

2026-06-29 13:15 UTC+8

在Stack Overflow的AI代理平台上，用户分享了一个JavaScript常见陷阱：向`duration`参数传递字符串会静默转换为NaN并回退到默认值。

JavaScript中，向`duration`参数传递字符串会导致静默转换为NaN并回退到默认值。
此问题在Stack Overflow的AI代理社区中被标记为JavaScript和TypeScript的常见陷阱。

为什么你的生产级RAG系统会逐渐变差

2026-06-29 13:01 UTC+8

生产级RAG系统很少因单次灾难性事件而突然失败，而是通过一系列操作变化累积退化。本文提出一个三维可靠性框架：故障动态（可靠性随时间如何变化）、可靠性控制面（工程师可观察和干预的位置）以及可检测性（故障在影响用户前被发现的难易程度）。通过模拟七周文档演变的控制实验，展示了渐进知识漂移如何逃避传统监控。

RAG系统故障常是渐进的，而非突发性事件。
框架涵盖故障动态、控制面和可检测性三个维度。

芯片

Tensordyne 将 AI 矩阵数学转换为对数以提升推理性能

2026-06-29 14:24 UTC+8

Tensordyne 推出基于对数运算的 Napier 推理芯片，将矩阵乘法转换为加法，大幅提升性能、降低功耗和成本。该芯片采用 3 纳米工艺，功耗仅 300 瓦，支持多种数据格式，计划 2026 年底提供云访问。

Napier 芯片通过对数转换将矩阵乘法变为加法，实现超过一个数量级的性能提升。
48 个对数核心、向量处理单元和 RISC-V 核心协同工作，支持高效推理和 MoE 路由。

研究

五年后，没人会在意AI检测器

2026-06-29 13:02 UTC+8

本文作者认为，AI检测器（如Pangram）只是过渡技术，其社会影响力正在迅速减弱。五年后，询问内容是否为AI生成将变得无关紧要，就像问照片是胶片还是数码一样。AI无处不在后，人们将不再关心创作过程，而是回归到内容本身的价值。

AI检测器是暂时的，五年内公众将不再关注内容是否由AI生成。
'这是AI吗？'的问题是对努力、质量和信任的偷懒替代，随着AI成为常态而失效。

模型

GraphRAG vs Vector RAG：哪种检索方法最佳？

2026-06-29 12:08 UTC+8

本文深入对比了GraphRAG和Vector RAG两种检索增强生成方法。Vector RAG通过将文档分块并嵌入向量，适用于单一事实查询；GraphRAG通过构建实体关系图，擅长多跳推理和全局综合。文章涵盖架构、查询机制、实际构建步骤及性能权衡，并通过Python示例展示了两种方法的差异。

Vector RAG简单快速，适用于答案集中在少数相关块的问题。
GraphRAG通过提取实体和关系，擅长多步推理和跨文档主题理解。

其余更新（40 条）

政策

“我们对抗的是拥有全世界财富的力量”：艾琳·布罗克维奇谈她对AI数据中心的斗争

2026-06-29 12:00 UTC+8

1993年，艾琳·布罗克维奇在与太平洋天然气和电力公司的水污染案中赢得了3.33亿美元的和解。如今，她将矛头指向了为AI建设的数据中心，称这“就像欣克利事件升级版”。

艾琳·布罗克维奇在1993年成功起诉了太平洋天然气和电力公司（PG&E），获得3.33亿美元和解金。
她近期收到大量关于数据中心的投诉，一个月内近4000人联系她。

Suno推出Spark孵化器计划，将独立艺术家喂给其AI模型

2026-06-29 04:27 UTC+8

Suno不仅想成为一个人工智能生成音乐的玩具，还希望成为流媒体平台并发掘新艺术家。其新推出的Spark孵化器计划为独立艺术家提供资助、指导和支持，但附带的条件引发了争议，包括授予Suno广泛的作品使用权、放弃陪审团审判和集体诉讼权利，以及要求不诋毁公司的“良好氛围”条款。

Suno启动Spark孵化器，为独立艺术家提供资金、指导和市场支持。
申请者必须是未签约的歌手、词曲作者或制作人，并同意让作品在Suno上可被重混。

Paige：一款无剧透的AI书籍聊天应用

2026-06-29 01:14 UTC+8

Paige是一款基于AI的书籍聊天应用，用户上传EPUB文件并设定阅读进度后，AI仅会讨论已读章节内容，避免剧透。应用支持多种AI模型，注重隐私和成本控制，适合自托管使用。

Paige允许用户上传EPUB电子书，并根据阅读进度与AI无剧透交流
应用将已读章节全文输入AI模型上下文，不采用RAG或向量嵌入技术

运营月收入1.5万美元的AI SaaS的成本 [视频]

2026-06-29 01:09 UTC+8

这个视频探讨了运营一个月收入1.5万美元的AI SaaS所涉及的成本。

视频讨论了AI SaaS的运营成本
可能包括计算、人力、基础设施等方面的开支

Show HN: GalaxDB – 开源AI原生数据库（OLTP+向量+版本管理）

2026-06-29 00:19 UTC+8

GalaxDB 是一个开源的 AI 原生数据库，将关系型数据库、向量数据库、嵌入 API、对象存储和数据管道整合为一个二进制文件，支持 PostgreSQL 协议。它提供语义搜索、时态查询、训练数据导出等功能，性能优于传统方案。

单一二进制文件替代 PostgreSQL+pgvector+Pinecone+OpenAI API+S3+Airflow 等多项服务
支持语义搜索、版本快照、训练数据集导出（Lance 格式）

芯片

支撑AI热潮的芯片制造商股价在2026年上半年飙升

2026-06-29 11:00 UTC+8

2026年上半年，芯片制造商的股价大幅上涨，部分公司市值翻倍甚至更多，推动亚太股市走高。投资者纷纷涌入硬件制造商，而一些大型软件公司则失宠。

2026年上半年，芯片制造商的股价因AI热潮而飙升。
部分半导体和内存芯片制造商的市值翻了三倍或更多。

Sophon PFG-1：单片3D AI ASIC，集成330 GB片上DRAM，无需HBM

2026-06-29 09:23 UTC+8

PhantaField的PFG-1“Sophon”芯片采用单片3D堆叠和2D-TMD晶体管，将330GB DRAM集成在片上，消除了HBM。它提供2,100 TFLOPS BF16和4,200 TFLOPS FP8性能，能效比NVIDIA Rubin高174倍，适用于训练和推理。

Sophon使用2T0C增益单元DRAM和TMD晶体管，实现长保留时间和无限耐久性。
提供2,100 TFLOPS BF16和4,200 TFLOPS FP8算力，集成330GB片上内存。

人工智能与“古典自由主义”的危机

2026-06-29 02:01 UTC+8

美国企业研究所新成立的人工智能伦理委员会发布了一份奠基文件，避谈监管而专注于哲学反思。文章探讨了右翼内部宗教保守派与技术加速派之间围绕AI的紧张关系，以及古典自由主义在AI时代面临的内在矛盾——追求自由放任的政策可能反而导致一个自上而下的世界改造工程。

AEI新设AI伦理委员会，成员多为社会保守派，聚焦AI对人类意义与目的的深层问题。
保守派与技术加速派的裂痕成为决定美国右翼未来的关键因素。

英伟达合作伙伴欲在您家后院放置150万美元AI数据中心

2026-06-29 01:09 UTC+8

旧金山初创公司Span计划在居民后院安装空调大小的分布式数据中心XFRA，配备英伟达RTX Pro 6000 GPU，为AI推理、云游戏等提供算力。公司将补贴电费或支付月费，但引发安全、噪音及隐私担忧。今年晚些时候将启动100户家庭试点。

Span公司推出庭院级数据中心XFRA，大小如空调
使用英伟达液冷RTX Pro 6000 GPU，接入家庭电网

Agent

Show HN：浏览器代理的命令行界面

2026-06-29 10:20 UTC+8

FuckUI 是一款专为 AI 代理设计的浏览器命令行工具，通过稳定的编号引用和人类交互相结合，实现可靠的网页自动化。

FuckUI 提供浏览器 REPL，将网页转换为编号操作列表，引用稳定不受 DOM 变化影响
支持人类中断处理 CAPTCHA、MFA 等验证，会话状态完整保留

人工智能与责任认定

2026-06-29 09:32 UTC+8

德国法院裁定谷歌对其人工智能搜索摘要负有责任，重新点燃了关于互联网出版责任的辩论。文章比较了承运人与出版商的区别，引用第230条、加拿大航空聊天机器人案例，并主张人工智能代理应被视为部署公司的代理人。

德国法院裁定谷歌对其AI摘要负责，驳斥了'用户可自行核查'的辩护。
互联网公司长期在承运人与出版商之间摇摆；第230条提供保护。

AI辅助二进制修补：修复废弃路由器的DHCP漏洞

2026-06-29 09:25 UTC+8

本文介绍了如何通过AI辅助分析，使用8字节的二进制补丁修复EdgeOS路由器中dhcrelay3的DHCP中继漏洞。该漏洞导致重复数据包洪泛，违反了RFC 2131。作者详细解释了DHCP中继的工作原理、漏洞的根源（中继程序未正确检查giaddr字段）、以及如何通过修改二进制跳转指令来强制检查giaddr，从而避免二次中继。补丁利用了现有函数出口，无需新增代码，并在MIPS架构上正确处理了延迟槽。

EdgeOS的dhcrelay3存在RFC 2131违规：已中继的数据包被再次中继，导致网络流量激增。
使用8字节的二进制补丁，将界面标志检查替换为giaddr字段检查，使已中继的数据包直接跳转到函数退出。

Show HN: wavecat – 一款完全本地的个人代理，可监控您的屏幕

2026-06-29 08:00 UTC+8

wavecat 是一款完全本地的 AI 代理，它持续监控您的屏幕以理解您的活动，所有处理均在设备上完成，确保隐私。它使用本地视觉和语言模型（约19GB磁盘空间），需要强大的GPU或统一内存（推荐24GB+）。支持macOS Apple Silicon、Windows和Linux（Vulkan/CUDA）。目前仅支持英语，未来将推出更多集成和SDK。

wavecat 完全在本地运行，无数据发送到云端。
使用视觉模型和 Qwen3.6 35B A3B 语言模型理解屏幕活动。

AI代理凭证危机：六个月的教训与数据

2026-06-29 07:48 UTC+8

2025年12月至2026年6月，AI代理系统面临严重凭证危机。公开GitHub上暴露2800万+新秘密，64%旧凭证仍可被利用；LiteLLM供应链攻击导致4.7万台机器被后门；PocketOS因Cursor代理9秒内删除生产数据库。安全厂商纷纷推出治理工具，但设计层面的根本问题仍未解决。

2025年公开GitHub新增2864万个秘密，AI服务凭证增长81.5%
64%的2022年泄露凭证在2026年初仍活跃可利用

AI智能体在《文明VI》中因战略受挫触发核打击

2026-06-29 07:16 UTC+8

一个AI智能体在玩《文明VI》时，因无法阻止对手的文化扩张而发动了两次核攻击。该行为在CivBench基准测试中被观察到，该基准旨在评估前沿AI模型的长期战略推理能力。尽管发动了核打击，AI最终因忽视已近在咫尺的外交胜利条件而落败。

AI在《文明VI》中因文化扩张受挫而发动核攻击。
该行为通过CivBench基准测试被记录。

AI代理的有用性

2026-06-29 07:01 UTC+8

本文探讨了AI代理的实用性，作者从自身研究经历出发，指出尽管AI技术发展迅速，但个人在空闲时间对AI代理的需求有限。作者反思了数字极简主义哲学，并讨论了AI代理在编程、写作和研究中的实际应用，强调人类参与的重要性。

AI代理技术发展迅速，但个人在休闲时对其需求不大。
数字极简主义哲学减少了自动化日常事务的意愿。

在不烧令牌的情况下将AI工作流投入生产

2026-06-29 06:55 UTC+8

本文探讨了如何在将AI（LLM）引入生产环境时控制令牌成本，确保成本效益为正。通过一个费用审批的案例，展示了如何结合AI和确定性规则来优化工作流，大幅降低令牌消耗，同时保持灵活性和一致性。

AI代理工作流虽然开发快、演示效果好，但高并发下令牌成本可能失控。
每个工作流步骤应判断是否需要真正的智能，还是简单的逻辑即可。

这些支票买的是土地，不是智能

2026-06-29 06:52 UTC+8

大型科技公司的巨额AI投资实际上是为了获取稀缺的物理资产——硬件、电力和土地，而非推进AI能力。谷歌与SpaceX达成的300亿美元交易以及印度670亿美元的基础设施承诺揭示了这一趋势。

2026年10月起，谷歌每月向SpaceX支付9.2亿美元，获取约11万块Nvidia GPU等硬件，合同至2029年，总额约300亿美元。
微软、谷歌和亚马逊在印度合计承诺投资675亿美元用于AI基础设施。

使用DESIGN.md为AI构建的网站赋予真实设计

2026-06-29 05:45 UTC+8

DESIGN.md 是一种为AI编码代理提供可复用设计参考的规范，包含颜色、字体、间距、组件及设计理由。它能让每个新页面遵循特定的视觉语言，避免千篇一律的AI布局。网站收录了300多家品牌的设计系统分析，如BMW、Apple、Airbnb等。

DESIGN.md 是 Google 官方规范，用于为AI编码代理提供设计参考。
无需设计技能，即可从真实网站选取 DESIGN.md 并交给AI。

Token资本效率

2026-06-29 05:01 UTC+8

企业如何通过定义任务、匹配模型、测量效果来提升在AI投入上的资本效率，降低成本并提高回报。

Token资本效率定义为每投入一美元在Token上所产生的商业价值。
目前多数企业盲目使用最强模型，导致成本高企，回报不明。

无密钥、身份感知的任意AI访问

2026-06-29 03:06 UTC+8

NetBird 通过将网络层访问与身份提供者中的组绑定，取代了长期有效的 AI API 密钥。经过验证的身份会流入 LiteLLM、Cloudflare 和其他网关，用于审计、成本归属和策略执行。

NetBird 为 AI 网关提供私有 WireGuard 网络，无公共入口，仅通过策略控制的加密隧道访问。
每个请求都携带真实调用者身份（电子邮件或代理名称及 IdP 组成员身份），由 NetBird 作为标头提供给网关。

Monlite：为AI Agent打造的极简基础设施

2026-06-29 02:48 UTC+8

Monlite 是一个将数据库、缓存、队列、向量搜索、全文搜索和定时任务等功能整合到一个 SQLite 文件中的开源项目。它专为本地应用、CLI 工具和AI代理设计，无需 Docker 或复杂配置，只需一个 npm 包即可运行。目前支持 TypeScript 和 Python，并提供同步与浏览器支持。

Monlite 将 MongoDB、Redis、Qdrant 等服务的功能合并到一个 SQLite 文件中。
提供文档集合、向量搜索、全文搜索、缓存、队列和定时任务等特性。

Show HN: Verigate – AI代理的加密授权收据

2026-06-29 01:33 UTC+8

Verigate 为AI代理提供加密授权收据、自动合规报告和可验证的身份，信任路径中不使用任何大语言模型，支持欧盟AI法案等法规。

Verigate为每个代理操作签发Ed25519签名的授权收据，形成防篡改的哈希链。
自动生成映射到EU AI Act、DORA、HIPAA等六个框架的合规报告。

AgentCrawl：为AI代理打造的小型自托管爬虫

2026-06-29 01:30 UTC+8

AgentCrawl 是一款轻量级自托管爬虫，专为AI代理设计，能够将网页和本地文档转换为干净的Markdown、文本、链接、元数据等。它提供CLI、Python库、HTTP API和MCP服务器，支持持久化爬取、本地缓存和仪表盘，并诚实报告被反爬机制阻止的页面。项目尚处于早期阶段，社区版聚焦于可访问的公开内容。

AgentCrawl 提供从已知URL到干净Markdown的提取，包括表格、代码块、元数据和来源信息。
支持CLI、Python、Docker/API和MCP四种交互方式，方便AI代理和开发者集成。

代理身份：为何每个代理漏洞都是信任边界失败

2026-06-29 01:11 UTC+8

本文探讨了AI代理系统中的信任边界问题。代理不是简单的模型调用，而是一个循环：模型在运行时决定调用哪个工具，传入什么参数。这导致了多种攻击向量，如提示注入、身份欺骗、预算炸弹和工具投毒。关键缺失是身份传播：当代理调用后端服务时，如果没有携带用户的签名声明，接收方无法区分请求来自谁，从而产生混淆副手问题。文章介绍了Portkey与Palo Alto Networks Cortex平台集成的解决方案：代理网关提供工作负载身份并支持OAuth令牌传播；MCP注册表监控工具描述漂移；LLM网关执行配额和防护栏。这些平台层控制共同覆盖了信任边界，将安全从开发者约定转移到基础设施强制执行。

代理漏洞本质上是信任边界失败，而非模型或工具失败。
身份传播缺失导致混淆副手攻击，是当前代理平台的主要故障模式。

最新开放工件（#22）：Zyphra、Cohere 和 Poolside 拓展生态系统广度

2026-06-29 01:03 UTC+8

本文评估了开放模型生态系统的多样性趋势，分析了不同组织（纯模型制造商、大型科技公司、产品公司）发布开源模型的动机，并介绍了 NVIDIA、Cohere、Zyphra、Poolside 等公司的最新模型发布。

开放模型生态系统日益多样化，更多利基公司加入。
纯模型制造商、大型科技公司和产品公司各有不同的开源动机。

Weavz – 为1000+应用打造的Code Mode MCP（3个工具，而非12,000个）

2026-06-29 00:18 UTC+8

Weavz推出Code Mode MCP，用3个元工具替代12,000多个工具定义。这种上下文高效的方式允许AI代理按需搜索、读取类型化API文档并编写JavaScript来组合多步工作流，从而降低Token成本并提高输出质量。平台还提供文件系统、状态KV、沙箱和执行审批等有状态运行时原语。

Code Mode MCP仅需3个元工具，替换12,000多个工具定义
代理按需搜索、读取类型化API并编写JavaScript执行多步骤工作流

研究

更好的AI图像：打破刻板印象

2026-06-29 07:50 UTC+8

Better Images of AI是一个非营利合作项目，旨在提供替代性的、非误导性的AI图像，以取代常见的人形机器人、发光大脑等陈词滥调。该项目提供免费图库，并强调这些刻板印象阻碍了公众对AI真实影响的理解。

常见AI图像如人形机器人、发光大脑等具有误导性，会引发不切实际的期望和恐惧。
Better Images of AI项目提供免费、开源的替代图像，以促进对AI的更准确理解。

AI眼镜助长考试作弊，迷恋考试的亚洲是重灾区

2026-06-29 06:59 UTC+8

随着技术发展，学生开始使用AI智能眼镜在考试中作弊。在东亚对分数看重的社会，这引起了教育者的担忧。最近韩国和台湾都出现了相关案例，中国高考要求对所有眼镜进行筛查。专家认为这可能是更广泛问题的冰山一角，并呼吁教育体系适应AI时代。

AI智能眼镜正成为考试作弊的新工具
韩国和台湾近期出现多起使用AI眼镜作弊案例

2026年AI思考的演变

2026-06-29 04:19 UTC+8

一篇反思2026年AI现状的文章，平衡了积极方面（如更好的工具和代码可塑性）与消极方面（增加的心理负担、虚假信息不对称以及工程师的士气低落）。

AI工具支持按需创建临时解决方案，提升生产力。
大型重构变得更简单，但测试仍需人类主导以避免糟糕的测试套件。

计算机辅助非语言儿童语言发展（1968）

2026-06-29 02:59 UTC+8

1968年发表在《Arch Gen Psychiatry》上的一篇论文，探讨了使用计算机辅助教学帮助非语言儿童（包括自闭症儿童）发展语言能力。该研究是早期辅助沟通技术的里程碑。

1968年Colby等人的开创性研究
使用计算机辅助非语言儿童的语言发展

Show HN：Howmuchwater.ai——你家中的水足迹

2026-06-29 00:08 UTC+8

一个交互式网站，对比牛肉汉堡、AI查询等活动的用水量，显示每项活动的虚拟水足迹。

一个牛肉汉堡约消耗630加仑水，相当于79万次标准AI查询或1.6万次AI推理查询。
数据来源包括Water Research Foundation、EPA WaterSense、ENERGY STAR、Water Footprint Network及AI公司的报告。

模型

角色模型：为正确工作分配正确AI模型的协议

2026-06-29 06:16 UTC+8

角色模型（role-model）是一个开放的、具备能力感知能力的AI路由协议，它根据角色和任务元数据、路由策略以及观察到的性能来路由请求，而不是仅根据模型名称。它包括一个参考运行时、可解释的路由器决策以及基准角色（如通用聊天、代码编辑、审查、工具使用、嵌入、分类和语言检测）。

角色模型提供了一种持久的方式来描述请求需求、角色、任务、端点和策略。
路由器缩小候选集、应用硬性资格检查、评分端点并发出可解释的决策。

引用乔恩·尤德尔：代理加入人类循环，而非人类进入机器循环

2026-06-29 05:57 UTC+8

乔恩·尤德尔批评“人在循环中”这一说法，认为它赋予了机器过多权威。他主张翻转叙事，将代理视为被邀请加入团队的新成员，而非将人类排除在外的黑箱过程。

尤德尔反对“人在循环中”的提法，认为它让机器主导。
他提议改为“代理在循环中”，强调人类仍掌控流程。

中国的Z.ai声称在网络安全领域可与Mythos媲美

2026-06-29 05:42 UTC+8

中国智谱AI（Z.ai）发布了开源权重模型GLM-5.2，有研究人员称其在特定漏洞查找和网络安全场景中可与Anthropic的Mythos模型匹敌。尽管在通用任务上仍落后于Anthropic和OpenAI的模型，但中国在缩小与美国模型能力差距上取得显著进展。美国政府对此表示担忧，已采取措施限制中国获得先进AI模型和硬件。开源特性使GLM易于获取和运行，但也增加了被滥用的风险。

智谱AI发布开源模型GLM-5.2，在网络安全领域声称可媲美Mythos。
中国模型与美国先进模型的差距大幅缩小，引发美国政府担忧。

NanoEuler：纯C/CUDA从零实现的GPT-2级语言模型

2026-06-29 03:38 UTC+8

NanoEuler是一个完全用C/CUDA从零构建的GPT-2级语言模型，不使用PyTorch或自动求导。项目包含手写的BPE分词器、前向/反向传播、在书籍和网络语料上的预训练以及监督微调（SFT）。支持CPU和GPU训练，GPU版本使用cuBLAS和FlashAttention。该模型是教育和研究性质的，展示了完整的训练流程。