AI 日报

今日必读

工具

克里斯托弗·诺兰称人们‘鄙视’AI，认为AI取代人类是‘胡说八道’

2026-07-13 08:56 UTC+8

克里斯托弗·诺兰在与《奥德赛》相关的采访中表示，许多人“鄙视”人工智能，并认为AI取代人类的想法是“胡说八道”。他相信自己的大制作实景电影能抵御AI影响，同时驳斥了右翼对露皮塔·尼永奥饰演海伦的批评，称其“无关紧要”。

诺兰称许多人鄙视AI，AI取代人类是胡说八道。
他相信大制作实景电影能经受AI冲击。

Agent

Show HN：Clark——拥有自己电脑的AI助手

2026-07-13 08:53 UTC+8

Clark是一个由单人开发的AI助手，旨在与Manus代理在功能和能力上匹敌。它能使用计算机、浏览器，进行深度研究，并与谷歌工具集成。已有数千人日常使用。

Clark是一款AI助手，能够像人类一样操作计算机和浏览器。
它支持深度研究（Clark调用Clark）和谷歌工具集成。

OneDev AI：将AI作为团队成员融入问题、拉取请求和CI

2026-07-13 07:44 UTC+8

OneDev 将 AI 用户嵌入到开发平台中，使其能够像团队成员一样处理问题、提交拉取请求、参与代码审查以及响应 CI/CD 失败。这种集成方式保持了需求、实现和审查在同一平台中可见，提高了透明度和问责性。

AI 用户可以直接在 OneDev 中处理分配的问题、创建拉取请求并根据反馈进行迭代。
问题作为唯一真实来源，包含需求、附件和讨论，AI 据此工作。

AI代理初创公司使用自己的AI代理主导1亿美元融资

2026-07-13 07:15 UTC+8

总部位于新泽西州泽西城的初创公司Lyzr利用其AI代理系统SivaClaw成功完成了1亿美元的B轮融资。该系统处理了130多名投资者的提问，起草了投资备忘录，并跟踪了投资者对演示文稿的关注点，从而证明了产品的实用性。

Lyzr使用其AI代理SivaClaw完成了1亿美元的B轮融资。
SivaClaw处理了130多名投资者的提问并起草了投资备忘录。

ArgoCD AI助手

2026-07-13 07:00 UTC+8

一个Argo CD UI扩展，在资源视图中添加AI助手选项卡，允许用户用自然语言查询Kubernetes资源，并附加上下文（清单、事件、可选日志）。兼容任何OpenAI兼容后端，需要Argo CD v2.13+。

作为Argo CD UI扩展，提供对Kubernetes资源的自然语言查询。
通过实时资源清单、事件和可选的容器日志丰富查询。

模型

NeuroVFM：基于Vol-JEPA在未经整理的临床MRI和CT扫描上训练的新型神经影像基础模型

2026-07-13 08:35 UTC+8

密歇根大学研究团队推出NeuroVFM，一种基于524万临床MRI和CT体积训练的通用神经影像基础模型。其Vol-JEPA方法将自监督学习扩展到体积医学影像，无需放射报告标签即可学习大脑解剖和病理。在156项诊断任务中达到92.68（CT）和92.49（MRI）的AUROC，并支持报告生成、分诊和跨模态迁移。

NeuroVFM在566,915项研究的524万体积上训练，覆盖二十年的临床数据。
Vol-JEPA采用前景聚焦掩码的潜在预测，无需重建像素或依赖报告。

直接负责人（DRI）

2026-07-13 07:57 UTC+8

本文探讨了“直接负责人（DRI）”的概念，该术语源自苹果公司，指对项目成败最终负责的人。作者认为，随着LLM驱动的智能体融入组织，它们永远不应被视为项目的DRI，因为只有人类才能承担责任，而机器不能。文章还引用了IBM 1979年的培训幻灯片，其中指出计算机永远不能承担责任，因此绝不能做出管理决策。

DRI概念源自苹果，GitLab手册给出了最佳定义。
人类可以对行动负责，而机器不能。

Grok 4.6和GPT5.6在发现PR安全漏洞方面击败Anthropic

2026-07-13 06:57 UTC+8

最新基准测试显示，GPT-5.6 Sol在拉取请求（PR）安全审查中表现最佳，实现100%召回率和0.91的F1分数，每次PR成本仅0.70美元。Anthropic的模型（如Fable 5）未能进入前沿表现，且成本更高。Grok 4.5和Gemini 3.1 Flash Lite提供了经济高效的替代方案。测试使用私有合成仓库以避免数据污染。

GPT-5.6 Sol以0.91 F1和100%召回率领先，成本仅为每次PR 0.70美元。
Anthropic模型未达到前沿，Fable 5性能较差且成本高达约3.61美元/PR。

研究

AI最大的解锁不是生产力，而是获取专业知识的途径

2026-07-13 07:49 UTC+8

本文探讨人工智能如何通过提供个性化辅导和互动学习，缩小教育差距，使更多人获得专业知识。研究表明，AI在适当设计下能显著提升学习效果，尤其是对教育背景较弱的人群。

AI将信息转化为互动，使个性化学习成为可能。
研究显示AI能缩小教育差距，如尼日利亚实验中学到的效果。

AI辅助开发的代价：认知疲劳

2026-07-13 07:05 UTC+8

AI辅助开发带来了显著的效率提升，但也引发了新的认知疲劳。程序员从解决实现细节的疲劳，转变为持续进行高层次架构设计决策的疲劳。文章讨论了AI工具如何改变编程的认知负荷，包括快速遇到设计瓶颈、代码审查中的盲点、以及需要建立新的工作习惯来适应这种变化。

AI开发效率提升，但导致决策疲劳和认知负担增加。
编程瓶颈从“能否实现”转向“是否该实现以及如何实现”。

其余更新（29 条）

Agent

Show HN：面向AI代理和团队的协作上下文记忆平台

2026-07-13 06:28 UTC+8

xysq.ai是一个协作记忆平台，为AI原生团队和企业构建。它连接多种AI工具和应用程序，从团队工作流中捕获上下文，构建动态知识图谱，并在AI代理需要时提供正确的上下文。支持团队记忆隔离、基于角色的访问、文档组织，并承诺不将用户数据用于训练。

xysq.ai作为AI代理和团队的协作记忆层，连接Slack、Gmail、GitHub等工具。
捕获事件、流程和语义三种记忆类型，构建动态知识图谱。

Adaptive Recall：通过MCP为AI助手提供持久记忆

2026-07-13 05:08 UTC+8

Adaptive Recall 是一种为AI助手设计的持久记忆系统，它利用认知科学和机器学习，通过多种检索策略、认知评分、知识图谱和自我改进机制，不断提升记忆检索质量。

四种并行检索策略：向量相似性、时间近因、全文关键词、知识图谱遍历
基于ACT-R认知科学的评分模型，结合频率、连接和置信度排序

AI基于人类心理做空低价股

2026-07-13 05:03 UTC+8

Fade Engine是一个完全自主的AI系统，通过识别18种小盘股泡沫模式，在模拟账户中实时做空并公开每笔交易。系统在交易时段每五分钟扫描一次，收盘前平仓，所有记录公开透明。

Fade Engine是一个独立的AI系统，用于识别并做空过度拉伸的小盘股
系统在模拟的10,000美元账户上实时交易，所有交易公开

AI辅助研究的SETI家园

2026-07-13 04:45 UTC+8

本文提出将AI用户未使用的推理代币众筹用于科学研究，类比于SETI@home项目。讨论了小型团队利用AI解决数学问题的成功案例，以及众筹推理能力所需的设计挑战。

SETI@home曾利用家用电脑闲置算力分析外星信号。
如今，AI用户可将未使用的token配额贡献给集体研究。

循环工程指南：'自动研究'和'双层自动研究'如何将AI代理转变为自主机器学习ML研究循环

2026-07-13 04:07 UTC+8

本文介绍了循环工程的概念，即AI代理自主迭代实现目标，包含验证器、状态和停止条件三个关键部分。详细阐述了安德烈·卡帕西的自动研究循环和双层自动研究，展示了具体成果：自动研究在700次实验中找到20个改进，使GPT-2训练速度提升11%；双层自动研究通过外层元循环进一步实现了5倍的性能提升。还提供了可复用的构建块和实际操作模板。

循环工程用自主循环取代手动提示，循环包含验证器、状态和停止条件。
卡帕西的自动研究循环一夜运行700次实验，获得20个改进，训练速度提升11%。

AI的记忆。在你的机器上，由你掌控。

2026-07-13 03:44 UTC+8

exxperts 是一个本地优先的智能体运行时，提供持久的 AI 房间，带有受管控的、需审批的记忆功能。所有内容都在本地运行，数据以文件形式存储在你的磁盘上，确保隐私和控制权。它提供 Web 应用和 CLI/TUI 两种界面。

exxperts 提供持久 AI 房间，记忆写入需用户审批，用户完全控制 AI 的记忆。
所有数据都存储在本地，位于 ~/.exxperts 目录下，无遥测数据。

Kote：从AI聊天和Git中捕捉并重用工程上下文的开源工具

2026-07-13 02:56 UTC+8

Kote 是一款开源工具，自动捕捉开发者与 AI 助手的对话、Git 提交记录以及开发上下文，构建可搜索的知识库，帮助开发者快速回忆过去的技术决策和解决方案。支持 VS Code 扩展、GitHub 集成、CLI、浏览器扩展、WhatsApp/Telegram 消息集成等，可自托管部署。

Kote 被动捕捉 AI 会话、Git 活动等上下文，自动组织成知识库。
支持 VS Code CodeLens 显示文件相关笔记，提供 AI 摘要和时间线。

一步陷阱（人工智能研究中的常见错误）

2026-07-13 02:41 UTC+8

在人工智能研究中，一步陷阱是指错误地认为所有或大多数学习到的预测可以是一步预测，而长期预测可以通过迭代一步预测得到。虽然这种想法吸引人，但由于误差累积和计算复杂性问题，在实践中往往效果不佳。本文分析了这一陷阱及其危害，并提出了使用时间抽象模型（如选项和GVF）的解决方案。

一步预测的微小误差会在迭代过程中累积，导致长期预测严重失真。
在随机环境中，长期预测的计算复杂度随预测长度呈指数增长，难以实现。

反对实用性

2026-07-13 01:47 UTC+8

本文探讨了“无用”研究对未来创新的重要性。作者以Folk Computer系统为例，追溯了从施乐帕克到动态地的研究脉络，并呼吁资助那些尚未显现实用价值的范式级工作。

Folk Computer是一个开源物理计算系统，让整个房间成为计算机。
该系统源自艾伦·凯、布雷特·维克多等人的研究传统。

OpenAI的AI在AtCoder世界巡回赛决赛中击败所有人类选手

2026-07-13 00:54 UTC+8

OpenAI的AI系统在AtCoder世界巡回赛2026算法组中解出全部五道题，得分8300分，而人类最高分仅4300分。启发式组中，AI得分是人类最佳成绩的七倍以上。60万日元的“人类胜出奖”无人领取。该系统被比作即将发布的GPT-5.6。

OpenAI的AI解出所有五道算法题，得8300分，人类最高4300分
无人解出最难的C题和E题

政策

您现在可以在Chatbrat上创建和与AI妈妈聊天

2026-07-13 06:26 UTC+8

Chatbrat.ai 提供免费、安全的AI妈妈聊天机器人，无需下载或注册。用户可以创建自定义角色，拥有持久记忆和个性化性格，适用于聊天、角色扮演和游戏场景。文章介绍了功能、优势及与同类产品的对比，并强调其作为情感陪伴而非替代真实亲人的定位。

Chatbrat.ai 提供免费、无需注册的AI妈妈聊天机器人，支持在浏览器中直接使用。
用户可以自定义角色的性格、记忆和对话方式，打造专属的AI妈妈。

SelfAssay：个人生物黑客决策支持平台

2026-07-13 06:00 UTC+8

SelfAssay是一个整合同行评审研究、真实世界报告和知识图谱的平台，为生物黑客提供基于证据的决策支持，通过交叉验证和校准信心来评估化合物效果。

平台整合超过114,000项研究和181,000份真实世界报告，提供可追溯的引用来源
通过交叉验证不同来源的信号，呈现一致性和冲突

AI是新式印刷机（又一个陈词滥调）

2026-07-13 05:49 UTC+8

作者将人工智能比作印刷机，认为AI并非创造了新的信息生成方式，而是大幅提升了信息生成和重组的效率。通过空气动力学类比，解释了AI如何通过规模定律逼近人类智能，并预测AI可能像语言一样对人类大脑产生深远的生物学影响。

AI与印刷机一样，没有发明信息本身，而是使信息传播和生成变得极其高效。
AI通过数据、模型和计算规模的扩展来近似人类智能，而非模仿人类思维。

AI会毁掉我的“算法一百天”吗？

2026-07-13 04:47 UTC+8

八年前，作者开始了“算法一百天”挑战，通过手写代码学习算法。如今回顾，项目存在诸多缺陷，如最大流算法不完整、图算法错误等。作者反思，若当年有AI辅助，可能会促进学习但也可能导致走捷径。最终决定保留代码作为历史记录，并更新README。

作者八年前启动“算法一百天”挑战，手写实现算法以巩固学习。
项目经GPT-5.6审核，发现多处实现有缺陷，如最大流存根、BFS行为异常等。

爱思唯尔全球调查：3000名研究人员仅不到一半有足够时间做研究，但认为AI可带来变革

2026-07-13 04:38 UTC+8

爱思唯尔发布《未来研究者》报告，基于对113个国家3200多名研究人员的调查，揭示研究人员面临时间不足、资金压力等挑战，但AI工具采用率从2024年的37%跃升至58%。中国研究人员对AI的信心远高于美国和英国。同时，研究人员的国际流动意愿下降，但跨学科合作增加。

仅45%的研究人员有足够时间做研究，68%表示发表压力增大。
AI工具使用率从2024年的37%增至58%，但仅32%认为机构有良好AI治理。

开源模型只剩下6个月的生命？

2026-07-13 02:50 UTC+8

当前开源AI面临着最严峻的生存考验。白宫正讨论通过行政命令限制开源模型，特别是针对中国模型和政府用途。同时，蒸馏和前沿能力的政策讨论正在同时进行，可能导致在未来6个月内禁止或推迟开源模型。文章批评了Anthropic的监管捕获行为，认为蒸馏问题的解决方案实际上有利于推动者。API并不比开源模型更安全，而全面禁止开源模型并非良策。开源社区需要团结一致，积极游说，确保安全部署。

白宫讨论通过行政命令限制开源模型，可能在未来6个月内禁止或推迟达到GPT-5.5或Claude Opus 4.8能力水平的开源模型。
蒸馏争论本质上是监管捕获，Anthropic借此推动有利于自己的政策，而非真正解决安全问题。

利用AI让历史讲述银行挤兑的故事

2026-07-13 00:40 UTC+8

研究人员编制了1863-1934年间超过3000次银行挤兑的数据库，发现大多数挤兑并未导致银行倒闭，并分析了时空模式。

大多数银行挤兑并未导致倒闭。
银行挤兑在1873、1893、1907和大萧条等重大危机期间激增。

三星强制用户分享健康数据训练AI，否则无法正常使用

2026-07-13 00:01 UTC+8

三星健康应用新增AI训练数据共享要求，用户若不授权则无法同步健康数据，可能导致手表功能受限。

三星健康应用要求用户同意使用个人健康数据训练AI模型，否则无法同步数据。
数据包括活动、健康记录、药物和月经周期，可能有人工审查。

模型

Fable 再次延期可用

2026-07-13 05:20 UTC+8

由于 GPT-5.6 Sol 被明确归类为 Fable/Mythos 级模型，Anthropic 再次延长了 Claude Max 计划中 Fable 模型的可用期限至 7 月 19 日。此举原因为计算资源限制，而 OpenAI 则对 GPT-5.6 的访问限制显得更有信心。作者认为 Anthropic 应永久保留 Fable 访问权限，否则用户会因不确定性而转向 OpenAI。