One Useful Thing AI 新闻来源

公开文章 12采集文章 12可信度 84刷新频率 720 分钟

健康状态健康来源类型研究原文权限 站内改写最近入库 2026-06-12ID one-useful-thing运行状态 已启用

AI analysis newsletter; summary-only unless authorization is obtained.

最新公开文章

与Mythos合作是什么感觉

2026-06-10 01:11 UTC+8

作者早期体验了首个面向公众的神话级AI模型——Claude 5 Fable。该模型在多项复杂任务中显著超越此前所有模型，能够自主运行数小时完成多页规格项目。作者感受到角色从“巫师”转变为“赞助人”，AI在幕后自主决策，用户仅需下达指令并评判结果。文章通过等时地图和数据分析软件等案例，展示了Fable的强大能力及其带来的黑箱问题。

Fable在各类任务中大幅领先现有模型，可自动执行长达数小时的复杂工作。
它通过启动多个子智能体进行调研、编码和验证，几乎无需用户干预。

共存与协同智能的终结

2026-06-05 05:13 UTC+8

作者反思了从“协同智能”到“共存”的转变，新书《共存》探讨如何在AI有时优于人类、有时不如人类的时代工作与生活。书中分享了作者写作过程中使用AI的经验，以及如何让AI成为读者和推荐者。

《共存》将于10月20日出版，预购已开启
作者亲自撰写全书，但使用AI进行反馈、事实核查和创意激发

未来的迹象：GPT-5.5

2026-04-24 04:00 UTC+8

作者提前体验了GPT-5.5，认为它标志着AI能力的重大进步，尤其是在编码、图像生成和综合应用方面。尽管模型变得更智能，应用和工具也大幅改进，但AI的“崎岖边界”依然存在，例如长篇虚构创作仍有不足。文章通过实例展示了GPT-5.5在模拟城市演变、生成学术论文和创建角色扮演游戏等方面的惊人能力。

GPT-5.5 Pro在编码任务上比前代更快更智能，能模拟动态变化的3D城镇。
OpenAI在模型、应用和工具三个层面均取得进展，包括新图像生成模型和Codex桌面应用。

Claude Dispatch 与接口的力量

2026-04-01 06:34 UTC+8

AI的能力远超人们想象，但大部分用户仅通过聊天机器人访问，这导致了认知负担。文章探讨了专门化接口（如编程代理Claude Code）、Google的实验性工具、以及个人代理（如OpenClaw和Claude Cowork）如何通过更好的接口释放AI潜力。

聊天机器人接口造成认知税，降低工作效率
专门化接口如Claude Code对程序员高效，但非技术人员缺乏优化工具

文章探讨了AI能力的指数级增长及其对工作、市场和政策的深远影响。从“协同智能”到“管理AI”的转变，AI代理（如Claude Code、Codex）已能独立完成复杂任务。作者通过“水獭测试”和多项基准测试展示了AI的快速进步，并指出虽然AI能力惊人，但实际应用仍处于早期阶段。文章还介绍了StrongDM的“软件工厂”这一激进实验，以及AI导致的“滚动式颠覆”——如金融市场波动、企业裁员和政策冲突。最后，作者警告递归自我改进（RSI）可能加速变化，但强调当前仍是塑造AI未来的关键窗口。

AI能力指数级增长，从协同智能转向管理AI代理。
强基准测试显示AI已接近或超越人类专家水平。

智能体时代AI选择指南

2026-02-18 09:45 UTC+8

本文深入分析了从聊天机器人到智能体的转变，介绍了选择AI时需要考虑的模型、应用和工具框架三个层面，并详细比较了GPT、Claude、Gemini三大前沿模型及其配套应用和框架，为不同需求的用户提供了实用建议。

AI使用已从聊天机器人转向智能体，可自主完成任务。
选择AI需考虑模型、应用和工具框架三个要素。

管理作为AI超级力量

2026-01-28 00:55 UTC+8

在宾夕法尼亚大学的一个实验中，MBA学生利用AI工具在四天内从零开始创建初创公司，展示了AI如何加速创业过程。文章探讨了AI代理工作的方程式，以及如何通过有效的委托（管理技能）来提高AI工作的成功率。

学生在四天内用AI构建了功能原型，大幅缩短了传统创业周期。
AI工作的价值取决于三个变量：人类基准时间、成功概率和AI处理时间。

Claude Code 及其未来展望

2026-01-08 07:00 UTC+8

新一代AI编码工具如Claude Code正展现出强大的自主工作能力，能够独立完成复杂任务并自我纠错。文章介绍了Claude Code的功能，如长时间自主运行、上下文压缩、技能和子代理机制，并探讨了其对编程领域的深远影响。尽管目前主要面向程序员，但预示着AI在知识工作中的更广泛应用。

Claude Code等AI工具在编程任务中实现长时间自主工作并自我纠错。
通过上下文压缩、技能和子代理等机制克服LLM局限。

AI的形态：锯齿状前沿、瓶颈与突出点

2025-12-21 01:32 UTC+8

AI的能力分布不均，被称为“锯齿状前沿”。进步常被瓶颈阻碍，一旦解决，就会带来突飞猛进，如谷歌Nano Banana Pro提升了图像生成能力，解锁了PPT制作等新功能。

AI的锯齿状前沿意味着它在某些任务上表现出色，而在其他任务上则失败，往往难以预测。
瓶颈，如图像生成能力差，可能阻碍整个系统，直到问题被解决。

从GPT-3到Gemini 3：三年AI进化之路

2025-11-19 00:55 UTC+8

作者通过对比三年前的ChatGPT和如今的Gemini 3，展示了AI从聊天机器人到智能代理的飞跃。Gemini 3不仅能编写代码、创建游戏，还能自主进行博士级研究，标志着‘数字同事’时代的来临。

三年前AI刚能写诗，如今Gemini 3能构建互动游戏并自主完成复杂研究
Google发布的Gemini 3及其代理工具Antigravity，展示了AI从对话到行动的转变

给你的AI来一场求职面试

2025-11-12 10:46 UTC+8

随着AI建议的重要性日益增加，我们需要更擅长评估AI。当前基准测试存在数据泄露、测试含义不明、难度不均等问题。但综合来看，它们仍衡量了潜在能力。然而，对于写作、商业咨询等特定任务，基准测试往往不足。作者提出通过“氛围”基准测试（如让AI画鹈鹕骑自行车）和真实任务测试（如OpenAI的GDPval研究）来深入了解AI模型，并强调组织应像面试员工一样系统性地测试AI。

当前AI基准测试存在数据泄露、测试意义不明等问题
综合基准测试显示AI能力呈上升趋势，但特定任务评估不足

关于当下使用AI的主观指南

2025-10-20 02:45 UTC+8

本文是一篇关于如何使用AI的主观指南，涵盖了免费与付费AI模型的选择、主流AI系统（如Claude、Gemini、ChatGPT等）的对比、如何获取更优答案（包括深度研究和数据连接）、多模态输入以及图像与视频生成等功能。作者基于实际使用模式给出建议，并强调实验与直觉培养的重要性。

目前约10%的人每周使用AI，大部分使用免费工具
选择AI系统时，优先考虑Claude、Gemini、ChatGPT三大付费服务（20美元/月）

One Useful Thing