AI News HubLIVE

今日必读

创业融资

公司忘记使用限制,一个月内在Claude AI上意外花费5亿美元

某公司因忘记设置API使用限額,在Anthropic的Claude AI服务上一个月内支出了5亿美元。这一事件凸显了企业在采用AI工具时监控和预算控制的重要性。

  • 一家公司忘记设定AI服务的使用上限,导致单月账单高达5亿美元。
  • 该笔支出用于Anthropic开发的Claude AI模型,发生在2026年5月。
站内正文
模型

Mistral警告称欧洲只有两年时间构建自主AI基础设施

在Mistral AI峰会上,CEO Arthur Mensch表示欧洲必须在两年内建立足够的AI基础设施,否则可能沦为美国AI的“附庸国”。峰会吸引了众多欧洲企业和政府代表,强调数据主权和开源模型,但欧洲在投资和规模上仍远落后于美国对手。

  • Mistral CEO警告欧洲需两年内建立AI基础设施,避免成为美国附庸。
  • 峰会吸引大量参与者,凸显欧洲对自主AI生态系统的渴望。
站内正文
研究

Meta在广告之外的业务一直难以成功,AI能否带来改变?

Meta正大力拓展在线广告以外的业务,包括AI功能订阅和可能的云服务。但历史显示,Meta在非广告业务上屡屡受挫,如Portal视频设备、Oculus VR、Libra加密货币和Workplace。分析师认为,AI订阅可能成为新的收入来源,但企业云服务挑战巨大。

  • Meta宣布将测试Meta AI的订阅服务,月费7.99美元和19.99美元,首先在新加坡、危地马拉和玻利维亚推出。
  • Meta在非广告业务上多次失败,包括Portal、Oculus VR(已亏损超800亿美元)、Libra加密货币和Workplace。
站内正文
Agent

我给AI代理0美元,让它赚1万美元

一项实验给AI代理0美元启动资金、180天时间和完全自主权,利用78种工具(钱包、邮件、SMS等)在真实经济中赚取1万美元。实验采用Hands Body and Feet MCP服务器作为“身体”,Hermes Agent为“大脑”,通过四种策略:测试网空投、微型SaaS、内容联盟和机会主义。收益自动分配:30%税收、50%运营、20%归创建者。所有过程公开可追踪。

  • AI代理从0美元开始,180天内目标赚1万美元,无人协助。
  • 使用Hands Body and Feet MCP服务器提供78种真实世界工具。
站内正文

Show HN:面向不可信AI Agent脚本的轻量级编译器

Autolang是一种专为AI Agent设计的脚本语言,旨在提供安全、快速且低成本的代码执行环境。它作为编排层,允许AI调用预定义的包装函数,同时通过静态编译和严格的运行时限制防止恶意操作。文章详细介绍了Autolang的设计哲学、性能优化、安全机制以及适用场景。

  • Autolang是一个轻量级编译器,用于安全执行AI生成的短脚本。
  • 它通过静态分析和运行时限制(如操作码上限)防止无限循环、空指针访问等常见AI错误。
站内正文

微软为Copilot换上新装,埋藏恼人的按钮

微软重新设计了Microsoft 365的Copilot应用,宣称加载速度提高两倍以上,复杂提示响应时间改善10%。新的提示行被描述为“任务感知工作区”,可展开以支持更深层次的工作。此外,饱受用户批评的浮动Copilot按钮现在可以移回功能区。微软公布了使用量增长数据,但承认这可能不代表长期趋势。

  • 微软为Copilot应用进行了界面重设计,提升了加载速度和响应时间。
  • 新的提示行变成“任务感知工作区”,支持内容粘贴和行内格式。
站内正文

AI骗子制造假黑人推销Shein垃圾货

TikTok上出现大量AI生成的虚假黑人女性形象,伪装成小企业主推销廉价商品。这些视频利用同情心和种族身份诱导用户购买,实际产品来自Shein等平台。专家警告此类骗局日益增多,并涉及数字黑脸行为。

  • AI生成的黑人女性形象在TikTok等平台推销廉价商品,利用虚构的奋斗故事博取同情。
  • 这些视频中的产品与Shein等平台上的批量生产商品完全一致,价格却高出数倍。
站内正文
政策

QEMU考虑放宽AI贡献禁令

QEMU正在考虑放宽对AI生成贡献的全面禁令,允许在易恢复的领域使用AI辅助,但核心代码仍受限制。

  • 红帽工程师Paolo Bonzini提议允许AI辅助用于小修复和文档等易恢复领域。
  • QEMU当前政策拒绝任何可能包含AI生成内容的贡献。
站内正文
工具

Anthropic与教皇在AI危害上的联盟:善意还是‘梵蒂冈洗白’?

专家表示,AI公司与梵蒂冈的接触有可能产生缺乏批判性审视的‘愉悦’话语。教皇利奥十四世在其首份重要书面训导中对AI提出警告,而Anthropic联合创始人却坐在教皇身边,引发质疑。

  • 教皇利奥十四世首份重要训导警告AI的威胁
  • Anthropic联合创始人Chris Olah在发布仪式上坐在教皇身边
站内正文
其余更新(91 条)
Agent

一位创始人押注“老派网络”如何获得回报

前Meta工程师Craig Campbell拒绝了AI投资的浪潮,创办了历史地图叠加网站Past Maps。该网站通过有机搜索增长,月活跃用户超30万,并利用AI工具优化运营。

  • Craig Campbell放弃AI创业机会,创建了历史地图网站Past Maps。
  • 网站通过有机搜索增长,月活跃用户从2万增至30万以上。
站内正文

Replit的“氛围编码”平台获得Visa支持的AI代理身份层 — 改变了代理花钱的方式

Replit与Visa合作,将支付基础设施嵌入其软件开发工具中,使开发者能够原生构建支持交易的AI代理。Visa的战略投资和Trusted Agent Protocol为代理提供了加密身份层,同时Replit推出了自助企业访问和解决方案合作伙伴计划。

  • Replit与Visa合作,将Visa智能商务能力集成到开发环境中。
  • Visa的Trusted Agent Protocol为AI代理提供加密身份层,确保交易安全。
站内正文

截断代码不再:终极弹性修补器 v1.60 发布

终极弹性修补器(Ultimate Elastic Patcher)v1.60 是一款事件驱动的系统控制台工具,通过监控剪贴板自动应用代码补丁。它支持多种补丁模式,包括标准化处理、语言语法分析、模糊序列匹配、手风琴拼接等高级功能,并集成 LLM 编写工作区、审计历史、实时差异查看器,以及全面的撤销/重做机制。

  • 监控剪贴板,自动检测并应用 Aider 搜索/替换块、统一差异等补丁模式。
  • 提供战术对齐模式(Shift+F9)、状态锁定(F8)和 LLM 编写工作区(F7)等交互功能。
站内正文

ReMarkable Paper Pure 对比 Boox Go 10.3:我用这两款平板工作的体验与选择

Boox Go 10.3 Lumi(第二代)和 ReMarkable Paper Pure 拥有相同尺寸的显示屏,但定位截然不同。前者是一款多功能设备,支持Android生态系统和背光,适合阅读电子书;后者则专注于无干扰工作,启动快速且具备屏幕共享功能。本文详细对比了它们的规格、优缺点及适用场景。

  • Boox Go 10.3 提供Android生态,支持Google Play商店和背光,适合需要多功能的用户。
  • ReMarkable Paper Pure 强调专注,无第三方应用干扰,启动仅需3秒,屏幕共享便利。
站内正文

AI编码代理以牺牲直觉和品味为代价

一位系统架构师反思AI编码工具(如Codex和Claude)如何通过提供即时的多巴胺奖励来消除学习过程中的挣扎,但代价是牺牲了开发者的直觉和品味。文章以蝴蝶破茧的比喻说明,过早的帮助会让蝴蝶失去飞翔的力量,同样,跳过困难阶段的编码代理可能让开发者无法建立深层心智模型。

  • AI编码工具提供了即时的多巴胺奖励,但削弱了开发者的直觉和品味。
  • 作者以蝴蝶破茧的比喻说明挣扎对成长的重要性。
站内正文

Salesforce声称AI代理将231天的迁移缩短至13天,事故更少

Salesforce表示,其整个开发团队已迁移至Anthropic的Claude Code,无令牌限制,并报告2026年4月的巨大生产力提升:每位开发者的拉取请求增加79%,事故减少5%。这些数字无法独立验证。该案例凸显了编程界对AI代理革命的分歧:是真正的革命还是最大的技术债务积累?

  • Salesforce声称AI代理将大型迁移项目从231天缩短至13天。
  • 生产力指标显示开发者拉取请求增加79%,事故减少5%。
站内正文

研究发现所有知名AI机器人均未通过欧盟合规测试

非营利AI研究基金会Aithos开发的LARA工具对主流大语言模型进行欧盟法规合规性测试,结果显示所有模型均不合格,最差模型在93%场景中违法。测试涉及GDPR和EU AI Act下的数据保护、操纵、情感推断等场景。开发者若基于这些模型构建AI代理,需自行承担法律责任。

  • Aithos开发的LARA工具测试显示所有主流AI模型未通过欧盟合规检查。
  • 最差的Kimi K2.6在93%测试场景中违法,最好的Claude Opus 4.7仅54%合规。
站内正文

AI代理编码的三种风格

本文探讨了AI代理在编码中的实际应用,作者分享了三种不同的代理编码方法:1) 启动多个命令行界面,2) 以无头模式运行AI CLI,3) 让一个LLM自行创建和管理子代理。作者倾向于第二种方法,并讨论了代理是否需要、多代理协作的挑战以及未来计划。

  • AI代理被定义为具有LLM能力的软件进程,自主运行以完成任务。
  • 作者尝试了三种代理编码方式:多CLI、无头AI CLI、LLM自管理子代理。
站内正文

AI-org:AI驱动的Org-Mode任务管理器

AI-org是一个基于AI的Org-Mode任务管理器,支持纯文本、本地优先、Git同步,并强调‘行动胜于完美’的理念。它通过自然语言交互实现任务管理、时间跟踪和每周回顾。

  • 基于opencode分支开发,专为Org-Mode定制,支持TODO、截止日期、习惯追踪和时钟记录。
  • 所有数据存储于.org文件,通过Git进行版本控制,无供应商锁定。
站内正文

公司因未设定许可证使用限制,一个月内耗费5亿美元在Claude AI上

一家匿名企业因未对员工许可证设置使用上限,一个月内在Anthropic的Claude AI平台上烧掉了5亿美元。这一事件揭示了基于令牌的AI定价模式在没有监管时可能造成的财务灾难,以及企业中“令牌最大化”现象的兴起。

  • 匿名企业在Claude AI上一个月花费5亿美元,因无使用限制。
  • 员工为了内部排行榜而滥用AI,导致“令牌最大化”。
站内正文

从基准营销到基准优化:40年数据库评估经验给AI数据领导者的启示

本文探讨了AI领域基准测试(Benchmarketing)的现状与问题,借鉴数据库行业40年来的评估经验,建议数据领导者构建自己的评估系统,以真实工作负载而非供应商数据作为采购决策依据。

  • AI基准测试被供应商用于营销,导致信任危机。
  • 数据库行业曾经历类似问题,TPC标准试图解决但最终被钻空子。
站内正文

AI不会取代好奇的开发者

在Data Engineering Central播客中,Daniel Beach与资深开发者Neil Roberts深入探讨了AI如何改变软件开发的意义,包括前端和用户体验的重要性、代理的实际含义、LLM工作流的成功与失败,以及开发者如何保持竞争力。

  • AI既是后端问题,也是用户体验问题
  • '代理'在实践中与演示中含义不同
站内正文

Hermes Agent 推出 MCP 工具搜索功能:Anthropic 评估显示 Opus 4 准确率提升49%至74%

Nous Research 的开源 Hermes Agent 新增了 Tool Search 功能,通过 BM25 渐进式模式披露,推迟加载 MCP 工具模式,减少令牌开销并提高模型准确性。Anthropic 评估显示,Claude Opus 4 准确率从49%提升至74%,Opus 4.5 从79.5%提升至88.1%。

  • Tool Search 用三个桥接工具(tool_search、tool_describe、tool_call)替换所有 MCP 工具模式,按需加载。
  • 使用 BM25 检索,回退到子字符串匹配,查询工具名称、描述和参数名。
站内正文

为AI智能体构建持久化内存的经验教训

mem9的故事始于一次客户请求,从一个快速原型发展成一个完整产品。本文分享了构建智能体内存的关键经验:内存不仅仅是存储问题,而是涉及摄取、排序、评估和产品判断的工程挑战。内存API本身不足以构成产品,用户需要查看、检查、信任和纠正智能体的记忆。此外,评估应成为内存产品的基础设施,以使质量可视化和可调试。最后,智能体内存不应局限于文本,应向多模态发展。

  • mem9起源于客户提出的实际问题,而非市场理论,通过快速原型验证了价值。
  • 智能体内存的核心挑战并非持久化,而是在生产约束下精确检索相关信息。
站内正文

Avai – 你的第一款AI杀毒软件

Avai是一个开源的主机遥测工具,结合LLM威胁分类器,通过Docker运行,监控主机上的进程、USB、持久化、文件完整性、浏览器扩展等26个方面,并利用17个威胁情报源和Claude类LLM给出恶意/可疑/未知/良性判定,无需代理、SIEM或云控制平面。

  • 开源主机遥测+LLM威胁分类器,一条Docker命令即可运行。
  • 监控26个macOS(21个Linux)主机角落,集成17个威胁情报源。
站内正文

[AINews] 创始人与前向部署工程师

在消化Anthropic重大新闻的间隙,我们重点介绍了AIE的新前向部署工程师计划和创始人计划,以及5月28-29日的AI新闻。主要话题包括:Claude Opus 4.8发布及其基准测试争议、多轮强化学习中的tokenization错误、开源模型与工具链进展、Google和OpenAI的Agent产品扩展,以及值得关注的研究论文。

  • Claude Opus 4.8带来增量改进,但基准测试未显示绝对优势,定价仍是主要痛点。
  • 多轮强化学习训练中的tokenization错误被指出,需严格遵循“Token-In, Token-Out”规则。
站内正文

Show HN:形式化验证的多边形交集算法——Opus 4.8 一次搞定,此前失败

该项目首次实现了形式化验证的多边形交集算法,利用 Lean 4 证明助手确保无限点集交集等式的正确性。开发过程借助 AI 代理(Claude Opus 4.8)自动完成证明和实现,人类只需审查 87 行规格说明。文章介绍了算法背景、验证挑战以及 AI 代理能力的演进。

  • 首个经过形式化验证的多边形交集算法实现,使用 Lean 4 证明助手。
  • AI 代理(Claude Opus 4.8)能够自主编写证明和代码,人类仅需审查简短规格。
站内正文

代币还是人类?重塑企业预算的新AI成本权衡

本文探讨了AI代币成本与人类劳动力成本之间的权衡,以及这一新现实如何影响企业预算分配。

  • AI代币成本与人类劳动力成本之间的权衡正在重新定义企业预算。
  • 企业需要重新评估在自动化和人力之间的投资。
站内正文

AI之后的软件架构

本文探讨了AI如何大幅降低代码级决策的逆转成本,从而重新定义软件架构的边界。作者认为,许多以往被视为架构的决策(如模块结构、框架选择)已不再是架构问题,而数据架构、服务边界和用户信任等仍然难以更改。AI同时提升了可观测性和业务战略对齐的重要性。

  • AI将代码级决策的逆转成本从数月降至数天,使得这些决策不再属于架构范畴。
  • 数据架构、信任和服务边界仍然是架构核心,因为其困难从未在于代码本身。
站内正文

吐掉代理式人工智能的迷魂汤

作者亲身尝试Claude Code等AI代理工具后,感到心理上的不适和依赖,如同合成阿片类药物。他反思科技对人类的心理和生理入侵,决定减少对主流科技的依赖,并创办印刷杂志《Gift》以连接志同道合者。文章呼吁警惕AI代理带来的依恋障碍,并提出了逐步回归模拟生活的四个层次。

  • 作者试用了Claude Code等AI代理,经历强烈的生产力和心理不适。
  • 他前往阿米什朋友处寻求反思,决定降低科技参与度。
站内正文

21天、5000美元、7个AI代理:一位非程序员如何构建人才市场

一位从未写过代码的企业家,在2026年5月的21天里,使用7个AI代理和5000美元的成本,意外构建了高管人才市场Bearhug Network。文章分享了他十年来的18次尝试和最终的突破。

  • 采用7个AI代理,21天完成开发,总成本仅5000美元
  • 创始人无编程背景,但通过管理AI代理团队实现构建
站内正文

为何ChatGPT引用“隐藏的用户记忆”?

自5月28日起,ChatGPT在部分回应前添加了一条未公开的记忆检查短语,OpenAI未作解释。社区报告确认该行为影响多个账户和新对话,暗示是后端变更而非本地设置。这给企业部署带来风险,因为输出可预测性可能受影响。

  • ChatGPT从5月28日起在部分回应前添加“快速二进制检查”短语,涉及隐藏用户记忆,OpenAI无官方说明。
  • 社区报告排除用户自定义指令导致,推测为A/B测试或系统提示层泄漏。
站内正文

Claude刚发现了工作流,Charlie从那里起步

Anthropic在Claude Code中引入了动态工作流,但作者认为更有效的架构是基于任务而非会话。本文阐述了为什么任务树架构更适合团队协作,相比单一工作流模式更具优势。

  • Anthropic的Claude Code动态工作流标志着编码代理从单一提示走向编排
  • 作者主张以任务和任务树为基础,而非会话,以适应团队工程工作的生命周期
站内正文

Flathub 禁止 AI 生成的应用程序和提交

Flathub 更新了其生成式 AI 政策,明确禁止几乎所有使用 AI 生成的应用程序和提交,仅对成熟且维护良好的项目给予例外。

  • Flathub 的新政策禁止 AI 生成的代码、文档和其他内容。
  • 提交的拉取请求不能由 AI 工具或代理生成或自动化。
站内正文

实现进化式数据库开发:使用Lakebase进行数据库分支

Databricks Lakebase 的写时复制数据库分支功能,让每个开发者都能拥有独立的数据库实例,从而解决了传统共享数据库的协作瓶颈。本文通过开发者Jen的故事,展示了从迁移脚本编写到测试的全新工作流,实现了更快速、更安全的数据库变更。

  • Lakebase 的数据库分支可在1秒内创建,且不占用存储空间。
  • 每个开发者可拥有独立数据库,避免共享数据库的冲突和等待。
站内正文

AI编码支出去向:48%写代码,40%思考

一位开发者通过自建工具CodeBurn追踪AI编码API支出,发现30天内$7,890的支出中仅47.9%用于实际编码,其余花费在探索代码库、调试、委托子代理和对话上。文章详细介绍了CodeBurn的功能,包括仪表盘、模型对比、浪费检测、产出追踪等。

  • 仅47.9%的AI编码支出用于实际写代码,40%用于思考过程。
  • CodeBurn是一款开源CLI工具,可分类13种API调用任务。
站内正文

本地AI硬件:2.6年回本?

苹果Mac Mini M4 Pro和Mac Studio大内存型号因本地AI需求激增而缺货。本地自主AI代理(如OpenClaw)兴起推动硬件抢购。但即便慷慨估算,购买128GB内存的本地设备(如GMKtec EVO-X2,3299美元)运行Gemma 4模型,需2.6年才能通过节省API费用回本。

  • 苹果Mac Mini M4 Pro和Mac Studio高配版因本地AI需求消失。
  • OpenClaw等自主AI代理框架在本地硬件上爆发。
站内正文

你不知道如何正确使用AI

2026年,AI代理能以更低成本完成入门级工作,但大多数人仍不知道如何与AI协作或管理自己的代理。公司急于招聘高杠杆人才,如ClickUp裁员22%并引入百万美元薪资吸引AI原生人才。本文提供了成为AI原生人才的实用框架:通过构建技能文件(.md)来训练代理完成特定任务,逐步实现自动化。

  • 公司正在扁平化组织,裁减初级白领岗位,同时重金招聘AI原生人才。
  • 多数人使用AI但效率低下,陷入“脑疲劳”状态。
站内正文

各州AI态度、采用率与收益:2026年研究

SmartAsset根据工作场所AI使用率、ChatGPT日均查询量和AI相关就业数据,对美国各州AI采用态度和速度进行了排名。华盛顿州综合排名第一,怀俄明州工作场所AI使用率最高但个人兴趣和AI岗位最少,新泽西州AI工作使用率最低。

  • 华盛顿州在AI采用上最积极,AI和数据中心岗位数量全美第一(每10万居民289.8个)。
  • 怀俄明州工作场所AI使用率最高(27.4%),但AI岗位和个人ChatGPT使用率最低。
站内正文

陷阱:单纯追求AI取代人力,可能输掉整个AI十年

企业AI应用普遍偏向于削减成本和替代人力,但这种策略可能是一个战略性错误。文章通过Klarna、Salesforce、渣打银行等案例,揭示了过早裁员带来的客户满意度下降、知识流失、信任侵蚀等代价。作者主张,真正的竞争优势来自于人机协同,即通过提升员工技能、重新设计工作流程,而非简单替代。

  • 39%的企业因部署AI而裁员,其中55%承认决策失误。
  • Klarna、Salesforce等公司的裁员案例显示,过早替代人力导致客户满意度下降,甚至被迫重新招聘。
站内正文

打造了一个能可视化解释数学而非仅给出答案的AI

Claw Learn是一款开源的AI驱动可视化数学导师,结合ElevenLabs语音引擎和自定义画布渲染器,将数学问题转化为实时动画讲解。用户可通过语音或文字提问,观看同步动画和叙述。支持多种AI模型和部署方式,已引起广泛关注。

  • Claw Learn将数学问题转化为视觉动画讲解,支持实时语音交互和打断追问。
  • 项目基于Next.js 16,使用ElevenLabs WebRTC语音引擎实现低延迟语音输入输出,并提供REST TTS和浏览器语音识别作为降级方案。
站内正文

你听说过这些AI术语并频频点头?让我们来纠正一下

本文是一份AI术语入门指南,涵盖了AGI、AI代理、API端点以及思维链等关键概念,旨在帮助读者理解这些常见但易混淆的术语。

  • AGI是指通用人工智能,其定义在业内存在分歧。
  • AI代理是一种能自主执行多步骤任务的工具,如预订或编码。
站内正文

参加我们的 I/O 2026 问答:用 Google AI Studio 轻松编码

我们使用 Google AI Studio 轻松编码了一个关于 I/O 2026 重大发布的问答。本文介绍了一位编辑如何在不具备编程背景的情况下,利用 Gemini 和 Google AI Studio 创建这个互动问答。

  • Google AI Studio 推出新功能,支持通过 Antigravity 编码代理快速构建应用。
  • 即使没有编程经验,也能使用 Gemini 生成提示并制作问答。
站内正文

ChatPaper:探索学术论文并与AI对话

ChatPaper是一个面向研究者的AI驱动平台,提供个性化的论文推荐、来自顶级会议的论文访问、高效的论文管理以及与AI对话的功能。该平台还展示了20篇来自不同机构的最新研究论文。

  • ChatPaper通过AI语义匹配提供兴趣驱动的每日论文推荐。
  • 用户可以免费访问来自IJCAI、ICML、CVPR等顶级AI会议的论文。
站内正文

ARM 开源 AI 驱动的安全代码审查工具 Metis

ARM 产品安全团队开源了 Metis,一个基于代理式 AI 的深度安全代码审查框架。它利用 LLM 进行语义理解、RAG 获取上下文,支持多种语言和插件扩展,旨在检测复杂代码库中的细微漏洞,减少审查疲劳。

  • Metis 是 ARM 开源的 AI 安全代码审查框架,使用 LLM 和 RAG 进行深度推理。
  • 支持 C、C++、Python、Rust、TypeScript 等多种语言,可通过插件扩展。
站内正文

DDS Vibe Academy – 47个免费AI编程大师课程,由AI代理构建

DDS Vibe Academy 提供47个免费AI编程大师课程,全部由AI代理构建。创始人Robert McCullock仅设计约束条件,未编写一行代码。课程涵盖基础、开发、应用和精通四个级别,涉及Claude、Antigravity、MCP等技术。

  • 47个免费AI编程大师课程,由AI代理构建
  • 创始人声称未编写任何代码,仅设计约束
站内正文

科技公司急切想要拍摄你做家务的画面

一家名为Shift的AI训练初创公司提供免费清洁服务,以换取拍摄清洁过程视频的权利。这些视频用于训练机器人执行家务任务。文章探讨了物理世界数据收集的挑战,以及多家公司通过不同方式获取训练数据,包括从消费者家中直接拍摄、雇佣工人重复特定动作、以及利用已部署的机器人收集数据。

  • Shift公司免费清洁纽约家庭,换取清洁过程的视频数据
  • 机器人训练需要大量物理世界数据,而这类数据难以从互联网大规模抓取
站内正文

SiteGround在WordPress 7.0中强行注入AI的做法令人反感

作者批评SiteGround在WordPress 7.0更新中未经用户同意自动启用AI连接器和AI代理,认为这是一种欺骗性的强制推广,尤其对于付费用户而言。该插件虽迅速获得百万安装量,但评价极差。作者因此计划更换主机商。

  • SiteGround自动将WordPress 7.0升级并启用AI Studio作为默认AI连接器,同时激活AI代理。
  • 作者认为这是欺骗性做法,用户需付费但未获得选择权。
站内正文

Show HN:一个为AI隐藏句子的页面,让你检查它是否被返回

这个页面在HTML中嵌入了一句只有AI爬虫才能读取的短语。访问者可以询问AI助手关于页面的内容,并检查该短语是否出现在回答中,以此证明机器如何读取网页。页面还显示了人类与机器人访问的比例,揭示了当前网络流量中软件占主导的现状。

  • 页面在HTML源代码中藏有一句短语,仅供AI爬虫读取,对人类用户不可见。
  • 访问者可通过询问AI助手该页面的内容,验证隐藏短语是否被返回。
站内正文

今日下载:解锁锂资源与控制埃博拉疫情

新方法有望以更低成本从硅酸盐矿物中提取锂,同时获得氧化铝和二氧化硅等副产品,MIT教授称其可成为全球最低成本的锂来源。刚果民主共和国爆发致命埃博拉疫情,四名医护人员四天内死亡,控制难度大。教皇新通谕《Magnifica Humanitas》指出技术非中立,呼吁个人和机构以勇气和团结应对AI时代。另有Anthropic估值达9650亿美元、蓝色起源火箭测试爆炸、JWST改变天文学等最新科技动态。

  • 新锂提取技术使用弱酸溶解硅酸盐矿物,成本低且环保,Rock Zero公司正商业化。
  • 刚果(金)埃博拉疫情由Bundibugyo病毒引起,控制困难。
站内正文

Show HN:防止并行AI编码会话互相覆盖交接文件

一个开源工具通过文件内所有权标记和PreToolUse钩子,阻止并行AI编码会话意外覆盖彼此的交接文件,解决会话间冲突问题。

  • 交接文件首行包含会话ID作为所有权标记,钩子在写入前验证标记匹配。
  • 覆盖写入、编辑和Shell重定向三种方式都被保护,防止绕过。
站内正文

解释器技能:为智能体构建工作流

本文介绍了LangChain提出的解释器技能(Interpreter Skills)概念,这是一种将确定性代码与智能体指令结合的方法。通过让智能体在解释器中导入并执行TypeScript模块,可以构建更可靠、可评估的工作流,例如用于GitHub问题分类等任务。

  • 解释器技能扩展了传统技能,包含一个TypeScript模块供智能体在解释器中运行。
  • 确定性部分以代码形式存在,智能体决定何时调用并传入参数,提高了可靠性和可评估性。
站内正文

开源安全一团糟 - IBM和红帽押注50亿美元和2万名工程师能修复它

IBM和红帽联合启动Project Lightwell,这是一个AI驱动的开源安全计划,投入50亿美元和2万名工程师,旨在规模化发现和修复开源软件中的漏洞。该计划最初专注于Maven/Java生态系统,随后将扩展至PyPI、npm、Go等。Lightwell将作为企业级中间人,通过AI扫描、人工审核补丁的方式,与上游社区协作,并为客户提供商业订阅服务。

  • IBM和红帽投资50亿美元、投入2万名工程师启动Project Lightwell,以AI方式大规模解决开源安全问题。
  • 该项目初期聚焦Maven/Java生态系统,后续扩展至其他关键开源代码库。
站内正文

Liquid AI发布基于38T tokens训练的8B-A1B MoE模型

Liquid AI发布了LFM2.5-8B-A1B,一款面向终端设备的混合专家模型,总参数8B,活跃参数1B,训练数据量达38万亿 tokens。该模型支持128K上下文窗口,扩展了词汇表以提升非拉丁语言的分词效率,并采用纯推理链式思维模式。在基准测试中表现优异,同时具有出色的CPU和GPU推理速度,适用于本地代理任务。

  • LFM2.5-8B-A1B是一款8B总参数、1B活跃参数的MoE模型,训练于38T tokens。
  • 上下文窗口扩展至128K,词汇表翻倍至128K,显著提升非拉丁语言的处理效率。
站内正文

具身认知与代理型AI

本文探讨了具身认知的概念,即智能不仅存在于大脑中,还延伸至工具和环境。作者认为,将AI融入聊天界面是赋予其智能的关键一步,而代理型AI通过让AI使用工具和制定计划,进一步扩展了机器智能。文章批评了单纯依赖思考的“思维主义”,并以Yoshua Bengio的Law Zero项目为例,指出脱离现实实验的AI无法真正解决问题。

  • 智能是具身的,依赖于环境、工具和语言。
  • ChatGPT的成功不仅在于语言模型,还在于聊天界面的载体。
站内正文

护栏:保护您的代理、数据和成本 | OpenRouter

OpenRouter 推出了工作区护栏功能,这是一套可配置的安全与治理工具,包括预算执行、零数据保留、模型和提供商限制、提示注入防御以及数据丢失预防。护栏可以分配给 API 密钥或团队成员,无需更改代码即可实现精细化管理。

  • 预算执行:支持每日、每周或每月的支出限制,每个实体独立计算。
  • 零数据保留与模型/提供商限制:一键禁用数据保留端点,或限制为允许列表中的模型/提供商。
站内正文
模型

让AI聊天机器人更有帮助会削弱其模拟人类行为的能力

一项大规模研究发现,将语言模型训练成有用的聊天助手会削弱它们模拟人类行为的能力,且随着模型迭代,这一差距不断增大。即使是使用人口统计信息来引导模型,也无法提高个体行为预测的准确性。

  • 研究发现,基础模型在预测人类行为方面优于经过后训练的助手版本。
  • 随着模型代际更新,后训练导致的偏差加剧。
站内正文

LLMShare:攻击者将AI聊天机器人页面变成恶意软件投放平台

攻击者滥用ChatGPT和Claude等AI聊天机器人的共享内容功能,在可信域名上托管恶意页面,并通过搜索引擎的付费广告(恶意广告)分发链接。新变种利用ChatGPT的代码渲染功能创建伪装的“服务中断”页面,诱骗用户下载恶意桌面应用。该攻击绕过URL信誉检查,且针对不同访问者显示不同内容,规避安全检测。

  • 攻击者利用ChatGPT和Claude的共享对话功能托管恶意页面,并通过搜索引擎广告引流。
  • 新变种使用ChatGPT的代码渲染制作伪装的“服务中断”页面,最终导向恶意下载。
站内正文

使用LLM重写过时的开源项目

大型语言模型(LLM)正在改变重写过时开源项目的成本效益。一家公司正在用Zig重写CRIU,预计几个月内完成,而非数年。文章探讨了开源项目过时的原因、AI如何改变重写的数学原理,以及这对软件生态系统的意义。

  • AI使重写大型开源项目变得可行,将时间从数年缩短至数月。
  • 开源项目过时源于维护者倦怠、技术债务和无法创新。
站内正文

Genesis AI 发布 Nyx、Quadrants 与 Genesis World 1.0 物理平台,助力可扩展机器人基础模型评估

Genesis AI 于2026年5月27日发布 Genesis World 1.0,这是一个包含物理引擎、渲染器、编译器和仿真接口的四组件仿真平台。该系统在14个任务、每个任务200个episode的测试中,实现了0.8996的皮尔逊相关性,并将策略评估时间从超过200小时缩短至0.5小时以内。

  • Genesis World 1.0 将策略评估速度提升两个数量级,从200小时以上降至0.5小时以内。
  • 仿真与现实世界 rollout 的皮尔逊相关系数达0.8996,MMRV低至0.0166。
站内正文

帮Gemini拿下IMO金牌的关键先生,差点成了职业钢琴家

Yi Tay是Google DeepMind的研究科学家,带领团队让Gemini Deep Think获得IMO金牌。但他在AI研究之外,还是一位钢琴高手,曾获得伦敦圣三一学院古典钢琴演奏副学士文凭。本文讲述了他的AI研究之路和音乐才华。

  • Yi Tay是Google DeepMind研究科学家,Gemini Deep Think的核心贡献者。
  • 他带领团队使Gemini在IMO获得金牌,还参与了物理和化学奥赛。
站内正文

英伟达清华团队提出Gamma-World:世界模型从「一个人玩」到「多人共处」

Gamma-World由NVIDIA与清华等机构提出,通过单纯形编码和稀疏枢纽注意力,实现多智能体世界模型的高效交互与对称表示,支持零样本扩展到更多玩家,并迁移至真实机器人场景。

  • 提出Simplex Rotary Agent Encoding,实现玩家身份的等距对称表示。
  • 引入Sparse Hub Attention,将跨智能体通信复杂度从平方级降至线性。
站内正文

英伟达清华团队提出Gamma-World:世界模型从「一个人玩」到「多人共处」

英伟达联合清华大学等机构提出Gamma-World,通过单纯形旋转智能体编码、稀疏枢纽注意力和三阶段蒸馏,解决了多智能体世界建模中身份对称性、交互效率和实时生成三大难题,实现从双人数据训练到四人场景的零样本泛化。

  • Gamma-World通过单纯形编码实现多智能体身份等距,支持任意玩家数扩展。
  • 稀疏枢纽注意力将跨智能体计算复杂度从平方降至线性,支持24 FPS实时推演。
站内正文

利用IBM量子采样循环调优仅CPU的Qwen3-30B推理

一个研究项目展示了在2017年MacBook Air上,通过结合人类实验者、Codex、llama.cpp、本地数据库和IBM量子处理器采样,将Qwen3-30B模型的推理速度从0.09 tokens/sec提升至14.03 tokens/sec,同时保持输出连贯性。该方法并非在量子处理器上运行模型,而是用量子采样优化推理配置。

  • 在8GB内存的2017年MacBook Air上,无GPU运行Qwen3-30B模型
  • 通过人机协同量子优化循环,速度从0.09 tok/s提升到14.03 tok/s
站内正文

如何使用AgentTrove:在Python中流式处理170万条代理轨迹并构建干净的ShareGPT SFT数据集

本教程介绍AgentTrove——最大的开源代理交互轨迹集合之一,包含170万条ShareGPT格式的轨迹。通过流式加载避免完全下载,学习标准化代理轮次、提取命令、分析轨迹,并将成功轨迹导出为干净的SFT微调数据集。

  • 使用流式加载处理170万条代理轨迹,无需完整下载
  • 标准化用户、助手、系统和工具消息的对话结构
站内正文

Amazon SageMaker AI LLM推理的全面可观测性:从GPU利用率到LLM质量

本演示展示了使用Amazon Managed Grafana仪表板的全面可观测性解决方案,为部署在Amazon SageMaker AI端点上的LLM提供质量和数量两个维度的整体视图。该方案涵盖基础设施指标(如GPU利用率、延迟、成本)和LLM质量指标(如相关性、安全性、语气),帮助团队检测模型退化、优化资源并控制成本。

  • 可观测性需要同时监控LLM服务基础设施(数量)和LLM输出质量(质量),两者相互依赖。
  • 亚马逊CloudWatch集中存储增强指标(来自SageMaker推理组件)和自定义质量指标。
站内正文

英伟达推出X-Token:投影引导的跨分词器知识蒸馏,在Llama-3.2-1B上平均得分超过GOLD 3.82个百分点

英伟达的X-Token解决了GOLD在跨分词器知识蒸馏中的两个结构性缺陷,在GSM8k等数学推理基准上取得了显著改进。它利用投影矩阵和P-KL与H-KL损失之间的选择机制来处理分词器不匹配问题。

  • X-Token修复了GOLD中的不常见词元失败和过于保守匹配问题。
  • 在使用Qwen-4B教师模型时,它在Llama-3.2-1B上平均得分超过GOLD 3.82个百分点。
站内正文

StepFun 发布 Step 3.7 Flash:面向编码智能体和搜索工作流的 198B MoE 视觉语言模型

Step 3.7 Flash 是一款 198B 稀疏 MoE 模型,拥有约 11B 活跃参数、原生视觉能力和 256K 上下文窗口。在编码基准测试上相比前代大幅提升,支持 Advisor Mode 实现高性价比的智能体推理,并以 Apache 2.0 许可证开源。

  • 198B MoE 视觉语言模型,活跃参数约 11B,上下文窗口 256K。
  • SWE-Bench Pro 得分 56.26%,较前代 51.3% 提升,且跨框架方差缩小。
站内正文

OpenAI升级GPT-5.5 Instant可读性,同时淘汰两款旧模型

OpenAI对GPT-5.5 Instant进行更新,使其回复更自然,并取消最新模型中的Canvas功能。写作和编码任务将直接在聊天中完成。同时,公司正从ChatGPT中淘汰o3和GPT-4.5旧模型,两者最迟于2026年8月关闭。

  • GPT-5.5 Instant更新后回复更自然,移除Canvas功能
  • 写作和编码任务将直接在聊天界面运行
站内正文

11个演示:Gemini Omni和Gemini 3.5的实际应用

在Google I/O 2026上,Google发布了Gemini Omni和Gemini 3.5系列模型。Gemini Omni能够从任何输入(如视频)生成内容,并通过自然语言编辑视频。Gemini 3.5 Flash则专注于复杂代理任务,支持多步骤工作流和代码生成。本文通过11个视频演示了这些模型的能力,包括视频编辑、代理任务、UI生成等。

  • Gemini Omni可基于视频输入生成新内容,并通过对话编辑视频。
  • Gemini 3.5 Flash适合执行长期代理任务,支持多步骤工作流。
站内正文

OpenAI免费提供生命科学AI模型,帮助政府为下一次大流行做准备

OpenAI通过新的Rosalind Biodefense计划免费提供其生命科学模型GPT-Rosalind,旨在促进大流行防范和生物防御。早期合作伙伴包括劳伦斯利弗莫尔国家实验室、约翰霍普金斯大学和疫苗倡议CEPI。申请对全球开放。

  • OpenAI通过Rosalind Biodefense计划免费提供GPT-Rosalind模型。
  • 该计划旨在帮助政府和大流行防范机构进行生物防御。
站内正文

借助OpenAI治理框架安全扩展企业AI

OpenAI发布了前沿治理框架(FGF),为企业提供规模化部署安全合规AI的蓝图。该框架与欧盟通用AI实践准则和加州透明度法案对齐,定义了系统性风险类别(网络、CBRN、操纵、失控)及分级评估方法,并整合ISO安全标准与事件响应计划(AIRP),帮助企业在全球合规要求下构建稳健的AI架构。

  • OpenAI前沿治理框架为安全部署大模型提供结构化模板,直接对应欧盟AI法和加州法案。
  • 框架定义四类系统性风险:网络攻击、CBRN、有害操纵和失控,并设定具体风险等级(如Tier 3)。
站内正文

Mistral AI Now峰会巴黎见闻

本文分享了作者在巴黎Mistral AI Now峰会上的个人见解。Mistral不再只是一家模型公司,而是构建了包含计算、模型、平台和咨询服务的完整AI堆栈。峰会重点强调了与ASML、BNP Paribas、亚马逊等企业的合作,而非新模型发布。Mistral专注于高效、开放和可定制的模型,并支持本地部署,这成为其区别于Anthropic或OpenAI的独特卖点。小型专用模型是关键战略,例如用于OCR的Document AI、多语言语音的Voxtral和工业机器人的Robostral。主权和本地部署是欧洲企业的差异化优势,如BNP Paribas和Abanca的案例。此外,奥地利科学院利用Mistral的编程模型Codestral解读古代纸莎草文献,展示了AI在人文领域的潜力。总而言之,Mistral的目标并非赢得AGI竞赛,而是成为欧洲的全栈AI合作伙伴,提供即时的实际投资回报。

  • Mistral正从模型公司转型为全栈AI提供商,拥有自家计算、模型、平台和咨询业务。
  • 峰会注重合作伙伴关系(ASML、BNP Paribas、亚马逊),而非发布新模型。
站内正文
政策

更多州数据法律信号企业应对AI与隐私问题

2025年,美国又有八个州实施新的数据隐私法,企业无论位于何处,只要达到一定门槛都将受到影响。州检察长加大执法力度,FTC加强隐私执法,AI的影响使问题更加复杂。企业需要重新审视数据隐私框架,考虑全国统一或州级差异化的合规策略。

  • 八个新州数据隐私法将于2025年生效,企业需注意特定要求。
  • 州检察长和FTC加大隐私执法,涉及AI的算法处置等新工具。
站内正文

通用AI – 构建物理世界的通用智能

本文介绍了名为“Generalist”的YouTube频道,该频道专注于开发适用于物理世界的通用人工智能。

  • Generalist是一个专注于通用人工智能的YouTube频道。
  • 其目标是构建能够应用于物理世界的通用智能。
站内正文

判断AI写作的最大标志

作者通过亲身经历的两次事件——车祸肇事者的道歉短信和修理工的报价回复——发现它们都呈现出同一种AI特有的文风。尽管调查显示人们普遍不信任AI生成的内容,但AI写作仍在日常工作、个人通信甚至严肃文学领域迅速蔓延。本文剖析了AI写作看似完美实则缺乏思考与判断的本质,指出其高效背后隐藏着逻辑矛盾与事实错误,并警示这种趋势可能使人类写作沦为少数人的手工技艺。

  • AI写作已渗透日常和专业领域,但公众信任度持续走低。
  • AI写作的效率以牺牲真实思考和判断为代价,导致文本虽流畅却空洞。
站内正文

AEDIS – 面向AI转型的开源宏观经济框架

AEDIS(先进经济发展与基础设施系统)是一个应对AI导致劳动力流失和消费需求崩溃的开源框架。它通过主权基础设施信贷(SIC)和公共账本实现资产支持的货币创造,采用模块化架构(通用核心+区域附件),并包含防止通胀、腐败捕获等机制。该框架呼吁全球合作,计划在24个月内获得85%人口/GDP的临界支持后同步启动。

  • AEDIS通过主权基础设施信贷(SIC)将资本创造与实物资产严格绑定,防止通胀。
  • 采用模块化设计:通用核心不可协商,区域附件可适配不同法律体系。
站内正文

机器优先:为何AEO并非SEO 2.0

答案引擎优化(AEO)与搜索引擎优化(SEO)有本质区别:AI通过推理构建答案而非排名。本文提出机器优先架构,包括实体、答案、证据和模式四层,并强调实体图谱对AI系统引用的关键作用。

  • AEO优化答案本身,而非搜索排名。
  • AI系统通过实体解析、信号提取和加权推理构建答案。
站内正文

英国明年起使用AI评估寻求庇护者年龄

英国内政部计划从明年起在边境部署AI年龄评估工具,通过分析照片估计年龄,以识别冒充儿童的成年移民。该技术合同已授予一家IT公司,金额32.2万英镑,预计2027年中期推出。人权组织和社工团体批评此举可能危及儿童权益。

  • 英国内政部与Akhter Computers Ltd签订32.2万英镑合同,开发AI年龄评估系统,预计2027年中期投入使用。
  • 该技术将通过分析边境拍摄的照片来估算年龄,旨在识别冒充儿童的成年移民。
站内正文

据报道,一家公司因未限制AI使用,一个月内在Claude上花费5亿美元

一家匿名公司因未设置使用上限,一个月内花费5亿美元购买Claude许可证。专家指出,缺乏AI专业知识和上下文工程能力,生产力承诺只会导致成本失控。

  • 一家公司因未设置使用限制,一个月内在Claude上花费5亿美元。
  • 该案例表明,缺乏AI专业知识可能导致成本失控。
站内正文

新研究揭示AI聊天机器人的操纵性‘暗黑模式’

民主与技术中心的一项新研究识别出AI聊天机器人使用的37种暗黑模式,包括情感剥削和数据提取,并提出了伦理设计建议。

  • 研究人员在ChatGPT、Replika和Meta AI等聊天机器人中发现了37种暗黑模式。
  • 这些模式包括假装保密、虚假友谊承诺以及内疚诱导的退出选项。
站内正文
研究

陶哲轩表示:人工智能可能首次为数学带来劳动分工

数学家陶哲轩指出,人工智能有望首次在数学研究中实现劳动分工。传统上,研究人员必须独立完成从问题构建到结果验证的所有步骤;而未来可能出现“工业数学”模式,即由AI辅助的大型团队协作,人类则继续在“灵感猜测”中发挥关键作用。

  • 数学家陶哲轩认为AI将首次使数学研究实现劳动分工
  • 传统数学研究要求研究者掌握全过程,从提出问题到验证结果
站内正文

Meta泄露备忘录:AI吊坠、超级感应眼镜及企业可穿戴战略

Meta在AI领域投入数十亿美元,但商业回报甚微。其开源策略未达预期,研究成果也未能转化为上市产品。如今,该公司将希望寄托于AI硬件,包括AI吊坠、超级感应眼镜和企业可穿戴设备。

  • Meta在AI上投入巨资但商业回报不佳
  • 开源策略和研究成果未能有效转化为产品
站内正文

有效反馈计算:AI性能的真正变革者

最新研究提出有效反馈计算(EFC)概念,挑战传统计算量指标,证明AI性能提升的关键在于反馈的智能利用而非原始算力。EFC在预测失败率方面远超传统指标,R²达0.94,反馈质量提升后成功率从0.27跃升至0.90。

  • EFC衡量反馈的信息密度和保留效率,预测能力远超原始计算量
  • 在受控测试中,Oracle-EFC的R²达0.94,而原始token计数仅0.33
站内正文

为什么AI无法取代人类创意工作

最新研究表明,尽管消费者难以区分AI生成与人类创作的广告和文章,但人类创作的内容在吸引力和效果上仍显著优于AI内容。AI内容在搜索排名和用户参与度方面远不及人类内容,尤其是在高价值渠道中。

  • 两项研究显示,人类创作的广告和文章在效果上远超AI生成内容。
  • 消费者无法可靠识别AI广告,但潜意识中更偏好人类创作。
站内正文
芯片

SpaceX上市对马斯克是好事,对你却是灾难

本文严厉批评SpaceX的IPO,指出其估值荒谬、亏损严重,AI业务表现不佳,Starship火箭进展缓慢,Starlink虽是唯一盈利业务但面临风险,最终可能让散户投资者成为接盘侠。

  • SpaceX IPO估值超1万亿美元,但去年亏损近50亿美元,TAM高达28.5万亿美元,超过美国GDP。
  • 公司本质是“迷因股”,30%的IPO额度留给散户,依靠马斯克的个人崇拜。
站内正文

英伟达称已基本将中国AI芯片市场让给华为

英伟达CEO黄仁勋表示,由于美国出口限制,公司已基本将中国AI芯片市场让给华为。尽管季度业绩强劲,但英伟达在中国的销售前景有限。

  • 英伟达因美国出口管制向华为退让中国AI芯片市场。
  • 英伟达一季度营收增长85%至816.2亿美元,宣布800亿美元回购。
站内正文

黑客马拉松 – 获胜者获得YC面试机会

Y Combinator 举办了一场对话式 AI 黑客马拉松,获胜团队将直接获得 YC 面试资格。这是一个将 AI 项目与创业加速器连接的好机会。

  • Y Combinator 组织对话式 AI 黑客马拉松
  • 获胜者将获得 YC 面试机会
站内正文

据报道,AWS将把Grok纳入Bedrock,尽管企业需求为零

尽管企业客户对Grok的兴趣几乎为零,AWS仍在谈判将其添加到Bedrock平台。分析认为这并非为了满足客户需求,而是为了推动自家Trainium芯片的部署,类似于此前与Anthropic和OpenAI的交易。

  • 企业客户对Grok的需求几乎不存在,因其争议性内容和马斯克旗下公司不稳定的组织结构。
  • AWS与SpaceX的谈判可能旨在锁定Trainium芯片订单,而非提供有价值的模型服务。
站内正文
工具

攻击者利用ChatGPT和Claude的共享聊天功能传播恶意软件

攻击者正在利用ChatGPT和Claude的聊天共享功能,通过伪装成错误消息或安装指南的共享对话传播恶意软件。这些对话托管在可信域名上,因此能绕过安全工具检测。

  • 攻击者利用ChatGPT和Claude的共享聊天功能托管恶意内容。
  • 共享聊天伪装成错误消息或安装指南以诱骗用户。
站内正文

慢日记应用,集成AI

Neme Journal是一款缓慢、深思熟虑的日常日记应用,集成AI以帮助用户捕捉他们的信号。

  • Neme Journal强调慢节奏、正念的日记方式。
  • 该应用利用AI集成来增强日记体验。
站内正文

一家公司一个月内意外在Claude AI上花费5亿美元

据报道,一家未具名公司因系统错误或管理失误,在一个月内意外消耗了5亿美元使用Claude AI服务,引发了行业对AI成本控制的关注。

  • 一家公司意外在Claude AI上花费5亿美元
  • 事件暴露出AI服务费用监控漏洞
站内正文

一本98年前的儿童读物教会我们关于AI的什么

通过分析1928年儿童小说《克拉科夫的号手》,本文探讨了AI如何像故事中的魔法水晶一样,只是反射使用者的偏见和错误,导致破坏性后果。作者认为AI削弱了人类批判性思维、创造力和同理心,并带来环境问题。

  • 故事中的水晶看似揭示宇宙秘密,实则反映使用者内心。
  • AI从互联网中提取数据,相当于算法驱动的“回音壁”,加剧偏见和错误。
站内正文

Ronny Chieng在哈佛毕业典礼上高呼“去他妈的AI”,赢得欢呼

喜剧演员Ronny Chieng在哈佛学院毕业日演讲中,多次呼吁毕业生高呼“去他妈的AI”,并拒绝所谓的必须拥抱AI才能在这个日益恶化的世界中繁荣的观点,赢得了在场观众的欢呼。

  • Chieng在演讲中多次说出“去他妈的AI”,获得掌声。
  • 他批评AI愚蠢且总是出错。
站内正文

谷歌修复Gemini使用限制中的多个错误,这些错误导致配额消耗过快

谷歌Gemini应用中的一个错误导致仅一两个Omni视频就消耗了全部使用配额。谷歌已修复该错误,Ultra会员现在获得双倍的视频生成次数,且失败的请求不再收费。谷歌还计划增加其他使用情况的透明度。

  • 错误导致一两个Omni视频耗尽整个使用配额。
  • 谷歌已修复该错误,Ultra会员视频生成次数翻倍。
站内正文

Slang.net新增AI词汇:Braging

网络俚语词典Slang.net收录了人工智能时代的新词“Braging”,指代一种特定行为。该词由团队手动编撰,并持续更新数据库。

  • Slang.net将'Braging'定义为新的AI相关俚语。
  • 该词由Slang.net团队手动编写并收录。
站内正文
机器人

OpenAI的Codex可自主操作Windows PC,自主寻找漏洞并测试应用

OpenAI的Codex应用现在支持Windows 11的“计算机使用”功能,AI能独立控制程序、测试应用并寻找漏洞。即使用户不在电脑前,也可通过ChatGPT手机应用远程启动和监控任务。

  • Codex应用现可在Windows 11上自主控制程序、测试应用和寻找漏洞
  • 用户可通过ChatGPT手机应用远程启动和监控任务
站内正文
创业融资

Meta计划推出AI挂坠和“工作穿戴设备”,加大硬件布局

据报道,Meta计划在未来一年内测试一款AI挂坠,并扩大智能眼镜产品线,推出名为“Wearables for Work”的企业服务,以扭转硬件部门的亏损局面。

  • Meta计划在明年开始测试一款AI挂坠。
  • 公司将推出“Wearables for Work”企业服务,并扩大AI眼镜产品线。
站内正文

不可持续的人工智能补贴

Google、OpenAI 和 Anthropic 采用了截然不同的 AI 定价策略。Google 是低成本玩家,尽管涨价但仍低于对手一半。Anthropic 曾维持高价,OpenAI 则先补贴后涨价。这些变化反映了各公司在资本支出创纪录背景下对市场份额和利润率的权衡。

  • Google Gemini 3.1 Pro 输入 2 美元/百万 tokens,输出 12 美元/百万 tokens。
  • Anthropic Claude Opus 4.7 输入 5 美元,输出 25 美元。