公司忘记使用限制,一个月内在Claude AI上意外花费5亿美元
某公司因忘记设置API使用限額,在Anthropic的Claude AI服务上一个月内支出了5亿美元。这一事件凸显了企业在采用AI工具时监控和预算控制的重要性。
- 一家公司忘记设定AI服务的使用上限,导致单月账单高达5亿美元。
- 该笔支出用于Anthropic开发的Claude AI模型,发生在2026年5月。
日报
2026-05-30 精选 10 条,按主题聚合。其余新闻折叠归档。
某公司因忘记设置API使用限額,在Anthropic的Claude AI服务上一个月内支出了5亿美元。这一事件凸显了企业在采用AI工具时监控和预算控制的重要性。
在Mistral AI峰会上,CEO Arthur Mensch表示欧洲必须在两年内建立足够的AI基础设施,否则可能沦为美国AI的“附庸国”。峰会吸引了众多欧洲企业和政府代表,强调数据主权和开源模型,但欧洲在投资和规模上仍远落后于美国对手。
研究人员发现,到2026年,开发者对AI编码工具形成了高度依赖。尽管AI加速了编码过程,但代码质量可能下降,未来或引发问题。
Meta正大力拓展在线广告以外的业务,包括AI功能订阅和可能的云服务。但历史显示,Meta在非广告业务上屡屡受挫,如Portal视频设备、Oculus VR、Libra加密货币和Workplace。分析师认为,AI订阅可能成为新的收入来源,但企业云服务挑战巨大。
一项实验给AI代理0美元启动资金、180天时间和完全自主权,利用78种工具(钱包、邮件、SMS等)在真实经济中赚取1万美元。实验采用Hands Body and Feet MCP服务器作为“身体”,Hermes Agent为“大脑”,通过四种策略:测试网空投、微型SaaS、内容联盟和机会主义。收益自动分配:30%税收、50%运营、20%归创建者。所有过程公开可追踪。
Autolang是一种专为AI Agent设计的脚本语言,旨在提供安全、快速且低成本的代码执行环境。它作为编排层,允许AI调用预定义的包装函数,同时通过静态编译和严格的运行时限制防止恶意操作。文章详细介绍了Autolang的设计哲学、性能优化、安全机制以及适用场景。
微软重新设计了Microsoft 365的Copilot应用,宣称加载速度提高两倍以上,复杂提示响应时间改善10%。新的提示行被描述为“任务感知工作区”,可展开以支持更深层次的工作。此外,饱受用户批评的浮动Copilot按钮现在可以移回功能区。微软公布了使用量增长数据,但承认这可能不代表长期趋势。
TikTok上出现大量AI生成的虚假黑人女性形象,伪装成小企业主推销廉价商品。这些视频利用同情心和种族身份诱导用户购买,实际产品来自Shein等平台。专家警告此类骗局日益增多,并涉及数字黑脸行为。
QEMU正在考虑放宽对AI生成贡献的全面禁令,允许在易恢复的领域使用AI辅助,但核心代码仍受限制。
专家表示,AI公司与梵蒂冈的接触有可能产生缺乏批判性审视的‘愉悦’话语。教皇利奥十四世在其首份重要书面训导中对AI提出警告,而Anthropic联合创始人却坐在教皇身边,引发质疑。
前Meta工程师Craig Campbell拒绝了AI投资的浪潮,创办了历史地图叠加网站Past Maps。该网站通过有机搜索增长,月活跃用户超30万,并利用AI工具优化运营。
Replit与Visa合作,将支付基础设施嵌入其软件开发工具中,使开发者能够原生构建支持交易的AI代理。Visa的战略投资和Trusted Agent Protocol为代理提供了加密身份层,同时Replit推出了自助企业访问和解决方案合作伙伴计划。
终极弹性修补器(Ultimate Elastic Patcher)v1.60 是一款事件驱动的系统控制台工具,通过监控剪贴板自动应用代码补丁。它支持多种补丁模式,包括标准化处理、语言语法分析、模糊序列匹配、手风琴拼接等高级功能,并集成 LLM 编写工作区、审计历史、实时差异查看器,以及全面的撤销/重做机制。
Boox Go 10.3 Lumi(第二代)和 ReMarkable Paper Pure 拥有相同尺寸的显示屏,但定位截然不同。前者是一款多功能设备,支持Android生态系统和背光,适合阅读电子书;后者则专注于无干扰工作,启动快速且具备屏幕共享功能。本文详细对比了它们的规格、优缺点及适用场景。
一位系统架构师反思AI编码工具(如Codex和Claude)如何通过提供即时的多巴胺奖励来消除学习过程中的挣扎,但代价是牺牲了开发者的直觉和品味。文章以蝴蝶破茧的比喻说明,过早的帮助会让蝴蝶失去飞翔的力量,同样,跳过困难阶段的编码代理可能让开发者无法建立深层心智模型。
Salesforce表示,其整个开发团队已迁移至Anthropic的Claude Code,无令牌限制,并报告2026年4月的巨大生产力提升:每位开发者的拉取请求增加79%,事故减少5%。这些数字无法独立验证。该案例凸显了编程界对AI代理革命的分歧:是真正的革命还是最大的技术债务积累?
非营利AI研究基金会Aithos开发的LARA工具对主流大语言模型进行欧盟法规合规性测试,结果显示所有模型均不合格,最差模型在93%场景中违法。测试涉及GDPR和EU AI Act下的数据保护、操纵、情感推断等场景。开发者若基于这些模型构建AI代理,需自行承担法律责任。
本文探讨了AI代理在编码中的实际应用,作者分享了三种不同的代理编码方法:1) 启动多个命令行界面,2) 以无头模式运行AI CLI,3) 让一个LLM自行创建和管理子代理。作者倾向于第二种方法,并讨论了代理是否需要、多代理协作的挑战以及未来计划。
AI-org是一个基于AI的Org-Mode任务管理器,支持纯文本、本地优先、Git同步,并强调‘行动胜于完美’的理念。它通过自然语言交互实现任务管理、时间跟踪和每周回顾。
一家匿名企业因未对员工许可证设置使用上限,一个月内在Anthropic的Claude AI平台上烧掉了5亿美元。这一事件揭示了基于令牌的AI定价模式在没有监管时可能造成的财务灾难,以及企业中“令牌最大化”现象的兴起。
本文探讨了AI领域基准测试(Benchmarketing)的现状与问题,借鉴数据库行业40年来的评估经验,建议数据领导者构建自己的评估系统,以真实工作负载而非供应商数据作为采购决策依据。
在Data Engineering Central播客中,Daniel Beach与资深开发者Neil Roberts深入探讨了AI如何改变软件开发的意义,包括前端和用户体验的重要性、代理的实际含义、LLM工作流的成功与失败,以及开发者如何保持竞争力。
Nous Research 的开源 Hermes Agent 新增了 Tool Search 功能,通过 BM25 渐进式模式披露,推迟加载 MCP 工具模式,减少令牌开销并提高模型准确性。Anthropic 评估显示,Claude Opus 4 准确率从49%提升至74%,Opus 4.5 从79.5%提升至88.1%。
mem9的故事始于一次客户请求,从一个快速原型发展成一个完整产品。本文分享了构建智能体内存的关键经验:内存不仅仅是存储问题,而是涉及摄取、排序、评估和产品判断的工程挑战。内存API本身不足以构成产品,用户需要查看、检查、信任和纠正智能体的记忆。此外,评估应成为内存产品的基础设施,以使质量可视化和可调试。最后,智能体内存不应局限于文本,应向多模态发展。
Avai是一个开源的主机遥测工具,结合LLM威胁分类器,通过Docker运行,监控主机上的进程、USB、持久化、文件完整性、浏览器扩展等26个方面,并利用17个威胁情报源和Claude类LLM给出恶意/可疑/未知/良性判定,无需代理、SIEM或云控制平面。
在消化Anthropic重大新闻的间隙,我们重点介绍了AIE的新前向部署工程师计划和创始人计划,以及5月28-29日的AI新闻。主要话题包括:Claude Opus 4.8发布及其基准测试争议、多轮强化学习中的tokenization错误、开源模型与工具链进展、Google和OpenAI的Agent产品扩展,以及值得关注的研究论文。
该项目首次实现了形式化验证的多边形交集算法,利用 Lean 4 证明助手确保无限点集交集等式的正确性。开发过程借助 AI 代理(Claude Opus 4.8)自动完成证明和实现,人类只需审查 87 行规格说明。文章介绍了算法背景、验证挑战以及 AI 代理能力的演进。
本文探讨了AI代币成本与人类劳动力成本之间的权衡,以及这一新现实如何影响企业预算分配。
本文探讨了AI如何大幅降低代码级决策的逆转成本,从而重新定义软件架构的边界。作者认为,许多以往被视为架构的决策(如模块结构、框架选择)已不再是架构问题,而数据架构、服务边界和用户信任等仍然难以更改。AI同时提升了可观测性和业务战略对齐的重要性。
作者亲身尝试Claude Code等AI代理工具后,感到心理上的不适和依赖,如同合成阿片类药物。他反思科技对人类的心理和生理入侵,决定减少对主流科技的依赖,并创办印刷杂志《Gift》以连接志同道合者。文章呼吁警惕AI代理带来的依恋障碍,并提出了逐步回归模拟生活的四个层次。
一位从未写过代码的企业家,在2026年5月的21天里,使用7个AI代理和5000美元的成本,意外构建了高管人才市场Bearhug Network。文章分享了他十年来的18次尝试和最终的突破。
自5月28日起,ChatGPT在部分回应前添加了一条未公开的记忆检查短语,OpenAI未作解释。社区报告确认该行为影响多个账户和新对话,暗示是后端变更而非本地设置。这给企业部署带来风险,因为输出可预测性可能受影响。
Anthropic在Claude Code中引入了动态工作流,但作者认为更有效的架构是基于任务而非会话。本文阐述了为什么任务树架构更适合团队协作,相比单一工作流模式更具优势。
Flathub 更新了其生成式 AI 政策,明确禁止几乎所有使用 AI 生成的应用程序和提交,仅对成熟且维护良好的项目给予例外。
Databricks Lakebase 的写时复制数据库分支功能,让每个开发者都能拥有独立的数据库实例,从而解决了传统共享数据库的协作瓶颈。本文通过开发者Jen的故事,展示了从迁移脚本编写到测试的全新工作流,实现了更快速、更安全的数据库变更。
一位开发者通过自建工具CodeBurn追踪AI编码API支出,发现30天内$7,890的支出中仅47.9%用于实际编码,其余花费在探索代码库、调试、委托子代理和对话上。文章详细介绍了CodeBurn的功能,包括仪表盘、模型对比、浪费检测、产出追踪等。
苹果Mac Mini M4 Pro和Mac Studio大内存型号因本地AI需求激增而缺货。本地自主AI代理(如OpenClaw)兴起推动硬件抢购。但即便慷慨估算,购买128GB内存的本地设备(如GMKtec EVO-X2,3299美元)运行Gemma 4模型,需2.6年才能通过节省API费用回本。
2026年,AI代理能以更低成本完成入门级工作,但大多数人仍不知道如何与AI协作或管理自己的代理。公司急于招聘高杠杆人才,如ClickUp裁员22%并引入百万美元薪资吸引AI原生人才。本文提供了成为AI原生人才的实用框架:通过构建技能文件(.md)来训练代理完成特定任务,逐步实现自动化。
SmartAsset根据工作场所AI使用率、ChatGPT日均查询量和AI相关就业数据,对美国各州AI采用态度和速度进行了排名。华盛顿州综合排名第一,怀俄明州工作场所AI使用率最高但个人兴趣和AI岗位最少,新泽西州AI工作使用率最低。
企业AI应用普遍偏向于削减成本和替代人力,但这种策略可能是一个战略性错误。文章通过Klarna、Salesforce、渣打银行等案例,揭示了过早裁员带来的客户满意度下降、知识流失、信任侵蚀等代价。作者主张,真正的竞争优势来自于人机协同,即通过提升员工技能、重新设计工作流程,而非简单替代。
Claw Learn是一款开源的AI驱动可视化数学导师,结合ElevenLabs语音引擎和自定义画布渲染器,将数学问题转化为实时动画讲解。用户可通过语音或文字提问,观看同步动画和叙述。支持多种AI模型和部署方式,已引起广泛关注。
本文是一份AI术语入门指南,涵盖了AGI、AI代理、API端点以及思维链等关键概念,旨在帮助读者理解这些常见但易混淆的术语。
我们使用 Google AI Studio 轻松编码了一个关于 I/O 2026 重大发布的问答。本文介绍了一位编辑如何在不具备编程背景的情况下,利用 Gemini 和 Google AI Studio 创建这个互动问答。
ChatPaper是一个面向研究者的AI驱动平台,提供个性化的论文推荐、来自顶级会议的论文访问、高效的论文管理以及与AI对话的功能。该平台还展示了20篇来自不同机构的最新研究论文。
ARM 产品安全团队开源了 Metis,一个基于代理式 AI 的深度安全代码审查框架。它利用 LLM 进行语义理解、RAG 获取上下文,支持多种语言和插件扩展,旨在检测复杂代码库中的细微漏洞,减少审查疲劳。
DDS Vibe Academy 提供47个免费AI编程大师课程,全部由AI代理构建。创始人Robert McCullock仅设计约束条件,未编写一行代码。课程涵盖基础、开发、应用和精通四个级别,涉及Claude、Antigravity、MCP等技术。
一家名为Shift的AI训练初创公司提供免费清洁服务,以换取拍摄清洁过程视频的权利。这些视频用于训练机器人执行家务任务。文章探讨了物理世界数据收集的挑战,以及多家公司通过不同方式获取训练数据,包括从消费者家中直接拍摄、雇佣工人重复特定动作、以及利用已部署的机器人收集数据。
作者批评SiteGround在WordPress 7.0更新中未经用户同意自动启用AI连接器和AI代理,认为这是一种欺骗性的强制推广,尤其对于付费用户而言。该插件虽迅速获得百万安装量,但评价极差。作者因此计划更换主机商。
这个页面在HTML中嵌入了一句只有AI爬虫才能读取的短语。访问者可以询问AI助手关于页面的内容,并检查该短语是否出现在回答中,以此证明机器如何读取网页。页面还显示了人类与机器人访问的比例,揭示了当前网络流量中软件占主导的现状。
新方法有望以更低成本从硅酸盐矿物中提取锂,同时获得氧化铝和二氧化硅等副产品,MIT教授称其可成为全球最低成本的锂来源。刚果民主共和国爆发致命埃博拉疫情,四名医护人员四天内死亡,控制难度大。教皇新通谕《Magnifica Humanitas》指出技术非中立,呼吁个人和机构以勇气和团结应对AI时代。另有Anthropic估值达9650亿美元、蓝色起源火箭测试爆炸、JWST改变天文学等最新科技动态。
一个开源工具通过文件内所有权标记和PreToolUse钩子,阻止并行AI编码会话意外覆盖彼此的交接文件,解决会话间冲突问题。
本文介绍了LangChain提出的解释器技能(Interpreter Skills)概念,这是一种将确定性代码与智能体指令结合的方法。通过让智能体在解释器中导入并执行TypeScript模块,可以构建更可靠、可评估的工作流,例如用于GitHub问题分类等任务。
IBM和红帽联合启动Project Lightwell,这是一个AI驱动的开源安全计划,投入50亿美元和2万名工程师,旨在规模化发现和修复开源软件中的漏洞。该计划最初专注于Maven/Java生态系统,随后将扩展至PyPI、npm、Go等。Lightwell将作为企业级中间人,通过AI扫描、人工审核补丁的方式,与上游社区协作,并为客户提供商业订阅服务。
Liquid AI发布了LFM2.5-8B-A1B,一款面向终端设备的混合专家模型,总参数8B,活跃参数1B,训练数据量达38万亿 tokens。该模型支持128K上下文窗口,扩展了词汇表以提升非拉丁语言的分词效率,并采用纯推理链式思维模式。在基准测试中表现优异,同时具有出色的CPU和GPU推理速度,适用于本地代理任务。
本文探讨了具身认知的概念,即智能不仅存在于大脑中,还延伸至工具和环境。作者认为,将AI融入聊天界面是赋予其智能的关键一步,而代理型AI通过让AI使用工具和制定计划,进一步扩展了机器智能。文章批评了单纯依赖思考的“思维主义”,并以Yoshua Bengio的Law Zero项目为例,指出脱离现实实验的AI无法真正解决问题。
OpenRouter 推出了工作区护栏功能,这是一套可配置的安全与治理工具,包括预算执行、零数据保留、模型和提供商限制、提示注入防御以及数据丢失预防。护栏可以分配给 API 密钥或团队成员,无需更改代码即可实现精细化管理。
一项大规模研究发现,将语言模型训练成有用的聊天助手会削弱它们模拟人类行为的能力,且随着模型迭代,这一差距不断增大。即使是使用人口统计信息来引导模型,也无法提高个体行为预测的准确性。
攻击者滥用ChatGPT和Claude等AI聊天机器人的共享内容功能,在可信域名上托管恶意页面,并通过搜索引擎的付费广告(恶意广告)分发链接。新变种利用ChatGPT的代码渲染功能创建伪装的“服务中断”页面,诱骗用户下载恶意桌面应用。该攻击绕过URL信誉检查,且针对不同访问者显示不同内容,规避安全检测。
大型语言模型(LLM)正在改变重写过时开源项目的成本效益。一家公司正在用Zig重写CRIU,预计几个月内完成,而非数年。文章探讨了开源项目过时的原因、AI如何改变重写的数学原理,以及这对软件生态系统的意义。
Genesis AI 于2026年5月27日发布 Genesis World 1.0,这是一个包含物理引擎、渲染器、编译器和仿真接口的四组件仿真平台。该系统在14个任务、每个任务200个episode的测试中,实现了0.8996的皮尔逊相关性,并将策略评估时间从超过200小时缩短至0.5小时以内。
Yi Tay是Google DeepMind的研究科学家,带领团队让Gemini Deep Think获得IMO金牌。但他在AI研究之外,还是一位钢琴高手,曾获得伦敦圣三一学院古典钢琴演奏副学士文凭。本文讲述了他的AI研究之路和音乐才华。
Gamma-World由NVIDIA与清华等机构提出,通过单纯形编码和稀疏枢纽注意力,实现多智能体世界模型的高效交互与对称表示,支持零样本扩展到更多玩家,并迁移至真实机器人场景。
英伟达联合清华大学等机构提出Gamma-World,通过单纯形旋转智能体编码、稀疏枢纽注意力和三阶段蒸馏,解决了多智能体世界建模中身份对称性、交互效率和实时生成三大难题,实现从双人数据训练到四人场景的零样本泛化。
一个研究项目展示了在2017年MacBook Air上,通过结合人类实验者、Codex、llama.cpp、本地数据库和IBM量子处理器采样,将Qwen3-30B模型的推理速度从0.09 tokens/sec提升至14.03 tokens/sec,同时保持输出连贯性。该方法并非在量子处理器上运行模型,而是用量子采样优化推理配置。
本教程介绍AgentTrove——最大的开源代理交互轨迹集合之一,包含170万条ShareGPT格式的轨迹。通过流式加载避免完全下载,学习标准化代理轮次、提取命令、分析轨迹,并将成功轨迹导出为干净的SFT微调数据集。
本演示展示了使用Amazon Managed Grafana仪表板的全面可观测性解决方案,为部署在Amazon SageMaker AI端点上的LLM提供质量和数量两个维度的整体视图。该方案涵盖基础设施指标(如GPU利用率、延迟、成本)和LLM质量指标(如相关性、安全性、语气),帮助团队检测模型退化、优化资源并控制成本。
英伟达的X-Token解决了GOLD在跨分词器知识蒸馏中的两个结构性缺陷,在GSM8k等数学推理基准上取得了显著改进。它利用投影矩阵和P-KL与H-KL损失之间的选择机制来处理分词器不匹配问题。
Step 3.7 Flash 是一款 198B 稀疏 MoE 模型,拥有约 11B 活跃参数、原生视觉能力和 256K 上下文窗口。在编码基准测试上相比前代大幅提升,支持 Advisor Mode 实现高性价比的智能体推理,并以 Apache 2.0 许可证开源。
OpenAI对GPT-5.5 Instant进行更新,使其回复更自然,并取消最新模型中的Canvas功能。写作和编码任务将直接在聊天中完成。同时,公司正从ChatGPT中淘汰o3和GPT-4.5旧模型,两者最迟于2026年8月关闭。
在Google I/O 2026上,Google发布了Gemini Omni和Gemini 3.5系列模型。Gemini Omni能够从任何输入(如视频)生成内容,并通过自然语言编辑视频。Gemini 3.5 Flash则专注于复杂代理任务,支持多步骤工作流和代码生成。本文通过11个视频演示了这些模型的能力,包括视频编辑、代理任务、UI生成等。
OpenAI通过新的Rosalind Biodefense计划免费提供其生命科学模型GPT-Rosalind,旨在促进大流行防范和生物防御。早期合作伙伴包括劳伦斯利弗莫尔国家实验室、约翰霍普金斯大学和疫苗倡议CEPI。申请对全球开放。
OpenAI发布了前沿治理框架(FGF),为企业提供规模化部署安全合规AI的蓝图。该框架与欧盟通用AI实践准则和加州透明度法案对齐,定义了系统性风险类别(网络、CBRN、操纵、失控)及分级评估方法,并整合ISO安全标准与事件响应计划(AIRP),帮助企业在全球合规要求下构建稳健的AI架构。
本文分享了作者在巴黎Mistral AI Now峰会上的个人见解。Mistral不再只是一家模型公司,而是构建了包含计算、模型、平台和咨询服务的完整AI堆栈。峰会重点强调了与ASML、BNP Paribas、亚马逊等企业的合作,而非新模型发布。Mistral专注于高效、开放和可定制的模型,并支持本地部署,这成为其区别于Anthropic或OpenAI的独特卖点。小型专用模型是关键战略,例如用于OCR的Document AI、多语言语音的Voxtral和工业机器人的Robostral。主权和本地部署是欧洲企业的差异化优势,如BNP Paribas和Abanca的案例。此外,奥地利科学院利用Mistral的编程模型Codestral解读古代纸莎草文献,展示了AI在人文领域的潜力。总而言之,Mistral的目标并非赢得AGI竞赛,而是成为欧洲的全栈AI合作伙伴,提供即时的实际投资回报。
2025年,美国又有八个州实施新的数据隐私法,企业无论位于何处,只要达到一定门槛都将受到影响。州检察长加大执法力度,FTC加强隐私执法,AI的影响使问题更加复杂。企业需要重新审视数据隐私框架,考虑全国统一或州级差异化的合规策略。
教皇利奥在首份重要教皇文件中严厉警告人工智能风险,称其受“权力文化”驱动,威胁人类。美国读者表达了对无监管AI的恐惧,认为它可能带来新的奴役形式。
本文介绍了名为“Generalist”的YouTube频道,该频道专注于开发适用于物理世界的通用人工智能。
作者通过亲身经历的两次事件——车祸肇事者的道歉短信和修理工的报价回复——发现它们都呈现出同一种AI特有的文风。尽管调查显示人们普遍不信任AI生成的内容,但AI写作仍在日常工作、个人通信甚至严肃文学领域迅速蔓延。本文剖析了AI写作看似完美实则缺乏思考与判断的本质,指出其高效背后隐藏着逻辑矛盾与事实错误,并警示这种趋势可能使人类写作沦为少数人的手工技艺。
AEDIS(先进经济发展与基础设施系统)是一个应对AI导致劳动力流失和消费需求崩溃的开源框架。它通过主权基础设施信贷(SIC)和公共账本实现资产支持的货币创造,采用模块化架构(通用核心+区域附件),并包含防止通胀、腐败捕获等机制。该框架呼吁全球合作,计划在24个月内获得85%人口/GDP的临界支持后同步启动。
答案引擎优化(AEO)与搜索引擎优化(SEO)有本质区别:AI通过推理构建答案而非排名。本文提出机器优先架构,包括实体、答案、证据和模式四层,并强调实体图谱对AI系统引用的关键作用。
英国内政部计划从明年起在边境部署AI年龄评估工具,通过分析照片估计年龄,以识别冒充儿童的成年移民。该技术合同已授予一家IT公司,金额32.2万英镑,预计2027年中期推出。人权组织和社工团体批评此举可能危及儿童权益。
一家匿名公司因未设置使用上限,一个月内花费5亿美元购买Claude许可证。专家指出,缺乏AI专业知识和上下文工程能力,生产力承诺只会导致成本失控。
民主与技术中心的一项新研究识别出AI聊天机器人使用的37种暗黑模式,包括情感剥削和数据提取,并提出了伦理设计建议。
数学家陶哲轩指出,人工智能有望首次在数学研究中实现劳动分工。传统上,研究人员必须独立完成从问题构建到结果验证的所有步骤;而未来可能出现“工业数学”模式,即由AI辅助的大型团队协作,人类则继续在“灵感猜测”中发挥关键作用。
Meta在AI领域投入数十亿美元,但商业回报甚微。其开源策略未达预期,研究成果也未能转化为上市产品。如今,该公司将希望寄托于AI硬件,包括AI吊坠、超级感应眼镜和企业可穿戴设备。
最新研究提出有效反馈计算(EFC)概念,挑战传统计算量指标,证明AI性能提升的关键在于反馈的智能利用而非原始算力。EFC在预测失败率方面远超传统指标,R²达0.94,反馈质量提升后成功率从0.27跃升至0.90。
最新研究表明,尽管消费者难以区分AI生成与人类创作的广告和文章,但人类创作的内容在吸引力和效果上仍显著优于AI内容。AI内容在搜索排名和用户参与度方面远不及人类内容,尤其是在高价值渠道中。
本文严厉批评SpaceX的IPO,指出其估值荒谬、亏损严重,AI业务表现不佳,Starship火箭进展缓慢,Starlink虽是唯一盈利业务但面临风险,最终可能让散户投资者成为接盘侠。
英伟达CEO黄仁勋表示,由于美国出口限制,公司已基本将中国AI芯片市场让给华为。尽管季度业绩强劲,但英伟达在中国的销售前景有限。
Y Combinator 举办了一场对话式 AI 黑客马拉松,获胜团队将直接获得 YC 面试资格。这是一个将 AI 项目与创业加速器连接的好机会。
尽管企业客户对Grok的兴趣几乎为零,AWS仍在谈判将其添加到Bedrock平台。分析认为这并非为了满足客户需求,而是为了推动自家Trainium芯片的部署,类似于此前与Anthropic和OpenAI的交易。
攻击者正在利用ChatGPT和Claude的聊天共享功能,通过伪装成错误消息或安装指南的共享对话传播恶意软件。这些对话托管在可信域名上,因此能绕过安全工具检测。
Neme Journal是一款缓慢、深思熟虑的日常日记应用,集成AI以帮助用户捕捉他们的信号。
据报道,一家未具名公司因系统错误或管理失误,在一个月内意外消耗了5亿美元使用Claude AI服务,引发了行业对AI成本控制的关注。
通过分析1928年儿童小说《克拉科夫的号手》,本文探讨了AI如何像故事中的魔法水晶一样,只是反射使用者的偏见和错误,导致破坏性后果。作者认为AI削弱了人类批判性思维、创造力和同理心,并带来环境问题。
喜剧演员Ronny Chieng在哈佛学院毕业日演讲中,多次呼吁毕业生高呼“去他妈的AI”,并拒绝所谓的必须拥抱AI才能在这个日益恶化的世界中繁荣的观点,赢得了在场观众的欢呼。
谷歌Gemini应用中的一个错误导致仅一两个Omni视频就消耗了全部使用配额。谷歌已修复该错误,Ultra会员现在获得双倍的视频生成次数,且失败的请求不再收费。谷歌还计划增加其他使用情况的透明度。
网络俚语词典Slang.net收录了人工智能时代的新词“Braging”,指代一种特定行为。该词由团队手动编撰,并持续更新数据库。
OpenAI的Codex应用现在支持Windows 11的“计算机使用”功能,AI能独立控制程序、测试应用并寻找漏洞。即使用户不在电脑前,也可通过ChatGPT手机应用远程启动和监控任务。
这款新的自动驾驶车从概念到实现共耗时四年。
据报道,Meta计划在未来一年内测试一款AI挂坠,并扩大智能眼镜产品线,推出名为“Wearables for Work”的企业服务,以扭转硬件部门的亏损局面。
Google、OpenAI 和 Anthropic 采用了截然不同的 AI 定价策略。Google 是低成本玩家,尽管涨价但仍低于对手一半。Anthropic 曾维持高价,OpenAI 则先补贴后涨价。这些变化反映了各公司在资本支出创纪录背景下对市场份额和利润率的权衡。