AI News HubLIVE

实时更新

BI接入要点:优化性能与总拥有成本

您的BI仪表盘速度缓慢,调优消耗大量时间和金钱。本文从物理布局到治理语义层,逐步介绍Databricks的BI接入栈,提供改善查询性能和降低总拥有成本的实用指导。

  • 星型模式与托管表构成BI性能的基础。
  • 液簇与预测优化自动进行数据优化。
站内正文

Snowflake承诺向AWS投入60亿美元,深入AI领域

Snowflake与AWS签署五年60亿美元合作协议,使用AWS Graviton和GPU实例进行AI训练和推理,并扩展至10个新区域。此举表明Snowflake在AI时代的雄心,同时通过Cortex AI产品套件推动企业AI应用。

  • Snowflake承诺五年内向AWS投资60亿美元,用于Graviton计算和AI基础设施。
  • 合作涵盖AWS的ARM Graviton处理器和GPU加速EC2实例,用于AI模型训练和推理。
站内正文

使用Amazon Bedrock AgentCore构建企业支持AI代理

AWS生成式AI创新中心与Works Human Intelligence合作,利用Amazon Bedrock AgentCore构建了两个AI代理,分别用于通勤津贴审批和浏览器操作,实现了高达97%的成本降低并提升了运营效率。

  • AI代理自动化HR例行任务,如通勤津贴审批和浏览器操作。
  • 通过迁移至AgentCore和Strand Agents架构,成本降低97%。
站内正文

从数据过载到可操作洞察:Verizon Connect如何将智能代理AI扩展至10万用户

Verizon Connect利用AWS构建智能代理AI解决方案,每天将超过5000万数据点转化为10万用户的可操作洞察。本文详细介绍了其架构决策、实施挑战和可衡量的成果,包括使用无服务器统计模型进行异常检测、采用Strands Agents实现动态推理、以及通过Amazon Nova Lite将输入令牌成本降低70%。

  • Verizon Connect通过智能代理AI处理每日5亿数据点,为10万用户提供洞察。
  • 采用无服务器统计模型进行异常检测,避免LLM处理原始表格数据的局限性。
站内正文

AWS SMGS如何利用基于Amazon Bedrock AgentCore的AI对话助手转变业务管理

AWS SMGS使用NarrateAI(基于Amazon Bedrock AgentCore构建的智能对话解决方案)实现大规模商业智能。该方案采用双层架构:批量叙事生成和实时交互,通过专用AI代理进行路由和验证,支持自然语言查询、行级安全及个性化角色体验,显著提升决策效率。

  • NarrateAI通过双层架构(批量处理+实时交互)解决传统BI的延迟和数据碎片化问题。
  • 使用Amazon Bedrock AgentCore实现多代理编排,支持自然语言查询和上下文感知响应。
站内正文

微软MAI-Image-2.5在基准测试中与谷歌Nano Banana 2持平

微软的MAI-Image-2.5模型在Arena文本到图像排行榜上位列第三,与谷歌的Nano Banana 2性能相当,但仍落后于OpenAI的Image-2。该模型在图像内文本渲染和商业视觉内容方面有明显改进。

  • MAI-Image-2.5在Arena排行榜上排名第三,与谷歌Nano Banana 2持平
  • 模型在文本渲染和商业视觉内容方面有显著提升
站内正文

AI编程助手Devin开发商Cognition估值九个月内翻倍至260亿美元

Cognition公司为其AI软件开发工具Devin融资超10亿美元,估值达260亿美元,显示了投资者对AI编程工具的热情,尽管其实际价值仍存争议。

  • Cognition融资超10亿美元,估值九个月内翻倍至260亿美元。
  • 投资者对AI编程代理兴趣浓厚。
站内正文

这款无AI的谷歌替代品人气飙升 - 快来亲自体验

DuckDuckGo作为一款无AI的搜索替代品,因谷歌AI概览的兴起而用户激增。本文介绍了如何无AI地使用DuckDuckGo进行私密搜索和浏览。

  • DuckDuckGo在谷歌I/O 2026后安装量激增,iOS应用增幅最高达69.9%。
  • DuckDuckGo提供无AI搜索和AI聊天选项,用户可自由选择。
站内正文

利用 Amazon Bedrock AgentCore 赋能代理型 AI 销售策略

AWS 销售团队使用 Amazon Bedrock AgentCore 构建了 Field Advisor,以编排超过 20 个领域特定代理,减轻销售代表认知负担并提高效率。该解决方案每周为每位代表节省最多 2 小时,并将延迟降低 41%。

  • Field Advisor 通过单一对话界面编排 20 多个专业代理。
  • 人工参与的工作流确保数据准确性和问责制。
站内正文

🔬ESMFold2:蛋白质领域的苦涩教训——Alex Rives,BioHub

Alex Rives 在 BioHub 上发布了 ESMFold2,这是一个基于大规模无监督训练蛋白质语言模型的开源科学引擎,在蛋白质相互作用(尤其是抗体)预测上取得了最先进性能,并发布了68亿蛋白质图谱和11亿预测结构。文章讨论了世界模型在蛋白质生物学中的应用,以及如何通过稀疏自编码器提取语义特征实现可编程生物学。

  • ESMFold2 基于 ESMC 世界模型,在抗体等缺乏多序列比对(MSA)的蛋白质上超越 AlphaFold3。
  • BioHub 发布包含 68 亿蛋白质序列和 11 亿预测结构的开放图谱。
站内正文

Robinhood 允许 AI 代理为客户交易股票和使用信用卡购买

Robinhood 通过 MCP 让客户连接 Anthropic 的 Claude 等 AI 代理,这些代理可以自主交易股票。美国券商监管机构 FINRA 已将其视为新的风险领域,警告不可控的决策。Robinhood 也承认该产品并非适合所有人。

  • Robinhood 推出功能,客户可通过 MCP 连接 AI 代理(如 Claude)进行股票交易和使用信用卡购买。
  • AI 代理可以自主决策,无需客户逐一确认。
站内正文

“Tokenmaxxing 是真实的、昂贵的,而且正在蔓延”:新工具遏制AI预算爆炸

Tokenmaxxing(无节制使用AI token)导致企业预算失控。以Uber为例,其CTO称AI预算已超支。新兴公司Lanai推出Token Tuner工具,通过将token消耗映射到具体工作流程和业务成果,帮助企业优化模型选择、降低浪费,推动从“tokenmaxxing”向“outcomemaxxing”转变。

  • Tokenmaxxing使企业AI预算爆炸,Uber等公司已出现严重超支。
  • Lanai推出Token Tuner,通过追踪token与工作流程、成果的关联,提供效率评分和模型推荐。
站内正文

ITBench-AA:前沿模型在企业IT智能体任务基准测试中得分低于50%——由Artificial Analysis与IBM联合发布

Artificial Analysis与IBM联合推出ITBench-AA,这是首个针对企业IT智能体任务的基准测试,专注于站点可靠性工程(SRE)。前沿模型得分均低于50%,其中Claude Opus 4.7以47%领先。该基准测试评估模型在Kubernetes事件响应中的表现,要求从日志和追踪中诊断故障。

  • Claude Opus 4.7以47%领先,GPT-5.5为46%,Qwen3.7 Max为42%。
  • 所有前沿模型得分低于50%,使ITBench-AA成为饱和度最低的智能体基准之一。
站内正文

NVIDIA发布Polar:用于跨Codex、Claude Code和Qwen Code进行GRPO训练的忠实令牌回滚框架

NVIDIA研究人员推出Polar框架,通过在智能体工具链和推理服务器之间放置模型API代理,实现无需修改智能体工具链即可进行强化学习训练。基于Qwen3.5-4B模型使用GRPO训练,Polar在Codex、Claude Code和Pi工具链上分别将SWE-Bench Verified pass@1提升了22.6、4.8和6.2个百分点。框架以NeMo Gym环境注册,并在ProRL Agent Server仓库开源。

  • Polar通过模型API代理捕获令牌级交互,无需修改现有智能体工具链即可进行RL训练
  • 使用GRPO在Qwen3.5-4B上训练,SWE-Bench Verified最高提升22.6个百分点
站内正文

我找到了一个简单的方法,自动将AI排除在搜索结果之外——几乎在所有浏览器上都有效

厌倦了搜索引擎中的AI结果?本文介绍了一种通过添加自定义搜索引擎来排除AI结果的方法,并详细说明了在Chrome、Firefox、Safari等主流浏览器中的设置步骤。

  • 添加自定义搜索引擎可排除AI搜索结果,避免AI带来的能源消耗和不准确信息。
  • 在Firefox中通过设置搜索快捷方式添加URL https://www.google.com/search?q=%s&udm=14。
站内正文

YouTube将从本月开始尝试自动标记AI视频

YouTube正在加强AI标签规则。从本月起,逼真或经过大量AI修改的内容的标签将显示在更显眼的位置——长视频显示在播放器下方,短视频则作为叠加层显示。从2026年5月开始,即使创作者未披露,自动检测系统也会标记AI生成的内容。推荐和变现不受影响。

  • YouTube收紧AI标签规定,标签位置更加显眼。
  • 2026年5月起自动检测AI生成内容,无需创作者主动披露。
站内正文

让你的AI投资获得良好回报

O'Reilly的Infrastructure & Ops超级流会探讨了AI工作负载的基础设施需求、成本和安全挑战。DORA报告显示,AI使代码交付量提升约10%,但稳定性下降,验证成本增加。专家强调平台工程、治理和认知债务的重要性,建议投资内部平台以保障AI应用的生产就绪。

  • AI工具提高了个人生产力,但团队交付稳定性下降,验证成本(验证税)需要纳入考量。
  • 良好的流程会被AI放大,糟糕的流程同样会被放大,组织应主动改善流程而非仅期待技术提升。
站内正文

我认为Anthropic和OpenAI已找到产品市场契合点

文章指出,Anthropic和OpenAI通过将企业客户转向API定价模式,以及编码代理产品的普及,实现了产品市场契合。这一转折点始于2025年11月模型升级,并在2026年4月因新模型发布和企业定价调整而加速。

  • Anthropic和OpenAI已将其企业计划定价调整为API价格,编码代理(如Claude Code和Codex)成为主要收入来源。
  • 2026年4月,两家公司发布新前沿模型并提高API价格,同时锁定企业客户以新价格签约。
站内正文

AI工厂:智能时代的新基础设施

AI工厂是新型基础设施,实时将电能转化为智能的生成单元——令牌。随着代理型AI的扩展,每瓦性能与每令牌成本成为关键经济指标。本文深入探讨AI工厂的工作原理、架构优化以及NVIDIA的最新硬件如何提升效率。

  • AI工厂将电能转化为令牌,是智能时代的“发电厂”。
  • 代理型AI使推理工作负载更深更复杂,要求实时协调。
站内正文

通过人工智能扩展人类智能

现代AI系统并非复制人类智能,而是扩展人类认知和语言中已有的结构。这一视角有助于理解AI的能力与局限,并重新定义AI安全为系统级挑战,关注工程和治理而非“失控AI”叙事。

  • AI系统通过建模语言中沉淀的人类理解结构来扩展智能,而非复制人类思维。
  • 幻觉和组合性差距源于AI缺乏与世界的有生命接触,无法锚定意义和真理。
站内正文

AI巨头互相攻击,却意外捧红了一位无名议员

OpenAI和Anthropic的争斗意外地让纽约州议员Alex Bores成为AI安全监管的代言人。尽管背后有超级政治行动委员会投入数百万美元攻击他,Bores却因这些攻击而声名鹊起,目前在初选中领先。

  • OpenAI和Anthropic在纽约第12国会选区的初选中花费数百万美元互相攻击,但受益者却是议员Alex Bores。
  • Bores撰写了美国首批AI监管法案之一,因此成为AI公司的攻击目标。
站内正文

AI 是一场军备竞赛,美国需要 90 亿美元的英伟达超级芯片来跟上步伐

美国情报机构秘密申请 90 亿美元采购英伟达 GB10 超级芯片,以帮助 CIA 和 NSA 追赶 Anthropic、OpenAI 等 AI 巨头的步伐。这笔资金尚待国会批准,同时国防预算已调拨 8 亿美元用于云算力。文章详细介绍了芯片规格、成本以及 AI 硬件竞赛的升级趋势。

  • 美国政府秘密申请 90 亿美元为 CIA 和 NSA 购买英伟达 GB10 超级芯片。
  • GB10 芯片功耗仅 140 瓦,却提供 1 petaflop FP4 性能,可微调 700 亿参数模型。
站内正文

Lyft 如何利用 LangGraph 和 LangSmith 构建自助式 AI 代理平台

Lyft 采用 LangGraph 和 LangSmith 构建了一个自助式 AI 代理平台,用于客户支持,将代理开发时间从数月缩短至数周。该平台通过路由多代理架构、LangGraph 的子图功能以及 LangSmith 的追踪与监控工具,赋能非技术领域专家独立开发 AI 代理,并借助 LLM-as-a-Judge 评估系统确保质量。

  • Lyft 通过让运营团队、VoC 负责人和产品经理直接使用提示和配置来定义代理,减少了机器学习工程师的介入。
  • 基于路由器的多代理架构使用 LangGraph 协调专业子代理,实现安全检查和状态管理。
站内正文

教皇错在哪里

教皇利奥十四世的AI通谕《伟大的人性》虽然正确指出了算法偏见、水资源使用和数据主权等问题,但未能正视通用人工智能和灾难性风险,缺乏应对大规模失业的具体方案,被批评为过时且令人失望。

  • 教皇利奥十四世的AI通谕《伟大的人性》被批评为过时,未能解决AI时代的关键问题。
  • 通谕虽提及算法偏见、水资源使用等问题,但缺乏对通用人工智能和灾难性风险的讨论。
站内正文

谷歌登场后,最重要的AI代理功能变得最无聊

谷歌在其I/O大会上推出管理型AI代理运行时,与Anthropic和AWS在六周内几乎同时发布类似产品。这标志着AI代理运行时已成为标配,竞争焦点转向数据位置、成本和可移植性等实际问题。

  • 谷歌、Anthropic和AWS在六周内相继发布了几乎相同形态的管理型AI代理运行时。
  • 代理运行时已成为基础功能,不再具备差异化优势。
站内正文

英伟达暗示将在台湾投入1500亿美元

英伟达CEO黄仁勋在即将在台湾设立总部的发布会上称该国为AI革命的“中心”。

  • 英伟达CEO黄仁勋称台湾为AI革命的中心
  • 英伟达将投资约1500亿美元在台湾建设新总部
站内正文

湖仓架构如何保持对云故障的弹性

随着AI代理工作负载激增,云基础设施面临新的可靠性挑战。Databricks的湖仓架构通过无状态Postgres计算、区域冗余存储、控制平面与数据平面分离、单元化隔离以及混沌测试等措施,实现了高可用性和弹性,确保数据库启动时间等关键操作的高可靠性。

  • 代理工作负载导致数据库创建量激增,每天启动数千万个数据库。
  • 无状态Postgres计算和区域冗余存储实现即时故障切换。
站内正文

AI的未来在本地:来自戴尔科技世界2026的商业建议

随着成本上升、主权需求以及智能体采用,戴尔最新会议聚焦企业如何将AI工作负载过渡到混合基础设施。

  • 戴尔科技世界2026强调企业AI执行,尤其是本地AI能力的构建。
  • 云LLM成本激增,推动企业将AI工作负载转向本地计算。
站内正文

Robinhood将允许AI代理交易股票,大赚(或大亏)一笔

Robinhood宣布开放其交易平台给AI代理,用户可以创建独立账户并为代理分配资金,让其自动买卖股票。该功能旨在自动化投资决策,但Robinhood发出重大风险警告,称AI驱动策略可能表现不佳,用户可能损失全部投资。此外,Robinhood Gold Card用户可连接AI代理进行信用卡购物。该功能通过MCP协议实现,初期支持股票,未来将扩展至期权、加密货币等。

  • Robinhood推出AI代理交易功能,用户可为代理设立独立账户并分配资金。
  • 公司警告代理交易风险极高,可能导致全部投资损失。
站内正文

AI写作丑闻越来越令人困惑

史蒂文·罗森鲍姆的书《真相的未来》中包含虚假引文,他指责AI聊天机器人导致错误。本周涌现多起文学AI丑闻,包括诺贝尔奖得主和英联邦短篇小说奖争议。随着AI工具渗透创作领域,重新界定何为合理使用AI写作的呼声日益高涨。

  • 罗森鲍姆称ChatGPT破坏了其书籍,但承认未核实AI生成的引文。
  • 一周内接连出现诺贝尔奖得主被误解、作家被指控用AI写小说等事件。
站内正文