AI News HubLIVE

今日必读

Agent

利用Genie和AI代理革新太阳能与风能维护报告

Plenitude在Databricks Genie上构建了一个基于代理的系统,将太阳能和风能维护的PDF报告转换为统一、可查询的数据模型,支持自然语言查询、跨工厂分析和预测性维护。

  • 系统使用Genie、Unity Catalog语义元数据和AI函数,从PDF中提取结构化数据。
  • 用户可通过自然语言提问,生成可视化结果并导出。
站内正文

亲手体验 Intelligent Terminal:一款AI增强的Windows终端

微软开源了Windows Terminal的一个分支——Intelligent Terminal,它内置AI助手,可在不干扰常规会话的情况下解释错误、编写命令和修复问题。该代理能感知终端动态,并记住当前和过去的会话。

  • 微软推出了开源分支Intelligent Terminal,集成AI助手。
  • AI助手可解释错误、编写命令、修复问题,无需离开终端。
站内正文

使用 NotebookLM 进行最佳研究

谷歌的 AI 研究助手 NotebookLM 获得全面升级,包括更高级的推理能力、新的输出格式(PDF、电子表格等)以及更轻松的研究启动。基于 Gemini 3.5 和 Antigravity,它提供了更高的准确性和分析能力。

  • NotebookLM 现在基于 Gemini 3.5 和 Antigravity 运行,推理能力更强。
  • 新的输出格式包括 PDF 报告、图表、电子表格和幻灯片。
站内正文

小米MiMo与TileRT实现万亿参数模型每秒超1000 token生成,运行于商用GPU

小米MiMo团队联合TileRT推出MiMo-V2.5-Pro-UltraSpeed,在单台8×商用GPU节点上,实现万亿参数模型每秒超1000 token的解码速度。该技术结合FP4量化、DFlash投机解码和TileRT运行时三大创新,无需定制芯片即可达此性能。API试用期为2026年6月9日至23日,定价为标准模型的3倍。

  • 万亿参数MoE模型在商用GPU上达到1000+ token/秒
  • 三大技术:FP4量化、DFlash投机解码、TileRT运行时
站内正文
研究

将300万美元的AI账单降至190万美元

Flowstate是一个智能代理,通过将AI请求路由到最合适的模型,并跟踪每个项目的支出,帮助企业节省高达42%的AI成本。文章揭示了AI账单膨胀的两个主要原因:默认使用昂贵的旗舰模型以及缺乏成本归属。

  • 默认使用昂贵模型导致不必要的成本,Flowstate通过任务路由自动选择合适模型。
  • 缺乏成本归属使得AI支出成为难以管理的单一费用,Flowstate提供项目级追踪。
站内正文
模型

微软研究表明:详细描述比模型规模更重要,Lens以38亿参数高效生成图像

微软研究院推出仅38亿参数的文本到图像模型Lens,利用GPT-4.1生成的8亿条详细描述进行训练,在多个基准测试中媲美数倍于其规模的模型,训练计算量仅为同类模型的五分之一。Lens-Turbo可在不到一秒内生成图像,代码和权重以MIT许可证开源。

  • Lens使用GPT-4.1生成的8亿条详细描述替代模糊的网络替代文本,大幅提升训练效率。
  • 仅38亿参数,Lens在基准测试中匹配或超越数倍于其规模的模型。
站内正文
政策

苹果宣布Siri AI及下一代Apple Intelligence

苹果在WWDC上宣布了新的AI功能以及更智能、更个性化的Siri。此前,苹果因未能实现2024年WWDC承诺的AI功能而面临集体诉讼,最终以2.5亿美元和解。苹果正追赶AI赛道,与谷歌达成协议,由Gemini支持新功能。

  • 苹果在WWDC 2026上发布新一代Siri AI和Apple Intelligence
  • 此前因未兑现AI功能承诺,苹果支付2.5亿美元和解集体诉讼
站内正文
芯片

英特尔获第二春:谷歌与英伟达探索其作为台积电AI芯片替代供应商

谷歌已向英特尔订购超过300万颗AI芯片,计划于2028年交付。英伟达也正在测试英特尔的制造工艺,用于其下一代Feynman架构。此举正值台积电难以满足AI芯片需求之际,英特尔长期挣扎的代工业务迎来罕见转机。

  • 谷歌与英特尔签订超过300万颗AI芯片订单,交付期为2028年。
  • 英伟达测试英特尔制造工艺,用于其Feynman架构芯片。
站内正文
工具

Show HN:Gitdot —— 一款更好的 GitHub。开源、反 AI、用 Rust 编写

Gitdot 是一个开源 GitHub 替代品,使用 Rust 编写,界面受命令行工具启发,支持用户注册、组织创建、仓库管理及从 GitHub 导入仓库(只读镜像或完整迁移)。目前缺少 issues、PR、CI 等功能。设计注重键盘驱动导航,目标实现 100ms 的首屏加载。

  • Gitdot 是用 Rust 编写的开源 GitHub 替代品,界面风格类似 CLI 工具。
  • 当前支持用户注册、组织创建、公有/私有仓库以及从 GitHub 导入仓库。
站内正文
机器人

黑客可能利用Meta的AI聊天机器人劫持超过2万个Instagram账户

Meta确认黑客利用其AI支持聊天机器人的漏洞,在无需双因素认证的情况下劫持了超过2万个Instagram账户,包括前总统奥巴马等知名账户。Meta已修復漏洞并重置密码链接。

  • Meta的AI支持聊天机器人存在漏洞,黑客可通过请求密码重置劫持账户。
  • 约20,225个Instagram账户受影响,包括奥巴马、美国太空军高级军士长等。
站内正文
其余更新(8 条)
模型

解锁欧洲AI灵活性:跨区域推理助力欧盟数据处理与模型访问

AWS通过Amazon Bedrock的跨区域推理(CRIS)功能,帮助客户在欧洲利用多个AWS区域的模型容量,同时满足GDPR等数据保护要求。本文深入介绍了全球推理与欧盟地理推理配置文件,以及如何通过IAM、CloudTrail等工具实现安全、透明和合规的数据处理。

  • 跨区域推理(CRIS)自动将请求路由至预定义地理边界内的AWS区域,提升模型可用性和弹性。
  • 欧盟地理推理配置文件(EU CRIS)确保请求仅在欧盟区域内处理,帮助客户遵守GDPR。
站内正文

NotebookLM升级至Gemini 3.5,新增云计算机和源发现功能

谷歌宣布对NotebookLM进行全面升级,采用Gemini 3.5模型,提升回答准确性和可靠性。用户现在可以通过提问直接启动研究项目,NotebookLM会利用Google搜索查找相关来源。此外,每个笔记本连接到安全的云计算机,支持编写和运行代码,并能输出多种文件格式。该更新面向AI Ultra计划用户和Workspace客户。

  • 采用Gemini 3.5模型,提供更准确可靠的信息
  • 用户可直接提问启动研究,NotebookLM通过Google搜索查找来源
站内正文

为什么将任务委托给LLM会导致文档损坏?

最新研究揭示,将文档编辑等任务委托给大型语言模型(LLM)时,模型可能会在交互过程中默默损坏文档内容。研究构建了DELEGATE-52基准测试,发现即使最先进的模型在20次交互后也会导致25%的内容损坏,原因包括错误累积、弱模型删除与强模型幻觉、上下文过载以及领域熟悉度不足。代理式AI工具对此问题帮助有限。

  • 研究发现,将任务委托给LLM会导致文档内容逐渐退化,顶级模型在20次交互后损坏率达25%,弱模型可达50%。
  • 错误累积、弱模型倾向于删除内容、强模型则幻觉式地篡改信息,且上下文过载加剧问题。
站内正文
Agent

现在可以安心合上笔记本电脑了:在Amazon Bedrock AgentCore上托管编码智能体

Amazon Bedrock AgentCore Runtime为每个智能体会话提供独立的微VM,包含持久化工作区、通过Gateway的安全工具访问以及内置的可观测性,使得Claude Code、Codex、Kiro、Cursor等可以并行运行而不会共享密钥、端口或文件系统。合上电脑,去吃晚餐,明天可以继续之前的工作。

  • 笔记本电脑不适合运行编码智能体:存在安全风险、密钥泄露、并行冲突以及合盖即中断的问题。
  • AgentCore提供隔离的微VM、持久化存储、身份层、网关和可观测性,无需担心合盖。
站内正文

大规模做出更好的决策:数学优化如何在直觉失效时发挥作用

本文介绍了数学优化作为AI的一个子领域,如何帮助企业在复杂决策中找到最优解,并通过AWS生成式AI创新中心的实际案例展示了其显著的业务效益。

  • 数学优化是演绎型AI,提供确定性最优决策,区别于机器学习的概率性预测。
  • 创新中心采用发现、建模、求解、架构四步框架解决优化问题。
站内正文

使用LangChain构建紧急求助热线语音代理

了解如何使用LangChain、AssemblyAI和OpenAI构建一个实时AI语音紧急求助热线代理。该代理能够倾听呼叫者的语音求助,实时评估情况,派遣合适的紧急服务,并安抚呼叫者——无需任何打字或菜单操作。文章详细介绍了三阶段流水线(语音转文字、智能体推理、文字转语音)以及关键代码实现。

  • 利用AssemblyAI实现实时语音转文字,支持部分转录和最终转录。
  • 智能体ARIA基于LangChain构建,具备位置查询、紧急派遣、升级至人工和安抚协议等工具。
站内正文
政策

使用Amazon SageMaker AI和全同态加密实现端到端的加密机器学习推理

本文介绍如何利用Amazon SageMaker AI和全同态加密(FHE)技术,在云上执行完全加密的机器学习推理。通过concrete-ml库,您可以训练FHE模型并部署到SageMaker端点,确保查询、响应和中间结果全程加密,即使云服务商也无法读取数据。文中涵盖医疗、能源、通信等敏感数据场景,并提供了详细的实施步骤。

  • 全同态加密(FHE)允许在不解密的情况下处理加密数据,实现隐私保护的ML推理。
  • 使用concrete-ml库(兼容scikit-learn)构建FHE模型,替代低阶SEAL库。