AI News HubLIVE

实时更新

Soro:专为塔吉克语打造的轻量级基础模型与聊天机器人

Soro是一系列专为塔吉克语优化的对话大语言模型,基于Gemma 3检查点,通过19亿标记的塔吉克语持续预训练和4万示例的指令微调,显著提升了塔吉克语任务表现,同时保持英语性能。模型支持FP8和INT4量化,适用于边缘部署,已在塔吉克斯坦教育领域试点。

  • Soro基于Gemma 3,使用19亿标记的塔吉克语语料进行持续预训练和4万示例的指令微调。
  • 在塔吉克语基准测试中大幅超越同等规模的Gemma 3基线,保持英语性能。
站内正文

识别和理解文本中的人类价值:一种可定制的基于LLM的架构

本文介绍了一种基于大型语言模型(LLM)的架构,用于检测和量化文本中人类价值的强度。该架构包含三个协调模块,可适应多种价值理论,并在ValueEval数据集上表现出良好的检测性能。

  • 提出了一种模块化的LLM架构,用于从文本中识别人类价值,避免了对特定价值理论或复杂提示工程的依赖。
  • 架构包括三个模块:生成结构化价值规范、标注文本、基于修辞和语义证据分配支持或反对等级。
站内正文

两大支柱:AI后软件工作的概念框架

一篇论文认为,随着生成式AI消除了人类编写正确代码的能力这一约束,软件工作围绕两大支柱重组:混音模式(人类像音响工程师一样连续操作多个判断轴)和元软件(观察、验证、上下文化和治理其他软件的软件)。这两个支柱不可分割,借鉴了从手工艺到统计控制的批量生产的历史转型。

  • 由于生成式AI,代码生产不再是软件组织中的主导问题。
  • 混音模式描述了从业者持续操作多个判断轴的新人类角色。
站内正文

你未来的工作将是让AI保持专注

诺亚·史密斯认为,随着AI能力增强,人类将从技术工作转向确保AI对齐——使AI专注于人类目标。他将其与《上班一条虫》类比,并警告AI生成内容“污泥”正在泛滥。

  • 人类需要维护AI对齐,确保AI不偏离任务。
  • 作者将未来人类角色比作《上班一条虫》中的“朗伯”经理。
站内正文

Safescript – 面向人工智能时代的编程语言

Safescript 是一种为 AI 代理设计的编程语言,通过静态分析在运行前证明所有安全属性,无需沙箱或虚拟机,彻底消除供应链攻击。它编译成有向无环图(DAG),可追踪数据流和宿主机调用,性能开销为零,启动时间为零。

  • Safescript 通过静态分析确保代码安全,无需运行时沙箱。
  • 编译器生成静态 DAG,可追踪所有数据流和宿主机调用。
站内正文

AIPass – 具有身份、记忆和电子邮件的持久化智能体工作空间

AIPass 是一个基于命令行的开源框架,为 AI 智能体提供持久性记忆、身份标识和协作能力。智能体共享文件系统,通过 JSON 文件存储记忆,无需云服务或额外 API 密钥。项目包含 13 个核心智能体,支持多智能体协作、任务调度、质量审计和实时监控。

  • AIPass 是一个 CLI 原生的智能体框架,为 AI 智能体添加持久性记忆、身份和协调能力。
  • 所有智能体共享本地文件系统,使用 JSON 文件存储记忆,无需云端依赖。
站内正文

语言建模具体化了蛋白质生物学的世界模型 [pdf]

本文提出了一种基于语言模型的蛋白质生物学世界模型,展示了如何通过大规模语言建模来理解和预测蛋白质的结构与功能。

  • 语言模型能够捕捉蛋白质序列中的复杂模式
  • 该模型在蛋白质结构预测和功能注释上表现出色
站内正文

伊利诺伊州议员通过了美国最强人工智能安全法案

伊利诺伊州参议院第315号法案(SB 315)要求人工智能实验室聘请独立审计师验证其安全承诺,该法案现已提交州长JB·普利兹克签署。普利兹克表示计划签署,称需要让大型科技公司负责。此举在联邦层面缺乏AI监管的背景下,凸显了州级立法的重要性。

  • SB 315 要求独立审计师核查AI实验室是否遵守自身安全标准。
  • 该法案是美国最严格的AI安全法规,超越了加州和纽约的相关法律。
站内正文

AI作弊 [PDF]

这是一份关于AI作弊的PDF报告,但无法直接解析内容。

  • 无法从PDF中提取文本
  • 报告可能来自METR组织
站内正文

Sakana AI 提出 DiffusionBlocks:一种将残差网络转换为可独立训练去噪模块的块状训练框架

来自Sakana AI和东京大学的研究人员提出了DiffusionBlocks,这是一种块状训练框架,可将Transformer网络划分为独立训练的块,从而将训练内存减少B倍(B为块数),同时在不同架构上保持性能。该方法通过将残差连接解释为扩散模型中的欧拉步骤,利用分数匹配目标实现块级独立训练。

  • DiffusionBlocks通过将网络划分为B个独立训练的块,将训练内存减少B倍,适用于多种架构。
  • 核心创新在于将残差连接视为反向扩散过程的欧拉离散化步骤,从而为每个块提供原则性的局部训练目标。
站内正文

我用这个免费应用深入挖掘Oura Ring数据——发现如下

Simple Wearable Report利用AI从Oura Ring数据中提取更多见解。本文介绍了作者如何使用它,以及它如何与Gemini等AI工具配合提供详细分析。

  • Simple Wearable Report能将Oura数据转化为实验室风格报告,便于医生查看或上传至AI聊天机器人。
  • 与Oura内置AI顾问相比,Gemini等工具提供更具体、量化的数据分析。
站内正文

Robinhood将允许AI代理交易——这可能成为一种趋势

股票交易应用Robinhood在高度监管的行业中率先允许AI代理进行交易,此举可能推动其他金融公司效仿。

  • Robinhood将允许AI代理在其平台上进行交易
  • 此举在高度监管的金融行业中是重大突破
站内正文

授权悖论:谁掌控着你的AI钥匙?[视频]

本文探讨了AI系统中的授权悖论问题,即谁真正拥有对AI系统的控制权。文章以视频形式呈现,讨论了相关的安全和隐私问题。

  • AI系统中的授权问题日益突出
  • 谁拥有AI的'钥匙'是关键
站内正文

苹果在CVPR 2026展示最新研究成果

苹果将在2026年6月3日至7日于丹佛举行的CVPR大会上赞助并展示多项研究,包括视频生成、多模态理解、图像压缩等领域,并在展位进行海报演示。

  • 苹果将在CVPR 2026展示STARFlow-V、AToken、Velox等多项创新研究。
  • 活动包括主题演讲、邀请演讲、海报展示及展位演示。
站内正文

OpenAI的前沿治理框架

探索OpenAI的前沿治理框架,了解我们的人工智能安全、安保和风险实践如何与新兴的欧盟和加利福尼亚法规保持一致。

  • OpenAI发布了前沿治理框架,旨在确保AI安全、安保和风险管理。
  • 该框架与欧盟和加利福尼亚即将出台的法规保持对齐。
站内正文

Show HN: Liiists —— 一款基于Markdown、支持iOS和命令行的列表应用

Liiists 是一款基于Markdown的列表应用,可在终端、iOS设备和AI代理上通过MCP服务器使用,所有操作都基于相同的纯文本.md文件。它提供了命令行工具、原生iOS应用(支持分享扩展和Siri)以及用于AI集成的MCP服务器。无需账户、无锁定,支持iCloud同步或指向任何文件夹(包括Obsidian vault)。

  • 在终端、iOS设备和AI代理上使用相同的Markdown文件
  • 用Go编写的CLI,无依赖
站内正文

SQLite 的 AGENTS.md

SQLite 新增了 AGENTS.md 文件,明确了其对 AI 生成贡献的政策:不接受未经事先同意的拉取请求,不接受代理生成的代码,但欢迎附带可重现测试用例的 bug 报告。由于 AI 生成的 bug 报告泛滥,论坛现已拆分出专门的 bug 论坛。

  • SQLite 添加 AGENTS.md 以定义 AI 贡献政策
  • 拉取请求需要事先同意和法律文件
站内正文

构建无障碍技术的未来:走进 Uvilox AI

Uvilox AI 通过下一代视觉 AI 技术,提供实时手语翻译、紧急响应和无障碍通话,延迟低于 80 毫秒,准确率高达 97.4%,支持 200 多种手语变体,并具备军事级安全保护和 HIPAA/GDPR 合规架构。目前正开放 Beta 测试,早期会员可免费永久使用。

  • 实时手语识别与翻译,延迟低于 80 毫秒,准确率 97.4%。
  • 支持 200 多种 ASL 和 BSL 手语变体,低光照和杂乱背景下稳定工作。
站内正文

NeuralAgent 2.5:个人AI助手,语音控制与并行代理惊艳登场

NeuralAgent 2.5 带来了语音模式、观察学习与并行代理三大功能,让AI助手能听、能看、能同时处理多项任务。用户可通过自然语言指挥它操作整个电脑,无需键盘鼠标。新版还优化了工作流、@提及和记忆系统。

  • NeuralAgent 2.5 新增语音模式,用户说话即可让AI执行操作并语音回复。
  • 观察学习功能允许用户演示一次任务,AI即可保存为工作流自动重复。
站内正文

在生产环境中修复代理故障:Interrupt 2026 回顾 | LangChain 新闻通讯

LangChain 在 Interrupt 2026 大会上发布了 LangSmith Engine 和 Sandboxes 正式版,并推出了 LangChain Labs 以推进代理的持续学习。大会所有演讲现已可按需观看。

  • LangSmith Engine 自动分析生产轨迹、聚类故障并推荐修复方案。
  • LangSmith Sandboxes 正式发布,提供安全的代理代码执行环境。
站内正文

大规模可靠LLM推理

Databricks构建了独特的推理平台,为众多前沿模型提供推理服务,每月处理超过120万亿个令牌。通过引入“模型单元”抽象,实现了成本感知的负载均衡和自动缩放,相比静态配置节省了80%以上的GPU成本。运行时可靠性机制包括黑盒健康检查,可自动检测和恢复静默故障。此外,通过分析多模态瓶颈,吞吐量提升了3倍。

  • Databricks推理平台为多种前沿模型提供服务,每月处理120T令牌。
  • 引入“模型单元”抽象,实现跨工作负载的容量管理和成本感知负载均衡。
站内正文

BI接入要点:优化性能与总拥有成本

您的BI仪表盘速度缓慢,调优消耗大量时间和金钱。本文从物理布局到治理语义层,逐步介绍Databricks的BI接入栈,提供改善查询性能和降低总拥有成本的实用指导。

  • 星型模式与托管表构成BI性能的基础。
  • 液簇与预测优化自动进行数据优化。
站内正文

Snowflake承诺向AWS投入60亿美元,深入AI领域

Snowflake与AWS签署五年60亿美元合作协议,使用AWS Graviton和GPU实例进行AI训练和推理,并扩展至10个新区域。此举表明Snowflake在AI时代的雄心,同时通过Cortex AI产品套件推动企业AI应用。

  • Snowflake承诺五年内向AWS投资60亿美元,用于Graviton计算和AI基础设施。
  • 合作涵盖AWS的ARM Graviton处理器和GPU加速EC2实例,用于AI模型训练和推理。
站内正文

使用Amazon Bedrock AgentCore构建企业支持AI代理

AWS生成式AI创新中心与Works Human Intelligence合作,利用Amazon Bedrock AgentCore构建了两个AI代理,分别用于通勤津贴审批和浏览器操作,实现了高达97%的成本降低并提升了运营效率。

  • AI代理自动化HR例行任务,如通勤津贴审批和浏览器操作。
  • 通过迁移至AgentCore和Strand Agents架构,成本降低97%。
站内正文

从数据过载到可操作洞察:Verizon Connect如何将智能代理AI扩展至10万用户

Verizon Connect利用AWS构建智能代理AI解决方案,每天将超过5000万数据点转化为10万用户的可操作洞察。本文详细介绍了其架构决策、实施挑战和可衡量的成果,包括使用无服务器统计模型进行异常检测、采用Strands Agents实现动态推理、以及通过Amazon Nova Lite将输入令牌成本降低70%。

  • Verizon Connect通过智能代理AI处理每日5亿数据点,为10万用户提供洞察。
  • 采用无服务器统计模型进行异常检测,避免LLM处理原始表格数据的局限性。
站内正文

AWS SMGS如何利用基于Amazon Bedrock AgentCore的AI对话助手转变业务管理

AWS SMGS使用NarrateAI(基于Amazon Bedrock AgentCore构建的智能对话解决方案)实现大规模商业智能。该方案采用双层架构:批量叙事生成和实时交互,通过专用AI代理进行路由和验证,支持自然语言查询、行级安全及个性化角色体验,显著提升决策效率。

  • NarrateAI通过双层架构(批量处理+实时交互)解决传统BI的延迟和数据碎片化问题。
  • 使用Amazon Bedrock AgentCore实现多代理编排,支持自然语言查询和上下文感知响应。
站内正文

微软MAI-Image-2.5在基准测试中与谷歌Nano Banana 2持平

微软的MAI-Image-2.5模型在Arena文本到图像排行榜上位列第三,与谷歌的Nano Banana 2性能相当,但仍落后于OpenAI的Image-2。该模型在图像内文本渲染和商业视觉内容方面有明显改进。

  • MAI-Image-2.5在Arena排行榜上排名第三,与谷歌Nano Banana 2持平
  • 模型在文本渲染和商业视觉内容方面有显著提升
站内正文

AI编程助手Devin开发商Cognition估值九个月内翻倍至260亿美元

Cognition公司为其AI软件开发工具Devin融资超10亿美元,估值达260亿美元,显示了投资者对AI编程工具的热情,尽管其实际价值仍存争议。

  • Cognition融资超10亿美元,估值九个月内翻倍至260亿美元。
  • 投资者对AI编程代理兴趣浓厚。
站内正文

这款无AI的谷歌替代品人气飙升 - 快来亲自体验

DuckDuckGo作为一款无AI的搜索替代品,因谷歌AI概览的兴起而用户激增。本文介绍了如何无AI地使用DuckDuckGo进行私密搜索和浏览。

  • DuckDuckGo在谷歌I/O 2026后安装量激增,iOS应用增幅最高达69.9%。
  • DuckDuckGo提供无AI搜索和AI聊天选项,用户可自由选择。
站内正文

利用 Amazon Bedrock AgentCore 赋能代理型 AI 销售策略

AWS 销售团队使用 Amazon Bedrock AgentCore 构建了 Field Advisor,以编排超过 20 个领域特定代理,减轻销售代表认知负担并提高效率。该解决方案每周为每位代表节省最多 2 小时,并将延迟降低 41%。

  • Field Advisor 通过单一对话界面编排 20 多个专业代理。
  • 人工参与的工作流确保数据准确性和问责制。
站内正文