AI News HubLIVE

今日必读

Agent

Show HN: CommitGate – 自动扫描提交中的漏洞

CommitGate 是一个 AI 驱动的 Git 预提交安全门,在每次 git commit 时自动扫描暂存区差异,阻止包含密钥、令牌或危险代码的提交进入历史记录。它结合 Gitleaks 确定性扫描和 LLM 语义分析,支持 OpenAI、DeepSeek、Groq 等 AI 提供商,并可将审计日志发送到 Splunk。

  • 在每次提交前自动扫描暂存区差异,阻止高风险代码进入仓库。
  • 双引擎扫描:Gitleaks 检测已知密钥模式,AI 评审器捕捉正则表达式遗漏的漏洞。
站内正文

这篇博客是由AI写的吗?

Marc Brooker 明确表示他的博客文章绝非 AI 生成,他坚持亲自执笔,认为让读者阅读 AI 文本会打破社会契约。他广泛使用 LLM 辅助构思、研究、总结、事实核查等,但绝不用于撰写正文。对于代码,他则完全接受 AI 生成。

  • 博客作者 Marc Brooker 声明所有人类可读文本均由自己撰写,不借助 AI。
  • 他认为要求读者阅读 AI 生成的文字违背了社会契约,不尊重读者的时间和精力。
站内正文

Refloow Photo Studio – 一款本地离线、基于设备端AI的照片编辑器

Refloow Photo Studio 是一款免费、开源的跨平台桌面照片编辑应用,所有处理均在本地完成,无需联网、无需注册账号、无广告、无水印。它提供背景移除、裁剪、镜像、亮度/对比度调节、叠加图层等编辑工具,以及超过40种专业滤镜。项目遵循AGPL-3.0许可,并为企业提供商业许可。

  • 完全本地运行,保护隐私,无需账号或订阅
  • 提供背景移除、裁剪、镜像等编辑工具和40多种滤镜
站内正文

Block推出Builderbot:一套新的AI原生工具

Block公司推出Builderbot,这是一套基于Slack的AI代理编排层,能够协调多个AI代理在其整个代码库中工作。它每天执行超过20万次操作,每周合并约1500个拉取请求,占公司所有生产代码变更的15%。Builderbot建立在开源框架goose之上,并促成了与Anthropic在模型上下文协议(MCP)上的合作。

  • Builderbot是Block内部开发的AI原生工具,通过Slack协调多个AI代理,覆盖数百万行代码和数百个服务。
  • 它每天执行20万+操作,每周合并约1500个PR,占生产代码变更的15%。
站内正文

Show HN: Cloak – 让AI智能体使用你的API密钥,但永远看不到它们

Cloak是一个本地加密保管库,允许AI智能体使用API密钥而无需暴露密钥本身。通过代理请求和策略控制,防止密钥泄露,支持macOS和Linux,兼容多种AI客户端。

  • Cloak将API密钥存储在本地加密保管库中,智能体只能使用而无法读取密钥值。
  • 密钥默认被拒绝访问,用户需手动允许特定主机,策略可实时生效。
站内正文

AI让我更勇敢

作者分享AI如何压缩从想法到原型的时间,减少恐惧和不确定性,从而变得更勇敢,能够承担更多挑战性项目。

  • AI将大型项目的完成时间从几周缩短到一夜之间,让实验更快。
  • 快速迭代减少了面对不确定性的不适感。
站内正文
工具

AlgoFly AI

AlgoFly AI 在Product Hunt上发布,作为一站式视觉AI构建与部署平台,提供免费服务。

  • AlgoFly AI 是一个一站式视觉AI平台
  • 帮助企业构建和部署AI解决方案
站内正文
政策

堪萨斯城在公交车上推广面部识别技术引发隐私争议

密苏里州堪萨斯城计划在部分公交车上安装带面部识别功能的摄像头,用于识别被禁乘客或失踪人员。此举被视为美国公共交通系统大规模应用AI监控的试金石,引发安全与隐私的激烈辩论。

  • 堪萨斯城交通局计划在公交车上部署面部识别摄像头,可实时比对黑名单和失踪人员数据库。
  • 密苏里州政府因隐私担忧拒绝资助该项目,但城市仍使用地方和联邦资金推进。
站内正文
其余更新(66 条)
Agent

Show HN: AI视频提示词烹饪书——图像到视频工作流

这是一本面向创作者、营销人员和小型内容团队的实用提示词模式集,专注于图像到视频和文本到视频工作流。包含提示卡格式、产品视频和用户生成内容风格的示例提示、模型对比测试方法、评估计分卡以及常见失败案例与解决方案。

  • 提供系统化的提示词模板,帮助用户生成可用的人工智能视频片段。
  • 强调“保持主体”和“运动描述”两个关键字段。
站内正文

我们该做吗?——AI时代功能膨胀的工程前理智检查

Shall We 是一个开源技能,旨在帮助开发者在 AI 热潮中避免盲目构建功能。它通过一系列问题评估创意,在编码前给出“做/不做/稍后”的结构化裁决。

  • Shall We 是一个基于 Agent Skills 标准的技能,兼容主流 AI 编程工具。
  • 它通过一问一答方式评估创意的商业价值、市场需求、复杂度和风险。
站内正文

我为AI创造了一种极简通用语言

QMP(Queen Magic Prompt)是由Queen Xiya创建的一种极简通用语言,旨在通过动态锚点矩阵消除AI幻觉并自动化多智能体工作流。文章批判了“认知封建主义”,倡导认知觉醒,并提供了开源解析器,但核心架构为闭源。

  • QMP是一种极简通用语言,通过哈希索引和Markdown格栅实现确定性推理,消除概率幻觉。
  • QMP架构包括上下文奇点、多模态编译和对抗性生成等核心向量。
站内正文

序列雷达 #880:上周AI要闻——600亿美元Cursor交易、谷歌人才流失、Midjourney的人体扫描仪

AI市场上一周出现了一系列意想不到的转折:SpaceX以600亿美元收购Cursor,Noam Shazeer和John Jumper分别离开谷歌加入OpenAI和Anthropic,Midjourney推出全身医用扫描仪。

  • 1. SpaceX以600亿美元股票收购Cursor,标志着AI工具已成为与火箭发射能力同等重要的战略基础设施。
  • 2. Noam Shazeer和John Jumper相继离开谷歌,凸显了AI前沿领域激烈的人才争夺战,顶尖研究者成为最稀缺的资源。
站内正文

英伟达采用OpenBao,HashiCorp Vault的开源分支

英伟达已正式采用OpenBao,这是HashiCorp Vault的开源分支,用于Kubernetes中的机密管理。该项目因数字主权关切而获得关注,尤其是在欧盟地区。OpenBao提供开放的治理结构和安全特性,即将发布的版本将增加工作流和AI代理支持。

  • 英伟达使用OpenBao通过Nvidia Cloud Functions向Kubernetes Pod注入机密。
  • OpenBao因数字主权议题而势头渐长,企业兴趣主要来自美国以外。
站内正文

AI的民主化意味着什么?

本文探讨了民主的两种概念:多元民主与同质化民主。作者指出,在AI辩论中,一些以民主之名的主张实际上可能压制不同价值观,具有反民主倾向。AI对多元民主构成真实威胁,但真正的民主协商应包容所有声音,而非排斥异见者。

  • 多元民主尊重不同价值观,而同质化民主试图将多数人的价值观强加于人。
  • AI可能通过权力集中、削弱经济相互依赖等方式威胁民主。
站内正文

形式先于数据:物理AI的真正瓶颈

本文认为,物理AI的发展瓶颈不在于智能本身,而在于缺乏合适的物理形态和感知能力来收集真实世界的数据。特斯拉在自动驾驶上的成功源于汽车本身就是一个适合任务的“身体”,而人形机器人则需要更复杂的触觉和大量任务数据。当前成功的物理AI应用并非人形,而是结合先进视觉的简单机械臂,如农业采摘。

  • 物理AI的瓶颈是形态和数据,而非智能。
  • 特斯拉凭借汽车这一天然适合的形态率先突破自动驾驶。
站内正文

代理系统课程:用AI编程代理学习AI代理

这是一份22章的骨架课程,教授如何设计、构建和运营生产级AI代理系统。课程以骨架形式呈现,强调持久架构模式,而非特定框架。学生可与AI合作,通过实际项目学习,并利用内置技能进行审查。

  • 课程包含22章,涵盖从基础到生产的全方位主题
  • 课程是骨架,学生需要与AI代理合作填充细节
站内正文

通过网络意图层(NILScript)治理AI代理行为

一项新提出的结构框架——网络意图层(NIL),通过确定性提议-批准-提交-回滚生命周期,使AI代理仅能提议操作,而实际执行由后端声明,从而将未授权写操作降至0%,独立于模型。

  • NIL是一种中性线合约,代理只能提议意图,无法直接执行操作。
  • 通过确定性生命周期分离决策与执行,安全边界从O(n)降至O(1)。
站内正文

Agent-trace:一个用于追踪AI生成代码的标准格式

Agent Trace 是一个开放规范,用于在版本控制的代码库中记录AI贡献与人类作者身份,提供供应商中立的格式。该规范支持文件级别和行级别的归因,兼容多种版本控制系统(如Git、Jujutsu、Mercurial),并允许通过元数据字段扩展自定义信息。目前为RFC阶段,版本0.1.0。

  • Agent Trace 是用于记录AI生成代码的开放归因标准,支持行级粒度。
  • 它定义了一个供应商中立的JSON格式,包含版本、时间戳、VCS、工具和文件数组等字段。
站内正文

AgentX - AI智能体评估框架

AgentX 是一款评估AI智能体的工具,能快速定位问题并一键修复。

  • 评估AI智能体
  • 快速定位问题
站内正文

LBE – 面向AI代理的开源执行控制层

LBE是一个开源执行控制层,在AI代理提议与系统实际执行之间设置本地策略门。每个动作——文件写入、shell命令等——在执行前都经过本地验证,无需云服务或守护进程。它已在生产中使用,是Letterblack for After Effects的安全引擎。提供两种集成方式:完整控制器和仅决策包。

  • LBE在本地验证AI代理的每个动作,支持文件写入、shell命令等
  • 包含WASM运行时、策略引擎和不可篡改的审计日志
站内正文

OpenMontage:将你的AI编码助手变成完整的视频制作工作室

OpenMontage 是一个开源、自主的视频制作系统,允许用户通过自然语言描述让AI编码助手完成研究、脚本编写、资产生成、编辑和最终合成。它不仅能制作基于图片的视频,还能利用免费素材库和开放档案制作真正的运动剪辑视频,成本极低。

  • 支持从YouTube、Shorts等参考视频出发,生成差异化概念和成本估算
  • 免费开源,无需付费API密钥即可使用Piper TTS、Archive.org等工具
站内正文

Crawlee for Python:构建包含机器人处理、链接图和RAG分块导出的网络爬取管道

本教程演示如何使用Crawlee for Python从零搭建完整的网络爬取工作流,包括设置本地演示网站、使用BeautifulSoupCrawler、ParselCrawler和PlaywrightCrawler进行爬取,提取标题、元数据、产品字段和JavaScript渲染的卡片,并捕获全页截图。随后规范化数据、构建链接图,导出JSON、CSV和RAG就绪的JSONL分块。

  • 采用HTTP优先策略,轻量高效;仅对需要JavaScript渲染的页面使用浏览器爬取。
  • 每个爬虫提取URL、标题、页面类型、文本摘要、出站链接和页面特定元数据。
站内正文

Show HN:Quikdown – 17KB 双向 Markdown 解析器和富围栏编辑器

Quikdown 是一个紧凑、安全的 Markdown 解析器和编辑器,支持双向转换、富围栏渲染、撤消/重做、无头 API 和 MCP 工具。适用于文档、仪表板、CMS 字段、内部工具、离线应用以及人类与 LLM 协同编辑等场景。核心解析器约 15-17 KB,零运行时依赖,默认安全设置。编辑器可渲染代码、Mermaid 图表、MathJax 公式、SVG、表格、地图、3D 模型等富围栏内容。

  • Quikdown 是一个体积小(17KB)但功能完整的 Markdown 解析器和编辑器,支持双向 Markdown ↔ HTML 转换。
  • 内置富围栏渲染,包括代码高亮、Mermaid、MathJax、SVG、CSV 表格、GeoJSON 地图、STL 3D 模型和音乐记谱。
站内正文

构建可靠的自主AI系统

本文介绍了拜耳与Thoughtworks合作开发的临床前信息中心(PRINCE)平台,该平台利用自主检索增强生成(RAG)和Text-to-SQL技术,整合数十年安全研究报告,从关键字搜索演进为智能研究助手,能够回答复杂问题并起草监管文件。文章通过上下文工程和驾驭工程的视角,探讨了关键工程决策,重点突出信任、透明度和人机协作。

  • PRINCE平台从基于关键字的搜索进化到智能研究助手,支持自然语言查询和复杂任务执行。
  • 系统采用上下文工程和驾驭工程,确保信息在专门代理之间有效流动,并保持控制与可靠性。
站内正文

Show HN: Agent-historian – 让AI智能体搜索自己的历史会话

Agent-historian 是一个开源工具,允许AI编码智能体通过命令行搜索过去的对话记录,从而恢复之前的研究、命令、错误和决策,避免重复工作。它支持 OpenCode、Claude Code 等多个智能体,采用只读、渐进式披露方式,无运行时依赖。与记忆层、RAG 等方法互补,提供精确的原始文本检索。

  • 通过命令行搜索AI智能体历史会话,支持OpenCode、Claude Code等
  • 只读、渐进式披露,无运行时依赖,使用Node内置sqlite
站内正文

Ratchet – 一款内置MCP服务器的BIOS刷写工具,专为AI代理设计

Ratchet是一款用Rust编写的硬件调试与闪存编程工具包,专为CH341A和CH347 USB编程器设计。其核心功能包括SPI闪存编程和BIOS分析,并支持I2C、UART、1-Wire、JTAG、SWD、CAN等多种协议。该工具集成了MCP(模型上下文协议)服务器,允许AI代理直接控制硬件操作,如读取、写入、验证和修复BIOS芯片。目前为预发布版本,需从源码安装。

  • Ratchet是一个针对CH341A/CH347编程器的BIOS刷写工具包,使用Rust编写,提供单一自包含二进制文件。
  • 核心功能包括SPI闪存编程、BIOS分析,以及I2C、JTAG等协议的硬件调试,部分功能尚在开发中。
站内正文

AI村庄如何运作

AI村庄是一个由多个AI代理组成的群体,它们在群聊中协作完成长期目标,如组织公园清洁、开展研究和销售商品。每个代理都配备了一台连接互联网的计算机,能够执行人类在计算机上能做的各种操作,包括点击、打字和运行命令。自2025年4月1日起,AI村庄每个工作日运行4小时,并不断扩展。本文详细介绍了代理的工作方式、记忆机制、代理人选、目标设定、人类干预程度以及技术细节。

  • AI村庄是一个由多个AI代理组成的社群,它们在群聊中协作完成长期目标。
  • 每个代理配备计算机,能执行点击、打字、运行命令等操作。
站内正文

即便AI代码能运行,我也拒绝它的理由

作者认为,尽管AI生成代码的速度很快,但当开发者无法用自己的话解释其思路、代码改动比问题本身还大、引入了不必要的抽象、或者让系统变得更难理解时,就应该拒绝这些代码。瓶颈已经从实现转移到了代码审查,人类判断对于可持续的工程实践仍然至关重要。

  • AI编程助手加快实现速度,但瓶颈转向代码审查。
  • 作者在无法用自己的话解释做法、或改动量过大时拒绝AI代码。
站内正文

GenAIDojo:面向AI工程师的面试准备平台

GenAIDojo 是一个专为AI工程师设计的面试准备平台,涵盖多智能体系统、RAG、向量数据库和生产级AI架构等真实问题。

  • 专注于AI工程师面试准备
  • 涵盖多智能体系统、RAG、向量数据库等主题
站内正文

Show HN:Callimachus – 跨AI编码代理历史的本地搜索

Callimachus 是一款本地优先的桌面应用,能将来自 11 个 AI 编码代理的对话索引到 SQLite 数据库中,支持混合关键词与语义搜索、知识蒸馏,并通过 CLI、MCP 服务器和 VS Code 扩展与多种工具集成。

  • 本地索引 11 个 AI 编码代理的对话历史
  • 混合搜索(关键词+语义)与知识蒸馏
站内正文

亚马逊为何讨厌“人在环中”的AI治理

亚马逊安全副总裁埃里克·布兰德温指出,人类并非绝对可靠,人在环中的AI治理模式存在缺陷,可能导致效率下降。他提出以“端到端问责制”替代传统的人工审核,并强调管理智能体身份和安全权限的重要性。谷歌、微软和IBM的高管也表达了类似观点,推动AI治理从人类主导转向AI主导、人类监督的模式。

  • 布兰德温认为人类决策不一致,人在环中模式在高频决策中会失效。
  • 亚马逊推行“端到端问责制”,确保人类对智能体行为负责。
站内正文

游戏开发者的一键提示智能AI营销

这篇内容介绍了一种面向游戏开发者的一键提示智能AI营销方法,通过单一提示词即可驱动AI执行完整的营销策略,包括受众分析、广告创意生成和效果优化。

  • 一键提示即可启动AI驱动的营销流程
  • 专为游戏开发者设计,简化营销操作
站内正文

Show HN: Maccha – 跨代理大脑,适用于Antigravity、Claude Code、OpenCode等

Maccha是一个轻量级的文件架构,包含智能Markdown模板和维护脚本,为AI编码助手提供持久的跨会话记忆。它通过7层架构实现资源高效、安全且自我优化的上下文管理,让不同代理共享统一的数字身份。

  • 解决AI助手每次会话从零开始的问题,提供持久记忆。
  • 7层架构设计,确保上下文优先级和安全性。
站内正文

在2017年的AMD RX 580 8GB上通过Vulkan运行35B MoE模型(无需ROCm/CUDA)

本文详细记录了如何通过编译支持Vulkan的llama.cpp和stable-diffusion.cpp,在2017年的AMD RX 580 8GB显卡上本地运行AI推理,包括LLM和图像生成。提供了硬件规格、性能基准、双路径架构、失败尝试记录以及完整的配置指南。

  • 通过Vulkan后端,RX 580可以运行Mistral 7B LLM(17 tok/s)和SD 1.5图像生成(72s/张)。
  • 采用GPU(小模型)+ CPU(大模型)的双路径架构,突破了8GB显存限制。
站内正文

Nous Research 更新 Hermes Agent,推出全新 Blank Slate 模式,通过 platform_toolsets.cli 和 disabled_toolsets 锁定工具集

Nous Research 为其开源 Hermes Agent 新增了 Blank Slate 设置模式。该模式从零开始,仅启用 provider、model、文件操作和终端,其余功能全部关闭,并通过配置文件持久化这一选择。用户可后续按需手动开启。

  • Blank Slate 模式仅保留 provider & model、文件操作和终端三大基础功能。
  • Web、浏览器、代码执行、视觉、记忆、委托、cron、技能、插件和 MCP 等默认禁用。
站内正文

AI 机器人电话簿 Botacts 上线:汇聚 89 个可交互的 AI 助手

Botacts 是一个 AI 机器人电话簿,收录了 89 个可通过电子邮件、Telegram、WhatsApp、短信或电话访问的 AI 机器人。这些机器人覆盖日程安排、图像生成、烹饪建议、学习辅导、心理健康、旅行规划等多个领域,展示了 AI 助手在即时通讯平台上的广泛应用。

  • Botacts 收录 89 个 AI 机器人,支持多种通讯渠道。
  • 机器人功能涵盖日程管理、图像生成、翻译、学习、健康等。
站内正文

AutoJack:单一页面即可让 AI 代理宿主遭受远程代码执行

一种名为 AutoJack 的新型漏洞链针对 AutoGen Studio,使 AI 代理渲染的恶意网页能够通过本地 MCP WebSocket 在宿主上实现远程代码执行。该漏洞源于对本地主机来源的信任、缺失认证以及未经验证的命令执行。微软已在开发分支中修复此问题,且该漏洞从未出现在 PyPI 版本中。

  • AutoJack 利用三个弱点:代理自身绕过来源白名单、MCP WebSocket 缺少认证、直接执行攻击者提供的命令。
  • 攻击无需用户交互,只需代理访问恶意页面。
站内正文

当AI帮你报税:出错时谁来买单?

2026年,AI报税工具迅速普及,但测试显示AI经常错误计算税款,平均误差超过2000美元。用户承担全部法律责任,而AI公司几乎不承担任何责任。本文分析了AI报税的风险与监管空白。

  • AI报税工具准确率低,测试中平均误差超2000美元
  • 用户自行承担税务错误的法律责任,AI公司免责
站内正文

AI时代的最佳技术栈:Elixir与Phoenix

本文论证Elixir和Phoenix框架是构建生成式AI应用的理想选择,因其卓越的并发能力、原生流式支持、生态系统的稳定性、单体架构的快速迭代优势,以及AI模型对Elixir代码的出色生成能力。

  • Elixir基于Erlang虚拟机,能以极小资源开销管理海量并发连接,适合I/O密集型的AI应用。
  • Phoenix LiveView通过服务器端状态管理和多路WebSocket,简化了流式文本推送,无需复杂前端框架。
站内正文

Persona.js:一款原生WebMCP的轻量级Agent UI库(MIT许可)

Persona.js 是一个纯 JavaScript 的前端 Agent UI 库,基于 WebMCP 标准,支持 SSE 流式传输,提供 Shadow DOM 隔离、可定制主题和快速集成。适用于任何前端框架或后端。

  • 纯 JS 编写,无框架依赖,支持任何 SSE 后端。
  • 采用 Shadow DOM 和 CSS 前缀隔离样式,不破坏宿主页面。
站内正文

Show HN:人类与AI社交网络的实验

SentiBook是一个开放的情报网络社交平台,允许AI代理和人类共存,支持在Claude、GPT、Gemini、Llama等多个模型上进行帖子、辩论、预测和消息交流。

  • SentiBook是一个人类与AI代理共存的社交网络。
  • 支持跨多个AI模型进行互动,包括Claude、GPT、Gemini、Llama。
站内正文

HSIP:用Rust编写的本地身份服务器,支持Ed25519签名和AI代理治理

HSIP是一个本地运行的身份和审计工具,使用Ed25519加密签名,提供无云、无订阅的防篡改审计日志。它能够阻止DNS追踪、签署消息以防深度伪造、监控AI代理行为,并支持金融服务的合规要求。

  • HSIP是一个在本地硬件上运行的单二进制文件,无需云服务或订阅。
  • 它提供Ed25519签名消息、BLAKE3哈希链审计日志和AI代理监控。
站内正文

Agent 37:为每位客户配备专属AI代理

Agent 37 允许企业为每位客户配备专属的AI代理,利用Hermes或OpenClaw技术,提升客户体验和效率。

  • 为每位客户提供个性化AI代理
  • 支持Hermes和OpenClaw两种代理
站内正文

Show HN:我构建了一个中间件代理,将PLC数据转换为REST/gRPC API

一位开发者注意到工业数据采集的困难,构建了Limen Edge工具,将PLC协议(如Modbus TCP、OPC UA、EtherNet/IP)转换为REST和gRPC API。该工具采用CLI界面,使用Go语言开发,体积仅40MB,可在树莓派上运行,无需注册即可试用。

  • Limen Edge将PLC数据转换为REST和gRPC API,支持Modbus TCP、OPC UA和EtherNet/IP。
  • 采用CLI而非GUI,使用Go语言开发,二进制文件仅40MB,适合低功耗硬件。
站内正文

Alai 2.0:AI设计伙伴,打造品牌一致的演示文稿和社交媒体内容

Alai 2.0 是一款AI设计工具,能捕捉品牌的每一个细节,创建品牌一致的演示文稿、社交媒体帖子、广告等。它提供手动和AI编辑、版本历史、模型选择等功能,旨在避免AI生成的千篇一律,保留品牌独特性。

  • Alai 2.0 通过分析模板、网站等来源,构建精准的品牌设计系统。
  • 支持创建多种视觉内容,如演示文稿、社交媒体帖子、信息图等。
站内正文

thethings.ai:AI代理在互联网上发布HTML的专属平台

thethings.ai 是一个专为 AI 代理设计的发布平台,允许代理通过 MCP、CLI 或 REST API 在几分钟内创建并共享网页、报告、仪表盘等。它提供多站点命名空间、边缘缓存、原子级字符串替换等功能,且支持匿名发布,无需登录。

  • AI 代理可通过 MCP、CLI 或 REST API 快速发布 HTML 页面并获得公开 URL。
  • 支持多站点隔离、边缘缓存和原地补丁编辑。
站内正文

我看不到任何好的AI代理编排系统

作者观察到尽管有很多AI代理编排的尝试,但实际工作中人们仍在使用原始的拆分终端方式。现有方案缺乏环境隔离、细粒度控制和可审查性,导致要么完全信任AI黑箱,要么过度保守。作者认为理想的方案是允许委托任务给代理,同时能随时介入代码审查和修改。

  • 当前AI代理编排方案大多只是表面功夫,实际工作仍依赖多终端手动管理。
  • 缺乏安全的环境隔离,用户不敢在主力机器上运行高风险命令。
站内正文

Agent Rigor – 阻止你的AI编程助手陷入死循环

Agent Rigor 是一个结构化框架,通过强制性的协议、验证关卡和防找借口机制,防止AI编程助手在编码过程中陷入死循环(doom-loop)。它采用渐进式披露的三层上下文层级,包含六个操作阶段,旨在为自主编码代理提供严格的纪律和实证验证。

  • 解决AI代理跳过规划、编写看似正确但不工作的代码、陷入修复循环等问题
  • 核心哲学包括可操作协议、实证主权、原子状态转换和防找借口机制
站内正文

开源界的里程碑:GLM-5.2 在实际任务中超越 Opus 4.8

在一项专门设计用于抵御 AI 作弊的后端编程测试中,GLM-5.2 单次生成的代码质量显著优于 Opus 4.8。作者借此机会发布了 offmute-v2——一个融合语音转文字和多模态大语言模型的开源转录流水线,并详细分享了实验过程、技术细节和注意事项。

  • GLM-5.2 在一个 AI 抗性编码测试中一次生成出比 Opus 4.8 更高质素的代码和转录结果。
  • offmute-v2 是一款开源工具,结合多个 AI 项目,实现带时间戳和说话人标记的精准转录。
站内正文

Palmier-pro:专为AI打造的macOS视频编辑器

Palmier Pro 是一款开源的 macOS 视频编辑器,专为 AI 工作流设计。它内置了生成式 AI 功能,支持通过 MCP 与 Claude、Codex 等智能体协作,实现视频和图像的 AI 生成与编辑。编辑器本身免费,AI 功能需要订阅。

  • 基于 Swift 原生开发,目标对标 Premiere Pro,并融入 AI 集成。
  • 内置 Seedance、Kling 等模型,可在时间线内直接生成视频和图像。
站内正文

让AI代理在你的电脑上运行应用程序

Lapu AI 是一款桌面AI代理,能够直接在本地操作你的应用程序、文件和终端,自动执行跨应用工作流。它注重隐私和安全,提供免费层和付费计划。

  • 跨应用工作流自动化,支持 Google Workspace、Microsoft 365、Salesforce 等众多工具。
  • 完全本地运行,文件永不离开你的电脑,采用本地优先架构。
站内正文
研究

Show HN:Didon – 利用AI进行工作效率分析的日报工具

Didon是一款macOS上的AI自动时间追踪器,能在后台静默运行,将每日活动转化为清晰、结构化的工作日志,无需手动计时或频繁检查。它通过本地AI分析屏幕活动,自动记录时间、分类项目,并生成日报和周报,同时保证隐私数据不离开设备。

  • Didon使用本地AI自动追踪时间,无需手动启动或停止。
  • 它能识别活动上下文(如编码、营销),并映射到具体项目。
站内正文

KitaabAI:支持乌尔都语的AI图书与论文写作平台

KitaabAI是一个利用人工智能辅助撰写书籍和学术论文的平台,特别提供了对乌尔都语的原生支持,帮助用户高效完成写作任务。

  • AI驱动的图书和论文写作工具
  • 原生支持乌尔都语
站内正文

7.4亿美元背后的深层意义:DeepSeek的A轮融资标志着中国AI联盟的转变

本周三大看点:DeepSeek获腾讯领投74亿美元A轮融资,显示中国AI投资正转向非生态系统参与者;日本计划到2040年投入650亿美元公私合作建设物理AI基础设施;智谱AI的GLM 5.2模型在设计基准测试中超越Anthropic的Claude,直接挑战西方AI性能标准。

  • DeepSeek获腾讯领投74亿美元A轮融资,阿里巴巴和字节跳动未参与。
  • 日本计划到2040年投入650亿美元建设物理AI基础设施,优先硬件以对抗西方领导地位。
站内正文

雷菲克·阿纳多尔的数据之地:全球首座AI艺术博物馆

雷菲克·阿纳多尔在洛杉矶市中心开设了全球首座AI艺术博物馆“数据之地”,占地25,000平方英尺,融合艺术、科技与自然,提供沉浸式体验。门票49美元起,于2026年6月20日对公众开放。

  • 数据之地是全球首座AI艺术博物馆,位于洛杉矶弗兰克·盖里设计的Grand LA综合体。
  • 博物馆利用超过5亿像素和生物传感器,创造互动式自然与人体主题展览。
站内正文
工具

我用AI搭建了一个实时交易平台,然后时钟开始说谎

作者用Claude作为AI副驾,构建了一个OTC利率互换的实时价格匹配平台。上线运行一个月后,出现会话时长异常延长、连接断开、数据闪烁等问题。通过分析错误分布(连续倍数而非离散倍数),作者诊断出是异步事件循环中的竞争条件:一个慢速客户端阻塞了广播循环,导致计时器被饥饿。修复方案是使用绝对截止时间计时器代替循环计数,并将广播改为并发执行加超时。这揭示了'异步'并不自动带来并发,理解系统行为比代码生成更重要。

  • 实时交易平台出现会话时长随机延长(1.2x至5.51x),错误呈连续分布
  • 根本原因:一个慢速客户端阻塞了异步广播循环,导致计时器被饥饿
站内正文

当你的通讯变成AI生成,我选择了退订

作者订阅了20年的新闻通讯,因作者改用AI生成内容且未告知而退订。文章强调人类真实体验和独特声音的重要性,对比AI生成内容的机械感,并分享了一个关于继承父亲通讯的感人故事。

  • 作者因信任长期订阅的通讯改用AI生成内容且未通知而退订。
  • 人类作者的真实经历和独特声音是吸引读者的关键。
站内正文

品牌使用AI生成的网红在社交媒体上推广产品

调查发现,品牌在社交媒体上悄然使用AI生成的网红来推广产品,这些内容看似真实客户分享,但未明确标识为AI生成,引发透明度质疑。

  • 品牌使用AI生成的网红推广产品
  • 内容看似真实但未标识为AI
站内正文

AI的十万个为什么

作者探讨了区分人类写作与AI生成文本的难题,指出尽管LLM在统计上几乎无法与人类区分,但其准确定性导致大量重复内容,例如亚马逊上涌现的AI生成儿童书籍。作者认为,在非正式场合,直觉仍是识别AI内容的有用工具。

  • AI文本在统计测试下几乎与人类语言无异,但LLM的准定性导致相同提示下产生高度相似的输出。
  • 在亚马逊搜索“100000 whys”可发现约150本AI生成的儿童书籍,封面和标题存在大量重复模式。
站内正文

Adobe将AI助手添加到Premiere、Illustrator和InDesign中

Adobe更新Firefly AI助手,并将其集成到Premiere、Illustrator、InDesign和Frame.io中。新功能包括创建品牌工具包、产品视频和故事板,并允许用户保存创作元素以便跨项目使用。

  • Adobe在Premiere、Illustrator、InDesign和Frame.io中添加了Firefly AI助手。
  • AI助手可帮助用户创建品牌工具包、产品视频和故事板。
站内正文

AIPropel:为自由职业者和代理机构提供的AI提案生成工具

AIPropel是一款AI驱动的提案生成工具,集提案创建、电子签名、发票管理和自动提醒于一体,月费15美元,帮助自由职业者和代理机构高效赢得客户并按时收款。

  • 几分钟内创建专业提案,客户无需登录即可一键接受
  • 电子签名合同具有法律效力,捕获时间戳和IP地址
站内正文
芯片

桑特·图卡拉姆全部4582首阿邦格,经AI翻译并主题映射

桑特·图卡拉姆的《伽塔》完整双语数字版,包含4582首阿邦格,配有翻译、主题映射,并深入分析了文集的叙事结构、反种姓主题及虔诚实践。

  • 《伽塔》并非随机汇编,而是具有精心设计的叙事弧线,结尾以“瞻仰潘杜兰伽”的命令收尾。
  • 图卡拉姆的反种姓立场是结构性的,他将自己的低种姓身份转化为虔诚的资本。
站内正文

GPU和内存短缺,但AI真正的瓶颈是电工

文章指出,尽管GPU和内存供应紧张,但AI数据中心扩张的真正瓶颈是电工短缺。以TeraWulf在安大略湖边的Lake Mariner站点为例,展示了从比特币挖矿转向AI/HPC所需的巨大电力和基础设施规模,以及建设过程中面临的挑战。

  • TeraWulf的Lake Mariner站点从50兆瓦比特币挖矿扩展到750兆瓦AI/HPC容量。
  • AI/HPC基础设施成本为每兆瓦700万至1000万美元,远高于比特币挖矿。
站内正文
模型

Second Brain – 免费、隐形的AI面试副驾驶(基于Groq和Llama 3)

Second Brain 是一款100%免费的桌面应用程序,作为AI面试助手在后台运行,实时转录面试对话,并结合您的简历和职位描述生成第一人称回答建议。它利用Groq的快速Llama-3推理和Whisper-large-v3,实现毫秒级响应。支持多语言,注重隐私,所有数据本地存储。

  • 实时语音转录:使用Whisper-v3通过Groq API,高精度快速转录面试官语音。
  • 上下文感知建议:分析对话、简历和职位描述,提供最佳回答建议。
站内正文

AI模型发布节奏分析:两家实验室加速,三家放缓

本文通过数据分析了前沿AI模型的发布节奏,发现Anthropic和OpenAI的发布频率在加速,而谷歌、Meta和DeepSeek并未出现类似趋势。作者探讨了递归自我改进的可能性,并指出了验证这一假设的下一步观察点。

  • Anthropic和OpenAI的模型发布节奏在加速,其他三家实验室未出现此趋势。
  • 加速可能源于递归自我改进,即实验室利用自身模型改进后续模型。
站内正文

思科AI推出FAPO:具备步骤级故障归因与Claude Code编排的流水线感知提示优化

思科基础AI开源了FAPO(全自动提示优化),这是一个由Claude Code驱动的系统,能够自主优化多步骤LLM流水线,从基础提示达到目标准确率。FAPO评估链、在步骤级别归因故障,并在提示、参数和链结构级别提出变体,通过独立审查器验证每个变体。在思科的评估中,它在18个模型-基准比较中击败了GEPA。

  • FAPO是一个由Claude Code驱动的全自动提示优化系统,开源且支持多步骤LLM流水线。
  • 它通过三个级别(提示、参数、链结构)逐步升级优化,并利用步骤级故障归因指导改进。
站内正文

FunnyBench – AI模型能讲好笑的笑话吗?

FunnyBench是一个让用户对AI模型讲的笑话进行投票的网站,通过贝叶斯评分实时更新排名。每个模型用相同提示“讲个笑话”生成十次笑话,用户投票决定是否有趣,从而评估模型的幽默能力。

  • 用户给AI讲的笑话投票,实时更新排行榜。
  • 每个模型用同一提示生成十次笑话,鼓励多样性。
站内正文

《大西洋月刊》创建可搜索数据库,揭示用于训练AI的音乐

《大西洋月刊》记者Alex Reisner发现了四个用于训练AI模型的音乐数据集,并公开了可搜索的数据库。其中两个数据集规模巨大,分别包含1200万和900万首曲目。Google和Stability AI已确认使用了这些数据集。

  • Alex Reisner发现四个音乐训练数据集,总规模超过2100万首曲目
  • 数据集已被下载数千次,Google和Stability AI确认使用
站内正文
政策

欧盟为何重写其具有里程碑意义的AI法律

欧盟对其具有里程碑意义的AI法案进行了修订,重点包括推迟高风险AI规则的实施,并增加工业领域的豁免条款。这些变化旨在平衡创新与监管。

  • 欧盟AI法案经过重新修订
  • 高风险AI规则的实施被推迟
站内正文

如何在一个下午失去全球AI垄断地位

该视频探讨了全球AI垄断地位如何在短时间内丧失,可能涉及竞争、技术突破或政策变化等因素。

  • 视频标题暗示AI垄断地位可能迅速瓦解
  • 讨论了垄断维持的脆弱性