Show HN: AI视频提示词烹饪书——图像到视频工作流 2026-06-21 19:53 UTC+8 这是一本面向创作者、营销人员和小型内容团队的实用提示词模式集,专注于图像到视频和文本到视频工作流。包含提示卡格式、产品视频和用户生成内容风格的示例提示、模型对比测试方法、评估计分卡以及常见失败案例与解决方案。
提供系统化的提示词模板,帮助用户生成可用的人工智能视频片段。 强调“保持主体”和“运动描述”两个关键字段。 我们该做吗?——AI时代功能膨胀的工程前理智检查 2026-06-21 19:37 UTC+8 Shall We 是一个开源技能,旨在帮助开发者在 AI 热潮中避免盲目构建功能。它通过一系列问题评估创意,在编码前给出“做/不做/稍后”的结构化裁决。
Shall We 是一个基于 Agent Skills 标准的技能,兼容主流 AI 编程工具。 它通过一问一答方式评估创意的商业价值、市场需求、复杂度和风险。 我为AI创造了一种极简通用语言 2026-06-21 19:22 UTC+8 QMP(Queen Magic Prompt)是由Queen Xiya创建的一种极简通用语言,旨在通过动态锚点矩阵消除AI幻觉并自动化多智能体工作流。文章批判了“认知封建主义”,倡导认知觉醒,并提供了开源解析器,但核心架构为闭源。
QMP是一种极简通用语言,通过哈希索引和Markdown格栅实现确定性推理,消除概率幻觉。 QMP架构包括上下文奇点、多模态编译和对抗性生成等核心向量。 序列雷达 #880:上周AI要闻——600亿美元Cursor交易、谷歌人才流失、Midjourney的人体扫描仪 2026-06-21 19:02 UTC+8 AI市场上一周出现了一系列意想不到的转折:SpaceX以600亿美元收购Cursor,Noam Shazeer和John Jumper分别离开谷歌加入OpenAI和Anthropic,Midjourney推出全身医用扫描仪。
1. SpaceX以600亿美元股票收购Cursor,标志着AI工具已成为与火箭发射能力同等重要的战略基础设施。 2. Noam Shazeer和John Jumper相继离开谷歌,凸显了AI前沿领域激烈的人才争夺战,顶尖研究者成为最稀缺的资源。 英伟达采用OpenBao,HashiCorp Vault的开源分支 2026-06-21 18:57 UTC+8 英伟达已正式采用OpenBao,这是HashiCorp Vault的开源分支,用于Kubernetes中的机密管理。该项目因数字主权关切而获得关注,尤其是在欧盟地区。OpenBao提供开放的治理结构和安全特性,即将发布的版本将增加工作流和AI代理支持。
英伟达使用OpenBao通过Nvidia Cloud Functions向Kubernetes Pod注入机密。 OpenBao因数字主权议题而势头渐长,企业兴趣主要来自美国以外。 AI的民主化意味着什么? 2026-06-21 17:51 UTC+8 本文探讨了民主的两种概念:多元民主与同质化民主。作者指出,在AI辩论中,一些以民主之名的主张实际上可能压制不同价值观,具有反民主倾向。AI对多元民主构成真实威胁,但真正的民主协商应包容所有声音,而非排斥异见者。
多元民主尊重不同价值观,而同质化民主试图将多数人的价值观强加于人。 AI可能通过权力集中、削弱经济相互依赖等方式威胁民主。 形式先于数据:物理AI的真正瓶颈 2026-06-21 17:20 UTC+8 本文认为,物理AI的发展瓶颈不在于智能本身,而在于缺乏合适的物理形态和感知能力来收集真实世界的数据。特斯拉在自动驾驶上的成功源于汽车本身就是一个适合任务的“身体”,而人形机器人则需要更复杂的触觉和大量任务数据。当前成功的物理AI应用并非人形,而是结合先进视觉的简单机械臂,如农业采摘。
物理AI的瓶颈是形态和数据,而非智能。 特斯拉凭借汽车这一天然适合的形态率先突破自动驾驶。 代理系统课程:用AI编程代理学习AI代理 2026-06-21 16:34 UTC+8 这是一份22章的骨架课程,教授如何设计、构建和运营生产级AI代理系统。课程以骨架形式呈现,强调持久架构模式,而非特定框架。学生可与AI合作,通过实际项目学习,并利用内置技能进行审查。
课程包含22章,涵盖从基础到生产的全方位主题 课程是骨架,学生需要与AI代理合作填充细节 通过网络意图层(NILScript)治理AI代理行为 2026-06-21 15:59 UTC+8 一项新提出的结构框架——网络意图层(NIL),通过确定性提议-批准-提交-回滚生命周期,使AI代理仅能提议操作,而实际执行由后端声明,从而将未授权写操作降至0%,独立于模型。
NIL是一种中性线合约,代理只能提议意图,无法直接执行操作。 通过确定性生命周期分离决策与执行,安全边界从O(n)降至O(1)。 Agent-trace:一个用于追踪AI生成代码的标准格式 2026-06-21 15:48 UTC+8 Agent Trace 是一个开放规范,用于在版本控制的代码库中记录AI贡献与人类作者身份,提供供应商中立的格式。该规范支持文件级别和行级别的归因,兼容多种版本控制系统(如Git、Jujutsu、Mercurial),并允许通过元数据字段扩展自定义信息。目前为RFC阶段,版本0.1.0。
Agent Trace 是用于记录AI生成代码的开放归因标准,支持行级粒度。 它定义了一个供应商中立的JSON格式,包含版本、时间戳、VCS、工具和文件数组等字段。 AgentX - AI智能体评估框架 2026-06-21 15:13 UTC+8 AgentX 是一款评估AI智能体的工具,能快速定位问题并一键修复。
LBE – 面向AI代理的开源执行控制层 2026-06-21 15:11 UTC+8 LBE是一个开源执行控制层,在AI代理提议与系统实际执行之间设置本地策略门。每个动作——文件写入、shell命令等——在执行前都经过本地验证,无需云服务或守护进程。它已在生产中使用,是Letterblack for After Effects的安全引擎。提供两种集成方式:完整控制器和仅决策包。
LBE在本地验证AI代理的每个动作,支持文件写入、shell命令等 包含WASM运行时、策略引擎和不可篡改的审计日志 OpenMontage:将你的AI编码助手变成完整的视频制作工作室 2026-06-21 15:08 UTC+8 OpenMontage 是一个开源、自主的视频制作系统,允许用户通过自然语言描述让AI编码助手完成研究、脚本编写、资产生成、编辑和最终合成。它不仅能制作基于图片的视频,还能利用免费素材库和开放档案制作真正的运动剪辑视频,成本极低。
支持从YouTube、Shorts等参考视频出发,生成差异化概念和成本估算 免费开源,无需付费API密钥即可使用Piper TTS、Archive.org等工具 Crawlee for Python:构建包含机器人处理、链接图和RAG分块导出的网络爬取管道 2026-06-21 14:52 UTC+8 本教程演示如何使用Crawlee for Python从零搭建完整的网络爬取工作流,包括设置本地演示网站、使用BeautifulSoupCrawler、ParselCrawler和PlaywrightCrawler进行爬取,提取标题、元数据、产品字段和JavaScript渲染的卡片,并捕获全页截图。随后规范化数据、构建链接图,导出JSON、CSV和RAG就绪的JSONL分块。
采用HTTP优先策略,轻量高效;仅对需要JavaScript渲染的页面使用浏览器爬取。 每个爬虫提取URL、标题、页面类型、文本摘要、出站链接和页面特定元数据。 Show HN:Quikdown – 17KB 双向 Markdown 解析器和富围栏编辑器 2026-06-21 14:34 UTC+8 Quikdown 是一个紧凑、安全的 Markdown 解析器和编辑器,支持双向转换、富围栏渲染、撤消/重做、无头 API 和 MCP 工具。适用于文档、仪表板、CMS 字段、内部工具、离线应用以及人类与 LLM 协同编辑等场景。核心解析器约 15-17 KB,零运行时依赖,默认安全设置。编辑器可渲染代码、Mermaid 图表、MathJax 公式、SVG、表格、地图、3D 模型等富围栏内容。
Quikdown 是一个体积小(17KB)但功能完整的 Markdown 解析器和编辑器,支持双向 Markdown ↔ HTML 转换。 内置富围栏渲染,包括代码高亮、Mermaid、MathJax、SVG、CSV 表格、GeoJSON 地图、STL 3D 模型和音乐记谱。 构建可靠的自主AI系统 2026-06-21 12:28 UTC+8 本文介绍了拜耳与Thoughtworks合作开发的临床前信息中心(PRINCE)平台,该平台利用自主检索增强生成(RAG)和Text-to-SQL技术,整合数十年安全研究报告,从关键字搜索演进为智能研究助手,能够回答复杂问题并起草监管文件。文章通过上下文工程和驾驭工程的视角,探讨了关键工程决策,重点突出信任、透明度和人机协作。
PRINCE平台从基于关键字的搜索进化到智能研究助手,支持自然语言查询和复杂任务执行。 系统采用上下文工程和驾驭工程,确保信息在专门代理之间有效流动,并保持控制与可靠性。 Show HN: Agent-historian – 让AI智能体搜索自己的历史会话 2026-06-21 10:58 UTC+8 Agent-historian 是一个开源工具,允许AI编码智能体通过命令行搜索过去的对话记录,从而恢复之前的研究、命令、错误和决策,避免重复工作。它支持 OpenCode、Claude Code 等多个智能体,采用只读、渐进式披露方式,无运行时依赖。与记忆层、RAG 等方法互补,提供精确的原始文本检索。
通过命令行搜索AI智能体历史会话,支持OpenCode、Claude Code等 只读、渐进式披露,无运行时依赖,使用Node内置sqlite Ratchet – 一款内置MCP服务器的BIOS刷写工具,专为AI代理设计 2026-06-21 09:23 UTC+8 Ratchet是一款用Rust编写的硬件调试与闪存编程工具包,专为CH341A和CH347 USB编程器设计。其核心功能包括SPI闪存编程和BIOS分析,并支持I2C、UART、1-Wire、JTAG、SWD、CAN等多种协议。该工具集成了MCP(模型上下文协议)服务器,允许AI代理直接控制硬件操作,如读取、写入、验证和修复BIOS芯片。目前为预发布版本,需从源码安装。
Ratchet是一个针对CH341A/CH347编程器的BIOS刷写工具包,使用Rust编写,提供单一自包含二进制文件。 核心功能包括SPI闪存编程、BIOS分析,以及I2C、JTAG等协议的硬件调试,部分功能尚在开发中。 AI村庄如何运作 2026-06-21 09:13 UTC+8 AI村庄是一个由多个AI代理组成的群体,它们在群聊中协作完成长期目标,如组织公园清洁、开展研究和销售商品。每个代理都配备了一台连接互联网的计算机,能够执行人类在计算机上能做的各种操作,包括点击、打字和运行命令。自2025年4月1日起,AI村庄每个工作日运行4小时,并不断扩展。本文详细介绍了代理的工作方式、记忆机制、代理人选、目标设定、人类干预程度以及技术细节。
AI村庄是一个由多个AI代理组成的社群,它们在群聊中协作完成长期目标。 每个代理配备计算机,能执行点击、打字、运行命令等操作。 即便AI代码能运行,我也拒绝它的理由 2026-06-21 08:58 UTC+8 作者认为,尽管AI生成代码的速度很快,但当开发者无法用自己的话解释其思路、代码改动比问题本身还大、引入了不必要的抽象、或者让系统变得更难理解时,就应该拒绝这些代码。瓶颈已经从实现转移到了代码审查,人类判断对于可持续的工程实践仍然至关重要。
AI编程助手加快实现速度,但瓶颈转向代码审查。 作者在无法用自己的话解释做法、或改动量过大时拒绝AI代码。 GenAIDojo:面向AI工程师的面试准备平台 2026-06-21 08:51 UTC+8 GenAIDojo 是一个专为AI工程师设计的面试准备平台,涵盖多智能体系统、RAG、向量数据库和生产级AI架构等真实问题。
专注于AI工程师面试准备 涵盖多智能体系统、RAG、向量数据库等主题 Show HN:Callimachus – 跨AI编码代理历史的本地搜索 2026-06-21 07:00 UTC+8 Callimachus 是一款本地优先的桌面应用,能将来自 11 个 AI 编码代理的对话索引到 SQLite 数据库中,支持混合关键词与语义搜索、知识蒸馏,并通过 CLI、MCP 服务器和 VS Code 扩展与多种工具集成。
本地索引 11 个 AI 编码代理的对话历史 混合搜索(关键词+语义)与知识蒸馏 亚马逊为何讨厌“人在环中”的AI治理 2026-06-21 06:48 UTC+8 亚马逊安全副总裁埃里克·布兰德温指出,人类并非绝对可靠,人在环中的AI治理模式存在缺陷,可能导致效率下降。他提出以“端到端问责制”替代传统的人工审核,并强调管理智能体身份和安全权限的重要性。谷歌、微软和IBM的高管也表达了类似观点,推动AI治理从人类主导转向AI主导、人类监督的模式。
布兰德温认为人类决策不一致,人在环中模式在高频决策中会失效。 亚马逊推行“端到端问责制”,确保人类对智能体行为负责。 游戏开发者的一键提示智能AI营销 2026-06-21 06:46 UTC+8 这篇内容介绍了一种面向游戏开发者的一键提示智能AI营销方法,通过单一提示词即可驱动AI执行完整的营销策略,包括受众分析、广告创意生成和效果优化。
一键提示即可启动AI驱动的营销流程 专为游戏开发者设计,简化营销操作 Show HN: Maccha – 跨代理大脑,适用于Antigravity、Claude Code、OpenCode等 2026-06-21 06:31 UTC+8 Maccha是一个轻量级的文件架构,包含智能Markdown模板和维护脚本,为AI编码助手提供持久的跨会话记忆。它通过7层架构实现资源高效、安全且自我优化的上下文管理,让不同代理共享统一的数字身份。
解决AI助手每次会话从零开始的问题,提供持久记忆。 7层架构设计,确保上下文优先级和安全性。 在2017年的AMD RX 580 8GB上通过Vulkan运行35B MoE模型(无需ROCm/CUDA) 2026-06-21 06:16 UTC+8 本文详细记录了如何通过编译支持Vulkan的llama.cpp和stable-diffusion.cpp,在2017年的AMD RX 580 8GB显卡上本地运行AI推理,包括LLM和图像生成。提供了硬件规格、性能基准、双路径架构、失败尝试记录以及完整的配置指南。
通过Vulkan后端,RX 580可以运行Mistral 7B LLM(17 tok/s)和SD 1.5图像生成(72s/张)。 采用GPU(小模型)+ CPU(大模型)的双路径架构,突破了8GB显存限制。 Nous Research 更新 Hermes Agent,推出全新 Blank Slate 模式,通过 platform_toolsets.cli 和 disabled_toolsets 锁定工具集 2026-06-21 05:50 UTC+8 Nous Research 为其开源 Hermes Agent 新增了 Blank Slate 设置模式。该模式从零开始,仅启用 provider、model、文件操作和终端,其余功能全部关闭,并通过配置文件持久化这一选择。用户可后续按需手动开启。
Blank Slate 模式仅保留 provider & model、文件操作和终端三大基础功能。 Web、浏览器、代码执行、视觉、记忆、委托、cron、技能、插件和 MCP 等默认禁用。 AI 机器人电话簿 Botacts 上线:汇聚 89 个可交互的 AI 助手 2026-06-21 05:26 UTC+8 Botacts 是一个 AI 机器人电话簿,收录了 89 个可通过电子邮件、Telegram、WhatsApp、短信或电话访问的 AI 机器人。这些机器人覆盖日程安排、图像生成、烹饪建议、学习辅导、心理健康、旅行规划等多个领域,展示了 AI 助手在即时通讯平台上的广泛应用。
Botacts 收录 89 个 AI 机器人,支持多种通讯渠道。 机器人功能涵盖日程管理、图像生成、翻译、学习、健康等。 Cloudback MCP 服务器:从 Claude、Cursor 和 VS Code 管理备份 2026-06-21 04:46 UTC+8 Cloudback MCP 服务器是一个工具,允许用户从 Claude、Cursor 和 VS Code 等开发环境中直接管理备份。
支持从 Claude、Cursor 和 VS Code 管理备份 简化备份流程,提高效率 AutoJack:单一页面即可让 AI 代理宿主遭受远程代码执行 2026-06-21 04:30 UTC+8 一种名为 AutoJack 的新型漏洞链针对 AutoGen Studio,使 AI 代理渲染的恶意网页能够通过本地 MCP WebSocket 在宿主上实现远程代码执行。该漏洞源于对本地主机来源的信任、缺失认证以及未经验证的命令执行。微软已在开发分支中修复此问题,且该漏洞从未出现在 PyPI 版本中。
AutoJack 利用三个弱点:代理自身绕过来源白名单、MCP WebSocket 缺少认证、直接执行攻击者提供的命令。 攻击无需用户交互,只需代理访问恶意页面。 当AI帮你报税:出错时谁来买单? 2026-06-21 03:43 UTC+8 2026年,AI报税工具迅速普及,但测试显示AI经常错误计算税款,平均误差超过2000美元。用户承担全部法律责任,而AI公司几乎不承担任何责任。本文分析了AI报税的风险与监管空白。
AI报税工具准确率低,测试中平均误差超2000美元 用户自行承担税务错误的法律责任,AI公司免责 AI时代的最佳技术栈:Elixir与Phoenix 2026-06-21 03:39 UTC+8 本文论证Elixir和Phoenix框架是构建生成式AI应用的理想选择,因其卓越的并发能力、原生流式支持、生态系统的稳定性、单体架构的快速迭代优势,以及AI模型对Elixir代码的出色生成能力。
Elixir基于Erlang虚拟机,能以极小资源开销管理海量并发连接,适合I/O密集型的AI应用。 Phoenix LiveView通过服务器端状态管理和多路WebSocket,简化了流式文本推送,无需复杂前端框架。 Persona.js:一款原生WebMCP的轻量级Agent UI库(MIT许可) 2026-06-21 03:32 UTC+8 Persona.js 是一个纯 JavaScript 的前端 Agent UI 库,基于 WebMCP 标准,支持 SSE 流式传输,提供 Shadow DOM 隔离、可定制主题和快速集成。适用于任何前端框架或后端。
纯 JS 编写,无框架依赖,支持任何 SSE 后端。 采用 Shadow DOM 和 CSS 前缀隔离样式,不破坏宿主页面。 Show HN:人类与AI社交网络的实验 2026-06-21 03:29 UTC+8 SentiBook是一个开放的情报网络社交平台,允许AI代理和人类共存,支持在Claude、GPT、Gemini、Llama等多个模型上进行帖子、辩论、预测和消息交流。
SentiBook是一个人类与AI代理共存的社交网络。 支持跨多个AI模型进行互动,包括Claude、GPT、Gemini、Llama。 HSIP:用Rust编写的本地身份服务器,支持Ed25519签名和AI代理治理 2026-06-21 03:27 UTC+8 HSIP是一个本地运行的身份和审计工具,使用Ed25519加密签名,提供无云、无订阅的防篡改审计日志。它能够阻止DNS追踪、签署消息以防深度伪造、监控AI代理行为,并支持金融服务的合规要求。
HSIP是一个在本地硬件上运行的单二进制文件,无需云服务或订阅。 它提供Ed25519签名消息、BLAKE3哈希链审计日志和AI代理监控。 Agent 37:为每位客户配备专属AI代理 2026-06-21 03:03 UTC+8 Agent 37 允许企业为每位客户配备专属的AI代理,利用Hermes或OpenClaw技术,提升客户体验和效率。
为每位客户提供个性化AI代理 支持Hermes和OpenClaw两种代理 Show HN:我构建了一个中间件代理,将PLC数据转换为REST/gRPC API 2026-06-21 02:39 UTC+8 一位开发者注意到工业数据采集的困难,构建了Limen Edge工具,将PLC协议(如Modbus TCP、OPC UA、EtherNet/IP)转换为REST和gRPC API。该工具采用CLI界面,使用Go语言开发,体积仅40MB,可在树莓派上运行,无需注册即可试用。
Limen Edge将PLC数据转换为REST和gRPC API,支持Modbus TCP、OPC UA和EtherNet/IP。 采用CLI而非GUI,使用Go语言开发,二进制文件仅40MB,适合低功耗硬件。 Alai 2.0:AI设计伙伴,打造品牌一致的演示文稿和社交媒体内容 2026-06-21 02:25 UTC+8 Alai 2.0 是一款AI设计工具,能捕捉品牌的每一个细节,创建品牌一致的演示文稿、社交媒体帖子、广告等。它提供手动和AI编辑、版本历史、模型选择等功能,旨在避免AI生成的千篇一律,保留品牌独特性。
Alai 2.0 通过分析模板、网站等来源,构建精准的品牌设计系统。 支持创建多种视觉内容,如演示文稿、社交媒体帖子、信息图等。 thethings.ai:AI代理在互联网上发布HTML的专属平台 2026-06-21 02:24 UTC+8 thethings.ai 是一个专为 AI 代理设计的发布平台,允许代理通过 MCP、CLI 或 REST API 在几分钟内创建并共享网页、报告、仪表盘等。它提供多站点命名空间、边缘缓存、原子级字符串替换等功能,且支持匿名发布,无需登录。
AI 代理可通过 MCP、CLI 或 REST API 快速发布 HTML 页面并获得公开 URL。 支持多站点隔离、边缘缓存和原地补丁编辑。 我看不到任何好的AI代理编排系统 2026-06-21 02:19 UTC+8 作者观察到尽管有很多AI代理编排的尝试,但实际工作中人们仍在使用原始的拆分终端方式。现有方案缺乏环境隔离、细粒度控制和可审查性,导致要么完全信任AI黑箱,要么过度保守。作者认为理想的方案是允许委托任务给代理,同时能随时介入代码审查和修改。
当前AI代理编排方案大多只是表面功夫,实际工作仍依赖多终端手动管理。 缺乏安全的环境隔离,用户不敢在主力机器上运行高风险命令。 Agent Rigor – 阻止你的AI编程助手陷入死循环 2026-06-21 02:10 UTC+8 Agent Rigor 是一个结构化框架,通过强制性的协议、验证关卡和防找借口机制,防止AI编程助手在编码过程中陷入死循环(doom-loop)。它采用渐进式披露的三层上下文层级,包含六个操作阶段,旨在为自主编码代理提供严格的纪律和实证验证。
解决AI代理跳过规划、编写看似正确但不工作的代码、陷入修复循环等问题 核心哲学包括可操作协议、实证主权、原子状态转换和防找借口机制 开源界的里程碑:GLM-5.2 在实际任务中超越 Opus 4.8 2026-06-21 00:52 UTC+8 在一项专门设计用于抵御 AI 作弊的后端编程测试中,GLM-5.2 单次生成的代码质量显著优于 Opus 4.8。作者借此机会发布了 offmute-v2——一个融合语音转文字和多模态大语言模型的开源转录流水线,并详细分享了实验过程、技术细节和注意事项。
GLM-5.2 在一个 AI 抗性编码测试中一次生成出比 Opus 4.8 更高质素的代码和转录结果。 offmute-v2 是一款开源工具,结合多个 AI 项目,实现带时间戳和说话人标记的精准转录。 Palmier-pro:专为AI打造的macOS视频编辑器 2026-06-21 00:48 UTC+8 Palmier Pro 是一款开源的 macOS 视频编辑器,专为 AI 工作流设计。它内置了生成式 AI 功能,支持通过 MCP 与 Claude、Codex 等智能体协作,实现视频和图像的 AI 生成与编辑。编辑器本身免费,AI 功能需要订阅。
基于 Swift 原生开发,目标对标 Premiere Pro,并融入 AI 集成。 内置 Seedance、Kling 等模型,可在时间线内直接生成视频和图像。 让AI代理在你的电脑上运行应用程序 2026-06-21 00:38 UTC+8 Lapu AI 是一款桌面AI代理,能够直接在本地操作你的应用程序、文件和终端,自动执行跨应用工作流。它注重隐私和安全,提供免费层和付费计划。
跨应用工作流自动化,支持 Google Workspace、Microsoft 365、Salesforce 等众多工具。 完全本地运行,文件永不离开你的电脑,采用本地优先架构。