AI News HubLIVE

今日必读

政策

没有模型能拯救我们:教皇利奥、不满调节器与AI的觉醒程序员

文章评论梵蒂冈关于人工智能的新通谕《人文崇高》,指出技术本身并非善恶,问题在于使用者。作者强调人类本性无法被技术修复,AI模型反映编程者的偏见,并批评科技巨头和精英控制技术的权力。最后呼吁回归人类尊严与道德进步。

  • 技术工具本身是中性的,其善恶取决于使用者的意图和行动。
  • 人类固有的“不满调节器”使得任何技术进步都无法带来持久的满足。
站内正文

关于人工智能与数学的莱顿宣言

《莱顿宣言》概述了人工智能在数学研究中的应用,包括证明形式化,并提出了对可靠性、归属权和出版实践的担忧,同时为研究人员、专业机构、资助者和政策制定者提供了建议。

  • 《莱顿宣言》于2026年6月2日发布,源于2025年在莱顿洛伦兹中心举办的研讨会。
  • 宣言涉及AI在数学研究中的应用,如自动证明形式化,并关注由此带来的可靠性、归属权等问题。
站内正文

《蓝屏》:一部关于AI末日的计算机科幻小说

《蓝屏:彼得·古斯塔夫森如何碎片整理世界》是凯尔·本茨勒创作的一部科幻小说,设定在2984年,描绘了一个被优化技术统治的世界,探讨AI失控的后果。故事节奏紧凑,被读者誉为与《头号玩家》有相似之处。

  • 小说背景设定在公元2984年,世界万物均由技术设计以实现人类最优生活。
  • 主角彼得·古斯塔夫森在AI主导的世界中面临未知威胁。
站内正文
Agent

Mythograph Atelier #1 - 对你有意义的抽象艺术

本文作者介绍了Mythograph Atelier的灵感来源,这是一个创建个性化抽象画的AI艺术工作室。灵感结合了博物馆参观的触动、对动态AI原生应用的愿景,以及一个好奇的AI概念——它在生成艺术之前通过提问来理解用户。

  • Mythograph Atelier是一个AI艺术工作室,旨在创建具有个人意义的抽象画。
  • AI通过提问了解用户的品味和情感,然后生成艺术。
站内正文

AI编码优化只针对工程中最不痛苦的部分

文章探讨了AI编程工具在实际运营中的局限性。虽然AI在编写新代码时表现出色,但在凌晨3点处理生产故障时却毫无帮助。工程师大部分时间花在寻找上下文和知识上,而非编码。文章呼吁将团队知识视为基础设施,并提出了改进方法。

  • AI编码在快乐路径上表现出色,但在运营故障时几乎无用。
  • 工程师仅约16%的时间用于编码,其余时间用于上下文搜索和知识合成。
站内正文

AbTARS:自托管AI代理,具备持久记忆和5层自愈能力

AbTARS 是一个自托管的 AI 代理系统,具有持久记忆、自愈能力和点对点通信功能。它支持通过 Telegram、Discord 和 IRC 交互,利用多级记忆检索、情感追踪和夜间维护,实现无需人工干预的持续运行。

  • 持久记忆:多级检索(5个搜索阶段+重排序),包含情感追踪和矛盾检测。
  • 自愈架构:5层监督(心跳、看门狗、外部看门狗、OS 管理、每日重启)确保无故障运行。
站内正文

AgentCrew:面向AI编码代理的Markdown优先操作系统

AgentCrew是一种对话优先、Markdown优先的编码代理方法论,将单一聊天会话转化为有角色分工、任务路由、质量门禁和人工审批的团队流程。它通过纯Bash分类器识别任务类型和风险等级,支持快速通道和完整通道两种工作流,并内置安全规则防止代理自动合并代码或绕过审查。

  • 将编码代理从单一上下文转变为多角色团队流程
  • 使用Markdown和Shell脚本实现,无需守护进程
站内正文

如何在使用AI代理编码时节省Token:副标题等等

一篇讽刺性的指南,提供了三种有争议的方法来减少使用AI代理编码时的Token消耗:劫持命令输出、玩电话游戏式的代码上下文、以及极度简洁的交流方式。

  • 使用包装脚本将冗长的命令输出替换为简单的“OK.”。
  • 只提供类和函数名称,让AI自行“脑补”其余代码。
站内正文
工具

减少Token使用量:将PDF转换为Markdown

使用UNPDF等工具将PDF转换为Markdown格式,可大幅减少Token使用量,提高LLM解析效率。注意复杂表格和图表可能转换不完美,需核对原始数据。

  • 将PDF转换为Markdown可减少Token使用
  • Markdown更易被LLM准确解析
站内正文
模型

使用GEPA构建反射性提示优化:多组件提示、结构化反馈与留出验证

本教程演示如何使用GEPA框架优化小语言模型求解多步算术应用题,通过弱种子提示、确定性基准、结构化评估器和多组件提示演化,最终在留出验证集上比较基线与优化提示。

  • GEPA作为反射性提示演化框架,结合结构化反馈改进语言模型性能
  • 多组件提示同时演化指令字段和输出格式规则
站内正文
其余更新(4 条)
Agent

AI团队现在每月部署1000次——你的流水线跟不上

AI编码工具采用率从2024年的76%上升到2025年的90%,项目部署率从2021年的每月357次激增至2025年的近1000次,甚至突破1000次。然而,速度并非唯一目标,方向比速度更重要。团队需通过持续交付和反馈循环,确保每次变更都朝产品理想状态前进,否则高速部署只会加速错误。

  • AI编码工具采用率2025年达90%,项目部署率突破每月1000次。
  • 速度需结合方向——用“靶心模型”衡量产品速度。
站内正文

AI #171:虚假旗帜

本周,Claude Opus 4.8发布,带来渐进式改进;特朗普行政令回归,开启前沿模型事前限制时代;OpenAI发布政策蓝图但政治活动惹争议;还包括模型实用案例、升级、安全、深度伪造等话题。

  • Claude Opus 4.8较Opus 4.7有实质改进,成为日常首选模型。
  • 特朗普行政令正式生效,前沿模型发布需事前审批,引发担忧。
站内正文

Context Mode Insight:AI编程代理的可观测性层

Context Mode Insight 是一个面向企业AI工程的可观测性平台,基于已获25万+开发者信任的开源插件构建。它支持14种AI助手(如Claude Code、Cursor、Copilot等),通过222种模式分析工程信号,并提供角色感知的洞察。平台采用隐私优先设计,开源插件本地运行,数据不出设备;付费版(每席位每月20美元)提供组织级仪表盘、REST API和远程MCP接口,帮助CTO、EM、CISO等角色解决投资回报、团队阻塞、安全审计等问题。

  • Context Mode Insight 是首个专为AI编程代理设计的可观测性层,定价为每席位每月20美元。
  • 基于开源插件构建,支持14种AI助手,222种模式,13个MCP工具。
站内正文
工具

Deepseek在2026年6月位列Ramp热门软件供应商榜首,美国企业寻求更便宜的AI

2026年6月,Deepseek成为Ramp平台上最受欢迎的付费软件供应商,美国企业直接向其发送数据。Ramp首席经济学家Ara Kharazian指出成本意识是驱动因素,但警告使用中国模型的安全风险。

  • Deepseek在2026年6月成为Ramp热门软件供应商第一名。
  • 美国企业为降低成本转向使用Deepseek的付费AI服务。
AI 日报 2026-06-08 | AI News Hub