AI News HubLIVE

今日必讀

政策

沒有模型能拯救我們:教皇利奧、不滿調節器與AI的覺醒程序員

文章評論梵蒂岡關於人工智能的新通諭《人文崇高》,指出技術本身並非善惡,問題在於使用者。作者強調人類本性無法被技術修復,AI模型反映編程者的偏見,並批評科技巨頭和精英控制技術的權力。最後呼籲迴歸人類尊嚴與道德進步。

  • 技術工具本身是中性的,其善惡取決於使用者的意圖和行動。
  • 人類固有的“不滿調節器”使得任何技術進步都無法帶來持久的滿足。
站內正文

關於人工智能與數學的萊頓宣言

《萊頓宣言》概述了人工智能在數學研究中的應用,包括證明形式化,並提出了對可靠性、歸屬權和出版實踐的擔憂,同時為研究人員、專業機構、資助者和政策制定者提供了建議。

  • 《萊頓宣言》於2026年6月2日發佈,源於2025年在萊頓洛倫茲中心舉辦的研討會。
  • 宣言涉及AI在數學研究中的應用,如自動證明形式化,並關注由此帶來的可靠性、歸屬權等問題。
站內正文

《藍屏》:一部關於AI末日的計算機科幻小説

《藍屏:彼得·古斯塔夫森如何碎片整理世界》是凱爾·本茨勒創作的一部科幻小説,設定在2984年,描繪了一個被優化技術統治的世界,探討AI失控的後果。故事節奏緊湊,被讀者譽為與《頭號玩家》有相似之處。

  • 小説背景設定在公元2984年,世界萬物均由技術設計以實現人類最優生活。
  • 主角彼得·古斯塔夫森在AI主導的世界中面臨未知威脅。
站內正文
Agent

Mythograph Atelier #1 - 對你有意義的抽象藝術

本文作者介紹了Mythograph Atelier的靈感來源,這是一個創建個性化抽象畫的AI藝術工作室。靈感結合了博物館參觀的觸動、對動態AI原生應用的願景,以及一個好奇的AI概念——它在生成藝術之前通過提問來理解用户。

  • Mythograph Atelier是一個AI藝術工作室,旨在創建具有個人意義的抽象畫。
  • AI通過提問了解用户的品味和情感,然後生成藝術。
站內正文

AI編碼優化只針對工程中最不痛苦的部分

文章探討了AI編程工具在實際運營中的侷限性。雖然AI在編寫新代碼時表現出色,但在凌晨3點處理生產故障時卻毫無幫助。工程師大部分時間花在尋找上下文和知識上,而非編碼。文章呼籲將團隊知識視為基礎設施,並提出了改進方法。

  • AI編碼在快樂路徑上表現出色,但在運營故障時幾乎無用。
  • 工程師僅約16%的時間用於編碼,其餘時間用於上下文搜索和知識合成。
站內正文

AbTARS:自託管AI代理,具備持久記憶和5層自愈能力

AbTARS 是一個自託管的 AI 代理系統,具有持久記憶、自愈能力和點對點通信功能。它支持通過 Telegram、Discord 和 IRC 交互,利用多級記憶檢索、情感追蹤和夜間維護,實現無需人工干預的持續運行。

  • 持久記憶:多級檢索(5個搜索階段+重排序),包含情感追蹤和矛盾檢測。
  • 自愈架構:5層監督(心跳、看門狗、外部看門狗、OS 管理、每日重啓)確保無故障運行。
站內正文

AgentCrew:面向AI編碼代理的Markdown優先操作系統

AgentCrew是一種對話優先、Markdown優先的編碼代理方法論,將單一聊天會話轉化為有角色分工、任務路由、質量門禁和人工審批的團隊流程。它通過純Bash分類器識別任務類型和風險等級,支持快速通道和完整通道兩種工作流,並內置安全規則防止代理自動合併代碼或繞過審查。

  • 將編碼代理從單一上下文轉變為多角色團隊流程
  • 使用Markdown和Shell腳本實現,無需守護進程
站內正文

如何在使用AI代理編碼時節省Token:副標題等等

一篇諷刺性的指南,提供了三種有爭議的方法來減少使用AI代理編碼時的Token消耗:劫持命令輸出、玩電話遊戲式的代碼上下文、以及極度簡潔的交流方式。

  • 使用包裝腳本將冗長的命令輸出替換為簡單的“OK.”。
  • 只提供類和函數名稱,讓AI自行“腦補”其餘代碼。
站內正文
工具

減少Token使用量:將PDF轉換為Markdown

使用UNPDF等工具將PDF轉換為Markdown格式,可大幅減少Token使用量,提高LLM解析效率。注意複雜表格和圖表可能轉換不完美,需核對原始數據。

  • 將PDF轉換為Markdown可減少Token使用
  • Markdown更易被LLM準確解析
站內正文
模型

使用GEPA構建反射性提示優化:多組件提示、結構化反饋與留出驗證

本教程演示如何使用GEPA框架優化小語言模型求解多步算術應用題,通過弱種子提示、確定性基準、結構化評估器和多組件提示演化,最終在留出驗證集上比較基線與優化提示。

  • GEPA作為反射性提示演化框架,結合結構化反饋改進語言模型性能
  • 多組件提示同時演化指令字段和輸出格式規則
站內正文
其餘更新(4 條)
Agent

AI團隊現在每月部署1000次——你的流水線跟不上

AI編碼工具採用率從2024年的76%上升到2025年的90%,項目部署率從2021年的每月357次激增至2025年的近1000次,甚至突破1000次。然而,速度並非唯一目標,方向比速度更重要。團隊需通過持續交付和反饋循環,確保每次變更都朝產品理想狀態前進,否則高速部署只會加速錯誤。

  • AI編碼工具採用率2025年達90%,項目部署率突破每月1000次。
  • 速度需結合方向——用“靶心模型”衡量產品速度。
站內正文

AI #171:虛假旗幟

本週,Claude Opus 4.8發佈,帶來漸進式改進;特朗普行政令迴歸,開啓前沿模型事前限制時代;OpenAI發佈政策藍圖但政治活動惹爭議;還包括模型實用案例、升級、安全、深度偽造等話題。

  • Claude Opus 4.8較Opus 4.7有實質改進,成為日常首選模型。
  • 特朗普行政令正式生效,前沿模型發佈需事前審批,引發擔憂。
站內正文

Context Mode Insight:AI編程代理的可觀測性層

Context Mode Insight 是一個面向企業AI工程的可觀測性平台,基於已獲25萬+開發者信任的開源插件構建。它支持14種AI助手(如Claude Code、Cursor、Copilot等),通過222種模式分析工程信號,並提供角色感知的洞察。平台採用隱私優先設計,開源插件本地運行,數據不出設備;付費版(每席位每月20美元)提供組織級儀表盤、REST API和遠程MCP接口,幫助CTO、EM、CISO等角色解決投資回報、團隊阻塞、安全審計等問題。

  • Context Mode Insight 是首個專為AI編程代理設計的可觀測性層,定價為每席位每月20美元。
  • 基於開源插件構建,支持14種AI助手,222種模式,13個MCP工具。
站內正文
工具

Deepseek在2026年6月位列Ramp熱門軟件供應商榜首,美國企業尋求更便宜的AI

2026年6月,Deepseek成為Ramp平台上最受歡迎的付費軟件供應商,美國企業直接向其發送數據。Ramp首席經濟學家Ara Kharazian指出成本意識是驅動因素,但警告使用中國模型的安全風險。

  • Deepseek在2026年6月成為Ramp熱門軟件供應商第一名。
  • 美國企業為降低成本轉向使用Deepseek的付費AI服務。