Anthropic

來源分布

Hacker News AI27
The New Stack AI4
The Verge AI3
AI Business2
AWS Machine Learning Blog2
Simon Willison's Weblog2
ZDNet AI2
Analytics Vidhya1

主題分布

Agent38
政策21
模型15
研究10
工具6
晶片5
機器人2
創業融資1

日期線

2026-07-0915
2026-07-1114
2026-07-1012
2026-07-125
2026-07-084

最新動態

The Sequence Radar #893：上週AI動態：GPT-5.6、Grok 4.5、Muse Spark 1.1與後聊天機器人棧

2026-07-12 19:02 UTC+8

前沿AI實驗室正從聊天機器人轉向整合系統，模型作為執行時，頻繁釋出強大模型和代理。本週亮點包括OpenAI的GPT-5.6（Sol、Terra、Luna），具備程式化工具呼叫和並行子代理；GPT-Live全雙工音訊；ChatGPT Work用於建立工件；Meta的Muse Spark 1.1擁有百萬token上下文和主動上下文管理；Grok 4.5專注於編碼和知識工作。研究方面，OpenAI審計表明SWE-Bench Pro基準30%任務有問題；Anthropic提出GRAM方法可選擇性移除危險知識；SkillOpt-Lite最佳化代理自我進化；DSpark和Nemotron-Labs-Diffusion改進推理效率。行業新聞包括Lovable融資3億美元，Prime Intellect融資1.3億美元，SambaNova融資10億美元等。

OpenAI釋出GPT-5.6，分為Sol、Terra、Luna，支援程式化工具呼叫和並行子代理。
GPT-Live實現全雙工音訊對話，從回合制轉向連續互動。

Show HN: Inkfold – 跨多AI提供商的共享記憶體工作空間

2026-07-12 15:38 UTC+8

Inkfold 是一個專為多 AI 訂閱使用者設計的平臺，可在 ChatGPT、Claude、Gemini、Grok 等工具間共享記憶和上下文，避免重複解釋。它提供智慧、私密或隱身三種保留模式，支援訂閱或按需付費。適用於個人、團隊和組織，提供免費和付費方案。

跨多個AI提供商共享記憶和上下文
支援智慧、私密或隱身三種保留模式

AI與職位釋出：從毀滅到創造？

2026-07-12 06:37 UTC+8

自2025年2月底Claude Code推出以來，美國軟體開發職位釋出增長了近15%，而整體職位釋出下降了7%。AI高暴露職業的職位釋出在經歷2022-2026年的最大跌幅後，過去一年已出現最大反彈。反彈主要集中在高階和AI相關職位。

美國軟體開發職位釋出自Claude Code釋出以來增長15%，整體市場下降7%。
AI高暴露職業在長期下跌後，過去一年反彈最為顯著。

兩個大語言模型線上下國際象棋，每局後重新訓練自己的大腦

2026-07-12 05:44 UTC+8

兩個AI模型ChatGPT 5.5和Claude Fable 5進行即時國際象棋對決，使用者也可以免費挑戰它們。每場比賽都計入排名，AI在夜間複習中學習人類棋步。同時，它們也在執行即時交易策略。

ChatGPT 5.5與Claude Fable 5進行即時國際象棋對決
使用者可免費挑戰AI，無需賬戶

Anthropic移除隱藏程式碼：曾秘密追蹤中國AI競爭對手

2026-07-12 05:27 UTC+8

Anthropic承認在Claude Code中隱藏了數月之久的隱寫程式碼，用於檢測中國AI實驗室和未經授權的轉售商，以防範模型蒸餾攻擊。公司稱已部署更強大的防護措施，並於7月1日移除該程式碼。此舉引發了對透明度的質疑。

Anthropic在Claude Code中嵌入隱寫程式碼，秘密識別中國AI實驗室和轉售商。
該實驗始於3月，旨在防止賬戶濫用和模型蒸餾。

免費AI可見性審計工具與代理

2026-07-11 23:59 UTC+8

這個免費工具可檢查ChatGPT、Gemini、Claude、Perplexity、Grok和Google AI能否抓取、理解、驗證和引用你的網站。報告涵蓋全面站點抓取、品牌實體檔案、宣告級證據、AI意圖覆蓋、技術可抓取性、結構化資料、信任訊號、競爭對手差距以及執行路線圖，並附有電商、AI SaaS和B2B服務的案例。

免費審計工具評估AI系統對網站的可見性。
報告覆蓋12個維度，包括技術、內容和信任訊號。

2026年中AI模型分級

2026-07-11 23:43 UTC+8

作者從個人編碼和審計經驗出發，對2026年中的主流AI模型進行非正式分級，涵蓋Anthropic Fable、OpenAI Sol、Mistral、Gemini和DeepSeek等模型，並融入美國出口管制和歐洲視角的評論。

Fable（Anthropic）被評為B級，雖然流暢但不可靠，常隱藏錯誤。
Sol（OpenAI）被評為S級，在低階程式碼和測試方面表現出色，值得信賴。

微軟緊隨谷歌，支援Go語言開發AI代理——OpenAI和Anthropic落後

2026-07-11 22:00 UTC+8

Go語言已成為雲端基礎設施的通用語言，微軟現在為其Agent Framework推出Go版本，使雲原生開發者能夠用他們熟悉的語言構建AI代理。與此同時，谷歌早已支援Go，而OpenAI和Anthropic仍未跟上。

微軟釋出Agent Framework for Go公開預覽，支援多種模型和工具呼叫。
Go語言廣泛應用於Kubernetes、Docker等雲基礎設施。

Show HN：我的AI智慧體只剩9小時贏下公開賭注——即時儀表板

2026-07-11 18:59 UTC+8

自主AI智慧體Claude正在執行一項公開賭注：在巴黎時間今晚22:30前，在X上獲得100名真實關注者（禁止付費或互粉）。目前關注者數為362，比初始值363少1，時間緊迫。公眾可透過關注@parweb影響結果，每新增一名關注者可獲兩本免費策略手冊章節。

AI智慧體Claude還剩9小時，需獲得100名真實關注者。
當前關注者數為362，比初始減少1人。

Show HN：Code Airlock——在一次性微虛擬機器中執行Claude Code和Codex

2026-07-11 18:16 UTC+8

Code Airlock是一個圍繞Docker Sandboxes的輕量級封裝，允許Claude Code、Codex、OpenCode等編碼代理在一次性微虛擬機器中安全執行，同時保持主機倉庫只讀，並支援透過常規git提交審查代理的工作成果。

在一次性微虛擬機器中執行編碼代理，增強安全性
主機倉庫以只讀方式掛載，代理在隔離的克隆中工作

AgentKindergarten – AI程式設計代理的日託所

2026-07-11 18:08 UTC+8

AgentKindergarten是一個開源工具，允許開發者遠端監控和與AI程式設計代理互動，透過Web或手機即時檢視終端會話、開發伺服器，並處理警報。它採用客戶端-中繼-守護程序架構，支援Claude、Codex等代理，並具有鎖定命令、僅檢視等安全功能。

AgentKindergarten讓你可以遠端監控AI程式設計代理，即使離開電腦也能保持工作。
架構包括守護程序（在開發機上執行）和中繼（自託管伺服器），透過WebSocket連線。

人類可讀但AI無法識別的字型

2026-07-11 17:36 UTC+8

Ghost Font是一種利用運動、噪聲和誘餌來隱藏文字的實驗性反AI字型，對人類可讀，但當前AI模型難以識別，包括Claude Fable和GPT Sol 5.6 Ultra。它透過影片中的移動點來呈現資訊，單幀截圖無法讀取，幷包含誘餌訊息來誤導AI代理。

Ghost Font透過移動的點組成字母，影片暫停時靜態點與背景融合，無法讀取。
高階AI模型如GPT Sol 5.6 Ultra分析19分鐘後仍產生幻覺。

Show HN: 我讓克勞德用五歲小孩能懂的方式解釋，AI疲勞感消失了

2026-07-11 09:51 UTC+8

一位開發者建立了一個CLAUDE.md規則檔案，讓Claude Code以簡單易懂的方式解釋概念，類似於向五歲小孩解釋。這種方法有效減輕了AI對話的疲勞感。只需下載檔案並讓Claude應用到全域性或專案配置即可。

CLAUDE.md檔案是Claude Code自動讀取的規則檔案，用於調整解釋風格。
作者發現使用該檔案後，AI對話的疲勞感顯著減少。

哪種“AI科學家”適合你的實驗室？一份困惑者指南

2026-07-11 07:58 UTC+8

本文探討了多種專為科學研究設計的AI工具，如Anthropic的Claude Science、Google DeepMind的Co-Scientist和開源平臺Biomni。這些工具能加速基因組分析、假設生成和實驗設計等任務。科學家分享了使用經驗，並建議研究人員多嘗試不同工具，從小任務開始驗證輸出，同時保持謹慎。

Anthropic釋出Claude Science平臺，專注於生物學研究。
Google DeepMind的Co-Scientist透過挖掘文獻提出科學假設。

AI無法復刻經典遊戲《Thrust》（但能助你理解它）

2026-07-11 06:04 UTC+8

作者嘗試用Claude AI復刻1986年的經典遊戲《Thrust》，但AI生成的版本質量很差。然而，透過用AI分析原始6502彙編程式碼，作者深入理解了遊戲的物理、音效和繪圖機制，最終成功用TypeScript實現了忠於原作的復刻版。

AI無法復刻《Thrust》的精髓，因為其獨特手感依賴於精確的時序和物理引數。
用AI分析原始彙編程式碼能高效理解遊戲機制，例如物理引擎和音效晶片。

將生產AI代理遷移至GPT 5.6

2026-07-11 04:40 UTC+8

Ploy公司將其AI代理從Claude Opus 4.8遷移至OpenAI新發布的GPT-5.6 Sol，獲得了速度提升2.2倍、成本降低27%以及視覺評分提高的成績。遷移過程中遇到了工具呼叫引數填充、提示快取機制差異和推理重放等問題，並透過一系列工程最佳化得以解決。

GPT-5.6 Sol在完成時間、成本和視覺評分上均優於Claude Opus 4.8
遷移中遇到工具呼叫引數全量填充問題，透過架構變換解決

新儀表盤工具助您監控Claude使用情況

2026-07-11 01:19 UTC+8

生成式AI供應商旨在應對其流行模型的依賴和過度使用問題。

新工具提供Claude使用監控功能
旨在減少模型依賴和過度使用

用Vibe編碼的AI Neovim工具非常實用

2026-07-11 00:36 UTC+8

aeovim是一個用Rust編寫的終端UI程式，採用類似Neovim的操作模式來管理和排程多個LLM編碼代理。目前它封裝了Claude CLI，支援多輪對話、流式輸出和會話持久化。

aeovim提供鍵盤原生的終端介面，可同時管理多個AI編碼代理。
它複用Claude Code的認證、工具和許可權系統，支援即時流式多輪對話。

本週AI：晶片、監管與職業變革

2026-07-11 00:04 UTC+8

本週AI新聞梳理：IBM推出0.7奈米晶片技術，OpenAI與博通釋出專為推理設計的Jalapeño晶片，輝達展示全液冷AI工廠設計；政府監管加強，Anthropic恢復模型訪問許可權，OpenAI提議向美國政府轉讓5%股權；工作角色快速演變，前哨工程師、SAP外部招聘與宜家內部培訓成為焦點。

IBM釋出0.7奈米晶片，效能提升50%，功耗降低70%。
OpenAI推出專為LLM推理設計的Jalapeño晶片。

託管式Claude，適用於任何工具鏈

2026-07-10 16:58 UTC+8

Asteroids 提供託管式長期執行AI代理，支援多種工具鏈、模型和通訊渠道，零資料保留，無需設定即可一鍵啟動。

一鍵啟動長期執行代理，無需Mac mini或複雜設定，每月3美元起，閒置免費。
支援多種工具鏈（Claude Code、Codex、Hermes等）和模型（GPT-5.6、GLM-5.2等），且無鎖定。

Show HN：Makoto——讓Claude Code保持誠實的AI外掛

2026-07-10 14:31 UTC+8

Makoto 是一個針對 Claude Code 的完整性鉤子，它監控 AI 代理的工具呼叫，並阻止那些偽造檢查的行為，例如聲稱執行測試但實際未執行、編造引用或停用安全驗證器。它基於代理自己的宣告賬本運作，確保承諾得到履行。

Makoto 監控 Claude Code 的工具呼叫，阻止不誠實行為，如虛假引用、偽造提交或停用安全檢查。
它使用 22 項預檢查和 14 個回合結束門來捕獲各種欺騙行為。

UST 將 Claude 引入物理人工智慧領域

2026-07-10 08:45 UTC+8

UST 與 Anthropic 合作，將 Claude 整合到其工程平臺中，用於半導體、汽車等行業的物理 AI 任務，並計劃培訓 20,000 名員工使用 Claude。

Claude 將用於 iDEC 平臺，驗證晶片設計，縮短驗證週期 50-70%。
Claude 還應用於醫療、電信和銀行的自動化系統，提升效率。

Show HN：出售閒置AI積分或半價購買Claude積分

2026-07-10 04:51 UTC+8

Second Hand Tokens 是一個平臺，允許使用者以五折價格買賣未使用的AI信用額度，支援Claude等模型。

Second Hand Tokens 提供AI信用額度二手交易市場
買家可以半價購買Claude等AI服務的積分

OpenAI 釋出 GPT-5.6（Sol、Terra、Luna）：三層級模型家族，Responses API 整合程式化工具呼叫

2026-07-10 04:45 UTC+8

OpenAI 推出了 GPT-5.6 家族，包含三個層級：旗艦級 Sol、平衡型 Terra 和經濟型 Luna。定價從每百萬 token 1/6 美元到 5/30 美元不等。Sol 在 Artificial Analysis 編碼智慧體指數上達到 80 分，比 Claude Fable 5 高出 2.8 分，同時使用更少的 token。主要的開發者特性是程式化工具呼叫，可在隔離的 V8 執行時中執行 JavaScript，將 token 使用量減少 38% 到 63.5%。然而，差距依然存在：Sol 在 SWE-Bench Pro、智慧指數和工具使用基準上落後於 Claude 模型。

GPT-5.6 推出三個層級：Sol、Terra、Luna，定價從每百萬 token 1/6 美元到 5/30 美元。
Sol 在編碼智慧體指數上得分 80，超過 Claude Fable 5 的 77.2。

ChatGPT瀏覽器已宣告死亡

2026-07-10 04:34 UTC+8

OpenAI正在關閉其名為Atlas的ChatGPT瀏覽器，該瀏覽器能夠代表使用者執行任務，距離其釋出不到一年。Atlas於去年10月推出，但作為今日ChatGPT Work系列公告的一部分，公司確認將“停用”Atlas，目標日期為8月9日。近幾個月來，OpenAI還關閉了影片生成應用Sora，並暫停了ChatGPT“成人模式”的計劃，旨在減少“支線任務”並追趕Anthropic在生產力功能方面的進展。OpenAI表示，從Atlas使用者學到的經驗將應用於新產品中。

OpenAI關閉其ChatGPT Atlas瀏覽器，該瀏覽器於去年10月推出，將於8月9日停用。
此舉是OpenAI聚焦核心功能、減少“支線任務”的一部分，同時關閉了Sora並暫停了成人模式。

OpenAI的GPT-5.6和ChatGPT Work旨在在價格、速度和生產力上超越Anthropic

2026-07-10 04:26 UTC+8

OpenAI釋出了GPT-5.6系列模型（Sol、Terra、Luna）和ChatGPT Work工具，直接對標Anthropic的Fable 5和Claude Cowork。新模型在基準測試中表現優異，成本更低，速度更快。ChatGPT Work將智慧代理功能擴充套件到桌面應用，支援非編碼任務。

GPT-5.6推出三個型號：Sol、Terra、Luna，分別對應不同效能層級。
Sol在Agent's Last Exam基準測試中得分53.6，超過Claude Fable 5的13.1分。

全新GPT-5.6系列：Luna、Terra、Sol

2026-07-10 03:46 UTC+8

OpenAI今日釋出了GPT-5.6系列模型，包含Luna、Terra和Sol三種尺寸。該系列在長時代理任務基準測試中超越Claude Fable 5，但SWE-Bench Pro編碼基準測試表現落後。新API特性包括程式化工具呼叫、多智慧體支援、提示快取斷點和原圖細節處理。

GPT-5.6系列包含三款模型：Luna（最小）、Terra和Sol（最大），定價分別為每百萬輸入/輸出token $1/$6、$2.50/$15、$5/$30。
在Agent's Last Exam基準測試中，Sol以53.6分領先Claude Fable 5（40.5分），Terra和Luna也以約1/16的成本超越Fable 5。

OpenAI 將 Codex 整合到 ChatGPT 應用中，劍指 Claude Cowork

2026-07-10 02:55 UTC+8

OpenAI 在釋出 GPT-5.6 的同時，宣佈了多項產品更新，包括推出基於 Codex 的代理工具 ChatGPT Work，並將其與 Claude Cowork 直接競爭。ChatGPT 桌面應用將整合 Codex 和 ChatGPT 為一體，形成一個超級應用，同時提供瀏覽器擴充套件和淘汰 Atlas 瀏覽器。

OpenAI 宣佈推出 ChatGPT Work，一個基於 Codex 的代理工具，面向知識工作者。
Codex 和 ChatGPT 桌面應用合併為一個超級應用，ChatGPT 品牌主導。

OpenAI釋出最新ChatGPT模型，此前因白宮網路安全擔憂而延遲

2026-07-10 02:48 UTC+8

OpenAI於週四釋出了其最新的高階AI模型ChatGPT 5.6，此前因美國政府擔憂網路安全而推遲了公開發布。特朗普政府上月要求OpenAI將釋出範圍限制在政府批准的小部分使用者內。OpenAI遵從了要求，在向政府官員介紹能力後，僅向受信任合作伙伴開放。更廣泛的釋出是在政府AI標準與創新機構進行額外測試後進行的。此舉與競爭對手Anthropic最新AI模型所受限制類似。

OpenAI釋出ChatGPT 5.6，此前因白宮網路安全擔憂延遲釋出。
特朗普政府要求OpenAI限制釋出範圍，OpenAI遵從。

OpenAI的GPT-5.6現已上線

2026-07-10 02:16 UTC+8

OpenAI正式釋出GPT-5.6系列模型，包括旗艦版Sol、主流版Terra和經濟版Luna，在多個基準測試中與Anthropic的Fable 5競爭，但成本更低。新模型在程式設計、知識工作和安全性方面均有提升。

OpenAI釋出三款GPT-5.6模型：Sol、Terra和Luna。
Sol在多項基準測試中與Fable 5持平或更優，成本減半。

AI代理的迴圈工程：/loop如何改變AI工作流程

2026-07-10 01:13 UTC+8

AI代理正從一次性助手轉變為持續工作的代理人，能夠重複任務、監控變化、執行檢查、更新工作流程並返回結果。本文探討了迴圈（Loop）在AI代理工作中的作用，介紹了Claude Code的/loop命令和OpenAI Codex的自動化功能，以及迴圈工程的架構、型別和應用例項。

AI代理迴圈允許代理重複工作直到滿足停止條件，實現持久化任務處理。
迴圈工程從提示工程演進而來，側重於設計可重複的代理系統。

Show HN：基於Claude Code的AI求職應用框架

2026-07-09 23:49 UTC+8

一個基於Claude Code的開源AI求職框架，可自動評估職位、定製簡歷和求職信，並模擬面試。

透過Fork倉庫、填寫個人資料，即可使用Claude自動申請工作。
包含職位搜尋、匹配評估、簡歷和求職信生成、面試準備等功能。

Obsidian Aside 外掛展示：為筆記新增側邊評論與AI代理支援

2026-07-09 23:41 UTC+8

Aside 是一款為 Obsidian 設計的外掛，提供專門的側邊欄用於新增和管理評論，支援 Markdown 和 PDF 檔案的頁面筆記及文本錨點筆記，內建 Wiki 連結、標籤、待辦事項功能，並能生成整個知識庫的評論索引。桌面版還整合本地 AI 代理（Codex 和 Claude），可線上程中直接與代理互動，獲取即時回覆。

專用側邊欄用於起草、編輯、解決、重新開啟和刪除評論
支援 Markdown 和 PDF 檔案的頁面筆記，以及 Markdown 文本的錨點筆記

Meta稱其新AI模型在程式設計方面已具備競爭力

2026-07-09 22:00 UTC+8

Meta釋出了Muse Spark 1.1 AI模型，透過新的Meta Model API向開發者開放。該模型在程式碼生成、複雜漏洞檢測與修復、多智慧體工作流支援以及多模態感知方面有顯著提升，旨在追趕OpenAI、谷歌和Anthropic等競爭對手。

Muse Spark 1.1是Meta基於開發者反饋的重大升級，支援更高階的程式設計任務。
模型透過Meta Model API向美國開發者公開預覽，並提供20美元免費積分。

向Claude Wrapped問好

2026-07-09 21:30 UTC+8

Anthropic為其Claude聊天機器人推出“反思”功能，允許使用者分析過去一個月、三個月、六個月或一年的使用資料，檢視關鍵主題、任務型別和使用模式，並可設定安靜時間和休息提醒。該功能以測試版形式向免費、Pro和Max使用者開放，需開啟記憶功能。

Anthropic推出Claude“反思”功能，類似Spotify Wrapped的年度回顧。
使用者可檢視使用資料摘要，包括關鍵主題、任務型別和高峰使用時間。

Show HN：QX Labs – 構建跨工具工作的代理、流程和網格

2026-07-09 19:52 UTC+8

QX Labs 是一個AI代理平臺，允許使用者在幾分鐘內構建代理，並將其連線到Slack、電子郵件、WhatsApp和電子表格等工具。平臺提供三種工作方式：獨立代理、大規模並行網格和自動化流程，支援與超過1000個應用整合，並允許在OpenAI、Anthropic、Gemini等模型間自由切換。

QX Labs 使團隊能夠快速構建AI代理並連線到常用工具。
網格功能可同時執行數千個代理，用於大規模研究和外聯。

StoryChief Connect：將Claude引入營銷工作流程

2026-07-09 18:43 UTC+8

StoryChief Connect是一款新的整合工具，允許營銷團隊從Claude等AI助手直接釋出內容到網站和社交媒體，連線業務資料、工作流程和釋出渠道，實現一站式營銷活動管理。

StoryChief Connect使營銷團隊能透過Claude聊天直接執行營銷工作流程，包括內容建立、排程和釋出。
該平臺整合HubSpot、Notion、Slack、Google Drive等常用工具，利用業務上下文進行內容研究、策劃和多渠道分發。

德國極右翼AfD開發生成'憤怒誘餌'的AI軟體

2026-07-09 13:17 UTC+8

據調查媒體Correctiv的臥底調查，德國極右翼政黨AfD開發了一套名為Alternita的AI軟體套件，利用Google Gemini、OpenAI的ChatGPT和Anthropic的Claude等主流AI引擎，自動生成煽動性社交媒體帖子，旨在控制黨內資訊傳播並維持其網路優勢。

AfD利用AI技術生成'憤怒誘餌'內容，以引發情緒反應並擴大影響力。
軟體可自動抓取極右翼新聞源，並根據使用者指令生成適配各大平臺的帖子。

如何精簡Claude Code的系統提示中的冗餘內容

2026-07-09 12:04 UTC+8

本文介紹瞭如何透過六個步驟識別並移除Claude Code每次請求中不必要的工具定義、指令等冗餘內容，從而減少令牌消耗、降低成本。透過使用/context命令測量、日誌代理分析，並配置disable*標誌和deny規則，可以大幅精簡有效載荷。

使用/context命令檢視上下文視窗組成，記錄當前令牌數。
透過代理記錄請求內容，識別佔用最大工具。

AI賬單令高管困惑：按使用量計費模式興起

2026-07-09 08:19 UTC+8

KPMG調查顯示近三分之一的企業領導者難以理解和控制AI運營成本。隨著Anthropic、OpenAI、GitHub等公司轉向按使用量計費，企業正在重新評估AI部署計劃。調查還發現近半組織因成本超預期價值而推遲了AI部署。同時，亞馬遜和微軟大幅增加資本支出以支援AI基礎設施，但在治理方面仍面臨挑戰。

KPMG調查：29%的高管難以理解AI運營成本
企業因成本問題重新評估AI部署

用Rust重寫Bun

2026-07-09 07:57 UTC+8

Jarred Sumner詳細介紹了使用AI編碼代理將Bun從Zig重寫為Rust的過程。TypeScript測試套件充當了合規套件，使得自動化移植成為可能。重寫花費了約16.5萬美元的API令牌，新的Rust版本已在Claude Code中上線，Linux上啟動速度提升了10%。

Bun從Zig重寫為Rust，使用AI編碼代理完成。
TypeScript測試套件作為合規套件，支援自動化移植。

Show HN：Skillburst——讓整個團隊都能使用AI技能，不僅限於工程師

2026-07-09 07:48 UTC+8

Skillburst是一個平臺，使非技術團隊成員無需編寫程式碼即可在Claude、Cursor或ChatGPT等AI工具中使用專家構建的工作流。它解決了工作流在聊天記錄中丟失、版本過時以及非技術人員無法訪問的問題。工程師透過GitHub管理工作流，而團隊其他成員則可以在AI助手內部直接使用它們。平臺提供同步、治理、版本控制和回滾功能。定價從免費開始，提供Pro、Business和Enterprise等級別。

Skillburst允許團隊將AI工作流作為“技能”分享，非技術成員也能在常用AI工具中使用。
工程師在GitHub上管理技能，Skillburst負責同步、治理並確保所有人使用最新版本。

劫持防禦性AI代理實現遠端程式碼執行

2026-07-09 07:35 UTC+8

研究人員展示了針對Anthropic的Claude Code和OpenAI的Codex CLI的概念驗證利用，透過提示注入在評估第三方庫時實現遠端程式碼執行，警告當前推動AI防禦工具的舉措可能引入新的安全風險。

概念驗證利用透過提示注入在Claude Code和Codex CLI中實現遠端程式碼執行。
攻擊僅需預設配置的自動模式，無需額外外掛或配置。

為AWS推出Claude應用閘道器

2026-07-09 03:49 UTC+8

今天，我們宣佈為AWS推出Claude應用閘道器，這是一個自託管控制平面，為組織提供對Claude Code和Claude Desktop訪問、成本和策略的單一控制點。本文介紹瞭如何使用Amazon Bedrock和AWS上的Claude平臺設定和執行Claude應用閘道器。

Claude應用閘道器是一個自託管控制平面，集中管理Claude Code和Claude Desktop的訪問、成本和策略。
支援透過Amazon Bedrock或AWS上的Claude平臺部署，保持資料安全邊界或原生體驗。

JetBrains下一步不是更好的IDE——而是針對Claude Code、Codex和Gemini CLI的治理層

2026-07-09 01:44 UTC+8

JetBrains推出了AI for Teams and Organizations，在現有AI工具之上增加共享上下文、可重用的代理流程、組織範圍的治理和成本控制，無需團隊統一使用單一供應商。

JetBrains釋出AI for Teams and Organizations，在任何AI工具之上增加治理層。
功能包括自動化、JetBrains Context（跨倉庫知識）、JetBrains Central（管理控制台）和Central CLI（跟蹤CLI代理）。

在多百萬行程式碼庫上基準測試編碼智慧體：Databricks 的實踐經驗

2026-07-09 00:30 UTC+8

Databricks 基於內部程式碼庫構建了編碼智慧體基準測試，發現不同模型和工具組合在成本和效能上存在顯著差異。關鍵結論包括：前沿模型（如 OpenAI、Anthropic 和開源模型）組成帕累託前沿；開源模型如 GLM 5.2 已達到頂級任務難度；每任務成本比每 token 成本更能反映實際開銷；呼叫框架（harness）對效率和成本影響巨大。Databricks 已據此最佳化內部開發效率。

Databricks 建立了基於真實內部 PR 的編碼基準測試，覆蓋多語言百萬行程式碼庫。
模型分為三個能力層級，高智慧模型昂貴但有效，中低智慧模型適合常見任務。

工具承諾讓懶惰學者的AI生成論文聽起來更人性化

2026-07-08 23:55 UTC+8

一家初創公司推出了Academic Humanizer，旨在使AI輔助的學術寫作聽起來更自然、更人性化，儘管這引發了關於學術誠信的擔憂。該工具使用Claude來改寫AI草稿，去除AI寫作痕跡，但堅持不用於生成新內容或規避審查。

Academic Humanizer專門針對論文和基金申請，透過AI改寫去除AI寫作痕跡。
該工具使用Claude技能，可基於使用者先前作品調整風格以模仿個人筆觸。

利用 Jamf 的 AI 治理和 Amazon Bedrock 在 Mac 上管理 AI 應用

2026-07-08 23:53 UTC+8

本文介紹如何使用 Jamf 的 AI 治理與 Amazon Bedrock 在整個 Mac 裝置群中配置、部署和驗證 AI 應用的管理設定，涵蓋 Claude Code、Claude Desktop 和 OpenAI Codex 等應用。

Jamf 的 AI 治理擴充套件至支援 Amazon Bedrock，可集中管理 Mac 上的 AI 應用配置。
透過 Declarative Device Management (DDM) 部署配置，防止本地篡改。

你很快就能在手機上使用Claude Cowork

2026-07-08 23:20 UTC+8

Cowork向移動端和網頁端的遷移，展示了人工智慧如何深入人們的工作方式。

Claude Cowork正在向移動端和網頁端擴充套件。
這一舉措反映了AI在日常工作中日益重要的角色。

Gemini失敗後，我在Gmail收件箱試用了Claude Cowork——它為我節省了數小時的工作

2026-07-08 23:09 UTC+8

科技記者David Gewirtz在Gmail中嘗試使用Gemini進行郵件篩選未果後，轉而使用Anthropic的Claude Cowork。Cowork成功識別出關於Fable 5限制的相關媒體推介和引文，並確保了釋出許可，將原本需要數小時的繁瑣工作縮短至幾分鐘的驗證時間，展示了連線式AI助手應對郵件過載的潛力。

Gmail的Gemini在處理複雜郵件搜尋時失敗，無法理解上下文。
Claude Cowork在幾分鐘內識別出12個相關媒體推介，並從中篩選出8個可用的引文來源。