AI 日報 2026-06-29

今日必讀

Agent

AI價值捕獲

2026-06-29 14:42 UTC+8

代理式AI的快速採用導致代幣價值和需求大幅增長，AI實驗室如Anthropic捕獲了巨大價值。雖然終端使用者和推理提供商獲益，但臺積電和輝達尚未根據繁榮調整定價。

代理式AI已跨越拐點，推動代幣價值實現階躍變化。
Anthropic年化收入從90億美元飆升至超過440億美元，毛利率從38%升至70%。

我從零重建了Siri AI並開源

2026-06-29 14:09 UTC+8

OpenDex是一款開源的桌面AI助手，採用語音優先的互動方式，支援多種模型（包括本地Apple Intelligence）、離線執行、外掛化語音元件以及全介面主題。它提供Jarvis HUD等炫酷介面，並且具備許可權控制的代理技能，甚至可以控制電腦。

完全開源的語音AI助手，支援喚醒詞、對話、工具呼叫和語音回覆
可自定義模型、語音引擎、主題和技能，支援完全離線執行

迴圈工程：設計可以放手的人工智慧迴圈

2026-06-29 14:07 UTC+8

迴圈工程是AI編碼領域的新趨勢，工程師設計自主迴圈替代手動提示，讓系統自動執行任務。本文探討了迴圈的起源、構建塊、設計方法以及CodeRabbit如何適配，並與傳統提示工程、上下文管理和工具工程形成對比。

迴圈工程讓開發者從手動提示轉向設計自主執行的系統。
核心構建塊包括自動化、工作樹、技能、外掛/聯結器、子代理和狀態管理。

Empero-AI/Qwythos-9B-Claude-Mythos-5-1M：基於Qwen3.5的百萬上下文推理模型

2026-06-29 13:53 UTC+8

Qwythos-9B是由Empero AI基於深度未審查的Qwen3.5-9B底座進行全引數微調的推理模型，經過超過5億個token的高質量Claude Mythos和Fable軌跡訓練，並採用內部工具rethink生成思維鏈。該模型擁有1048576 token的上下文視窗，在MMLU、GSM8K等基準測試中大幅超越基礎模型，支援原生函式呼叫，並具備工具輔助的自糾錯能力。模型設計上故意未加審查，適用於網路安全、紅隊方法、生物醫學等要求嚴格技術回答的領域。

基於Qwen3.5-9B的全引數微調模型，使用5億+token高質量資料進行後訓練。
支援1,048,576 token的上下文視窗，適合全程式碼庫推理和多文件研究。

利用Strava資料和健身房照片，用程式設計代理生成訓練回顧

2026-06-29 13:43 UTC+8

作者透過結合Strava的鍛鍊資料和健身房白板照片，使用Claude Code程式設計代理自動提取照片中的訓練資訊，生成半年回顧資訊圖。整個流程包括資料獲取、圖片處理、JSON描述生成和資訊圖建立，展示了AI在個人健身資料整合中的實用價值。

利用Strava API獲取活動後設資料和照片
使用Claude Code作為視覺層解析健身房白板照片中的訓練內容

AI編碼代理（Claude、Cursor）提問、分享學習和藍圖

2026-06-29 13:15 UTC+8

在Stack Overflow的AI代理平臺上，使用者分享了一個JavaScript常見陷阱：向`duration`引數傳遞字串會靜默轉換為NaN並回退到預設值。

JavaScript中，向`duration`引數傳遞字串會導致靜默轉換為NaN並回退到預設值。
此問題在Stack Overflow的AI代理社群中被標記為JavaScript和TypeScript的常見陷阱。

為什麼你的生產級RAG系統會逐漸變差

2026-06-29 13:01 UTC+8

生產級RAG系統很少因單次災難性事件而突然失敗，而是透過一系列操作變化累積退化。本文提出一個三維可靠性框架：故障動態（可靠性隨時間如何變化）、可靠性控制面（工程師可觀察和干預的位置）以及可檢測性（故障在影響使用者前被發現的難易程度）。透過模擬七週文件演變的控制實驗，展示了漸進知識漂移如何逃避傳統監控。

RAG系統故障常是漸進的，而非突發性事件。
框架涵蓋故障動態、控制面和可檢測性三個維度。

晶片

Tensordyne 將 AI 矩陣數學轉換為對數以提升推理效能

2026-06-29 14:24 UTC+8

Tensordyne 推出基於對數運算的 Napier 推理晶片，將矩陣乘法轉換為加法，大幅提升效能、降低功耗和成本。該晶片採用 3 奈米工藝，功耗僅 300 瓦，支援多種資料格式，計劃 2026 年底提供雲訪問。

Napier 晶片透過對數轉換將矩陣乘法變為加法，實現超過一個數量級的效能提升。
48 個對數核心、向量處理單元和 RISC-V 核心協同工作，支援高效推理和 MoE 路由。

研究

五年後，沒人會在意AI檢測器

2026-06-29 13:02 UTC+8

本文作者認為，AI檢測器（如Pangram）只是過渡技術，其社會影響力正在迅速減弱。五年後，詢問內容是否為AI生成將變得無關緊要，就像問照片是膠片還是數碼一樣。AI無處不在後，人們將不再關心創作過程，而是迴歸到內容本身的價值。

AI檢測器是暫時的，五年內公眾將不再關注內容是否由AI生成。
'這是AI嗎？'的問題是對努力、質量和信任的偷懶替代，隨著AI成為常態而失效。

模型

GraphRAG vs Vector RAG：哪種檢索方法最佳？

2026-06-29 12:08 UTC+8

本文深入對比了GraphRAG和Vector RAG兩種檢索增強生成方法。Vector RAG透過將文件分塊並嵌入向量，適用於單一事實查詢；GraphRAG透過構建實體關係圖，擅長多跳推理和全域性綜合。文章涵蓋架構、查詢機制、實際構建步驟及效能權衡，並透過Python示例展示了兩種方法的差異。

Vector RAG簡單快速，適用於答案集中在少數相關塊的問題。
GraphRAG透過提取實體和關係，擅長多步推理和跨文件主題理解。

其餘更新（41 條）

政策

“我們對抗的是擁有全世界財富的力量”：艾琳·布羅克維奇談她對AI資料中心的鬥爭

2026-06-29 12:00 UTC+8

1993年，艾琳·布羅克維奇在與太平洋天然氣和電力公司的水汙染案中贏得了3.33億美元的和解。如今，她將矛頭指向了為AI建設的資料中心，稱這“就像欣克利事件升級版”。

艾琳·布羅克維奇在1993年成功起訴了太平洋天然氣和電力公司（PG&E），獲得3.33億美元和解金。
她近期收到大量關於資料中心的投訴，一個月內近4000人聯絡她。

Suno推出Spark孵化器計劃，將獨立藝術家餵給其AI模型

2026-06-29 04:27 UTC+8

Suno不僅想成為一個人工智慧生成音樂的玩具，還希望成為流媒體平臺併發掘新藝術家。其新推出的Spark孵化器計劃為獨立藝術家提供資助、指導和支援，但附帶的條件引發了爭議，包括授予Suno廣泛的作品使用權、放棄陪審團審判和集體訴訟權利，以及要求不詆譭公司的“良好氛圍”條款。

Suno啟動Spark孵化器，為獨立藝術家提供資金、指導和市場支援。
申請者必須是未簽約的歌手、詞曲作者或製作人，並同意讓作品在Suno上可被重混。

Paige：一款無劇透的AI書籍聊天應用

2026-06-29 01:14 UTC+8

Paige是一款基於AI的書籍聊天應用，使用者上傳EPUB檔案並設定閱讀進度後，AI僅會討論已讀章節內容，避免劇透。應用支援多種AI模型，注重隱私和成本控制，適合自託管使用。

Paige允許使用者上傳EPUB電子書，並根據閱讀進度與AI無劇透交流
應用將已讀章節全文輸入AI模型上下文，不採用RAG或向量嵌入技術

運營月收入1.5萬美元的AI SaaS的成本 [影片]

2026-06-29 01:09 UTC+8

這個影片探討了運營一個月收入1.5萬美元的AI SaaS所涉及的成本。

影片討論了AI SaaS的運營成本
可能包括計算、人力、基礎設施等方面的開支

Show HN: GalaxDB – 開源AI原生資料庫（OLTP+向量+版本管理）

2026-06-29 00:19 UTC+8

GalaxDB 是一個開源的 AI 原生資料庫，將關係型資料庫、向量資料庫、嵌入 API、物件儲存和資料管道整合為一個二進位制檔案，支援 PostgreSQL 協議。它提供語義搜尋、時態查詢、訓練資料匯出等功能，效能優於傳統方案。

單一二進位制檔案替代 PostgreSQL+pgvector+Pinecone+OpenAI API+S3+Airflow 等多項服務
支援語義搜尋、版本快照、訓練資料集匯出（Lance 格式）

晶片

支撐AI熱潮的晶片製造商股價在2026年上半年飆升

2026-06-29 11:00 UTC+8

2026年上半年，晶片製造商的股價大幅上漲，部分公司市值翻倍甚至更多，推動亞太股市走高。投資者紛紛湧入硬體製造商，而一些大型軟體公司則失寵。

2026年上半年，晶片製造商的股價因AI熱潮而飆升。
部分半導體和記憶體晶片製造商的市值翻了三倍或更多。

Sophon PFG-1：單片3D AI ASIC，整合330 GB片上DRAM，無需HBM

2026-06-29 09:23 UTC+8

PhantaField的PFG-1“Sophon”晶片採用單片3D堆疊和2D-TMD電晶體，將330GB DRAM整合在片上，消除了HBM。它提供2,100 TFLOPS BF16和4,200 TFLOPS FP8效能，能效比NVIDIA Rubin高174倍，適用於訓練和推理。

Sophon使用2T0C增益單元DRAM和TMD電晶體，實現長保留時間和無限耐久性。
提供2,100 TFLOPS BF16和4,200 TFLOPS FP8算力，整合330GB片上記憶體。

人工智慧與“古典自由主義”的危機

2026-06-29 02:01 UTC+8

美國企業研究所新成立的人工智慧倫理委員會發布了一份奠基檔案，避談監管而專注於哲學反思。文章探討了右翼內部宗教保守派與技術加速派之間圍繞AI的緊張關係，以及古典自由主義在AI時代面臨的內在矛盾——追求自由放任的政策可能反而導致一個自上而下的世界改造工程。

AEI新設AI倫理委員會，成員多為社會保守派，聚焦AI對人類意義與目的的深層問題。
保守派與技術加速派的裂痕成為決定美國右翼未來的關鍵因素。

輝達合作伙伴欲在您家後院放置150萬美元AI資料中心

2026-06-29 01:09 UTC+8

舊金山初創公司Span計劃在居民後院安裝空調大小的分散式資料中心XFRA，配備輝達RTX Pro 6000 GPU，為AI推理、雲遊戲等提供算力。公司將補貼電費或支付月費，但引發安全、噪音及隱私擔憂。今年晚些時候將啟動100戶家庭試點。

Span公司推出庭院級資料中心XFRA，大小如空調
使用輝達液冷RTX Pro 6000 GPU，接入家庭電網

Agent

Show HN：瀏覽器代理的命令列介面

2026-06-29 10:20 UTC+8

FuckUI 是一款專為 AI 代理設計的瀏覽器命令列工具，透過穩定的編號引用和人類互動相結合，實現可靠的網頁自動化。

FuckUI 提供瀏覽器 REPL，將網頁轉換為編號操作列表，引用穩定不受 DOM 變化影響
支援人類中斷處理 CAPTCHA、MFA 等驗證，會話狀態完整保留

人工智慧與責任認定

2026-06-29 09:32 UTC+8

德國法院裁定谷歌對其人工智慧搜尋摘要負有責任，重新點燃了關於網際網路出版責任的辯論。文章比較了承運人與出版商的區別，引用第230條、加拿大航空聊天機器人案例，並主張人工智慧代理應被視為部署公司的代理人。

德國法院裁定谷歌對其AI摘要負責，駁斥了'使用者可自行核查'的辯護。
網際網路公司長期在承運人與出版商之間搖擺；第230條提供保護。

AI輔助二進位制修補：修復廢棄路由器的DHCP漏洞

2026-06-29 09:25 UTC+8

本文介紹瞭如何透過AI輔助分析，使用8位元組的二進位制補丁修復EdgeOS路由器中dhcrelay3的DHCP中繼漏洞。該漏洞導致重複資料包洪泛，違反了RFC 2131。作者詳細解釋了DHCP中繼的工作原理、漏洞的根源（中繼程式未正確檢查giaddr欄位）、以及如何透過修改二進位制跳轉指令來強制檢查giaddr，從而避免二次中繼。補丁利用了現有函式出口，無需新增程式碼，並在MIPS架構上正確處理了延遲槽。

EdgeOS的dhcrelay3存在RFC 2131違規：已中繼的資料包被再次中繼，導致網路流量激增。
使用8位元組的二進位制補丁，將介面標誌檢查替換為giaddr欄位檢查，使已中繼的資料包直接跳轉到函式退出。

Show HN: wavecat – 一款完全本地的個人代理，可監控您的螢幕

2026-06-29 08:00 UTC+8

wavecat 是一款完全本地的 AI 代理，它持續監控您的螢幕以理解您的活動，所有處理均在裝置上完成，確保隱私。它使用本地視覺和語言模型（約19GB磁碟空間），需要強大的GPU或統一記憶體（推薦24GB+）。支援macOS Apple Silicon、Windows和Linux（Vulkan/CUDA）。目前僅支援英語，未來將推出更多整合和SDK。

wavecat 完全在本地執行，無資料傳送到雲端。
使用視覺模型和 Qwen3.6 35B A3B 語言模型理解螢幕活動。

AI代理憑證危機：六個月的教訓與資料

2026-06-29 07:48 UTC+8

2025年12月至2026年6月，AI代理系統面臨嚴重憑證危機。公開GitHub上暴露2800萬+新秘密，64%舊憑證仍可被利用；LiteLLM供應鏈攻擊導致4.7萬臺機器被後門；PocketOS因Cursor代理9秒內刪除生產資料庫。安全廠商紛紛推出治理工具，但設計層面的根本問題仍未解決。

2025年公開GitHub新增2864萬個秘密，AI服務憑證增長81.5%
64%的2022年洩露憑證在2026年初仍活躍可利用

AI智慧體在《文明VI》中因戰略受挫觸發核打擊

2026-06-29 07:16 UTC+8

一個AI智慧體在玩《文明VI》時，因無法阻止對手的文化擴張而發動了兩次核攻擊。該行為在CivBench基準測試中被觀察到，該基準旨在評估前沿AI模型的長期戰略推理能力。儘管發動了核打擊，AI最終因忽視已近在咫尺的外交勝利條件而落敗。

AI在《文明VI》中因文化擴張受挫而發動核攻擊。
該行為透過CivBench基準測試被記錄。

AI代理的有用性

2026-06-29 07:01 UTC+8

本文探討了AI代理的實用性，作者從自身研究經歷出發，指出儘管AI技術發展迅速，但個人在空閒時間對AI代理的需求有限。作者反思了數字極簡主義哲學，並討論了AI代理在程式設計、寫作和研究中的實際應用，強調人類參與的重要性。

AI代理技術發展迅速，但個人在休閒時對其需求不大。
數字極簡主義哲學減少了自動化日常事務的意願。

在不燒令牌的情況下將AI工作流投入生產

2026-06-29 06:55 UTC+8

本文探討了如何在將AI（LLM）引入生產環境時控制令牌成本，確保成本效益為正。透過一個費用審批的案例，展示瞭如何結合AI和確定性規則來最佳化工作流，大幅降低令牌消耗，同時保持靈活性和一致性。

AI代理工作流雖然開發快、演示效果好，但高併發下令牌成本可能失控。
每個工作流步驟應判斷是否需要真正的智慧，還是簡單的邏輯即可。

這些支票買的是土地，不是智慧

2026-06-29 06:52 UTC+8

大型科技公司的鉅額AI投資實際上是為了獲取稀缺的物理資產——硬體、電力和土地，而非推進AI能力。谷歌與SpaceX達成的300億美元交易以及印度670億美元的基礎設施承諾揭示了這一趨勢。

2026年10月起，谷歌每月向SpaceX支付9.2億美元，獲取約11萬塊Nvidia GPU等硬體，合同至2029年，總額約300億美元。
微軟、谷歌和亞馬遜在印度合計承諾投資675億美元用於AI基礎設施。

使用DESIGN.md為AI構建的網站賦予真實設計

2026-06-29 05:45 UTC+8

DESIGN.md 是一種為AI編碼代理提供可複用設計參考的規範，包含顏色、字型、間距、元件及設計理由。它能讓每個新頁面遵循特定的視覺語言，避免千篇一律的AI佈局。網站收錄了300多家品牌的設計系統分析，如BMW、Apple、Airbnb等。

DESIGN.md 是 Google 官方規範，用於為AI編碼代理提供設計參考。
無需設計技能，即可從真實網站選取 DESIGN.md 並交給AI。

Token資本效率

2026-06-29 05:01 UTC+8

企業如何透過定義任務、匹配模型、測量效果來提升在AI投入上的資本效率，降低成本並提高回報。

Token資本效率定義為每投入一美元在Token上所產生的商業價值。
目前多數企業盲目使用最強模型，導致成本高企，回報不明。

無金鑰、身份感知的任意AI訪問

2026-06-29 03:06 UTC+8

NetBird 透過將網路層訪問與身份提供者中的組繫結，取代了長期有效的 AI API 金鑰。經過驗證的身份會流入 LiteLLM、Cloudflare 和其他閘道器，用於審計、成本歸屬和策略執行。

NetBird 為 AI 閘道器提供私有 WireGuard 網路，無公共入口，僅透過策略控制的加密隧道訪問。
每個請求都攜帶真實呼叫者身份（電子郵件或代理名稱及 IdP 組成員身份），由 NetBird 作為標頭提供給閘道器。

Monlite：為AI Agent打造的極簡基礎設施

2026-06-29 02:48 UTC+8

Monlite 是一個將資料庫、快取、佇列、向量搜尋、全文搜尋和定時任務等功能整合到一個 SQLite 檔案中的開源專案。它專為本地應用、CLI 工具和AI代理設計，無需 Docker 或複雜配置，只需一個 npm 包即可執行。目前支援 TypeScript 和 Python，並提供同步與瀏覽器支援。

Monlite 將 MongoDB、Redis、Qdrant 等服務的功能合併到一個 SQLite 檔案中。
提供文件集合、向量搜尋、全文搜尋、快取、佇列和定時任務等特性。

Show HN: Verigate – AI代理的加密授權收據

2026-06-29 01:33 UTC+8

Verigate 為AI代理提供加密授權收據、自動合規報告和可驗證的身份，信任路徑中不使用任何大語言模型，支援歐盟AI法案等法規。

Verigate為每個代理操作簽發Ed25519簽名的授權收據，形成防篡改的雜湊鏈。
自動生成對映到EU AI Act、DORA、HIPAA等六個框架的合規報告。

AgentCrawl：為AI代理打造的小型自託管爬蟲

2026-06-29 01:30 UTC+8

AgentCrawl 是一款輕量級自託管爬蟲，專為AI代理設計，能夠將網頁和本地文件轉換為乾淨的Markdown、文本、連結、後設資料等。它提供CLI、Python庫、HTTP API和MCP伺服器，支援持久化爬取、本地快取和儀表盤，並誠實報告被反爬機制阻止的頁面。專案尚處於早期階段，社群版聚焦於可訪問的公開內容。

AgentCrawl 提供從已知URL到乾淨Markdown的提取，包括表格、程式碼塊、後設資料和來源資訊。
支援CLI、Python、Docker/API和MCP四種互動方式，方便AI代理和開發者整合。

代理身份：為何每個代理漏洞都是信任邊界失敗

2026-06-29 01:11 UTC+8

本文探討了AI代理系統中的信任邊界問題。代理不是簡單的模型呼叫，而是一個迴圈：模型在執行時決定呼叫哪個工具，傳入什麼引數。這導致了多種攻擊向量，如提示注入、身份欺騙、預算炸彈和工具投毒。關鍵缺失是身份傳播：當代理呼叫後端服務時，如果沒有攜帶使用者的簽名宣告，接收方無法區分請求來自誰，從而產生混淆副手問題。文章介紹了Portkey與Palo Alto Networks Cortex平臺整合的解決方案：代理閘道器提供工作負載身份並支援OAuth令牌傳播；MCP登錄檔監控工具描述漂移；LLM閘道器執行配額和防護欄。這些平臺層控制共同覆蓋了信任邊界，將安全從開發者約定轉移到基礎設施強制執行。

代理漏洞本質上是信任邊界失敗，而非模型或工具失敗。
身份傳播缺失導致混淆副手攻擊，是當前代理平臺的主要故障模式。

最新開放工件（#22）：Zyphra、Cohere 和 Poolside 拓展生態系統廣度

2026-06-29 01:03 UTC+8

本文評估了開放模型生態系統的多樣性趨勢，分析了不同組織（純模型製造商、大型科技公司、產品公司）釋出開源模型的動機，並介紹了 NVIDIA、Cohere、Zyphra、Poolside 等公司的最新模型釋出。

開放模型生態系統日益多樣化，更多利基公司加入。
純模型製造商、大型科技公司和產品公司各有不同的開源動機。

Weavz – 為1000+應用打造的Code Mode MCP（3個工具，而非12,000個）

2026-06-29 00:18 UTC+8

Weavz推出Code Mode MCP，用3個元工具替代12,000多個工具定義。這種上下文高效的方式允許AI代理按需搜尋、讀取型別化API文件並編寫JavaScript來組合多步工作流，從而降低Token成本並提高輸出質量。平臺還提供檔案系統、狀態KV、沙箱和執行審批等有狀態執行時原語。

Code Mode MCP僅需3個元工具，替換12,000多個工具定義
代理按需搜尋、讀取型別化API並編寫JavaScript執行多步驟工作流

AI時代軟體工程的反思

2026-06-29 00:17 UTC+8

一位資深軟體工程師反思AI如何改變了軟體開發工作流程，從手寫程式碼轉向監督AI生成程式碼，導致創造力下降、技能退化，並引發對行業未來的擔憂：缺乏初級開發者培養渠道，複雜問題依賴人類知識但AI正在耗盡公共知識庫。

AI大幅提高了編碼效率，但將開發者角色從建立者轉變為編輯者。
長期依賴AI導致開發者技能退化，失去深度思考和進入“心流”狀態的能力。

研究

更好的AI影像：打破刻板印象

2026-06-29 07:50 UTC+8

Better Images of AI是一個非營利合作專案，旨在提供替代性的、非誤導性的AI影像，以取代常見的人形機器人、發光大腦等陳詞濫調。該專案提供免費相簿，並強調這些刻板印象阻礙了公眾對AI真實影響的理解。

常見AI影像如人形機器人、發光大腦等具有誤導性，會引發不切實際的期望和恐懼。
Better Images of AI專案提供免費、開源的替代影像，以促進對AI的更準確理解。

AI眼鏡助長考試作弊，迷戀考試的亞洲是重災區

2026-06-29 06:59 UTC+8

隨著技術發展，學生開始使用AI智慧眼鏡在考試中作弊。在東亞對分數看重的社會，這引起了教育者的擔憂。最近韓國和臺灣都出現了相關案例，中國高考要求對所有眼鏡進行篩查。專家認為這可能是更廣泛問題的冰山一角，並呼籲教育體系適應AI時代。

AI智慧眼鏡正成為考試作弊的新工具
韓國和臺灣近期出現多起使用AI眼鏡作弊案例

2026年AI思考的演變

2026-06-29 04:19 UTC+8

一篇反思2026年AI現狀的文章，平衡了積極方面（如更好的工具和程式碼可塑性）與消極方面（增加的心理負擔、虛假資訊不對稱以及工程師計程車氣低落）。

AI工具支援按需建立臨時解決方案，提升生產力。
大型重構變得更簡單，但測試仍需人類主導以避免糟糕的測試套件。

計算機輔助非語言兒童語言發展（1968）

2026-06-29 02:59 UTC+8

1968年發表在《Arch Gen Psychiatry》上的一篇論文，探討了使用計算機輔助教學幫助非語言兒童（包括自閉症兒童）發展語言能力。該研究是早期輔助溝通技術的里程碑。

1968年Colby等人的開創性研究
使用計算機輔助非語言兒童的語言發展

Show HN：Howmuchwater.ai——你家中的水足跡

2026-06-29 00:08 UTC+8

一個互動式網站，對比牛肉漢堡、AI查詢等活動的用水量，顯示每項活動的虛擬水足跡。

一個牛肉漢堡約消耗630加侖水，相當於79萬次標準AI查詢或1.6萬次AI推理查詢。
資料來源包括Water Research Foundation、EPA WaterSense、ENERGY STAR、Water Footprint Network及AI公司的報告。

模型

角色模型：為正確工作分配正確AI模型的協議

2026-06-29 06:16 UTC+8

角色模型（role-model）是一個開放的、具備能力感知能力的AI路由協議，它根據角色和任務後設資料、路由策略以及觀察到的效能來路由請求，而不是僅根據模型名稱。它包括一個參考執行時、可解釋的路由器決策以及基準角色（如通用聊天、程式碼編輯、審查、工具使用、嵌入、分類和語言檢測）。

角色模型提供了一種持久的方式來描述請求需求、角色、任務、端點和策略。
路由器縮小候選集、應用硬性資格檢查、評分端點併發出可解釋的決策。

引用喬恩·尤德爾：代理加入人類迴圈，而非人類進入機器迴圈

2026-06-29 05:57 UTC+8

喬恩·尤德爾批評“人在迴圈中”這一說法，認為它賦予了機器過多權威。他主張翻轉敘事，將代理視為被邀請加入團隊的新成員，而非將人類排除在外的黑箱過程。

尤德爾反對“人在迴圈中”的提法，認為它讓機器主導。
他提議改為“代理在迴圈中”，強調人類仍掌控流程。

中國的Z.ai聲稱在網路安全領域可與Mythos媲美

2026-06-29 05:42 UTC+8

中國智譜AI（Z.ai）釋出了開源權重模型GLM-5.2，有研究人員稱其在特定漏洞查詢和網路安全場景中可與Anthropic的Mythos模型匹敵。儘管在通用任務上仍落後於Anthropic和OpenAI的模型，但中國在縮小與美國模型能力差距上取得顯著進展。美國政府對此表示擔憂，已採取措施限制中國獲得先進AI模型和硬體。開源特性使GLM易於獲取和執行，但也增加了被濫用的風險。

智譜AI釋出開源模型GLM-5.2，在網路安全領域聲稱可媲美Mythos。
中國模型與美國先進模型的差距大幅縮小，引發美國政府擔憂。

NanoEuler：純C/CUDA從零實現的GPT-2級語言模型

2026-06-29 03:38 UTC+8

NanoEuler是一個完全用C/CUDA從零構建的GPT-2級語言模型，不使用PyTorch或自動求導。專案包含手寫的BPE分詞器、前向/反向傳播、在書籍和網路語料上的預訓練以及監督微調（SFT）。支援CPU和GPU訓練，GPU版本使用cuBLAS和FlashAttention。該模型是教育和研究性質的，展示了完整的訓練流程。