One Useful Thing AI 新聞來源

公開文章 12採集文章 12可信度 84刷新頻率 720 分鐘

健康狀態健康來源類型研究原文權限 站內改寫最近入庫 2026-06-12ID one-useful-thing運行狀態 已啟用

AI analysis newsletter; summary-only unless authorization is obtained.

最新公開文章

與Mythos合作是什麼感覺

2026-06-10 01:11 UTC+8

作者早期體驗了首個面向公眾的神話級AI模型——Claude 5 Fable。該模型在多項複雜任務中顯著超越此前所有模型，能夠自主運行數小時完成多頁規格項目。作者感受到角色從“巫師”轉變為“贊助人”，AI在幕後自主決策，用户僅需下達指令並評判結果。文章通過等時地圖和數據分析軟件等案例，展示了Fable的強大能力及其帶來的黑箱問題。

Fable在各類任務中大幅領先現有模型，可自動執行長達數小時的複雜工作。
它通過啓動多個子智能體進行調研、編碼和驗證，幾乎無需用户干預。

共存與協同智能的終結

2026-06-05 05:13 UTC+8

作者反思了從“協同智能”到“共存”的轉變，新書《共存》探討如何在AI有時優於人類、有時不如人類的時代工作與生活。書中分享了作者寫作過程中使用AI的經驗，以及如何讓AI成為讀者和推薦者。

《共存》將於10月20日出版，預購已開啓
作者親自撰寫全書，但使用AI進行反饋、事實核查和創意激發

未來的跡象：GPT-5.5

2026-04-24 04:00 UTC+8

作者提前體驗了GPT-5.5，認為它標誌着AI能力的重大進步，尤其是在編碼、圖像生成和綜合應用方面。儘管模型變得更智能，應用和工具也大幅改進，但AI的“崎嶇邊界”依然存在，例如長篇虛構創作仍有不足。文章通過實例展示了GPT-5.5在模擬城市演變、生成學術論文和創建角色扮演遊戲等方面的驚人能力。

GPT-5.5 Pro在編碼任務上比前代更快更智能，能模擬動態變化的3D城鎮。
OpenAI在模型、應用和工具三個層面均取得進展，包括新圖像生成模型和Codex桌面應用。

Claude Dispatch 與接口的力量

2026-04-01 06:34 UTC+8

AI的能力遠超人們想象，但大部分用户僅通過聊天機器人訪問，這導致了認知負擔。文章探討了專門化接口（如編程代理Claude Code）、Google的實驗性工具、以及個人代理（如OpenClaw和Claude Cowork）如何通過更好的接口釋放AI潛力。

聊天機器人接口造成認知税，降低工作效率
專門化接口如Claude Code對程序員高效，但非技術人員缺乏優化工具

文章探討了AI能力的指數級增長及其對工作、市場和政策的深遠影響。從“協同智能”到“管理AI”的轉變，AI代理（如Claude Code、Codex）已能獨立完成複雜任務。作者通過“水獺測試”和多項基準測試展示了AI的快速進步，並指出雖然AI能力驚人，但實際應用仍處於早期階段。文章還介紹了StrongDM的“軟件工廠”這一激進實驗，以及AI導致的“滾動式顛覆”——如金融市場波動、企業裁員和政策衝突。最後，作者警告遞歸自我改進（RSI）可能加速變化，但強調當前仍是塑造AI未來的關鍵窗口。

AI能力指數級增長，從協同智能轉向管理AI代理。
強基準測試顯示AI已接近或超越人類專家水平。

智能體時代AI選擇指南

2026-02-18 09:45 UTC+8

本文深入分析了從聊天機器人到智能體的轉變，介紹了選擇AI時需要考慮的模型、應用和工具框架三個層面，並詳細比較了GPT、Claude、Gemini三大前沿模型及其配套應用和框架，為不同需求的用户提供了實用建議。

AI使用已從聊天機器人轉向智能體，可自主完成任務。
選擇AI需考慮模型、應用和工具框架三個要素。

管理作為AI超級力量

2026-01-28 00:55 UTC+8

在賓夕法尼亞大學的一個實驗中，MBA學生利用AI工具在四天內從零開始創建初創公司，展示了AI如何加速創業過程。文章探討了AI代理工作的方程式，以及如何通過有效的委託（管理技能）來提高AI工作的成功率。

學生在四天內用AI構建了功能原型，大幅縮短了傳統創業週期。
AI工作的價值取決於三個變量：人類基準時間、成功概率和AI處理時間。

Claude Code 及其未來展望

2026-01-08 07:00 UTC+8

新一代AI編碼工具如Claude Code正展現出強大的自主工作能力，能夠獨立完成複雜任務並自我糾錯。文章介紹了Claude Code的功能，如長時間自主運行、上下文壓縮、技能和子代理機制，並探討了其對編程領域的深遠影響。儘管目前主要面向程序員，但預示着AI在知識工作中的更廣泛應用。

Claude Code等AI工具在編程任務中實現長時間自主工作並自我糾錯。
通過上下文壓縮、技能和子代理等機制克服LLM侷限。

AI的形態：鋸齒狀前沿、瓶頸與突出點

2025-12-21 01:32 UTC+8

AI的能力分佈不均，被稱為“鋸齒狀前沿”。進步常被瓶頸阻礙，一旦解決，就會帶來突飛猛進，如谷歌Nano Banana Pro提升了圖像生成能力，解鎖了PPT製作等新功能。

AI的鋸齒狀前沿意味着它在某些任務上表現出色，而在其他任務上則失敗，往往難以預測。
瓶頸，如圖像生成能力差，可能阻礙整個系統，直到問題被解決。

從GPT-3到Gemini 3：三年AI進化之路

2025-11-19 00:55 UTC+8

作者通過對比三年前的ChatGPT和如今的Gemini 3，展示了AI從聊天機器人到智能代理的飛躍。Gemini 3不僅能編寫代碼、創建遊戲，還能自主進行博士級研究，標誌着‘數字同事’時代的來臨。

三年前AI剛能寫詩，如今Gemini 3能構建互動遊戲並自主完成複雜研究
Google發佈的Gemini 3及其代理工具Antigravity，展示了AI從對話到行動的轉變

給你的AI來一場求職面試

2025-11-12 10:46 UTC+8

隨着AI建議的重要性日益增加，我們需要更擅長評估AI。當前基準測試存在數據泄露、測試含義不明、難度不均等問題。但綜合來看，它們仍衡量了潛在能力。然而，對於寫作、商業諮詢等特定任務，基準測試往往不足。作者提出通過“氛圍”基準測試（如讓AI畫鵜鶘騎自行車）和真實任務測試（如OpenAI的GDPval研究）來深入瞭解AI模型，並強調組織應像面試員工一樣系統性地測試AI。

當前AI基準測試存在數據泄露、測試意義不明等問題
綜合基準測試顯示AI能力呈上升趨勢，但特定任務評估不足

關於當下使用AI的主觀指南

2025-10-20 02:45 UTC+8

本文是一篇關於如何使用AI的主觀指南，涵蓋了免費與付費AI模型的選擇、主流AI系統（如Claude、Gemini、ChatGPT等）的對比、如何獲取更優答案（包括深度研究和數據連接）、多模態輸入以及圖像與視頻生成等功能。作者基於實際使用模式給出建議，並強調實驗與直覺培養的重要性。

目前約10%的人每週使用AI，大部分使用免費工具
選擇AI系統時，優先考慮Claude、Gemini、ChatGPT三大付費服務（20美元/月）

One Useful Thing