2026-02-18 09:45 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

智能體時代AI選擇指南

本文深入分析了從聊天機器人到智能體的轉變，介紹了選擇AI時需要考慮的模型、應用和工具框架三個層面，並詳細比較了GPT、Claude、Gemini三大前沿模型及其配套應用和框架，為不同需求的用户提供了實用建議。

來源One Useful Thing作者: Ethan Mollick

自ChatGPT問世以來，我撰寫了八版AI使用指南，但這一版與以往截然不同，因為“使用AI”的含義已經發生了巨大變化。直到幾個月前，對大多數人來説，“使用AI”意味着與聊天機器人進行來回對話。但近幾個月來，將AI用作智能體已成為現實：你可以給它們分配任務，它們會利用工具自主完成。由於這一變化，在選擇AI時需要考慮三個因素：模型、應用和工具框架。

模型是AI的大腦，三大主流模型是GPT-5.2/5.3、Claude Opus 4.6和Gemini 3 Pro。它們決定了系統的智能水平、推理能力、寫作、編碼、分析電子表格的能力，以及圖像識別和生成能力。應用是你實際用來與模型交互的產品，如chatgpt.com、claude.ai、gemini.google.com等網站，以及OpenAI Codex、Claude Code等編碼工具。工具框架則讓AI能夠使用工具、採取行動並自主完成多步驟任務，例如Claude Code為Claude Opus 4.6提供了虛擬計算機、瀏覽器、代碼終端等，使其能獨立完成網站構建等複雜工作。

目前，頂級模型在整體能力上非常接近，且比以往更智能、錯誤更少。但要認真使用高級AI，每月至少需要支付20美元。免費模型針對聊天優化，速度快但準確性和能力較差。付費後可以選擇模型，例如ChatGPT的GPT-5.2 Thinking Extended或GPT-5.2 Pro，Gemini的3 Pro或Deep Think，Claude的Opus 4.6並開啓擴展思考。

聊天機器人界面仍是主流，但各平台已差異明顯。Gemini集成了圖像生成、視頻創作、學習輔助和深度研究工具；ChatGPT提供了圖像生成、學習、深度研究和購物研究等；Claude則僅提供深度研究，但可通過創建項目實現學習模式。在工具框架方面，OpenAI和Anthropic領先於Google：Claude.ai和ChatGPT能編寫和運行代碼、提供文件、進行深度研究，而Gemini網站在這方面較弱。

除了聊天機器人，其他應用和工具框架正展示出更強大的能力。Claude Code、OpenAI Codex和Google Antigravity面向開發者，讓AI自主編寫、運行和測試代碼。Claude Cowork則針對非技術用户，可操作本地文件和瀏覽器，執行組織報表、提取數據等任務。NotebookLM是Google的知識管理工具，能構建交互式知識庫並生成播客等。OpenClaw是開源智能體，但存在安全風險。

總之，如果你剛開始接觸，選擇三大系統之一併付費20美元，選擇高級模型，將AI應用於實際工作。如果已熟悉聊天機器人，可嘗試NotebookLM、Claude Code或Claude Cowork等專業工具。從聊天機器人到智能體的轉變是自ChatGPT以來最重要的變化，雖然尚處早期，但能行動的AI遠比能説話的AI更有價值。