模型定價 AI News

模型定價動態

Vizro：上傳電子表格，幾分鐘內獲得答案

2026-07-14 17:49 UTC+8

Vizro 是一款 AI 驅動的 iOS 應用，可將 CSV 或 Excel 檔案轉換為美觀的互動式儀表盤，無需編碼。提供 AI 分析、自然語言查詢、故事模式和一鍵分享功能，訂閱價格為每月 9.99 美元。

上傳電子表格，AI 自動生成儀表盤、圖表和關鍵指標。
支援自然語言查詢，可對資料集提問並得到基於資料的回答。

Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8：智慧編碼基準測試、API定價及成本-效能權衡對比

2026-07-14 08:58 UTC+8

Anthropic釋出了Claude Sonnet 5，這是其最強的中端代理模型，在多項基準測試中超越前代Sonnet 4.6，並縮小了與旗艦Opus 4.8的差距。Sonnet 5引入了努力水平（effort levels）以控制推理成本，在低/中努力水平下價效比極高，但高努力水平下成本可能超過Opus 4.8。它已作為Free和Pro計劃的預設模型，並可透過API呼叫。

Sonnet 5在SWE-bench Pro、OSWorld-Verified和HLE等基準測試中均優於Sonnet 4.6，接近Opus 4.8。
定價低於Opus 4.8：$2/$10每百萬token（至2026年8月31日），之後為$3/$15。

AI基礎設施建設構成最新通脹威脅

2026-07-14 05:03 UTC+8

大規模AI資料中心投資導致晶片、電腦和電力價格上漲，可能使通脹持續高於美聯儲目標，並促使加息。

四大科技公司今年AI投資預計達7200億美元，推高記憶體晶片價格高達400%。
蘋果、微軟等企業已提高筆記型電腦、遊戲機等產品價格。

對人工智慧的思考

2026-07-13 10:43 UTC+8

作者分享了自己對人工智慧的看法，認為其影響很大且偏向積極。他回答了關於AI是否會取代工作、SaaS是否消亡、定價變化以及資本支出是否合理等問題，認為AI將簡化搜尋流程、改變商業模式，但無需過度擔憂。

作者對AI持高度積極態度，認為其影響巨大。
AI不會完全取代工作，而是改變工作方式。

AINews：今日平靜，模型釋出潮後的小憩

2026-07-11 10:53 UTC+8

在持續一週的模型釋出熱潮後，今日相對平靜。主要新聞包括GPT-5.6令人困惑的釋出及快速修正、Meta的Muse Spark 1.1以激進定價提供接近前沿的質量、開源模型工具的進步，以及安全擔憂的加劇。

GPT-5.6釋出36種變體，使用者體驗問題導致快速修正。
Meta推出Muse Spark 1.1，定價激進，效能接近前沿模型。

2026年初AI訂閱服務削減配額並提價

2026-07-10 13:51 UTC+8

2026年初，多家AI訂閱服務提供商削減免費或付費配額並提高價格，引發使用者不滿。文章回顧了2025年AI工具的激烈競爭格局，並指出當前趨勢是服務收縮而非擴張。

2026年初AI訂閱服務普遍削減配額並提價
使用者面臨更高成本和更少的使用量

韓國晶片製造商SK海力士借AI熱潮在美上市募資265億美元

2026-07-10 13:06 UTC+8

SK海力士作為先進儲存晶片供應商，受益於全球AI資料中心建設熱潮，利潤飆升。公司於週五確定其鉅額美國上市定價，計劃融資265億美元，成為全球最大規模股票發行之一。

SK海力士於週五確定美國上市定價，目標融資265億美元。
該公司是全球AI資料中心建設熱潮的主要受益者，利潤大幅增長。

GPT-5.6 正式釋出：Sol、Terra 和 Luna 三款模型

2026-07-10 12:19 UTC+8

OpenAI 釋出 GPT-5.6 系列，包括旗艦模型 Sol、工作模型 Terra 和快速模型 Luna。所有使用者均可免費使用。本文詳細介紹定價、效能、安全特性及實際測試結果。

三款模型：Sol（旗艦）、Terra（工作）、Luna（快速），均開放給所有使用者。
定價靈活：Sol 標準版 $5/$30，快速版 $12.50/$75；Terra $2.50/$15；Luna $1/$6（每百萬 token）。

Meta超級智慧實驗室釋出Muse Spark 1.1：專為智慧體任務打造的多模態推理模型，現已登陸Meta Model API

2026-07-10 06:26 UTC+8

Meta超級智慧實驗室釋出了Muse Spark 1.1，這是一款專為智慧體任務最佳化的多模態推理模型，同時公開預覽了Meta Model API。該模型擁有可主動壓縮的100萬token上下文視窗，對新型工具和MCP伺服器具有零樣本泛化能力，並支援多智慧體委派。定價為每百萬輸入token 1.25美元，每百萬輸出token 4.25美元，目前僅在美國提供預覽。在工具使用基準測試中領先，但在編碼和視覺推理方面落後於競爭對手。

Muse Spark 1.1在工具使用和工具增強推理方面表現出色，在Meta報告的基準測試中領先。
該模型擁有百萬token上下文視窗並主動壓縮，同時支援多智慧體委派。

Show HN：出售閒置AI積分或半價購買Claude積分

2026-07-10 04:51 UTC+8

Second Hand Tokens 是一個平臺，允許使用者以五折價格買賣未使用的AI信用額度，支援Claude等模型。

Second Hand Tokens 提供AI信用額度二手交易市場
買家可以半價購買Claude等AI服務的積分

Palo Alto CEO Arora稱AI定價需下降90%，代幣成本飆升

2026-07-10 04:50 UTC+8

Palo Alto Networks執行長Nikesh Arora表示，AI代幣成本需要下降高達90%以促進企業採用，並批評當前高定價是主要障礙。他加入包括Palantir的Alex Karp在內的高管行列，呼籲更便宜的替代方案，同時開源模型正獲得關注。

Arora要求AI代幣成本在兩年內降低90%。
他認為OpenAI的54%效率提升還不夠。

OpenAI 釋出 GPT-5.6（Sol、Terra、Luna）：三層級模型家族，Responses API 整合程式化工具呼叫

2026-07-10 04:45 UTC+8

OpenAI 推出了 GPT-5.6 家族，包含三個層級：旗艦級 Sol、平衡型 Terra 和經濟型 Luna。定價從每百萬 token 1/6 美元到 5/30 美元不等。Sol 在 Artificial Analysis 編碼智慧體指數上達到 80 分，比 Claude Fable 5 高出 2.8 分，同時使用更少的 token。主要的開發者特性是程式化工具呼叫，可在隔離的 V8 執行時中執行 JavaScript，將 token 使用量減少 38% 到 63.5%。然而，差距依然存在：Sol 在 SWE-Bench Pro、智慧指數和工具使用基準上落後於 Claude 模型。

GPT-5.6 推出三個層級：Sol、Terra、Luna，定價從每百萬 token 1/6 美元到 5/30 美元。
Sol 在編碼智慧體指數上得分 80，超過 Claude Fable 5 的 77.2。

OpenAI的GPT-5.6和ChatGPT Work旨在在價格、速度和生產力上超越Anthropic

2026-07-10 04:26 UTC+8

OpenAI釋出了GPT-5.6系列模型（Sol、Terra、Luna）和ChatGPT Work工具，直接對標Anthropic的Fable 5和Claude Cowork。新模型在基準測試中表現優異，成本更低，速度更快。ChatGPT Work將智慧代理功能擴充套件到桌面應用，支援非編碼任務。

GPT-5.6推出三個型號：Sol、Terra、Luna，分別對應不同效能層級。
Sol在Agent's Last Exam基準測試中得分53.6，超過Claude Fable 5的13.1分。

GPT-5.6 Sol (max) 基準測試結果

2026-07-10 02:51 UTC+8

OpenAI 的最新一代推理模型 GPT-5.6 Sol (max) 在 Artificial Analysis 智慧指數中取得 59 分，遠超同類模型平均水平。該模型具備文本與影像輸入、100 萬 tokens 上下文視窗，但定價高昂（輸入 $5/百萬 tokens，輸出 $30/百萬 tokens），且評估中生成 7000 萬 tokens，冗長性較高。

GPT-5.6 Sol (max) 在 Artificial Analysis 智慧指數中得分 59，遠高於同類模型的中位數 30。
定價昂貴：輸入 $5/百萬 tokens，輸出 $30/百萬 tokens，評估總成本高達 $2824.18。

Grok 4.5 基準測試結果

2026-07-09 17:51 UTC+8

Grok 4.5 (高) 在 Artificial Analysis 智慧指數中得分為 54，速度 86.7 令牌/秒，輸入價格 $2.00/百萬令牌，輸出 $6.00/百萬令牌。作為推理模型，支援文本和影像輸入，上下文視窗 500k。

Grok 4.5 在智慧指數中排名靠前，得分為 54，遠超同類模型平均 29。
其輸出速度為 87 令牌/秒，高於平均值 73。

SpaceXAI釋出Grok 4.5：收購Cursor後首款Opus級模型

2026-07-09 14:05 UTC+8

SpaceXAI（xAI）正式釋出了Grok 4.5，這是一款專注於程式設計和智慧體的前沿模型，旨在提供接近Opus級別的效能，但速度更快、成本更低。該模型與Cursor合作訓練，定價為每百萬輸入標記2美元、輸出標記6美元，上下文視窗為50萬標記（計劃擴充套件至100萬）。在獨立評測中，Grok 4.5在效率上表現突出，被認為是效能與成本的最佳平衡點。

Grok 4.5是xAI首款針對程式設計和智慧體訓練的模型，與Cursor合作開發。
定價低於競爭對手（GPT-5.6和Opus 4.8），輸出速度更快。

SpaceXAI釋出Grok 4.5：與Cursor聯合訓練的編碼、代理任務和知識工作模型，輸入價格每百萬tokens僅2美元

2026-07-09 07:54 UTC+8

SpaceXAI釋出了其迄今為止最智慧的模型Grok 4.5，該模型與AI編碼編輯器Cursor聯合訓練，專注於編碼、代理任務和知識工作。定價為每百萬輸入tokens 2美元、每百萬輸出tokens 6美元，服務速度達80 TPS，並在Harvey法律代理基準測試中排名第一。Grok 4.5在令牌效率方面表現出色，在SWE Bench Pro上輸出tokens數量比Opus 4.8少約4.2倍。該模型現已在Grok Build和Cursor中提供，並有限時免費使用。

Grok 4.5與Cursor聯合訓練，針對編碼、代理任務和知識工作最佳化。
在Harvey法律代理基準測試中排名第一，服務速度80 TPS。

初創公司聚焦：Sourcerer 希望透過 AI 採購成為供應商

2026-07-09 03:38 UTC+8

Sourcerer 並非又一個採購工作流工具，而是一家試圖成為實物商品記錄供應商的初創公司。客戶上傳產品規格、發票或描述後，其 AI 代理會稽核供應商、定價、安排貨運、提供信貸，並給出單一報價。

Sourcerer 定位為實物商品的記錄供應商，而非傳統採購工具。
AI 代理負責供應商稽核、定價、貨運和信貸服務。

開放、便捷且可預測：推出預留吞吐量功能

2026-07-08 08:00 UTC+8

Together AI 推出預留吞吐量功能，為 MiniMax M3 和 GLM-5.2 等前沿開放模型提供保留推理容量，採用基於 Token 的定價和 99% 正常執行時間 SLA，成本比專有 API 降低高達 90%。

預留吞吐量提供保留推理容量，無需管理 GPU 小時或基礎設施。
基於 Token 的定價，每 PTU 每分鐘 0.05 美元，支援輸入、快取輸入和輸出 Token。

‘絕對瘋狂’：舊金山住宅因人工智慧熱潮以高於要價100萬美元售出

2026-07-08 06:33 UTC+8

房地產公司Compass的分析顯示，2026年上半年舊金山有超過140套房屋以高於要價至少100萬美元的價格售出，其中6月就有44套。人工智慧熱潮帶來的財富增長與住房短缺共同推動買家大幅加價。

舊金山AI熱潮導致購房者支付遠超要價的金額
2026年上半年超140套房產溢價超100萬美元，6月單月44套

中國AI模型憑藉成本優勢在美國企業中的採用率上升

2026-07-08 05:48 UTC+8

中國開發的AI模型正逐漸縮小與領先美國競爭對手的效能差距，同時保持顯著的價格優勢，因此在美國公司中越來越受歡迎。最近DeepSeek和Z.ai等中國公司釋出的模型被認為與Anthropic和OpenAI等前沿系統高度競爭。這些進步正值許多美國AI實驗室最先進模型的token價格上漲，使企業面臨與使用該技術相關的意外高成本。

中國AI模型效能提升，與美國領先模型差距縮小。
DeepSeek和Z.ai等中國公司的模型在成本上更具優勢。

OpenAI釋出GPT-Realtime-2.1和GPT-Realtime-2.1-mini，用於API中的低延遲語音代理

2026-07-07 12:35 UTC+8

OpenAI在API中新增了兩個Realtime模型：gpt-realtime-2.1和gpt-realtime-2.1-mini。後者是一款針對即時語音的迷你推理模型，定價與之前的gpt-realtime-mini相同。OpenAI還透過改進快取將p95延遲降低了至少25%。本文介紹了模型的變化、定價對比以及如何透過WebRTC連線。

OpenAI推出gpt-realtime-2.1和gpt-realtime-2.1-mini，後者為低延遲語音推理模型。
定價與之前的mini模型相同，p95延遲降低至少25%。

評估電力價格預測的時間序列基礎模型：汙染風險、分佈偏移和協變數依賴性

2026-07-07 12:00 UTC+8

該研究提出了一種雙資料集基準評估框架，用於公平評估時間序列基礎模型（TSFMs）在電力價格預測中的表現。研究發現，TSFMs在零樣本預測中表現強勁，但嚴重依賴於協變數支援，且不一定超越專用領域方法。有趣的是，TSFMs與領域特定方法的簡單整合顯示出顯著潛力，表明兩種方法捕獲了互補的預測資訊。

提出雙資料集基準框架以降低汙染風險，實現公平評估。
時間序列基礎模型在電力價格預測中極具競爭力，但效能依賴協變數。

專為亞馬遜賣家設計的AI產品攝影套件

2026-07-06 15:25 UTC+8

Loomadesign.ai 推出專為亞馬遜賣家設計的AI產品攝影套件，提供不同定價層級，包括每月39.5美元的高階計劃，包含8000積分、自動佇列、無水印下載等功能。

AI驅動的產品攝影工具，專為亞馬遜賣家最佳化
提供免費和付費計劃，高階計劃每月39.5美元

晶片製造商敦促白宮避免對記憶體市場進行廣泛干預

2026-07-04 07:22 UTC+8

晶片行業協會SEMI致信特朗普政府，敦促其不要對記憶體市場進行廣泛干預，認為此舉會扭曲價格和產能決策。SEMI建議採取稅收減免和長期採購合同等更窄的措施，以應對由人工智慧需求驅動的記憶體價格上漲。

SEMI代表多家主要半導體公司，呼籲白宮避免廣泛干預記憶體市場。
該協會建議採取稅收減免和長期採購合同作為替代方案。

TokenScope：面向大型語言模型程式碼任務的詞元級可解釋性與可分析性工具

2026-07-03 12:00 UTC+8

TokenScope 是一款面向解碼器型 LLM 的互動式可解釋性工具，能在程式碼生成過程中提供詞元級度量、注意力模式和結構資訊，支援詞元替換、反事實分支和基於抽象語法樹的程式碼感知聚合。

TokenScope 提供詞元級的度量和注意力分析，揭示 LLM 在程式碼生成中的決策過程。
支援互動式詞元替換和反事實分支，探索不同生成路徑。

特朗普重新設計所有.gov網站的計劃導致AI恐怖作品

2026-07-01 21:15 UTC+8

Ars Technica的審查發現，特朗普NDS計劃下新推出的政府網站大多數是單頁登錄檔單，許多域名重定向到舊版網站。值得注意的專案包括藥品價格比較工具、一個迅速消失的商店以及一個聖誕主題的虛榮專案。

NDS只推出了幾十個網站，大多數是單頁表單。
像live.gov這樣的許多域名重定向到未重新設計的舊站點。

5個無需頭疼即可構建應用的AI編碼平臺

2026-07-01 20:00 UTC+8

本文介紹了五個AI編碼平臺，幫助非技術使用者透過簡單提示將想法轉化為完整應用。涵蓋Lovable、v0、Replit Agent、OpenAI Codex和MiniMax Code，比較其特點、適用人群和價格。

Lovable適合初學者，透過自然語言生成全棧應用並一鍵部署。
v0 by Vercel擅長生成精美UI，與Vercel生態深度整合。

Claude Sonnet 5：強大的代理效能，但每任務成本更高

2026-07-01 07:35 UTC+8

Anthropic 的 Claude Sonnet 5 在人工智慧分析智慧指數中得分 53，較上一代提升 6 分，與 GPT-5.5（高推理）持平，但落後於 Opus 4.7 和 4.8。其每任務成本為 2.29 美元，比 Opus 4.8 高出約 15%，主要由於 token 用量增加。在代理知識工作基準測試中，Sonnet 5 與 Opus 4.8 相當甚至更優，但在推理和知識密集型任務上仍遜色於更大模型。Sonnet 5 支援 100 萬 token 上下文視窗，定價 3/15 美元每百萬 token，並新增了“xhigh”努力級別。

Claude Sonnet 5 在智慧指數上得分 53，排名第五，與 GPT-5.5（xhigh）和 Opus 4.8（max）僅差 2-3 分。
每任務成本 2.29 美元，比 Sonnet 4.6 高約 2 倍，比 Opus 4.8 高 15%，主要由於 token 用量增加。

Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8：智慧編碼基準測試、API定價及成本-效能權衡對比

2026-07-01 05:37 UTC+8

Sonnet 5在SWE-bench Pro、OSWorld-Verified和HLE等基準測試中均優於Sonnet 4.6，接近Opus 4.8。
定價低於Opus 4.8：$2/$10每百萬token（至2026年8月31日），之後為$3/$15。

Claude Sonnet 5 新特性解析

2026-07-01 05:23 UTC+8

Anthropic 釋出 Claude Sonnet 5，效能接近 Opus 4.8 但價格更低。模型採用新分詞器，使相同輸入產生的 token 數量增加約 30%，實際成本上升。API 不再支援 temperature、top_p、top_k 引數，自適應思考預設開啟。

Sonnet 5 效能接近 Opus 4.8，定價與 Sonnet 4.6 相同
新分詞器使英文 token 數量增加約 42%，中文基本不變

Claude Sonnet 5 – 基準測試結果

2026-07-01 04:09 UTC+8

Anthropic 於 2026 年 6 月釋出的 Claude Sonnet 5（自適應推理，最大努力）在人工分析智慧指數中得分 53，處於領先水平。該模型支援文本和影像輸入，輸出文本，具有 100 萬 token 的上下文視窗，且定價為每百萬 token 輸入和輸出均為 0.00 美元，極具競爭力。

Claude Sonnet 5 以 53 分的高分位居人工分析智慧指數前列，遠超同類模型。
該模型為推理模型，支援文本和影像輸入，輸出文本，上下文視窗高達 100 萬 token。

在AWS上推出Claude Sonnet 5：Anthropic最強的Sonnet模型

2026-07-01 02:40 UTC+8

Anthropic宣佈在Amazon Bedrock和Claude Platform on AWS上推出其最先進的Sonnet模型Claude Sonnet 5。該模型在編碼、智慧體任務和專業工作中提供接近Opus級別的智慧，但價格與Sonnet系列相同。它支援多檔案編碼、複雜推理和自動化工作流程，適用於金融、生產力等領域。文章還提供了在Amazon Bedrock上使用該模型的詳細指南和程式碼示例。

Claude Sonnet 5是Anthropic最新一代的首個Sonnet模型，在編碼、智慧體和專業工作上表現出色。
該模型以Sonnet價格提供接近Opus的智慧，支援大規模部署。

OpenAI、Anthropic、Google——6個月內14次定價變動，大多數團隊都忽略了

2026-06-30 23:22 UTC+8

2026年1月至6月，OpenAI、Anthropic和Google共進行了14次模型定價調整。模型棄用、隱藏令牌類別和靜默功能變更導致實際賬單與標價不符。追蹤每次呼叫的成本至關重要，否則預算會悄然超支。

2026年上半年三大AI提供商進行了14次定價變更，許多團隊未察覺。
模型棄用後自動重定向到更貴或產生更多令牌的替代品。

Kilo中的Next-Edit：由Inception擴散LLM驅動

2026-06-30 06:02 UTC+8

Kilo釋出Next-Edit功能，由Inception的Mercury Edit 2模型驅動，能夠預測開發者的下一步編輯。該功能基於擴散LLM架構，並行最佳化程式碼，提供更高的接受率和選擇性。即日起免費使用一個月，之後可按市場價格繼續使用。

Next-Edit利用擴散LLM預測程式碼編輯，而非簡單的自動補全。
Mercury Edit 2接受率提高48%，選擇性提高27%。

低成本中國AI模型如DeepSeek在美國受到青睞

2026-06-29 23:15 UTC+8

美國開發者和小型企業正在轉向中國AI模型以降低成本。儘管效能仍落後於美國頂尖模型，但中國模型能以極低價格處理大多數任務。微軟也在考慮使用DeepSeek等開源模型作為更低成本的替代方案。然而，中國公司面臨將流行度轉化為可觀收入的挑戰。

美國開發者用DeepSeek替代Claude，成本從10美元降至不到50美分。
中國模型價格低廉得益於國內較低的薪資和基礎設施成本。

為什麼蘋果要我為大科技公司的AI狂熱買單？

2026-06-27 21:30 UTC+8

蘋果公司近期將多款產品價格上調，並將原因歸咎於AI產業對記憶體晶片的需求激增。專家指出，記憶體製造商將生產線轉向AI資料中心專用的高頻寬記憶體，導致消費級DDR5記憶體價格上漲。儘管蘋果連續多個季度創下盈利記錄，硬體利潤率遠高於行業平均水平，但公司仍選擇將成本轉嫁給消費者。分析師認為，這更多是為了安撫追求持續增長的股東，並應對蘋果在AI競賽中落後、新CEO任命的不確定性以及缺乏熱門新品等壓力。

蘋果CEO庫克稱價格上漲“不可避免”，16英寸MacBook Pro漲價300美元，11英寸iPad Air從599美元漲至749美元。
記憶體製造商將產能轉向AI資料中心所需的高頻寬記憶體，導致消費級記憶體價格飆升，是漲價的直接原因。

Show HN: Tested – 由LLM專家組（Claude、GPT、Gemini、Grok）評分的AI工具

2026-06-27 09:06 UTC+8

Tested是一個獨立的AI工具評測平臺，使用四個頂級LLM（Claude、GPT、Gemini、Grok）作為評審團，對40多種AI工具進行打分，避免付費排名。覆蓋聊天機器人、編碼、影像、影片等多個類別，提供透明分數和定價資訊。

使用四個LLM代理獨立評分，確保排名公正
覆蓋AI聊天、編碼、影像、影片等12個類別

OpenAI 預覽 GPT-5.6：Sol、Terra 和 Luna 分層模型，新增推理模式，限量訪問

2026-06-27 03:18 UTC+8

OpenAI 開始限量預覽 GPT-5.6 系列，包括旗艦模型 Sol、生產級模型 Terra 和低成本快速模型 Luna。新增最大推理和超級模式，提升複雜任務處理能力。定價從每百萬 tokens 1 美元起，效能在多項基準上創下新高。

GPT-5.6 系列分為三層：Sol（旗艦）、Terra（生產）和 Luna（快速低成本）。
新增 max 和 ultra 兩種推理模式，分別最佳化深度推理和並行任務處理。

AI模型目錄（比較用）

2026-06-27 02:57 UTC+8

一個提供全球AI模型和代理的許可證、定價與合規性資訊的目錄網站。

涵蓋全球AI模型與代理的許可證、定價和合規性資訊
旨在幫助使用者比較和選擇適合的AI模型

深度代理的提示快取

2026-06-27 01:13 UTC+8

瞭解Deep Agents如何利用提示快取，在無需額外配置的情況下，將各大模型提供商的LLM Token成本降低高達80%。

提示快取透過儲存模型狀態，可使推理Token成本降低41-80%。
不同模型提供商對快取控制的支援各不相同，增加了跨提供商最佳化的難度。

OpenAI 預覽 GPT-5.6 系列：Sol、Terra 和 Luna

2026-06-27 01:10 UTC+8

OpenAI 宣佈開始限量預覽 GPT-5.6 系列模型，包括旗艦模型 Sol、平衡型模型 Terra 和快速經濟型模型 Luna。Terra 效能與 GPT-5.5 相當，但成本降低一半；Luna 則以最低價格提供強大能力。定價按每百萬 tokens 計算，Sol 為 $5 輸入 / $30 輸出，Terra 為 $2.50 / $15，Luna 為 $1 / $6。新系列還引入了更可預測的提示快取，支援顯式快取斷點和 30 分鐘最小快取壽命。由於美國政府的參與，此次釋出先以限量預覽形式提供給少數可信合作伙伴，隨後將廣泛釋出。

GPT-5.6 系列包括 Sol（旗艦）、Terra（平衡）和 Luna（快速經濟）三款模型。
Terra 效能與 GPT-5.5 相當但價格減半，Luna 以最低成本提供強大能力。

OpenAI釋出GPT-5.6，正值美國AI監管爭議之際

2026-06-27 01:00 UTC+8

在特朗普政府要求推遲釋出後不到24小時，OpenAI推出了GPT-5.6模型套件，包括旗艦版Sol、中端版Terra和經濟型Luna。該模型在編碼、網路安全和生物學方面表現突出，並具備長時自主AI任務能力。定價方面，Sol每百萬token輸入5美元、輸出30美元，約為Anthropic Claude Fable 5的一半。OpenAI在公告中重點強調了安全性和潛在濫用風險，並提到與政府合作進行預覽期監管。

OpenAI應特朗普政府要求，在推遲後迅速釋出GPT-5.6套件（Sol、Terra、Luna）。
Sol定價較競爭對手Anthropic的Claude Fable 5便宜近一半。

當前大語言模型成本為何不可持續

2026-06-26 15:44 UTC+8

大型語言模型的成本正在飆升，但技術進步和市場競爭將推動價格下降。本文分析了效能瓶頸、開源模型、晶片改進、零切換成本和本地模型這五個關鍵因素。

模型效能提升放緩，價格難以繼續上漲
開源模型以十分之一的成本達到頂級效能

MacroLens：宏觀經濟場景下的多工上下文金融推理基準研究

2026-06-25 12:00 UTC+8

MacroLens是一個全新的多工基準，涵蓋2021-2026年間4,416只美國小盤和微盤股。它整合價格、會計資料、宏觀經濟序列、SEC檔案和新聞，旨在解決金融時間序列評估中四大假設違反問題。基準包含七個任務、1,130個宏觀經濟事件，評估了19種方法，並進行了特徵消融實驗。

首個同時處理價格、基本面、宏觀和文本四類訊號的公開基準
覆蓋4,416只美國股票，包含46.8M XBRL事實、53個宏觀序列和215,882篇新聞

OpenAI與博通推出AI推理晶片

2026-06-25 04:21 UTC+8

該晶片將使AI模型提供商能夠提供更低的token價格，可能緩解企業對高token成本的擔憂。

OpenAI與博通合作推出AI推理晶片。
新晶片使AI模型使用者能夠享受更低的token價格。

Mistral OCR 4 釋出：突破性的文件理解模型

2026-06-23 22:03 UTC+8

Mistral OCR 4 引入了邊界框、塊分類和置信度分數，在人類偏好測試中優於所有競爭對手，平均勝率達72%。支援170種語言，可單容器自託管，定價為每千頁4美元。

獨立標註員偏好OCR 4，平均勝率達72%，在OlmOCRBench上得分85.20。
輸出包括邊界框、塊型別（標題、表格、等式等）和逐字置信度分數。

Abacus AI 的 ChatLLM 評測：為日常工作打造的多模型 AI 工作空間

2026-06-23 01:00 UTC+8

ChatLLM 是 Abacus AI 開發的一個 AI 工作空間，它整合了多個領先的大語言模型、AI 代理、文件分析、影像生成、自動化及團隊協作功能。本文詳細評測了其支援的模型、功能、定價、使用限制，並對比了 ChatGPT。

ChatLLM 在一個訂閱中提供對 GPT、Claude、Gemini、Grok 等數十種 AI 模型的訪問。
平臺包含多模型聊天、文件分析、資料視覺化、影像與影片生成、程式碼執行、AI 代理及企業整合。

我用AI搭建了一個即時交易平臺，然後時鐘開始說謊

2026-06-21 16:24 UTC+8

作者用Claude作為AI副駕，構建了一個OTC利率互換的即時價格匹配平臺。上線執行一個月後，出現會話時長異常延長、連線斷開、資料閃爍等問題。透過分析錯誤分佈（連續倍數而非離散倍數），作者診斷出是非同步事件迴圈中的競爭條件：一個慢速客戶端阻塞了廣播迴圈，導致計時器被飢餓。修復方案是使用絕對截止時間計時器代替迴圈計數，並將廣播改為併發執行加超時。這揭示了'非同步'並不自動帶來併發，理解系統行為比程式碼生成更重要。

即時交易平臺出現會話時長隨機延長（1.2x至5.51x），錯誤呈連續分佈
根本原因：一個慢速客戶端阻塞了非同步廣播迴圈，導致計時器被飢餓

Show HN：為AI輔助創意作品新增時間戳和出處記錄

2026-06-20 06:29 UTC+8

Colossee 為AI生成或輔助的創意作品提供帶時間戳的公共記錄和證書頁面，在釋出前證明所有權。它支援超過40種AI工具，並提供簡單的三步流程：新增作品、建立證明記錄、釋出時附上收據。定價從免費開始，有創作者、專業和工作室付費方案。

Colossee為AI輔助作品建立可驗證的時間戳和所有權記錄。
支援超過40種AI平臺，包括Midjourney、OpenAI和Runway。

模型定價

相關主題

模型定價動態

Vizro：上傳電子表格，幾分鐘內獲得答案

Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8：智慧編碼基準測試、API定價及成本-效能權衡對比

AI基礎設施建設構成最新通脹威脅

對人工智慧的思考

AINews：今日平靜，模型釋出潮後的小憩

2026年初AI訂閱服務削減配額並提價

韓國晶片製造商SK海力士借AI熱潮在美上市募資265億美元

GPT-5.6 正式釋出：Sol、Terra 和 Luna 三款模型

Meta超級智慧實驗室釋出Muse Spark 1.1：專為智慧體任務打造的多模態推理模型，現已登陸Meta Model API

Show HN：出售閒置AI積分或半價購買Claude積分

Palo Alto CEO Arora稱AI定價需下降90%，代幣成本飆升

OpenAI 釋出 GPT-5.6（Sol、Terra、Luna）：三層級模型家族，Responses API 整合程式化工具呼叫

OpenAI的GPT-5.6和ChatGPT Work旨在在價格、速度和生產力上超越Anthropic

GPT-5.6 Sol (max) 基準測試結果

Grok 4.5 基準測試結果

SpaceXAI釋出Grok 4.5：收購Cursor後首款Opus級模型

SpaceXAI釋出Grok 4.5：與Cursor聯合訓練的編碼、代理任務和知識工作模型，輸入價格每百萬tokens僅2美元

初創公司聚焦：Sourcerer 希望透過 AI 採購成為供應商

開放、便捷且可預測：推出預留吞吐量功能

‘絕對瘋狂’：舊金山住宅因人工智慧熱潮以高於要價100萬美元售出

中國AI模型憑藉成本優勢在美國企業中的採用率上升

OpenAI釋出GPT-Realtime-2.1和GPT-Realtime-2.1-mini，用於API中的低延遲語音代理

評估電力價格預測的時間序列基礎模型：汙染風險、分佈偏移和協變數依賴性

專為亞馬遜賣家設計的AI產品攝影套件

晶片製造商敦促白宮避免對記憶體市場進行廣泛干預

TokenScope：面向大型語言模型程式碼任務的詞元級可解釋性與可分析性工具

特朗普重新設計所有.gov網站的計劃導致AI恐怖作品

5個無需頭疼即可構建應用的AI編碼平臺

Claude Sonnet 5：強大的代理效能，但每任務成本更高

Anthropic Claude Sonnet 5 vs Sonnet 4.6 vs Opus 4.8：智慧編碼基準測試、API定價及成本-效能權衡對比

Claude Sonnet 5 新特性解析

Claude Sonnet 5 – 基準測試結果

在AWS上推出Claude Sonnet 5：Anthropic最強的Sonnet模型

OpenAI、Anthropic、Google——6個月內14次定價變動，大多數團隊都忽略了

Kilo中的Next-Edit：由Inception擴散LLM驅動

低成本中國AI模型如DeepSeek在美國受到青睞

為什麼蘋果要我為大科技公司的AI狂熱買單？

Show HN: Tested – 由LLM專家組（Claude、GPT、Gemini、Grok）評分的AI工具

OpenAI 預覽 GPT-5.6：Sol、Terra 和 Luna 分層模型，新增推理模式，限量訪問

AI模型目錄（比較用）

深度代理的提示快取

OpenAI 預覽 GPT-5.6 系列：Sol、Terra 和 Luna

OpenAI釋出GPT-5.6，正值美國AI監管爭議之際

當前大語言模型成本為何不可持續

MacroLens：宏觀經濟場景下的多工上下文金融推理基準研究

OpenAI與博通推出AI推理晶片

Mistral OCR 4 釋出：突破性的文件理解模型

Abacus AI 的 ChatLLM 評測：為日常工作打造的多模型 AI 工作空間

我用AI搭建了一個即時交易平臺，然後時鐘開始說謊

Show HN：為AI輔助創意作品新增時間戳和出處記錄

更多增長標籤

AI 編程

MCP

開源模型

推理成本

Agent 框架

中國 AI

GPU 基礎設施

DeepSeek

Qwen