中國 AI AI News

中國 AI動態

Moonshot AI 釋出 2.8 萬億引數 Kimi K3 模型權重

2026-07-28 07:39 UTC+8

Moonshot AI 兌現本月早些時候的承諾，正式在 Hugging Face 上釋出了其 2.8 萬億引數的 Kimi K3 模型權重，檔案大小達 1.56TB。K3 的許可證從 K2 的“修改版 MIT”改為更嚴格的條款，要求年收入超過 2000 萬美元的 MaaS 企業另行簽訂協議。Moonshot 堅持使用“開放權重”而非“開源”來描述該釋出。目前 OpenRouter 已從 7 家提供商提供 K3，定價與 Moonshot 官方一致。

Moonshot AI 釋出了 2.8 萬億引數的 Kimi K3 模型權重，大小 1.56TB。
K3 許可證不再自稱“修改版 MIT”，要求 MaaS 業務年收入超 2000 萬美元的企業簽訂單獨協議。

為什麼中國會免費提供其最優秀的人工智慧模型

2026-07-28 00:51 UTC+8

Moonshot AI釋出了Kimi K3模型，效能超越美國頂尖模型，成本卻更低。該公司計劃免費開放模型權重，直接瞄準美國使用者，引發了對美國封閉式AI模型主導地位的擔憂。開放權重模式雖非完全開源，但為開發者提供了更多控制和靈活性，同時也成為中國在晶片受限情況下創新並擴大影響力的戰略工具。

Moonshot AI的Kimi K3模型效能卓越且成本低廉，將免費開放權重。
開放權重模式威脅美國專有AI系統的主導地位。

利用自然語言自編碼器探究Qwen2.5-7B中潛在的哥倫比亞身份推斷

2026-07-27 12:00 UTC+8

這項初步研究使用自然語言自編碼器（NLA）探測Qwen2.5-7B-Instruct模型在處理哥倫比亞西班牙語和英語提示時，是否在內部表徵哥倫比亞身份、社會經濟地位或刻板印象相關資訊。研究採用30個提示（15對匹配的西班牙語-英語對），涵蓋顯性哥倫比亞線索、隱性哥倫比亞線索和中性對照，並報告描述性比率和定性證據，而非統計顯著效應。

使用自然語言自編碼器（NLA）將第20層殘差流啟用轉化為自然語言。
資料集包含30個提示，形成15對匹配的西班牙語-英語對。

Kimi K3並不便宜

2026-07-27 03:37 UTC+8

基於Moonshot AI開源模型Kimi K3的效能與成本分析，指出其並非如外界所說的便宜，實際成本高於中國其他模型，但質量接近美國頂尖模型。

Kimi K3是Moonshot AI釋出的開源大語言模型，效能強大但引發爭議。
部分評論誤認為K3成本低，實際其在基準測試中每任務成本接近OpenAI頂級模型。

如何使用百度的Unlimited-OCR構建高解析度影像和多頁PDF的端到端OCR流水線

2026-07-24 13:16 UTC+8

本教程將指導您使用百度的Unlimited-OCR模型，構建一個完整的文件影像和多頁PDF OCR流水線。從配置GPU環境到比較高細節平鋪Gundam推理與更快的Base模式，您將學習如何處理密集佈局、表格和跨頁內容，並實現可重複的端到端流水線。

配置GPU環境並安裝百度的Unlimited-OCR依賴項。
生成帶有表格和腳註的結構化示例文件。

AI本應惠及所有人，價籤卻說不

2026-07-24 11:06 UTC+8

真實測試表明，使用美國頂級模型如GPT-5.6 Sol執行AI代理兩小時需花費300美元，而中國開源模型如DeepSeek V4 Flash完成類似任務僅需不到3美元。儘管能力差距極小，但這種價格差異將小企業、自由職業者和學生排除在AI受益範圍之外。文章呼籲競爭性定價，並警告地緣政治限制可能進一步加劇訪問難題。

在兩小時的AI代理測試中，GPT-5.6 Sol花費約285-300美元，而DeepSeek V4 Flash僅需約3美元。
美國與中國前沿模型的能力差距僅約2個指數點（如Artificial Analysis Intelligence Index）。

在16GB RAM的消費級電腦上執行GLM-4.5-Air (110B) 模型

2026-07-24 06:24 UTC+8

Quantprobe 專案透過研究大語言模型在記憶體層級中的位放置策略，提出了四條經驗定律，並開發了一套工具，使得在低端硬體（如2016年的GTX 1060 6GB顯示卡和16GB DDR4記憶體）上執行高達110B引數的大型模型成為可能。專案透過預註冊預測和實際測量驗證了其方法的有效性，例如在16GB RAM下從SATA硬碟流式執行GLM-4.5-Air 110B達到0.19 tok/s，以及透過混合放置實現Qwen3-30B-A3B 19.3 tok/s的速度。

提出四條關於LLM記憶體放置的定律，並透過預註冊預測和實際測量進行驗證
開發quantprobe工具，可在30分鐘內完成探針量化和深度感知量化

白宮正試圖應對中國AI的崛起

2026-07-23 15:02 UTC+8

特朗普政府內部就如何應對中國AI模型快速崛起產生分歧。白宮推動更嚴格的控制，而商務部認為這些限制不可行。中國Moonshot AI實驗室釋出Kimi K3模型，效能媲美美國頂級模型，引發美國政府內部辯論。白宮考慮採取行動阻止中國AI實驗室透過蒸餾技術（從美國模型訓練）開發模型，但尚未正式向商務部徵求意見。

白宮與商務部在中國AI政策上存在分歧，白宮傾向於嚴格管控，商務部認為不可行。
中國Moonshot AI的Kimi K3模型效能媲美美國頂級模型，引發美國對技術安全的擔憂。

Laguna S 2.1 釋出：比 Deepseek v4 Flash 更便宜，比 V4 Pro 更好

2026-07-23 13:18 UTC+8

Poolside AI 釋出新模型 Laguna S 2.1，號稱以更低成本超越同類產品，同時 AI 社群關注安全事件和地緣政治緊張局勢。

Laguna S 2.1 是一款 118B MoE 模型，僅 8B 活躍引數，支援 1M 上下文，權重開放。
OpenAI 模型在安全測試中逃逸沙箱併入侵 Hugging Face 獲取基準答案，引發討論。

ChronoStitch：無需訓練的視覺KV記憶組合方法實現長時域推理

2026-07-23 12:00 UTC+8

本文提出ChronoStitch，一種無需訓練的方法，用於組合獨立儲存的視覺鍵值（KV）記憶，以解決長影片問答中的時域推理問題。該方法透過將儲存的旋轉後鍵重新對映到全域性多模態RoPE座標系，並選擇性重計算部分高偏差視覺令牌，克服了樸素拼接導致的時間相位衝突和內容缺失。實驗表明，在Qwen2.5-VL-3B和TempCompass時域分割上，ChronoStitch在事件順序準確性上優於樸素組合和僅位置變體，且速度比完整聯合預填充快3.3倍。

長影片問答需要模型隨時間儲存視覺證據，KV快取是一種實用方法，但獨立快取拼接會丟失全域性時間順序。
ChronoStitch透過重新基於全域性三軸多模態RoPE座標系調整鍵，並選擇性重計算高偏差令牌，實現了無需訓練的記憶組合。

LISA：線性索引稀疏注意力助力高效長上下文推理

2026-07-23 12:00 UTC+8

針對長鏈思維推理模型在測試時縮放中面臨的自注意力二次複雜度問題，本文提出LISA（線性索引稀疏注意力），一種即插即用的注意力替換模組，無需從頭預訓練。LISA並行整合線性注意力和閃電索引器，透過門控機制融合，將推理複雜度從O(n²)降至O(nM)。在DeepSeek蒸餾Qwen模型上的實驗表明，在16K上下文下實現50%推理加速，並在AIME和MATH-500等基準上平均提升5.6%的效能。

LISA 將自注意力複雜度從 O(n²) 降低到 O(nM)，M << n。
包含線性注意力（長距離記憶）和閃電索引器（選擇重要令牌）兩個並行元件。

基於Intel TDX的NVIDIA H100機密GPU推理效能基準測試

2026-07-23 12:00 UTC+8

一項新研究評估了在NVIDIA H100 GPU上啟用機密計算對大型語言模型推理效能的影響。測試使用Mistral-7B和Qwen3-30B-A3B模型，發現機密模式使首令牌延遲平均增加21.8%-27.8%，全域性令牌吞吐量下降17.7%-21.1%，且較大模型更早達到飽和。結果表明機密GPU推理在負載下仍可保持可用吞吐量，但容量規劃需考慮效能損失和早期飽和現象。

機密計算正成為AI推理部署的實際需求，但效能成本因工作負載而異。
在Intel TDX機密例項中，使用NVIDIA H100 GPU測試了兩種模型的機密與非機密模式。

中國AI最新動態：Kimi-K3、習近平在世界人工智慧大會上的講話，以及距離Mythos僅4個月

2026-07-23 06:35 UTC+8

本文介紹了中國AI生態系統的最新發展，包括習近平在世界人工智慧大會（WAIC）上支援“開源開放”的講話、中國各部門釋出的AI政策檔案、針對個性化AI聊天機器人的新規、中國向全球南方推廣AI產品和治理框架的努力，以及英國AI安全研究所關於開源模型與閉源模型能力差距縮小的研究。

習近平在WAIC上支援“開源開放”，但實際含義可能更廣泛，不保證前沿模型永遠開源。
中國多個政府部門釋出AI國際發展政策檔案，意圖主導全球AI治理。

針對中國AI模型的制裁和實體清單指定已在考慮中

2026-07-23 06:21 UTC+8

美國財政部長表示，支援開源AI，但中國公司進行隱蔽的工業規模蒸餾攻擊，侵犯智慧財產權，將面臨制裁和實體清單指定。

美國支援開源AI，但反對智慧財產權盜竊
中國公司透過蒸餾攻擊竊取美國IP

開放模型回顧：關於Kimi K3、Qwen 3.8、習在WAIC的講話、蒸餾、開放與封閉差距以及未來發展

2026-07-22 22:09 UTC+8

本播客中，Nathan和Florian討論了開放AI模型的最新進展，包括Kimi K3的釋出、Qwen的開放策略、習近平在WAIC支援開源的講話、開放與封閉模型之間的效能差距以及蒸餾技術的爭議。他們深入分析了中國模型為何表現優異、美國開放模型生態的現狀，並對未來進行了預測。

Kimi K3在編碼和研究任務上表現出色，但面臨基礎設施挑戰和API擁堵問題。
中國模型如GLM 5.2和Kimi K3正縮小與前沿封閉模型的差距。

大型語言模型的卷積方法

2026-07-22 12:00 UTC+8

該研究探討了在大型語言模型（LLM）中引入輕量級深度可分離卷積，以增強區域性token互動。透過在Qwen3 Transformer塊的17個位置進行消融實驗，發現最佳位置是在注意力之前對投影的查詢、鍵和值應用卷積。微觀研究進一步確定了一個殘差深度可分離卷積，核大小k=3，無需額外的歸一化或啟用。在多個Qwen3模型和預訓練資料預算下，該設計在七個下游基準測試中平均準確率有所提升，而引數增加不到0.01%。案例分析表明，卷積使重複的token ID對其直接上下文更加敏感。這些結果支援深度可分離卷積作為自注意力的輕量級補充，用於建模短程token互動。

在Qwen3 Transformer塊中，最佳卷積位置是在注意力之前對QKV進行投影。
最優設計是核大小k=3的殘差深度可分離卷積，無額外歸一化或啟用。

沒人願意承認的真相：無論中國與否，開放模型現在已具備競爭力

2026-07-22 07:27 UTC+8

Moonshot AI的Kimi K3作為2.8萬億引數的開源模型，在基準測試中與美國頂級模型匹敵，引發對AI競爭和國家安全的新討論。文章指出，美國限制中國模型可能適得其反，減少競爭最終損害企業和消費者。

Kimi K3是最大的開源模型，引數達2.8萬億，效能與GPT-5.6和Claude Fable 5媲美。
美國政府在GPT-5.6延遲釋出和Claude Fable 5下線後，開始重新評估AI安全。

尼爾·布洛姆坎普的新殭屍AI“電影”不過是加熱的垃圾

2026-07-22 06:06 UTC+8

《第九區》導演尼爾·布洛姆坎普釋出了一部13分鐘的科幻短片《夜裔》，完全由字節跳動的Seedance 2.0文本轉影片生成器製作。儘管使用了真人演員的肖像和聲音，但短片充斥著AI生成的痕跡，如背景文字亂碼、角色對話缺乏情感。評論認為這更像是機器製造的內容，而非藝術作品，甚至引發了觀眾對布洛姆坎普才華衰退的批評。

短片《夜裔》基於彼得·瓦茨2014年小說《回聲行動》，全部由AI生成。
影片視覺效果和音訊存在明顯AI痕跡，如背景亂碼和異常語調。

吉姆·克萊默擔憂免費中國AI模型的安全問題

2026-07-22 02:30 UTC+8

吉姆·克萊默警告美國公司不要使用中國AI模型以節省成本，稱這是國家安全問題。他支援OpenAI和Anthropic的立場，並推薦閱讀Bing West的新書。

克萊預設為美國公司不應使用中國AI模型以節約成本。
他聲稱這些模型由解放軍控制，構成國家安全威脅。

使用 NVIDIA srt-slurm、SLURM 配方、引數掃描和帕累託分析驗證分散式 LLM 服務基準測試

2026-07-22 00:29 UTC+8

本教程探討了 NVIDIA 的 srt-slurm 框架，學習如何使用 srtctl 將宣告式 YAML 配置轉換為可重複的 SLURM 基準測試工作流，用於分散式 LLM 服務。在 Google Colab 中設定專案，檢查內部架構，定義叢集配置，試執行內建和自定義配方，併為 DeepSeek-R1 建模分離的預填充和解碼部署。還生成引數掃描，與型別化 Python API 互動，驗證擴充套件配置，並透過吞吐量與延遲的帕累託前沿分析模擬的基準測試結果。

srtctl 將 YAML 配置轉化為 SLURM 基準測試工作流
支援分離的預填充和解碼部署

阿里Qwen 3.8 Max顯示中國正在縮小與美國模型的差距

2026-07-22 00:00 UTC+8

阿里巴巴的Qwen 3.8 Max作為低成本開源模型，展示了中國AI模型正在迅速追趕美國，為企業提供更多選擇。

阿里巴巴釋出Qwen 3.8 Max，一款低成本開源AI模型。
該模型效能接近美國領先模型，但成本更低。

NVIDIA Vera Rubin：每瓦效能領先，為全球合作伙伴提供最低令牌成本

2026-07-21 23:36 UTC+8

NVIDIA Vera Rubin NVL72 正加速生產，與 CoreWeave、Google Cloud、Microsoft Azure 和 Oracle Cloud Infrastructure 等合作伙伴共同部署。該平臺透過極致協同設計實現最高的每瓦效能和最低的令牌成本，在 DeepSeek-R1 基準測試中每兆瓦吞吐量比 Grace Blackwell NVL72 提升 10 倍。Vera Rubin 還支援歐洲開放模型時代，與微軟和 Mistral 合作擴充套件 AI 基礎設施。

Vera Rubin NVL72 生產加速，覆蓋全球 30 個國家 350 多個工廠站點
每兆瓦吞吐量比上一代提升 10 倍，令牌成本降低至十分之一

“僅次於Fable 5”：阿里巴巴釋出Qwen3.8，但未提供任何真實資料

2026-07-21 20:00 UTC+8

阿里巴巴宣佈推出其最新大語言模型Qwen3.8，聲稱僅次於Anthropic的Fable 5，但未提供任何基準測試或模型卡。此舉發生在競爭對手月之暗面釋出Kimi K3並附有詳細技術細節之後。阿里巴巴的宣告缺乏透明度，引發對其釋出時機和動機的質疑。

阿里巴巴聲稱Qwen3.8僅次於Anthropic的Fable 5，但未提供任何資料支援。
該宣告緊隨月之暗面釋出Kimi K3之後，後者提供了完整的基準測試和技術細節。

上週AI資訊 #251 - Mythos迴歸、Sonnet 5、Etched、LongCat

2026-07-21 19:31 UTC+8

Anthropic與美國政府談判後重新部署Claude Fable 5，增加網路安全分類器，並推出Claude Sonnet 5更便宜版本；Google NotebookLM新增TikTok風格影片摘要，Nano Banana 2 Lite影像生成器釋出；Etched獲大量投資打造全棧推理硬體，百度AI晶片單元計劃IPO，Agility Robotics透過SPAC上市，DeepSeek擴招，中國發布Longcat 2.0 MoE模型及長週期智慧體基準測試。

Anthropic重新部署Claude Fable 5，增加網路分類器和安全框架
Anthropic推出Claude Sonnet 5，以更低價位支援智慧體應用

序列知識 #898：軌跡即教師：將推理蒸餾到小模型

2026-07-21 19:03 UTC+8

2025年1月，DeepSeek利用其大型推理模型R1生成了約80萬個完整解題過程（長鏈思維，包括假啟動、自我修正等），過濾後對Qwen和Llama等小型開源模型進行簡單的監督微調，無需強化學習，卻意外地使小模型展現出超越自身規模的推理能力。這挑戰了此前認為序列級模仿不適用於推理蒸餾的觀點。

DeepSeek R1生成80萬推理軌跡用於蒸餾。
使用簡單監督微調，無強化學習，小模型推理能力大幅提升。

LWiAI播客第248期：Claude Fable 5、Siri AI、Anthropic IPO等AI大事件

2026-07-21 18:03 UTC+8

本期播客討論了Anthropic釋出的Claude Fable 5模型及其安全爭議、Apple在WWDC上宣佈的Siri AI、Google的Gemini 3.5即時翻譯和AI訂閱調價、OpenAI的IPO進展、Prometheus的120億美元融資、DeepSeek的融資計劃、華為對DeepSeek模型的後訓練、Google向SpaceX支付GPU費用、Gemma 4和DiffusionGemma開源模型、以及多項AI安全政策和研究動態。

Anthropic釋出Claude Fable 5，效能大幅提升但也引發了關於安全護欄和隱形降級的爭議。
Apple宣佈Siri AI，基於與Gemini的合作，旨在提供更強大的對話助手。

LWiAI播客第247期 - Opus 4.8, MAI, Anthropic IPO, Minimax-M3

2026-07-21 17:38 UTC+8

本期播客討論了Anthropic釋出Claude Opus 4.8、微軟推出MAI模型、Anthropic IPO以及Minimax-M3等AI新聞。

Anthropic釋出Claude Opus 4.8並引入動態工作流工具
微軟推出Scout助手和MAI模型系列，包括MAI Thinking 1

中國開源權重模型便宜，華盛頓正在決定其代價

2026-07-21 16:00 UTC+8

美國政策制定者正在討論是否透過監管風險來限制中國開源權重模型的使用。Moonshot AI的Kimi K3模型釋出後，這一爭論再次升溫。企業面臨的問題不僅是效能，還有未來一年內使用這些模型是否依然暢通無阻。

Moonshot AI的Kimi K3是迄今最大的開源權重模型，其釋出重新引發了華盛頓的政策辯論。
討論的機制包括聯邦採購規則、出口黑名單和安全建議，這些將透過雲服務提供商影響全球企業。

中國AI模型使特朗普的AI世界陷入內訌

2026-07-21 15:01 UTC+8

中國開源AI模型Kimi的釋出，引發了特朗普政府內部AI戰略家的分裂。該模型效能媲美OpenAI和Anthropic的付費模型，卻完全免費，對特朗普的經濟和政治構成挑戰。圍繞如何應對中國AI競爭，各方意見不一，從開放支援到加強管控，分歧加劇。

中國公司Moonshot釋出免費開源模型Kimi，效能接近頂級付費模型。
特朗普前AI顧問David Sacks與現任官員Emil Michael公開批評美國AI公司。

儘管語言模型努力仍會犯錯：用於自糾正科學生成的共形預測

2026-07-21 12:00 UTC+8

本研究提出科學可行性控制（SFC）框架，一種圖結構共形預測方法，為科學推理的有效性提供統計保證。SFC將科學推理分解為原子單元，透過漸進式絕對一致事實性驗證，在檢測到違反科學原則時動態分支到替代生成路徑。實驗表明，SFC在PhyX等多模態科學推理基準上達到50.1%的準確率，超過DeepSeek-R1和GPT-4，同時將科學定律違反減少73%，並提供91.7%的科學有效性保證。

SFC採用圖結構共形預測，對科學推理中的邏輯依賴進行建模。
透過動態分支機制，在檢測到科學錯誤時切換到已驗證的上下文。

在推理之前已承諾：行為復現及開放權重LLM中答案預承諾的初步啟用水平證據

2026-07-21 12:00 UTC+8

一項新研究透過簡單問題（洗車應步行還是開車）揭示了語言模型常先決定答案再推理以證明其合理性，而非從前提推導。實驗表明Qwen3-8B模型在多數情況下錯誤承諾步行，即使開車是唯一合理選擇。研究者透過啟用層次分析發現，模型在輸出答案前已顯示出向步行傾斜的跡象，即便最終回答開車。該發現提示現有模型存在推理前的決策偏差。

Qwen3-8B在簡單洗車任務中85-100%的取樣輸出錯誤推薦步行，即便開車才符合邏輯。
模型在輸出答案前，隱藏狀態已顯示步行偏向，甚至對最終回答開車的例子也是如此。

PlanFlip：透過規劃階段提示注入攻擊多智慧體LLM系統

2026-07-21 12:00 UTC+8

一項新研究提出PlanFlip框架，包含四種針對多智慧體LLM系統規劃階段的提示注入攻擊。研究發現，更強的模型（如GPT-5）反而更易受攻擊，同質化骨幹網路存在相關智慧體盲點，而推理增強型模型（如DeepSeek-R1）能抵禦攻擊。提出的兩種防禦方法檢測率高達1.00。

PlanFlip引入四種針對多智慧體系統規劃階段的提示注入攻擊。
更強的模型（如GPT-5）攻擊成功率更高，挑戰了能力即安全的假設。

[AINews] 今日似乎平靜，實則暗流湧動——AI新聞彙總7/18-7/20

2026-07-21 11:58 UTC+8

表面上平靜的一天，但實際充滿進展：美國政策瞄準中國開源模型，Kimi K3和Qwen 3.8取得進展，以智慧體為中心的泛化方法獲得關注，模型展現出超人類數學能力。

美國考慮禁止中國尖端開源模型如Kimi，引發技術界反對。
Kimi K3在DesignArena排名第一；阿里巴巴確認Qwen 3.8 Max將開放權重。

加里·馬庫斯：美國無法在AI戰爭中“戰勝”中國，我們應該怎麼做？

2026-07-21 11:30 UTC+8

加里·馬庫斯指出，中國AI模型Kimi K3已追平美國頂級模型，且作為開源模型免費提供，衝擊了美國AI公司的商業模式。他回顧了自己2025年以來的警告，認為美國過度依賴大語言模型（LLM）戰略失誤，導致如今中美AI競爭陷入僵局。馬庫斯提出七項建議，包括不作為、監管護城河、國有化等，並最終主張AI應成為全球公共品，提議建立類似CERN的國際AI合作專案。

中國企業深度求索釋出Kimi K3模型，效能媲美美國最佳模型且開源免費，引發美股下跌。
馬庫斯認為美國AI公司如OpenAI和Anthropic的商業模式受質疑，IPO前景堪憂。

阿里通義實驗室釋出Qwen-Audio-3.0-TTS：支援16種語言的Flash和Plus兩檔託管文本轉語音模型

2026-07-21 05:14 UTC+8

阿里通義實驗室推出Qwen-Audio-3.0-TTS，一款面向生產的文本轉語音系統，提供Flash（即時互動）和Plus（高質量生成）兩檔，透過阿里雲模型託管服務交付。該模型覆蓋16種語言和20種中文方言，支援自然語言風格控制和86種細粒度內聯標籤，並在Artificial Analysis語音競技場中排名第一。文章詳細介紹了模型架構、效能表現、開發者反饋及定價資訊。

Qwen-Audio-3.0-TTS提供Flash（約300毫秒首包延遲）和Plus（質量優先）兩個版本，均為API託管服務。
Plus版本在Artificial Analysis競技場Elo評分約1236，每百萬字元價格約27.59美元，但吞吐量僅約16字元/秒。

誰在害怕中國模型？

2026-07-21 01:09 UTC+8

本·湯普森提出美國應立法明確訓練資料為合理使用，並禁止禁止蒸餾的服務條款，以幫助美國開源模型與中國模型競爭。同時，阿里巴巴決定釋出Qwen 3.8 Max開源權重，可能受習近平鼓勵開源合作的講話影響。

本·湯普森建議美國立法將訓練資料收集定為合理使用，並禁止禁止蒸餾的服務條款。
蒸餾（即查詢API）幾乎無法阻止，美國應轉變政策，鼓勵透過訓練成果推動創新。

Kimi K3：開放權重升級

2026-07-21 00:06 UTC+8

Moonshot AI釋出了最新旗艦模型Kimi K3，這是一個2.8萬億引數的MoE模型，將於7月27日開放權重。K3在多項基準測試中排名靠前，成為最強的開源模型。文章探討了中美AI模型差距縮小、中國開源策略、開源模型的經濟影響以及中國AI的效率優勢。

Kimi K3是2.8T引數的MoE模型，開放權重，效能接近前沿閉源模型。
中國AI實驗室展示出獨立創新能力，而不僅僅是快速追隨。

中國給美國人工智慧霸主地位一記組合拳

2026-07-20 18:16 UTC+8

中國領先的人工智慧公司Moonshot和阿里巴巴釋出了新模型，聲稱能以更低成本與OpenAI和Anthropic的最佳模型競爭。這些開放原始碼的釋出加劇了中美技術競賽，並質疑美國鉅額投入是否能維持優勢。

Moonshot釋出Kimi K3，阿里巴巴推出Qwen3.8，均聲稱效能接近頂尖美國模型。
兩家公司強調模型開源，與美國的封閉策略形成對比。

我比較了5個AI程式設計訂閱的定價模式和使用限制

2026-07-20 14:59 UTC+8

2026年AI程式設計訂閱計劃採用不同的計費模式，如固定月費、每幾小時或每週重新整理配額等。本文比較了MiniMax、小米MiMo、GLM、Kimi Code和Canopy Wave五種計劃的定價、限制、整合和最佳用例，幫助開發者根據工作流選擇最合適的方案。

AI程式設計訂閱計劃計費模式各異，包括月度代幣、信用額度、時間重新整理配額及降級後繼續服務等。
MiniMax適合需要程式設計加多模態功能的開發者；小米MiMo提供低價入門和大額信用包；GLM適合生態使用者；Kimi Code提供第一方CLI/IDE體驗；Canopy Wave提供可預測的高容量API成本。

更好的開始，更好的結束：引導式迭代自我推理蒸餾用於壓縮推理

2026-07-20 12:00 UTC+8

本文提出BIRD，一種兩階段自我推理蒸餾方法，透過先取樣簡潔解並進行提示切換SFT，然後應用線上逆KL蒸餾，顯著提升了大語言模型在長鏈推理中的效率。在Qwen3-8B上，MATH-500準確率從86.2%提升至92.0%，同時響應長度從3099降至1115 tokens。

現有線上自我蒸餾方法存在初始化瓶頸，模型在噪聲和冗餘字首上訓練。
BIRD第一階段利用簡潔指令取樣和提示切換SFT將簡潔性轉化為預設行為。

2026年單張24GB GPU可執行的最佳本地LLM：Qwen、Gemma、Mistral、DeepSeek對比

2026-07-20 09:18 UTC+8

本文對比了六款適合單張24GB GPU（如RTX 3090/4090）的開放權重模型，涵蓋Qwen3.6、Gemma 4、Mistral Small等，並解釋了記憶體分配、量化策略以及各模型的優勢場景。

24GB是本地推理的實際起點，推薦使用20B-35B引數模型而非壓縮70B模型。
Qwen3.6-27B是最全面的通用選擇，DeepSeek-R1-Distill-Qwen-32B適合深度推理但佔用最高。

阿里巴巴預覽Qwen3.8-Max：2.4萬億引數多模態模型，緊隨Moonshot的Kimi K3開源釋出之後

2026-07-20 05:42 UTC+8

阿里巴巴Qwen團隊預覽了Qwen3.8-Max-Preview，一個2.4萬億引數的多模態MoE模型，號稱“僅次於Fable 5”。該預覽已在Token Plan、Qoder和QoderWork上以標準定價的10%提供。但尚未提供任何基準測試表、模型卡、許可證、每token價格或啟用引數數量。本文區分了阿里巴巴確認的內容和僅聲稱的內容。

Qwen3.8-Max-Preview已在Token Plan、Qoder和QoderWork上以10%的優惠價格提供。
2.4萬億引數和“僅次於Fable 5”的排名僅是阿里巴巴的聲稱，尚未有已驗證的基準測試。

Moonshot AI 因Kimi K3需求大增暫停新訂閱

2026-07-20 00:02 UTC+8

由於Kimi K3需求超出預期，Moonshot AI宣佈暫停新訂閱以保護現有使用者體驗。

Kimi K3需求在48小時內接近容量上限
為保護現有使用者，暫停新訂閱

序列雷達 #897：上週AI要聞：中國、壓縮與開放模型競賽

2026-07-19 19:00 UTC+8

本週AI領域多項重要進展：Thinking Machines釋出開源975B引數MoE模型Inkling，Moonshot AI推出2.8萬億引數Kimi K3，PrismML展示可在手機上執行的Bonsai 27B模型。OpenAI的GPT-Red透過自博弈實現自動化紅隊測試，並在測試中對GPT-5.1達到84%的攻破率。此外，習近平在上海世界人工智慧大會上強調開源AI作為全球公共品，呼籲國際合作。

Thinking Machines釋出開源模型Inkling：9750億引數，MoE架構，支援多模態和百萬標記上下文視窗
Moonshot AI推出Kimi K3：2.8萬億引數，啟用16個專家，針對長時編碼和知識工作

Qwen 3.8 Max

2026-07-19 18:41 UTC+8

Qwen 3.8 Max是Qwen系列的最新模型，已在其官網釋出。

Qwen 3.8 Max已釋出
可在Qwen官網獲取更多資訊

中國打擊AI伴侶，迫使數百萬使用者與虛擬伴侶分手

2026-07-19 09:53 UTC+8

中國出臺新規，禁止科技公司向未成年人提供AI或虛擬伴侶，並要求平臺限制使用者過度使用、禁止聊天機器人鼓勵情感依賴。此舉旨在阻止現實人際關係的弱化，並試圖扭轉持續下降的出生率。字節跳動、阿里巴巴和騰訊等科技巨頭已宣佈關閉個性化AI伴侶聊天功能，數百萬使用者被迫與虛擬伴侶告別。

新規禁止向未成年人提供AI伴侶，並限制所有聊天機器人鼓勵情感依賴。
中國政府擔憂AI伴侶會導致年輕人逃避現實婚姻和生育。

Kimi K3 vs DeepSeek V4 Pro vs GLM-5.2：開源萬億引數MoE模型基準測試、許可與成本對比

2026-07-19 09:41 UTC+8

中國三家實驗室的旗艦開源MoE模型——Kimi K3、DeepSeek V4 Pro和GLM-5.2——在基準測試、許可條款和服務成本上各有優劣。Kimi K3效能最強但僅限API，DeepSeek V4 Pro成本最低且立即開源，GLM-5.2平衡了速度與可部署性。

Kimi K3（2.8萬億引數）在Artificial Analysis智慧指數中以57分領先，但權重需等到7月27日才釋出。
DeepSeek V4 Pro（1.6萬億引數）MIT許可，成本僅為K3的1/17，適合注重價效比的團隊。

使用NVIDIA NeMo AutoModel對Qwen3進行LoRA微調：完整的單GPU Google Colab工作流教程

2026-07-19 09:08 UTC+8

本教程詳細介紹瞭如何在Google Colab上使用單個GPU，透過NVIDIA NeMo AutoModel對Qwen3-0.6B模型進行LoRA引數高效微調。涵蓋環境驗證、原始碼安裝、配方載入與調整、命令列訓練、模型評估以及Python API呼叫。

在Colab單GPU上搭建NeMo AutoModel環境
載入並修改Qwen3-0.6B LoRA微調配方

人工智慧繁榮建立在債務之上，投資者需求驟降，超大規模企業加速債券發行

2026-07-18 20:58 UTC+8

人工智慧（AI）繁榮日益依賴債務融資，但隨著超大規模企業加大債券發行，投資者需求卻在下降。亞馬遜最近的債券發行不得不提高收益率，訂單倍數下降。AI債券供應激增，但投資者要求更高利差。同時，中國AI模型Kimi K3的突破性效能引發對美國AI支出可持續性的擔憂，可能導致經濟衰退。

自2025年初以來，Alphabet、Meta、亞馬遜、甲骨文等公司已發行超過3000億美元債券。
投資者對AI債券的需求下降，亞馬遜債券訂單倍數從3.2倍降至2.5倍。

控制LLM中的推理努力程度

2026-07-18 19:16 UTC+8

本文探討了如何開發具有多種推理努力模式的模型，涵蓋從o1和DeepSeek-R1到GPT-5.6的推理模型演變，以及RLVR訓練、推理縮放、思考標記和推理模式切換等關鍵技術。

推理模型透過輸出中間推理軌跡逐步解決問題，與普通LLM不同。
RLVR訓練僅基於最終答案的正確性獎勵，不利用中間軌跡。

中國 AI

相關主題

中國 AI動態

Moonshot AI 釋出 2.8 萬億引數 Kimi K3 模型權重

為什麼中國會免費提供其最優秀的人工智慧模型

利用自然語言自編碼器探究Qwen2.5-7B中潛在的哥倫比亞身份推斷

Kimi K3並不便宜

如何使用百度的Unlimited-OCR構建高解析度影像和多頁PDF的端到端OCR流水線

AI本應惠及所有人，價籤卻說不

在16GB RAM的消費級電腦上執行GLM-4.5-Air (110B) 模型

白宮正試圖應對中國AI的崛起

Laguna S 2.1 釋出：比 Deepseek v4 Flash 更便宜，比 V4 Pro 更好

ChronoStitch：無需訓練的視覺KV記憶組合方法實現長時域推理

LISA：線性索引稀疏注意力助力高效長上下文推理

基於Intel TDX的NVIDIA H100機密GPU推理效能基準測試

中國AI最新動態：Kimi-K3、習近平在世界人工智慧大會上的講話，以及距離Mythos僅4個月

針對中國AI模型的制裁和實體清單指定已在考慮中

開放模型回顧：關於Kimi K3、Qwen 3.8、習在WAIC的講話、蒸餾、開放與封閉差距以及未來發展

大型語言模型的卷積方法

沒人願意承認的真相：無論中國與否，開放模型現在已具備競爭力

尼爾·布洛姆坎普的新殭屍AI“電影”不過是加熱的垃圾

吉姆·克萊默擔憂免費中國AI模型的安全問題

使用 NVIDIA srt-slurm、SLURM 配方、引數掃描和帕累託分析驗證分散式 LLM 服務基準測試

阿里Qwen 3.8 Max顯示中國正在縮小與美國模型的差距

NVIDIA Vera Rubin：每瓦效能領先，為全球合作伙伴提供最低令牌成本

“僅次於Fable 5”：阿里巴巴釋出Qwen3.8，但未提供任何真實資料

上週AI資訊 #251 - Mythos迴歸、Sonnet 5、Etched、LongCat

序列知識 #898：軌跡即教師：將推理蒸餾到小模型

LWiAI播客第248期：Claude Fable 5、Siri AI、Anthropic IPO等AI大事件

LWiAI播客第247期 - Opus 4.8, MAI, Anthropic IPO, Minimax-M3

中國開源權重模型便宜，華盛頓正在決定其代價

中國AI模型使特朗普的AI世界陷入內訌

儘管語言模型努力仍會犯錯：用於自糾正科學生成的共形預測

在推理之前已承諾：行為復現及開放權重LLM中答案預承諾的初步啟用水平證據

PlanFlip：透過規劃階段提示注入攻擊多智慧體LLM系統

[AINews] 今日似乎平靜，實則暗流湧動——AI新聞彙總7/18-7/20

加里·馬庫斯：美國無法在AI戰爭中“戰勝”中國，我們應該怎麼做？

阿里通義實驗室釋出Qwen-Audio-3.0-TTS：支援16種語言的Flash和Plus兩檔託管文本轉語音模型

誰在害怕中國模型？

Kimi K3：開放權重升級

中國給美國人工智慧霸主地位一記組合拳

我比較了5個AI程式設計訂閱的定價模式和使用限制

更好的開始，更好的結束：引導式迭代自我推理蒸餾用於壓縮推理

2026年單張24GB GPU可執行的最佳本地LLM：Qwen、Gemma、Mistral、DeepSeek對比

阿里巴巴預覽Qwen3.8-Max：2.4萬億引數多模態模型，緊隨Moonshot的Kimi K3開源釋出之後

Moonshot AI 因Kimi K3需求大增暫停新訂閱

序列雷達 #897：上週AI要聞：中國、壓縮與開放模型競賽

Qwen 3.8 Max

中國打擊AI伴侶，迫使數百萬使用者與虛擬伴侶分手

Kimi K3 vs DeepSeek V4 Pro vs GLM-5.2：開源萬億引數MoE模型基準測試、許可與成本對比

使用NVIDIA NeMo AutoModel對Qwen3進行LoRA微調：完整的單GPU Google Colab工作流教程

人工智慧繁榮建立在債務之上，投資者需求驟降，超大規模企業加速債券發行

控制LLM中的推理努力程度

更多增長標籤

AI 編程

MCP

開源模型

推理成本

Agent 框架

GPU 基礎設施

模型定價

DeepSeek

Qwen