Machine Learning Mastery AI 新聞來源

公開文章 26採集文章 28可信度 76刷新頻率 120 分鐘

健康狀態健康來源類型社群原文權限 站內改寫最近入庫 2026-06-24ID machine-learning-mastery運行狀態 已啟用

Machine learning education and applied AI source; summary-only unless authorization is obtained.

最新公開文章

上下文窗口並非記憶：AI智能體開發者需要理解的關鍵點

2026-06-24 20:00 UTC+8

本文解釋了為什麼大上下文窗口不等於智能體記憶，並介紹了檢索、壓縮和摘要技術如何在智能體的認知棧中協同工作，從而實現真正的記憶持久化。

上下文窗口是臨時工作區，不是持久記憶，模型是無狀態的。
檢索增強生成（RAG）可能引入矛盾，需要時間戳優先級解決。

使用LLM嵌入和HDBSCAN對非結構化文本進行聚類

2026-06-23 20:00 UTC+8

本文介紹瞭如何結合大語言模型嵌入和HDBSCAN密度聚類算法，構建文本聚類管道，自動發現未標註文本數據中的主題。包括使用預訓練模型生成嵌入、UMAP降維、HDBSCAN聚類及可視化。

使用sentence-transformers生成文本嵌入
通過UMAP將嵌入降維至5維

本文介紹瞭如何使用Playwright、browser-use和LangGraph在Python中構建能瀏覽和操作真實網站的AI代理。文章涵蓋了Playwright相較於Selenium的優勢（持久WebSocket連接、內置瀏覽器二進制、自動等待等）、環境搭建步驟、動態頁面抓取、多步驟表單填寫、反爬蟲處理、會話持久化以及Docker部署。通過實際代碼示例，讀者將學會構建一個能導航網站、填寫表單、提取結構化數據並通過LLM決策的瀏覽器代理。

Playwright通過持久WebSocket連接實現比Selenium快30-50%的瀏覽器操作，並內置自動等待和真實鼠標/鍵盤事件。
環境搭建僅需Python 3.10+、OpenAI API密鑰和幾個pip安裝命令，包括Playwright瀏覽器二進制文件。

使用Scikit-LLM構建端到端情感分析管道

2026-06-16 20:00 UTC+8

學習如何使用Scikit-LLM和Groq API提供的開源大語言模型構建情感分析管道，包括設置、數據集準備、管道構建和評估，在IMDB數據集上達到95%的準確率。

Scikit-LLM彌合了經典scikit-learn管道與現代LLM API調用之間的差距
通過Groq API使用Llama 3.1 8B等開源模型進行零樣本分類

每位AI工程師必須掌握的Python概念

2026-06-12 20:00 UTC+8

從編寫本地實驗腳本到構建可擴展的生產級AI系統，需要轉變Python編寫方式。本文介紹五種關鍵Python概念：生成器與惰性求值、上下文管理器、異步編程、數據類與Pydantic、魔術方法，幫助工程師管理內存、硬件資源、併發API調用和類型安全。

生成器通過惰性求值實現常數量內存開銷的數據流處理，如處理5萬條JSONL記錄時內存從25MB降至14MB。
上下文管理器通過with語句自動管理資源，避免泄漏，例如自定義InferenceProfiler安全切換模型模式並記錄延遲。

使用Scikit-LLM進行多標籤文本分類

2026-06-11 20:00 UTC+8

本文介紹如何利用Scikit-LLM和大型語言模型，無需標註數據即可實現多標籤文本分類。通過整合Groq提供的免費開源LLM，採用零樣本推理方式，並基於真實數據集go_emotions演示情感多標籤分類。步驟包括庫安裝、API配置、分類器初始化、數據集加載及預測執行，展示一條文本可同時獲得多個情感標籤。

Scikit-LLM封裝LLM，支持零樣本多標籤分類，無需訓練數據。
使用Groq免費API和llama-3.3-70b-versatile模型進行推理。

使用Transformers.js在瀏覽器中實現圖像與語音的多模態AI

2026-06-10 19:35 UTC+8

本文介紹瞭如何使用Transformers.js在瀏覽器中構建多模態AI應用，包括圖像分類、圖像描述和語音轉錄。所有模型完全在客户端運行，無需服務器或API密鑰，保護用户隱私。文章提供了詳細的代碼示例和項目結構，指導開發者一步步實現。

瀏覽器內實現多模態AI：圖像分類、圖像描述和語音轉錄。
使用Transformers.js，模型在客户端運行，數據不離開設備。

AgentOps實踐指南

2026-06-08 23:21 UTC+8

AgentOps是自主AI代理在生產環境中的運維框架，涵蓋可觀測性、評估、成本治理、安全防護和持續改進五大支柱。本文介紹了AgentOps與傳統LLM監控的區別、工具生態系統、一個完整的工作代碼示例，以及如何通過會話回放調試代理故障。

AgentOps為自主AI代理提供運維支撐，確保行為可解釋、可測量並與業務目標一致。
AgentOps的五大支柱：可觀測性、評估、成本治理、安全防護和持續改進。

使用Scikit-LLM與開源大語言模型

2026-06-04 20:55 UTC+8

本文介紹如何通過Ollama和Scikit-LLM Python庫，免費使用本地託管的開源大語言模型（如Llama 3、Mistral和Gemma）進行文本分類任務。

安裝Ollama並下載開源模型到本地運行。
配置Scikit-LLM將請求路由到本地Ollama端點。

Scikit-LLM 與傳統文本分類器：何時應使用 LLM？

2026-06-02 20:00 UTC+8

本文比較了三種文本分類方法：TF-IDF 結合邏輯迴歸、零樣本 BART 以及使用 Groq LLM 的 Scikit-LLM。在一個合成客户支持數據集上，Scikit-LLM 準確率最高（87%），延遲低於 BART，特別適用於數據量小且需要深度語言理解的任務。

TF-IDF + 邏輯迴歸最快但準確率最低（約 53%）
零樣本 BART 較慢，準確率中等（約 67%）

掌握LLMOps的路線圖：2026年指南

2026-06-01 20:00 UTC+8

本文提供了一個結構化的六步LLMOps路線圖，涵蓋可觀測性、評估、成本控制和代理編排，幫助您構建生產級LLM系統。預計LLMOps市場將從2024年的19.7億美元增長到2028年的49億美元，複合年增長率為42%。

LLMOps與傳統MLOps不同，重點在於提示版本控制、非確定性輸出評估和成本優化。
在開始LLMOps工具之前，需要掌握Python、LLM基礎、雲基礎設施和版本控制。

為長期運行代理構建上下文修剪管道

2026-05-28 20:00 UTC+8

本文介紹瞭如何為長期運行的AI代理實現上下文修剪管道，通過語義相似度動態管理對話記憶，降低成本並提高效率。涵蓋了使用句子變換器嵌入模型計算相似度、構建修剪後的上下文窗口等步驟。

長期運行的AI代理面臨對話歷史無限增長的問題，導致令牌成本高和推理性能下降。
上下文修剪管道通過保留當前提示、最近對話輪次和語義相似的歷史輪次來優化上下文。

令牌選擇的統計：Logits、温度與Top-P詳解

2026-05-27 20:00 UTC+8

本文深入探討了大語言模型中logits、温度和top-p採樣如何協同工作以控制下一個令牌的預測。文章詳細解釋了logits的來源、温度和top-p對概率分佈的影響，以及它們如何構成一個順序管道來生成LLM輸出。最後，提供瞭如何根據實際應用場景選擇温度和top-p值的建議。

Logits是神經網絡最後一層輸出的原始未歸一化分數，經過softmax轉換為概率分佈。
温度參數通過縮放logits來調整概率分佈的平坦度，高温度增加創意性，低温度增加確定性。

構建具備錯誤恢復能力的多工具Gemma 4智能體

2026-05-26 20:00 UTC+8

本文展示瞭如何將一個基礎的工具調用腳本轉變為一個能夠優雅處理工具失敗、模型輸出錯誤和服務不可用等問題的彈性智能體。涵蓋了迭代式智能體循環、四種不同的錯誤恢復模式以及如何設計信息豐富的錯誤消息以幫助模型自我糾正。

學習構建帶迭代次數安全上限的智能體循環。
掌握智能體調用工具時遇到的四種失敗類別及處理方法。

在RAG中實現混合語義-詞彙搜索

2026-05-25 20:00 UTC+8

本文介紹瞭如何在檢索增強生成(RAG)系統中構建混合搜索策略，結合BM25詞彙搜索與語義搜索，並通過互惠排名融合(RRF)合併排名。詳細説明了Python實現步驟，包括數據集加載、BM25和語義搜索函數的編寫，以及混合搜索的整合。實驗表明，混合搜索在小型數據集上也能取得合理結果，優於單獨使用任一方法。

混合搜索結合BM25詞彙搜索和語義搜索，彌補各自的盲點。
使用互惠排名融合(RRF)將兩種搜索的排名結果合併。

使用LLM嵌入與元數據在Python中構建上下文感知搜索

2026-05-22 20:00 UTC+8

本文介紹如何構建一個結合嵌入相似性與結構化元數據過濾的上下文感知語義搜索引擎，涵蓋從生成嵌入到持久化索引的全過程。

利用sentence-transformers生成384維嵌入向量
在評分之前先進行元數據過濾以提高效率

為非確定性代理實施統計護欄

2026-05-05 20:00 UTC+8

非確定性代理是指相同輸入可能產生不同輸出的代理。本文探討了如何通過統計護欄來管理和評估這些代理的行為，確保其可靠性和安全性。

非確定性代理的輸入相同但輸出可能不同。
統計護欄用於監控代理行為，防止異常輸出。

代理型RAG：按三個難度級別解釋

2026-05-04 20:00 UTC+8

本文以初學者、中級和高級三個層次解釋代理型RAG（檢索增強生成）的概念。它介紹了基礎原理、架構設計以及在實際應用中的優勢與挑戰，幫助讀者根據自身水平理解這一新興技術。

代理型RAG結合了檢索系統和生成模型，能夠自主選擇何時檢索外部知識。
文章從三個難度級別逐步深入：簡單類比、技術實現和前沿研究。

有效KV壓縮：TurboQuant

2026-04-30 20:00 UTC+8

谷歌推出TurboQuant，一種用於大語言模型和向量搜索引擎的新型算法套件和庫，旨在實現先進的量化與壓縮，是RAG系統的關鍵組件。

TurboQuant是谷歌推出的新算法和庫，用於LLM和向量搜索引擎的量化與壓縮。
它針對RAG系統中的向量搜索進行了優化，提升效率。

使用Pydantic AI在Python中構建AI代理

2026-04-29 20:00 UTC+8

學習如何使用Pydantic AI框架在Python中構建生產級的AI代理，涵蓋結構化輸出、自定義工具和依賴注入，以及Web搜索和擴展推理等內置功能。

定義Pydantic模型以實現類型安全的代理輸出，框架自動驗證並重試。
使用@agent.tool_plain或@agent.tool註冊Python函數作為可調用工具。

AI代理有效上下文工程：開發者指南

2026-04-28 20:00 UTC+8

本文深入探討了AI代理的上下文工程，強調將上下文窗口視為有限資源，並系統性地處理靜態與動態上下文、歷史管理、檢索預算及生產環境下的質量評估，以提高代理的可靠性、成本效益和準確性。

上下文窗口應視為受約束的資源，需平衡財務與認知成本。
分離靜態和動態上下文，利用前綴緩存優化性能。

使用Scikit-LLM進行文本摘要

2026-04-27 20:00 UTC+8

本文介紹如何使用Scikit-LLM庫中的文本摘要功能，通過構建自定義轉換器集成Hugging Face的預訓練摘要模型，並將其嵌入scikit-learn流水線中，實現從長文本到分類的端到端流程。

Scikit-LLM橋接傳統機器學習與大語言模型，提供零樣本和少樣本分類及文本摘要功能。
自定義HuggingFaceSummarizer類繼承自BaseEstimator和TransformerMixin，可加載預訓練摘要模型並生成摘要。

使用本地小語言模型構建AI代理

2026-04-23 20:00 UTC+8

本文介紹瞭如何在自己的計算機上使用小型語言模型（SLM）構建完全本地運行的AI代理，無需互聯網連接或API費用。涵蓋AI代理和SLM的概念、本地運行的優勢、Ollama和LangChain的設置、逐步構建代理以及添加記憶和工具的方法，並討論了SLM的侷限性。

AI代理是使用語言模型進行推理和決策的程序，比普通聊天機器人更強大。
小型語言模型（如Phi-3、Mistral 7B）可在標準硬件上運行，提供隱私和零成本。

使用 FastAPI 訓練、部署和使用 Scikit-learn 模型

2026-04-22 20:00 UTC+8

本文詳細介紹瞭如何使用 FastAPI 構建一個 Scikit-learn 機器學習模型的推理 API。從項目設置、模型訓練、本地測試到雲端部署，完整地演示了將乳腺癌分類器轉化為可調用 API 的過程。

使用 FastAPI 快速構建輕量級機器學習模型 API
完整流程包括項目結構、模型訓練、本地測試與雲部署

AI代理記憶的三級難度解析

2026-04-21 20:00 UTC+8

本文從三個難度級別解釋AI代理記憶：無狀態LLM代理的根本記憶問題，主要記憶類型（上下文內記憶和外部記憶），以及可擴展架構（包括寫入策略、檢索方法、衰減處理和多方代理一致性）。為構建能隨時間改進的代理提供實用見解。

無狀態LLM代理沒有持久記憶，使多步任務和個性化變得困難。
上下文內記憶利用上下文窗口處理當前狀態；外部記憶通過檢索（向量搜索、結構化查詢）實現持久存儲。

零樣本文本分類入門

2026-04-20 20:00 UTC+8

零樣本文本分類允許在沒有任務特定訓練數據的情況下對文本進行標記，通過將標籤轉化為自然語言陳述並使用預訓練模型判斷文本是否支持該陳述。本文介紹了其工作原理、使用facebook/bart-large-mnli模型進行單標籤和多標籤分類的方法，以及如何通過自定義假設模板提高性能。

零樣本分類將標籤轉化為自然語言陳述，通過推理判斷文本是否支持該陳述。
使用Hugging Face pipeline和預訓練模型可以輕鬆實現零樣本文本分類。

Machine Learning Mastery