AI News HubLIVE
公開文章 26採集文章 28可信度 76刷新頻率 120 分鐘
健康狀態 健康來源類型 社群原文權限 站內改寫最近入庫 2026-06-24ID machine-learning-mastery運行狀態 已啟用

Machine learning education and applied AI source; summary-only unless authorization is obtained.

最新公開文章

上下文視窗並非記憶:AI智慧體開發者需要理解的關鍵點

本文解釋了為什麼大上下文視窗不等於智慧體記憶,並介紹了檢索、壓縮和摘要技術如何在智慧體的認知棧中協同工作,從而實現真正的記憶持久化。

  • 上下文視窗是臨時工作區,不是持久記憶,模型是無狀態的。
  • 檢索增強生成(RAG)可能引入矛盾,需要時間戳優先順序解決。
站內正文

使用LLM嵌入和HDBSCAN對非結構化文本進行聚類

本文介紹瞭如何結合大語言模型嵌入和HDBSCAN密度聚類演算法,構建文本聚類管道,自動發現未標註文本資料中的主題。包括使用預訓練模型生成嵌入、UMAP降維、HDBSCAN聚類及視覺化。

  • 使用sentence-transformers生成文本嵌入
  • 透過UMAP將嵌入降維至5維
站內正文

用Python構建能使用瀏覽器的AI代理

本文介紹瞭如何使用Playwright、browser-use和LangGraph在Python中構建能瀏覽和操作真實網站的AI代理。文章涵蓋了Playwright相較於Selenium的優勢(持久WebSocket連線、內建瀏覽器二進位制、自動等待等)、環境搭建步驟、動態頁面抓取、多步驟表單填寫、反爬蟲處理、會話持久化以及Docker部署。透過實際程式碼示例,讀者將學會構建一個能導航網站、填寫表單、提取結構化資料並透過LLM決策的瀏覽器代理。

  • Playwright透過持久WebSocket連線實現比Selenium快30-50%的瀏覽器操作,並內建自動等待和真實滑鼠/鍵盤事件。
  • 環境搭建僅需Python 3.10+、OpenAI API金鑰和幾個pip安裝命令,包括Playwright瀏覽器二進位制檔案。
站內正文

使用Scikit-LLM構建端到端情感分析管道

學習如何使用Scikit-LLM和Groq API提供的開源大語言模型構建情感分析管道,包括設定、資料集準備、管道構建和評估,在IMDB資料集上達到95%的準確率。

  • Scikit-LLM彌合了經典scikit-learn管道與現代LLM API呼叫之間的差距
  • 透過Groq API使用Llama 3.1 8B等開源模型進行零樣本分類
站內正文

每位AI工程師必須掌握的Python概念

從編寫本地實驗指令碼到構建可擴充套件的生產級AI系統,需要轉變Python編寫方式。本文介紹五種關鍵Python概念:生成器與惰性求值、上下文管理器、非同步程式設計、資料類與Pydantic、魔術方法,幫助工程師管理記憶體、硬體資源、併發API呼叫和型別安全。

  • 生成器透過惰性求值實現常數量記憶體開銷的資料流處理,如處理5萬條JSONL記錄時記憶體從25MB降至14MB。
  • 上下文管理器透過with語句自動管理資源,避免洩漏,例如自定義InferenceProfiler安全切換模型模式並記錄延遲。
站內正文

使用Scikit-LLM進行多標籤文本分類

本文介紹如何利用Scikit-LLM和大型語言模型,無需標註資料即可實現多標籤文本分類。透過整合Groq提供的免費開源LLM,採用零樣本推理方式,並基於真實資料集go_emotions演示情感多標籤分類。步驟包括庫安裝、API配置、分類器初始化、資料集載入及預測執行,展示一條文本可同時獲得多個情感標籤。

  • Scikit-LLM封裝LLM,支援零樣本多標籤分類,無需訓練資料。
  • 使用Groq免費API和llama-3.3-70b-versatile模型進行推理。
站內正文

使用Transformers.js在瀏覽器中實現影像與語音的多模態AI

本文介紹瞭如何使用Transformers.js在瀏覽器中構建多模態AI應用,包括影像分類、影像描述和語音轉錄。所有模型完全在客戶端執行,無需伺服器或API金鑰,保護使用者隱私。文章提供了詳細的程式碼示例和專案結構,指導開發者一步步實現。

  • 瀏覽器內實現多模態AI:影像分類、影像描述和語音轉錄。
  • 使用Transformers.js,模型在客戶端執行,資料不離開裝置。
站內正文

AgentOps實踐指南

AgentOps是自主AI代理在生產環境中的運維框架,涵蓋可觀測性、評估、成本治理、安全防護和持續改進五大支柱。本文介紹了AgentOps與傳統LLM監控的區別、工具生態系統、一個完整的工作程式碼示例,以及如何透過會話回放除錯代理故障。

  • AgentOps為自主AI代理提供運維支撐,確保行為可解釋、可測量並與業務目標一致。
  • AgentOps的五大支柱:可觀測性、評估、成本治理、安全防護和持續改進。
站內正文

使用Scikit-LLM與開源大語言模型

本文介紹如何透過Ollama和Scikit-LLM Python庫,免費使用本地託管的開源大語言模型(如Llama 3、Mistral和Gemma)進行文本分類任務。

  • 安裝Ollama並下載開源模型到本地執行。
  • 配置Scikit-LLM將請求路由到本地Ollama端點。
站內正文

Scikit-LLM 與傳統文本分類器:何時應使用 LLM?

本文比較了三種文本分類方法:TF-IDF 結合邏輯迴歸、零樣本 BART 以及使用 Groq LLM 的 Scikit-LLM。在一個合成客戶支援資料集上,Scikit-LLM 準確率最高(87%),延遲低於 BART,特別適用於資料量小且需要深度語言理解的任務。

  • TF-IDF + 邏輯迴歸最快但準確率最低(約 53%)
  • 零樣本 BART 較慢,準確率中等(約 67%)
站內正文

掌握LLMOps的路線圖:2026年指南

本文提供了一個結構化的六步LLMOps路線圖,涵蓋可觀測性、評估、成本控制和代理編排,幫助您構建生產級LLM系統。預計LLMOps市場將從2024年的19.7億美元增長到2028年的49億美元,複合年增長率為42%。

  • LLMOps與傳統MLOps不同,重點在於提示版本控制、非確定性輸出評估和成本最佳化。
  • 在開始LLMOps工具之前,需要掌握Python、LLM基礎、雲基礎設施和版本控制。
站內正文

為長期執行代理構建上下文修剪管道

本文介紹瞭如何為長期執行的AI代理實現上下文修剪管道,透過語義相似度動態管理對話記憶,降低成本並提高效率。涵蓋了使用句子變換器嵌入模型計算相似度、構建修剪後的上下文視窗等步驟。

  • 長期執行的AI代理面臨對話歷史無限增長的問題,導致令牌成本高和推理效能下降。
  • 上下文修剪管道透過保留當前提示、最近對話輪次和語義相似的歷史輪次來最佳化上下文。
站內正文

令牌選擇的統計:Logits、溫度與Top-P詳解

本文深入探討了大語言模型中logits、溫度和top-p取樣如何協同工作以控制下一個令牌的預測。文章詳細解釋了logits的來源、溫度和top-p對機率分佈的影響,以及它們如何構成一個順序管道來生成LLM輸出。最後,提供瞭如何根據實際應用場景選擇溫度和top-p值的建議。

  • Logits是神經網路最後一層輸出的原始未歸一化分數,經過softmax轉換為機率分佈。
  • 溫度引數透過縮放logits來調整機率分佈的平坦度,高溫度增加創意性,低溫度增加確定性。
站內正文

構建具備錯誤恢復能力的多工具Gemma 4智慧體

本文展示瞭如何將一個基礎的工具呼叫指令碼轉變為一個能夠優雅處理工具失敗、模型輸出錯誤和服務不可用等問題的彈性智慧體。涵蓋了迭代式智慧體迴圈、四種不同的錯誤恢復模式以及如何設計資訊豐富的錯誤訊息以幫助模型自我糾正。

  • 學習構建帶迭代次數安全上限的智慧體迴圈。
  • 掌握智慧體呼叫工具時遇到的四種失敗類別及處理方法。
站內正文

在RAG中實現混合語義-詞彙搜尋

本文介紹瞭如何在檢索增強生成(RAG)系統中構建混合搜尋策略,結合BM25詞彙搜尋與語義搜尋,並透過互惠排名融合(RRF)合併排名。詳細說明了Python實現步驟,包括資料集載入、BM25和語義搜尋函式的編寫,以及混合搜尋的整合。實驗表明,混合搜尋在小型資料集上也能取得合理結果,優於單獨使用任一方法。

  • 混合搜尋結合BM25詞彙搜尋和語義搜尋,彌補各自的盲點。
  • 使用互惠排名融合(RRF)將兩種搜尋的排名結果合併。
站內正文

使用LLM嵌入與後設資料在Python中構建上下文感知搜尋

本文介紹如何構建一個結合嵌入相似性與結構化後設資料過濾的上下文感知語義搜尋引擎,涵蓋從生成嵌入到持久化索引的全過程。

  • 利用sentence-transformers生成384維嵌入向量
  • 在評分之前先進行後設資料過濾以提高效率
站內正文

為非確定性代理實施統計護欄

非確定性代理是指相同輸入可能產生不同輸出的代理。本文探討了如何透過統計護欄來管理和評估這些代理的行為,確保其可靠性和安全性。

  • 非確定性代理的輸入相同但輸出可能不同。
  • 統計護欄用於監控代理行為,防止異常輸出。
站內正文

代理型RAG:按三個難度級別解釋

本文以初學者、中級和高階三個層次解釋代理型RAG(檢索增強生成)的概念。它介紹了基礎原理、架構設計以及在實際應用中的優勢與挑戰,幫助讀者根據自身水平理解這一新興技術。

  • 代理型RAG結合了檢索系統和生成模型,能夠自主選擇何時檢索外部知識。
  • 文章從三個難度級別逐步深入:簡單類比、技術實現和前沿研究。
站內正文

有效KV壓縮:TurboQuant

谷歌推出TurboQuant,一種用於大語言模型和向量搜尋引擎的新型演算法套件和庫,旨在實現先進的量化與壓縮,是RAG系統的關鍵元件。

  • TurboQuant是谷歌推出的新演算法和庫,用於LLM和向量搜尋引擎的量化與壓縮。
  • 它針對RAG系統中的向量搜尋進行了最佳化,提升效率。
站內正文

使用Pydantic AI在Python中構建AI代理

學習如何使用Pydantic AI框架在Python中構建生產級的AI代理,涵蓋結構化輸出、自定義工具和依賴注入,以及Web搜尋和擴充套件推理等內建功能。

  • 定義Pydantic模型以實現型別安全的代理輸出,框架自動驗證並重試。
  • 使用@agent.tool_plain或@agent.tool註冊Python函式作為可呼叫工具。
站內正文

AI代理有效上下文工程:開發者指南

本文深入探討了AI代理的上下文工程,強調將上下文視窗視為有限資源,並系統性地處理靜態與動態上下文、歷史管理、檢索預算及生產環境下的質量評估,以提高代理的可靠性、成本效益和準確性。

  • 上下文視窗應視為受約束的資源,需平衡財務與認知成本。
  • 分離靜態和動態上下文,利用字首快取最佳化效能。
站內正文

使用Scikit-LLM進行文本摘要

本文介紹如何使用Scikit-LLM庫中的文本摘要功能,透過構建自定義轉換器整合Hugging Face的預訓練摘要模型,並將其嵌入scikit-learn流水線中,實現從長文本到分類的端到端流程。

  • Scikit-LLM橋接傳統機器學習與大語言模型,提供零樣本和少樣本分類及文本摘要功能。
  • 自定義HuggingFaceSummarizer類繼承自BaseEstimator和TransformerMixin,可載入預訓練摘要模型並生成摘要。
站內正文

使用本地小語言模型構建AI代理

本文介紹瞭如何在自己的計算機上使用小型語言模型(SLM)構建完全本地執行的AI代理,無需網際網路連線或API費用。涵蓋AI代理和SLM的概念、本地執行的優勢、Ollama和LangChain的設定、逐步構建代理以及新增記憶和工具的方法,並討論了SLM的侷限性。

  • AI代理是使用語言模型進行推理和決策的程式,比普通聊天機器人更強大。
  • 小型語言模型(如Phi-3、Mistral 7B)可在標準硬體上執行,提供隱私和零成本。
站內正文

使用 FastAPI 訓練、部署和使用 Scikit-learn 模型

本文詳細介紹瞭如何使用 FastAPI 構建一個 Scikit-learn 機器學習模型的推理 API。從專案設定、模型訓練、本地測試到雲端部署,完整地演示了將乳腺癌分類器轉化為可呼叫 API 的過程。

  • 使用 FastAPI 快速構建輕量級機器學習模型 API
  • 完整流程包括專案結構、模型訓練、本地測試與雲部署
站內正文

AI代理記憶的三級難度解析

本文從三個難度級別解釋AI代理記憶:無狀態LLM代理的根本記憶問題,主要記憶型別(上下文內記憶和外部記憶),以及可擴充套件架構(包括寫入策略、檢索方法、衰減處理和多方代理一致性)。為構建能隨時間改進的代理提供實用見解。

  • 無狀態LLM代理沒有持久記憶,使多步任務和個性化變得困難。
  • 上下文內記憶利用上下文視窗處理當前狀態;外部記憶透過檢索(向量搜尋、結構化查詢)實現持久儲存。
站內正文

零樣本文本分類入門

零樣本文本分類允許在沒有任務特定訓練資料的情況下對文本進行標記,透過將標籤轉化為自然語言陳述並使用預訓練模型判斷文本是否支援該陳述。本文介紹了其工作原理、使用facebook/bart-large-mnli模型進行單標籤和多標籤分類的方法,以及如何透過自定義假設模板提高效能。

  • 零樣本分類將標籤轉化為自然語言陳述,透過推理判斷文本是否支援該陳述。
  • 使用Hugging Face pipeline和預訓練模型可以輕鬆實現零樣本文本分類。
站內正文

全部來源