上下文視窗並非記憶:AI智慧體開發者需要理解的關鍵點
本文解釋了為什麼大上下文視窗不等於智慧體記憶,並介紹了檢索、壓縮和摘要技術如何在智慧體的認知棧中協同工作,從而實現真正的記憶持久化。
- 上下文視窗是臨時工作區,不是持久記憶,模型是無狀態的。
- 檢索增強生成(RAG)可能引入矛盾,需要時間戳優先順序解決。
來源詳情
AI News Hub 持續追蹤 Machine Learning Mastery 的 AI 更新,並公開來源狀態、授權邊界、抓取方式和已發布文章。
Machine learning education and applied AI source; summary-only unless authorization is obtained.
本文解釋了為什麼大上下文視窗不等於智慧體記憶,並介紹了檢索、壓縮和摘要技術如何在智慧體的認知棧中協同工作,從而實現真正的記憶持久化。
本文介紹瞭如何結合大語言模型嵌入和HDBSCAN密度聚類演算法,構建文本聚類管道,自動發現未標註文本資料中的主題。包括使用預訓練模型生成嵌入、UMAP降維、HDBSCAN聚類及視覺化。
本文介紹瞭如何使用Playwright、browser-use和LangGraph在Python中構建能瀏覽和操作真實網站的AI代理。文章涵蓋了Playwright相較於Selenium的優勢(持久WebSocket連線、內建瀏覽器二進位制、自動等待等)、環境搭建步驟、動態頁面抓取、多步驟表單填寫、反爬蟲處理、會話持久化以及Docker部署。透過實際程式碼示例,讀者將學會構建一個能導航網站、填寫表單、提取結構化資料並透過LLM決策的瀏覽器代理。
學習如何使用Scikit-LLM和Groq API提供的開源大語言模型構建情感分析管道,包括設定、資料集準備、管道構建和評估,在IMDB資料集上達到95%的準確率。
從編寫本地實驗指令碼到構建可擴充套件的生產級AI系統,需要轉變Python編寫方式。本文介紹五種關鍵Python概念:生成器與惰性求值、上下文管理器、非同步程式設計、資料類與Pydantic、魔術方法,幫助工程師管理記憶體、硬體資源、併發API呼叫和型別安全。
本文介紹如何利用Scikit-LLM和大型語言模型,無需標註資料即可實現多標籤文本分類。透過整合Groq提供的免費開源LLM,採用零樣本推理方式,並基於真實資料集go_emotions演示情感多標籤分類。步驟包括庫安裝、API配置、分類器初始化、資料集載入及預測執行,展示一條文本可同時獲得多個情感標籤。
本文介紹瞭如何使用Transformers.js在瀏覽器中構建多模態AI應用,包括影像分類、影像描述和語音轉錄。所有模型完全在客戶端執行,無需伺服器或API金鑰,保護使用者隱私。文章提供了詳細的程式碼示例和專案結構,指導開發者一步步實現。
AgentOps是自主AI代理在生產環境中的運維框架,涵蓋可觀測性、評估、成本治理、安全防護和持續改進五大支柱。本文介紹了AgentOps與傳統LLM監控的區別、工具生態系統、一個完整的工作程式碼示例,以及如何透過會話回放除錯代理故障。
本文介紹如何透過Ollama和Scikit-LLM Python庫,免費使用本地託管的開源大語言模型(如Llama 3、Mistral和Gemma)進行文本分類任務。
本文比較了三種文本分類方法:TF-IDF 結合邏輯迴歸、零樣本 BART 以及使用 Groq LLM 的 Scikit-LLM。在一個合成客戶支援資料集上,Scikit-LLM 準確率最高(87%),延遲低於 BART,特別適用於資料量小且需要深度語言理解的任務。
本文提供了一個結構化的六步LLMOps路線圖,涵蓋可觀測性、評估、成本控制和代理編排,幫助您構建生產級LLM系統。預計LLMOps市場將從2024年的19.7億美元增長到2028年的49億美元,複合年增長率為42%。
本文介紹瞭如何為長期執行的AI代理實現上下文修剪管道,透過語義相似度動態管理對話記憶,降低成本並提高效率。涵蓋了使用句子變換器嵌入模型計算相似度、構建修剪後的上下文視窗等步驟。
本文深入探討了大語言模型中logits、溫度和top-p取樣如何協同工作以控制下一個令牌的預測。文章詳細解釋了logits的來源、溫度和top-p對機率分佈的影響,以及它們如何構成一個順序管道來生成LLM輸出。最後,提供瞭如何根據實際應用場景選擇溫度和top-p值的建議。
本文展示瞭如何將一個基礎的工具呼叫指令碼轉變為一個能夠優雅處理工具失敗、模型輸出錯誤和服務不可用等問題的彈性智慧體。涵蓋了迭代式智慧體迴圈、四種不同的錯誤恢復模式以及如何設計資訊豐富的錯誤訊息以幫助模型自我糾正。
本文介紹瞭如何在檢索增強生成(RAG)系統中構建混合搜尋策略,結合BM25詞彙搜尋與語義搜尋,並透過互惠排名融合(RRF)合併排名。詳細說明了Python實現步驟,包括資料集載入、BM25和語義搜尋函式的編寫,以及混合搜尋的整合。實驗表明,混合搜尋在小型資料集上也能取得合理結果,優於單獨使用任一方法。
本文介紹如何構建一個結合嵌入相似性與結構化後設資料過濾的上下文感知語義搜尋引擎,涵蓋從生成嵌入到持久化索引的全過程。
非確定性代理是指相同輸入可能產生不同輸出的代理。本文探討了如何透過統計護欄來管理和評估這些代理的行為,確保其可靠性和安全性。
本文以初學者、中級和高階三個層次解釋代理型RAG(檢索增強生成)的概念。它介紹了基礎原理、架構設計以及在實際應用中的優勢與挑戰,幫助讀者根據自身水平理解這一新興技術。
谷歌推出TurboQuant,一種用於大語言模型和向量搜尋引擎的新型演算法套件和庫,旨在實現先進的量化與壓縮,是RAG系統的關鍵元件。
學習如何使用Pydantic AI框架在Python中構建生產級的AI代理,涵蓋結構化輸出、自定義工具和依賴注入,以及Web搜尋和擴充套件推理等內建功能。
本文深入探討了AI代理的上下文工程,強調將上下文視窗視為有限資源,並系統性地處理靜態與動態上下文、歷史管理、檢索預算及生產環境下的質量評估,以提高代理的可靠性、成本效益和準確性。
本文介紹如何使用Scikit-LLM庫中的文本摘要功能,透過構建自定義轉換器整合Hugging Face的預訓練摘要模型,並將其嵌入scikit-learn流水線中,實現從長文本到分類的端到端流程。
本文介紹瞭如何在自己的計算機上使用小型語言模型(SLM)構建完全本地執行的AI代理,無需網際網路連線或API費用。涵蓋AI代理和SLM的概念、本地執行的優勢、Ollama和LangChain的設定、逐步構建代理以及新增記憶和工具的方法,並討論了SLM的侷限性。
本文詳細介紹瞭如何使用 FastAPI 構建一個 Scikit-learn 機器學習模型的推理 API。從專案設定、模型訓練、本地測試到雲端部署,完整地演示了將乳腺癌分類器轉化為可呼叫 API 的過程。
本文從三個難度級別解釋AI代理記憶:無狀態LLM代理的根本記憶問題,主要記憶型別(上下文內記憶和外部記憶),以及可擴充套件架構(包括寫入策略、檢索方法、衰減處理和多方代理一致性)。為構建能隨時間改進的代理提供實用見解。
零樣本文本分類允許在沒有任務特定訓練資料的情況下對文本進行標記,透過將標籤轉化為自然語言陳述並使用預訓練模型判斷文本是否支援該陳述。本文介紹了其工作原理、使用facebook/bart-large-mnli模型進行單標籤和多標籤分類的方法,以及如何透過自定義假設模板提高效能。