上下文窗口並非記憶:AI智能體開發者需要理解的關鍵點
本文解釋了為什麼大上下文窗口不等於智能體記憶,並介紹了檢索、壓縮和摘要技術如何在智能體的認知棧中協同工作,從而實現真正的記憶持久化。
- 上下文窗口是臨時工作區,不是持久記憶,模型是無狀態的。
- 檢索增強生成(RAG)可能引入矛盾,需要時間戳優先級解決。
來源詳情
AI News Hub 持續追蹤 Machine Learning Mastery 的 AI 更新,並公開來源狀態、授權邊界、抓取方式和已發布文章。
Machine learning education and applied AI source; summary-only unless authorization is obtained.
本文解釋了為什麼大上下文窗口不等於智能體記憶,並介紹了檢索、壓縮和摘要技術如何在智能體的認知棧中協同工作,從而實現真正的記憶持久化。
本文介紹瞭如何結合大語言模型嵌入和HDBSCAN密度聚類算法,構建文本聚類管道,自動發現未標註文本數據中的主題。包括使用預訓練模型生成嵌入、UMAP降維、HDBSCAN聚類及可視化。
本文介紹瞭如何使用Playwright、browser-use和LangGraph在Python中構建能瀏覽和操作真實網站的AI代理。文章涵蓋了Playwright相較於Selenium的優勢(持久WebSocket連接、內置瀏覽器二進制、自動等待等)、環境搭建步驟、動態頁面抓取、多步驟表單填寫、反爬蟲處理、會話持久化以及Docker部署。通過實際代碼示例,讀者將學會構建一個能導航網站、填寫表單、提取結構化數據並通過LLM決策的瀏覽器代理。
學習如何使用Scikit-LLM和Groq API提供的開源大語言模型構建情感分析管道,包括設置、數據集準備、管道構建和評估,在IMDB數據集上達到95%的準確率。
從編寫本地實驗腳本到構建可擴展的生產級AI系統,需要轉變Python編寫方式。本文介紹五種關鍵Python概念:生成器與惰性求值、上下文管理器、異步編程、數據類與Pydantic、魔術方法,幫助工程師管理內存、硬件資源、併發API調用和類型安全。
本文介紹如何利用Scikit-LLM和大型語言模型,無需標註數據即可實現多標籤文本分類。通過整合Groq提供的免費開源LLM,採用零樣本推理方式,並基於真實數據集go_emotions演示情感多標籤分類。步驟包括庫安裝、API配置、分類器初始化、數據集加載及預測執行,展示一條文本可同時獲得多個情感標籤。
本文介紹瞭如何使用Transformers.js在瀏覽器中構建多模態AI應用,包括圖像分類、圖像描述和語音轉錄。所有模型完全在客户端運行,無需服務器或API密鑰,保護用户隱私。文章提供了詳細的代碼示例和項目結構,指導開發者一步步實現。
AgentOps是自主AI代理在生產環境中的運維框架,涵蓋可觀測性、評估、成本治理、安全防護和持續改進五大支柱。本文介紹了AgentOps與傳統LLM監控的區別、工具生態系統、一個完整的工作代碼示例,以及如何通過會話回放調試代理故障。
本文介紹如何通過Ollama和Scikit-LLM Python庫,免費使用本地託管的開源大語言模型(如Llama 3、Mistral和Gemma)進行文本分類任務。
本文比較了三種文本分類方法:TF-IDF 結合邏輯迴歸、零樣本 BART 以及使用 Groq LLM 的 Scikit-LLM。在一個合成客户支持數據集上,Scikit-LLM 準確率最高(87%),延遲低於 BART,特別適用於數據量小且需要深度語言理解的任務。
本文提供了一個結構化的六步LLMOps路線圖,涵蓋可觀測性、評估、成本控制和代理編排,幫助您構建生產級LLM系統。預計LLMOps市場將從2024年的19.7億美元增長到2028年的49億美元,複合年增長率為42%。
本文介紹瞭如何為長期運行的AI代理實現上下文修剪管道,通過語義相似度動態管理對話記憶,降低成本並提高效率。涵蓋了使用句子變換器嵌入模型計算相似度、構建修剪後的上下文窗口等步驟。
本文深入探討了大語言模型中logits、温度和top-p採樣如何協同工作以控制下一個令牌的預測。文章詳細解釋了logits的來源、温度和top-p對概率分佈的影響,以及它們如何構成一個順序管道來生成LLM輸出。最後,提供瞭如何根據實際應用場景選擇温度和top-p值的建議。
本文展示瞭如何將一個基礎的工具調用腳本轉變為一個能夠優雅處理工具失敗、模型輸出錯誤和服務不可用等問題的彈性智能體。涵蓋了迭代式智能體循環、四種不同的錯誤恢復模式以及如何設計信息豐富的錯誤消息以幫助模型自我糾正。
本文介紹瞭如何在檢索增強生成(RAG)系統中構建混合搜索策略,結合BM25詞彙搜索與語義搜索,並通過互惠排名融合(RRF)合併排名。詳細説明了Python實現步驟,包括數據集加載、BM25和語義搜索函數的編寫,以及混合搜索的整合。實驗表明,混合搜索在小型數據集上也能取得合理結果,優於單獨使用任一方法。
本文介紹如何構建一個結合嵌入相似性與結構化元數據過濾的上下文感知語義搜索引擎,涵蓋從生成嵌入到持久化索引的全過程。
非確定性代理是指相同輸入可能產生不同輸出的代理。本文探討了如何通過統計護欄來管理和評估這些代理的行為,確保其可靠性和安全性。
本文以初學者、中級和高級三個層次解釋代理型RAG(檢索增強生成)的概念。它介紹了基礎原理、架構設計以及在實際應用中的優勢與挑戰,幫助讀者根據自身水平理解這一新興技術。
谷歌推出TurboQuant,一種用於大語言模型和向量搜索引擎的新型算法套件和庫,旨在實現先進的量化與壓縮,是RAG系統的關鍵組件。
學習如何使用Pydantic AI框架在Python中構建生產級的AI代理,涵蓋結構化輸出、自定義工具和依賴注入,以及Web搜索和擴展推理等內置功能。
本文深入探討了AI代理的上下文工程,強調將上下文窗口視為有限資源,並系統性地處理靜態與動態上下文、歷史管理、檢索預算及生產環境下的質量評估,以提高代理的可靠性、成本效益和準確性。
本文介紹如何使用Scikit-LLM庫中的文本摘要功能,通過構建自定義轉換器集成Hugging Face的預訓練摘要模型,並將其嵌入scikit-learn流水線中,實現從長文本到分類的端到端流程。
本文介紹瞭如何在自己的計算機上使用小型語言模型(SLM)構建完全本地運行的AI代理,無需互聯網連接或API費用。涵蓋AI代理和SLM的概念、本地運行的優勢、Ollama和LangChain的設置、逐步構建代理以及添加記憶和工具的方法,並討論了SLM的侷限性。
本文詳細介紹瞭如何使用 FastAPI 構建一個 Scikit-learn 機器學習模型的推理 API。從項目設置、模型訓練、本地測試到雲端部署,完整地演示了將乳腺癌分類器轉化為可調用 API 的過程。
本文從三個難度級別解釋AI代理記憶:無狀態LLM代理的根本記憶問題,主要記憶類型(上下文內記憶和外部記憶),以及可擴展架構(包括寫入策略、檢索方法、衰減處理和多方代理一致性)。為構建能隨時間改進的代理提供實用見解。
零樣本文本分類允許在沒有任務特定訓練數據的情況下對文本進行標記,通過將標籤轉化為自然語言陳述並使用預訓練模型判斷文本是否支持該陳述。本文介紹了其工作原理、使用facebook/bart-large-mnli模型進行單標籤和多標籤分類的方法,以及如何通過自定義假設模板提高性能。