2026-06-23 21:02 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-23 21:05 UTC+8

Lamini：構建準確率超過90%的迷你AI代理

Lamini是一個提供Memory Tuning、Memory RAG和Classifier Agent等工具的平臺，旨在幫助開發者和企業團隊快速構建高準確率的迷你AI代理。其核心技術基於創始人團隊二十年的LLM研究經驗，支援雲部署和自託管，並提供免費額度。

來源Hacker News AI作者: doener

Lamini是一個專為構建迷你AI代理而設計的平臺，能夠幫助使用者實現90%以上的準確率，無論您是獨立開發者還是企業團隊。平臺提供多種工具，包括Memory Tuning（記憶微調）、Memory RAG（記憶檢索增強生成）和Classifier Agent（分類代理），以應對不同場景的需求。

Memory Tuning是一項核心功能，它允許使用者向模型注入精確的事實資訊，從而消除幻覺現象。使用者只需從10個事實和示例開始，即可擴充套件至100,000個以上，可靠地達到95%以上的準確率。這種方法打破了傳統微調的精度上限，同時透過使用較小的語言模型和迷你代理來降低延遲和成本。Memory Tuning支援任何開源模型，並透過統一的API進行訪問。

Memory RAG則提供了一種更簡便的替代方案，無需複雜的RAG設定即可實現90%以上的準確率。相比GPT-4，Memory RAG在使用者的幾輪資料迭代後，能將準確率從50%提升至90-95%。其智慧嵌入技術擴充套件了資料表示，能夠捕捉真實的語義和關係，從而構建可靠的迷你代理。

Classifier Agent Toolkit是另一個重要元件，專注於分類任務。它可以在幾分鐘內構建精確的分類器，支援從2到1000多個類別，並以每秒40萬個token的速度處理非結構化資料，準確率高達99.9%。該工具可自動路由請求，並高效地進行程式碼和內容的分類。

Lamini面向兩類主要使用者：開發者和初創企業，以及企業團隊。對於前者，平臺提供簡單的SDK和API、免費起步選項、清晰的文件和快速整合，相容OpenAI API。對於後者，Lamini提供生產級安全性、氣隙部署選項、跨部門擴充套件能力和自定義部署支援，以降低生產風險。

實際應用方面，Lamini可用於SQL生成、客戶支援代理、資料分類、程式碼助手以及自動化規劃與執行等場景。使用者可以透過300美元的免費額度快速上手，選擇雲部署或自託管，利用SDK或API進行開發，並透過儀表板監控執行狀態。

Lamini的團隊在LLM領域擁有二十年的經驗，曾發明LLM縮放定律，向超過10億使用者部署LLM產品，教授近25萬學生微調LLM，並指導過後來構建主要基礎模型（如OpenAI GPT-3/4、Anthropic Claude、Meta Llama 3.1、Google PaLM和NVIDIA Megatron）的技術負責人。他們的專業知識為Lamini提供了深厚的技術支撐。