2026-06-23 21:02 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-23 21:05 UTC+8

Lamini：構建準確率超過90%的迷你AI代理

Lamini是一個提供Memory Tuning、Memory RAG和Classifier Agent等工具的平台，旨在幫助開發者和企業團隊快速構建高準確率的迷你AI代理。其核心技術基於創始人團隊二十年的LLM研究經驗，支持雲部署和自託管，並提供免費額度。

來源Hacker News AI作者: doener

Lamini是一個專為構建迷你AI代理而設計的平台，能夠幫助用户實現90%以上的準確率，無論您是獨立開發者還是企業團隊。平台提供多種工具，包括Memory Tuning（記憶微調）、Memory RAG（記憶檢索增強生成）和Classifier Agent（分類代理），以應對不同場景的需求。

Memory Tuning是一項核心功能，它允許用户向模型注入精確的事實信息，從而消除幻覺現象。用户只需從10個事實和示例開始，即可擴展至100,000個以上，可靠地達到95%以上的準確率。這種方法打破了傳統微調的精度上限，同時通過使用較小的語言模型和迷你代理來降低延遲和成本。Memory Tuning支持任何開源模型，並通過統一的API進行訪問。

Memory RAG則提供了一種更簡便的替代方案，無需複雜的RAG設置即可實現90%以上的準確率。相比GPT-4，Memory RAG在用户的幾輪數據迭代後，能將準確率從50%提升至90-95%。其智能嵌入技術擴展了數據表示，能夠捕捉真實的語義和關係，從而構建可靠的迷你代理。

Classifier Agent Toolkit是另一個重要組件，專注於分類任務。它可以在幾分鐘內構建精確的分類器，支持從2到1000多個類別，並以每秒40萬個token的速度處理非結構化數據，準確率高達99.9%。該工具可自動路由請求，並高效地進行代碼和內容的分類。

Lamini面向兩類主要用户：開發者和初創企業，以及企業團隊。對於前者，平台提供簡單的SDK和API、免費起步選項、清晰的文檔和快速集成，兼容OpenAI API。對於後者，Lamini提供生產級安全性、氣隙部署選項、跨部門擴展能力和自定義部署支持，以降低生產風險。

實際應用方面，Lamini可用於SQL生成、客户支持代理、數據分類、代碼助手以及自動化規劃與執行等場景。用户可以通過300美元的免費額度快速上手，選擇雲部署或自託管，利用SDK或API進行開發，並通過儀表板監控運行狀態。

Lamini的團隊在LLM領域擁有二十年的經驗，曾發明LLM縮放定律，向超過10億用户部署LLM產品，教授近25萬學生微調LLM，並指導過後來構建主要基礎模型（如OpenAI GPT-3/4、Anthropic Claude、Meta Llama 3.1、Google PaLM和NVIDIA Megatron）的技術負責人。他們的專業知識為Lamini提供了深厚的技術支撐。