AI News HubLIVE
站內改寫2 分鐘閱讀

Lamini:構建準確率超過90%的迷你AI代理

Lamini是一個提供Memory Tuning、Memory RAG和Classifier Agent等工具的平臺,旨在幫助開發者和企業團隊快速構建高準確率的迷你AI代理。其核心技術基於創始人團隊二十年的LLM研究經驗,支援雲部署和自託管,並提供免費額度。

來源Hacker News AI作者: doener

Lamini是一個專為構建迷你AI代理而設計的平臺,能夠幫助使用者實現90%以上的準確率,無論您是獨立開發者還是企業團隊。平臺提供多種工具,包括Memory Tuning(記憶微調)、Memory RAG(記憶檢索增強生成)和Classifier Agent(分類代理),以應對不同場景的需求。

Memory Tuning是一項核心功能,它允許使用者向模型注入精確的事實資訊,從而消除幻覺現象。使用者只需從10個事實和示例開始,即可擴充套件至100,000個以上,可靠地達到95%以上的準確率。這種方法打破了傳統微調的精度上限,同時透過使用較小的語言模型和迷你代理來降低延遲和成本。Memory Tuning支援任何開源模型,並透過統一的API進行訪問。

Memory RAG則提供了一種更簡便的替代方案,無需複雜的RAG設定即可實現90%以上的準確率。相比GPT-4,Memory RAG在使用者的幾輪資料迭代後,能將準確率從50%提升至90-95%。其智慧嵌入技術擴充套件了資料表示,能夠捕捉真實的語義和關係,從而構建可靠的迷你代理。

Classifier Agent Toolkit是另一個重要元件,專注於分類任務。它可以在幾分鐘內構建精確的分類器,支援從2到1000多個類別,並以每秒40萬個token的速度處理非結構化資料,準確率高達99.9%。該工具可自動路由請求,並高效地進行程式碼和內容的分類。

Lamini面向兩類主要使用者:開發者和初創企業,以及企業團隊。對於前者,平臺提供簡單的SDK和API、免費起步選項、清晰的文件和快速整合,相容OpenAI API。對於後者,Lamini提供生產級安全性、氣隙部署選項、跨部門擴充套件能力和自定義部署支援,以降低生產風險。

實際應用方面,Lamini可用於SQL生成、客戶支援代理、資料分類、程式碼助手以及自動化規劃與執行等場景。使用者可以透過300美元的免費額度快速上手,選擇雲部署或自託管,利用SDK或API進行開發,並透過儀表板監控執行狀態。

Lamini的團隊在LLM領域擁有二十年的經驗,曾發明LLM縮放定律,向超過10億使用者部署LLM產品,教授近25萬學生微調LLM,並指導過後來構建主要基礎模型(如OpenAI GPT-3/4、Anthropic Claude、Meta Llama 3.1、Google PaLM和NVIDIA Megatron)的技術負責人。他們的專業知識為Lamini提供了深厚的技術支撐。