2026-06-23 21:02 UTC+8站内改写2 分钟阅读更新: 2026-06-23 21:05 UTC+8

Lamini：构建准确率超过90%的迷你AI代理

Lamini是一个提供Memory Tuning、Memory RAG和Classifier Agent等工具的平台，旨在帮助开发者和企业团队快速构建高准确率的迷你AI代理。其核心技术基于创始人团队二十年的LLM研究经验，支持云部署和自托管，并提供免费额度。

来源Hacker News AI作者: doener

Lamini是一个专为构建迷你AI代理而设计的平台，能够帮助用户实现90%以上的准确率，无论您是独立开发者还是企业团队。平台提供多种工具，包括Memory Tuning（记忆微调）、Memory RAG（记忆检索增强生成）和Classifier Agent（分类代理），以应对不同场景的需求。

Memory Tuning是一项核心功能，它允许用户向模型注入精确的事实信息，从而消除幻觉现象。用户只需从10个事实和示例开始，即可扩展至100,000个以上，可靠地达到95%以上的准确率。这种方法打破了传统微调的精度上限，同时通过使用较小的语言模型和迷你代理来降低延迟和成本。Memory Tuning支持任何开源模型，并通过统一的API进行访问。

Memory RAG则提供了一种更简便的替代方案，无需复杂的RAG设置即可实现90%以上的准确率。相比GPT-4，Memory RAG在用户的几轮数据迭代后，能将准确率从50%提升至90-95%。其智能嵌入技术扩展了数据表示，能够捕捉真实的语义和关系，从而构建可靠的迷你代理。

Classifier Agent Toolkit是另一个重要组件，专注于分类任务。它可以在几分钟内构建精确的分类器，支持从2到1000多个类别，并以每秒40万个token的速度处理非结构化数据，准确率高达99.9%。该工具可自动路由请求，并高效地进行代码和内容的分类。

Lamini面向两类主要用户：开发者和初创企业，以及企业团队。对于前者，平台提供简单的SDK和API、免费起步选项、清晰的文档和快速集成，兼容OpenAI API。对于后者，Lamini提供生产级安全性、气隙部署选项、跨部门扩展能力和自定义部署支持，以降低生产风险。

实际应用方面，Lamini可用于SQL生成、客户支持代理、数据分类、代码助手以及自动化规划与执行等场景。用户可以通过300美元的免费额度快速上手，选择云部署或自托管，利用SDK或API进行开发，并通过仪表板监控运行状态。

Lamini的团队在LLM领域拥有二十年的经验，曾发明LLM缩放定律，向超过10亿用户部署LLM产品，教授近25万学生微调LLM，并指导过后来构建主要基础模型（如OpenAI GPT-3/4、Anthropic Claude、Meta Llama 3.1、Google PaLM和NVIDIA Megatron）的技术负责人。他们的专业知识为Lamini提供了深厚的技术支撑。