AI News HubLIVE
站内改写2 分钟阅读

Lamini:构建准确率超过90%的迷你AI代理

Lamini是一个提供Memory Tuning、Memory RAG和Classifier Agent等工具的平台,旨在帮助开发者和企业团队快速构建高准确率的迷你AI代理。其核心技术基于创始人团队二十年的LLM研究经验,支持云部署和自托管,并提供免费额度。

来源Hacker News AI作者: doener

Lamini是一个专为构建迷你AI代理而设计的平台,能够帮助用户实现90%以上的准确率,无论您是独立开发者还是企业团队。平台提供多种工具,包括Memory Tuning(记忆微调)、Memory RAG(记忆检索增强生成)和Classifier Agent(分类代理),以应对不同场景的需求。

Memory Tuning是一项核心功能,它允许用户向模型注入精确的事实信息,从而消除幻觉现象。用户只需从10个事实和示例开始,即可扩展至100,000个以上,可靠地达到95%以上的准确率。这种方法打破了传统微调的精度上限,同时通过使用较小的语言模型和迷你代理来降低延迟和成本。Memory Tuning支持任何开源模型,并通过统一的API进行访问。

Memory RAG则提供了一种更简便的替代方案,无需复杂的RAG设置即可实现90%以上的准确率。相比GPT-4,Memory RAG在用户的几轮数据迭代后,能将准确率从50%提升至90-95%。其智能嵌入技术扩展了数据表示,能够捕捉真实的语义和关系,从而构建可靠的迷你代理。

Classifier Agent Toolkit是另一个重要组件,专注于分类任务。它可以在几分钟内构建精确的分类器,支持从2到1000多个类别,并以每秒40万个token的速度处理非结构化数据,准确率高达99.9%。该工具可自动路由请求,并高效地进行代码和内容的分类。

Lamini面向两类主要用户:开发者和初创企业,以及企业团队。对于前者,平台提供简单的SDK和API、免费起步选项、清晰的文档和快速集成,兼容OpenAI API。对于后者,Lamini提供生产级安全性、气隙部署选项、跨部门扩展能力和自定义部署支持,以降低生产风险。

实际应用方面,Lamini可用于SQL生成、客户支持代理、数据分类、代码助手以及自动化规划与执行等场景。用户可以通过300美元的免费额度快速上手,选择云部署或自托管,利用SDK或API进行开发,并通过仪表板监控运行状态。

Lamini的团队在LLM领域拥有二十年的经验,曾发明LLM缩放定律,向超过10亿用户部署LLM产品,教授近25万学生微调LLM,并指导过后来构建主要基础模型(如OpenAI GPT-3/4、Anthropic Claude、Meta Llama 3.1、Google PaLM和NVIDIA Megatron)的技术负责人。他们的专业知识为Lamini提供了深厚的技术支撑。