Show HN:Torrix —— 自托管的大语言模型可观测性工具(无需 Postgres 和 Redis)
Torrix 是一款自托管的 LLM 可观测性工具,支持跟踪令牌数、成本、延迟、完整提示追踪、推理令牌捕获和 PII 脱敏。兼容 OpenAI、Anthropic、Google Gemini 等众多提供商。通过 Docker 一键部署,无需 Postgres 或 Redis。提供 Python、Node.js、Go、C#、Java SDK 以及 LangChain 回调和 HTTP 代理。
文章情报
要点
- 自托管 LLM 可观测性,无需 Postgres 或 Redis。
- 跟踪令牌数、成本、延迟、提示追踪、推理令牌和 PII 脱敏。
- 支持多种 LLM 提供商,提供多语言 SDK 和 HTTP 代理。
为什么重要
这条新闻值得关注,因为自托管 LLM 可观测性,无需 Postgres 或 Redis。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
Torrix 是一款开源自托管的 LLM 可观测性工具,旨在帮助开发者和企业全面监控、调试和优化大语言模型应用。它能够捕获每一次 LLM 请求的详细指标,包括令牌消耗、成本、响应延迟、完整的提示追踪(prompt traces)、推理令牌(reasoning tokens)以及自动脱敏个人身份信息(PII)。所有数据仅存储在你的本地基础设施中,无需依赖任何外部云服务,确保数据隐私和安全。
部署 Torrix 极其简洁,唯一的依赖是 Docker Desktop。用户只需下载一份 docker-compose.yml 文件并运行 docker compose up 即可启动服务。启动后通过浏览器访问 http://localhost:8088 创建账户,即可获得 API 密钥。Torrix 支持通过 HTTP 代理或官方 SDK 将 LLM 调用无缝路由到监控平台。特别值得一提的是,Torrix 不需要 Postgres 或 Redis 作为外部数据存储,极大地降低了运维复杂度和成本。
Torrix 兼容市面上主流的 LLM 提供商,包括 OpenAI、Anthropic、Google Gemini、Azure OpenAI、Groq、Mistral、DeepSeek、Perplexity、Fireworks、Together AI、Cohere、HuggingFace、Replicate、Ollama 以及任何符合 OpenAI 格式的 HTTP 端点。为了便于集成,Torrix 提供了多种编程语言的 SDK:Python、Node.js、Go、C# (.NET 6+)、Java (11+)。这些 SDK 能够轻松包裹原生客户端,自动捕获请求响应数据。此外,Torrix 还为 LangChain 用户提供了 TorrixCallbackHandler,只需简单配置即可自动追踪所有 LLM 调用。
对于无法直接使用 SDK 的场景,Torrix 的 HTTP 代理模式允许任何语言或工具(如 n8n、curl、Postman)通过简单的 HTTP 请求记录 LLM 交互。代理模式支持丰富的头部配置,包括自定义运行名称、提供商提示、追踪 ID 和会话 ID,方便进行多步骤 Agent 调用或对话分组的可观测性。
总的来说,Torrix 为 LLM 应用开发提供了轻量级、自托管、功能全面的可观测性方案。它不仅降低了监控门槛,还保证了数据的完全自主可控,适合从个人开发者到企业团队的各种规模使用。