Nexus:在本地向AI询问敏感电子表格
Nexus 是一个本地优先的开源工具,让 AI 代理(如 Claude Code)直接查询和操作本地的 CSV、XLSX、SQLite 或 Google Sheets 文件,而无需上传数据到云端。它通过 MCP 协议暴露数据,支持非破坏性衍生(视图、分支、快照等),并内置可选的语义读取层 Iris。
Nexus 是一个本地优先的开源工具,旨在解决当前 AI 工具处理敏感数据时的隐私问题。当用户将电子表格交给 ChatGPT、Claude 等云端 AI 时,数据需要离开本地机器,这可能会引发数据泄露或合规风险。Nexus 反转了这一模式:数据始终保留在用户机器上,AI 代理通过本地 MCP 服务器以语义化的方式查询和操作数据,确保敏感信息不会离开本地环境。
Nexus 支持多种数据源,包括 CSV、TSV、XLSX、SQLite 以及公开或私有的 Google Sheets。用户只需一条命令即可注册数据源,并启动 MCP 服务器。AI 代理(如 Claude Code 或 Cursor)通过 MCP 客户端连接到本地服务器后,会自动获取一组与数据相关的工具,例如 describe_source、find_rows、create_collection 等。所有对数据的操作(如筛选、假设分析、快照)都以非破坏性的衍生层保存,原始文件从未被修改。这种设计允许用户随意尝试而无需担心破坏原始数据。
为了提升智能性,Nexus 提供了一个可选的语义读取层 Iris。Iris 使用 AI 自动识别列类型、生成结构化摘要、建议查询,并发现非显而易见的模式(称为 "Tells")。Iris 支持三种后端:Claude Code(使用现有认证)、OpenRouter(需 API 密钥)或纯本地模式(不依赖任何 LLM)。用户可以通过 --sampler 参数或环境变量指定后端,从而灵活控制数据处理的智能程度和隐私安全。
对于私有 Google Sheets,Nexus 提供了完善的 OAuth 认证支持。用户只需执行 nexus auth login google 一次,即可获得访问权限。Nexus 首先尝试通过公共 CSV 导出 URL 获取数据,如果失败则回退到 Sheets API v4。所有认证令牌和缓存数据都存储在本地 ~/.nexus/ 目录下,且仅允许用户本人读写。Nexus 还提供了详细的故障排除指南,包括 URL 引号使用、刷新令牌轮换等常见问题。
与其他工具的对比中,Nexus 在本地运行、支持多格式输入、通过 MCP 暴露给 AI 代理、具备类型化语义层和非破坏性衍生方面具有明显优势。而 Datasette 更适合发布 SQLite 数据库为 Web UI,DuckDB UI 专注于快速本地分析 SQL,Quadratic 和 Copilot 则依赖云端上传。Nexus 最适合那些希望使用现有 AI 代理(如 Claude Code、Cursor)就地查询电子表格、无需上传且支持假设分析的场景。
安全性方面,Nexus 内嵌了 Google OAuth 客户端凭据,但这符合 Google 的桌面应用规范,且与 gcloud、gh 等流行工具的做法一致。PKCE 协议仍然保护了授权码拦截,用户的刷新令牌和数据始终留在本地机器上。PixelDesigns 无法访问任何用户数据,仅能在 GCP 审计日志中看到谁授权了应用。
v0.3.0 版本已发布,支持本地文件摄取、私有 Google Sheets 访问、Iris 语义读取、多种衍生类型(视图、集合、分支、快照、注释)、MCP 服务器(HTTP 和 stdio 传输)以及持久化存储。项目采用 MIT 许可证,代码托管在 GitHub 上。