AI News HubLIVE
站内改写

打造了一个能可视化解释数学而非仅给出答案的AI

Claw Learn是一款开源的AI驱动可视化数学导师,结合ElevenLabs语音引擎和自定义画布渲染器,将数学问题转化为实时动画讲解。用户可通过语音或文字提问,观看同步动画和叙述。支持多种AI模型和部署方式,已引起广泛关注。

文章情报

工程师中级

要点

  • Claw Learn将数学问题转化为视觉动画讲解,支持实时语音交互和打断追问。
  • 项目基于Next.js 16,使用ElevenLabs WebRTC语音引擎实现低延迟语音输入输出,并提供REST TTS和浏览器语音识别作为降级方案。
  • 支持多种AI提供商(Gemini、OpenAI、Ollama等),通过OpenAI兼容API接入,并提供了详细的部署指南和环境变量配置。
  • 画布渲染器支持30多种视觉元素,可动态生成自定义教学场景,采用安全的递归下降解析器,不使用eval。

为什么重要

这条新闻值得关注,因为Claw Learn将数学问题转化为视觉动画讲解,支持实时语音交互和打断追问。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

Claw Learn是一款开源的AI驱动可视化数学导师,由开发者Arzuman Abbasov创建并在GitHub上公开。它通过将数学与物理问题转化为实时动画讲解,革新了传统的学习方式,旨在取代幻灯片、教科书和预录视频。

用户可以通过语音或文字向Claw Learn提问,例如“导数为什么代表斜率?”或“矩阵乘法如何工作?”。系统会生成一个包含多个场景的教学计划,并在浏览器中实时渲染动画,同时通过ElevenLabs的语音引擎提供同步叙述。这种交互方式允许用户随时打断并追问,无需接触键盘。

技术栈方面,Claw Learn基于Next.js 16(使用App Router和Turbopack),前端采用React 19、Tailwind CSS v4和Framer Motion。AI部分兼容任何OpenAI兼容的API,包括Gemini(默认)、OpenAI和Ollama。语音输入输出主要通过ElevenLabs Speech Engine的WebRTC连接实现,如果未配置,则降级为REST TTS和浏览器语音识别。

项目支持多种部署选项,推荐使用Vercel。用户需要配置AI提供商API密钥、Google OAuth认证、可选的Upstash Redis用于速率限制,以及ElevenLabs语音设置。每个认证用户每天限制3次提问,通过Upstash Redis在多个Vercel实例间跟踪。

Claw Learn的画布渲染器支持30多种视觉元素,包括坐标轴、函数曲线、切线、矩阵、直方图、3D轴等,所有元素都可动态组合以形成教学场景。项目还提供了完整的代码结构和详细的文档,方便开发者贡献和部署。

尽管Claw Learn目前存在一些限制,例如对话历史不持久(仅内存存储),但其创新性的教学方式已经引起了广泛关注。项目采用MIT许可证,并强调了安全性:API密钥仅服务端使用,输入经过长度限制和验证,CORS在生产环境中锁定,且数学解析器采用安全的递归下降解析,不使用eval或new Function。