AI News HubLIVE
站内改写

打造了一個能可視化解釋數學而非僅給出答案的AI

Claw Learn是一款開源的AI驅動可視化數學導師,結合ElevenLabs語音引擎和自定義畫布渲染器,將數學問題轉化為實時動畫講解。用户可通過語音或文字提問,觀看同步動畫和敍述。支持多種AI模型和部署方式,已引起廣泛關注。

文章情報

工程師中級

要點

  • Claw Learn將數學問題轉化為視覺動畫講解,支持實時語音交互和打斷追問。
  • 項目基於Next.js 16,使用ElevenLabs WebRTC語音引擎實現低延遲語音輸入輸出,並提供REST TTS和瀏覽器語音識別作為降級方案。
  • 支持多種AI提供商(Gemini、OpenAI、Ollama等),通過OpenAI兼容API接入,並提供了詳細的部署指南和環境變量配置。
  • 畫布渲染器支持30多種視覺元素,可動態生成自定義教學場景,採用安全的遞歸下降解析器,不使用eval。

為甚麼重要

這條新聞值得關注,因為Claw Learn將數學問題轉化為視覺動畫講解,支持實時語音交互和打斷追問。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

Claw Learn是一款開源的AI驅動可視化數學導師,由開發者Arzuman Abbasov創建並在GitHub上公開。它通過將數學與物理問題轉化為實時動畫講解,革新了傳統的學習方式,旨在取代幻燈片、教科書和預錄視頻。

用户可以通過語音或文字向Claw Learn提問,例如“導數為什麼代表斜率?”或“矩陣乘法如何工作?”。系統會生成一個包含多個場景的教學計劃,並在瀏覽器中實時渲染動畫,同時通過ElevenLabs的語音引擎提供同步敍述。這種交互方式允許用户隨時打斷並追問,無需接觸鍵盤。

技術棧方面,Claw Learn基於Next.js 16(使用App Router和Turbopack),前端採用React 19、Tailwind CSS v4和Framer Motion。AI部分兼容任何OpenAI兼容的API,包括Gemini(默認)、OpenAI和Ollama。語音輸入輸出主要通過ElevenLabs Speech Engine的WebRTC連接實現,如果未配置,則降級為REST TTS和瀏覽器語音識別。

項目支持多種部署選項,推薦使用Vercel。用户需要配置AI提供商API密鑰、Google OAuth認證、可選的Upstash Redis用於速率限制,以及ElevenLabs語音設置。每個認證用户每天限制3次提問,通過Upstash Redis在多個Vercel實例間跟蹤。

Claw Learn的畫布渲染器支持30多種視覺元素,包括座標軸、函數曲線、切線、矩陣、直方圖、3D軸等,所有元素都可動態組合以形成教學場景。項目還提供了完整的代碼結構和詳細的文檔,方便開發者貢獻和部署。

儘管Claw Learn目前存在一些限制,例如對話歷史不持久(僅內存存儲),但其創新性的教學方式已經引起了廣泛關注。項目採用MIT許可證,並強調了安全性:API密鑰僅服務端使用,輸入經過長度限制和驗證,CORS在生產環境中鎖定,且數學解析器採用安全的遞歸下降解析,不使用eval或new Function。