AI News HubLIVE
站内改写

打造了一個能視覺化解釋數學而非僅給出答案的AI

Claw Learn是一款開源的AI驅動視覺化數學導師,結合ElevenLabs語音引擎和自定義畫布渲染器,將數學問題轉化為即時動畫講解。使用者可透過語音或文字提問,觀看同步動畫和敘述。支援多種AI模型和部署方式,已引起廣泛關注。

文章情報

工程師中級

要點

  • Claw Learn將數學問題轉化為視覺動畫講解,支援即時語音互動和打斷追問。
  • 專案基於Next.js 16,使用ElevenLabs WebRTC語音引擎實現低延遲語音輸入輸出,並提供REST TTS和瀏覽器語音識別作為降級方案。
  • 支援多種AI提供商(Gemini、OpenAI、Ollama等),透過OpenAI相容API接入,並提供了詳細的部署指南和環境變數配置。
  • 畫布渲染器支援30多種視覺元素,可動態生成自定義教學場景,採用安全的遞迴下降解析器,不使用eval。

為什麼重要

這條新聞值得關注,因為Claw Learn將數學問題轉化為視覺動畫講解,支援即時語音互動和打斷追問。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

Claw Learn是一款開源的AI驅動視覺化數學導師,由開發者Arzuman Abbasov建立並在GitHub上公開。它透過將數學與物理問題轉化為即時動畫講解,革新了傳統的學習方式,旨在取代幻燈片、教科書和預錄影片。

使用者可以透過語音或文字向Claw Learn提問,例如“導數為什麼代表斜率?”或“矩陣乘法如何工作?”。系統會生成一個包含多個場景的教學計劃,並在瀏覽器中即時渲染動畫,同時透過ElevenLabs的語音引擎提供同步敘述。這種互動方式允許使用者隨時打斷並追問,無需接觸鍵盤。

技術棧方面,Claw Learn基於Next.js 16(使用App Router和Turbopack),前端採用React 19、Tailwind CSS v4和Framer Motion。AI部分相容任何OpenAI相容的API,包括Gemini(預設)、OpenAI和Ollama。語音輸入輸出主要透過ElevenLabs Speech Engine的WebRTC連線實現,如果未配置,則降級為REST TTS和瀏覽器語音識別。

專案支援多種部署選項,推薦使用Vercel。使用者需要配置AI提供商API金鑰、Google OAuth認證、可選的Upstash Redis用於速率限制,以及ElevenLabs語音設定。每個認證使用者每天限制3次提問,透過Upstash Redis在多個Vercel例項間跟蹤。

Claw Learn的畫布渲染器支援30多種視覺元素,包括座標軸、函式曲線、切線、矩陣、直方圖、3D軸等,所有元素都可動態組合以形成教學場景。專案還提供了完整的程式碼結構和詳細的文件,方便開發者貢獻和部署。

儘管Claw Learn目前存在一些限制,例如對話歷史不持久(僅記憶體儲存),但其創新性的教學方式已經引起了廣泛關注。專案採用MIT許可證,並強調了安全性:API金鑰僅服務端使用,輸入經過長度限制和驗證,CORS在生產環境中鎖定,且數學解析器採用安全的遞迴下降解析,不使用eval或new Function。