答えを出すだけでなく、数学を視覚的に説明するAIを構築
Claw Learnは、ElevenLabs Speech Engineとカスタムキャンバスレンダラーを組み合わせ、数学の問題をリアルタイムのアニメーション解説に変換するAI搭載の視覚的数学チューターです。ユーザーは音声またはテキストで質問し、同期されたナレーション付きのアニメーションを視聴できます。
記事インテリジェンス
要点
- Claw Learnは数学の問題を視覚的なアニメーション解説に変換し、リアルタイムの音声インタラクションを実現。
- Next.js 16ベースで、ElevenLabs WebRTCを使用した低遅延音声入出力を採用。REST TTSやブラウザ音声認識へのフォールバックも可能。
- Gemini、OpenAI、Ollamaなど複数のAIプロバイダーをサポートし、詳細なデプロイガイドを提供。
- キャンバスレンダラーは30種類以上の視覚要素をサポートし、動的な教学シーンを生成。安全な再帰下降パーサーを使用。
重要な理由
このニュースが重要なのは、Claw Learnは数学の問題を視覚的なアニメーション解説に変換し、リアルタイムの音声インタラクションを実現ためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
Claw Learnは、数学と物理学の問題をリアルタイムのアニメーション解説に変換する、オープンソースのAI駆動型視覚的数学チューターです。開発者のArzuman Abbasovによって作成され、GitHubで公開されています。従来のスライド、教科書、録画済みビデオに代わる革新的な学習方法を提供します。
ユーザーは音声またはテキストで「導関数がなぜ傾きを表すのか?」や「行列の掛け算はどう機能するのか?」といった質問をClaw Learnに投げかけます。システムは複数のシーンからなる教学計画を生成し、ブラウザ上でアニメーションをリアルタイムにレンダリングし、ElevenLabsの音声エンジンで同期されたナレーションを提供します。この対話型の仕組みにより、ユーザーはいつでも割り込んでフォローアップの質問ができ、キーボードに触れる必要はありません。
技術スタックはNext.js 16(App RouterとTurbopack)を基盤とし、フロントエンドにはReact 19、Tailwind CSS v4、Framer Motionを使用しています。AI部分はOpenAI互換のAPIであればどれでも動作し、Gemini(デフォルト)、OpenAI、Ollamaなどが利用可能です。音声入出力は主にElevenLabs Speech EngineのWebRTC接続を介し、設定がない場合はREST TTSとブラウザの音声認識にフォールバックします。
デプロイはVercelが推奨されており、AIプロバイダーのAPIキー、Google OAuth認証、オプションのレート制限用Upstash Redis、ElevenLabsの音声設定などが必要です。認証ユーザーは1日あたり3回の質問に制限され、Upstash Redisを使用して複数のVercelインスタンス間で追跡されます。
Claw Learnのキャンバスレンダラーは30種類以上の視覚要素をサポートしており、座標軸、関数曲線、接線、行列、ヒストグラム、3D軸など、あらゆる要素を動的に組み合わせて教学シーンを形成します。プロジェクトは完全なコード構造と詳細なドキュメントを提供し、開発者がコントリビュートやデプロイを容易に行えるようにしています。
現時点では会話履歴がインメモリのみで永続化されないといった制限はありますが、その革新的な教育アプローチは大きな注目を集めています。プロジェクトはMITライセンスで提供され、セキュリティにも配慮:APIキーはサーバーサイドのみで使用、入力は長さ制限とバリデーションを実施、本番環境ではCORSをALLOWED_ORIGINにロック、数式パーサーは安全な再帰下降パーサーを採用し、evalやnew Functionを使用していません。