AIメガネが教育の未来に与える影響
香港科技大学のテストで、GPT-5.2を搭載したRokidグラスがコンピュータネットワークの試験で92.5点を獲得し、学生平均の72点を上回り、教育における規制の必要性が浮き彫りになった。
先週の期末試験週に、一見普通のスマートグラスが香港科技大学のコンピュータネットワーク学部期末試験で92.5点の高得点を獲得しました。Rokid Glassesをベースに開発され、OpenAIの最新GPT-5.2モデルを搭載したこのAIグラスは、100人以上の学生がいるクラスでトップ5に入り、学生平均の72点を大きく上回りました。学生は試験用紙を見下ろすだけで、グラスが問題を素早く撮影し、遠隔推論を通じて解答を返します。
このテストは香港科技大学の張軍教授と孟子力教授のチームが主導し、AIグラスの複雑な知識タスクにおける深い推論能力を検証しただけでなく、世界中の教育コミュニティに警鐘を鳴らしました。スマートグラス教育の時代が到来したのです。この技術をどのように活用し規制するかが、AIグラス時代の鍵となります。
テスト結果は衝撃的でした。Rokidグラスは92.5点、学生最高点は97.5点、学生平均点は72点でした。AIグラスの回答プロセスは次のとおりです。画像キャプチャ(学生が試験用紙を見下ろし、グラスのカメラが撮影)、遠隔推論(写真がグラス→スマートフォン→クラウドのパイプラインを経由してLLMに送信)、結果返送(解答が逆経路でグラスに表示され、学生が書き写す)。
自動回答を実現するには、グラスにカメラ入力と表示出力の両方が必要です。研究チームは12の市販グラスを評価し、Meta Ray-Ban、Frame、Rokidのみがカメラとディスプレイを備えていることを確認しました。しかしMetaはディスプレイ制御用のSDKを提供しておらず、Frameはカメラの画質が不十分だったため、最終的にRokidが選ばれました。大規模モデルについては、GPT-5.2が応答速度に優れていたため選択されました。
詳細な性能評価では、選択問題で満点(29点)、単一ページ記述問題で満点(18点)、複数ページ記述問題で45.5点(満点53点)、合計92.5点でした。Rokidは選択問題と単一ページ記述問題で満点を獲得し、複数ページ記述問題でもほとんどの得点を獲得しました。複数ページ記述問題は特に難しく、1つの問題が複数ページに分割されるため、グラスが問題全体を一度に見ることができず、後続の小問題が前のページの情報に依存するため、ワークフローが困難になります。それでもRokidはこれらを容易に処理しました。
全体的に、Rokidが誤答した問題は通常、問題内の最も難しいサブパートであり、非自明な推論計算が必要で、モデルの推論能力に高い負荷がかかりました。最終回答が間違っていても、モデルは推論ステップの大部分を生成していました。誤答例では、AIの答え(111.123.15.254)は技術的に正しかったものの、コースで使用された簡略化モデル(111.123.15.255)と一致しませんでした。これはAIが授業範囲外の知識を適用したためです。
既存の問題点として、画質のボトルネック(カメラの鮮明さが回答性能を決定)、消費電力と接続の安定性(Rokidは高解像度写真転送のためにWi-Fiを有効にすると、30分でバッテリーが100%から58%に低下;FrameはBluetooth接続が不安定で、テスト中15分間に4回切断し、毎回手動再接続が必要)が挙げられます。
AIグラスが教育に与える影響は両刃の剣です。肯定的な側面として、教育技術の革新(個別学習、的を絞った支援とリソースの提供、学習リソースの不平等の是正、追加支援を必要とする学生の学業向上)が期待されます。否定的な側面として、試験中の使用は学術的誠実性を著しく損ない、教育評価システム全体の公平性に疑問を投げかけます。
教育者と政策立案者は直ちに行動し、合理的な規制メカニズムを確立する必要があります。明確なポリシーと規制の策定(教育・試験環境におけるスマートデバイスの使用境界を定義)、技術的監視と検出(試験中の信号妨害や特定の監視ソフトウェアの使用)、教育と啓発(学習プロセスでのスマートデバイスの合法的かつ効果的な使用を推奨するが、試験中の使用は厳禁)が求められます。倫理と技術のバランスを見つけ、法律、技術、教育、文化の各レベルでの包括的な規制を通じてのみ、学術的誠実性を保護しつつ、教育技術の真の革新と進歩を実現できます。