Coplot: 研究プロセスを可視化で支援
研究プロセスでは、可視化がデータ理解を促進します。Cohere Labs は、反復作業とデータ精度を両立するツール co/plot を開発し、オープンソースとして公開しました。
研究の真のインパクトは、研究者が自分の作業を明確に視覚化できるかどうかにかかっています。可視化は、研究過程でのデータ理解や意思決定を助け、結果の共有を容易にします。図表や棒グラフ、折れ線グラフなどの可視化成果は、長期間のデータ分析と意味の探求の産物です。
Cohere Labs では、研究者としてチームの研究課題を支援するため、さまざまな可視化を作成してきました。しかし、既存のワークフローでは、再現性とデータ忠実度を維持しながら迅速に反復することが困難でした。Matplotlib は多くの研究者に使われていますが、小さな変更でもスクリプト全体の再実行が必要で、反復が非効率です。一方、Figma は美しいプロットを作成できますが、データを確実に取り込めず、手動で Matplotlib のプロットをトレースする必要があり、精度が低下するリスクがありました。これらの方法は研究の速度を低下させ、可視化の効果を十分に活用できませんでした。
そこで、私は新しいツールの実験を始めました。当初は Matplotlib 用のスタイルルールを生成するシンプルなツールが目標でしたが、チームとの協力を通じて、より有用なものを構築できると気づきました。それが co/plot です。迅速なプロトタイピング、事前設定済みでカスタマイズ可能なスタイル、そしてデータへの忠実さを兼ね備えたツールです。
Tiny Aya プロジェクトの構築中に、co/plot は徹底的にテストされました。モデル構築では、評価対象の70以上の言語に対応するよう機能を拡張し、技術レポート作成時にはスタイルを磨き上げ、結果を明確かつ洗練された形で提示できるようにしました。また、研究者にツールを渡しながらユーザーエクスペリエンスを改善していきました。
この過程で、co/plot がワークフローに与える影響が明らかになりました。スタイルが改善され、読みやすくなったプロットは、研究過程での意思決定を向上させました。これらのプロットは技術レポートだけでなく、研究プロセス全体にとって重要でした。
オープンサイエンスの信念に基づき、私たちは co/plot を公開することにしました。論文やモデルに加えてツールを公開することで、研究の基盤が向上します。すでにオープンサイエンスコミュニティの独立した研究者たちが co/plot を利用し、より明確に成果をまとめ、迅速に反復し、自信を持って研究を共有しています。これこそが目的です。可視化ツールの水準が上がれば、より多くの研究者が明確な研究を行い、明確な結論に達し、予想外の場所から優れたアイデアが生まれる可能性が広がります。
データ可視化の分野は急速に変化しており、研究者が選ぶツールはデータとの関わり方を形作ります。プロットを作成し、表現を試し、何が示されるかを確認する反復作業は、研究者が発見を理解するプロセスの一部です。co/plot は、プロットを作成する過程がプロット自体と同じくらい重要であり、研究ツールはその過程を支援すべきであり、抽象化すべきではないという信念に基づいて構築されました。私たちは co/plot の開発を継続し、研究プロセスを形成してきたツールをさらに公開し、コミュニティからのフィードバックを反映してより良いツールを提供していくことを楽しみにしています。