AI News HubLIVE
站内改写2 分鐘閱讀

Coplot: 通過可視化支持研究過程

研究過程中,可視化工具幫助研究人員更清晰地理解數據和工作。Cohere Labs 開發了 co/plot,一個快速迭代且保持數據準確性的可視化工具,已在多個項目中得到驗證,並開源供社區使用。

研究的影響力往往取決於研究人員能否清晰呈現自己的工作——既包括研究過程中的自我理解,也包括與他人分享時的溝通效果。可視化在這一過程中扮演着關鍵角色,它幫助研究人員實時理解實驗數據、決定下一步方向、識別工作中的瓶頸。從圖表到柱狀圖、表格、折線圖,這些伴隨論文或博客呈現的可視化成果,其實是長期數據分析與意義探索的最終輸出。

在 Cohere Labs,我的職責之一就是製作這些可視化圖表,支持團隊探索研究問題。隨着我製作越來越多的圖表,我發現現有工作流程很難在快速迭代的同時保持可重複性和數據準確性。這是一個真正的瓶頸。許多研究者使用的 Matplotlib 難以快速迭代——微小的改動往往需要重新運行整個腳本。而設計工具 Figma 雖然能產出精美的圖表,卻無法可靠地導入數據,這意味着需要手動描摹 Matplotlib 的圖表,增加了準確性風險。這兩種方式都拖慢了工作進度,使得數據可視化難以充分發揮在研究過程中的作用。

於是我開始嘗試新的方法。最初我的目標是創建一個簡單的樣式工具,生成適用於 Matplotlib 的樣式規則。但隨着與團隊深入合作,我們意識到可以構建一個更有用的工具。我們稱之為 co/plot:一個可以快速原型化、自帶可定製樣式、且保持數據準確性的工具。

在構建 Tiny Aya 項目期間,co/plot 經受了全面測試。在模型構建過程中,我擴展了它的功能以支持我們評估的 70 多種語言;在撰寫技術報告時,我優化了它的樣式,使研究結果更加清晰精美。同時,我不斷將工具交給研究人員使用,根據他們的反饋改進用户體驗。

在這個過程中,co/plot 對我們工作流程的影響逐漸顯現。樣式更美觀、更易讀的圖表幫助我們做出了更好的決策。這些圖表不僅對技術報告有幫助,對整個研究過程也至關重要。

作為開放科學的堅定信仰者,我們決定將 co/plot 公開發布。除了論文和模型,發佈工具能夠提高整個領域的研究基線。來自開放科學社區的獨立研究者已經在使用 co/plot 更清晰地梳理他們的發現,這意味着他們可以更快迭代、獲得更好的反饋、更自信地分享工作。在我看來,這正是意義所在:當可視化工具的水平提升,更多的研究者能夠做出更清晰的工作,得出更清晰的結論,好的想法也能從意想不到的地方湧現。

數據可視化領域正在快速變化,研究者使用的工具決定了他們如何與數據互動。製作圖表、嘗試不同表示方式並觀察結果,這一迭代過程本身就是研究者理解發現的一部分。co/plot 正是基於這一信念構建的:製作圖表的過程與圖表本身同樣重要,研究工具應該支持這一過程,而不是將其抽象化。我們期待繼續開發 co/plot,發佈更多塑造我們研究過程的工具,並傾聽社區的意見,讓這些工具更好地為研究者服務。