AI字型生成的現狀
本文由 Simon Cozens 撰寫,探討了AI字型生成的當前狀況,指出了機器學習研究人員與字型設計師之間缺乏合作、西方與東亞字型工廠對AI的不同態度以及該領域的研究進展。
AI字型生成領域近年來取得了顯著進展,但同時也暴露出一些關鍵問題。本文作者 Simon Cozens 基於自身訓練字形生成模型的經驗,全面分析了該領域的現狀。
首先,機器學習研究人員與字型設計師之間存在明顯的合作缺口。許多ML模型在字形提取和柵格化過程中缺乏字型專家的輸入,導致輸出質量在字型設計師眼中難以接受。例如,一些被ML工程師視為成功的模型,實際上在排版專業人士看來完全不達標。這種跨學科合作不足的原因在於,ML研究人員習慣於處理計算機圖形學問題,而字型設計表面上看起來簡單——畢竟人人都認識字母“a”——但實際上需要深厚的專業知識。
然而,當ML研究人員尋求與字型社群合作時,可能會遇到牴觸情緒。字型設計師擔心AI會取代他們的工作,並且對倫理和法律問題持審慎態度。這形成了一個封閉迴圈:研究人員因缺乏合作而產出低劣模型,字型設計師看到這些低劣模型後更加堅信自己的工作安全。
但這一視角主要適用於西方。在中文、日文和韓文(CJK)字型設計中,情況截然不同。CJK字型包含數萬個字元,人工繪製每個字形是一項繁重且無趣的任務。因此,中國和日本的字型工廠對AI字型生成持開放態度,甚至積極支援相關研究。例如,中國字型廠商方正(Founder)與研究人員合作,公開提供其商業字型庫用於訓練AI模型。這種合作催生了“小樣本字型生成”技術,即使用者只需提供幾十個參考字形,AI即可自動補全剩餘字元。這項技術已在CJK字型生產中實際應用。
西方拉丁字型的AI生成目前仍處於較低水平,而CJK字型的AI生成已接近生產就緒。造成這種差異的原因可能包括:拉丁字母數量少,設計中的“趣味性”較高;而CJK字形量大,自動化需求迫切。
當前AI字型生成研究主要透過學術論文傳播,尤其是Arxiv上的計算機視覺與模式識別(cs.CV)子類。許多模型基於生成對抗網路(GAN),例如DG-Font、LF-Font、MX-Font等,這些模型嘗試將風格與內容分離,實現從少量樣本生成新字型。此外,還有基於擴散模型和Transformer的新方法正在湧現。
總之,AI字型生成技術正在快速發展,但其成功應用取決於跨學科合作以及對不同文化背景下字型設計需求的理解。未來,隨著研究的深入,我們可能會看到更多實用的拉丁字型生成工具,但這需要ML研究人員與字型設計師的共同努力。