AI字體生成的現狀
本文由 Simon Cozens 撰寫,探討了AI字體生成的當前狀況,指出了機器學習研究人員與字體設計師之間缺乏合作、西方與東亞字體工廠對AI的不同態度以及該領域的研究進展。
AI字體生成領域近年來取得了顯著進展,但同時也暴露出一些關鍵問題。本文作者 Simon Cozens 基於自身訓練字形生成模型的經驗,全面分析了該領域的現狀。
首先,機器學習研究人員與字體設計師之間存在明顯的合作缺口。許多ML模型在字形提取和柵格化過程中缺乏字體專家的輸入,導致輸出質量在字體設計師眼中難以接受。例如,一些被ML工程師視為成功的模型,實際上在排版專業人士看來完全不達標。這種跨學科合作不足的原因在於,ML研究人員習慣於處理計算機圖形學問題,而字體設計表面上看起來簡單——畢竟人人都認識字母“a”——但實際上需要深厚的專業知識。
然而,當ML研究人員尋求與字體社區合作時,可能會遇到牴觸情緒。字體設計師擔心AI會取代他們的工作,並且對倫理和法律問題持審慎態度。這形成了一個封閉循環:研究人員因缺乏合作而產出低劣模型,字體設計師看到這些低劣模型後更加堅信自己的工作安全。
但這一視角主要適用於西方。在中文、日文和韓文(CJK)字體設計中,情況截然不同。CJK字體包含數萬個字符,人工繪製每個字形是一項繁重且無趣的任務。因此,中國和日本的字體工廠對AI字體生成持開放態度,甚至積極支持相關研究。例如,中國字體廠商方正(Founder)與研究人員合作,公開提供其商業字體庫用於訓練AI模型。這種合作催生了“小樣本字體生成”技術,即用户只需提供幾十個參考字形,AI即可自動補全剩餘字符。這項技術已在CJK字體生產中實際應用。
西方拉丁字體的AI生成目前仍處於較低水平,而CJK字體的AI生成已接近生產就緒。造成這種差異的原因可能包括:拉丁字母數量少,設計中的“趣味性”較高;而CJK字形量大,自動化需求迫切。
當前AI字體生成研究主要通過學術論文傳播,尤其是Arxiv上的計算機視覺與模式識別(cs.CV)子類。許多模型基於生成對抗網絡(GAN),例如DG-Font、LF-Font、MX-Font等,這些模型嘗試將風格與內容分離,實現從少量樣本生成新字體。此外,還有基於擴散模型和Transformer的新方法正在湧現。
總之,AI字體生成技術正在快速發展,但其成功應用取決於跨學科合作以及對不同文化背景下字體設計需求的理解。未來,隨着研究的深入,我們可能會看到更多實用的拉丁字體生成工具,但這需要ML研究人員與字體設計師的共同努力。