AI News HubLIVE
站内改写2 分钟阅读

AI字体生成的现状

本文由 Simon Cozens 撰写,探讨了AI字体生成的当前状况,指出了机器学习研究人员与字体设计师之间缺乏合作、西方与东亚字体工厂对AI的不同态度以及该领域的研究进展。

来源Hacker News AI作者: gsky

AI字体生成领域近年来取得了显著进展,但同时也暴露出一些关键问题。本文作者 Simon Cozens 基于自身训练字形生成模型的经验,全面分析了该领域的现状。

首先,机器学习研究人员与字体设计师之间存在明显的合作缺口。许多ML模型在字形提取和栅格化过程中缺乏字体专家的输入,导致输出质量在字体设计师眼中难以接受。例如,一些被ML工程师视为成功的模型,实际上在排版专业人士看来完全不达标。这种跨学科合作不足的原因在于,ML研究人员习惯于处理计算机图形学问题,而字体设计表面上看起来简单——毕竟人人都认识字母“a”——但实际上需要深厚的专业知识。

然而,当ML研究人员寻求与字体社区合作时,可能会遇到抵触情绪。字体设计师担心AI会取代他们的工作,并且对伦理和法律问题持审慎态度。这形成了一个封闭循环:研究人员因缺乏合作而产出低劣模型,字体设计师看到这些低劣模型后更加坚信自己的工作安全。

但这一视角主要适用于西方。在中文、日文和韩文(CJK)字体设计中,情况截然不同。CJK字体包含数万个字符,人工绘制每个字形是一项繁重且无趣的任务。因此,中国和日本的字体工厂对AI字体生成持开放态度,甚至积极支持相关研究。例如,中国字体厂商方正(Founder)与研究人员合作,公开提供其商业字体库用于训练AI模型。这种合作催生了“小样本字体生成”技术,即用户只需提供几十个参考字形,AI即可自动补全剩余字符。这项技术已在CJK字体生产中实际应用。

西方拉丁字体的AI生成目前仍处于较低水平,而CJK字体的AI生成已接近生产就绪。造成这种差异的原因可能包括:拉丁字母数量少,设计中的“趣味性”较高;而CJK字形量大,自动化需求迫切。

当前AI字体生成研究主要通过学术论文传播,尤其是Arxiv上的计算机视觉与模式识别(cs.CV)子类。许多模型基于生成对抗网络(GAN),例如DG-Font、LF-Font、MX-Font等,这些模型尝试将风格与内容分离,实现从少量样本生成新字体。此外,还有基于扩散模型和Transformer的新方法正在涌现。

总之,AI字体生成技术正在快速发展,但其成功应用取决于跨学科合作以及对不同文化背景下字体设计需求的理解。未来,随着研究的深入,我们可能会看到更多实用的拉丁字体生成工具,但这需要ML研究人员与字体设计师的共同努力。