然而,与下面人类手工设计的LOGO比起来,上面AI设计的效果不能说不好看,但似乎还差那么点意思:

人类设计师会在保留原本字体特色、让人们能一眼认出单词的基础上,再加入一点创新之处,例如将Jazz中的J改成乐器,但其他人一眼仍然能认出“JAZZ”字体的形状。

例如这是Stable Diffusion生成的“FROG”设计,FRO仍然是原本字体的形状,只有G变成一只跳出去的小青蛙:

如果用Stable Diffusion 2进一步进行后期处理的话,还能进一步实现上色功能,显得更加生动:

为了一定程度上保留原本字体的风格、以及只改变单词中的某几个字母,作者们想出一种“微调”字母形状的方法——

具体控制点数量,则根据字母复杂度和字体风格进行迭代变换,直到设计出来的字母符合要求,其中橙色是初始点,蓝色是后续增加的控制点:

例如这是不同数量的控制点生成字母的效果,如果数量太少,会看不清设计的图像形状;但数量过多又容易扭曲字体原本的形状:

基于这种核心设计思路,作者们结合Stable Diffusion和CLIP,设计出了一整个字体设计AI模型:

其中,ACAP(as conformal as possible)损失函数基于德劳内三角形剖分算法,对字母形状进一步进行了约束。

例如这是PANTS(裤子)在变形前和变形之后的形态,可以看见ACAP在保留裤子形态的同时,也保留了字体的效果:

与此同时,为了进一步保留字体形态,作者们采用了一个低通滤波器,保证调整后的字母不与原始字母偏离太多。例如这是Bear(熊)中的B调整后的形态:

不过在arXiv上,作者们的名字倒是已经公开了,他们分别来自以色列特拉维夫大学、Reichman University(莱希曼大学),以及伦敦大学金史密斯学院:

共同一作Shir Iluz,特拉维夫大学电子与电气工程理学硕士,目前的研究方向是生成AI,感兴趣的方向是深度学习与计算机视觉。

共同一作Yael Vinker,特拉维夫大学计算机视觉博士生,曾经在以色列希伯来大学获得计算机科学本科与硕士学位,目前研究方向同样是深度学习与计算机视觉。

作者 admin

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注