当前位置:重庆公共服务第三方检测 > 神秘顾客学习 >
发布日期:2024-01-16 10:09 点击次数:161
能准确写汉字的AI绘制器具成都汽车销售神秘顾客调查,终于登场了!
包括中语在内一共相沿四种讲话,而况还能笔墨的位置还能肆意指定。
从此,东谈主们终于可以和AI绘制模子的“鬼画符”说相遇了。
这款名为AnyText的绘制器具来自阿里巴巴,可以按照指定位置精确地向图中加入笔墨。
此前的绘制模子多半无法准确地向图中添加笔墨,即便有也很难相沿像中语这么结构复杂的笔墨。
而当今Anytext相沿中英日韩四种讲话,不仅字形准确,立场也可以与图片完满交融。
除了可以在绘制时加入笔墨,修改图片中已有的笔墨,致使向其中加字也王人不是问题。
究竟AnyText着力若何,咱们也骨子体验了一番。
神秘顾客公司_赛优市场调研各样立场放浪足下
官方在GitHub文档中提供了AnyText的部署教程,也可以在魔搭社区中体验。
此外成都汽车销售神秘顾客调查还有网友制作了PyTorch札记,可以在土产货或Colab中一键部署,咱们选拔的亦然这种神色。
AnyText相沿中英文Prompt,不外从步伐日记来看,中语领导词会被自动翻译成英文。
比如咱们念念让AnyText给马斯克换上一件白色T恤,让他来给量子位(QbitAI)打个call。
只需要输入领导词,然后设定文本的位置,然后径直开动就可以了。
淌若需要换取尺寸等参数,可以将上方的菜单伸开;淌若不会操作,页面中还附有中英双语教程。
最终,在搭载V100的Colab上,AnyText用了10多秒绘制出了四张图片。
着力已经可以的,无论是图本人已经笔墨,看上去王人莫得什么缝隙。
而况各样笔墨材质AnyText王人能准确师法,比如黑板上的粉笔字,致使是传统书道……
街景中的笔墨,致使是电商促销海报,王人难不倒AnyText。
而况不仅是平面上多样各样的笔墨,神秘顾客资讯立身形度雷同也不在话下。
而其中的文本剪辑功能,还可以修改已有图片中的笔墨,真的不会留住缝隙。
在测试当中,AnyText亦然获得了可以的收获——无论是中英文,准确度王人权贵高于ControlNet,FID过失也大幅减少。
此外,淌若自行部署,还可以对字体进行自界说,只需准备好字体文献并对代码浅易修改就可以了。
那么,计算东谈主员是若何让AnyText学会写字的呢?
文本渲染寥寂完成
AnyText是基于扩散模子树立的,主要分为两个模块,笔墨生成的历程是相对寥寂的。
这两个模块远离是隐空间提拔模块和文本镶嵌模块。
其中,提拔模块对字形、笔墨位置和掩码这三种信息进行编码并构建隐空间特征图像,用来提拔视觉笔墨的生成;
文本镶嵌模块则将样子词中的语义部分与待生成文本部证明耦,使用图像编码模块单独索求字形信息后,再与语义信息作念交融。
在骨子使命历程中,镶嵌的文本运输给绘制模块时被用星号代替,在镶嵌空间预留位置并用标记填充。
然后文本镶嵌模块得到的字形图像被输入预查验OCR模子,索求出字形特征,然后换取其维度并替换预留位置中的标记,得到新的序列。
终末,这个序列暗示被输入到CLIP的文本编码器中,造成最终指导图像生成的指示。
这种“分而治之”的神色,既有助于笔墨的书写精度,也有益于提高笔墨与布景的一致性。
此外,AnyText还相沿镶嵌其他扩散模子,为之提供文本生成相沿。
Powered by 重庆公共服务第三方检测 @2013-2022 RSS地图 HTML地图
Copyright 站群 © 2013-2022 粤ICP备09006501号