介绍
最近,我觉得图像生成的 AI 已经成为一个热门话题。
但是,由于我不是主要从事机器学习和 AI 等领域的工程师,所以我认为这会很有趣,并在对面银行看了几个星期。
然后是稳定扩散的话题!我以为这会改变潮流,所以我在Google Colaboratory环境中玩了各种东西,所以我会写一篇文章。
本文是 text2img 的下一步。 (在我的观察范围内,目前还没有,所以就匆匆写了)
还没有做text2img的Hugging Face账号是什么?如果你是?,请(收藏这篇文章)转身,看《马背上的宇航员》,然后回来。我一直在这里等你。
结论
向下滚动上面的扩散器官方 github 示例/推理页面自述文件。
按屏幕截图上的第一个“在 Colab 中打开”按钮,然后从顶部按顺序运行。就这样! (截至 2022 年 8 月 26 日)
没有,感觉就这些了,不知道官方是不是昨天上传的?我在 img2img 日文文章中找不到介绍这个 Colab 的文章。 (这就是为什么我走了很多弯路。有远见的眼睛。)
补充给不知道的人
对于那些只能理解结论的人来说,其余的很可能是可以理解的,所以......
好吧,老实说,有很多东西我不是很了解,因为我在不同的领域,但我并不真正了解 Google Colaboratory 和 Python 之类的东西!我想说这话的人会随着这波大浪进来,所以我会写得更详细一点。
谷歌 Colab
首先,作为一个大前提,我也不知道,但是如果你通过在 Colab 中打开的链接打开 Colaboratory,你可以在“你自己的环境”中运行某人编写的代码。
因此,似乎可以执行和重写这个通过单击打开的屏幕,如下面的屏幕截图。
从顶部运行意味着单击编写程序的框左上角的红色箭头。
当我第一次运行它时,我收到以下警告:如果您认为没问题,请“按原样运行”。还有另一个警报,但我认为也可以检查一下。
拥抱的脸
提示登录时使用获取的令牌登录。
一些文章如教程初始化管道?我直接把它写成use_auth_token="xxxxxx" 我正在做的地方。两者都工作得很好,所以你喜欢哪个?唯一的区别是当您保存它时,它将完全可见。
更改草图
这是草图的指定部分。最简单的方法是将另一个图像的 URL 放在 url="https://..." 部分中。
我从伊良户屋借来的。 (不过会被当作直接链接处理,所以不知道是否允许,仅供参考。)
如您所见,比例有点奇怪。
init_img = init_img.resize((768, 512))
在您阅读时,它已使用此处的代码调整大小。
生成的图像也会是这个大小,所以你应该根据情况改变这个数字。
请注意,您应该认为(512,512) 是最小值。不知道为什么如果比这个小,那是因为训练图像也很小,但是生成的图像质量下降很多。
如果它太大,你会得到一个错误,没有足够的内存。我正在考虑将这些单独放在一起。也许吧,但我认为 Colab 的限制是将一个大小设置为1024,另一个设置为512。
与其使用网上的图片,不如使用自己用颜料画的图片,会增加一点步骤,但我想这是我想做的。我认为有几种方法,但我将通过拖放将其上传到环境中来介绍如何使用它。
单击左侧的文件夹图标以查看文件。将文件拖放到此处以将它们上传到您的环境。
# init_img = Image.open(BytesIO(response.content)).convert("RGB")
init_img = Image.open("test.png").convert("RGB")
将程序中的BytesIO(...)改成上传的文件名并运行。
如截图所示,我没有使用从网上下载图片的部分,所以我把#作为评论的第一个字符。 (该行也可以使用 Ctrl+/ 键进行注释。)
如果您按顺序执行此操作,则可以从上传的草图创建图像。
嗯,我希望在草图和提示中看到更多的独创性。 . .
非常感谢您的评论和您可能拥有的任何信息!
原创声明:本文系作者授权爱码网发表,未经许可,不得转载;
原文地址:https://www.likecs.com/show-308624556.html