发布时间:2024-04-03 13:08:26 浏览量:287次
本文主要介绍了 StableDiffusion在图片生成上的内容,然后详细说明了StableDiffusion 的主要术语和参数,并探讨了如何使用 prompt 和高级技巧(如图像修复、训练自定义模型和图像编辑)来生成高质量的图片。
介绍StableDiffusion
Stable Diffusion是一种潜在的文本到图像扩散模型,能够生成逼真的图像,只需任何文本输入,就可以自主自由创造漂亮的图像,使众多不会拍照的人在几秒钟内创造出惊人的图片。StableDiffusion可以生成不同的图片风格,比如:Anime 动画,realistic 写实,Landscape 风景,Fantasy 奇幻,Artistic 艺术。 还有很多其他的风格,都可以在网上看到。
有一些图示来直观理解StableDiffusion,比较深奥,不过多解释:
https://zhuanlan.zhihu.com/p/599887666
https://stable-diffusion-art.com/models/
网上可以下载到的StableDiffusion模型非常多。只需要记得这些都是SD模型的微调版本即可,这些不同版本的StableDiffusion模型都是基于相同的算法和原理,并且都可以用于生成高质量的图像、音频、视频等数据。具体选择哪个版本取决于应用场景和具体需求。
以下是常见模型,以及说明:
也可以自己做模型的合并,在StableDiffusion的GUI界面如下操作即可:
ControlNet是一种稳定的扩散模型,可以复制作品和人体姿势。想要使用的话再扩展中安装sd-webui-controlnet扩展即可。
正常情况下我们想要控制人物的姿势是十分困难的,并且姿势随机,而ControlNet解决了这个问题。它强大而多功能,可以与任何扩散模型一起使用。
主要作用:
可用的模型以及说明:
不同抽样算法的生成时间对比:
使用不同的抽样算法生成的图片:
a busy city street in a modern city
https://stable-diffusion-art.com/know-these-important-parameters-for-stunning-ai-images/#Sampling_methods
如何生成高质量的图片
在StableDiffusion中,"prompt"是指为GPT模型提供输入的文本段落或句子。它是用来引导模型生成有意义、准确的响应的关键因素之一。
同时可以考虑满足以下的条件:
如果不确定要用什么风格,可以去下面的两个地址搜一下对应的风格
使用()增加权重,使用[]降低权重;
a (word) - 将对单词的权重增加1.1倍
a ((word)) - 将对单词的权重增加1.21倍(= 1.1 * 1.1)
a [word] - 将对单词的权重减少1.1倍
a (word:1.5) - 将对单词的权重增加1.5倍
a (word:0.25) - 将对单词的权重减少4倍(= 1 / 0.25)
a \(word\) - 在提示中使用字面上的()字符,转义,不使用权重
prompt也可以从某个点位开始考虑生成指定的内容:
[from:to:when]
示例:
a [fantasy:cyberpunk:16] landscape
另外一种语法:
[cow|horse] in a field
第1步,提示是“cow”。第2步是“horse”。第3步是“cow”,以此类推。
negtive提示符:
ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face
((((ugly)))), (((duplicate))), ((morbid)), ((mutilated)), [out of frame], extra fingers, mutated hands, ((poorly drawn hands)), ((poorly drawn face)), (((mutation))), (((deformed))), ((ugly)), blurry, ((bad anatomy)), (((bad proportions))), ((extra limbs)), cloned face, (((disfigured))), out of frame, ugly, extra limbs, (bad anatomy), gross proportions, (malformed limbs), ((missing arms)), ((missing legs)), (((extra arms))), (((extra legs))), mutated hands, (fused fingers), (too many fingers), (((long neck)))
https://stable-diffusion-art.com/inpainting-remove-extra-limbs/
其中的一些参数:
模型记得选择SDv1.5修复模型(sd-v1-5-inpainting.ckpt)。
可以直接在Colab云端训练,本地也不用配置环境,训练也很快:
https://colab.research.google.com/github/Linaqruf/kohya-trainer/blob/main/kohya-LoRA-dreambooth.ipynb#scrollTo=WNn0g1pnHfk5
想在本地训练:
按照colab正常操作就行;最终会输出一份训练的模型到你的Google Driver中。然后自己在本地测试:
prompt:a woman, hitokomoru , with a cat on her head <lora:hito_komoru_test:1>
negtive: (worst quality:2), (low quality:2),disfigured, ugly, old, wrong finger
使用自己的Lora VS 不使用Lora
还有一次可以训练多个概念,把文件件组织好就行了
编辑配置文件
configs/instruct-pix2pix.yaml,改为如下内容:
use_ema: true // 默认为false
load_ema: true
denoising 改为1.0, 抽样使用Euler a算法;
常用参数:
下面是一些常用的指令模板:
有时候重新表达指令可以改善结果(例如,“turn him into a dog”与“make him a dog”与“as a dog”)。
增加steps的值有时可以改善结果。
人脸看起来奇怪?Stable Diffusion自编码器在图像中人脸较小的情况下会有问题。尝试:裁剪图像,使人脸在画面中占据更大的部分。
资料地址:
Stable Diffusion的webUI中默认有一些脚本,可以方便我们尝试一些不同的生成方式。
水下摄影肖像,iu1,裙子,美丽的详细女孩,极其详细的眼睛和脸,美丽的详细眼睛,闭着嘴,黑色的头发,锁骨,裸露的肩膀,长睫毛,飘逸的头发,气泡,阳光穿过水面,逼真,照片般的真实感,由泰德·格兰博拍摄,最高品质。
正面提示:underwater photography portrait, iu1, dress, beautiful detailed girl, extremely detailed eyes and face, beautiful detailed eyes, closed mouth, black hair, collarbone, bare shoulders, longeyelashes, floating hair, bubbles, sun light breaking through water surface, realistic, photorealistic, by ted grambeau, best quality
<lora:iu_V35:0.8>
反面提示:(worst quality:2), (low quality:2), (normal quality:2) , goggles, sun glasses, hand, extra fingers, fewer fingers, strange fingers, bad hand
参数 | 值 | 参数说明 |
CFG scale | 8 | 值越大,越符合你的prompt,范围为1~30;默认为7. 个人测试: 5以下看起来不好看 |
Sampling steps | 20 | 理论上越大,图片质量越高,但是可能会带来模糊 |
Image size | 512×512 | |
Seed | -1 | |
Face restoration | Codeformer | 勾选面部修复 |
Sampling method | DPM++ 2M Karas | |
Model | F222 | 默认是SD模型,可以下载这个模型,F222主要用在女性身材生成上比较擅长: https://huggingface.co/acheong08/f222/blob/main/f222.ckpt |
微调模型 | Lora iu https://civitai.com/models/11722/iu | 默认是SD模型,可以下载这个模型,F222主要用在女性身材生成上比较擅长: https://huggingface.co/acheong08/f222/blob/main/f222.ckt |
我做的事情:
原始照片:
生成prompt:
第一张prompt: ((Sunset)) , (Lake Gold) , Boat Center, Mountain, Tree in left, realistic, photorealistic, , 8K,Wide-angle, (expansive:1.5) , a combination of red, orange, pink, and purple.
negtive: (worst quality:2), (low quality:2)
第二张:a sunset over a body of water with a tree branch hanging over it and the sun reflecting in the water, a photo, Arthur Pan, dau-al-set, tranquil
第三张:two ducks swimming in a pond with fish in the water and a fish in the water behind them,, an impressionist painting, Emperor Huizong of Song, cloisonnism, tone mapping
第四张:a field of colorful flowers with green stems and yellow and red flowers in the middle of the field,, a jigsaw puzzle, Bob Thompson, color field, rich vivid colors
prompt:a young man holding a durian fruit in his hand , portrait ,detailed eyes, hyperrealistic
negtive prompt: (worst quality:2), (low quality:2),disfigured, ugly, old
模型:AnythingV3;
Denoising strength从0.1依次升高,第一张为原图;
Denoising strength: 0.4~0.7(可以看到从0.5的噪声强度开始,AI已经开始自由发挥了,虽然也会参考原图)
Denoising strength: 0.8~0.9 (基本完全自由发挥)
依旧是上个原图,换为midjourney v4模型,Denoising strength测试0.2, 0.4, 0.6, 0.8
相同的提示词,换个模型之后整体风格大变;
TextCFG固定:7.5,调整ImageCFG;
Put him in beach
提示:A girl, showing her muscles, detailed face , realistic ,8k <
lora:chilloutmixss30_v30:1>
negtive prompht: (worst quality:2), (low quality:2),disfigured, ugly, old,nsfw
除了控制姿势,还可以控制人物的表情,这里我们只是控制人物的姿势;
给“模特”戴项链:
A girl, (necklace:1.5), showing her muscles, detailed face , realistic ,8k <lora:chilloutmixss30_v30:1>
给“模特”戴墨镜:
A girl, (sunglasses:1.5), showing her muscles, detailed face , realistic ,8k <lora:chilloutmixss30_v30:1>
StableDiffusion在实际应用中的案例
探讨StableDiffusion与AIGC未来的发展趋势
将概念扩大不仅是生成图片,而是人工智能生成内容的话,参开ChaGPT的回答,在未来人工智能技术可能的发展方向和影响;
人工智能内容生成技术可以用于新闻、报道、评论等方面,帮助媒体机构更快速、高效地生成内容。同时,它也可以用于广告创意、广告文案等方面,帮助广告公司更好地推广产品和服务。
人工智能内容生成技术可以用于游戏角色、游戏关卡等方面,帮助游戏公司更好地设计和开发游戏。此外,它还可以用于教学资源的生成和个性化教学,例如生成教材、课件、试题等。
人工智能内容生成技术可以用于金融报告、分析和预测,例如生成金融新闻报道、投资报告等。在医疗行业中,它可以用于医疗报告和病历记录,例如生成病历记录、医学报告等。
人工智能内容生成技术可以用于法律文件和合同的生成,例如生成合同、法律文书等。在建筑行业中,它可以用于建筑设计和规划,例如生成建筑设计图纸、规划方案等。
人工智能内容生成技术在IT行业中的应用非常广泛,可以将其分为以下几个子类别:
人工智能内容生成技术可以用于互联网内容的自动化生成,例如自动化生成新闻报道、博客文章、社交媒体内容等,从而提高效率和质量。
人工智能内容生成技术可以用于搜索引擎的优化和改进,例如生成更好的搜索结果、提高搜索的准确性和速度等。
人工智能内容生成技术可以用于个性化推荐系统的优化和改进,例如生成更符合用户兴趣和需求的推荐内容。
人工智能内容生成技术可以用于聊天机器人的开发和优化,例如生成更自然、流畅的对话内容,提升用户体验。
人工智能内容生成技术可以用于大数据分析和处理,例如自动生成数据报告、分析结果等。
人工智能内容生成技术可以用于自动生成代码、文档、测试用例等,从而提高软件开发的效率和质量。
人工智能内容生成技术可以用于网络安全和数据安全领域,例如自动生成安全报告、分析网络攻击等。
人工智能内容生成技术可以用于改善人机交互体验,例如自动生成UI界面、语音交互内容等。
人工智能内容生成技术可以用于优化云计算服务,例如自动生成云计算资源规划、监控报告等。
总结
这里主要介绍了 StableDiffusion在图片生成上的内容,然后详细说明了StableDiffusion 的主要术语和参数,并探讨了如何使用 prompt 和高级技巧(如图像修复、训练自定义模型和图像编辑)来生成高质量的图片。最后设想了一些 StableDiffusion 在个人和商业领域的实际应用案例,讨论了它在媒体、游戏、金融、法律、IT 等行业的未来发展趋势。
最后,我们正处于 AIGC的时代,这些新技术正在改变我们的生活和工作方式,为我们带来前所未有的机遇和挑战。积极拥抱这些新技术,抓住时代的机遇,不断学习和适应新的变化。不管以后什么行业,AIGC 技术都将发挥越来越重要的作用。尽早探索未知的领域,开创更好的未来!
相关资源
作者:艾贺(致问)
来源:微信公众号:大淘宝技术
出处
:https://mp.weixin.qq.com/s/NkdPkEq_GMO6FRCLc_ZSow
热门资讯
想将照片变成漫画效果?这篇文章分享了4个方法,包括Photoshop、聪明灵犀、VanceAI Toongineer、醒图,简单操作就能实现,快来尝试一下吧!
2. 华为手机神奇“AI修图”功能,一键消除衣服!原图变身大V领深V!
最近华为手机Pura70推出的“AI修图”功能引发热议,通过简单操作可以让照片中的人物换装。想了解更多这款神奇功能的使用方法吗?点击查看!
近年来,人工智能逐渐走入公众视野,其中的AI图像生成技术尤为引人注目。只需在特定软件中输入关键词描述语以及上传参考图就能智能高效生成符合要求的...
4. AI视频制作神器Viggle:让静态人物动起来,创意无限!
Viggle AI是一款免费制作视频的AI工具,能让静态人物图片动起来,快来了解Viggle AI的功能和优势吧!
5. Logo Diffusion——基于sd绘画模型的AI LOGO 生成器
这下LOGO设计彻底不用求人了。接下来详细演示一遍操作流程首先进入Logo D... 想学习更多AI技能,比如说关于怎么样利用AI来提高生产效率、还能做什么AI...
6. 零基础10分钟生成漫画,教大家如何用AI生成自己的漫画
接下来,我将亲自引导你,使用AI工具,创作一本既有趣又能带来盈利的漫画。我们将一起探索如何利用这个工具,发挥你的创意,制作出令人惊叹的漫画作品。让...
以下是一些免费的AI视频制作网站或工具,帮助您制作各种类型的视频。 1. Lumen5:Lumen5是一个基于AI的视频制作工具,可将文本转换为视频。 用户可以使...
8. AI显卡绘画排行榜:4090无悬念,最具性价比出人意料
在AI绘图领域,Stable Diffusion的显卡绘图性能备受关注。本文整理了Stable Diffusion显卡的硬件要求和性能表现,以及2023年3月显卡AI绘图效率排行榜和性价比排行榜。欢迎查看最新的AI显卡算力排行榜。
9. 一款免费无限制的AI视频生成工具火了!国内无障碍访问!附教程
人人都可以动手制作AI视频! 打开网址https://pixverse.ai/,用邮箱注册后,点击右上角Create,就可以开始创作了。 PixVerse目前有文案生成视频,和图片生...
就能快速生成一幅极具艺术效果的作品,让现实中不懂绘画的人也能参与其中创作!真的超赞哒~趣趣分享几款超厉害的AI绘画软件,提供详细操作!有需要的快来...
同学您好!