0


AI 绘画Stable Diffusion 研究(十三)SD数字人制作工具SadTlaker使用教程

免责声明:
本案例所用安装包免费提供,无任何盈利目的。

大家好,我是风雨无阻。

想必大家经常看到,无论是在产品营销还是品牌推广时,很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵,少则几千,多则上万。

那么如何才能免费制作属于自己的数字人视频呢?

其实很简单,只需要在stable diffusion上安装sadtalker插件就能轻松生成自己的数字人。

如果还没安装sadtalker插件的朋友,请查看我的上一篇文章AI 绘画Stable Diffusion 研究(十二)SD数字人制作工具SadTlaker插件安装教程。

今天我们就来演示 如何使用SadTlaker插件制作一个会说话的数字人视频。

大家跟着我的步骤,赶紧实操起来,看看效果。

1、准备图片

图片: 准备一张人物正面图片,我们可以用sd 文生图或图生图功能生成,也可以是其他的图片。

这里再演示一下,使用sd 图生图,生成一张正面图片的步骤。

(1)、去C站找一张正面图作为参考

在这里插入图片描述

(2)、下载大模型: majicMIX realistic 麦橘写实 ,并把它放到 models\Stable-diffusion 目录下

然后重启 Stable-diffusion 让模型生效。

\sd-webui-aki-v4.2\models\Stable-diffusion

在这里插入图片描述

(3)、下载图片,并上传到图生图,然后设置相关参数

  • 上传图片
  • 设置正向提示词 、反向提示词
  • CLP 终止层数设置为:2
  • 设置随机种子
  • 设置采样方法
  • 设置重绘制尺寸
  • 开启面部修复(重要:不开启,人物面部会出现斑点或痣)

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

(4)、点击生成,可以获得一张人物正面图片

在这里插入图片描述

2、准备音频文件

音频文件格式: MP3或wav 文件。

音频文件允许的长度:由显存大小决定。

音频文件的生成:可以使用chatgpt 生成文案,再使用配音工具生成音频,保存起来。当然也可以自己录制音频,这里就不再详细演示。

这里为了演示,提前准备了一段 14s 左右的音频。

3、使用SadTlaker 合成数字人视频

(1)、功能栏区域,切换到SadTlaker 标签页

在这里插入图片描述

(2)、上传刚刚sd 生成好的人物正面图片

在这里插入图片描述

(3)、上传准备的音频文件

在这里插入图片描述

(4)、参数设置及详解

  • 姿态样式: 人脸姿态,一共47个数字,每个姿态都不一样,大家可自行测试选择喜欢的姿态。
  • 脸部模型分辨率:根据分辨率选择自己对口型的模型,如果图片较大就选择512。
  • 预处理:这个设置,与图生图中的设置相同。
  • 静止模式:更少的手势,需要和完整与处理一起使用。
  • 使用GFPGAN 增强面部: 是否高清化处理

这是我的设置,如下:

在这里插入图片描述

(5)、点击“生成”按钮,合成视频

视频会在预览窗口显示视频处理状态,控制台也能看到处理进度。

只需等待处理完成即可。

在这里插入图片描述

A、使用预处理完整+静止模式的方式生成的视频:

SD插件SadTlaker制作的会说话的数人

B、使用预处理裁剪 方式生成的视频:

SD插件SadTlaker制作的会说话的数人2

对比效果:

A 方式生成的视频动作幅度更小,但是图片使用的是原尺寸。

B 方式生成的视频动作幅度更大,图片被裁剪,但是效果更真实自然一些。

好了,SD数字人制作教程就到此结束。


本文转载自: https://blog.csdn.net/lizhong2008/article/details/132394948
版权归原作者 w风雨无阻w 所有, 如有侵权,请联系我们删除。

“AI 绘画Stable Diffusion 研究(十三)SD数字人制作工具SadTlaker使用教程”的评论:

还没有评论