最近有一个生成证件照的开源项目很火,今天我们来学习一下。之前我生成证件照都是线下去拍照,线上使用也是各种限制,需要付费或看广告,而且效果也不是很理想,
今天要分享的这个 AI 证件照生成工具可以一键可以生成一寸照、二寸照、教师资格证、国家公务员考试、社保卡、电子驾驶证、各种签证在内的 18 种证件照片,而且可以选择蓝、白、红、黑、深蓝在内的五种背景证件照片。
如果这些配置项里面的不满足你的要求,你还可以自定义生成各种样式的照片。
只需要上传自拍照片,就可以生成各种证件照,自动排版,一键打印,同时也提供了一键美白功能:
这个就是使用最近火出圈的AI工具:HivisionIDPhotos 来生成的。
该工具支持好几种方式去运行,这里我总结一下:
- 在线Demo,直接运行
- 通过Docker一键运行,本地使用
- 本地安装启动
- 集成到ComfyUI里,利用工作流自定义出图,这个我会重点讲解一下
在线地址
作者提供了线上地址,无需部署,在线直接免费运行。
国内:
https://swanhub.co/ZeYiLin/HivisionIDPhotos/demo
https://modelscope.cn/studios/SwanLab/HivisionIDPhotos
国外:
https://huggingface.co/spaces/TheEeeeLin/HivisionIDPhotos
Docker部署
docker pull linzeyi/hivision_idphotos
docker run -d-p7860:7860 linzeyi/hivision_idphotos
访问:http://localhost:7860 即可。
如果需要启动后端接口服务则启动如下服务:
docker run -d-p8080:8080 linzeyi/hivision_idphotos python3 deploy_api.py
本地安装启动
1.下载源码到本地。
git clone https://github.com/Zeyi-Lin/HivisionIDPhotos.git
cd HivisionIDPhotos
2.安装依赖。
pip install-r requirements.txt
pip install-r requirements-app.txt
3.下载权重文件。
- 使用脚本下载
python scripts/download_model.py --models all
- 直接下载放到对应目录
存到项目的 hivision/creator/weights目录下:
1.modnet_photographic_portrait_matting.onnx (24.7MB): MODNet官方权重
2.hivision_modnet.onnx (24.7MB): 对纯色换底适配性更好的抠图模型
下载地址:
https://github.com/Zeyi-Lin/HivisionIDPhotos/releases/download/pretrained-model/hivision_modnet.onnx
3.rmbg-1.4.onnx (176.2MB): BRIA AI 开源的抠图模型,下载后重命名为rmbg-1.4.onnx
下载地址:
https://huggingface.co/briaai/RMBG-1.4/resolve/main/onnx/model.onnx?download=true
4.birefnet-v1-lite.onnx(224MB): ZhengPeng7 开源的抠图模型,下载后重命名为birefnet-v1-lite.onnx
下载地址:
https://github.com/ZhengPeng7/BiRefNet/releases/download/v1/BiRefNet-general-bb_swin_v1_tiny-epoch_232.onnx
4.人脸检测模型配置(可选)。
拓展人脸检测模型介绍使用文档MTCNN离线人脸检测模型,高性能CPU推理(毫秒级),为默认模型,检测精度较低Clone此项目后直接使用RetinaFace离线人脸检测模型,CPU推理速度中等(秒级),精度较高下载后放到
hivision/creator/retinaface/weights
目录下Face++旷视推出的在线人脸检测API,检测精度较高,官方文档使用文档
5.GPU推理加速(可选)。
在当前版本,可被英伟达GPU加速的模型为
birefnet-v1-lite
,并请确保你有16GB左右的显存。
如需使用英伟达GPU加速推理,在确保你已经安装CUDA与cuDNN后,根据onnxruntime-gpu文档找到对应的
onnxruntime-gpu
版本安装,以及根据pytorch官网找到对应的
torch
版本安装。
# 假如你的电脑安装的是CUDA 12.x, cuDNN 8# 安装torch是可选的,如果你始终配置不好cuDNN,那么试试安装torch
pip install onnxruntime-gpu==1.18.0
pip install torch --index-url https://download.pytorch.org/whl/cu121
在上面配置完后,执行如下命令,然后访问:http://localhost:7860 即可。
python app.py
6.API 服务(可选)。
如果需要启动请求 API 服务,则需要执行如下命令
python deploy_api.py
详细请求方式请参考 API 文档,包含以下请求示例:
- cURL:https://github.com/Zeyi-Lin/HivisionIDPhotos/blob/master/docs/api_CN.md#curl-请求示例
- Python:https://github.com/Zeyi-Lin/HivisionIDPhotos/blob/master/docs/api_CN.md#python-请求示例
- Java:https://github.com/Zeyi-Lin/HivisionIDPhotos/blob/master/docs/api_CN.md#java-请求示例
- Javascript:https://github.com/Zeyi-Lin/HivisionIDPhotos/blob/master/docs/api_CN.md#javascript-请求示例
ComfyUI
插件地址:https://github.com/AIFSH/HivisionIDPhotos-ComfyUI
有 ComfyUI 的小伙伴,只需要在 ComfyUI 管理器搜索:HivisionIDPhotos-ComfyUI 就可以了。当然也可以直接下载到
custom_nodes
下面。
同上面下载权重和模型一样的操作,
modnet_photographic_portrait_matting.onnx
,
hivision_modnet.onnx
,
rmbg-1.4.onnx
,
birefnet-v1-lite.onnx
,把文件放到
ComfyUI/custom_nodes/HivisionIDPhotos-ComfyUI/hivision/creator/weights
目录下面,而RetinaFace下载的模型
retinaface-resnet50.onnx
放到
ComfyUI/custom_nodes/HivisionIDPhotos-ComfyUI/hivision/creator/retinaface/weights
下面。
加载工作流,选好配置运行结果如下:
节点都比较简单,如
ZHHivisionParamsNode
节点:
第一个选项证件照的尺寸,第二个选项是背景颜色,第三个选项是背景的渲染效果,是纯色,还是上下渐变或者中心渐变。
HivisionNode
节点:
head_measure_ratio:头部尺寸比例,值越大,头部占据证件照的比例就越大。
top_distance:头部到图像顶部的距离,值越大,距离越远。
whitening_strength:为美白强度。
AddWaterMarkNode
节点为添加文字水印节点。
- text_color:输入颜色编码,默认是白色。
- text_size:字体的大小。
- text_opacity:水印的透明度。
- text_angle:水印的旋转角度。
- text_space:水印字体间隔。
如我添加“壁虎”文字水印,效果如下:
想要新增证件类型,只需要修改
HivisionIDPhotos-ComfyUI\hivision\demo\assets
以下文件就可以了,CN 后缀的代表中文,按照文件中的格式添加就可以了。
- 尺寸:修改size_list_CN.csv后再次运行即可,其中第一列为尺寸名,第二列为高度,第三列为宽度。
- 颜色:修改color_list_CN.csv后再次运行即可,其中第一列为颜色名,第二列为Hex值。
比如我新加类型:自定义配置和紫色。
结果如下:
至此基本的用法我们学会了,但在ComfyUI中我们就可以组合各种模型和Lora去生成自己想要的头像了。
比如我们可以把自己的头像上传,然后结合模型,生成微调的专属头像,或调整眼睛,鼻子,耳朵等等。
同时我们还能对图片进行模糊去噪,放大等。比如我们简单处理后效果如下:
文中所使用到的工作流欢迎关注公众号,回复【工作流】获取。
欢迎大家关注微信公众号"壁虎说技术",更多AI新技术,新点子在公众号第一时间更新。
参考
HivisionIDPhotos
版权归原作者 逆天壁虎 所有, 如有侵权,请联系我们删除。