🔥SCEdit

SCEdit由阿里巴巴通义实验室视觉智能团队(Alibaba TongYi Vision Intelligence Lab)所提出，是一个高效的生成式微调框架。该框架不仅支持文生图下游任务的微调能力，相比LoRA节省30%-50%的训练显存开销，实现快速迁移到特定的生成场景中；而且还可以直接扩展到可控图像生成任务中，仅需ControlNet条件生成7.9%的参数量并节省30%的显存开销，支持边缘图、深度图、分割图、姿态、颜色图、图像补全等条件生成任务。

我们使用了风格迁移数据集中的3D风格数据进行了训练，并使用相同的Prompt: A boy in a camouflage jacket with a scarf进行测试，具体的定性和定量的结果如下：

Method	bs	ep	Target Module	Param. (M)	Mem. (MiB)
LoRA/r=64	1	50	q/k/v/out/mlp	23.94 (2.20%)	8440MiB
SCEdit	1	50	up_blocks	19.68 (1.81%)	7556MiB
LoRA/r=64	10	100	q/k/v/out/mlp	23.94 (2.20%)	26300MiB
SCEdit	10	100	up_blocks	19.68 (1.81%)	18634MiB
LoRA/r=64	30	200	q/k/v/out/mlp	23.94 (2.20%)	69554MiB
SCEdit	30	200	up_blocks	19.68 (1.81%)	43350MiB

使用SCEdit执行训练任务并复现上述结果：

# 先执行下面章节的安装步骤
cd examples/pytorch/multi_modal/notebook
python text_to_image_synthesis.py