如何使用 Kolors
1. 安装系统要求: 确保您的系统已安装 Python 3.8+、PyTorch 1.13.1+、Transformers 4.26.1+ 和 CUDA 11.7+(推荐)
2. 克隆仓库并安装依赖: 运行以下命令:
1. apt-get install git-lfs
2. git clone https://github.com/Kwai-Kolors/Kolors
3. cd Kolors
4. conda create --name kolors python=3.8
5. conda activate kolors
6. pip install -r requirements.txt
7. python3 setup.py install
3. 下载模型权重: 使用以下任一方法下载权重:
选项 1: huggingface-cli download --resume-download Kwai-Kolors/Kolors --local-dir weights/Kolors
或
选项 2: git lfs clone https://huggingface.co/Kwai-Kolors/Kolors weights/Kolors
4. 基本文本到图像生成: 运行:python3 scripts/sample.py "your_prompt_here"
生成的图像将保存到 scripts/outputs/sample_text.jpg
5. 启动 Web 演示(可选): 运行:python3 scripts/sampleui.py 以启动 Web 界面
6. 使用 Diffusers(替代方法): 1. 克隆并安装最新版本的 diffusers:
git clone https://github.com/huggingface/diffusers
cd diffusers
python3 setup.py install
2. 使用 KolorsPipeline 并使用推荐设置:
- guidance_scale=5.0
- num_inference_steps=50
7. 高级功能(可选): 可用的附加功能:
- IP-Adapter-Plus 用于图像提示生成
- ControlNet 用于图像控制
- Inpainting 用于图像编辑
- IP-Adapter-FaceID-Plus 用于面部感知生成
- Dreambooth-LoRA 用于微调
每个功能都需要从 Hugging Face 下载特定的额外权重
8. 商业使用注册: 如果用于商业目的,请将问卷发送至 [email protected] 进行注册。如果月活跃用户 < 300 百万,可获得免费许可
Kolors 常见问题
Kolors 是快手 Kolors 团队开发的一个大规模文本到图像生成模型。它基于数十亿个文本-图像对进行训练,支持中文和英文输入,在视觉质量、复杂语义准确性和文本渲染方面表现出色。
查看更多