如何使用 Kolors
1. 安裝系統需求: 確保您的系統已安裝 Python 3.8+、PyTorch 1.13.1+、Transformers 4.26.1+ 和 CUDA 11.7+(推薦)
2. 克隆存儲庫並安裝依賴項: 運行以下命令:
1. apt-get install git-lfs
2. git clone https://github.com/Kwai-Kolors/Kolors
3. cd Kolors
4. conda create --name kolors python=3.8
5. conda activate kolors
6. pip install -r requirements.txt
7. python3 setup.py install
3. 下載模型權重: 使用以下方法之一下載權重:
選項 1: huggingface-cli download --resume-download Kwai-Kolors/Kolors --local-dir weights/Kolors
或
選項 2: git lfs clone https://huggingface.co/Kwai-Kolors/Kolors weights/Kolors
4. 基本文本到圖像生成: 運行:python3 scripts/sample.py "your_prompt_here"
生成的圖像將保存到 scripts/outputs/sample_text.jpg
5. 啟動 Web 演示(可選): 運行:python3 scripts/sampleui.py 以啟動 Web 界面
6. 使用 Diffusers(替代方法): 1. 克隆並安裝最新版 diffusers:
git clone https://github.com/huggingface/diffusers
cd diffusers
python3 setup.py install
2. 使用 KolorsPipeline 並設置推薦參數:
- guidance_scale=5.0
- num_inference_steps=50
7. 高級功能(可選): 可用的其他功能:
- IP-Adapter-Plus 用於圖像提示生成
- ControlNet 用於圖像控制
- Inpainting 用於圖像編輯
- IP-Adapter-FaceID-Plus 用於面部感知生成
- Dreambooth-LoRA 用於微調
每個功能都需要從 Hugging Face 下載特定的權重
8. 商業使用註冊: 如果用於商業目的,請將問卷發送至 [email protected] 進行註冊。如果每月活躍用戶 < 300 百萬,可獲得免費許可
Kolors 常見問題
Kolors 是由快手 Kolors 團隊開發的大規模文本到圖像生成模型。它基於數十億個文本-圖像對進行訓練,支持中文和英文輸入,在視覺質量、複雜語義準確性和文本渲染方面表現出色。
查看更多