Kolors 使い方
Kolorsは、Kuaishouによって開発された大規模なバイリンガルテキストから画像への生成モデルであり、視覚品質、複雑な意味の正確性、そして中国語と英語のコンテンツのテキストレンダリングに優れています
もっと見るKolorsの使い方
1. システム要件のインストール: システムにPython 3.8+、PyTorch 1.13.1+、Transformers 4.26.1+、およびCUDA 11.7+(推奨)がインストールされていることを確認してください
2. リポジトリをクローンし、依存関係をインストール: これらのコマンドを実行します:
1. apt-get install git-lfs
2. git clone https://github.com/Kwai-Kolors/Kolors
3. cd Kolors
4. conda create --name kolors python=3.8
5. conda activate kolors
6. pip install -r requirements.txt
7. python3 setup.py install
3. モデルの重みをダウンロード: 次のいずれかを使用して重みをダウンロードします:
オプション1:huggingface-cli download --resume-download Kwai-Kolors/Kolors --local-dir weights/Kolors
または
オプション2:git lfs clone https://huggingface.co/Kwai-Kolors/Kolors weights/Kolors
4. 基本的なテキストから画像への生成: 実行:python3 scripts/sample.py "your_prompt_here"
生成された画像はscripts/outputs/sample_text.jpgに保存されます
5. ウェブデモの起動(オプション): 実行:python3 scripts/sampleui.pyでウェブインターフェースを開始します
6. Diffusersとの併用(代替方法): 1. 最新のdiffusersをクローンしてインストールします:
git clone https://github.com/huggingface/diffusers
cd diffusers
python3 setup.py install
2. 推奨設定でKolorsPipelineを使用します:
- guidance_scale=5.0
- num_inference_steps=50
7. 高度な機能(オプション): 利用可能な追加機能:
- 画像プロンプト生成のためのIP-Adapter-Plus
- 画像制御のためのControlNet
- 画像編集のためのインペインティング
- 顔認識生成のためのIP-Adapter-FaceID-Plus
- ファインチューニングのためのDreambooth-LoRA
各機能には、Hugging Faceから特定の追加の重みをダウンロードする必要があります
8. 商業利用登録: 商業目的で使用する場合は、[email protected]にアンケートを送信して登録してください。月間アクティブユーザーが300百万未満の場合は無料ライセンスが利用可能です
Kolorsのよくある質問
Kolorsは、Kuaishou Kolorsチームによって開発された大規模なテキストから画像への生成モデルです。数十億のテキスト-画像ペアで訓練されており、中国語と英語の両方の入力をサポートし、視覚的品質、複雑な意味の正確さ、およびテキストレンダリングにおいて優れたパフォーマンスを発揮します。
もっと見る