Kolorsは無料で使用できますか？

Kolorsの重みは学術研究のために完全にオープンです。商業目的の場合、ユーザーはkwai-kolors@kuaishou.comにアンケートを送信して登録する必要があります。月間アクティブユーザーが3億人を超えない場合、商業利用は自動的に承認されます。

Kolorsは他のAI画像生成器と比較してどのようにパフォーマンスを発揮しますか？

評価によると、KolorsはMidjourney-v6、DALL-E 3、Stable Diffusion 3などの他のモデルと比較して、全体的な満足度スコア（3.59）と視覚的魅力（3.99）で最高のスコアを達成しました。また、MPS（多次元人間嗜好スコア）機械評価で最高スコア（10.3）を獲得しました。

Kolorsはどのような機能と能力をサポートしていますか？

Kolorsは、テキストから画像への生成、IP-Adapter-Plus、ControlNet（Canny、Depth、Pose）、Inpainting、IP-Adapter-FaceID-Plus、Dreambooth-LoRAをサポートしています。特に高品質のポートレート、中国の要素、複雑な意味理解、およびテキストレンダリングの生成に強みがあります。

Kolorsを実行するためのシステム要件は何ですか？

KolorsはPython 3.8以降、PyTorch 1.13.1以降、Transformers 4.26.1以降、推奨CUDA 11.7以降を必要とします。コマンドライン、ウェブデモ、Diffusersライブラリなど、さまざまなインターフェースを通じて実行できます。

Kolors

WebsiteFree TrialText to Image

Kolorsは、Kuaishouによって開発された大規模なバイリンガルテキストから画像への生成モデルであり、視覚品質、複雑な意味の正確性、そして中国語と英語のコンテンツのテキストレンダリングに優れています

ウェブサイトを訪問

このツールを宣伝する

https://github.com/Kwai-Kolors/Kolors?ref=aipure&utm_source=aipure

概要
代替案

製品情報

更新日:2025年11月15日

Kolorsとは

Kolorsは、Kuaishou Kolorsチームによって開発された潜在拡散に基づく高度なテキストから画像への生成モデルです。数十億のテキスト-画像ペアでトレーニングされており、AI画像生成技術における重要な進歩を表しています。このモデルはバイリンガルとして設計されており、中国語と英語の入力をサポートし、高い視覚品質を維持しながら複雑な意味理解を処理できます。学術研究のためにオープンソースとして利用可能で、ビジネスアプリケーションのための商業ライセンスオプションを提供します。

Kolorsの主な機能

Kolorsは、Kuaishouによって開発された大規模なテキストから画像への生成モデルで、中国語と英語のテキストプロンプトからフォトリアリスティックな画像を作成するのに優れています。数十億のテキスト-画像ペアで訓練されており、優れた視覚品質、複雑な意味的正確性、およびテキストレンダリング機能を提供します。このモデルには、IP-Adapter-Plus、ControlNetサポート、インペインティング機能、顔IDの保持などのさまざまな高度な機能が含まれており、AI画像生成の包括的なソリューションとなっています。

バイリンガルサポート: 中国語と英語のテキスト入力において強力なパフォーマンスを発揮し、中国特有のコンテンツの理解と生成に特に優れています

高度な制御メカニズム: Canny、Depth、Pose制御のためのControlNetサポートを含み、画像生成の正確な操作を可能にします

アイデンティティの保持: 異なる生成画像間で一貫した顔の特徴とアイデンティティを維持するIP-Adapter-FaceID-Plus技術を備えています

高い視覚品質: 視覚的魅力、テキストの忠実性、全体的な満足度において業界のリーディングスタンダードを達成しており、人間と機械の評価を通じて証明されています

Kolorsのユースケース

ポートレート生成: アイデンティティの一貫性を維持しながら高品質のポートレート画像を作成し、写真撮影やエンターテインメント業界に役立ちます

バーチャル試着: バーチャルな衣服の試着アプリケーションを可能にし、eコマースやファッション小売に有益です

文化コンテンツの生成: 中国の文化要素を含む画像の生成に特化しており、文化的および教育的コンテンツに適しています

テキストベースのデザイン: 画像内のテキストレンダリングに優れ、広告やグラフィックデザインにとって価値があります

メリット

中国語と英語のテキストから画像への生成において優れたパフォーマンス

制御と適応機能の包括的なスイート

強い意味的正確性を持つ高品質の視覚出力

デメリット

月間300M以上のアクティブユーザーを持つビジネス利用には商業登録が必要です

比較的高いシステム要件（CUDA 11.7以降推奨）

確率的性質のため、出力コンテンツの正確性と安全性に限られた保証があります

Kolorsの使い方

1. システム要件のインストール: システムにPython 3.8+、PyTorch 1.13.1+、Transformers 4.26.1+、およびCUDA 11.7+（推奨）がインストールされていることを確認してください

2. リポジトリをクローンし、依存関係をインストール: これらのコマンドを実行します： 1. apt-get install git-lfs 2. git clone https://github.com/Kwai-Kolors/Kolors 3. cd Kolors 4. conda create --name kolors python=3.8 5. conda activate kolors 6. pip install -r requirements.txt 7. python3 setup.py install

3. モデルの重みをダウンロード: 次のいずれかを使用して重みをダウンロードします：オプション1：huggingface-cli download --resume-download Kwai-Kolors/Kolors --local-dir weights/Kolors またはオプション2：git lfs clone https://huggingface.co/Kwai-Kolors/Kolors weights/Kolors

4. 基本的なテキストから画像への生成: 実行：python3 scripts/sample.py "your_prompt_here" 生成された画像はscripts/outputs/sample_text.jpgに保存されます

5. ウェブデモの起動（オプション）: 実行：python3 scripts/sampleui.pyでウェブインターフェースを開始します

6. Diffusersとの併用（代替方法）: 1. 最新のdiffusersをクローンしてインストールします： git clone https://github.com/huggingface/diffusers cd diffusers python3 setup.py install 2. 推奨設定でKolorsPipelineを使用します： - guidance_scale=5.0 - num_inference_steps=50

7. 高度な機能（オプション）: 利用可能な追加機能： - 画像プロンプト生成のためのIP-Adapter-Plus - 画像制御のためのControlNet - 画像編集のためのインペインティング - 顔認識生成のためのIP-Adapter-FaceID-Plus - ファインチューニングのためのDreambooth-LoRA 各機能には、Hugging Faceから特定の追加の重みをダウンロードする必要があります

8. 商業利用登録: 商業目的で使用する場合は、[email protected]にアンケートを送信して登録してください。月間アクティブユーザーが300百万未満の場合は無料ライセンスが利用可能です