Kolors 常見問題

Question 1

什麼是 Kolors？

Accepted Answer

Kolors 是由快手 Kolors 團隊開發的大規模文本到圖像生成模型。它基於數十億個文本-圖像對進行訓練，支持中文和英文輸入，在視覺質量、複雜語義準確性和文本渲染方面表現出色。

Question 2

Kolors 是否免費使用？

Accepted Answer

Kolors 的權重完全開放供學術研究使用。對於商業用途，用戶需要通過發送問卷到 kwai-kolors@kuaishou.com 進行註冊。如果每月活躍用戶數不超過 3 億，商業使用將自動獲批。

Question 3

Kolors 與其他 AI 圖像生成器相比表現如何？

Accepted Answer

根據評估，Kolors 在與其他模型（如 Midjourney-v6、DALL-E 3 和 Stable Diffusion 3）相比時，達到了最高的整體滿意度得分（3.59）和視覺吸引力（3.99）。它在多維度人類偏好得分（MPS）機器評估中也得分最高（10.3）。

Question 4

Kolors 支持哪些功能和能力？

Accepted Answer

Kolors 支持文本到圖像生成、IP-Adapter-Plus、ControlNet（Canny、Depth、Pose）、Inpainting、IP-Adapter-FaceID-Plus 和 Dreambooth-LoRA。它在生成高質量肖像、中國元素、複雜語義理解和文本渲染方面尤其強大。

Question 5

運行 Kolors 的系統要求是什麼？

Accepted Answer

Kolors 需要 Python 3.8 或更高版本、PyTorch 1.13.1 或更高版本、Transformers 4.26.1 或更高版本，並推薦使用 CUDA 11.7 或更高版本。它可以通過多種接口運行，包括命令行、Web 演示和 Diffusers 庫。

Kolors 使用方法