Whisk 的主要功能
Whisk 是 Google Labs 的實驗性 AI 圖像生成工具,獨特地允許用戶使用其他圖像作為提示來生成圖像,而不是使用文字。它結合了 Google 的 Gemini 模型進行圖像理解與 Imagen 3 進行生成,專注於快速視覺探索而非像素完美的編輯。該工具接受多個圖像輸入,包括主題、場景和風格,然後創建新的圖像,捕捉輸入的本質,同時允許用戶通過可編輯的文字提示來精細調整結果。
圖像基於提示: 用戶可以上傳圖像而不是寫文字提示來生成新圖像,使創意過程更加直觀和視覺化
三部分輸入系統: 允許分別為主題、場景和風格輸入圖像,實現更受控和多樣化的創意輸出
可編輯的文字提示: 用戶可以查看和修改由 Gemini 生成的底層文字提示,以精細調整輸出圖像
快速迭代: 設計用於快速視覺探索和實驗,允許用戶快速生成多個變體
Whisk 的使用案例
創意構思: 藝術家和設計師可以快速生成視覺概念,探索不同的創意方向
風格轉換: 將現有圖像轉換成不同的藝術風格,例如貼紙、搪瓷胸針或毛絨玩具
視覺敘事: 為敘事、營銷材料或社交媒體內容創建獨特的圖像
優點
直觀的視覺基於輸入系統
快速且容易的創意探索
通過文字提示修改具有靈活的編輯能力
缺點
目前僅在美國可用
不適合像素完美的編輯
可能會忽略原始圖像中的特定細節
查看更多