什麼是 Whisk
Whisk 是谷歌實驗室推出的一款新的實驗性工具,專為快速視覺探索和創意構思而設計。目前僅在美國通過 labs.google/whisk 提供,這個由 AI 驅動的平台與傳統圖像編輯器不同,側重於快速創意探索而非像素完美的編輯。作為谷歌最新的 AI 倡議之一,與 Veo 2 和 Imagen 3 一起,Whisk 為用戶提供了一種獨特的圖像生成方法,通過結合多個源圖像的視覺元素。
Whisk 如何運作?
Whisk 通過允許用戶輸入多個圖像來實現其所需的創作的不同方面——具體來說是主題、場景和風格。在幕後,谷歌的 Gemini 模型自動分析這些輸入圖像並寫出詳細的字幕,描述其關鍵特徵。這些描述然後被輸入到谷歌最新的圖像生成模型 Imagen 3 中,根據結合的元素生成新圖像。該平台提供了一個簡單的界面,預定義了多種風格(如貼紙、搪瓷胸針和毛絨玩具),以及一個高級編輯器以獲得更詳細的控制。用戶可以隨時查看和編輯底層提示以微調其結果。
Whisk 的好處
Whisk 的主要優勢在於它能夠通過消除複雜的文字提示需求來簡化創意過程,使那些在撰寫詳細描述方面有困難的用戶更容易使用。它支持快速迭代和實驗,使用戶能夠快速探索多種選項並下載他們最喜歡的結果。該工具著重於捕捉輸入圖像的本質而非精確複製,促進創意探索和意外組合。此外,其與谷歌先進的 AI 模型的集成確保了高質量的輸出,同時保持用戶友好的功能。
查看更多