Whisk
Whisk 是谷歌實驗室的創新 AI 圖像生成工具,允許用戶使用現有圖像作為提示來創建新圖像,而不是依賴文字描述。
https://labs.google/fx/tools/whisk?utm_source=aipure
產品資訊
更新時間:2024年12月17日
什麼是 Whisk
Whisk 是谷歌實驗室推出的一款新的實驗性工具,專為快速視覺探索和創意構思而設計。目前僅在美國通過 labs.google/whisk 提供,這個由 AI 驅動的平台與傳統圖像編輯器不同,側重於快速創意探索而非像素完美的編輯。作為谷歌最新的 AI 倡議之一,與 Veo 2 和 Imagen 3 一起,Whisk 為用戶提供了一種獨特的圖像生成方法,通過結合多個源圖像的視覺元素。
Whisk 的主要功能
Whisk 是 Google Labs 的實驗性 AI 圖像生成工具,獨特地允許用戶使用其他圖像作為提示來生成圖像,而不是使用文字。它結合了 Google 的 Gemini 模型進行圖像理解與 Imagen 3 進行生成,專注於快速視覺探索而非像素完美的編輯。該工具接受多個圖像輸入,包括主題、場景和風格,然後創建新的圖像,捕捉輸入的本質,同時允許用戶通過可編輯的文字提示來精細調整結果。
圖像基於提示: 用戶可以上傳圖像而不是寫文字提示來生成新圖像,使創意過程更加直觀和視覺化
三部分輸入系統: 允許分別為主題、場景和風格輸入圖像,實現更受控和多樣化的創意輸出
可編輯的文字提示: 用戶可以查看和修改由 Gemini 生成的底層文字提示,以精細調整輸出圖像
快速迭代: 設計用於快速視覺探索和實驗,允許用戶快速生成多個變體
Whisk 的使用案例
創意構思: 藝術家和設計師可以快速生成視覺概念,探索不同的創意方向
風格轉換: 將現有圖像轉換成不同的藝術風格,例如貼紙、搪瓷胸針或毛絨玩具
視覺敘事: 為敘事、營銷材料或社交媒體內容創建獨特的圖像
優點
直觀的視覺基於輸入系統
快速且容易的創意探索
通過文字提示修改具有靈活的編輯能力
缺點
目前僅在美國可用
不適合像素完美的編輯
可能會忽略原始圖像中的特定細節
如何使用 Whisk
訪問 Whisk: 前往 labs.google/whisk(注意:目前僅在美國可用)
登錄: 使用您的谷歌賬戶登錄以訪問該工具
上傳圖像: 上傳或選擇三個關鍵元素的圖像:主題(您想要創建的對象/人物)、場景(環境/背景)和風格(您想要的視覺風格)
可選:添加文字詳情: 您可以添加額外的文字提示以進一步精確您想要生成的內容
生成圖像: 讓 Whisk 處理您的輸入——它使用 Gemini 生成參考圖像的字幕,並將其輸入到 Imagen 3 以生成新圖像
審查與迭代: 審查生成的圖像。如有需要,您可以查看和編輯底層提示以調整輸出
下載與分享: 點擊下載圖標以保存您喜歡的圖像。您也可以通過谷歌的 Discord 頻道分享您的創作
混音與探索: 使用混音功能生成變體並探索您上傳圖像的不同創意可能性
Whisk 常見問題
Whisk 是 Google 最新的生成圖像實驗,專注於快速視覺構思,而無需深入了解提示。它使用 Google 的 Imagen 3 圖像生成模型和 Gemini 的多模式理解能力。
Whisk 網站分析
Whisk 流量和排名
791.7K
每月訪問量
#79719
全球排名
#1382
類別排名
流量趨勢:Jun 2024-Nov 2024
Whisk 用戶洞察
00:01:49
平均訪問時長
2.2
每次訪問的頁面數
49.42%
用戶跳出率
Whisk 的主要地區
US: 29.19%
IN: 7.45%
GB: 5.61%
JP: 4.87%
CA: 4.47%
Others: 48.41%