Whisk
Whisk 是 Google Labs 的创新 AI 图像生成工具,允许用户使用现有图像作为提示来创建新图像,而不是依赖文本描述。
https://labs.google/fx/tools/whisk?utm_source=aipure
产品信息
更新于:2024年12月17日
什么是 Whisk
Whisk 是 Google Labs 推出的一款新的实验性工具,专为快速视觉探索和创意构思设计。目前仅在美国通过 labs.google/whisk 提供,这款 AI 驱动的平台与传统图像编辑器不同,专注于快速创意探索而非像素级编辑。作为 Google 最新 AI 项目的一部分,与 Veo 2 和 Imagen 3 一同推出,Whisk 为用户提供了一种独特的图像生成方法,通过结合多个源图像的视觉元素。
Whisk 的主要功能
Whisk 是 Google Labs 的实验性 AI 图像生成工具,独特之处在于用户可以使用其他图像作为提示生成图像,而不是使用文本。它结合了 Google 的 Gemini 模型进行图像理解与 Imagen 3 进行生成,专注于快速视觉探索而非像素级编辑。该工具接受多个图像输入,包括主题、场景和风格,然后创建新的图像,捕捉输入的精髓,同时允许用户通过可编辑的文本提示来细化结果。
基于图像的提示: 用户可以上传图像而不是编写文本提示来生成新图像,使创意过程更加直观和视觉化
三部分输入系统: 允许分别输入主题、场景和风格的图像,实现更受控和多样的创意输出
可编辑的文本提示: 用户可以查看和修改由 Gemini 生成的底层文本提示,以微调输出图像
快速迭代: 设计用于快速视觉探索和实验,允许用户快速生成多个变体
Whisk 的使用场景
创意构思: 艺术家和设计师可以快速生成视觉概念,探索不同的创意方向
风格转换: 将现有图像转换为不同的艺术风格,如贴纸、珐琅胸针或毛绒玩具
视觉叙事: 为讲故事、营销材料或社交媒体内容创建独特的图像
优点
直观的基于图像的输入系统
快速简便的创意探索
通过文本提示修改实现灵活的编辑功能
缺点
目前仅在美国可用
不适用于像素级编辑
可能遗漏原始图像中的特定细节
如何使用 Whisk
访问 Whisk: 访问 labs.google/whisk(注意:目前仅在美国可用)
登录: 使用您的 Google 账户登录以访问该工具
输入图像: 上传或选择三个关键元素的图像:主题(您想要创建的内容/对象)、场景(环境/背景)和风格(您想要的视觉风格)
可选:添加文本详情: 您可以添加额外的文本提示以进一步细化您想要生成的内容
生成图像: 让 Whisk 处理您的输入 - 它使用 Gemini 为参考图像创建标题,并将它们输入到 Imagen 3 以生成新图像
审查与迭代: 审查生成的图像。如有需要,您可以查看和编辑底层提示以调整输出
下载与分享: 点击下载图标以保存您喜欢的图像。您还可以通过 Google 的 Discord 频道分享您的创作
混音与探索: 使用混音功能生成变体并探索您上传图像的不同创意可能性
Whisk 常见问题
Whisk 是 Google 最新的生成图像实验,专注于快速视觉创意,而无需深入了解提示。它使用 Google 的 Imagen 3 图像生成模型和 Gemini 的多模态理解能力。
Whisk 网站分析
Whisk 流量和排名
791.7K
每月访问量
#79719
全球排名
#1382
类别排名
流量趋势:Jun 2024-Nov 2024
Whisk 用户洞察
00:01:49
平均访问时长
2.2
每次访问页数
49.42%
用户跳出率
Whisk 的热门地区
US: 29.19%
IN: 7.45%
GB: 5.61%
JP: 4.87%
CA: 4.47%
Others: 48.41%