科技大厂谷歌17日推出全新人工智能工具“Whisk”,用户只要上传图像即可获得AI生成图像,即“图像生成图像”,无需再依赖长篇文字提示,目前仅开放给美国地区用户。
《CNN》报导,Whisk使用Google的AI产品Gemini(2023年12月推出),并与DeepMind(Google 2014年收购的AI实验室)12月发布的最新文本转图像生成模型Imagen 3配合运作。当用户上传图像时,Gemini会生成一个标题,该标题被输入到Imagen 3中,最终生成图像。
Whisk支持用户提供图像作为指令,针对主题、场景和风格各输入图像(可输入多张),就能混合成一张新图。假设手边没有适合的图像,只需点击骰子图示,即可获得AI生成的图像。如果生成结果不够精准,也可输入文字作为补充。
Google表示,Whisk“旨在提供快速的视觉探索,而非像素级的编辑”,目的不在于生成完美的图,不会精准复制用户提供的主题,而是抓住“精随”,以利3 张图像重新组合。
谷歌表示,Whisk仍处于开发的早期阶段,目前仅在Google Labs网站上向美国用户提供。