想不出來如何下提示才能生成心儀的 AI 圖像?Google 的 Whisk 可能就是你的答案
可惜目前還不開放美國以外的地區試用。
在新一代的 Veo 2 生成式影片 AI 之外,Google 今天還發表了另一款名為「Whisk」的 AI 圖像產生器。它可以讓你使用現有圖像(而非文字)作為提示。但其輸出只試圖捕捉起始圖像的「精髓」,而不是直接以原始圖像為基礎,來構建新的影像。因此它更多是當你對於如何生成心目中的影像沒有概念時,可以用它來協助你用視覺的方式跳過文字提示。
Google 將 Whisk 描述為「一種新型的創意工具」。在使用時,你將會先上傳一張「對象」的圖片(也可以用文字)、選擇一個「場景」、然後再選擇一個「風格」。在 Google 的範例影片中,圖像是一位長者,場景是一個綠色的幻想世界,而風格則是「90 年代日本動畫」。這樣組合完之後,你還能加入進一步的描述,像是「主角騎著飛行自行車」,或是直接編輯整個描述。
Google 警告,Whisk 只會從你的來源圖像提取一些「關鍵特徵」,因此取決於 AI 選擇的特徵為何,生成的圖像可能具有不同的身高、體重、髮型或膚色。當然,前面有提到你可以編輯描述圖片的文字提示,將圖片修改成心儀的樣貌了。
Whisk 目前僅在美國提供。有興趣的話可以前往它在 Google Labs 上的專屬網站試用。