Google 開始生成式影片模型「Veo」的小範圍預覽
Imagen 3 圖片生成模型也即將來到 Vertex AI 企業平台上。
Google 已開始推出對其 Veo 和 Imagen 3 生成式 AI 模型進行小範圍的預覽。從今天起,Vertex AI Google Cloud 企業方案的客戶可以開始使用 Veo 由文字提示和圖像生成影片,並隨後由下週開始,Google 將向這些相同的用戶提供其最新的文字轉圖像模型 Imagen 3。
Google 號稱 Veo 生成的 1080p 影片「具一致性且連貫」,而且可以生成「超過一分鐘」的影。該工具除了使用文字提示外,也可以上傳 AI 生成或人工製作的圖像,做為影片的起點。不過看了看 Google 分享的範例片段,很顯然 Veo 與所有 AI 模型一樣,在因果關係上還是有些欠缺。舉例來說,在烤棉花糖的片段中,雖然已經烤了半天,但棉花糖卻一直白得發亮,沒有烤到的痕跡。
隨著 Veo 的推出,Google 表示自己是第一家提供圖像轉影片模型的超大規模雲提供商。到目前為止,OpenAI 的 Sora 模型仍僅向特定的藝術家、學者和研究人員開放,不過 OpenAI 從 12 月 5 日將開始為期 12 天的產品演示,或許會在這當中宣佈擴大適用範圍也不一定。
至於 Imagen 3,Google 表示該模型能從簡單的文字提示生成「最逼真和最高品質的圖像」,在細節、照明方面超越了以前的 Imagen 版本。然而,同樣的它也不能說是做到了完美。舉例來說,上圖這個一群朋友坐在後車箱上的例子中,原始提示包括「閃光攝影」,但這張照片怎麼看都是大白天的照片,最多只能說是用閃光燈對逆光的暗部進行補光,但這應該不能叫「閃光攝影」吧?
無論如何,Google 還是希望讓更多的企業客戶使用生成式 AI。據其內部的研究,在使用生成式 AI 的公司中,有 86% 的公司回報營收有所增加。