AI模型爭霸 圖像生成下個新賽道

OpenAI宣布對GPT-4o和Sora進行重大升級,提供全新文生圖模型,可生成高度擬真的圖像,號稱「逼真到肉眼難辨」,表現甚至超越AI圖像生成工具Midjourney等競爭對手,OpenAI大張旗鼓宣揚AI文生圖重大更新,AI圖片生成儼然已成為下個AI模型賽道,光通訊廠喜迎商機。

業界人士指出,AI影像生成工具陸續問世,將刺激資料傳輸需求暴增,矽光子及高速光模組可提高資料傳輸速度,光聖(6442)、波若威(3163)、華星光(4979)、上詮(3363)等光通訊廠,將受惠這波AI影像生成商機。

OpenAI宣布GPT 4o模型的重大更新,是以大量多樣化圖片和文字訓練而成,它本身具備龐大的圖文知識及分析上傳圖片的能力,以生成實用而美觀的圖片,生成的影像逼真到「肉眼幾乎看不出任何破綻」,在精細度、細節和遵循文字指令等方面表現出色。

OpenAI強調,經過「積極後訓練」的GPT 4o具備驚人視覺能力,在圖像生成方面擁有多項突破,包括可更精確地進行文字渲染與文字整合、多輪生成圖像、多模態文本及影像輸入與輸出,且模型風格轉換多樣化,從手繪草圖到高解析度寫實風格,都可靈活轉換。

OpenAI執行長奧特曼甚至在直播中興奮表示,這些圖像品質令人驚嘆,「我幾乎不敢相信它們出自 AI,這是創意自由的新高峰」。

AI圖片生成已成為下個AI模型賽道。Google去年12月先前也升級影像生成AI模型至Veo2,效能比OpenAI當時宣布開放的Sora更強大,較勁意味濃厚。

【看原文連結】

更多udn報導
申訴沒用!提前給外送員4號碼 她上千元日本料理沒了
大安區街頭驚見高檔家具 清潔隊隔天找嘸:全被搬光
上市公司老董「十指緊扣」小三 馬拉松比賽畫面變捉姦
遭趙駿亞施暴掐脖 吳婉君「奄奄一息」還原殘忍過程