AI 畫出來的圖能多美,全靠「提示工程師」!這個未來職業究竟在做什麼?

今年 9 月,美國科羅拉多州遊戲設計師艾倫(Jason Allen),以一張由 AI 繪圖工具 Midjourney 製作出的圖片,在藝術博覽會上獲得「數位影像類」的第一名。由 AI 產生的內容(AIGC,AI Generated Content)搬上檯面,甚至登上藝術殿堂。

AIGC 的特點是自動化生產、高效。隨著自然語言生成技術 NLG 和 AI 模型的成熟,AIGC 逐漸受到大家的關注,目前已經可以自動產生文字、圖片、音訊、影片,甚至 3D 模型和程式碼。然而,有玩過 AI 文字轉圖的人應該都知道,生成圖片的好看與否,有沒有可能變得畸形、邪惡,與輸入的文字提示(prompt)息息相關,就像明確告訴神燈裡的精靈你的願望是什麼一樣。

於是 AIGC 時代,「提示工程」(prompt engineering)就成了有趣的學問。簡單來說,提示工程就是用聰明、準確、時而冗長的文字提示,設定好上下文場景,一步步把 AI 帶進場景,讓它更了解人類意圖,產生最符合期待的結果。

一個好的「提示工程師」要具備哪些技能?

DataRobot 的工程師、人工智能系统設計專家舒普(Alex Shoop)認為,AIGC 的提示工程師的工作仍有很大一部分是做基本的測試,包含技術穩不穩定,能不能產出固定質量的結果等等。

而英國行銷公司 Ladder 創辦人泰勒(Michael Taylor)則指出,一個出色的提示工程師,其特點是能夠清晰地溝通,「當你可以創造任何你想要的東西時,你能多準確地表達『那是什麼』的能力就變得很重要。」

「這幅畫由厚重的顏料、筆觸構成,以漩渦狀的模式作畫,顏色主要是藍色和綠色,帶有一點黃色和紅色,夜空中的星星被渲染成白點。整體畫作有夢幻的質感,帶有濃烈情感的效果。」泰勒以創作一幅梵谷風格的畫為例,厚重筆觸、漩渦畫法、藍色綠色、夢幻質感、濃烈情感,這些都是梵谷相關的關鍵字,它們共同構成這位藝術家的風格,就像人類大腦在思考時會喚醒這些聯想一樣,提示工程師要有能力把所有內容和連結描述出來,以打造出最理想、最有梵谷風格的一幅畫。

因此泰勒認為,提示工程師的工作培訓與作為藝術家或撰稿人的培訓會非常相似。需要閱讀文學作品、了解著名的藝術、了解人性,以及與容易和目標受眾產生共鳴的內容。

另外,一名好的提示工程師,不僅要負責創造藝術,還要願意擔任守門人,以防止系統濫用,像是產製偽造內容、仇恨言論、侵犯版權、色情等。

提示工程師未來可能是一種「藝術職業」

科技媒體《VentureBeat》指出,Midjourney、DALL-E 確實已經將時代領到 AI 藝術的轉折點,未來的 AI 藝術家,無論是自學成才還是受過教育,都需要具備交流和設計原創觀點的能力;需要理解和學習數據科學,以及機器學習模型的工作原理,就像是一個攝影藝術家,若是懂得光和光圈的物理原理,會讓其攝影藝術變得超凡脫俗。

該報導認為,「提示工程師」可能是未來的藝術職業,需要科學和藝術的斜槓人才的來教育演算法。他們將會是持續將人類的思考和美感注入機器,不斷更新、創造的一群人。

資料來源:New York TimesSaxifrage

更多報導
1 分鐘生成美圖!Midjourney 出現以後,設計師會失業嗎?
2022 年人工智慧發展回顧:產業應用純熟,但人才稀缺難解
《阿凡達:水之道》的佛系行銷:扛 20 億美元票房壓力,如何重現第一集的成功?