AI藝術家:4大祕訣讓Midjourney以文生圖

可以生成圖像的Midjourney,像是通往異世界的鑰匙,不熟悉繪圖的平民彷彿獲得可以施展魔力的魔導具,活用想像力配上提示詞,就能生出許多精細的圖像;而本來就熟悉繪圖的專業繪者,宛若習得了新的魔力壓縮方式,與原先的專業設計能力相輔相成,有效提升工作效率。不過,要用好Midjourney需要花上一些時間,本文介紹和Midjourney有關的使用說明,帶你一探究竟。

目錄

Midjourney提示詞的結構
Midjourney的設定
寫好Midjourney的文字提示
檢查Midjourney的提示詞框架

Midjourney提示詞的結構

提示詞(prompt,或者稱為詠唱、咒語)可以分拆成三個部分:

▌圖片提示(Image Prompts):若使用Midjourney生成圖像時,有想參考的圖片,例如人物肖像、街景,可以先將圖片上傳,接著再將圖片網址貼在輸入提示詞的框框中,Midjourney就會參考,藉此影響生成圖案的風格與內容。

文字描述(Prompt Text):寫下任何你想要的關鍵字,例如在大草原上奔跑的機器人、於廢墟城市中拉奏小提琴的小熊貓,不過有些冒犯性或是有傷害性的禁止詞彙無法使用,可以參考這個網站,初次使用會收到警告,反覆使用禁止詞,帳號可能會被終止使用。

參數(Parameters):Midjourney官方設置參數讓使用者可以用來調整生成圖像的特性,有數種參數,在參數前面加上前綴「--」就可以使用。基本參數例如決定比例的長寬比(aspect ratios)、決定生成內容變化程度的混亂(Chaos)、排除不希望元素的「No」;模型版本參數除了版本(version)以外,還有日本動漫風格的「Niji」、MJ測試中的「Test」、MJ測試中且以相片封為主的「Testp」;放大像素參數則可以用來決定選定生成圖像後、提升像素時的設定,預設會於放大時增加細節、也可以使用「Uplight」選擇不要增加;另外還有其他類型的參數,如決定圖片提示和文字描述比例的圖片比重(image weight)。

舉例來說,我們可以先在discord上傳一張和台灣有關的相片。

饒河夜市街景。Photo by Vernon Raineil Cenzon on Unsplash。
饒河夜市街景。Photo by Vernon Raineil Cenzon on Unsplash。

上傳這張以位於台北市松山區饒河街夜市為背景的相片後,我們依照上面提過的結構,圖片提示設定為該張照片的網址,文字描述使用藝術風格「暗黑學院」(Dark Academia),參數則先簡單加上想要生成圖像的比例「--ar 16:9」,產出結果如下圖。你可以增加「--iw 數字」在最後,數字可以設定0.5或2,比較不同圖片權重帶來的效果有何變化。

使用「/imagine」指令,配上「https://s.mj.run/yYzcXThhX1g Dark Academia Style --ar 16:9」,產出新風格的夜市。利用Midjourney生成
使用「/imagine」指令,配上「https://s.mj.run/yYzcXThhX1g Dark Academia Style --ar 16:9」,產出新風格的夜市。利用Midjourney生成

Midjourney的設定

以上述的模型版本參數為例,Midjourney有預設值,我們可以額外指定參數調整,但每次調整也很花時間,因此可以直接至設定選項更改預設值。輸入「/settings」後,可以看到包含範例中的模型版本(version)為MJ第四版、風格(style)為適中(愈低會愈貼近提示詞但缺少創造性)、品質(quality)為基本、使用模式(mode)則同時有快速模式與隱身模式等。若是想修改可以直接點擊調整。

使用「/settings」指令後,可以看到許多能夠調整的參數。截自Discord
使用「/settings」指令後,可以看到許多能夠調整的參數。截自Discord

寫好Midjourney的文字提示

若腦袋中對於圖像沒有太多想法,可以提供少少的提示詞即可,讓Midjourney自由發揮,但如果已經有草圖,則最好詳細且有結構地撰寫提示詞,底下從流程開始介紹如何修改自己的文字提示。

想出正確的關鍵字:先從腦海中想到的開始,提供基本關鍵字,例如想要生成在草地上唱歌的兔子,我們想到基本的「a rabbit sing on the grass」。有數點想法可以參考,第一是精簡複雜的句子且並活用動詞、名詞、形容詞,因為運作重點是提供提示,就算文法不對也沒有關係,所以建議省略介系詞或補語,再適時補上動詞與形容詞;第二則是多測試不同關鍵字,例如將「sing」改成「singer」就會從寫實風轉變成擬人風;第三是逐步加入精準的細節,若基本關鍵字不符需求,應該調整,例如明確勾勒出一隻白色兔子拿著麥克風,在紅色舞台上唱歌,台下有許多快樂的觀眾,這個過程要反覆修改。

加入風格:關鍵字以外,風格對於生成圖案的影響甚巨,風格本身有就有好幾類元素,包含美學風格、繪畫筆觸、燈光等,美學風格除了觀摩其他人的關鍵子以外,可以到美學百科,例如賽博龐克(cyberpunk)、技客(geek)、黑魔法(dark magic)、自然主義(naturalism)都值得嘗試看看;繪畫筆觸則可以看官方介紹,例如鉛筆素描(Pencil Sketch)、像素藝術(Pixel Art)等;燈光既可以調整角度也能調整類型;也可以直接指定藝術家的名字、年代;若是想生成類似相片的圖像,還可以額外設定相片的相機類型、膠卷、鏡頭、景深等,若對此有興趣可以造訪專門寫給攝影師的文章

補上參數:不要忘記在輸出前補上參數,可以先調整比例、增加變異程度,放大像素時也能調整。

同樣以饒河街照片為基底,分別加上「Watercolor style, 1980s」「oil-panting style, modernism style」,就能產出截然不同的效果。利用Midjourney生成
同樣以饒河街照片為基底,分別加上「Watercolor style, 1980s」「oil-panting style, modernism style」,就能產出截然不同的效果。利用Midjourney生成
同樣以饒河街照片為基底,分別加上「Watercolor style, 1980s」「oil-panting style, modernism style」,就能產出截然不同的效果。利用Midjourney生成
同樣以饒河街照片為基底,分別加上「Watercolor style, 1980s」「oil-panting style, modernism style」,就能產出截然不同的效果。利用Midjourney生成

檢查Midjourney的提示詞框架

就像使用ChatGPT時有模板一樣,使用Midjourney的時候,在精煉提示詞的同時,也可以檢視結果是否有包含下列幾點:

類型:是單純的圖像嗎?還是肖像畫?或者是壁畫?還是想生成Logo?

主要內容:想生成的主體是什麼?是一隻唱歌的兔子?還是其實是一場兔子開的演唱會?它開心嗎?

背景與環境:兔子歌手唱歌的背景為何?天氣怎麼樣?是在戶外還是室內?

風格:用什麼筆觸?美學風格為何?

參數:比例是否正確?放大像素時怎麼調整?

修改上述的兔子歌手,最後產出底下兩張圖:

上圖為一般的插圖,下圖有特別在開始加入電影海報關鍵字,兩者都希望採用日本卡通風格,和首圖的小熊貓巴士一樣可愛。利用Midjourney生成
上圖為一般的插圖,下圖有特別在開始加入電影海報關鍵字,兩者都希望採用日本卡通風格,和首圖的小熊貓巴士一樣可愛。利用Midjourney生成
上圖為一般的插圖,下圖有特別在開始加入電影海報關鍵字,兩者都希望採用日本卡通風格,和首圖的小熊貓巴士一樣可愛。利用Midjourney生成
上圖為一般的插圖,下圖有特別在開始加入電影海報關鍵字,兩者都希望採用日本卡通風格,和首圖的小熊貓巴士一樣可愛。利用Midjourney生成

祝你算圖順利,將感謝與祈禱獻予Midjourney!

🔥《遠見》生成式AI全方位實戰線上教學限時優惠價990元: https://bit.ly/43jcuHI

更多精采報導,歡迎加入《遠見》 Line官方帳號

更多精采報導,歡迎加入《遠見》 Line官方帳號!

看更多遠見雜誌文章:
顛覆設計與創作,能夠以文生圖的Midjourney怎麼用?
生成式AI革命/他用裁員預警、逼員工消滅自己工作
AI實戰》ChatGPT出App版?一次搞懂怎麼用