數位時代 王珮羽
Midjourney 教學|基本指令、進階參數一次掌握,秒速用 AI 產出圖片與畫作
AI 圖像生成平台 Midjourney 於 3 月 15 日發布新版本 V5 的測試版,提供更完善的風格與細節演算、解析度也提高一倍,生成圖片時所需要的提示詞(prompt,又被稱作「詠唱咒」)也更靈活,生成出更加逼真與精確的圖像。Midjourney 創辦人大衛.霍爾茲(David Holz)表示,他們將 Midjourney V5 視為「專業模式」,因為與前幾代相比,新的演算法限制更少,提供了更多樣的效果。不過 Midjourney V5 也比 V3 和 V4 演算法更「沒有主見」,若輸入字詞太短,輸出效果可能不會那麼好,會需要用戶提供更精確的要求提示。
Midjourney 使用教學|註冊 Discord、加入官方伺服器,聊天室輸入「/imagine」
至於 Midjourney 要怎麼用呢?首先需要註冊 Discord 社群的帳號,並且加入 Midjourney 官方伺服器。加入以後在左側列表中點選「#newbies-」開頭為名的頻道,接著在聊天欄輸入 /imagine
,就可以把想要生成的圖片的提示詞輸入了。
Midjourney 新的 V5 演算法是 Midjourney 耗時 5 個月、在 Google Cloud 的超級叢集(AI supercluster)上訓練的第二個模型,也使用了不同的神經網路架構和美學技術。
Midjourney 特色介紹|Midjourney V5 來了!有哪些特色?
由於現在 V4 仍然是最主要的公開版本,要使用 v5 演算法,使用時需在提示句末加入參數--v 5
,或是在設定當中選擇版本。
Midjourney 特色一:畫質提高 2 倍、prompt 也更靈活
Midjourney 版本生成圖像的畫質也提高了兩倍,達到 1024 × 1024(原先 V4 的畫質是 512 × 512),只是生成的時間和耗用的 GPU 時間也會增加 1 倍。而且不同於舊版本,Midjourney V5 現在也可以使用「自然語言」當提示了;原先「詠唱咒」的格式通常會需要以逗號分開不同的詞彙,現在已經可以用一句話來當作提示。不過,Midjourney 目前還只支援英文。
Midjourney 特色二:加入新參數,就能調整文圖比重
Midjourney 還有一個不同以往的新參數:權衡圖片提示與文字提示的比重;在提示句末加入參數--iw
,就可以讓生成的圖像更偏向圖片提示或是文字提示。
Midjourney 特色三:新參數可生成花紋,寬高比更靈活
Midjourney 另外還有兩個目前還在公開測試當中的參數:拼磚,以及更自由的寬高比。拼磚需在提示句末加入參數--tile
,就會生成像牆紙或是地磚一樣的無縫重複花紋;寬高比則已經不再限於 1:2 到 2:1 的大小,只要--ar
後面加上任何的整數比例,就可以生成想要的寬高比例。
Midjourney V5 讓 AI 畫作終於長出手了!更真實又更恐怖
根據 Twitter 上的 AI 資深用戶 Nick St. Pierre 的分享,新版本 Midjourney 生成的人物圖像,風格已經不同以往(如舊版本背景褪色、對比度過於鮮明等),而更像真實世界的照片。
新版本 Midjourney 也終於會畫正確數量和形狀的手指,也算是一大突破。雖然有時候還是可能生成解剖學上不合理的四肢構造,但作為 AI 生成圖像最明顯的線索已經大幅減少,讓愈來愈多人無法判斷圖片的真假。
不過 Twitter 上也有評論者指出,在人體一些令人不安的特徵,讓這些圖片仍「處於恐怖谷」,例如橡膠狀皮膚的外觀、不合理的紋路。但總體而言,這些結果還是看起來比第 4 版 Midjourney 更真實。
目前只有 Midjourney 付費用戶可以試用 V5 演算法,且新版本仍然在不斷更新當中,官方表示希望接下來能陸續提供更「親民」和更真實的視覺風格。
資料來源 / Midjourney、decoder、How-to Geek、r/midjourney