2023年3月或許是迄今為止全地球最關心AI的一個月,但或許是從此刻開始的未來中,全球最不關心AI的一個月。
姍姍來遲,今天為大家帶來大家都在關心的AI繪畫軟件比較,Stable Diffusion VS Midjourney,也就是SD和MJ。2023年3月,這兩款軟件和ChatGPT一起,作為幾乎是第一批AIGC的代名詞收割了全球的目光。這兩款軟件各有千秋,但對于我來說,最終的選擇傾向早有定數。
SD和MJ都屬于能夠通過prompt(提示詞)來進行文生圖,或是圖生圖的方式來生成想要的圖片,但在很多具體的部分有很大的差異。本文的目的就是介紹一下兩個軟件,再對比不同之處。
軟件簡介
Stable Diffusion是2022年發布的深度學習文本到圖像生成模型,它是一種潛在擴散模型,它由創業公司Stability AI與多個學術研究者和非營利組織合作開發。目前的SD的源代碼和模型都已經開源,在Github上由AUTOMATIC1111維護了一個完整的項目,正在由全世界的開發者共同維護。由于完整版對網絡有一些眾所周知的需求,國內有多位開發者維護著一些不同版本的封裝包。Coder為SD的普及做出了難以磨滅的貢獻。
SD最大的特征,就是由于其開源的特性,可以在電腦本地上離線運行??梢栽诖蠖鄶蹬鋫渲辽?GB顯存的適度GPU的消費級硬件上運行。我的推薦顯存線是12G。
Stable Diffusion界面如下:
Midjourney是一款由總部位于舊金山的獨立研究實驗室Midjourney, Inc.創建和托管的人工智能程序和服務。Midjourney基于Discord平臺提供服務,可以根據自然語言描述(稱為“提示”)生成圖像,也支持圖生圖功能。使用MJ需要登陸Discord賬號,在聊天界面發送指令后就可以直接在線得到AI圖像。
主要特征
Stable Diffusion主要特征:
①硬件要求高:需要本地的獨立顯卡,對硬件要求很高。純CPU也能跑,但是速度會非常慢。
②部署相對麻煩:環境布置略微麻煩,需要從GitHub上用眾所周知的方式下很多文件,且要求一定的python知識。如使用國內技術大牛打包的整合包會稍微好一些,但需要從網盤下載,也較為麻煩。
③使用難度較高:SD的界面有很多內容,如采樣方式等,以及訓練等都需要比較復雜的學習過程。
④上限/下限差距極大:無特殊操作的情況下,SD可能跑出古神。需要有一定的學習過程才能跑出好看的圖片,但是圖片如果好看,又可以做到非常精致。難上手,難精通,但是精通之后上限極高。
⑤可控性極強:插件極多,LORA極多,可以幾乎隨心所欲地換風格和形態,出圖的數量也極大。
⑥可完全本地運行:運行全程可無需聯網,數據僅存在本地,擁有硬件即可無限使用。
⑦【極其重要】可以訓練模型:可以“煉丹”,訓練只屬于自己的數據庫,讓AI完全按照自己的想法去塑造目標風格的內容。
Midjourney主要特征:
①無硬件要求:使用科學上網,能夠使用discord就能夠使用。對本地硬件性能0要求,可以在幾乎所有設備上運行。
②部署極為簡單:點開discord馬上就能使用,幾乎沒有什么門檻。
③使用難度較低:基本上復制好提示詞,選好選項,就可以。
④上限/下限差距很?。簾o特殊操作的情況下,MJ能夠立刻產出比較討喜的圖片。但是能夠把控的范圍也更小。容易上手,容易精通,但是精通之后上限相對固定。
⑤可控性極弱:沒有插件,沒有LORA,產出的畫面風格非常固定。
⑥必須聯網運行:運行全程聯網,數據存在服務器上,難以本地保存。
⑦無法自定義自己想要的模型:只能用官方提供的。
操作效果
直觀的來說,啥都不會的人,哪怕復制別人的提示詞,SD的用戶會得到:
但是MJ用戶只要復制提示詞,一開始就能得到:
但是到后面,隨著能力的提升,SD用戶能夠隨心所欲地訓練自己的模型和LORA,乃至引入controlnet用各類工具來控制AI繪畫出圖的內容。甚至還可以指定區域重繪……這個過程最終就會很像真實的繪畫。
小結
簡單來說,SD是在本地運行的服務,開源,但門檻較高,但是能夠實現的效果上限極高。而MJ作為在線的服務,門檻低,但是可控性不夠強,上下限差距不大。
SD和MJ我都高強度用了一段時間,但我還是堅持選擇SD。因為SD可以訓練自己想要的模型,并且完全掌控。雖然煉丹比較麻煩,其中涉及到很多參數調整和素材,非常復雜,但是這個過程走完之后得到的模型能夠成為煉丹術士的美術資產。今后的世界里,只屬于自己的模型或許是公司或是個人的重要資產,是競爭力,也是壁壘。