在上一年,Stable Diffusion模型發布以來,“AI文本圖片生成”真正的變成普通人也能使用的技術。
但是最近一些網友利用網上的真人圖片,不斷喂給模型進行自主學習。其訓練出來的效果已經可以做到以假亂真,你甚至不知道哪些圖片是AI生成的還是真人拍出來的。
為了給廣大讀者造福利,這篇文章從零開始,教你如何搭建自己的真人AI網站。
搭建你自己的AI網站
之前我寫過一篇文章,在自己本地可以部署可玩的文本圖像生成網站。這里我們也可以直接使用GitHub倉庫:stable-diffusion-webui
在電腦上安裝python 3.10.6,如果已經安裝了其他python版本,可以利用conda安裝多一個3.10的虛擬環境版本:
conda create -n novelai python==3.10.6
下載該倉庫的代碼:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
安裝對應的GPU版本的Pytorch,直接進入網站:https://pytorch.org/get-started/locally/,復制對應的命令
進入剛剛創建的虛擬環境”novelai“:
執行剛剛的命令:
./python -m pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116
安裝成功后,可以測試自己的pytorch版本是否可以跑通
進入剛剛下載的Github倉庫的代碼文件夾,安裝第三方依賴:
python -m pip install -r requirements.txt
模型下載
有了網站之后,就需要下載對應的AI模型進行有效生成。
一些網友已經利用網上大量的圖片訓練好的模型,并分享到網站上
https://civitai.com/
這個大名鼎鼎的網站被人們稱為”C站“,里面有很多你意想不到的模型
我們可以在這個網站上找到很多已經訓練好的模型。比如找一個生成真人圖片的模型:ChilloutMix
從網頁上下載對應的模型后,把該模型放到工程目錄:models/Stable-diffusion
漢化插件下載
stable-diffusion-webui這個項目還支持下載第三方插件。比如我們可以下載對應的漢化插件。
其下載地址如下:
https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN
登陸上面網站后,我們就可以下載插件的安裝包:
然后將文件解壓放到 extensions 目錄下:
接著,就需要對網頁進行重啟服務:
在擴展這里,把插件勾上:
在“設置”選項里,找到zh_CN,最后需要重新啟動網頁,就可以生效了:
生成你的真人圖片
啟動主程序'launch.py',等待一定的時間出現網頁地址就可以了
打開網址后,有時候可能模型沒有更新上去,因此可以嘗試一下多次重啟。
需要選擇剛剛下載的模型:ChilloutMix
這樣我們就已經完成前期的部署工作了。接下來詳細教大家怎么生成自己想要的圖片。
1
生成真人圖片
在c站上,已經有很多大神利用promt生成圖片了,因此我們就可以對這些進行參考。
比如找一個好看的圖片,對下面的Prompt詞語進行復制:
其中Prompt詞語放在提示詞框內,消極Prompt詞語放在對應的方框內。同時調整對應的參數,最后就可以
生成真人圖片:
2
不同風格圖片生成
在C站上,還有很多Lora模型可以進行下載,這是一種可以幫助你調整畫風的小模型。主要是放到Prompt中進行使用。
比如我們可以在網站上下載原神的Lora模型:
下載完成后,把模型放到models/Lora路徑下:
按照圖片下的步驟,選中模型后,會看到具體的Prompt在方框內了:
把步驟4.1中的Prompt詞語加入到這里,就可以生成一個原神風格的圖片:
3
動畫視頻生成
首先需要安裝插件“deforum”,這個插件能夠根據多個生成的圖片構造成視頻動畫。
https://github.com/deforum-art/deforum-for-automatic1111-webui
在當前stable-diffusion目錄下,執行下面命令
git clone https://github.com/deforum-art/deforum-for-automatic1111-webui extensions/deforum
就會發現extensions多了新的插件:
同時重啟新的網頁,發現會多了deforum這個選項:
我們可以先執行簡單的生成,在提示詞上,已經默認填寫了語句:
{
'0': 'tiny cute swamp bunny, highly detailed, intricate, ultra hd, sharp photo, crepuscular rays, in focus, by tomasz alen kopera',
'30': 'anthropomorphic clean cat, surrounded by fractals, epic angle and pose, symmetrical, 3d, depth of field, ruan jia and fenghua zhong',
'60': 'a beautiful coconut --neg photo, realistic',
'90': 'a beautiful durian, trending on Artstation'
}
最后生成出來的視頻如下:
Prompt詞語模板解釋如下:
//Abstracted Example
{
'0': 'Prompt A --neg NegPompt'
'12': 'Prompt B'
}
其中“0”和“12”提示在插值中解析的關鍵幀。
Prompt A 和 B 是肯定提示,NegPrompt 是否定提示。
當然,我們也可以直接用上面C站下載下來的模型,生成真人動畫。
讓你生成的圖片開口說話
從上面我們已經得到了生成的圖片
那么我們就可以利用這張圖片,創建自己的AI說話視頻
登陸這個網址:
https://studio.d-id.com/
選擇剛剛生成的圖片,然后輸入自己想要說的話,之后生成就可以了:
最后就可以得到比較逼真的真人AI說話視頻了。
有了這個技術,就可以批量制作二次元甚至是真人說話視頻。這對于AICG這個行業是一個顛覆性的技術,相信未來這個技術在多個領域上都能夠推廣開來。
以上就是本期的內容了。我是leo,我們下期再見~