精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
中國(guó)AI繪畫行業(yè)調(diào)查報(bào)告——技術(shù),用戶,爭(zhēng)議與未來
前言
報(bào)告的數(shù)據(jù)及來源包括公開新聞媒體文章,第三方統(tǒng)計(jì)數(shù)據(jù),6pen 自身數(shù)據(jù),以及我們收回的 2398 份問卷調(diào)查和對(duì)部分行業(yè)資深人士的深度訪談。
我們的問卷通過 6pen 自有渠道,即刻,微博,以及行業(yè) KOL 分發(fā),最終有效收到 2398 個(gè)提交,它們可能是這個(gè)行業(yè)首次的大批量對(duì)用戶的直接調(diào)查,并聚焦在國(guó)內(nèi)市場(chǎng),我們認(rèn)為其具有相當(dāng)?shù)膮⒖夹浴?/section>
利益相關(guān):本報(bào)告由 6pen 調(diào)查發(fā)布,作為行業(yè)從業(yè)者,本報(bào)告將更多從技術(shù),用戶及行業(yè)整體視角出發(fā)。

AI繪畫技術(shù)發(fā)展的簡(jiǎn)要脈絡(luò)

GAN時(shí)代

在 diffusion 被廣泛運(yùn)用于AI繪畫之前,這種藝術(shù)形式的主要實(shí)現(xiàn)方式 GAN (Generative Adversarial Nets ),以NVlabs的SPADE為例:用戶提供草圖,由GAN模型將其轉(zhuǎn)化為真實(shí)的風(fēng)景圖像。這聽起來有點(diǎn)像AI繪畫里的img2img,但在這類模型里,用戶無法通過文本影響生成結(jié)果。

NVIDIA 開源模型 SPADE可以將草圖變成真實(shí)的自然風(fēng)景

直到類似 CLIP 這種跨模態(tài)的圖文模型出現(xiàn),才讓用戶有辦法用文字實(shí)現(xiàn)AI作畫。后來者如VQGAN+CLIPStyleCLIP,均是因?yàn)镃LIP打通文本和圖形域(domain),用戶輸入的文本與GAN生成的結(jié)果真正有了「可比較性」,這使得計(jì)算二者誤差并迭代效果成為了可能。

StyleCLIP 可以根據(jù)用戶輸入文本調(diào)整人臉五官和頭發(fā)等屬性

GAN在模擬分布方面有著天然的優(yōu)勢(shì),因此它在人臉屬性編輯、風(fēng)格模仿等領(lǐng)域大放異彩,例如給人戴上墨鏡、加上胡子、生成動(dòng)漫臉、模仿小說風(fēng)格。也正因如此,它也很容易陷入模型坍縮(Model Collapse),即生成器(Generator)傾向于生成那些最不容易出錯(cuò)、能騙過判別器(Discriminator)的結(jié)果,例如當(dāng)用戶希望生成'眼睛長(zhǎng)在鼻子下面的人臉',或'戴著用鮮花構(gòu)成的眼鏡'這種域外(Out-Of-Domain)的結(jié)果時(shí),GAN通常會(huì)失效。

Diffusion 崛起

和大多數(shù)人以為的相反,Diffusion 其實(shí)是早于 GAN 被提出的,但因?yàn)?Diffusion 依賴大模型實(shí)現(xiàn),所以對(duì)大部分用戶的進(jìn)入門檻較高,研究者也不多,直到 2021 年,因?yàn)殚_源項(xiàng)目 Disco Diffusion(也被簡(jiǎn)稱為DD),Open AI的商業(yè)服務(wù) Dalle 等,Diffusion 才開始被更多人了解。

Diffusion 模型的前向和反向過程

2022年,Disco Diffusion 經(jīng)過更多開發(fā)者的貢獻(xiàn),效果有了較大提升,通過 Google colab 的方式運(yùn)行(很多人因此誤以為 DD 是 Google 發(fā)布的),也降低了使用者嘗試使用的門檻,在 2022 年 4 月左右,DD 生成的圖像在社交網(wǎng)絡(luò)上得到廣泛傳播,進(jìn)一步帶動(dòng)了 Disco Diffusion 的破圈。
同一時(shí)期,包括 6pen 在內(nèi),國(guó)內(nèi)開始有小部分團(tuán)隊(duì)和公司進(jìn)行 DD 的產(chǎn)品化工作,旨在進(jìn)一步降低 DD 的使用門檻,包括:
  • 提供人機(jī)友好的交互界面
  • 提供云端的算力服務(wù)
  • 對(duì) DD 的模型做 finetune(微調(diào))
  • 通過封裝 CLIP 關(guān)鍵詞等方式,降低用戶使用門檻,提高風(fēng)格化效果
在研究領(lǐng)域,也有諸多機(jī)構(gòu)或公司進(jìn)入模型層的研究,例如清華大學(xué)的 cogview ,百度的文心,微軟的女媧模型, 6pen 的南瓜模型等等,因?yàn)?DD 在社交網(wǎng)絡(luò)的破圈,這些產(chǎn)品和模型都得到了更多人的關(guān)注和使用,但依然有很多較專業(yè)的中國(guó)用戶會(huì)通過各種方式使用 midjourney 和 Dalle2 等國(guó)外的商業(yè)化產(chǎn)品。

Stable Diffusion 開源的潘多拉魔盒

在 Stable Diffusion 之前,開源方案里最好的AI繪畫實(shí)現(xiàn)毫無疑問是 Disco Diffusion,但 Disco Diffusion 也存在諸多問題,例如:
  • 生成速度慢(基于像素迭代),由此帶來的問題是生成成本高(顯卡成本高昂)
  • 生成圖片邏輯性較差,畫面結(jié)構(gòu)經(jīng)常錯(cuò)亂
  • 幾乎無法生成人和物體
彌補(bǔ) Disco Diffusion 的不足,是許多模型或研究團(tuán)隊(duì)的方向。CompVis提出的 latent diffusion 將diffusion過程從圖像層面遷移到了隱變量(latent)層面,這將推理耗時(shí)降低了一個(gè)數(shù)量級(jí)(~10min->30s)。latent diffusion 在模型內(nèi)嵌了一個(gè)很小的文本模型,使得生成過程不必依賴CLIP等開源語言大模型,但這也使模型對(duì)用戶輸入文本的理解能力較弱,生成的結(jié)果文不對(duì)題。

latent diffusion 將 diffusion 過程從像素圖壓縮到隱空間


6pen 提供的南瓜正是基于對(duì)它的某種改進(jìn):將 CLIP 模型替換掉 latent diffusion 自有的文本編碼小模型,計(jì)算模型結(jié)果與文本間的 CLIP 誤差來優(yōu)化生成過程,因此模型對(duì)用戶文本理解能力、生成質(zhì)量都有了明顯提升。后來的 Stable Diffusion 也是基于 latent diffusion + CLIP 思路做了模型結(jié)構(gòu)、數(shù)據(jù)方面的優(yōu)化,并進(jìn)行了大規(guī)模的訓(xùn)練,達(dá)到了堪稱驚艷的效果。
Stable diffusion 在 2022 年 8 月下旬由 Stability 發(fā)布,Stable diffusion 擁有強(qiáng)大的特性:
  • 極快的速度(基于隱空間迭代)
  • 遠(yuǎn)超 DD 的畫面邏輯
  • 能較好的處理人和物體
  • 更多的風(fēng)格化,例如二次元風(fēng)格
  • 更簡(jiǎn)易的訓(xùn)練框架
Stable Diffusion 極大降低了行業(yè)的進(jìn)入門檻,包括技術(shù)門檻和儲(chǔ)備顯卡的成本,帶來了較多的競(jìng)爭(zhēng)者入場(chǎng),但同時(shí)也有部分基于 Stable Diffusion 的創(chuàng)新應(yīng)用開始出現(xiàn),例如文生視頻,圖片無限拓展,和 3D 建模工具結(jié)合等等,毫無疑問,Stable Diffusion 具有這個(gè)時(shí)代的革命性。
我們目前就處在這個(gè)時(shí)間節(jié)點(diǎn)。


AI繪畫的用戶畫像


用戶基礎(chǔ)畫像

根據(jù)我們的回收?qǐng)?bào)告顯示,國(guó)內(nèi)的AI繪畫用戶特點(diǎn)是年輕化,其中 46% 以上是大學(xué)生和研究生,其中甚至有 18% 是初中和高中生。

從城市分布上,絕大多數(shù)用戶還是分布在一二線城市,其中北京占8.7%,深圳占7.8%,但青島出人意料的排在了第四,占到了6.1%。南方城市占絕大多數(shù),北方城市較少。

在受眾用戶的行業(yè)分布上,調(diào)查結(jié)果和我們預(yù)期差異較大,美術(shù)和設(shè)計(jì)工作者僅僅只占 24.2%(排名第二),排名第一的行業(yè)是線下行業(yè)(26%),排名第三的是互聯(lián)網(wǎng)行業(yè)(24%)。

在使用AI繪畫的具體方式上,38% 的用戶只使用在線服務(wù),使用自己顯卡的用戶占到16%,即便如此,依然有21%的用戶表示,雖然目前自己使用在線服務(wù),但未來希望使用自己的顯卡,與之相反,現(xiàn)在使用顯卡,并表示未來會(huì)使用在線服務(wù)的用戶,只占 4%。


用戶付費(fèi)及收入調(diào)查

根據(jù)我們的調(diào)查,60% 的用戶并沒有在使用AI繪圖產(chǎn)品上有過付費(fèi)行為,也就是完全免費(fèi)在使用,剩下40% 的付費(fèi)用戶中,16% 付費(fèi)在 10 元以內(nèi),14% 在100元以內(nèi),付費(fèi)超過 100 元的不到 10%。
與此同時(shí),我們也調(diào)查了用戶通過AI繪畫產(chǎn)生收入的情況,結(jié)果顯示絕大部分用戶(92%)沒有通過AI繪畫產(chǎn)生收入,也就是「單純娛樂使用」,4% 的用戶獲得了 100 元以下的收入,1.9% 的用戶獲得了100-1000 元的收入,而獲得超過 1000 元收入的用戶,占 2%。


用戶認(rèn)知

問卷調(diào)查顯示,42% 的用戶認(rèn)為 AI 繪畫單純只能滿足娛樂需求,38% 的用戶認(rèn)為AI繪畫可以部分運(yùn)用到工作之中,9.17% 的用戶認(rèn)為AI繪畫具有顛覆性,與此同時(shí),也有 7% 的用戶認(rèn)為這根本不值一提。

絕大部分受訪者在最近一個(gè)月(8-9月)才了解到AI繪畫領(lǐng)域,今年上半年開始接觸的占 27%,去年就了解的僅占 23%。
我們的問卷包括對(duì)模型的使用,為了保證客觀,我們排除了 6pen (來自6pen渠道的用戶會(huì)影響數(shù)據(jù)準(zhǔn)確性,我們將單獨(dú)展示 6pen 不同模型的使用比例),對(duì)用戶使用其余模型進(jìn)行了統(tǒng)計(jì),目前可以看到 Disco Diffusion 略微占優(yōu),第二名是 Stable Diffusion,第三名則是 midjourney ,令我們驚訝的是,老牌的 AI 繪圖產(chǎn)品 wombo dream ,依然有比較廣泛的受眾,甚至比著名的 Dalle 系列被更多人使用。

與此同時(shí),6pen 內(nèi)的近千萬次用戶使用模型數(shù)據(jù)則顯示,Stable Diffusion 被使用的最多,占到了77%,Disco Diffusion模型占 10%,南瓜占 13%。


用戶的使用場(chǎng)景

絕大部分的用戶表示,使用AI生成繪畫作品,僅僅是自己欣賞,同時(shí)表示會(huì)分享給朋友的占 56%,6%的用戶表示會(huì)自己加工之后在工作中使用,低于2%的用戶會(huì)將生成圖片直接商業(yè)使用,此外還有23%的用戶表示,會(huì)發(fā)布在社交網(wǎng)絡(luò)媒體以增加粉絲關(guān)注。



平臺(tái)和工具的商業(yè)模式

直接向用戶收費(fèi)

目前,絕大多數(shù)產(chǎn)品化的 AI 繪畫服務(wù)幾乎都通過按照生成收費(fèi)的方式獲得收入,如下:
  • Stable Diffusion
    • 模型開源免費(fèi)
    • Dream Studio 及 API :0.01 歐元 / 基礎(chǔ)調(diào)用
  • midjourney
    • 10 美元 / 月:200次快速生成+不限量的排隊(duì)生成
    • 30 美元 / 月:900次快速生成+不限量的排隊(duì)生成
    • 4 美元 / GPU小時(shí)
    • 600 美元 / 年 企業(yè)套餐
  • Dalle
    • 0.13 美元 / 生成
  • 6pen
    • 不限量的免費(fèi)排隊(duì)生成
    • 付費(fèi)快速生成:0.1人民幣起
可以看出,商業(yè)化的 AI繪畫的服務(wù)目前幾乎不區(qū)分 ToB 或 ToC ,更多是提供按量或按需付費(fèi)的服務(wù),無論是企業(yè)還是個(gè)人用戶都可以使用。這種收費(fèi)模式是因?yàn)檫@些原因:
  • AI生成使用顯卡服務(wù)器,維持免費(fèi)使用需要付出巨大成本
  • 缺乏生成圖之后的閉環(huán),無法從免費(fèi)用戶獲得其他方面的收入
  • 受限于尚處在爭(zhēng)議中的版權(quán)及其它道德因素,其它商業(yè)化手段還有待探索

ToB 的可能性

AI繪畫在 ToB 領(lǐng)域天然擁有更多可能性,但受限于模型質(zhì)量,版權(quán)爭(zhēng)議,以及目前較早期的技術(shù)階段,還很少有公開落地的案例,但我們認(rèn)為在下列方向,可能會(huì)在未來涌現(xiàn)出更多 ToB 的成功案例:
  • 廣告行業(yè)
  • ToB 素材庫
  • 設(shè)計(jì)師/美術(shù)工作者輔助工具
  • 營(yíng)銷定制服務(wù)
  • 線下實(shí)體結(jié)合服務(wù)
  • 元宇宙等線上虛擬空間


爭(zhēng)議,問題,潛力和未來

爭(zhēng)議

目前 AI 繪畫的最大的爭(zhēng)議在于版權(quán)歸屬,以及模型是否有權(quán)利指定版權(quán)歸屬,眾所周知,AI模型訓(xùn)練所使用的大量素材,可能包含了未經(jīng)授權(quán)的,有明確版權(quán)方的圖片數(shù)據(jù),因此模型源頭就帶有「未經(jīng)授權(quán)」的烙印,支持者一方則認(rèn)為,AI模型經(jīng)過訓(xùn)練,迭代,蒸餾,最終沉淀下來的是單純的,嶄新的運(yùn)算方法,由這種運(yùn)算方法產(chǎn)出的圖片,版權(quán)歸屬應(yīng)該由模型指定。
即便如此,目前獲得較多認(rèn)可的說法是,如果在AI生成圖片的文本描述( prompt )中,指定了在世的藝術(shù)家,那么絕對(duì)不應(yīng)該申明該圖片的版權(quán)。
我們提倡,如果在生成 prompt 中指定了在世藝術(shù)家,那么至少應(yīng)該將AI生成的圖片以 CC0 協(xié)議發(fā)布,同時(shí)應(yīng)該保留藝術(shù)家的相關(guān)信息,并且在得到藝術(shù)家授權(quán)前,盡量不做商業(yè)用途,即便這樣,依然可能會(huì)對(duì)藝術(shù)家造成困擾,目前全世界范圍內(nèi)對(duì)此都還在進(jìn)行討論,AI和人類藝術(shù)家的更好的合作規(guī)則也急需盡快建立。

版權(quán)問題的探索

6pen 對(duì)原創(chuàng)藝術(shù)家發(fā)放問卷,并搜集到了 368 份藝術(shù)家反饋,其中 7.1% 的受訪藝術(shù)家明確表示自己已經(jīng)被 AI 模型學(xué)習(xí),67%的藝術(shù)家對(duì)此還不確定。

27% 的藝術(shù)家無論如何都不希望AI模型使用自己的風(fēng)格,27%的藝術(shù)家希望如果生成者使用了自己的風(fēng)格,那么需要在使用圖片時(shí)展示藝術(shù)家的信息,37%的藝術(shù)家希望如果使用自己的風(fēng)格,那么需要向自己付費(fèi),完全不介意的只有6.9%
對(duì)目前的 AI 繪畫(包括模型和產(chǎn)品),絕大部分藝術(shù)家都持有負(fù)面的態(tài)度,NPS評(píng)分低至-89,這主要的原因在于,那些在未經(jīng)授權(quán)就被模型學(xué)習(xí)的大量人類藝術(shù)家,其本身并不能從模型生成中獲益,但生成的圖片卻可能為生成者帶來收益,這既不公平,也在某種程度上破壞了生產(chǎn)關(guān)系,還將進(jìn)一步瓦解人類的創(chuàng)作動(dòng)力——為了免于成為模型學(xué)習(xí)的素材,原創(chuàng)性的探索將會(huì)減少,新的風(fēng)格,范式,流派都可能會(huì)停止出現(xiàn)。
但是,如果未來AI繪畫能更具規(guī)范,例如:
  • 使用版權(quán)干凈的素材訓(xùn)練模型
  • 使用藝術(shù)家風(fēng)格,向其進(jìn)行分成付費(fèi)
  • 和藝術(shù)家共同探索新的風(fēng)格邊界
  • 為人類創(chuàng)作提供輔助性功能
  • 尊重藝術(shù)家不被AI模型學(xué)習(xí)的意愿
根據(jù)我們的問卷調(diào)查,如果這些問題得到解決,那么藝術(shù)家對(duì)AI生成圖片技術(shù)的 NPS 評(píng)分將提高 4 倍,絕大多數(shù)藝術(shù)家認(rèn)為這樣的 AI 生成是可以被接受的。

然而這樣的模式建立也并不容易,其中在技術(shù),產(chǎn)品和規(guī)則上都需要很多創(chuàng)新和嘗試,6pen 將在搜集更多反饋后開始行動(dòng),我們也會(huì)將探索的過程隨時(shí)分享。

其他問題

技術(shù)問題

雖然在過去的幾個(gè)月,AI繪畫技術(shù)已經(jīng)得到了快速的發(fā)展,但依然有一部分問題一直存在,包括:
  • 對(duì)顯卡,主要是顯存,要求較高,成本高昂
  • 無法精確的指定畫面對(duì)象的數(shù)量,例如“三只豬和四只老虎”
  • 人的肢體(主要是手指)和眼球效果較差
  • 多主體對(duì)象生成效果差(往往只會(huì)保留一個(gè)或兩個(gè)主體對(duì)象)
  • 無法進(jìn)行有邏輯延續(xù)的故事性生成
不過,這些問題有望在未來 6-12 個(gè)月得到較大改善。

技術(shù)性道德問題

和其它賽道不同,AI繪畫既依托先進(jìn)的AI技術(shù),又(很多時(shí)候)依托開源世界的能力,因此可能會(huì)有一些其他行業(yè)所不存在的可能的道德問題,例如在 Stable Diffusion 開源之后,從國(guó)內(nèi)涌現(xiàn)出較多的封裝型產(chǎn)品,其中許多都存在技術(shù)性道德問題,包括:
  • 不遵守開源模型 licence ,包裝成自研或國(guó)產(chǎn) AI 進(jìn)行營(yíng)銷 *
  • 直接將可能含有藝術(shù)家風(fēng)格的生成圖片用于版權(quán)交易或NFT
  • 將未經(jīng)安全過濾的圖片直接展示給用戶,可能含有歧視,暴力,色情或其他內(nèi)容
  • 過度封裝,隱藏藝術(shù)家的相關(guān)信息
  • 使用非開源服務(wù),用爬蟲等方式獲取其他服務(wù)的生成結(jié)果,封裝成獨(dú)立產(chǎn)品
* 據(jù)我們統(tǒng)計(jì),2022 年 9 月后國(guó)內(nèi)涌現(xiàn)的AI繪畫產(chǎn)品,95% 都使用了 Stable Diffusion,但是按照 Stability License 展示必要信息的,只有不到 10 %
這些問題可能會(huì)阻礙行業(yè)的健康發(fā)展,甚至加劇不同立場(chǎng)的用戶群體之間的矛盾,其中有些難以避免,另一些則完全是故意為之,我們也再次呼吁,從業(yè)者應(yīng)該理性的,有尊嚴(yán)的進(jìn)行探索和創(chuàng)新。

未來的市場(chǎng)預(yù)估

AI 繪畫目前依然是快速增長(zhǎng)的市場(chǎng),技術(shù)也在快速發(fā)展,根據(jù)我們的預(yù)測(cè),在未來五年,全世界的圖片內(nèi)容可能有10-30%為AI生成或AI輔助生成,據(jù)此估算其市場(chǎng)規(guī)模可能超過600億。


但如果要達(dá)到這樣的數(shù)字,前述的問題和爭(zhēng)議都需要得到妥善的解決,就總體而言,AI繪畫的技術(shù)發(fā)展確實(shí)很快,甚至快到法律和規(guī)則還遠(yuǎn)遠(yuǎn)沒有跟上,就已經(jīng)產(chǎn)生了巨大的影響力,這不一定是好事,但也蘊(yùn)含著許多新的可能性,我們應(yīng)該更加謹(jǐn)慎,小心的進(jìn)行探索,盡可能的保護(hù)而非損害更多人的利益。
如果AI技術(shù)的發(fā)展是以人類創(chuàng)作力的枯竭為代價(jià),那 AIGC 將是人類之最大不幸,但如果我們能找到好的方式,來激勵(lì)人類無窮的創(chuàng)造力,并讓所有人都從中受益,那么,這將能成為開啟一個(gè)更美好的世界的鑰匙,我們正處在這兩條道路的中間,我們無法停止前進(jìn),我們也將注視著,看到人類將邁向何方。
我們希望,能走向?qū)Φ哪欠健?/section>
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
最時(shí)髦的AI畫畫,一文包教包會(huì)
AI繪畫,偷竊藝術(shù)
5秒AI繪畫出圖,全球最快的Stable Diffusion終于來了!
Ai繪畫| stable diffusion 高清修復(fù)插件
ChatGPT被“玩壞” 美圖大漲45% AIGC賽道風(fēng)口來了?
第一家瀕臨倒閉的AI繪畫創(chuàng)業(yè)公司出現(xiàn)了,創(chuàng)始人:根本賺不到錢
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 霍州市| 海淀区| 溆浦县| 荆门市| 夏津县| 定结县| 铜陵市| 遵义市| 综艺| 宝鸡市| 平南县| 麟游县| 加查县| 建宁县| 响水县| 泰来县| 德江县| 邯郸县| 藁城市| 扶绥县| 达拉特旗| 广南县| 绥滨县| 平度市| 清苑县| 贵州省| 繁峙县| 芮城县| 柞水县| 天柱县| 莱西市| 长武县| 凤山市| 平邑县| 股票| 天津市| 宁明县| 黑河市| 财经| 涞水县| 武清区|