AIGC爆火,ChatGPT一枝獨秀,想要追逐、趕超,從什么角度切入比較好?
瀾舟科技創始人兼CEO、AI大拿周明的想法是“在垂直領域的應用”。
也就是說,不學ChatGPT的“AGI”夢想,先在一個具體領域做好,等形成產業鏈后,再把這套成熟的技術鋪向更多領域。
不單單是他一個人這么想,還有人跟他一拍即合,這人是中文在線集團董事長兼總裁童之磊。
就在昨天,兩家公司宣布了合作,要一起部署類ChatGPT技術,在內容創作中有效發揮AIGC的作用。
實際上,中文在線和瀾舟科技要聯手的消息,去年9月就已傳出。
具體而言,就是開發一套預訓練模型技術的文學創作輔助算法,并進行商業化嘗試。
雙方各司什么職?采取什么樣的落地方案?目前進展如何?
瀾舟科技祭出的是大模型“孟子”,走的是輕量化、高效訓練的路線。
基于Transformer架構,僅包含10億參數量,可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務。
在此前的中文語言理解權威評測基準CLUE榜單上,“孟子”以10億參數完成了此前百億、千億參數模型刷新的紀錄,僅次于人類基準,打破騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局。獲得這項成績,意味著“孟子”對中文數據的理解分析能力目前已處在第一梯隊。
而中文在線這邊,拿出的是23年里積攢下的數字內容能力,以及能夠繼續發揮創造力的創作者資源。
這就涉及到一個眾所周知的版權歸屬難問題。童之磊表示,訓模型的數據、AI創作出的新內容、對AI創作內容的修改使用,這三個層面“都是有版權的”。
根據這個合作路線,可以看到,二者在AIGC方面的布局,不同于ChatGPT想走的AGI之路,而是要在垂直領域打造一款專用大模型。
通用大模型能夠服務更多行業和領域,專用大模型也有自己的剛需和市場,一方面是降低訓練成本,一方面是提高針對性——
用中文網文作為訓練數據,再用AI對寫手寫作進行輔助,這樣一來幫助寫手完成文章中的基本陳述,繼而人類能把精力重點放在創作情節和設定上。
童之磊舉了一個例子來幫助理解:
提及一座高山,作者通常會用高聳入云、奇峰峻嶺之類的詞語對山峰形貌進行描述。這樣的描述不可或缺,但很少成為挑動讀者閱讀興奮程度的關鍵點,讀者更關心的是以“山”為環境背景,人物會有哪些遭遇。
AI輔助創作的功能,就是在你輸入“高山”后生成數個描摹高山的語句段落,作為備選答案。
目前,這個功能已向中文在線旗下17K文學平臺全部作者開放,他們可針對人物、物品等進行AI輔助創作,并針對不同的作品類別如古風、都市等進行語言調整。
接下來,還將對寫作渲染、語法檢查、錯字排查、文本翻譯等既有技術做進一步完善。
同時,要讓模型更加理解用戶意圖,便于AI基于操作系統的形式調動不同的引擎。
調動在這里與“可控”畫等號,如功能可控,即根據作者需求加減可調用的具體功能;再如結果可控,保證AI輸出的內容是健康、良性的。
中文在線是一家數字出版機構,培養一個AI寫手,不會搬起石頭,把平臺聚集的作者的飯碗砸個稀巴爛?
這樣的爭論存在不是一天兩天了,AI可以寫作的第一天起,有網友就覺得它在內容創作者的脖子上比著一把無形的利刃。隨著寫作AI能夠要啥給啥,新聞、評論、摘要、小說都能寫,題材風格隨便選,更多人慌了起來。
針對此種情況,有悲觀者表示過“創造力即將消亡”。
雙方的合作暗示著中文在線和瀾舟科技對此持積極態度,并表示推出的功能是“AI輔助技術”,而非一個可以完全替代寫手的AI寫作大手子。