墨算未來
墨科技演進,算未來氣象
百度 AI開發者大會(BIDA)上,百度發布了兩個重要產品:一是備受關注的文心一言。文心一言是全球首個多模態融合 NLP模型,它能夠同時理解文本和對話中的多個模態,從而進行多模態融合生成。在百度 AI開發者大會上,文心一言首次亮相,其效果表現引發業界關注。
百度在此次大會上推出了文心一言的升級版本——文心一言 Plus。升級后的文心一言 Plus具備多模態、多場景、高效率四大優勢,是智能對話和智能寫作領域的重大突破,在語言理解和生成方面超越 ChatGPT等國際領先算法模型。
百度副總裁沈抖介紹說:“文心一言 Plus不僅繼承了文心一號的開放能力,還首次引入了文心二號的語義理解技術,構建起了更加強大的語義理解模型。”以多模態融合 NLP模型為基礎,文心一言 Plus能夠在對話、寫作等任務上全面超越 ChatGPT。
沈抖還表示:“文心一號是我們面向自然語言處理任務訓練的第一個大規模語言模型,我們希望文心一言 Plus能夠幫助更多人獲得更好的創作體驗。”
據介紹,接下來,百度將在開放更多核心能力,與業界共同探索人機協同、跨模態融合的 NLP新范式。
一、簡介
文心一言是全球首個多模態融合 NLP模型,由百度聯合中國科學院計算技術研究所共同研發。文心一號和文心二號是其最重要的兩個基礎模型,也是文心一言的前身,二者均采用大規模預訓練語言模型進行訓練,是目前業內最先進的文本生成模型之一。
在此基礎上,文心一號和文心二號被不斷改進,并融合了文本和對話中的多個模態信息,形成了能同時處理文本和對話中的多個模態、并具有更高語義理解能力的新模型——文心一言 Plus。
相較于當前國際最先進的 ChatGPT模型,文心一言 Plus能夠在語言理解和生成方面超越 ChatGPT等國際領先算法模型。
二、模型架構
文心一言 Plus在保留文心一號、文心二號、文心一言基礎上,采用了多模態融合架構。該架構利用深度神經網絡對多模態數據進行建模,同時利用文本語義和對話上下文信息,構建出文本-對話-文本的融合生成模型。
三、技術實踐
作為國內首個多模態融合 NLP模型,文心一言 Plus在多個領域取得了出色的效果。例如在智能對話中,它可以應對復雜多變的對話場景,根據用戶意圖和上下文等信息,提供更加自然的交互體驗;在智能寫作領域,文心一言 Plus可用于文檔、報告、演講、小說等多種應用場景,生成富有創意的文本內容。
另外,文心一言 Plus也擁有高效率優勢。相比傳統方法,文心一言 Plus具有更高的靈活性和通用性。以自然語言生成為例,只需少量文本訓練數據即可實現效果提升,既可以訓練文心二號模型也可以訓練文心一號模型;而對于大型語言模型來說,它還具有更高的靈活性和通用性。
四、使用案例
在過去一年中,百度文心一言 Plus已經在多個應用場景落地,幫助開發者提升產品體驗。
在對話式寫作方面,文心一言 Plus已經上線了智能寫作平臺“文心一言”,用戶可以用它來寫文章,寫對話,完成各種復雜的任務。
目前該平臺已支持多達30種語言的寫作能力,包括中文、英文、日文、泰文等。
五、思考和展望
“文心一言 Plus在對話、寫作等任務上全面超越 ChatGPT,將引領智能對話、智能寫作技術的新突破。”沈抖表示。
但也要看到, ChatGPT還是一個基于大規模數據進行學習的語言模型,其生成能力仍然有很大改進空間。未來,百度將進一步研發多模態融合 NLP模型,讓機器更加全面、更加智能地理解自然語言,為更多人提供更加智能的生活體驗。
此外,百度將進一步探索 AI與自然語言處理技術融合的新范式。除了文心一言 Plus,百度還將基于文心一言,進一步加強開放能力建設、推進人機協同創新發展。文心一言 Plus將繼續以開放和創新的方式與更多伙伴分享。