精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
京東大模型:「知識」就是力量

機器之心原創

作者:蛋醬

火熱了半年多,大模型領域的格局,總算清晰了一些。

如果你還有印象,在 2022 年 12 月 ChatGPT 爆火之后,國內的科技公司說得最多的是「成為中國的 OpenAI」、「打造中國版 ChatGPT」。搶發大模型,曾經是第一要務。

流暢的多輪對話、豐富的通用知識問答。大模型到底是具備「超級能力」,還是因為其訓練語料足夠豐富而使得模型僅僅是「記憶」這些內容?

隨著領域內對大模型技術路徑的認知不斷加深,大模型的深層價值開始被挖掘,人們發現它應該走到實體產業中,走進傳統行業,影響到生產力的方方面面,但規模化落地設想遇到的挑戰也迅速顯現。

在 2023 京東全球科技探索者大會暨京東云峰會上,京東推出了面向產業的言犀大模型和言犀 AI 開發計算平臺,大踏步走向產業。


「技術的產業導向,也是落地的產業向導」

「產業化最后一公里的問題,看起來好像不大,卻是決定大模型能用不能用的邊界。」埋首于產業實踐中的科學家們感受最深。

真正的產業需求與前沿技術之間,往往存在一條很難跨越的溝壑。對于這個問題,京東感受到的時間可能比其他科技公司都早。

京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬博士說,「如果只是拿著刷榜的技術去秀,而沒有考慮真實用戶需求,那么用起來就肯定會碰到各種各樣的問題。一旦對使用者來說不可用,再怎么說也覺得技術不行」。

從一開始,京東對 AI 技術的探索就帶有明顯的「產業導向」特色。

與其他科技互聯網公司相比,京東的實體屬性更強,具有龐大而又復雜的產業生態,和復雜、動態、鮮活等領域數據。因此,京東持續投入的產業 AI 面向的也多是知識增強、任務型的場景,需要解決真實世界深度復雜的問題。這些廣泛的實體業務與數據優勢也奠定了京東成為 AI 產業落地的前沿陣地。

「我們在組建 AI 研究院的時候就有一個理念:百分之八十由產品和行業落地應用來驅動,百分之二十的研究是面向未來。」何曉冬表示,「一直以來,京東的對外開放的 AI 能力都是由自身業務錘煉而成的,并通過京東場景充分的驗證與實踐。」

這也應證了他在 2023 京東全球科技探索者大會暨京東云峰會上提出的京東大模型「三步走」路徑。


在這種產業驅動的技術探索中,京東在 2020 年就關注到大語言模型技術可能帶來的應用價值,但同時也發現了它和產業落地之間還存在相當一段距離。

大語言模型的成功,可以追溯到 2018 年 Transformer 架構在自然語言處理領域的突破。當參數量越來越高,大模型的能力開始「涌現」。AI 開始變成了我們想象的樣子,甚至展現出超出想象的「智能」。

ChatGPT 的成功,意味著大語言模型已經完成了「從技術到產品」的關鍵一步,其通用能力得到證明。而下一步「從產品到落地」,卻并不比上一步來得容易。

首先就是模型的「內容準確度」問題。在電商領域,京東很早就在嘗試將大語言模型用于推薦、新品介紹等內容生成,但很快感覺到大語言模型直接生成的文案、文字和報告在商用場景不可行。由于大模型的底層架構是「預測下一個 token」,導致其容易產生「幻覺」,給出事實上不正確的陳述。

這是現在大部分生成式 AI 產品都或多或少存在的問題,即使生成式語言模型生成的內容正確率能夠達到 83%、85% 左右,但這在可靠性要求較高的、嚴肅的任務型場景中,還遠遠不夠。這導致許多企業對于在業務流程中使用大模型這件事抱有謹慎態度,也是 ToC 場景和 ToB 場景技術落地之間的天然差距。

其次,在大模型進入具體行業之前,還有「知識深度」的問題要解決。在知識圖譜和預訓練模型融合方面,主要存在三個技術上的挑戰:結構化的知識圖譜與擅長非結構化的預訓練模型結合的問題;文本和知識圖譜嵌入在特征空間上的對齊問題;知識噪聲的問題。

關于對齊,曾有媒體追問「是在語義層面對齊,還是數據層面對齊?」何博士的觀點是,在語義層面,或者更低。

此外還有「安全可控」「迭代效率」兩個問題。

大模型輸出中的信息泄露情況頻發,尚未做到完全可控。

同時,如何突破算力瓶頸,提高資源效能,提升模型迭代升級效率,降低訓練及使用成本,也是大模型走入落地階段的必答題。

對于企業來說,還有部署成本的問題。

大模型參數的爆炸式增長帶來了能力的涌現,也意味著訓練、推理、部署成本的成倍增加。模型越大,架構越復雜,對于企業來說就更難直接調用做部署。

何曉冬表示:「在與客戶的交流中,我們發現很多企業還是需要一個拿來就能用的東西。調用 API,有時也是企業不可承受的技術操作成本。」


所以,不做單純的大模型商店,不去做一個單純提供模型訓練、推理服務的 MaaS 平臺,而是提供端到端的產品服務,這些決定都是京東深思熟慮的結果。

「大模型不是一天之內訓練成的」

任何大模型都不是一天之內訓練出來的。

「數據大小解決知識豐富度問題,容量大小解決功能性問題」。在不斷深化的產業實踐驗證中,京東大模型的規模也完成了從十億、百億到千億參數的進化。


起跑早的京東當然也更早的遇到了上面所說的落地問題。

2021 年,針對大語言模型內容生成專業度、忠實度、可靠度不足的問題,京東在業內首創了將領域知識注入大模型的方法,提出十億級自研領域模型「K-PLUG」。


K-PLUG 模型與電商場景緊密結合,基于零售行業深刻的產業 Know-How,大幅改善了此前 AI 生成長文本任務中文本多樣性、篇章連貫性,以及在商品賣點文案的生成中尤其需要關注的賣點獨特性、屬性一致性。

2022 年,針對模型泛化性不足的問題,京東又提出了百億級 Vega 模型。之后,團隊在通用語言理解基礎模型方面對織女大模型進行再升級,提出規模更大、性能更強、遷移性更好的 Vega v2 模型。

GPT-4 將多模態帶進大模型,進一步拓展了大模型的能力邊界。而基于業務應用需求,京東很早就關注到了多模態的價值,在這一技術領域已布局多年。

2018 年,何曉冬帶領團隊在 CVPR 發表了一項重要研究,他們提出了「Bottom-up and top-down」注意力機制,用于跨模態的語言和圖像信息在語義層次的對齊研究。過去五年,CVPR 會議發表的所有論文中,「Bottom-up」這篇論文排名前二十。而排名前二十的論文中,只有「Bottom-up」這一篇是有關多模態的,這篇論文迄今已有超過 5000 次的引用。


論文發布的那年,何曉冬博士團隊用文生圖算法(AttnGAN)生成了一張小鳥「照片」。那是一只紅羽毛白肚子的短嘴小鳥,胖憨可愛,加上兩道黑粗劍眉,神似風靡全球的游戲「憤怒小鳥」里的主角。這是他們在「多模態」任務中階段性的成果。

「不只是我的團隊做大模型要走多模態這一條路,其他團隊也得走這條路。」,何曉冬博士強調。

隨著 GPT4.0 的發布,越來越多的企業將視角投向了多模態大模型。

而自 2018 年起,京東云已經將言犀的能力積極推向跨越語音、視覺等多模態的應用。例如,在言犀的加持下,京東多模態數字人已落地到零售、金融、政務等廣泛的應用場景中,且交互體驗大幅提升。今年 618 期間,言犀虛擬主播開播商家較去年 11.11 增幅超 5 倍,帶動商家 GMV 增長較去年 11.11 增幅超 246%,大幅為品牌直播間降本提效。


今年 2023 京東全球科技探索者大會暨京東云峰會上全面升級的言犀智能服務,只需要提供少量樣本素材和 5 分鐘的簡易拍攝,言犀數字人大模型就能提供全鏈路內容自動生成,還支持生成側臉 / 走動 / 手勢這些大姿態和動態局部高清與語義驅動的肢體動作編排。

「知識就是力量 讓大模型擁有知識」

當通用智能向前進發,多模態認知智能十分關鍵。

如果人工智能識別做的只是比對,缺少信息進入「大腦」之后的「加工、理解、思考 」。那僅僅是「感知」,而并非「認知」。要讓 AI 有類似大腦的活動,走到認知階段,需要讓它掌握知識、進行推理。

比較之前的感知智能,認知智能進入到一個學習曲線更加陡峭,也就是說,更加艱難的學習過程里。Scientia potentia est(知識就是力量),弗朗西斯?培根如是說。

機器人學家羅德尼?布魯克斯夢想造出能在現實世界中執行有用任務的機器人,在他的理論體系中,他確信人工智能要取得有意義的進步,只能通過與現實世界中的系統交互來實現。并且認為,智慧是一種「涌現」性質,來源于實體與它所處環境發生的各種交互作用。

現在,大模型通過海量數據的訓練,實現了布魯克斯期待的「涌現」。

對于任何大模型來說,只有通過大量的人類反饋的交互數據,效果才能越來越好。

具體到復雜的產業創新應用上,更需要「活的」ToB 場景數據,即動態而非靜態的數據,這很難在互聯網上獲取,自身沒有相應的場景也無法讓數據「活」起來。

有一個常見誤區, 「垂直產業模型比通用域大模型簡單」,但實際上產業大模型是在通用域大模型的基礎上做的知識增強,垂直的產業模型必須擁有基礎的常識和意圖理解能力,它是通用域大模型的進階版。其次,通用域大模型更關注常識性問題的回答和生成等任務,產業大模型則更關注產業效率的提升。這兩個方面,都是京東的強項。

何曉冬博士說,在言犀大模型的數據構成中,70% 為公域數據,30% 為京東數智供應鏈的原生數據。并在訓練過程中,不斷通過用戶反饋強化模型對產業的認知,持續不斷進行效果迭代。

整個京東每年產生的動態交互數據加起來有數百億之多。以智能客服領域為例,每天提供 1000 萬智能客戶服務,每月 200 萬小時通話語音,今年京東 618 期間累計服務超 7 億次。

除了語音,京東還有有商品圖片、安裝指南視頻、用戶評論 & 問答…… 京東全量智能服務的技術經驗,加上在京東零售、物流、健康等多類業務的多年實踐,體量做到了日均千萬次智能交互。這種長鏈路、復雜協同、更多動態數據回流形成正反饋的京東場景,是多模態大模型的最好練兵場。

「某種意義上,我們相當于既做了通識教育,又讀了四年專業性的本科教育。」何曉冬表示。

寫在最后

產業大模型「開考」在即,在這場考驗中,我們發現京東已經先行進入了下一階段的賽程。

「狗糧要自己先試一下」,即使業內普遍關注如何訓練超大規模參數的模型、提高模型的通用性,京東始終更看重的也是大模型在供應鏈各環節的應用效果。技術總要先經過內部使用,效果達到后再開放給合作伙伴。

詳細拆解京東為言犀大模型規劃的三步走路徑:第一步,推出京東言犀大模型的基座模型與「言犀 AI 開發計算平臺」;第二步:內部實踐,將模型反復迭代測試,應用于京東內部核心業務并形成最佳實踐,針對一些重點場景的標桿客戶進行對外服務;第三步:針對金融、政務、健康等京東域外重點產業場景全面開放大模型能力,產生技術普惠價值,助力實體經濟。

基于言犀大模型解耦出的底層能力,京東推出了「言犀 AI 開發計算平臺」。在昨天的大會現場,我們也看到了言犀 AI 開發計算平臺的演示:


平臺內含零售、物流、健康等十余個行業知識庫,提供了百余種訓練和推理優化工具和更加高效的大模型開發環境,支持以少量企業數據精調出專屬模型,將整個迭代效率提升了 10 倍以上。

比如金融營銷場景,大模型解決了諸如關鍵性任務,動態適應性、用戶體驗等問題,大幅優化了營銷運營流程,降低運營人員的學習成本與操作成本,實現方案生產效率上百倍提高。

過去涉及產品 / 研發 / 算法 / 設計 / 分析師等 5 類以上職能才能完成的流程,現在 1 人就能完成。同時,以一個入口的全新交互模式,讓人機交互次數從 2000 次降低至少于 50 次,操作效率卻能提升超過 40 倍。

回望這半年,大模型確實帶來了全新的智能交互與內容生成能力,引燃了生產力的變革。言犀大模型的發布,是大模型落地產業的新起點,但并不意味著京東對大模型技術路線探索的終點。

因為真實而復雜的產業場景中不只有語言,還有語音、視覺。在產業場景中跑得通的大模型,絕不能只是精通「語言」。大模型的下一步,一定是走向多模態和具身智能,而且是面向真實世界、產業原生的大模型。

正如何曉冬博士在演講最后指出的,當前多模態融合還相對淺層,主要是通過一個模型調用另一個模態。如果想達到深層的涌現智能,必須進行深層次融合,真正做到多模態的通用大模型,才能夠說 AGI 實現了。

在這個過程中,實體產業場景將給模型提出更多難題,一如當年 Transformer 的「胡言亂語」。

但在未來的某一天,多模態領域也一定會迎來自己的「ChatGPT 時刻」,人類終將打開通往 AGI 的大門。
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
大模型的“第一性原理”:技術創新與社會價值的接軌
華為智慧搜索更好用了!上線智慧搜圖,用人話找出“我的”圖片
毫末智算中心:補齊自動駕駛3.0時代最后一塊拼圖
以通用AI為支點,商湯絕影撬動了智能汽車新生態
阿里版ChatGPT即將發布,其他“局內”選手進展如何?
[首藏作品](8773)創新煥發活力 人工智能與實體經濟融合加速
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 东安县| 达拉特旗| 六枝特区| 诸暨市| 虹口区| 武川县| 敖汉旗| 徐汇区| 仁寿县| 葫芦岛市| 资阳市| 陵川县| 湖口县| 红原县| 杭锦旗| 济阳县| 北流市| 银川市| 正阳县| 石阡县| 吴忠市| 永昌县| 富蕴县| 吴桥县| 铜梁县| 杭州市| 呈贡县| 壤塘县| 弋阳县| 鹤岗市| 樟树市| 康马县| 峨眉山市| 天峻县| 澎湖县| 丹阳市| 济宁市| 唐山市| 平遥县| 达日县| 呈贡县|