京東用自己多年積累的零售、健康、物流數據,喂出了一個專門解決行業問題的大模型。 作者 | 鄭玄 又一個重要玩家入局大模型賽道。7 月 13 日,京東云峰會在北京開幕。會上,京東正式推出了千億規模的言犀大模型,以及言犀 AI 開發計算平臺,并展示了京東基于大模型,開發的一系列服務京東原有業務的產品和解決方案。與華為、火山、阿里等國內云廠商相似,京東同樣是從行業應用而非 ChatGPT 這樣的 C 端產品切入大模型賽道。京東云表示,言犀大模型的訓練數據來源于 70% 的通用大數據和 30% 的京東數智供應鏈原生數據,這使得言犀大模型從誕生之初,就有更強的產業屬性,從而更好的解決產業問題。要讓大模型真正服務千行百業,除了老生常談的在技術和基礎設施層面解決訓練成本、部署成本和推理成本等問題,還要讓開發、部署大模型這件事本身變得更加簡單。使得原來需要數個 AI 科學家才能完成的工作,讓幾個普通程序員也能「手到擒來」。京東云基于大模型開發了一系列平臺工具和應用產品。會上,各個工具和產品的負責人一一登臺,現場演示了生成、訓練、部署自己的行業 AI 大模型,以及利用 AI 大模型開發的工具來尋醫問診、生成 AI 商圖的實踐操作。每一項工具和應用的使用,可以說都是「傻瓜式」操作,比如只需要五步勾選幾個選項就能生成各種各樣的大模型,其難度不會超過填寫一個網上的調查問卷。在云巨頭們紛紛 All in 的大模型賽道,京東云并不是「種子選手」。看起來沒有太多 AI 大牛和噱頭的京東云,選擇了最接地氣的方式,召開了自己的第一場大模型發布會。但就像極客公園此前多次說過的那樣,今天大模型領域比拼的不是誰的技術背景、算力更強,誰的參數更大,而是誰能真正解決行業使用大模型的難題,讓技術真正服務于產業,服務于消費者。而務實的京東云,完全有可能會是這個大目標下的一匹黑馬。
01
言犀大模型
和 AI 開發計算平臺
會上,京東詳細介紹了言犀大模型的技術底座,以及基于京東云過去積累的 AI 技術能力和計算資源,開發的面向行業客戶的言犀 AI 開發計算平臺。
值得一提的是,讓大模型持續升級迭代是今天行業需要解決的關鍵問題之一,而這個問題的鑰匙之一就是向量數據庫。京東自研了向量數據庫 Vearch,可以支持百億級向量搜索,目前該數據庫已經開放給國內首個開源軟件基金會——原子基金會。與大模型基座一同發布的「言犀 AI 開發計算平臺」,則是基于言犀大模型解耦出的基礎能力,集成了超過 100 種場景的 AI 算法和工具,打造的一個低代碼 MaaS 平臺。
京東健康多年來累積了大量的行業數據和資源,包括累計超 3000 萬高質量臨患對話,百萬級規模醫學知識圖譜,醫療專家團隊,覆蓋線上 140 余科室的醫生、藥師、營養師、心理醫生。基于這些數據和能力,京東訓練了健康大模型和行業應用。大模型的多輪交互、工具調用、總結摘要、圖文多模態等能力,幫助京東健康在多場景升級應用:有服務用戶的個人健康助手、隨訪管理;還有服務醫生、藥師的診療助手、醫療文案書寫、科研助理、診療服務調度等。會上,京東云展示了一個醫療問診案例。傳統的 AI 醫療問診,往往是一次提問而 AI 直接回答一大串內容,從結果來看這樣的做法和搜索引擎相似。而真正的醫師(包括互聯網醫師)往往是通過多輪提問,為缺少醫療知識的患者答疑解惑,從而更準確地判斷病情。