“在AI創業中,技術必須從用戶場景出發,圍繞用戶需求來研發,而不是盲目圍繞技術閉門造車。”
在接受網易智能采訪的過程中,楊志明這樣表達他對于技術創業的心得。
在這之前,這家叫做深思考人工智能(以下簡稱'深思考')的公司以及CEO楊志明似乎頗為低調。
實際上,深思考這家公司已經成立了整整三年,目前有近70余人,其突出的技術是“多模態深度語義理解技術”,可同時理解文本、視覺圖像背后的深度語義,目前面向場景為智慧醫療大健康和汽車智慧商業。
這已經是楊志明在AI領域的第四次連續創業,他長于AI算法,在人工智能領域有十余年學研經驗,是中國科學院軟件所人工智能方向博士、中科院大學MBA,主持過多項國家級重大核心系統研發,擁有百余項知識產權。
專攻多模態深度語義理解
推出深思考大腦(iDeepWise.ai)4.0
“AI技術的發展會經歷感知、識別、理解、決策四個階段。前兩個階段我們已經發展比較好了,目前我們正在解決理解的問題,”楊志明說,“比如讓機器識別‘暴力圖片’,不能簡單識別出一把刀就是暴力,如果一個水果旁邊放著一把刀呢? 那就可能不是暴力圖片。”
8月初,深思考推出了“多模態深度語義理解”深思考大腦(iDeepWise.ai)4.0,憑借此項技術,深思考近日在中文語義理解與人機交互領域最高水平的SMP2018-ECDT賽事中獲得冠軍,蟬聯2017、2018兩屆冠軍。
楊志明表示,深思考大腦(iDeepWise.ai)4.0在多輪人機交互語義理解方面有突出優勢,使得機器人能夠與人多輪人機交互,能夠理解上下文,最厲害的是在人機交互的過程中實現會話意圖的自由切換與準確識別,其語義理解是多模態的,能夠同時理解文本、語音和視覺圖像背后的深度語義。
但是,我們如何評價機器理解的效果?楊志明稱目前學界還沒有統一的技術評價標準,但是在具體領域,我們主要看最終的產品效果就可以。比如在醫療篩查領域,可以看最終的準確率怎么樣。
布局醫療AI篩查領域
60秒可分類7萬個細胞
目前,深思考一方面是在AI核心前沿技術領域繼續突破,另一方面利用AI技術結合業務場景來落地。
創業三年,楊志明認為最關鍵的就是找到剛需場景,用AI技術賦能這些場景,產生更好服務,最大的挑戰是如何用技術來解決這些場景下的產品化問題。
深思考目前更多地將多模態深度語義理解技術應用在醫學健康領域。楊志明說,深思考大腦4.0可以理解醫學文章,做健康咨詢和健康篩查,比如宮頸癌細胞篩查等。深思考已經面向醫療機構推出了全自動人工智能宮頸癌細胞輔助閱片系統,這套系統可以在60秒內分類7萬個細胞,快速進行AI宮頸癌篩查。
目前,深思考的宮頸癌細胞篩查方案除了與國內一些三甲醫院合作外,但更多的是進駐第三方檢測機構,楊志明稱面向后者的市場占有率已達到了60-70%。
談到深思考在醫療大健康領域的未來布局,楊志明稱,我們先從單點突破,然后再進行縱向和橫向的拓展,持續建立起病理細胞學平臺,進而用遷移學習方法逐漸從宮頸癌細胞篩查拓展到其他病理細胞篩查上。
“不同于其他AI醫療公司的是:我們已經積累了大量的關于細胞分類的基礎技術,在病理細胞學上頗有研究,比較容易進行其他病種遷移。”楊志明說到。
關于盈利模式,楊志明表示,未來基于病理細胞學的篩查平臺有兩種盈利模式,一種是“云模式”,算法都在云端,可以任意接入不同的醫療機構的終端設備,不斷積累數據并優化模型,對于客戶來說入門使用成本適宜,易用大規模擴展。另外一種盈利模式是“端模式”,主要針對于某些不適合接入云端的醫療場景,提供AI算法+芯片的一站式智慧醫療解決方案。
值得一提的是,深思考已經推出了專用AI芯片DPU,分別是智慧醫療專用AI芯片M-DPU,還有智慧商業專用AI芯片B-DPU。深思考的DPU是基于FPGA平臺研發的,主要針對特定場景解決方案來使用,用DPU集成運算深思考大腦(IDeepWise.ai)4.0核心算法,形成完整解決方案。
汽車智慧展廳業務是現金牛
看好車內場景交互
AI落地應該從場景和用戶需求出發,但在這個過程中有業務需求與AI技術的巨大鴻溝,因為AI落地與傳統業務結合往往是一個跨領域的復雜問題。
因此,改變醫療行業并非一蹴而就,即使在醫療篩查行業普及AI技術也并非易事。在推進醫療篩查的業務之外,深思考又開辟了汽車智慧展廳的現金牛業務。
據悉,深思考憑借自身在人機交互、多模態語義理解和大數據領域多年的人工智能技術積累,將AI賦能線上云平臺和線下體驗入口,以4S展廳為切入點,針對傳統4S展廳留客難、體驗差、無法分析客戶關注點、產品介紹不夠全面規范等痛點,用AI構建了以智能視覺分析與理解平臺、大數據分析平臺、智能迎賓機器人、多模態深度語義理解與人機交互平臺為一體的智慧展廳。
同時,深思考也通過大數據分析平臺為智慧展廳提供用戶畫像。從年齡、性別、購車咨詢時的情緒、停留時間、關注焦點、購車偏好等多個維度的大數據分析,輔助4S店長和主機廠商決策層做決策,形成一套商業領域的多模態人工智能機器人大腦解決方案,帶來全新的購車、售車體驗。
目前深思考已簽約億元大單,將落地數千家智慧展廳,還有多家品牌汽車主機廠商正與深思考深度接洽。
與此同時,深思考也在利用自己在AI交互上的技術優勢來布局汽車內部場景,主要涉及人與車的交互方案。在楊博士看來,未來汽車上肯定會有一個人機交互的入口,這個入口有可能是車機大屏,有可能是投射3D屏幕等等,而且語音語義交互、手勢交互等等多模態的人機交互會是未來人車交互的一個趨勢。
但是如果想在前裝普及這種新交互模式,起碼還需要3年的時間。目前市面上的車內語音交互方案還有很大的問題,一是語音控制方面不能夠完成最終的任務,往往只能完成一半還是需要觸摸操作;二是聽不懂,雖然機器能聽清什么問題,但聽不懂問題,無法理解問題,也沒有上下文理解記憶能力,無法完成操作。楊志明博士稱,如果想在車內人機交互上取得突破,還需要深挖下去,將算法和應用場景深度結合,對產品進行精細化打磨才行。
在采訪中,楊志明向網易智能透露,深思考近期完成了5000萬元的A輪融資,另外新一輪的融資也已即將敲定,今年總計融資額有望達到1.3億元。
- 加入社群吧 -