大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新服務(wù)媒體
——聚焦數(shù)據(jù) · 改變商業(yè)
也就是說,在6個(gè)月內(nèi),作為一家以NLP技術(shù)為核心,打造標(biāo)準(zhǔn)化平臺(tái)產(chǎn)品并率先上云的創(chuàng)業(yè)公司——竹間智能,已經(jīng)成功累計(jì)獲得3億元人民幣的融資。
那么,竹間智能怎么就能在短時(shí)間內(nèi)屢受資本市場青眛,連續(xù)拿下兩輪融資的呢?
竹間智能由前微軟(亞洲)互聯(lián)網(wǎng)工程院副院長簡仁賢于2015年創(chuàng)辦,是國內(nèi)少數(shù)具有語音、語義、圖像全場景多模態(tài)人機(jī)交互技術(shù)的企業(yè)。
其以自然語言處理(NLP)、知識工程、計(jì)算機(jī)視覺、多模態(tài)情感計(jì)算、深度學(xué)習(xí)等AI技術(shù)為基礎(chǔ),為企業(yè)提供一站式人工智能標(biāo)準(zhǔn)平臺(tái)產(chǎn)品及解決方案,助力企業(yè)實(shí)現(xiàn)智能化轉(zhuǎn)型。
而竹間智能近6年來深耕的NLP正是人工智能的重要技術(shù)領(lǐng)域,也是目前人工智能產(chǎn)業(yè)最難攻克的技術(shù)之一。
圖丨竹間智能創(chuàng)始人兼CEO簡仁賢
我們經(jīng)常看到#人工智能有多智障# 、#人工智障圖鑒# 等詞條頻頻被懟上熱搜。專家口中的人工智能會(huì)在10年內(nèi)代替人類,電影里面的人工智能正在密謀接管世界,可現(xiàn)實(shí)生活中的人工智能,卻答非所問、指鹿為馬。究其根本原因,無非是技術(shù)不過關(guān)。從NLP的角度來講,技術(shù)的深度、廣度,直接決定了人工智能是否具有完備的語言理解功能以及理解后輸出的話語到底能否達(dá)到真正的智能。大家所碰到的“人工智障”更多是披著人工智能外皮的“假AI”,這樣的“假AI”大多采用“關(guān)鍵字”、“死模板“,無法實(shí)現(xiàn)對內(nèi)容的真正理解。
簡單點(diǎn)理解,NLP讓人與計(jì)算機(jī)之間以自然語言進(jìn)行有效溝通、通信。要實(shí)現(xiàn)人機(jī)交流,就需要彼此“懂”,而NLP就擔(dān)當(dāng)了搭建機(jī)器語言與人類語言之間溝通橋梁的重任。
早期的語言處理系統(tǒng),如SHRDLU,當(dāng)它們處于一個(gè)有限的“積木世界”,運(yùn)用有限的詞匯表會(huì)話時(shí),可以工作得相當(dāng)好。但是,一旦把這個(gè)系統(tǒng)拓展到充滿了含糊與不確定性的現(xiàn)實(shí)世界中,問題也就隨之而來。
打個(gè)比方,“我們把香蕉給猩猩,因?yàn)樗鼈凁I了”和“我們把香蕉給猩猩,因?yàn)樗鼈兪焱噶恕庇型瑯拥慕Y(jié)構(gòu)。但是代詞“它們”在第一句中指的是“猩猩”,在第二句中指的是“香蕉”。也就是說,如果人工智能不能像人一樣理解猩猩和香蕉的屬性,就根本無法領(lǐng)會(huì)句子的真正意圖,從而落實(shí)行動(dòng)。
所以說,面對人工智能的背后“是否真正懂了”的NLP技術(shù)時(shí),竹間智能顯然成了深藏功與名的“掃地僧”。
早期,竹間智能深耕了短文本NLP能力,研發(fā)了包括Bot Factory?對話式AI平臺(tái)和AICC+(AI Contact & Collaborate)等產(chǎn)品,并在圍繞情感對話交互,電話機(jī)器人、智能客服、語音助手等領(lǐng)域積累下大量技術(shù)和經(jīng)驗(yàn)后,逐步擴(kuò)展至機(jī)器閱讀、知識工程等長文本領(lǐng)域,通過Gemini認(rèn)知認(rèn)識工程平臺(tái)應(yīng)用于知識圖譜自動(dòng)構(gòu)建、文本審核、對比,智能推薦、搜索等等,極大地滿足了企業(yè)對于NLP技術(shù)更廣更深的需求。這些,都是竹間智能通過數(shù)百個(gè)標(biāo)桿客戶的應(yīng)用場景落地積累,形成了高度標(biāo)準(zhǔn)化的NLP相關(guān)產(chǎn)品與解決方案。
其中極具代表性的正是竹間智能在2021年新推出的以NLP長文本為基礎(chǔ)的認(rèn)知知識工程平臺(tái)產(chǎn)品“Gemini Cognitive Cloud”。Gemini Cognitive Cloud幫助企業(yè)處理海量的文本數(shù)據(jù),產(chǎn)生知識,形成用來推理和分析的結(jié)構(gòu)化知識圖譜,發(fā)揮應(yīng)用價(jià)值。
其中,Gemini Studio流程自動(dòng)化平臺(tái),像個(gè)”管家“,業(yè)務(wù)人員可以用無代碼拖拉拽方式自動(dòng)化構(gòu)建知識圖譜,既可以是應(yīng)用到特定場景業(yè)務(wù)的知識圖譜,也可以是通用的行業(yè)知識圖譜。同時(shí),這些知識圖譜也可以用來進(jìn)行業(yè)務(wù)推理和洞察以及行業(yè)的分析。
而Gemini KM更像是“倉庫”,它能用來管理企業(yè)海量的非結(jié)構(gòu)化文檔。文檔經(jīng)由Gemini KM智能知識庫的采編流程進(jìn)入到智能知識庫管理系統(tǒng)可以直接進(jìn)入Gemini Studio,自動(dòng)構(gòu)建成可推理的知識圖譜后,再將此用于Bot Factory 的對話機(jī)器人中,形成端到端的知識鏈,二者之間相輔相成,產(chǎn)生知識自動(dòng)化應(yīng)用的全棧式閉環(huán)。
以某大型石油國有企業(yè)的文本抽取和查重項(xiàng)目為例,在高舉數(shù)字化轉(zhuǎn)型大旗的今天,該企業(yè)就遇到了難題,一個(gè)看似不是問題的問題,卻造成了大量人力、時(shí)間的浪費(fèi)。
據(jù)悉,該企業(yè)有2700多份歷史項(xiàng)目文檔,而且每年還在以400到500份的數(shù)量增加,企業(yè)一開始依賴人工進(jìn)行報(bào)告查重,因此不僅對人員專業(yè)技術(shù)要求較高,而且造成了人工查詢效率低下和漏查比例大等問題。所以,如何避免新文檔與歷史文檔重復(fù),避免耗費(fèi)巨大人力查重,成為該企業(yè)的“剛需”。
基于這一需求,竹間智能為該企業(yè)部署了基于Gemini平臺(tái)的解決方案。之前,每100份新增項(xiàng)目文檔就需要兩個(gè)人花三個(gè)月時(shí)間去完成比對查重。而現(xiàn)在,運(yùn)用了竹間智能的Gemini認(rèn)知知識推理平臺(tái)后,每份新文檔的查重僅需要12秒,效率瞬間提升上千倍,有效解決了審漏、審錯(cuò)等問題,流程自動(dòng)化效率提升50%,信息搜索效率提升80%,并直接帶來了運(yùn)營效率的提升,整體每年人力成本節(jié)省200萬元。
而且,這些產(chǎn)品在發(fā)揮其真正所用價(jià)值和作用時(shí),極大程度地保證了準(zhǔn)確率。要知道,失去了準(zhǔn)確率的人工智能,終究會(huì)成為網(wǎng)友口中的“人工智障”。
當(dāng)然,也只有準(zhǔn)確率的提升、耗時(shí)驟減、效率提高,才真的帶來了人的解放、生產(chǎn)力的解放、讓時(shí)間更有價(jià)值。
竹間智能創(chuàng)始人兼CEO簡仁賢就表示:“目前,市場上公認(rèn)準(zhǔn)確率達(dá)不到85%是不達(dá)標(biāo)的。但是,我們產(chǎn)品冷啟動(dòng)期就可以達(dá)到85%的準(zhǔn)確率,加上我們內(nèi)置循環(huán)自學(xué)習(xí)功能,在實(shí)際業(yè)務(wù)中準(zhǔn)確率可以達(dá)到92%~95%,而且還在繼續(xù)提高,所以,隨著對于業(yè)務(wù)解決量的增加,我們的準(zhǔn)確率還會(huì)更高。”
也正是這樣高的“準(zhǔn)確率”,竹間智能才有了在業(yè)內(nèi)各類AI應(yīng)用落地難、AI企業(yè)融資趨冷、上市受阻時(shí),還能被資本發(fā)現(xiàn)并選擇的“底氣”。竹間智能對此表示。“市場應(yīng)該掌握在自己手里,好的產(chǎn)品,總是不乏吸引力的。”
據(jù)悉,竹間智能本輪融資后,將進(jìn)一步開展“All-In-Cloud”云化策略,以NLP技術(shù)為核心所有標(biāo)準(zhǔn)產(chǎn)品全部云化,并推出竹間云。
竹間的“這朵云”中包括了機(jī)器人工廠云(Bot Factory Cloud)、AICC+云 (AICC+ Cloud)、認(rèn)知及知識工程云(Gemini Cognitive Cloud)及NLP云(NLP Cloud)。并致力于將人工智能NLP產(chǎn)品云化,為企業(yè)客戶帶來低代碼、低運(yùn)營的企業(yè)智能化軟件服務(wù)。
舉例來講,如果說微軟的 Office 是企業(yè)辦公的標(biāo)準(zhǔn)軟件,用戶可以使用其產(chǎn)生大量的結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù)及文檔。那么竹間云 Emotibot Cloud 就是企業(yè)業(yè)務(wù)和服務(wù)的操作系統(tǒng)。
應(yīng)用竹間智能自身優(yōu)勢的NLP技術(shù)進(jìn)行充分閱讀和處理上述的非結(jié)構(gòu)化數(shù)據(jù),形成用來推理和分析的結(jié)構(gòu)化知識圖譜,并且還可以處理各式各類的文檔,如Word、PPT、Excel、PDF、圖片、視頻、語音等等。
其中還有“外掛”神器,也是產(chǎn)品的核心特色 “一鍵部署”。用戶只需輕點(diǎn)一下按鈕,一個(gè)可以支持?jǐn)?shù)百個(gè)甚至數(shù)千個(gè)機(jī)器人平臺(tái)即可迅速完成創(chuàng)建。并同時(shí)滿足企業(yè)公有云、私有云以及混合云的多種部署要求,支持華為云、騰訊云、阿里云、中國電子云、紫光云、Microsoft Azure,AWS等多家云廠商。
面對系統(tǒng)安全問題的日益凸顯,不少企業(yè)的系統(tǒng)有了“本土化”的需求,因此,竹間云平臺(tái)也可以支持國產(chǎn)CPU、服務(wù)器、操作系統(tǒng)及數(shù)據(jù)庫平臺(tái),如海思、麒麟、openGauss、寶蘭德BES等。畢竟讓企業(yè)系統(tǒng)國產(chǎn)化,具備自主研發(fā)和維護(hù)的能力才是中國人工智能實(shí)現(xiàn)彎道超車的必要條件之一。
本輪投資方廣發(fā)信德項(xiàng)目負(fù)責(zé)人楊昌泓先生認(rèn)為:“竹間智能堅(jiān)持自主研發(fā)底層NLP技術(shù),結(jié)合高度標(biāo)準(zhǔn)化的產(chǎn)品,大大提升了企業(yè)效率,并且通過產(chǎn)品云化一起建立了新的壁壘”。申能誠毅投資總監(jiān)劉喆先生則認(rèn)為:“竹間智能的語義技術(shù)和標(biāo)準(zhǔn)化的NLP產(chǎn)品是同類AI企業(yè)里的佼佼者。”朗瑪峰資本高級合伙人呂寧博先生表示:“竹間智能已經(jīng)形成了多個(gè)標(biāo)準(zhǔn)化平臺(tái)型的企業(yè)級產(chǎn)品,高效的工程化和交付能力獲得多個(gè)行業(yè)上百家標(biāo)桿客戶認(rèn)可。”
隨著數(shù)據(jù)量的大幅增加,數(shù)據(jù)和文檔的存儲(chǔ)和應(yīng)用已成為業(yè)內(nèi)共同需要面對的問題。據(jù)估計(jì),我國每天可產(chǎn)生2.5萬億字節(jié)的數(shù)據(jù),以神經(jīng)元計(jì)算,相當(dāng)于2.5億個(gè)人類大腦的海量數(shù)據(jù)。這些數(shù)據(jù)、文檔又該如何被有效應(yīng)用?
面對如此龐大的數(shù)據(jù)體、知識體,人工智能的云化之路似乎已成定局。
根據(jù)市場研究機(jī)構(gòu)IDC的數(shù)據(jù)顯示,2020年全球AI硬件、軟件和服務(wù)產(chǎn)生的收入已達(dá)到1565億美元,比2019年增長12.3%。相關(guān)專家預(yù)測,在未來11年,人工智能將為全球創(chuàng)造15.7萬億美元的凈增量GDP。
其中,AI“語言”雖然得到了長足發(fā)展,但人類語言仍是一項(xiàng)獨(dú)特且深邃的難題,亦是AI技術(shù)所面對的最為艱巨的挑戰(zhàn)之一。簡仁賢就表示,“這是一個(gè)不斷打磨沉淀的過程,不可能一蹴而就。”
如果說,云是未來的“土地”,大數(shù)據(jù)是“樹木”,人工智能是樹木腐化后變成的“石油”。那么,可挖掘“石油”的“NLP泵”什么時(shí)候才能盡善盡美呢?相信竹間智能值得期待!
文:達(dá)尼亞 / 數(shù)據(jù)猿
●上一篇精彩好文:
阿里云數(shù)據(jù)中臺(tái)新添產(chǎn)品大將 DataTrust專注數(shù)據(jù)安全保護(hù)
聯(lián)系數(shù)據(jù)猿
北京區(qū)負(fù)責(zé)人:Summer
電話:18500447861(微信)