“未來,所有的計算都將是隱私計算。”
——“安全計算教母”宋曉冬
隱私計算對未來中國新興科技產業發展到底有多重要?在回答這個問題之前,我們先來看看隱私計算在香港的落地案例。
香港科技園具有一個以隱私計算技術為核心的“AI驗證平臺”,現在已經成為多個香港政府機關和企業正在使用的公共SaaS服務。基于該平臺可以在確保數據隱私安全受保護的前提下進行AI能力的驗證。在一些招投標場景或是AI大賽中,想要遴選出更優秀的AI,通常的做法是要求各AI提供方描述算法原理,或者視頻展示,而無法量化地驗證各AI提供方技術上的優劣。
通過AI驗證平臺,建立數據使用黑箱機制,數據經授權使用,通過智能算法進行計算,既保護AI模型IP,同時保護招標方或大賽數據方提供的數據隱私安全,能夠讓AI提供方使用更貼近真實場景的數據而非傳統刪減式的脫敏數據,對模型進行訓練和測試,真正做到公平公正且有效的AI能力驗證。
該平臺由國內隱私計算企業“翼方健數”負責承建。翼方健數首席科學家張霖濤介紹到,在香港的一個招標案例中,AI驗證平臺把真實數據與參與投標供應商的算法模型同時在平臺中進行驗證,招標方和供應商都只能看到最終的驗證結果,同時又不能盜取原始數據或算法模型。由于使用了隱私計算,招標方才能夠直接提供真實數據,而不是有可能導致最終結果可能會因此出現誤差的虛擬或脫敏數據進行模型驗證;而AI供應商也在隱私計算的支撐下,無所保留地拿出了自己的AI模型進行投標。
在諸如翼方健數的隱私計算企業的支持下,越來越多的場景突破了原本的瓶頸,據了解,上述模式是翼方健數眾多場景中的一個突破。數據一旦開始有機會通過隱私計算技術實現流動共享,無需分享原始數據就能釋放數據的價值,就能實現數據持有方、數據需求方和數據服務方的多方共贏,推動行業和大數據領域的發展。
#1
SaaS服務的數據安全“考核”
數據是數字經濟時代的核心生產要素,也是社會發展新的生產資料,數據的應用伴隨數字化工具以云的方式降臨在個人、組織中。
企業早已通過引入各類SaaS產品、AI服務結合包含自身在內的多源數據進行數智化賦能和優化。例如電商平臺基于歷史交易數據加以AI能力可以進行銷量預測;消費品企業通過自身沉淀的第一方用戶行為數據以及第三方數據實現營銷自動化提升復購率等。
隨著人工智能的發展,專業化的智能SaaS服務也迅速成長起來。對于這些SaaS服務商而言,客戶往往有數據隱私安全方面的顧慮。“SaaS服務商是否有足夠的能力保護客戶及自身的數據資產安全?”過去一段時間,層出不窮的服務型企業數據泄漏事件甚至通過非法銷售個人數據獲利等事件,證明了這樣的擔心并非杞人憂天。
那么“計算安全”是否能實現這一點呢?
我們先來看什么是傳統意義上的“計算安全”,一般包含了網絡安全、數據安全和計算安全。網絡安全是大家熟悉的防火墻、安全傳輸協議等,確保數據傳輸環節安全。在具體的數據安全部分可以通過加密文件系統,或進行訪問控制。計算安全,例如進程之間的隔離,使用虛擬化或容器化方式實現。
但是這些方法并不能夠解決數據共享和隱私的問題。例如如何在相互不信任的多個計算環境中保證數據安全,授權,完整性,溯源和數據血緣等,保證數據可獲得,這是傳統技術無法解決的。
翼方健數面對這樣的挑戰,打造了全流程的系統安全保障,翼方健數自研的XFS(XDP File System)文件管理系統,從底層設計開始,提供跨機構,多管理域的安全存儲架構。在XFS中,數據全程加密,密鑰由數據所有者而不是系統管理員擁有,對使用場景授權,而不是對使用人員授權,從而保證數據在計算過程中的完整性,保證可溯源。其通過了來自園區千余家企業的數據安全和運行效率考核。
#2
SaaS服務的自循環智能進化,還欠一個安全有效的方法
數據指導業務這件事,早在ERP盛行的信息化時代就已經開始萌芽。而隨著數字化進程的加速,SaaS、AI產業的不斷發展完善,企業在從粗放轉向精細化運營時,更加劇了對數據價值的挖掘。
從效率的角度來看,目前企業在數字化系統建設時,優先考慮的是遴選市場中的成熟產品或解決方案,其次才是自建。這也是國內SaaS廠商與AI產業近幾年加速發展的原因。
但問題也隨之而來——AI升級,勢必需要投入大量并且高質量的數據供機器學習。那么,SaaS公司可以使用客戶的數據對產品進行AI能力的迭代升級嗎?
盡管第三方SaaS、AI或其他廠商大多會與企業明確數據權屬,但持有數據的企業依然不免擔憂數據安全等相關問題,畢竟這些數據要在廠商的系統里運行,或者直接從系統里產生。
尤其是在高新技術、生物醫療、政企合作等對數據安全性有更高要求的領域,服務于這些企業的AI需要數據進行升級,只有以數據為中心,以數據驅動的AI才能構建成功的AI系統實現生產力提升。
若是服務商將模型給到客戶,在客戶的環境進行訓練,或許能打消客戶對數據資產受到威脅的顧慮。但這又帶來了新的問題——服務商同樣擔憂自己的算法泄露乃至逆向分析。
隨著隱私計算技術的成熟,問題逐步有了轉機。隱私計算就是在保護數據安全的前提下,實現對數據的分析計算,達到對數據“可用不可見”的一種技術。更廣義一點講,隱私計算就是能讓相互不完全信任的實體之間進行數據和算法協作的一系列技術手段。
在這個場景來說,隱私計算就像是一個能夠讓數據和算法在其中正常運轉的“黑盒子”。
而前文提到的SaaS產業。國內SaaS產業之所以能夠快速發展,或多或少與數據的“越權使用”有關。像智能客服或語音外呼等系統,這類SaaS產品中的數據,所有權無疑都屬于企業客戶,SaaS產品本身不應該產生或未經授權使用企業相關的銷售線索、會員信息或者公司員工信息等數據。
一個顯而易見的情況是,SaaS服務商需要依靠這些數據來進行產品優化或模型訓練等相關工作,用來進一步提升自身的產品競爭力、指導自身的業務決策。近年來隨著法律法規的完善,對通過數據獲利(例如兜售數據)實行了更為嚴厲的查處,其發生頻次也大幅降低。盡管SaaS廠商會與客戶企業明確數據使用邊界,但過程中依然不免存在數據安全方面的隱患。
這一問題在軟件本地化部署的信息化時代并不明顯,但隨著云計算SaaS模式的流行,問題與矛盾越發突出。
拿當下最火爆的私域流量運營舉例,企業用戶希望把自己客戶的社會屬性、商業行為行為數據加以利用,來提升經營效果,而這個數據分散在企業若干的SaaS(或非SaaS)的業務系統中,數據應用的問題隨之而來。
1、數據治理問題:數據的治理由誰來做?客戶自己還是SaaS廠商?數據的歸口和標準由誰來制定?
2、數據權屬問題:企業想要達到目的,必須要更高效、更合理的應用數據,但數據的應用需要SaaS業務系統的支持,這個數據應不應該開放給SaaS廠商?
3、數據應用條件:根據不同業務、產品特征,SaaS廠商的業務模型需要快速迭代來適配企業需求,迭代方向需要數據的指引,但這個數據是企業所有,SaaS廠商要提供更先進的業務支持,該如何與企業達成數據應用的條件?數據在SaaS廠商和企業之間該如何傳遞?
4、數據應用方式:SaaS廠商與企業之間的數據關系從管理到應用,要做哪些合法、合規的準備?用什么技術或方案?
這些痛點,已經是橫亙在SaaS廠商與企業之間含糊而曖昧的裂痕。而隱私計算成了彌合SaaS產業中數據持有方和數據使用方兩端需求的最佳方案。
通過隱私計算,SaaS廠商可以在不碰數據的情況下,利用數據進行相關的計算處理,在充分保護數據和隱私安全的前提下,實現數據價值的轉化和釋放。
隱私計算可以把數據的所有權和使用權分開,通過黑盒機制,令企業只與SaaS廠商共享數據的使用權,SaaS廠商無法明文查看,但卻可以使用數據產出計算結果,為企業制定更靈活的流量運營策略;改進更符合企業業務特征的SaaS產品。
雖然當下,數據安全的信任為題仍具有一定的爭議。但可以預見的是,即使數據安全問題依舊是一把“達摩克里斯之劍”,也無法阻止SaaS與AI產業勢如破竹的發展,隱私計算技術所能帶來安全性、高效率、低成本等巨大價值,值得成為未來數字化廠商們重點關注方向。
#3
網絡化是必然趨勢,隱私計算能否為AI、SaaS帶來顛覆性變革
除了現有企業數據能夠被安全可控地使用起來,隱私計算是否能夠幫助SaaS和AI產業匯聚大量且高質的數據呢?答案是肯定的。
隱私計算通過“數據可用不可見”的能力,在保護數據隱私安全的前提下,匯聚并實現數據共享使用,從而更好地發揮出數據在人工智能領域發展過程中的支撐性作用。通過構建數據網絡,幫助數據在可管控、可度量且受隱私安全保護的前提下為SaaS和AI產業的發展提供數據上的助力。
不僅僅來自于產業對數據的訴求,張霖濤表示,數據價值的需求方希望嘗試不同算法在數據上抽取模型或獲得預測結果;需要利用多種計算資源降低成本,提高生產力;廠商需要將從數據中得到的洞察提供給更多的應用,服務更多客戶;由于對數據及算法合作方的不信任,對原始數據和客戶隱私的保護訴求,合作開展需要更多約束和條件。數據利用的難度與價值都在同步地提升,將被迫持續引入第三方乃至多方。在與日俱增的需求和要求的推進下,IT架構愈加復雜化,網絡化也是必然趨勢,新的局面將催生“數據和計算互聯網”,翼方健數始終致力于成為數據和計算互聯網的先行者和運營商。在這個龐大、復雜的網絡結構里,SaaS產業和人工智能,無疑是數據價值流通的直接受益方。
不只是SaaS和AI產業,在垂直領域中,我們也看到了行業對隱私計算能力的認可。去年11月,由翼方健數召開的首屆DataX大會上,在其圓桌論壇部分,共計來自醫療、科學、生物信息、云計算、營銷、國企、高校等不同領域的專家都認為,在未來10年隱私計算100%在其所在行業會被采用,并且未來10年里,全世界的計算里有百分之多少會采用安全計算形式。其回答的平均值高達82%。行業甲方的認可,勢必也會影響到乙方的技術選型和合作。對此,張霖濤回應到,事實上我們正在與一些SaaS和AI服務商進行相關合作,并且獲得了來自客戶的甲方對此的肯定和贊許。
自2020年以來,由于隱私計算在數據安全等方面的重要作用,使得隱私計算在如今數字化逐步邁入深水區的過程中開始越發受到重視,而這正是翼方健數等隱私計算企業快速增長的原因。
據悉,翼方健數2021年的各項業績相比2020年均實現強勢增長,包括營收增長7倍,客戶數量增長3倍,員工人數也實現翻番。隨著IoDC在全球各地部署,數據和計算互聯網的雛形已經初步形成。
翼方健數的爆發,其實正是隱私計算行業正在繁榮的一個縮影。據KPMG的預測,我國隱私計算系統的銷售和服務收入規模在3年之內有望觸達100~200億的市場空間。拉動隱私計算行業增長的,是來自亟需被喚醒的AI的心聲;其背后支撐著的,是將在3年內產生超過全球1/4數據量的數字浪潮。
“在深度解鎖數據價值的過程中,隱私計算必不可少。面對未來爆發式增長的需求,我們認為,未來所有的計算都是隱私安全的計算。作為數據和計算互聯網的運營商和推動者,翼方健數將與各行業一起,推進數據的安全流通,幫助各行各業早日達成人工智能的'數據自由'。”張霖濤說。
關于翼方健數
翼方健數(BaseBit.ai)是“數據和計算互聯網(IoDC ,Internet of Data and Computing)”的先行者,是一家專注大數據、人工智能和隱私安全計算的高科技公司,有“隱私計算四小龍”之稱。翼方健數總部位于上海,在北京、廈門、深圳、香港、宜昌、成都、杭州、海南等地都設有辦事處。
翼方健數(BaseBit.ai)旨在通過核心技術“隱私安全計算”,實現數據可用不可見,不分享原始數據,輸出數據價值,打造數據生態,搭建數據要素與數據價值間的橋梁。降低數據利用門檻,推動智能化應用的進步。以隱私安全計算為根,為政務、醫療、科學、金融、營銷等行業的數據資產提供安全計算和應用開放賦能,解決方案覆蓋區域大數據應用開放平臺、科研平臺、生信分析平臺、輔助決策、電子病歷質量控制等。相關產品解決方案已應用在首批國家健康醫療大數據試點城市廈門、宜昌、健康醫療大數據國家研究院、香港科技園、國內著名三甲醫院等。
翼方健數是中國通信標準化協會大數據技術標準推進委員會全權成員單位,已參與多項隱私計算國家標準制定。翼方健數成為在工業化和信息化部相關司局的指導和支持下,由中國信息通訊研究院牽頭成立的“隱私計算聯盟”初創成員。是中國信通院“醫療科技安全實驗室”成員單位,提案并起草2021年醫療健康數據流通標準。
商務合作:contact@basebit.ai