精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
【人工智能】深度學習、數據庫選擇和人工智能的革命;人工智能是解鎖IoT潛力的鑰匙

深度學習(DL)和人工智能(AI)已經不再是科幻小說中遙不可及的目標,目前已成為了互聯網和大數據等領域的前沿研究內容。

由于云計算提供強的計算能力、提出的先進算法以及充裕的資金,這創(chuàng)造了五年前難以想象的新技術。此外,層出不窮的豐富數據也使得深度學習成為了現實。

相關內容分成四個部分,主要深入探索深度學習、數據庫的選擇以及相關實際商業(yè)應用問題等。

  • 在今天的第I部分內容中,主要是講解人工智能的歷史以及它現在高速發(fā)展的原因;

  • 在第II部分內容中,將討論一下人工智能、機器學習和深度學習之間的區(qū)別;

  • 在第III部分內容中,將深入研究深度學習以及在為新項目選擇數據庫時需要評估的關鍵事項;

  • 在第IV部分內容中,將討論深度學習為何使用MongoDB,并提供相關使用實例;

第I部分

人工智能的歷史

我們目前生活在人工智能開始嶄露頭角的時代,人工智能不僅創(chuàng)造了擾亂工業(yè)和變革工作場所的可能性,而且還可以解決一些社會上的挑戰(zhàn)。比如自動駕駛可以挽救數萬人的生命、增加老年人和殘疾人的流動性,精準醫(yī)學可以開展個體化治療以延長生命,智能建筑有助于減少碳排放并節(jié)約能源等,這些只是人工智能承諾的一些潛在的好處,并且大多已經取得相關突破性的進展。

到2018年,Gartner公司估計機器將占全球所有業(yè)務內容的20%,并預計60億個聯網設備將產生大量的數據。人工智能對理解這一切顯得至關重要,AI不再局限于科幻電影中,人工智能和機器學習正在被現實世界中的相關業(yè)務采用。

自從艾倫·圖靈(Alan Turing)于1950年寫了篇論文《計算機器與智能》以來,人工智能一直是人們的一個夢想。在這篇論文中,圖靈提出了一個根本性的問題——“機器能思考嗎?”,并考慮計算機是否能像人類那樣進行思考。人工智能領域的研究真正誕生于1956年的夏天,一組聚集在達特茅斯學院(Dartmouth College)的研究人員發(fā)起了一系列的研究項目,他們的目標是讓計算機做出像人類一樣行為。“人工智能”這一詞也是第一次在這所學院被創(chuàng)造出來,該會議的概念形成了一個合法的跨學科交流的研究領域。

在接下來的十年中,隨著新技術的發(fā)展受到當代技術的限制,人工智能的發(fā)展經歷了繁榮和蕭條周期。在1968年,科幻電影《2001:太空漫游》中的智能電腦——HAL9000說了一句著名的話,“對不起,戴夫,恐怕我不能那么做”,這幫助AI在主流意識中留下了不可磨滅的印象。在20世紀70年代末,電影《星球大戰(zhàn)》中智能機器人幫助拯救銀河的場景進一步鞏固了AI在主流文化中的地位。

但直到20世紀90年代末,人工智能才開始從科幻傳說轉變?yōu)楝F實世界中的實際應用。1997年初,由IBM的深藍國際象棋程序擊敗了當時的世界冠軍Garry Kasparov,人工智能在上世界90年代迎來了一個新的時代,AI的研究進展也開始加速。研究人員變得開始關注人工智能的相關子問題,并利用它來解決現實世界中的應用任務,比如圖像和語音識別等。研究人員沒有試圖構造由專家知識決定的邏輯規(guī)則,而是開始研究如何通過算法學習邏輯規(guī)則本身,這一趨勢有助于將研究重點轉移到人工神經網絡(ANNs)中。

在20世紀40年代,人工神經網絡被發(fā)明成“松散地”模仿人腦的學習方式。當反向傳播梯度下降算法得到改進時,人工神經網絡的研究于1986年開始變得流行起來,反向傳播算法減少了人工神經網絡訓練時需要大量手工調參問題,因此反向傳播算法(BP)也是一種有效的減少人工智能訓練時間的方法。

即使在算法方面取得新的進展,但神經網絡仍然受到技術上的限制,這些限制也影響了ANNs在過去幾十年的應用情況。直到2000年中期,人工智能才重新掀起一次科技浪潮。在2006年,多倫多大學的Geoffrey Hinton提出對人工神經網絡進行修改,并將其研究成果稱為“深度學習(Deep Neural Network)”。Hinton對人工神經網絡添加多個隱藏層并對每層進行數學優(yōu)化,逐層學習使得模型訓練變得更快。在2012年,斯坦福大學的Andrew Ng進一步推動了深度學習的發(fā)展,他建造了一個簡陋的利用圖形處理單元(GPU)實現深度神經網絡的模型,Andrew Ng發(fā)現集群GPU仿真訓練深度學習模型比通用的CPU訓練快得多,對于同樣的任務而言,GPU可能只需要一天的時間,而CPU需要幾周的時間才能產生相同的結果,這是由于GPU是大規(guī)模并行架構,而且能同時處理多個任務。

從本質上講,將軟件算法與高性能的硬件相結合已經醞釀了幾十年,這也將迎來AI正在經歷的快速發(fā)展。

人工智能現在為什么高速發(fā)展?

目前有四個主要因素推動了人工智能的發(fā)展:

1.更豐富的數據。人工智能需要大量的數據來學習,社交的數字化為其進步提供了可利用的原材料。諸如物聯網(傳感器等)、社交和移動計算、科學和學術界、醫(yī)療保健以及許多新的應用程序等來源的大數據可以用來訓練人工智能模型。不出意料,目前在人工智能領域投資較多的公司,比如亞馬遜、蘋果、百度、谷歌、微軟等,同時也是數據較多的公司。

2.更便宜的計算成本。在過去,即使人工智能相關算法得到改進,硬件仍然是一個制約因素。由于硬件和新的計算模型取得新的突破,尤其是GPU,加速了人工智能的發(fā)展過程。GPU由于其自身的并行處理能力及高效的執(zhí)行矩陣乘法的方式使得其在人工智能社區(qū)得到普及應用,這也締造了英偉達這一優(yōu)秀公司的行業(yè)地位。 最近,英特爾在Xeon和Xeon Phi處理器中增加了新的深度學習指令,這允許其能更好地進行并行和高效的矩陣運算。隨著人工智能技術的應用,硬件廠商現在需要專門針對人工智能進行開發(fā)、設計和制造相關產品,這些進步將導致更好的硬件設計、性能、功耗以及配置文件。

3.更復雜的算法。更高效的性能和更便宜的計算花費使得科研人員能夠開發(fā)和訓練更高級的算法,這是因為他們不再受限于過去硬件約束的限制。因此,深度學習現在正以驚人的精確度解決特定的問題(例如,語音識別、圖像分類、手寫識別、欺詐檢測等),更先進的算法繼續(xù)推動人工智能技術的發(fā)展。

4.更廣泛的投資。在過去的幾十年中,人工智能的研究和發(fā)展主要局限于大學和研究院等機構。資金缺乏以及人工智能問題的困難性導致其發(fā)展甚微。如今,人工智能投資不再局限于大學實驗室,而是在許多領域都在進行發(fā)展——政府、風險資本支持的初創(chuàng)公司、互聯網巨頭和各行業(yè)的大型企業(yè)等。

第II部分

人工智能、機器學習和深度學習之間的區(qū)別

在很多情況下,人工智能、機器學習和深度學習可以互換使用。但實際上,機器學習和深度學習都是人工智能的子集。人工智能作為計算機科學研究領域中的一個分支,其重點是建立能夠具有智能行為的機器,而機器學習和深度學習則是利用算法篩選數據,并從數據中學習、預測或采取自主行動的實踐。因此,這些算法不需要根據特定的約束進行編程,而是使用大量數據進行訓練,使其能夠獨立學習、推理和執(zhí)行特定的任務。

那么,機器學習和深度學習之間存在哪些區(qū)別呢?在定義深度學習之前,先深入地理解機器學習吧。

機器學習:有監(jiān)督VS.無監(jiān)督

機器學習方法主要分成兩大類:有監(jiān)督學習和無監(jiān)督學習。

有監(jiān)督學習:目前,有監(jiān)督學習是機器學習中最為常用的算法。在有監(jiān)督學習的情況下,相關算法的輸入是開發(fā)人員和分析人員手動標記的數據,即有標記的數據,這些標記就是數據的期望輸出值,使用這些數據來訓練模型并生成預測。監(jiān)督學習任務又可以分為兩大類:回歸和分類問題。

上圖演示了一個簡單的回歸問題。從圖中可以看到,存在兩個輸入或特征(平方英尺和價格),被用于生成擬合曲線,并預測未來的房地產價格。這個模型相當簡單,只考慮了房子的面積這一個特征對房價的影響,在國內的話,如果只考慮這房子面積這一個特征就去購買或投資房產的話,將會鬧出笑話。因此,一般而言,考慮的特征越多,模型會越復雜,預測也會更加準確。

上圖演示了一個有監(jiān)督分類問題。使用的數據集是有標記為良性腫瘤和惡性腫瘤的乳腺癌患者。有監(jiān)督分類算法試圖通過將數據擬合成直線將腫瘤劃分為兩種不同的類別。當算法學習好后,即劃分直線確定,將來的數據可以之間通過這條劃分直線來確定患者的腫瘤是良性或惡性。分類問題導致離散輸出,但不一定限制固定數據集的輸出數量,上圖中只有兩個離散輸出,但可以有更多分類類別(1表示良性,2表示惡性,3表示待定等)。

無監(jiān)督學習。在有監(jiān)督學習的示例中,可以看到使用的數據集都具有標記(良性或惡性分類),數據標記有助于算法確定正確的答案是什么,進而調整模型參數以使得模型輸出盡可能與標記相近。而在無監(jiān)督學習中,數據集是不具有標記的,需要依賴于算法來發(fā)現數據中的結構和模型。

從上圖中可以看到,每個數據點代表的信息不明確,因此要求算法在不受任何監(jiān)督的情況下查找數據中存在的結構信息。圖中的無監(jiān)督學習算法可以確定兩個不同的集群,并在集群之間進行直線分類。無監(jiān)督學習廣泛應用于新聞、社會網絡分析、市場分割及銀河系周圍的天文分析等許多應用案例中。

第III部分

深度學習是什么?

深度學習是機器學習研究領域中的一個分支,近年來在圖像識別、自然語言處理和圖像分類等領域應用十分火熱,受到世界范圍內的廣泛關注。深度學習是人工神經網絡(ANN)的一種改進,正如人工神經網絡一樣,是模擬人類大腦學習和解決問題的一種方法。

在深入了解深度學習的工作原理前,首先理解人工神經網絡(ANN)是如何工作的。人工神經網絡是由一組互相連接的神經元組成,類似于人類大腦中的神經元網絡。

上圖是一個簡化的神經元連接示意圖。神經網絡中的每個神經元接收與之連接的其它神經元的輸入信息(Xi),然后通過計算后輸出到網絡中的其它神經元或節(jié)點。神經元之間的連接參數用權重(Wj)表示,權重的大小表示二者連接的強度,權重的值可正可負。將所有的輸入信息都與對應的連接權重相乘(X1W1,X2W2等)并進行求和作為該節(jié)點的輸出。最后一步是對神經元執(zhí)行計算或激活函數處理。激活函數允許人工神經網絡模擬簡單模式無法正確表示的復雜的非線性問題,常用的激活函數是Sigmoid函數。

上圖表示一個三層的神經網絡,從左往右第一層為輸入層,輸入對應的特征(X1,X2,X3),第二層被稱作隱藏層,隱藏層可以有多層,第三層是輸出層。對于一個層而言,只要該層不是輸入層或輸出層,那么該層就可以稱作隱藏層。

“深度”學習最初就是這樣產生的,因為其含有多個隱藏層,通常包含多于3個的隱藏層。在一些情況下,隱藏層的個數高達1200多個。

多個隱藏層的好處是什么呢?在某些模式下,可能需要更加深入的調查,因此多個隱藏層可以進行額外的特征處理。深度學習在圖像分類領域中表現優(yōu)異,甚至在某些特定任務上超過了人類的表現。現在,通過一個額外隱藏層有助于面部識別的例子來說明這一點。

當一張圖片被輸入到一個深層次的學習網絡中時,它首先被分解成圖像像素。然后該算法將在圖像中的某些位置尋找特定形狀的圖案。第一個隱藏層可能試圖揭示特定的面部模式:眼睛、嘴巴、鼻子、耳朵等。添加一個額外的隱藏層來解析更加細粒度的屬性。例如,“嘴巴”可以進一步分解為“牙齒”、“嘴唇”、“牙齦”等。添加額外的隱藏層可以將這些模式更進一步抽象。最終的結果是一個深層的學習網絡可以將一個非常復雜的問題分解成一系列簡單的問題。隱藏層的本質是一個層次化的特征學習,它們能夠更好地提取特征。目前,大多數深度學習算法都是有監(jiān)督學習,即對已知的標記數據進行深度學習。

訓練是如何工作的?

訓練深度學習的最終目的是降低代價函數,即期望輸出與實際輸出之間的差異盡可能小。節(jié)點之間的連接將會有特定的權重,不斷修改這些權重參數使得網絡的代價函數變小。通過修改權重值,可以將代價函數最小化到全局最小值,這意味著模型的誤差降到最小值。深度學習之所以計算如此密集就是因為它需要找到合適的數以十億的連接權重值,這需要通過不斷迭代訓練調整得到,以找到使得代價函數全局最小值的權重集。

深度學習中最為常用的訓練方法是反向傳播梯度下降算法。梯度下降算法是一種有效的數學優(yōu)化方法,它能有效地處理大量的數據(特征),而不必強力進行維度分析。梯度下降算法根據權重函數的全局最小值來計算梯度(斜率)。

在訓練過程中,首先隨機分配權重并計算出一個誤差。然后基于這個誤差,通過使用梯度下降算法來修改權重,之后反向逐層調整每層的權重參數,當調整完每層參數后又正向進行傳播,計算得到一個新的誤差,之后基于新的誤差調整每層的參數,一直迭代到代價函數達到全局最小值為止。可能會出現一些例子,梯度下降算法是以局部最小值而不是全局最小值來計算的,減輕這個問題的方法是使用凸的代價函數或對參數產生更多的隨機性。

深度學習中對數據庫的思考

非關系數據庫在促進機器學習和深度學習技術的最新進展中起著不可或缺的作用。收集和存儲大量結構化和非結構化的數據的能力為提升深度學習預測提供的必要的原材料。在構建深度學習應用程序時,選擇用于管理底層數據的數據庫時要牢記一些注意事項。

  • 靈活的數據模型。在深度學習中,數據需要經歷三個階段——輸入數據、訓練數據和結果數據。深度學習是一個動態(tài)的過程,通常涉及大量的實驗,比如,實驗過程中參數調整是很正常的事情,加上非結構化數據的輸入、輸出結果的修改是自然而然地發(fā)生。隨著新的信息和見解被發(fā)現,重要的是在靈活數據模型上選擇一個合適的數據庫,避免在數據結構需要改變時需要執(zhí)行昂貴的模式遷移。

  • 規(guī)模。深度學習面臨的最大挑戰(zhàn)之一是模型訓練耗費的時間比較長,有些模型可能需要幾個星期的訓練時間,這是由于梯度下降等算法需要通過多次迭代來調整模型的數十億個參數。為了減少訓練次數,深度學習框架嘗試并行運算,將訓練負荷分布到多個高性能的服務器上。

并行化訓練主要有兩種方式:數據并行性和模型并行性。

  • 數據并行性。通過分布式系統(tǒng)將數據分割成多個節(jié)點進行處理并存儲,比如Apache Spark、MongoDB和Apache Hadoop。

  • 模型并行性。通過相關軟件庫和框架在多個節(jié)點上分割模型及其相關層,如TensorFlow、Caffe和Theano。分裂提供并行性,但是在協調不同節(jié)點之間的輸出時會產生性能代價。

除了模型訓練階段耗費時間長外,深度學習的另一個大挑戰(zhàn)是輸入數據集不斷增長,這增加了訓練參數的數量。這不僅意味著輸入數據集可能超過可用的服務器內存,而且還意味著涉及梯度下降的矩陣也能超過節(jié)點的內存。因此,縮放比擴展更加重要,這使得工作負載和相關的數據集在多個節(jié)點上分布,允許并行執(zhí)行計算。

  • 容錯。許多深度學習算法使用檢驗點作為故障發(fā)生時恢復訓練數據的一種方法。然而,頻繁設置的檢查點需要大量的系統(tǒng)開銷。另一種方法是利用駐留在分割節(jié)點上的多個數據副本,這些副本提供冗余和數據可用性,而無需消耗系統(tǒng)主節(jié)點上的資源。

  • 一致性。對于大多數深度學習算法而言,建議使用強數據一致性模型,具有強一致性的分布式數據庫集群中每個節(jié)點都運行在最新的數據副本上。雖然有些算法可以容忍一定程度的不一致性,比如隨機梯度下降算法(SGD),但強一致性能夠提供最精確的結果。然而,在某些情況下,算法更加看重訓練時間而不是精度,那么最終的一致性是可以接受的。為了優(yōu)化精度和性能,數據庫應該提供可調的一致性。

第IV部分

為什么MongoDB適合深度學習?

如果你沒有閱讀第III部分的內容,強力推薦閱讀一下,以更多地了解在做深度學習項目時選擇數據庫應該考慮的關鍵因素有哪些。在以下的講解部分中,開發(fā)者和數據科學家可以利用MongoDB作為一個靈活、可擴展、高性能的分布式數據庫來滿足人工智能應用開發(fā)的嚴峻考驗。

  • 靈活的數據模型

MongoDB的文檔數據模型,便于開發(fā)者和數據科學家存儲和結合其他任何數據庫的數據,且沒有放棄利用復雜的驗證規(guī)則來管理數據的質量。該模式可以在不停用應用程序或數據庫的情況下動態(tài)地修改數據,這是由關系數據庫系統(tǒng)的模式修改或重新設計的代價高所引起的。

這種數據模型的靈活性對于深度學習是特別有價值的,這需要不斷的實驗來發(fā)現新的見解和預測:

  • 輸入數據集可以包括快速變化的結構化數據和非結構化數據,這些數據集可以從點擊流、日志文件、社交網絡和物聯網傳感器流、CSV文件、txt文本、圖像、視頻等,這些數據集很多都不能映射成關系數據庫固定的行和列格式。

  • 深度學習的訓練過程中往往會增加新的隱藏層、特征標簽、參數以及輸入數據,這需要頻繁地修改底層數據模型。

  • 因此,一個支持各種輸入數據集的數據庫能夠無縫地修改模型訓練的參數,這對于深度學習而言是不可多得的。

  • 豐富的編程和查詢模型

MongoDB為開發(fā)者和數據科學家提供本地驅動程序和認證連接來建立深度學習模型,PyMongo驅動器是一個用于MongoDB的Python工具,也是一個被推薦的Python操作MongoDB數據庫的方式。社區(qū)也開發(fā)了R語言的MongoDB客戶端,這也可用于R語言程序員。

MongoDB的查詢語句和豐富的二級索引使得開發(fā)人員能夠開發(fā)應用程序,可以以多種方式查詢和數據分析。數據可以在毫秒級的響應時間內通過單鍵、范圍、文本搜索、圖表和地理空間查詢到復雜的聚合和MapReduce任務。

為了在分布式數據庫集群上并行處理數據,MongoDB提供了聚合管道(aggregation pipeline)和MapReduce。MongoDB聚合管道是仿照數據處理管道的基本原理設計,數據經過一個一個的階段,每階段將數據處理后的結果傳遞給下一個階段,最終得到多重處理后的結果。其中,最基本的管道階段提供像查詢等操作的過濾器及輸出文檔格式的轉換等功能,其它管道操作提供按特定字段對文檔進行分組、排序以及聚合數組中的內容等功能。此外,管道階段可以使用操作符進行相關計算,比如計算跨文檔集合的平均值或標準差等。MongoDB同樣也提供了原生MapReduce操作,使用JavaScript函數來執(zhí)行相關的map和reduce階段。

除了原生的查詢框架外,MongoDB同樣也提供了針對Apache Spark的一種高性能連接器,該連接器連接了Spark所有的庫,包括Python、R、Scala和Java。對于機器學習、圖表以及SQL API等分析而言,MongoDB數據可以作為其數據幀和數據集。

針對于Apache Spark的MongoDB連接器可以利用好MongoDB的聚合管道以及提取、篩選和處理其所需數據范圍的二級索引。比如,分析特定地理位置的所有客戶這一任務,簡單的非關系數據存儲不支持二級或在數據庫中聚合。而在這種情況下,Spark需要基于簡單的主鍵提取所有數據,這意味著數據科學家和工程師們在進行該過程時需要更多的時間上和硬件上的開銷。為了最大限度地提高性能,對于分布式數據集而言,MongoDB連接器可以將彈性分布數據集(RDDs)和源MongoDB節(jié)點同地協作,進而最小化跨集群之間的數據移動并減少延遲。

  • 可升縮性和冗余性

模型的訓練時間可以通過建立一個深度學習平臺以及可擴展數據庫層來減少,MongoDB提供了以下一些措施來盡可能地增大吞吐量以及盡可能地減少深度學習工作負載的延遲。

WiredTiger是MongoDB的默認存儲引擎,也是世界上部署最廣泛的嵌入式數據管理軟件,它是基于現代多核架構,并使用了多種編程技術,如風險指針、無鎖算法、快速鎖定和消息傳遞等。WiredTiger盡可能地增大每個CPU核和時鐘周期內的計算工作量,此外,WiredTiger使用緊湊的文件格式和壓縮存儲盡可能地減少磁盤開銷。

對于大多數對延遲敏感的深度學習應用而言,MongoDB可以配置存儲引擎。基于WiredTiger這個存儲引擎,可以在不犧牲傳統(tǒng)數據庫提供的豐富靈活查詢、實時分析和可升縮能力的情況下,為用戶提供內存計算的好處。

為了并行地進行模型訓練以及縮放輸入數據集,MongoDB使用分片(sharding)技術。MongoDB分片是完全彈性地、自動地調整集群中的數據作為輸入數據集的增長,或者是添加和刪除節(jié)點。

在MongoDB集群中,每個分片數據自動分發(fā)到多個駐留在不同節(jié)點上的多個副本,其副本集提供冗余性以在訓練數據發(fā)生故障時恢復數據,并減少檢查點的開銷。

  • 可調一致性

在一般情況下,MongoDB具有強一致性。啟動深度學習應用程序可用立體讀取已寫入的數據庫中的內容,從而避免了最終一致性系統(tǒng)導致的開發(fā)人員復雜。強一致性會為機器學習算法提供最準確的結果,然而,在某些情況下,如隨機梯度下降算法(SGD),其結果不是很好但尚可接受。

MongoDB人工智能部署情況

基于MongoDB具備上述討論的性質,MongoDB已經作為許多人工智能和深度學習平臺的數據庫,不同應用程序和行業(yè)用戶的選擇如下:

  • IBM Watson:分析與可視化

沃森分析是IBM的云托管服務,提供智能數據發(fā)現來指導數據探索、自動預測分析和可視化輸出。沃森分析應用場景十分廣泛,比如銀行、保險、零售、電信、石油和政府應用等。MongoDB被用來管理數據存儲,提供所有源數據集的元數據和分析可視化,并存儲在豐富的JSON文檔結構中,可以支持數以萬計的用戶并發(fā)訪問服務。

  • x.ai:個人助理

x.ai是智能驅動的個人助理,它能夠為用戶安排會議。用戶將他們的日歷連接到x.ai上,然后只要郵件抄送給amy@x.ai,該公司的虛擬私人助理Amy就能接手你的會議日常安排。MongoDB作為x.ai的整個平臺記錄系統(tǒng),支持所有的服務,包括自然語言處理、有監(jiān)督學習、分析和電子郵件通信等。MongoDB靈活的數據模型成為使得x.ai迅速適應于訓練集和輸入數據集的關鍵,同時也支持復雜的數據結構。更多內容可以看此案例了解。

  • 汽車貿易商:預測價值

英國最大的汽車市場廣泛應用機器學習,使用的關于車的規(guī)格及細節(jié)數據都存儲在MongoDB中。比如,先前車主的個數、顏色、里程數、保險歷史等。這些數據由汽車貿易商的數據科學團隊編寫的機器學習算法提取得到,并建立模型以預測準確的價值,然后再寫入數據庫中,選擇MongoDB由于其靈活的數據模型和分布式設計。更多內容可以看此案例了解。

  • Mintigo:銷售和市場預測

Mintigo是一家以企業(yè)為重點的預測市場和銷售的平臺。在B2B營銷領域,Mintigo利用數據進行營銷分析和預測,識別最有可能購買其產品的潛在客戶,幫助公司客戶提升銷量。Mintigo運行在AWS上,是用Python編寫的機器學習算法。MongoDB被用來存儲TB量級的數據集,這是看中了其數據流采集和存儲的可擴展性和靈活性、高效的查詢框架和二級索引,而無需掃描數據庫中的所有記錄。更多內容可以看此案例了解。

  • 零售定位分析

一個美國的移動APP開發(fā)者在MongoDB上建立的智能引擎,實時處理和存儲數以百萬計顧客的豐富地理空間數據點。該智能引擎使用可伸縮的機器學習和多維分析技術來展示行為模式,允許零售商通過移動設備預測和定位目標客戶。MongoDB支持具有復雜索引和查詢的空間數據結構,為機器學習算法提供基礎。MongoDB的分片擴展設計使得公司可以容納10-100百萬的客戶數據點。

  • 自然語言處理(NLP)

一個北美的人工智能開發(fā)者已經構建了由主要消費電子產品嵌入到智能家居和移動設備中的自然語言處理軟件。設備和用戶之間的所有交互都存儲在MongoDB中,然后反饋給學習算法。選擇MongoDB的原因是其架構的靈活性,且支持快速變化的數據結構。

  • 將數據科學引入人才招聘

該公司與財富500強的人力資源部門合作,利用數據科學和員工情況處理成堆的簡歷和候選者。該公司通過將人工智能應用于簡歷以外的數據數千個信息源,包括公共的和企業(yè)數據,為申請者提供實時分析和優(yōu)先次序。通過人工智能算法產生的預測分析,招聘人員可以立即確定主動申請以及潛在的應聘者中最佳的候選人,加快整個招聘過程、降低雇傭成本。選擇MongoDB作為底層數據庫是由于其數據模型的靈活性和可伸縮性,此外,大范圍的安全管理權保護了個人可識別信息(PII)。


人工智能是解鎖IoT潛力的鑰匙

海外華文客戶端 

德勤報告表示物聯網變得更加智能。公司正在將人工智能(特別是機器學習)整合到他們的物聯網應用程序中,并觀察功能的增長,包括提高運營效率并幫助避免意外停機。關鍵:洞察數據。

ITH是一波投資,一系列新產品和企業(yè)部署的崛起,人工智能正在物聯網(IoT)中掀起一陣熱潮。制定物聯網戰(zhàn)略,評估潛在的新物聯網項目或試圖從現有物聯網部署中獲得更多價值的公司可能需要探索人工智能的作用。

信號

以人工智能為重點的物聯網創(chuàng)業(yè)公司的風險投資正在快速增長:2017年前8個月,這個類別的初創(chuàng)公司籌集了7.05億美元

以人工智能為重點的物聯網創(chuàng)業(yè)公司并購數量增加:2017年前8個月為21個,2016年為24個,高于2015年的11個

包括亞馬遜,通用電氣,IBM,微軟,甲骨文,PTC和Salesforce在內的IoT平臺供應商正在整合AI功能

跨行業(yè)的大型組織已經在利用物聯網來借助或探索人工智能的力量,提供新產品并更高效地運營

Gartner預測,到2022年,超過80%的企業(yè)物聯網項目將包含一個AI組件,今天只有10%

AI是解鎖物聯網潛力的鑰匙

人工智能在物聯網應用和部署中扮演著越來越重要的角色,這一領域的公司行為顯然發(fā)生了變化。使用AI的物聯網初創(chuàng)企業(yè)的風險投資大幅增加。在過去的兩年里,公司已經收購了數十家在人工智能和物聯網交叉點工作的公司。物聯網平臺軟件的主要供應商現在提供集成的AI功能,如基于機器學習的分析。

人工智能在物聯網中扮演著主要角色,因為它能夠快速從數據中獲取洞察力。機器學習是一項人工智能技術,它可以自動識別模式并檢測智能傳感器和設備生成的數據中的異常情況,諸如溫度,壓力,濕度,空氣質量,振動和聲音等信息。各公司發(fā)現機器學習可以比傳統(tǒng)的商業(yè)智能工具在分析物聯網數據方面具有顯著優(yōu)勢,包括能夠比基于閾值的監(jiān)控系統(tǒng)提前20倍和更高的準確度進行運營預測。而其他人工智能技術,如語音識別和計算機視覺可以幫助從過去需要人工評估的數據中獲得見解。

AI和物聯網技術的強大組合幫助公司避免意外停機,提高運營效率,啟用新產品和服務,并加強風險管理。

避免昂貴的非計劃停機時間

在一些行業(yè)中,設備故障導致的意外停機可能造成嚴重損失。例如,根據一項研究,海上石油和天然氣經營者每年平均損失3800萬美元。另一個消息估計,對于工業(yè)制造業(yè)來說,意外停機時間每年花費500億美元,設備故障導致42%的停機。

使用預測性維護分析功能提前預測設備故障,以便安排有序的維護程序,可以減少非計劃停機的破壞性經濟性。例如,在制造業(yè)中,德勤發(fā)現預測性維護可以將維護計劃縮短20-50%,將設備正常運行時間和可用性增加10-20%,并將整體維護成本降低5-10%。

由于人工智能技術,特別是機器學習,可以幫助識別模式和異常情況,并基于大量數據進行預測,因此它們在實施預測性維護方面尤其有用。例如,領先的韓國煉油商SK Innovation通過使用機器學習預測連接的壓縮機預計故障可節(jié)省“數十億韓元”。同樣,意大利列車運營商Trenitalia希望避免意外停機,并節(jié)省8-10%的年度維護成本13億歐元。與此同時,法國電力公司EDF集團已經通過機器學習驅動的設備故障預警節(jié)省了超過100萬美元。

提高運營效率

人工智能驅動的物聯網可以做的不僅僅是幫助避免意外停機。它還可以幫助提高運營效率。這部分得益于機器學習的力量,以產生快速、準確的預測和深刻見解,以及AI技術能夠使越來越多的任務自動化完成。

例如,對于Hershey來說,在生產過程中管理其產品的重量至關重要:重量精度每提高1%,就意味著可以為14,000加侖的Twizzlers等一批產品節(jié)省超過500,000美元的成本。該公司使用物聯網和機器學習來顯著是減少生產過程中的重量變化。第二個數據被捕獲和分析,重量變化可以通過機器學習模型進行預測,每天可以進行240個工藝調整,而安裝ML驅動的IoT解決方案前每天僅有12個。

基于人工智能的預測也有助于谷歌削減40%的數據中心冷卻成本。該解決方案通過對設施內傳感器數據進行培訓,預測下一小時的溫度和壓力,以指導限制功耗的操作。

機器學習產生了深刻的見解,說服一家船隊運營商采取反直覺行動,為他們節(jié)省了大筆資金。從船載傳感器收集的數據被用來識別清洗船體的成本和燃油效率之間的相關性。分析表明,通過每年清洗船體兩次而不是每兩年清潔船體(從而將清潔費用翻兩番),由于燃油效率更高,最終可節(jié)省40萬美元。

實現新的和改進的產品和服務

物聯網技術與人工智能相結合,可以為改進并最終實現全新的產品和服務奠定基礎。例如,對于通用電氣的無人機和基于機器人的工業(yè)檢測服務,公司希望AI能夠實現檢測設備的導航自動化,并從他們捕獲的數據中識別缺陷。這可能會導致更安全,更精確,并且為客戶提供便宜高達25%的檢查。在醫(yī)療保健方面,費城托馬斯杰佛遜大學醫(yī)院試圖通過自然語言處理改善患者體驗,使患者能夠控制房間環(huán)境并通過語音命令請求各種信息。

與此同時,勞斯萊斯計劃盡快推出具有物聯網功能的飛機發(fā)動機維護服務新產品。該公司計劃使用機器學習來幫助其發(fā)現模式并確定將出售給航空公司的運營見解。汽車制造商Navistar正在研究實時連接車輛數據的機器學習分析,以實現車輛健康診斷和預測性維護服務的新收入流。根據Navistar技術合作伙伴Cloudera的說法,這些服務幫助近30萬輛汽車減少了高達40%的停機時間。

加強風險管理

將物聯網與AI結合在一起的許多應用程序,正在幫助企業(yè)更好地理解和預測各種風險,以及自動執(zhí)行快速響應,使他們能夠更好地管理工作人員安全,財務損失和網絡威脅。

例如,富士通已經在使用機器學習技術來分析連接可穿戴設備的數據,以評估其工廠工人可能會在一段時間內積累的潛在熱應力。印度和北美的銀行已經開始對ATM機中聯網監(jiān)控攝像頭的可疑活動進行實時識別。汽車保險公司進步正利用機器學習對聯網汽車的數據進行分析,從而準確地為其基于美國的保費定價,從而更好地管理承保風險。拉斯維加斯已經轉向了一種機器學習解決方案,以確保其智能城市計劃的安全,旨在實時檢測和應對威脅。

對企業(yè)的影響

對于不同行業(yè)的企業(yè),人工智能有望提升物聯網部署所創(chuàng)造的價值,從而實現更好的產品和運營,從而在業(yè)務績效中發(fā)揮競爭優(yōu)勢。

考慮新的基于物聯網項目的高管們應該意識到,預測功能的機器學習現在已經與大多數橫向和工業(yè)物聯網平臺集成在一起,如微軟 Azure 物聯網,IBM 沃森物聯網T,亞馬遜AWS物聯網,通用電氣Predix和PTC ThingWorx。

越來越多的交鑰匙,捆綁或垂直物聯網解決方案利用機器學習等AI技術。例如,對于連接汽車的使用案例,寶馬的CarData平臺可以訪問車主分享的數據以及IBM 沃森物聯網的AI功能。在消費品和零售業(yè)中,一些補貨自動化和優(yōu)化解決方案使用機器學習來預測需求并優(yōu)化庫存水平。汽車保險行業(yè)的遠程信息處理解決方案提供商正在整合機器學習,以創(chuàng)建更準確的風險模型并預測索賠行為。

使用人工智能技術可能會從物聯網部署中獲得更多價值,而這些部署并非是在設計時考慮到使用人工智能而設計的。例如,一家匈牙利石油和天然氣公司將機器學習應用于柴油生產過程中已經收集到的傳感器數據。該分析使公司能夠更準確地預測燃料的硫含量,并幫助識別過程改進,現在每年為該公司節(jié)省超過600,000美元。主要的橫向和工業(yè)物聯網平臺 —— 企業(yè)可能已經在使用 —— 正在提供新的基于人工智能的功能,可能有助于提升現有部署的價值。

物聯網的未來就是AI

很快就很難找到一個不能使用AI的物聯網實現。國際數據公司IDC預測,到2019年,AI將支持“所有有效的”物聯網工作,如果沒有人工智能,部署的數據將具有“有限的價值”。越來越多的物聯網供應商提供至少基本的AI支持。各行業(yè)的先鋒公司已經在其物聯網部署中獲得了AI的好處。如果你的公司有實施基于物聯網的解決方案的計劃,那么這些計劃也應該包括人工智能。

人工智能賽博物理操作系統(tǒng)

AI-CPS OS

人工智能賽博物理操作系統(tǒng)新一代技術+商業(yè)操作系統(tǒng)“AI-CPS OS:云計算+大數據+物聯網+區(qū)塊鏈+人工智能)分支用來的今天,企業(yè)領導者必須了解如何將“技術”全面滲入整個公司、產品等“商業(yè)”場景中,利用AI-CPS OS形成數字化+智能化力量,實現行業(yè)的重新布局、企業(yè)的重新構建和自我的煥然新生。

AI-CPS OS的真正價值并不來自構成技術或功能,而是要以一種傳遞獨特競爭優(yōu)勢的方式將自動化+信息化、智造+產品+服務數據+分析一體化,這種整合方式能夠釋放新的業(yè)務和運營模式。如果不能實現跨功能的更大規(guī)模融合,沒有顛覆現狀的意愿,這些將不可能實現。

領導者無法依靠某種單一戰(zhàn)略方法來應對多維度的數字化變革。面對新一代技術+商業(yè)操作系統(tǒng)AI-CPS OS顛覆性的數字化+智能化力量,領導者必須在行業(yè)、企業(yè)與個人這三個層面都保持領先地位:

  1. 重新行業(yè)布局:你的世界觀要怎樣改變才算足夠?你必須對行業(yè)典范進行怎樣的反思?

  2. 重新構建企業(yè):你的企業(yè)需要做出什么樣的變化?你準備如何重新定義你的公司?

  3. 重新打造自己:你需要成為怎樣的人?要重塑自己并在數字化+智能化時代保有領先地位,你必須如何去做?

AI-CPS OS是數字化智能化創(chuàng)新平臺,設計思路是將大數據、物聯網、區(qū)塊鏈和人工智能等無縫整合在云端,可以幫助企業(yè)將創(chuàng)新成果融入自身業(yè)務體系,實現各個前沿技術在云端的優(yōu)勢協同。AI-CPS OS形成的字化+智能化力量與行業(yè)、企業(yè)及個人三個層面的交叉,形成了領導力模式,使數字化融入到領導者所在企業(yè)與領導方式的核心位置:

  1. 精細種力量能夠使人在更加真實、細致的層面觀察與感知現實世界和數字化世界正在發(fā)生的一切,進而理解和更加精細地進行產品個性化控制、微觀業(yè)務場景事件和結果控制。

  2. 智能:模型隨著時間(數據)的變化而變化,整個系統(tǒng)就具備了智能(自學習)的能力。

  3. 高效:企業(yè)需要建立實時或者準實時的數據采集傳輸、模型預測和響應決策能力,這樣智能就從批量性、階段性的行為變成一個可以實時觸達的行為。

  4. 不確定性:數字化變更顛覆和改變了領導者曾經仰仗的思維方式、結構和實踐經驗,其結果就是形成了復合不確定性這種顛覆性力量。主要的不確定性蘊含于三個領域:技術、文化、制度。

  5. 邊界模糊:數字世界與現實世界的不斷融合成CPS不僅讓人們所知行業(yè)的核心產品、經濟學定理和可能性都產生了變化,還模糊了不同行業(yè)間的界限。這種效應正在向生態(tài)系統(tǒng)、企業(yè)、客戶、產品快速蔓延。

AI-CPS OS形成的數字化+智能化力量通過三個方式激發(fā)經濟增長:

  1. 創(chuàng)造虛擬勞動力,承擔需要適應性和敏捷性的復雜任務,即“智能自動化”,以區(qū)別于傳統(tǒng)的自動化解決方案;

  2. 對現有勞動力和實物資產進行有利的補充和提升,提高資本效率

  3. 人工智能的普及,將推動多行業(yè)的相關創(chuàng)新,開辟嶄新的經濟增長空間

給決策制定者和商業(yè)領袖的建議:

  1. 超越自動化,開啟新創(chuàng)新模式:利用具有自主學習和自我控制能力的動態(tài)機器智能,為企業(yè)創(chuàng)造新商機;

  2. 迎接新一代信息技術,迎接人工智能:無縫整合人類智慧與機器智能,重新

    評估未來的知識和技能類型;

  3. 制定道德規(guī)范:切實為人工智能生態(tài)系統(tǒng)制定道德準則,并在智能機器的開

    發(fā)過程中確定更加明晰的標準和最佳實踐;

  4. 重視再分配效應:對人工智能可能帶來的沖擊做好準備,制定戰(zhàn)略幫助面臨

    較高失業(yè)風險的人群;

  5. 開發(fā)數字化+智能化企業(yè)所需新能力:員工團隊需要積極掌握判斷、溝通及想象力和創(chuàng)造力等人類所特有的重要能力。對于中國企業(yè)來說,創(chuàng)造兼具包容性和多樣性的文化也非常重要。

子曰:“君子和而不同,小人同而不和。”  《論語·子路》云計算、大數據、物聯網、區(qū)塊鏈和 人工智能,像君子一般融合,一起體現科技就是生產力。

如果說上一次哥倫布地理大發(fā)現,拓展的是人類的物理空間。那么這一次地理大發(fā)現,拓展的就是人們的數字空間。在數學空間,建立新的商業(yè)文明,從而發(fā)現新的創(chuàng)富模式,為人類社會帶來新的財富空間。云計算,大數據、物聯網和區(qū)塊鏈,是進入這個數字空間的船,而人工智能就是那船上的帆,哥倫布之帆!

新一代技術+商業(yè)的人工智能賽博物理操作系統(tǒng)AI-CPS OS作為新一輪產業(yè)變革的核心驅動力,將進一步釋放歷次科技革命和產業(yè)變革積蓄的巨大能量,并創(chuàng)造新的強大引擎。重構生產、分配、交換、消費等經濟活動各環(huán)節(jié),形成從宏觀到微觀各領域的智能化新需求,催生新技術、新產品、新產業(yè)、新業(yè)態(tài)、新模式。引發(fā)經濟結構重大變革,深刻改變人類生產生活方式和思維模式,實現社會生產力的整體躍升。


產業(yè)智能官  AI-CPS

用“人工智能賽博物理操作系統(tǒng)新一代技術+商業(yè)操作系統(tǒng)“AI-CPS OS”:云計算+大數據+物聯網+區(qū)塊鏈+人工智能)在場景中構建狀態(tài)感知-實時分析-自主決策-精準執(zhí)行-學習提升的認知計算和機器智能;實現產業(yè)轉型升級、DT驅動業(yè)務、價值創(chuàng)新創(chuàng)造的產業(yè)互聯生態(tài)鏈

本文系“產業(yè)智能官”(公眾號ID:AI-CPS)收集整理,轉載請注明出處!



版權聲明產業(yè)智能官(公眾號ID:AI-CPS推薦的文章,除非確實無法確認,我們都會注明作者和來源。部分文章推送時未能與原作者取得聯系。若涉及版權問題,煩請原作者聯系我們,與您共同協商解決。聯系、投稿郵箱:erp_vip@hotmail.com



本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
【人工智能】人工智能前沿技術應用趨勢與發(fā)展展望
人工智能及機器學習與深度學習揭秘
給水排水 |水業(yè)導航:人工智能技術在供水行業(yè)中的應用與展望
人工智能教育應用的新發(fā)展
一位90后統(tǒng)計學碩士的深悟與真思:統(tǒng)計其實有門道!人工智能還能這樣學!(精薦40本圖書 20個視頻資...
深度解讀MIT TR10“全球十大突破性技術”之對抗性神經網絡
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 卓资县| 汝阳县| 康平县| 夹江县| 长兴县| 吴忠市| 霸州市| 雷波县| 偏关县| 惠东县| 观塘区| 信丰县| 普安县| 克东县| 襄樊市| 蒲江县| 新和县| 汉中市| 健康| 巴马| 民乐县| 木兰县| 赫章县| 台北县| 哈尔滨市| 宁阳县| 浦东新区| 绥滨县| 平和县| 罗田县| 扬州市| 哈巴河县| 丽江市| 凤庆县| 湖北省| 海南省| 济南市| 绥芬河市| 上饶县| 来安县| 宁晋县|