2019,4G將慢慢成為過去,5G正在緩緩到來,5G時代,AI(人工智能)和物聯網將會成為熱詞,尤其是隨著5G的網絡延遲大幅降低,以AI為核心的物聯網將實現真正的萬物互聯。那么AI的智力是怎么來的呢?AI的智力主要來源于貝葉斯-拉普拉斯公式,可以說是AI的大腦組成!
18世紀英國有一位英格蘭長老會牧師,他很喜歡數學,所以也可以稱得上是一位業余數學家,他的名字叫托馬斯·貝葉斯,他為了證明有上帝的存在,發明了概率統計學原理,可惜,他到死也沒有證明成功,反而因此誕生的許多概率統計學術語折磨了無數大學生。
他提出過一種看上去似乎顯而易見的觀點:“用客觀的新信息更新我們最初關于某個事物的信念后,我們就會得到一個新的、改進了的信念?!?/p>
它的數學原理很容易理解,簡單說就是你如果很喜歡去某家菜館吃飯,那么你可能會非常喜歡這家的菜,也就是說當你不能準確知悉一個事物的本質時,你可以依靠與事物特定本質相關的事件出現的多少去判斷其本質屬性的概率。
由此,貝葉斯分析方法誕生了,它建立在主觀判斷的基礎上,你可以先估計一個值,然后根據客觀事實不斷修正。
當然了,這還只是一個理論,看起來的確很簡單!
但是在1774年,法國數學家皮埃爾-西蒙·拉普拉斯根據這個研究成果提取出來了貝葉斯公式。拉普拉斯關心的問題是:當存在著大量數據,但數據又可能有各種各樣的錯誤和遺漏的時候,我們如何才能從中找到真實的規律。拉普拉斯研究了男孩和女孩的生育比例。有人觀察到,似乎男孩的出生數量比女孩更高。這一假說到底成立不成立呢?拉普拉斯不斷地搜集新增的出生記錄,并用之推斷原有的概率是否準確。每一個新的記錄都減少了不確定性的范圍。從而誕生了“貝葉斯-拉普拉斯公式”。
P(A/B)=P(B/A)*P(A)/P(B),該公式表示在B事件發生的條件下A事件發生的條件概率,等于A事件發生條件下B事件發生的條件概率乘以A事件的概率,再除以B事件發生的概率。公式中,P(A)也叫做先驗概率,P(A/B)叫做后驗概率。
很多人一看到這個公式覺得特別頭疼,其實我給大家翻譯一些就明白了,其實大家在生活中就經常使用貝葉斯分析方法,只不過大家并沒有意識到罷了,比如我們去一個陌生的地方吃飯,我們的手機又沒有電了,你沒有辦過通過手機APP了解這個地方的哪個餐廳最好吃,這樣我們似乎只能隨機選擇,但實際上并非如此,我們會根據貝葉斯方法,利用以往積累的經驗來提供判斷的線索。經驗告訴我們,通常那些坐滿了客人的餐館的食物要更美味些,而那些客人寥寥的餐館,食物可能不怎么樣而且可能會被宰。這樣,我們就往往通過觀察餐廳的上座率來選擇餐館就餐。
當然了,生活中還有很多這樣的例子,我們淘寶的時候,看到下面購買人數多,就會覺得這家店更可靠一些,購買人數太少,就不太放心以及突然發現老公的公文包里突然有了一支口紅,進而懷疑他出軌等等等等。。。
這其實就是我們在生活中不自覺地運用了貝葉斯分析方法。
大家可能會覺得這個公式和AI有啥關系。其實這個公式剛剛出來的時候,大家也覺得沒有什么用,但是隨著互聯網的不斷發展,科技的不斷進步,在被冷落200年之后,貝葉斯-拉普拉斯公式的存在感也就越發凸顯。甚至在熱門美劇《生活大爆炸》中謝耳朵也秀了一下。
這就要多虧了香農了,這位大數學家也是信息論的創始人,提出了想用數學方法處理自然語言的想法。(自然語言處理就是讓計算機代替人來翻譯語言、識別語音、認識文字和進行海量文獻的自動檢索。)
然而那個時候的計算機,因為時代和技術水平的原因,根本無法滿足大量信息處理的需要。你要知道即使在1982年,640K內存對微型計算機來說顯得綽綽有余,人們甚至認為,640K的內存可以用來干任何事。你就可以知道當時的計算機有多弱雞了!
所以香農的想法并沒有得到重視,然而時代在發展,科技在進步,后來大家才知道香農的話多么具有前瞻性!
1994年,比爾蓋茨坐在一堆紙上,告訴全世界:我手上的光盤能裝下下面所有紙記錄的信息
隨著計算機的不斷更新迭代,一路升級,很多人力很麻煩的東西都可以通過計算機來解決,很多在手工條件下看起來不可思議的進行模型訓練的巨大工作量通過計算機來實現變得輕而易舉,而如何讓計算機來處理這些東西呢?貝葉斯-拉普拉斯公式就隆重登場了!
打一個比方,我們給人工智能看一個菜刀的圖譜,問它這個是什么?人工智能又不是人,它不像我們在社會中成長,對于任何物體都有約定俗成的叫法,我們可以通過大腦思考,去判定事物,它又沒有腦子。那么貝葉斯-拉普拉斯公式這個時候就成為了人工智能的腦子。
當看到菜刀的形狀之后,可能是金屬制品。
一側十分鋒利,可能是用來分割物品。
一端還有刀柄,可能是廚具
。。。
最后得出結論是菜刀。
人工智能不斷地搜集自己儲存的信息,并用之推斷原有的概率是否準確。每一個新的推斷都減少了不確定性的范圍,從而得出正確的結論,所以說,貝葉斯-拉普拉斯公式可以說是AI進化論的基石。
還有人工智能識別我們的語音,我們對人工智能說了一句話,假設這句話是a,人工智能就需要判定它出現的意思e哪個是最靠譜的。即我們需要計算:P(e|a)。根據我上面給出的公式,從而得出:
P(e|a) ∝ P(e) * P(a|e)
最后人工智能就會判定出你說的話是什么意思,為什么現在的很多品牌的手機語音助手經常翻車,包括Siri也是經常翻車,就是在這個的計算上出現了問題。
所以,你明白了嗎?為什么人工智能的“智能”來自貝葉斯-拉普拉斯公式。
當然了,這還只是初級,由此為一個點,慢慢不斷延伸,比如深度學習 貝葉斯網絡。這些就太深了,就不細說了。
貝葉斯公式在生活中的運用非常常見,比如我們非常了解的大數據、人工智能、海難搜救、生物醫學、郵件過濾、疾病診斷,企業的資質評判,訴訟,市場預測等等等。
我們最為熟知的馬航搜救工作,也利用了貝葉斯-拉普拉斯公式。
可以說貝葉斯-拉普拉斯公式就好像是整個信息網絡化社會的大腦一樣。當隨著互聯網的不斷深入發展,技術的不斷成熟,貝葉斯公式與計算機結合的真正威力我們還無法預估。
不知道人工智能是否真的能從貝葉斯-拉普拉斯公式跳脫出,從而可以獨立地思考,甚至與人類之間發生戰爭。
然而,我們終歸要相信,人類之所以珍貴,是因為我們有血有肉,擁有真正的感情。
可以說在如今的社會,在以貝葉斯為基礎的算法已經成為了社會的血管,萬事萬物都拖離不了算法,大數據需要算法、自動化機器的運轉需要算法、手機拍照需要算法調教、彩票的機器需要通過算法篩選大獎等等等等。
不過,現在,算法過程、深度學習、機器學習、大數據運維之類的年入百萬也是輕輕松松,不過難度很高,希望大家報名此類的培訓班三思而行, 因為這門檻太高,如果這么不好,全球也不會這么缺人了。
注:因為受眾原因,講的比較粗略簡單,貝葉斯分析方法和貝葉斯-拉普拉斯公式之間的關系和聯系,還有貝葉斯和深度學習、機器學習之間,以及貝葉斯在算法中的作用等等,都沒有深入去談,有興趣的朋友可以多去了解一下。有任何錯漏歡迎指正!