精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
李彥宏說人工智能是百度核心中的核心,而我們更關心他和胡歌誰更帥

虎嗅:如果不是來現場,你很難感受到百度對人工智能這個話題的重視程度,如果你聯想到過去半年,百度的各種遭遇,再看現在百度對人工智能視若珍寶的程度,你就能感受到那種溺水者抓住救命稻草的欣喜。

整個演講,李彥宏講述了百度大腦的三大構成:算法、計算能力和數據,以及四大功能:語音的能力,圖像的能力,自然語言理解的能力,以及用戶畫像的能力。

演講的高潮出現在最后胡歌上場跟李彥宏互動的環節,這場耗時1個小時的演講或許是百度最全面、詳細展示其人工智能戰略和進展的一次。

有一個小小的細節,就是他不像一些其他涉足人工智能的企業一樣隨便給人工智能貼上多少歲的標簽。他在談到百度大腦相當于人類幾歲時,他說他也不知道,他認為電腦和人腦有很大的區別,百度大腦雖然是一個人工智能的大腦,但是它和人正常的發育的過程還是很不一樣的。而上次參加第四代微軟小冰發布會,微軟直言微軟小冰相當于18歲少女的智力。而其它一些開發人工智能的公司也喜歡嘲笑百度的度秘,而事實真的如此嗎?

以下是李彥宏的主旨演講,虎嗅進行了刪節,為了方便閱讀虎嗅加了幾個小標題:

各位來賓大家早上好!歡迎來到2016百度世界。

大家知道,百度世界是我們每年舉辦一次的百度技術創新大會。今年的主題我們聚焦在人工智能。剛才開場視頻是以人工智能為主題的,今天我的主題演講也將圍繞著人工智能來展開。

移動互聯網之后的下一幕是什么?其實現在已經很清楚了,就是我們所說的人工智能。人工智能對于百度來說是核心當中的核心。

我們也很幸運,在過去的五六年當中,百度花了很大很大的精力投入到人工智能的研發當中。人工智能對于百度來說意味著什么呢?我可以用簡單的四個字來描述,就是百度大腦。

百度大腦的三大構成:算法、計算能力和數據

百度大腦的概念我們其實在大約三年前就對外講過。那個時候我們講,百度大腦已經具備了大概兩三歲孩子的智力水平了。自此以后,不斷的有人來問我,尤其是今年人工智能突然火起來了之后,很多人來問我說,你們這個百度大腦現在相當于多少歲人的智力水平了。

要回答這個問題其實還蠻難的,我也不知道它現在是多少歲了,因為畢竟人腦和電腦它還是有很大的區別,百度大腦雖然是一個人工智能的大腦,但是它和人正常的發育的過程還是很不一樣的。

百度大腦到底由什么構成的呢?它基本上是由三個大的部分組成的。

第一個組成部分,就是人工智能的算法。我們有超大規模的神經網絡,這是模擬人的神經元組成的網絡,但其實我們也不知道真正人腦工作的原理是什么,只是想象當中應該是這個樣子。我們還使用了萬億級的參數,人腦的神經源大概是千億級的,我們也有千億的樣本和千億的特征進行訓練。

百度大腦的第二個組成部分是我們計算能力。現在我們已經使用了數十萬臺的服務器來進行計算,而這當中很多的服務器不是傳統基于CPU的服務器,而是基于GPU。早年的時候,GPU主要在游戲等領域使用得比較廣泛,在人工智能、尤其是深度學習起來以后,我們發現,其實GPU特別適合人工智能的計算,尤其是深度學習的計算,一塊GPU可以頂100個CPU的計算能力。

百度大腦的第三部分是數據。數據也非常非常重要,而且這個數據量也是非常大的。比如說,我們已經收集了全網上萬億的互聯網網頁內容,這其中包括了很多視頻、音頻、圖像,這些數據也是數以百億級的。我們還有每天數十億次網民的搜索請求,而且還有每天數百億次的網民定位請求,就是說這個人在什么地方,這樣的請求也比大家想象得多,每天都有好幾百億次這樣的定位請求。

百度大腦的四大功能

有了算法,有了計算能力,有了數據,百度大腦就可以開始工作了。百度大腦又到底有什么樣的功能?讓我們來看一看。

我們今天想重點介紹的四個功能:一個是語音的能力,一個是圖像的能力,一個是自然語言理解的能力,還有一個就是用戶畫像的能力。

下面我就分別來講一下這幾個功能,這幾個百度大腦的功能。

1. 語音功能包括語音識別和語音合成

我們先看一下語音,剛才也講了應該說今天人工智能發展的最成熟的一部分能力,而語音又分成兩個方向,一個是語音的合成,一個是語音的識別。

我們先看看語音識別。今年MIT Technology Review(《MIT科技評論》)雜志,把百度的Deep Speech 2評為“2016改變世界十大突破技術”,這就是百度的語音識別引擎,它已經到了第二代,主要就是使用了深度學習的能力。

這樣的一個技術已經可以把語音識別的準確度做到多少呢?大概可以做到97%的準確率,這樣的準確率已經達到、甚至有時已經超過了人對語音的識別能力。

當然,我們講這些能力不是為了簡單地去炫耀這個數字有多好,我更感興趣的是,當你有了這些能力時,它可以在什么領域應用,又可以在哪些方面幫助到我們,這其實才是最最讓我們覺得興奮的地方。

我個人的想象力很有限,整個百度幾萬人的想象力也是有限的,但是這些能力如果賦予到很多很多人,賦予給幾億人、幾十億人,這個可能性幾乎是無限的。

語音識別是一方面,語音合成又是另外一個方面。語音合成是什么意思呢?就是機器可以把文字轉換成語音,把它念出來、讀出來。今天的語音合成也有了和過去非常不一樣的體驗,最主要的就是,它可以用比較自然的人的聲音讀出來,而不是像過去機器一樣,每一個字之間的停頓都是一樣長,是勻速的、沒有表情的。這樣的自然體驗,當然對于用戶的黏性來說也是有很大的作用。

現在,百度每天要響應2.5億次的語音合成請求,這些請求用來干什么呢?比如說,過去人們看小說,今天可以在手機百度里面聽小說。慢慢的人們聽小說的時間也更長了,過去每個人平均在小說頻道會花大概四十分鐘左右的時間,現在要花將近兩個半小時,就是因為把計算機合成出來的語音讀出來給我們聽,確實是一個很不錯的體驗,甚至是一種享受。

不知道有沒有人注意到,百度地圖里導航功能就是用語音來進行的,其中有一個選項可以用我的聲音進行導航。其實導航的那些話我并沒有說過,機器只是根據我平時說話的情況合成了一個李彥宏的聲音。這樣的聲音不僅在我身上可以做到,在很多其他人身上也可以做到。

我們現在來給大家展示一個合成的聲音。我們合成了一下13年前已經去世的張國榮的聲音,我們來放一段video。(播放情感語音合成視頻)

為什么給大家展示這個呢?一方面我知道,很多人是張國榮的粉絲,另一方面,其實合成張國榮的聲音比合成一般人的聲音要更難。為什么呢?因為他的國語語料相對來說比較少,所以,我們能夠合成他的聲音,就一定能合成很多很多人的聲音。

對于百度來說,百度大腦的語音合成能力可以讓每個人都有自己的聲音模型,你只要按照我們的要求說50句話,我就學會了你說話的方式。

當你擁有自己的合成聲音之后,比如說家里的老人想經常聽你說一說,你把這個聲音合成出來讓他聽就好了?;蛘哒f你平時要加班,小孩睡覺之前想聽個故事,你合成自己的聲音給孩子講一遍這個故事,聽起來也會很親切。所以大家可以看到,這些語音的能力會帶來各種各樣新的可能性。

2. 圖像識別的應用:人臉識別、無人車、AR

下面我給大家講一下圖像。用一個比較專業的術語來講,我們叫做計算機視覺。這也是現在廣義的人工智能中非常重要的領域。說到圖像的識別,我想大家自然而然會反應出來一個什么應用呢?應該就是我們通常講的人臉識別的應用。人臉識別的準確率今天已經達到了99.7%,已經非常非常準確了。

現場的屏幕能夠識別出來我們一些嘉賓,根據他們的人臉,我們知道這個人是誰,這個準確率已經比較高了。剛才進來的時候,大家也可以看到一些人臉識別的展臺,我們是可以識別很多很多人的面孔的。

那么,人臉識別這個技術是怎么實現的?我們要對人臉的特征提取它的關鍵點,把這些點打出來之后要做一些處理,把它連成一個面部表情,據此來識別這樣一個人。這就使得當一個人的表情發生變化的時候,我們仍然能夠識別出來這個特點是沒有發生變化的,比如他在哭,他在笑,他在憤怒,他在迷茫,他的表情是不一樣的,但是他的表情特征是不變的,所以我們仍然可以很準確地識別出這樣一個人。

還有一個很重要的領域也是非常需要圖像識別的技術,這個領域是什么呢?這就是我們過去一年來講得比較多的無人駕駛汽車。無人駕駛汽車涉及到很多很多的技術,比如說我們需要計算機視覺的技術,需要高精度地圖,需要對環境的感知,需要定位,甚至需要語音的通話。

應該說,計算機視覺或者是圖像識別的技術是“最后一公里”,無人駕駛汽車真的要變成沒有人,真的要能夠解決99.999%、甚至100%的情況,最終還是要依靠計算機視覺的能力,要識別各種各樣的極端的情況。

去年年底開始,我們給大家展示過百度的無人車在五環上跑,在高速上跑的情況,過去一年左右的時間我們也花了不少精力去提升我們在城市道路上運營的水平,下面我們也放一段視頻給大家看一下。(播放無人車視頻)

大家看到左下角這是人能夠看到的視野,這個視野其實是比較窄的,主屏幕是無人車能夠看到的路面情況,大家可以感受到,它感知的范圍其實比人要寬了很多,很多比較遠的目標都可以感知到,每個目標都給出它唯一的編號進行識別。對面有什么車過來了,遇到紅綠燈,遇到障礙怎么辦,行人怎么能識別出來,或者是樹木,周邊的汽車等等,每一個目標我們都進行了識別和編號,這就是實際的、一個百度無人駕駛汽車在城市道路中行駛的情況,上面的45是限速。

這是大致的一個車看到的世界是什么樣的。這里面涉及了很多計算機視覺或者是圖像識別的技術,尤其是這兩個技術:一個是我們叫做車輛的檢測,你行駛過程中怎么能夠知道旁邊有車輛,這個車輛在哪?這個車輛的檢測我們現在按照國際權威的評測來看,車輛檢測的能力,百度無人車已經排名第一了。

還有一個很重要的能力是車輛跟蹤的能力。這個不僅是全自動的無人車,即使是對半自動的、高度自動駕駛來說,也是一個很基本的能力。你怎樣能夠準確地跟著前面的車走,這個技術在包括準確性、全面性、連續性等六項指標中,我們已經有四項拿到了第一。

這是無人車對于圖像識別依賴的情況。我們再給大家展示一個領域,就是增強現實AR,AR其實也是非常依賴(圖像識別)。拿著手機拍一下現實的情況,我們要能夠識別出來這是哪,這里面有什么,然后才能跟用戶進行互動,才能產生真實世界和一些虛擬世界的完美的結合。

無論你拿手機拍一張明信片,還是拍一個實物的洗發水,它都可以準確地識別出來這個東西,和用戶進行互動,這里面不僅有圖像識別的技術,也很大程度上取決于廣告主的創意,如果創意和這個技術結合,對消費者的吸引力也非常大,所以我們也期待將來的時間和客戶很好地合作,把這個創意,把最優秀的想法和最優秀的技術結合起來,給消費者帶來實惠。

3. 自然語言處理

下面我們再看自然語言處理。自然語言處理其實我剛才也講了,它的成熟程度應該不如語音,甚至不如圖像識別,但是即使在目前的狀態下,它也能夠給大家帶來很多很多不一樣的體驗。最直接的例子應該是我們去年在百度世界大會上講的一個例子,就是度秘。度秘是一個個人智能的助理。這個個人智能助理今天我們可以在手機百度里面找到,度秘跟用戶進行交互,現在已經有超過一半的交互是通過語音和圖像來完成的,去年我們也講了,語音和圖像將來會變成一個主流。

度秘除了它能夠識別語音和圖像之外,其實它更關鍵、更核心的技術,是能夠用人的語言來與人進行交流,并且能夠理解人的很多意思和意圖,盡管不是每一次都能理解。

過去這段時間我們也利用度秘的自然語言的能力做了一個比較有意思的應用,用度秘來解說奧運籃球。

下面再給大家展示一個自然語言理解的應用。這個應用的領域其實也不是特別新,就是自動翻譯。你要想把一種語言轉換成另外一種語言,你必須得理解這種語言在說什么。它不是簡單的把語音轉成文字,更多的是需要你知道它是什么意思。今天的百度翻譯已經可以支持27種語言、數百種不同方向的對譯了。

4. 用戶畫像

下面我們講百度大腦的第四個能力,就是用戶畫像的能力。用戶畫像也是基于百度的大數據以及機器學習的方式所獲得的一個能力?,F在我們已經有接近10億的用戶畫像,其中對于他們的識別我們已經用到了千萬級的細分標簽。

用戶畫像有什么用途?首先給大家舉一個百度的例子。

最近幾個月大家可能注意到了手機百度,除了上面的搜索框之外,下面增加了各種各樣的文章。這些文章有時候是新聞,有時候不見得是新聞,但是確實是你感興趣的東西。

之所以它能夠把你感興趣的東西推薦出來,就是因為我們利用了百度的用戶畫像。我知道你是一個什么人,你喜歡看什么樣的東西。

有了這樣的個性化推薦,過去兩個月手機百度推薦的文章的閱讀量增長了10倍,這種能力就是靠百度給用戶打了60多萬個標簽,而每個用戶都是這其中某些標簽組合后描畫出來的,所以它可以做到千人千面。準確地講,不是千人千面,而是萬人萬面,億人億面,每個人對于百度來說都是不一樣的個體。所以,每個人看到的信息和文章都是不一樣的。

這是一個百度內部使用的例子,我們也認為用戶畫像可以在很多其他領域使用。

胡歌壓軸登場,這個環節我們叫:“胡歌和李彥宏誰更帥?”

我基本上把百度大腦幾個主要的大功能都已經呈現出來了。下面我想請一位大家都很熟悉的明星,和我一起回顧一下百度大腦的這幾個功能。這個明星就在我們這張照片中。我們首先用百度大腦的圖像識別功能把這位明星找出來。大家知道他是誰嗎?對,他就是著名演員胡歌。(嘉賓胡歌登臺)

胡歌:你好,Robin,各位尊敬的來賓大家好。我是胡歌。今天非常榮幸可以參加百度世界大會。剛才我在側臺也聽了非常精彩的演講,感受到了很多新的科技。之前我有聽說過人臉支付,以后如果可以像剛才那樣在一大群人中先進行人臉識別,再完成支付,這個真是太便捷、太智能了。

Robin:你是想搶著買單嗎?

胡歌:如果以后有機會我和Robin要一塊吃飯,到買單的時候,我肯定把臉轉過去,不跟你搶買單。(場下觀眾笑)

Robin:沒問題,我買單。剛才我們已經看到了百度大腦對你的面部的識別。我還可以給你展示一些其他的能力,比如語音合成的能力。這個能力是這樣的,當你念一首詞,你念它的上半部分,百度大腦念它的下半部分,但是它念出來應該跟你是一樣的,它學的是你的聲音。

胡歌:這么厲害。

Robin:這首詞,是百度名字的來歷。你可以來念一下上闕。

胡歌:東風夜放花千樹,更吹落、星如雨。寶馬雕車香滿路。鳳簫聲動,玉壺光轉,一夜魚龍舞。(情感語音合成技術現場演示,其實就是把模仿胡歌的聲音讀出下闋。)

胡歌:太神奇了,首先讓我震撼的是,它能把我的聲音模仿得這么像。第二,它連百度錢包的代言詞都給我改了,真的挺智能的。

Robin:這是語音識別的能力,其實用戶畫像的能力對你其實也有用,為什么有用呢?你的粉絲都是什么樣的人。

【大屏幕展示粉絲用戶畫像結果】

Robin:這是根據你的粉絲的興趣偏好“畫”出來的東西。我還是有一點驚訝的,本來以為關心影視、音樂應該是最大的群體,但是我們看到旅游出行、網絡購物是你這些粉絲群體特別特別喜歡的東西。

胡歌:我看到旅游出行和餐飲美食可能是他們最感興趣的,那么能不能在這兒根據這個興趣數據也為我的粉絲謀取一些專屬的福利呢?

Robin:好啊。那我們下來通過糯米或是其他的平臺給胡歌粉絲提供專享的優惠。百度大腦的這些能力都是今天已經實現的。剛才我也講到這個大腦一天一天都在學習和成長,它的能力也在不斷的進步。所以我完全可以想象有一天當你決定要接一部戲的時候,你只要在這個合同上簽一下字,剩下的事情就都交給百度大腦來干,它可以合成你的聲音、可以合成你的圖像、可以做你的動作,以后演戲你只要說Yes,剩下的事我們就都給你辦了。(場下笑)

胡歌:科技在不斷發展,但是演戲對我來說還是我畢生藝術上的追求,我覺得百度大腦可以為我的生活帶來很多便利,但演戲這個事我還是自己來干吧!(笑)我相信它可以做好,但是我更愿意自己來做!

Robin:以后百度大腦具有新的能力的時候,我及時通知你。這有可能是好消息,也有可能是壞消息。

胡歌:謝謝!感謝今天讓我感受到了這么先進的科技,我也希望百度大腦能夠越來越強大,越來越智能。謝謝Robin!

Robin:謝謝胡歌!今天我們全面展示了百度大腦各種各樣的能力,我覺得,而在我自己和百度同學的想象范圍內,這些能力能做的事情已經很多了。

但是更讓我興奮的是如果這些能力賦予到全社會的每個人,它能夠變換出來無窮無盡的可能性。所以,百度大腦會把語音、圖像、自然語言理解和用戶畫像等能力完全開放出來,并且在大多數情況下這些能力會是免費提供的。有了這樣的能力,有了開放共享,將給各行各業的人群帶來過去大家做不到的、不敢想的能力。我在這里也邀請每個人重新想象你所在的行業,重新想象中國經濟,重新想象世界的未來。

參加虎嗅F&M創新節深圳站

人工智能和智能硬件踩過的坑、未來怎么應對

都在這里

本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
度秘告訴你 智能機器人能做什么
“百度大腦”正在改變你的生活!
李彥宏演講干貨:現場通過百度大腦給胡歌粉絲群畫像
NVIDIA力挺,胡歌助陣,百度大腦亮劍人工智能
對話李彥宏:百度為何要如此急切地與互聯網公司決裂?
吳恩達解讀百度大腦:人工智能到底能為我們做些什么?| 百度世界2016
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 门头沟区| 璧山县| 富蕴县| 武安市| 鄂托克前旗| 万源市| 从化市| 白城市| 鞍山市| 凯里市| 扬中市| 云林县| 通山县| 广丰县| 博客| 隆化县| 息烽县| 开阳县| 鄯善县| 龙岩市| 沂源县| 新蔡县| 稻城县| 兴宁市| 桂阳县| 资源县| 巩义市| 晋中市| 高碑店市| 永顺县| 尉氏县| 宁津县| 临海市| 怀远县| 从化市| 广饶县| 柞水县| 鄂托克旗| 读书| 玉林市| 汉寿县|