“人工智能是先進生產力,它正在以前所未有的深度、廣度和速度,進入我們的生產和生活。它還不成熟,存在著固有的缺陷,存在著被濫用的可能,需要對它進行治理,但這不能成為阻礙它發展的理由——對于人工智能,不發展就是最大的不安全。”中國新一代人工智能發展戰略研究院執行院長龔克在國家科技傳播中心講壇上發表如上觀點。
《國家科技傳播中心講壇》是中國科協打造的新型演講類新知欄目,以科學精神,科技探索和科技產業為主要講述內容,匯集相關領域頂尖科技工作者講述科技創新故事,傳播前沿創新成果,弘揚科學家精神。本文摘選部分內容以饗讀者。
對人工智能可以有很多不同看法,我這里強調三點。第一,人工智能是一個不可抗拒的、加速發展的新質生產力。第二,它正在經歷著重大的技術突破——不是“經歷了”,是“經歷著”,它整個還處在重大的技術突破過程中。第三,它還不成熟,但是已經在用了,而且是越用越廣,它的風險需要被控制。
人工智能是一項技術,是一項要完成人類規定的,或者人類所需要的任務的技術。它通過什么辦法來完成?通過模仿人類的智能行為。人類智能行為需要分成四個步驟來完成:首先是感知,在感知基礎上有認知,認知之后叫謀行,即謀劃行動,最后是執行。
ChatGPT開創了人工智能發展的新階段
人工智能發展已經有70多年歷史了。過程中有幾個重要的節點,其中最重要的是1956年,在美國達特茅斯舉行了一次會議,一群年輕人在當年夏季的研討會中提出了人工智能的概念。這群人中歲數最大的一位是Claude Shannon,他是信息論的創始人,當時他已經是MIT正教授,也不過才39歲。
進入新世紀,華裔科學家李飛飛建立了一個有1500多萬張標注好的圖片的巨大數據庫,全世界搞圖像識別的人可以用這個數據庫對AI進行訓練,然后進行識別。最初這個比賽表現最好的五個團隊,平均錯誤率達到28%,然后逐年下降。作為對比,人類識別的誤差率在5%-10%之間。到了2012年 、2013年的時候,AI就逼近了人類的水平。
這個進步,科學家依賴的是一種叫做深度神經網絡的算法。從那以后,所有最好的團隊都用深度神經網絡,很快就突破了人類界限,錯誤率直逼3%以下。這一巨大的成功使得圖像識別變成了第一項成熟的人工智能應用,人工智能從論文和實驗室走到了我們的生產和生活之中。
2022年11月30日發生了一件事情,OpenAI宣布他們的一個產品誕生,這個產品叫ChatGPT,我們現在把它稱為生成式的人工智能。它可以模仿人類生成文本、劇本、圖像、視頻,以及程序的代碼。這是一個重要的進步,我們認為它開創了人工智能發展的新階段。
從技術上看,這個新階段是由于有巨大參數的大模型同一系列其他技術相結合,實現了對語意的基本掌握。我們知道,所有的人類語言中用了很多詞匯,但是同一個詞匯在不同的上下文之間,可以表達不同的語意。這個大訓練模型利用了很長的文本,使得每一個詞的語意得到相對比較準確的表達。
從應用上看,chat也是非常重要的。在這之前比較有名的AI有Deep Blue(深藍),是下國際象棋的。后來出現下圍棋的AlphaGo。在中國,下國際象棋的人不多,下圍棋的可能多一點,但依然不是所有人都下圍棋。現在到了chat,everyone chats,所有人都會聊天,通過聊天把人工智能推向了所有的人。我想這是在應用上一個重大的進步。
但這也引起了社會上的一些焦慮,擔心AI會不會最后超過我們人類、它和人類是什么關系、人類能不能有效地管控它、它會不會終結我們人類。在這種情況下,去年3月份,包括Elon Musk在內的一批名人,就發出一個呼吁,說是要把人工智能的發展先停下來,至少停6個月。
但事實上它并沒有停下來。2023年6月份,麥肯錫做了一個調查,發現在亞太和北美地區,有40%的人在工作或生活中常規性地在使用AI;在技術領域和傳媒領域,甚至有50%的人在使用生成式AI——那時離ChatGPT出現只有半年的時間。這說明人工智能已經實實在在地走進了我們的生產和生活,這是一個擋不住的、重要的、歷史性的趨勢。
根據預測,從2023年到2030年,人工智能將以36.8%的速度在市場發展。我不知道還有什么其他的行業可以被預測有這么高的發展速度。
自古以來,人類從茹毛飲血到男耕女織,一直到今天的超級計算,人類總是不斷創造出工具來增強我們的能力,增強我們的體力,增強我們的腦力。這是人與其他動物的重要區別之一。自有文明史以來5000多年,人類在生理上并沒有什么重大的變化,但是今天人類的能力,比5000年前要強得多。強在什么地方?不是我們的腦比那時候更發達了,或者是我們的骨骼比那時候更發達了,而是我們使用的工具比那時候更先進了。這個過程就是生產力的進步。
大模型如何形成智能?
人工智能就像機械動力技術、電氣技術那樣,是革命性的通用技術,在所有的行業都能用,它會帶來整個社會的智能化。如何實現這樣的技術突破?這需要一個從量變到質變的過程。2018年剛推出來的第一代GPT,只有10億的參數,到2019年達到了15億的參數,有所增長;到了2020年6月份,達到了1750億的參數,這個增長已經不是一般的量變,可以稱之為突變了。現在參數又有了數百倍的增長,更是達到了幾十萬億。這種量的變化給AI帶來了巨大的能量。
這個參數是什么意思?指的是我們模仿人腦創造一個神經網絡的模型,模型中連接點的數量。人腦有860億個神經元,這些神經元通過觸突連接起來,我們模仿它,所謂模型參數就是這種連接的數量。但模型參數是不是越大越好、把參數做到無限大的時候AI就能變得無限聰明?也不盡然。非洲大象的神經元數量比人還大至少三倍,但是它并不比人聰明。這告訴我們,簡單地去增加參數數量并不能達到更好的智能效果。所以我們一方面要增加參數,另外一方面還需要技術的黃金組合。
ChatGPT一系列的技術里面,有幾項特別值得一提的技術,其中一項叫 Word Embedding ,翻譯成中文叫詞嵌入。這是比較難懂的一個詞,是把一個詞嵌入到一個矢量的空間里面。這里面矢量的維數可以非常多,每一維以0或者1代表一個矢量的性質。比方說第一個維度以0和1代表它是個生物還是非生物;如果是生物,下一維度,這是動物還是植物;如果是動物,下一維度判斷這是哺乳動物還是非哺乳動物;如果是哺乳動物,是地上跑的還是天上飛的……在一個高維矢量空間里,把一個詞意給它確定下來,這就叫做 Word Embedding。
還有一項重要的技術,GPT的T是Transformer的首字母。Transformer我們翻譯成變換器。這個變換器是干什么的?是做編碼和解碼用的。編碼和解碼會產生另一個概念,我們叫做 attention,翻譯成注意力,它可以在很長的上下文中找到關鍵詞。人看文章的時候,不是在每一個詞上都平均用力的,而是迅速抓住關鍵詞,這對AI來說也是一個重要的功能。
接下來還有一個重要的功能,叫做基于人類反饋的強化學習。就是AI說錯了以后,我們告訴它:“你說得不對吧?你寫得太長,要壓縮。”在這個人類反饋過程中,可以把人的價值觀、社會的風俗、法律的規定、技術的標準、人的審美和情緒,用語言輸入給模型,讓它產生你所需要的結果。
這一系列重要技術組合,才產生了今天的技術突破,而且按照我的說法,它正在經歷著突破,還在往前走著。
大模型帶來一個非常重要的工作模式和很多新的崗位。這個新的工作模式叫做MaaS,Model as a Service。原來我們說軟件是個服務,網絡是個服務,平臺是個服務,現在說,模型是個服務。這個預訓練的大模型會變成一個社會的基礎設施,讓我們的各行各業在這個預訓練大模型基礎上,用我們的數據和專門的知識,結合我們特定的任務,把它變成一個專用的模型。
這時候就降低了我們使用模型的門檻。即便要改進模型,也不用從頭做起,我們可以拿過一個大模型來,結合我們需要用的專門的數據做精調。現在有招聘一種崗位,叫做提示工程師。提示工程師的主要工作就是跟AI對話,通過有效對話來對它進行訓練。GPT工程師可以在模型基礎上去改錯、加工,而不是從頭一行一行寫C語言代碼,這使得原來最低級的程序員變成了軟件系列里比較高級的系統分析師。如果我們把AI看成是一輛車,我們不僅需要設計車的人和造車的人,更需要會開車的人。這就是一旦普遍使用這個工具,就會產生各行各業新的工作崗位的原因。
但人工智能的應用也是有風險的。它存在風險的一個最根本的原因在于,它在推測答案的時候,用的是概率,叫做聯合分布概率。給它輸入一個問題,它判斷哪些詞與輸入的詞組合形成的概率最高,那就是它選擇的輸出。既然它是通過概率來判斷的,就不可能100%正確,總有出錯的時候。人也會出錯,只不過我們可以通過長期的實踐、根據民主決策的程序、通過專家咨詢等,來盡量減少人的錯誤。而對大模型,現在還存在不可解釋性,還不能清晰地說明在什么樣的條件下可以影響它的概率分布。
我們認為這種出錯基本上會來自兩個方面:一是技術內在的不完善,聯合分布概率因此不可完全控制;另外一方面來自于它的濫用——再安全的車,也可以開著去撞人,不是車不好,也不是車的技術參數不好,危險來自對它的濫用。
發展人工智能我們可以這樣干
以上內容可以歸結為三點:第一,人工智能是先進生產力,發展不可阻擋;第二,它正在形成大的突破,而且是以前所未有的深度、廣度和速度,在進入我們的生產和生活;第三,它還不成熟,存在著固有的缺陷,存在著被濫用的可能,需要對它進行治理。在這三點基礎上,我們可以討論如何發展AI。
這里我想談五個關鍵詞:創新、應用、平臺、治理、人才。
創新和應用是一個相互迭代的過程,是相互促進的,沒有創新就沒有有效的應用。在此我借用一下“深度學習”中的“深度”概念,提出深度的創新和深度的應用。深度創新,指的是要在根上創新,要突破模型可解釋性問題,我們不能總是把別人做的模型拿過來做fine tuning。我們有沒有可能在類腦神經模型上做新的突破?就是把前文說的MaaS這個模型作為一個服務給廣泛推出,在應用大模型基礎上,把人工智能從chat推向product,變成了product以后,才能真正發揮效益。
這里我給大家舉一個例子。現在一些頭部的企業已經在推出面向行業的應用,但這些應用需要跟行業更緊密地結合,把它真正落到生產的深部。我們研究院做了一個試驗,到全國開展自動駕駛網聯車的那些城市去發調查問卷,分成坐過網聯車的和沒坐過網聯車的。我們看到無論是試驗組還是對照組對自動駕駛汽車上路進行測試,都持積極的態度,其中坐過的(試驗組)態度更為積極。拿武漢舉例,自動駕駛出租車推出商業服務不到500天的時間,有一個人就用了900多次,差不多一天用兩次自動駕駛車接送他的孩子。這說明這項技術在中國有比較好的接受度,我們可以在大規模應用過程中完善技術。
創新和應用之外,我們發現了一個更重要的現象:創新和應用在中國的發展是由平臺支撐的。我們調查了全國的2205家人工智能企業,看這些人工智能企業的資金從哪里來,投資向哪里去;看他們的人才從哪里來、人才跳槽向哪里去;看他們的技術從哪里來,如果輸出技術向哪里去。人、才、技術形成了這些企業之間的相互聯系。
在這兩千多家企業的背后,我們發現了一大批投資者、一大批科研院所、一大批政府的科研園區等。其中有15家企業是科技部命名的,叫人工智能開放創新平臺。這15個開放創新品牌,在這兩千多家企業中起到了重要的推動作用。這是一個平臺推動的發展生態。
我們需要建立一批跨界的創新組織,用這些創新組織來探索這種由平臺驅動的新質生產力,形成更好的上層建筑(生產關系),來加快創新應用的循環,推動產業的新生態,實現人工智能和實體經濟的深度融合。這是寫進我們黨的十九大報告的一句話:推進人工智能和實體經濟深度融合。
還有一個關鍵詞是治理。在這里,治理的對象是一種生產力,而且是一種先進的生產力,我們要以是否能解放和發展這種生產力作為治理的標準。最忌諱的,就是用現存的生產關系來約束正在迅速發展的先進的新質生產力。切記不能把這一生產力的發展和它的安全給對立起來——不發展就是最大的不安全,我們要治理它,首先就要把它發展好,要發展好就要鼓勵從根上創新,沒有根上的創新就沒有根上的安全,就實現不了發展。
目前我們國家建立了基于風險的、對人工智能的治理機制,劃出了一些高風險應用。比如把腦機接口植入到人的大腦里,風險就比較高,這樣的應用就屬于高風險應用。
智能化社會來了,我們需要全民的人工智能素質,但是不需要社會焦慮。現在有些完全不必要的社會焦慮,它們的存在只會對人工智能的發展、對生產生活的高質量發展帶來毫無必要的干擾。
最后一個關鍵詞是人才。有人評估說,光是中國人工智能領域,相關崗位就缺500萬,現在我們就要把這500萬人給培養出來。但還不止于這500萬,我們整個已經進入人工智能時代,這個時代所有合格公民都應該具備人工智能相應的素質,能夠學會駕馭人工智能。這就需要對我們的教育系統提出新的要求。
應用人工智能,特別要注意的是我們可以駕馭而不可以依賴這個工具——必須清楚,AI生成的只是半成品,它要經過人類的審視、人類的加工,才能變成一個真正的成品。我們要對它做factual check、logic check、ethical check,也就是做事實的、邏輯的、倫理的審查。這里有個詞叫做critical thinking,翻譯成批判性思維,其實我覺得翻譯成審辯思維更好。
概括起來,我們現在需要為AI立心。聯合國有一個口號,The AI we want is the AI with human values for sustainable development,“我們需要具有人類價值觀的、可持續發展服務的AI”。
作者丨龔克