本書《大模型時代:ChatGPT開啟通用人工智能浪潮》由龍志勇和黃雯撰寫,深入探討了大模型時代的到來及其對人工智能浪潮的影響。
作者簡介
龍志勇:曾任阿里巴巴資深產品專家兼事業部副總經理、阿里元境資深AI專家、硅谷AI創業公司云腦科技(定制人工智能解決方案)聯合創始人兼首席運營官,獲GMIC“AI Startup Top10”等榮譽,在人工智能、云計算、互聯網行業深耕20余年。曾撰文《從<華為的冬天>到AI的冬天》,并有多本暢銷譯著:《如何創造可信的AI》《稀缺》《超級合作者》《需求》等。
黃雯:互聯網大廠高級AI產品經理,曾就職于騰訊和AI創業公司,積累了豐富的AI產業互聯網、自然語言處理和大模型應用經驗。
全書分為4個篇章。
第一篇:技術篇,科普了ChatGPT和大模型背后的技術原理,淺顯易懂,小白也很容易理解。
第1章:我是一個傳話筒
本章通過擬人化的手法,介紹了ChatGPT對話機器人“小二”與大模型“老莫”之間的互動,闡釋了ChatGPT在接收用戶輸入和生成響應過程中的工作原理。
第2章:我是一個大模型
本章繼續以對話形式,揭示了大模型“老莫”如何通過預測下一個最可能的字或詞來生成連貫的文本,以及大模型在訓練和推理階段的工作原理。
第3章:ChatGPT是怎樣煉成的
探討了ChatGPT的訓練過程,包括預訓練、監督學習和強化學習等階段,以及這些訓練如何賦予ChatGPT強大的語言理解和生成能力。
生成式預訓練方法的重要性直到2022年才顯現,主要因為早期算力不足和數據稀缺,且符號主義主導了AI研究。杰弗里·辛頓在1986年提出自監督學習模型,但受限于資源。2017年,Transformer架構的出現推動了大語言模型的發展,OpenAI的GPT選擇生成式訓練,而谷歌的BERT則采用雙向編碼。盡管GPT在初期表現不佳,但通過不斷增加算力和數據,GPT-2和GPT-3逐漸展現出通用智能的潛力,最終獲得業界認可。伊利亞·薩特斯基弗強調,除了技術和資源,信念也是關鍵。GPT的成功證明了堅持和信念在AI發展中的重要性。
第4章:大模型的未解之謎
討論了大模型中的“涌現”現象,即模型在達到一定規模后表現出的新能力,以及這些能力的出現往往是不可預測和不可控的。
第2篇:變革篇,這波生成式AI對于編程、勞動力市場、人類認知等方面的帶來的巨大變革。
第5章:大機器時代的啟示
通過歷史視角,比較了大模型時代與工業革命時期的技術變革,探討了新技術對勞動力市場的影響和可能的社會變革。
第6章:大模型與智力革命
分析了大模型如何改變人類的認知過程,提高知識處理的效率,并可能引發一場智力革命。
第7章:自然語言編程與腦機協作
討論了大模型如何通過自然語言編程和交互,促進人與機器之間的協作,以及這種協作如何影響知識工作。
第8章:變革時代的韻腳
探討了大模型對勞動力市場的影響,以及新技術如何可能創造新的就業機會和引發社會結構的變化。
盧德主義者反對機器,因其導致失業和收入不均。工業革命初期,技術進步主要體現為取代人力,導致“恩格斯式停頓”,工人生活水平停滯。然而,隨著技術發展,新崗位如經理、工程師等出現,提高了對技術工人的需求和工資。新技術不僅降低產品成本,還創造了新市場和產品,如蒸汽機車、汽車和智能手機,擴大了市場規模。生產率提升也增加了閑暇時間,促進了消費市場擴大。1840年后,工業革命進入良性循環,工人實際工資上漲。新技術使能效應的關鍵在于生產體系和人力教育的適應,確保新崗位的增加能抵消舊崗位的損失。
第3篇:應用篇,講解了AI在各個場景的應用情況。
第9章:大模型應用的兩種創新
分析了大模型在行業中可能引發的漸進式創新和顛覆性創新,以及企業如何利用大模型進行創新。
蒸汽機時代催生了工廠制,工人集中于工廠,生產分工專業化,整體效率提升。電氣化初期,工廠僅替換中央動力源的蒸汽機,未改變集中驅動架構,效果不佳。經濟史學家小沃倫·迪瓦恩指出,問題在于未充分利用電動機的靈活性。若每臺機器配備獨立電機,擺脫傳動軸,可大幅提高靈活性,優化生產流水線布局,減少動力故障影響,提高生產率。1929年,電動機提供全美工廠80%機械動力,被視為“第二次工業革命”的催化劑。
第10章:知識工作型應用
探討了大模型在知識密集型產業中的應用,如教育、法律和政府工作等領域。
第11章:企業業務型應用
討論了大模型在企業業務流程中的應用,如市場營銷、客戶服務和產品設計等。
第12章:創意娛樂型應用
分析了大模型在創意產業中的應用,如內容創作、娛樂和個人IP打造等。
第13章:大模型應用的三重境界
提出了大模型應用的三個層次:個人效率提升、業務流程優化和全新業務模式的創造。
第一重是個人使用,提高工作效率,探索應用成熟度,注意數據保密。
第二重是嵌入業務流程,調整流程和崗位,進行質量審核,可與供應商簽訂服務等級協議,評估應用成熟度和優先級。
第三重是重新設計業務,進入新市場,創建新模式,適合初創企業或獨立團隊,追求顛覆式創新和市場增量。
整體效益最大化需考慮業務環節的信息量和容錯率。
第4四篇:產業篇,介紹了AI大模型的產業鏈,投資機會。
第14章:大模型產業拆解
詳細拆解了大模型產業的四個層次:硬件基礎設施、軟件基礎設施、模型MaaS層和應用層。
第15章:關于大模型產業的對話:第1集
通過對話形式,討論了大模型的商業化、技術挑戰和社會影響。
V姐認為國內GPU在推理場景有優勢,未來需求量大。老A指出推理GPU是邊際服務成本,類似互聯網視頻初期的帶寬成本。V姐預測推理成本會下降,甚至可能轉移到用戶終端。小柯提到LLaMA-13B推理成本已降低,但仍需優化算力效率。老A強調模型推理成本應低于替代人時的價值,選擇高價值應用場景才能盈利。V姐總結模型推理成本應低于替代人時的價值,選擇高價值應用場景才能盈利。
第16章:寒來暑往幾度:AI泡沫與機遇
反思了AI技術發展中的泡沫和機遇,以及如何避免過度樂觀和悲觀。
第17章:關于大模型產業的對話:第2集
繼續通過對話形式,深入探討了大模型的商業潛力、技術挑戰和未來發展方向。
作者討論AI原生應用的特點,具體包括:
充分利用新技術特性:從設計之初就圍繞新技術(如云計算、大模型)進行優化,發揮其最大優勢,而非簡單嵌入現有系統。
類人交互與任務:設計“類人”的交互和任務,視模型為人類,使用自然語言進行交流,期待模型執行復雜任務,如同請人類助手辦事。
高價值任務:將模型用于高價值、專業性強的任務,對標高薪人類助理或專業教練,避免低價值、簡單重復的工作。
個性化與定制化:提供深度個性化的虛擬人物或角色,允許用戶定制模型,增強用戶黏性和社區化。
多模態輸入與輸出:結合AR眼鏡等技術,接收圖像、視頻等多模態輸入,提供更豐富的交互體驗。
長期記憶與個性化服務:模型具備長期記憶能力,了解用戶歷史,提供個性化、持續的服務,形成高競爭壁壘。
這本書全面覆蓋了大模型技術的發展、應用及其對社會的深遠影響,為讀者提供了一個關于大模型時代的全方位視角。由于作者有在AI一線工作創業的經歷,內容比較詳實生動,干貨滿滿,非常值得一讀。