精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
當我們追Generative AI,我們到底追什么?

高小山說

2022年年底,由人工智能實驗室OpenAI發布的對話式大型語言模型ChatGPT,以其強大的信息整合和對話能力驚艷全球,兩個月內月活用戶突破1億,有人驚喜,有人狂熱,有人惶恐:ChatGPT究竟是什么?它為何這么強大?AI可以代替人類思考嗎?

2023年2月15日晚,百姓網創始人王建碩做客高山書院,與同學們一起進行了一場關于ChatGPT的主題討論會,課堂上同學們百家爭鳴、各抒己見。

討論結束后,主持人李可佳同學更是將“各家思想”融會貫通,寫出了一篇“課后感想”。

高山書院崇尚“沒有受教,求知探索”,任何新鮮事物面前,我們都愿意用一顆虔誠好學的心態去接受和理解。歡迎更多人與我們一起學習探討~

李可佳

Monad Infinity Venture Partner 

原字節跳動智慧教育CEO

高山書院2020級同學

張首晟獎學金獲得者

高山科學促進中心秘書長

AGI 即Artificial general intelligence(通用人工智能),ChatGPT(全名:Chat Generative Pre-trained Transformer)是由OpenAI開發的一個人工智能聊天機器人程序,Generative AI 指生成式人工智能,是一個廣泛的標簽,可用于描述任何一類人工智能。

作為一個計算機專業的畢業生,我第一次聽說GPT已經是比較晚的時候了。2020年的7月份,GPT-3橫空出世,我一個老同學興奮地發了個朋友圈:“請注意,現在站在你面前的是互聯網原子彈、人工智能界的卡麗熙、算力吞噬者、黃仁勛的新 KPI、下崗工人制造機、幼年期的天網——最先進的AI語言模型GPT-3。” 我隨手評論三個字:拉倒吧。

今天沒有人敢小看ChatGPT,就連無數對“先進”抱有迷思的程序員們,也被當頭棒喝:口碑并不來自于絕對先進,而是來自于超出預期。

與之前很多被過度炒作的熱門技術不同,Generative AI的繁榮伴隨著真實市場的實際收益,以及來自真實公司的真正吸引力。Stable Diffusion和ChatGPT等模型正在創造用戶增長的歷史新紀錄,多個應用程序在推出后不到一年的時間就達到了1億美元的年化收入。對照表明,人工智能模型在有些領域中的表現已經優于人類多個數量級

秦國能夠統一六國,最重要的原因之一是“弩”的存在。其實弩作為一個武器好像沒那么好用,射程沒有特別遠,殺傷力跟弓箭也差不太多,但是弩跟弓相比,有一個最大的特點,就是不需要力量訓練。其實拉弓需要的核心力量是非常大的,所以古代那些拉弓射箭的士兵都非常健壯;但是弩是用機械的力量把弦上上去,然后用扳機來發射,普通人就能操作,大大降低了成為一個戰士的門檻,有些學者把它解釋為“扳機效應”。
ChatGPT不是一顆互聯網原子彈,而是給了每個普通人一把“弩”。一顆原子彈再厲害,其最大作用還是藏在發射井里;而弩的出現,意味著一切逆流都將是插曲。隨著身邊越來越多的朋友都在開始圍繞ChatGPT進行創業和投資,我很想搞清楚,當他們都在說投資AGI,投資ChatGPT相關產品,他們具體投資什么?


相對確定的信息

(部分摘錄)

01

我們不能貿然把ChatGPT當通用智能(認為有智慧)(不管怎么定義智慧)它本質就是語言模型,不是邏輯或者計算模型,它的最強項還是語言的理解、組織和輸出,可以理解成是翻譯官(它是個“文科生or文字工作者”)

開頭提到的GPT-3就是一個針對語言的模型,期間它做了兩個關鍵變型,一是WebGPT,搭建基于文字的頁面瀏覽環境,教GPT-3上網查詢,在生成結果的同時生成引用來源,相對GPT-3大幅提升生成內容信息量和事實性;二是InstructGPT,基于用戶反饋的強化學習RLHF,將語言模型的輸出與用戶的意圖非常好地align(對齊/相關)起來,這是InstructGPT的核心所在。

ChatGPT恰恰是建立在InstructGPT基礎之上,使用基于人類反饋的監督學習和強化學習在GPT-3.5之上進行了微調的產物。(這部分信息很枯燥,但我認為很關鍵,知道技術路徑有利于了解邊界和瓶頸)

02

大模型不是一種新技術,但代表了一個新的技術范式。

我們可以做個比喻,它其實代表著從以前“大煉模型”(各自研發專用小模型),到“煉大模型”(研發超大規模通用智能模型)的一個轉變。這個轉變有很重要的意義:通過這種比較先進的算法架構,盡量整合可能多的數據,匯集大量算力,集約化的訓練模式,從而供大量用戶使用。

但從某種意義上來說,它是從小農經濟到大規模生產的一個很重要的變化,就像當初電網的變革一樣,此前自己發電,而今天要用AI,就不需要再做模型了,而是用已有的大模型,以一種服務方式提供給用戶。這很可能會改變信息產業的格局,改變以前作坊式AI開發模式,把AI應用帶入基于互聯網、云計算的大規模智能云階段。(以上摘錄自張宏江教授講話)

03

對創業者友好的的地方是:如當初電網的變革一樣,此前自己發電,今天要用 AI,就不需要再做模型了,而是用已有的大模型,以一種服務方式提供給用戶。

重點結合技術和產業的雙重優勢,通過微調方式能夠把大模型能力有效轉移到各種不同的應用場景中間,不再需要自己重新從零開始做模型,從而大大降低開發成本,使得它的應用會變得更加迅速、更加有效。

04

問題也很明顯:許多應用程序也相對沒有差異化,因為它們依賴于類似甚至相同的底層大模型,并且沒有發現競爭對手難以復制的明顯網絡效應或數據/工作流。

下面分應用、模型、基礎設施三個層面展開說說

Applications(應用):將生成的AI模型集成到面向用戶的產品中的應用程序,運行自己的模型管道(“端到端應用程序”)或依賴第三方API。

垂直整合(“產品及模型”)。細分領域從頭開始訓練以建立防御能力,但這是以更高的資本要求和更不靈活的產品團隊為代價的。

e.g:

[Novel AI](https://novelai.net/)可以幫助作者生成動漫角色;

[Make a Video] (https://makeavideo.studio/)可以直接生成小視頻。

重能力而非產品。 Generative AI在用戶已經工作的地方集成AI,是全新的產品設計思路,因為UI通常只是一個文本框,可以兼容桌面應用程序、移動應用程序、Figma/Photoshop插件、Chrome擴展程序、Discord機器人甚至是傳統客服中心。但是否延續移動互聯網時代的邏輯,也就是往往最大的公司直接面向終端用戶的應用程序?還無法定論。

通過炒作周期和區域進行管理。新鮮感和炒作過后,留存率是否會提升?相關政策和法規在不同國家地區是否存在不同路徑?這些問題對應用程序公司具有重要意義,包括何時加速籌款、如何積極地投資于客戶獲取、優先考慮哪些用戶細分、以及何時宣布產品市場契合度。

Models(模型):為AI產品提供動力的模型,可以作為專有API或開源檢查點提供高達數千萬或數億美元的大規模模型訓練費用。專有產品交互數據和稀缺的AI人才,注定是高資本和科技巨頭的競爭核心。

開源:Stable Diffusion的例子表明,如果開源模型達到足夠的性能水平和社區支持,那么專有替代品可能會發現難以競爭。

API 接口服務:對專有API(例如來自 OpenAI)的需求正在迅速增長。OpenAI有潛力成為一項龐大的業務,隨著越來越多的殺手級應用程序的構建,它在所有NLP類別的收入中占據很大一部分——特別是如果它們順利集成到Microsoft的產品組合中。

托管或訓練服務:包括垂直性訓練、大模型運營管理訓練等。在美國公司Hugging Face發展比較快,專門做大模型的訓練和推廣,尤其是一些開源的推廣。

Infrastructure(基礎設施):為Generative AI運行訓練和推理工作負載的基礎設施供應商(即云平臺和硬件制造商)

Generative AI幾乎所有時候都運行在基于云托管的GPU(或TPU)環境中。因此,生成人工智能市場的大量資金最終流向了基礎設施公司。據國外媒體統計,今天生成人工智能總收入的10-20%流向了云提供商。

最重要的是,訓練自己模型的初創公司已經籌集了數十億美元的風險投資——其中大部分(早期高達 80-90%)通常也用于云提供商。許多上市科技公司每年花費數億美元用于模型培訓,要么與外部云提供商合作,要么直接與硬件制造商合作。

主要是三大云:亞馬遜網絡服務 (AWS)、谷歌云平臺(GCP) 和Microsoft Azure。Nvidia是當前最大贏家,因為他們提供了稀缺硬件(例如 Nvidia A100 和 H100 GPU),本質上得益于他通過數十年來對GPU架構的投資、強大的軟件生態系統以及在學術界的深入使用,他們圍繞這項業務建立了強大的護城河。

也有一些初創公司如Coreweave和Lambda Labs,憑借專門針對大型模型開發人員的解決方案迅速成長。他們在成本、可用性和個性化支持方面展開競爭。

由于大多數AI工作負載是無狀態的,因為模型推理不需要附加的數據庫或存儲(模型權重本身除外)。這意味著AI工作負載可能比傳統應用程序工作負載更易于跨云移植。在這種情況下,客戶更容易流動,給新入場的設施提供商創造了一點機會。

不確定、有疑問的信息

(部分摘錄)


根據可用數據,尚不清楚生成式AI是否會出現長期的、贏者通吃的動態。

01

今天,生成式人工智能似乎沒有任何系統性的護城河。作為一階近似,應用程序缺乏很強的產品差異化,因為它們使用相似的模型;模型面臨不明確的長期差異,因為它們是在具有相似架構的相似數據集上訓練的;云提供商缺乏深度的技術差異化,因為他們運行相同的GPU;甚至硬件公司也在同一家工廠生產芯片。當然,還有標準的護城河:規模護城河(“我擁有或可以籌集到比你更多的錢!”)、供應鏈護城河(“我有GPU,你沒有!”)、生態系統護城河(“每個人都已經在使用我的軟件了!”)、算法護城河(“我們比你聰明!”)、分銷護城河(“我已經有一個銷售團隊和比你更多的客戶!”)和數據管道護城河(“我在互聯網上的爬行比你還多!”)

但從長遠來看,這些護城河都不會持久。現在判斷強大、直接的網絡效應是否在堆棧的任何層中占據主導地位還為時過早

02

例如,如果最終產品的主要差異化是AI本身,那么垂直化(即將面向用戶的應用程序與本土模型緊密耦合)很可能會勝出。而如果AI是更大的長尾特征集的一部分,那么它更有可能發生水平化。

當然,隨著時間的推移,我們還應該看到更多傳統護城河的建立——我們甚至可能會看到新型護城河站穩腳跟。

03

維特根斯坦說:“語言的邊界就是思想的邊界”。人類的邏輯是建立在語言的基礎之上的,賭大語言模型LLM是通往AGI的最佳路徑正是OpenAI到目前為止勝出的原因。

出門問問CEO李志飛說:“模型學會了非常底層的結構和機制。萬物都是自然產生的,語言也好,生物結構也好,它一定符合某種我們目前難以解釋的規律。模型經過互聯網上所有的數據訓練之后,它也獲得了某種屬于自己的解讀方式。”  這種說法我很期待,但并不確定,如果現實世界有一種語言,這種語言只可能是數學,但ChatGPT明顯是一個文科教授 理科小白。

引入的兩個新視角

1. ChatGDT是一場價值鏈解綁的新革命

Ben Thompson在其文章《The AI Unbundling》中提到一個觀點:創意的價值鏈一直在被解綁。

當我們希望一個創意最終被消費時,大抵經歷了以下步驟:

Creation (創意)

Substantiation (實現)

Duplication(復制)

Distribution(分發)

Consumption(消費)

如果從媒介的進化來看,這個過程是在不斷被解綁:

書寫之前,內容從創造到消費必須是即時的。一個優秀的說書人要同時兼備有創造力、好的記憶力、適當的名氣、足夠的體力以及聽眾的配合,才能讓創意被消費掉。

書寫解決了內容留存問題。內容的創造和消費,可以異步進行。

古登堡的印刷術解決了復制問題,讓人們可以大規模地復制與傳播內容,宗教革命和文藝復興也因此而誕生。現在創作的人只需要關注創意和實現,而復制和分發誕生了傳媒行業,價值鏈在進一步解綁。

互聯網讓分發不再依賴于傳統物理媒介,打破了效率瓶頸,讓信息傳遞成本幾乎降至免費。

現在還剩一個綁定的部分,即想法到創造的現實。而AI正在打破這個綁定。比如一個小說家,可以不需要再經過十幾年的訓練,就可以為自己的小說配上插圖。而那些有創意的人,將會不再需要依賴其他人幫忙,就能直接實現自己的想法。

當價值鏈上的各個環節每次被打破時,對應的商業模式也會被重塑,供給方和需求方的訴求也會發生變化。ChatGPT可以讓所有知識勞動者做一次個體的數字化轉型。

個體需要開始解綁自己的“工作”,拆解成不同的“任務”,對應不同的“技能”,然后在不同技能上使用不同的AI來替換或支持,重新設計工作流,達到強化自己的效果。

這是最壞的時代,因為必然有大量的就業崗位消失;這也是最好的時代,因為對用好AI的少數人來說,“組團隊”只需要過去10%的資本量。

2. Generative AI是個超級UI(接口)

昨天(2023年2月15日)百姓網建碩參加我們高山書院內部的一個討論,他提到說ChatGPT給他帶來的興奮感,和90年代第一次看到網景瀏覽器(Netscape Navigator)一樣,通過這個窗口看到了新的世界、新的時代。而在此之前只能用語言和命令,能玩轉的就是高級人才了,反正普通人是上不了的,太過于復雜。

我們與任何系統之間都有一個“界面”,也可以稱為“接口”,通過這個接口將系統內部的結構信息傳達給用戶;這個接口有時候是抽象的,也可以是具象的人,比如律師、醫生、財務顧問等,都是鏈接我們另一個復雜系統的接口。

一個好的接口能提高用戶的使用效率與頻次,繼而催生出一個高效流動的市場(如鏈家、多抓魚、TableAu)。復雜系統的接口特別稀缺,所以往往非常昂貴。

我的另一位朋友任鑫,他覺得Midjourney是最好的產品,因為僅通過一個對話框,輸入一些提示詞就能得到遠超預期的計算機繪畫作品。從web到移動端,那些曾經被奉為圭臬的交互設計原則都將回歸到一個對話框,并且從形態來講,它不再是一個靜態的東西。

這個對話窗口背后,是大模型跟數據,是業務高度融合,是動態迭代發展的一個存在,它是個service,下面不停地變,不停地融合。

這不得不讓我想起首晟教授提到的那個第一性原理:“分久必合 合久必分”。ChatGPT讓普通人第一次可以使用自然語言,通過這種跨越所有交互與數據操作之上的通用界面,對信息世界“編程”,并且獲得自己所需要的能力。

這是一次“接口”的革命,它無處不在,而且非常廉價。

因為利用弩這種不需要核心力量訓練的武器,就可以非常迅速、有效地把大部分普通人變成士兵。由此,秦國就最早地發展了一種“動員技術”。我們中國人有一句俗話叫“街坊四鄰”,為什么是四鄰呢?因為古代的基本社會組織是“五人為一伍”,除了你之外還有四家,這四家叫四鄰。

這個跟商鞅變法結合在一塊兒就更厲害了。商鞅變法推行耕戰制:你平常沒事干的時候就種地,該打仗的時候就打仗。如果沒有努,這些種田的普通人上了戰場也沒什么用。

弩這種兵器并不是秦國最早使用,而是韓國最早使用,但是秦國的制度用得最好。當戰國時代開始的時候,這個技術進步使得老百姓都能參與到戰爭中去。所以并不是說這個技術是秦國獨有的,而是秦國的政治制度和這個技術結合得好。





參考文獻

[1] https://mp.weixin.qq.com/s/30BZy4bEiehULF2rLS-GgQ

[2] https://a16z.com/2023/01/19/who-owns-the-generative-ai-platform/

[3] https://stratechery.com/2022/the-ai-unbundling/?access_token=eyJhbGciOiJSUzI1NiIsImtpZCI6InN0cmF0ZWNoZXJ5LnBhc3Nwb3J0Lm9ubGluZSIsInR5cCI6IkpXVCJ9.eyJhdWQiOiJzdHJhdGVjaGVyeS5wYXNzcG9ydC5vbmxpbmUiLCJlbnQiOnsidXJpIjpbImh0dHBzOi8vc3RyYXRlY2hlcnkuY29tLzIwMjIvdGhlLWFpLXVuYnVuZGxpbmcvIl19LCJleHAiOjE2NjU1ODMyNzEsImlhdCI6MTY2Mjk5MTI3MSwiaXNzIjoiaHR0cHM6Ly9zdHJhdGVjaGVyeS5wYXNzcG9ydC5vbmxpbmUvb2F1dGgiLCJzY29wZSI6ImFydGljbGU6cmVhZCBhc3NldDpyZWFkIGNhdGVnb3J5OnJlYWQiLCJzdWIiOiJBSnZzdjRjUnpDUFJVUGFVak50TDM0IiwidXNlIjoiYWNjZXNzIn0.XCngE9iQVgfrp74zwncCO-7ObrHsyi6TVufZLauXAMUMhzv8eUGZSa7WMXDBc0I1ykv8HsNMpF4zP2e8bUWgW7PdP2fd77aTbisoWCkVwf25BaVSDa2TKZYBl0gWjOMKua9_or_q2pYUpggI4K76aHWuFs2JXmV6Z-mWY3E8nsw8-c76VCfKL-YcFuzqBTlN8k-TZsQkpC54o5v7C5zoUOsOhb2GmNc9DasjTrYpGuTlvPcPfalMDFa7UWb_l7RJtMHm_wD_kKkWO-4Nx_upqgMXCth7W8I

[4] https://www.lesswrong.com/posts/hyShz2ABiKX56j5tJ/interfaces-as-a-scarce-resource



關于高山書院



高山書院以“科學復興”為愿景,以“沒有受教,求知探索”為理念,以“公心大用,智識生活”為共識,引導企業家、創業者及各界知名人士學習科學,同時向社會傳播科學精神和科學知識。高山書院是一個什么樣的地方?

作者 | 李可佳

編輯丨朱珍

排版 | 向桃

熱愛科學的人都在這里!
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
AIGC第一波裁員已至
“開源軍團”來勢洶洶,OpenAI還能堅挺多久? 轉載
谷歌敗走AI啟示錄:沒有無堅不摧的護城河
華泰 | 計算機: ChatGPT深度拆解
一文搞懂ChatGPT相關概念和區別:GPT、大模型、AIGC、LLM、Transformer、羊駝、LangChain…..
有道類ChatGPT模型“子曰”即將開放內測,垂類模型有機會嗎?
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 定陶县| 台中市| 清水县| 桃园县| 大同县| 南丰县| 安阳县| 武鸣县| 自贡市| 渭南市| 松滋市| 木兰县| 八宿县| 霍山县| 仁布县| 旌德县| 万源市| 行唐县| 石首市| 建水县| 通榆县| 进贤县| 全州县| 和田市| 河西区| 桦南县| 沙坪坝区| 静海县| 富蕴县| 舒兰市| 余干县| 靖西县| 玉屏| 科技| 紫云| 临湘市| 钦州市| 台山市| 平乐县| 阿鲁科尔沁旗| 海淀区|