精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
賈揚(yáng)清新作被某印度創(chuàng)始人內(nèi)涵借鑒,懶得糾纏:巧了,正準(zhǔn)備開(kāi)源,GitHub 見(jiàn)

1 月 25 日,LeptonAI 發(fā)布了一個(gè)基于自家服務(wù)的小 demo,用 500 行 Python 代碼實(shí)現(xiàn)了一個(gè)大模型加持的對(duì)話式搜索引擎。隨后,號(hào)稱要干掉谷歌搜索的 Perplexity 創(chuàng)始人聲稱 LeptonAI 在“借鑒”、“致敬”他們的產(chǎn)品。作為 LeptonAI 的創(chuàng)始人,賈揚(yáng)清在 Twitter 上進(jìn)行了公開(kāi)回?fù)簟4饲埃琇eptonAI 正打算開(kāi)源該演示工具的全部代碼。

事情經(jīng)過(guò)

LeptonAI 于近日發(fā)布了一個(gè)對(duì)話式搜索引擎 demo,名為“Lepton Search”。該 demo 界面主要是一個(gè)對(duì)話框,在對(duì)話框中輸入想問(wèn)的問(wèn)題后,Lepton Search 會(huì)根據(jù)提問(wèn),返回答案、對(duì)應(yīng)來(lái)源(Sources)、相關(guān)問(wèn)題(Related)。

截圖來(lái)源:https://search.lepton.run/

LeptonAI 以此為例,向大家解釋現(xiàn)在構(gòu)建一個(gè)人工智能應(yīng)用已經(jīng)相當(dāng)簡(jiǎn)單:這個(gè)演示程序,他們只用了不到 500 行 Python 代碼,后端是一個(gè)非常快的 Mixtral-8x7b 模型,運(yùn)行在 LeptonAI 自家的 playground 托管平臺(tái)上,正常情況下吞吐量可高達(dá)約 200 個(gè)令牌 / 秒。該搜索引擎目前建立在 Bing 搜索 API 上,用 Lepton KV 作為無(wú)服務(wù)器存儲(chǔ)。


原本是基于 LeptonAI 云平臺(tái)的一個(gè)簡(jiǎn)單 demo,沒(méi)想到賈揚(yáng)清在 Twitter 上發(fā)布演示視頻后,Perplexity 的創(chuàng)始人突然出現(xiàn),并發(fā)文感謝 LeptonAI 向他們“致敬”:“太棒了,看到 Perplexity 成為未來(lái)融資活動(dòng)的標(biāo)桿,前 Meta 和阿里巴巴高管都來(lái)取經(jīng)!這說(shuō)明 Perplexity 的影響力不局限于產(chǎn)品本身,而是輻射到了整個(gè)科技生態(tài)和行業(yè)發(fā)展,令人振奮!”


Perplexity AI 成立于 2022 年 8 月,總部設(shè)在舊金山。Aravind Srinivas 是 Perplexity AI 的創(chuàng)始人兼首席執(zhí)行官,2017 年從印度理工學(xué)院畢業(yè),考入加州大學(xué)伯克利分校攻讀博士學(xué)位,后來(lái)又在 OpenAI 擔(dān)任過(guò)一年的研究科學(xué)家。創(chuàng)始團(tuán)隊(duì)還包括 Denis Yarats 和 Johnny Ho,均具有人工智能相關(guān)背景。


截圖源自 The Wall Street Journal

2022 年 9 月,Perplexity 獲得 310 萬(wàn)美元的種子輪投資。2023 年 3 月,Perplexity 獲 2560 萬(wàn)美元 A 輪融資。今年 1 月,再獲英偉達(dá)領(lǐng)投的超 7000 萬(wàn)美元融資。

自 2023 年 12 月在亞馬遜云科技 re: Invent 主題上亮相后,Perplexity 就受到了廣泛關(guān)注,并得到了包括前 GitHub 首席執(zhí)行官 Nat Friedman 等在內(nèi)的一眾大佬熱捧。

Srinivas 的目標(biāo)是挑戰(zhàn)谷歌,他表示他自己是拉里·佩奇和谷歌的忠實(shí)粉絲:“我一直有做一些與谷歌同樣規(guī)模和雄心的事情的沖動(dòng)。”“目前看來(lái),世界似乎對(duì)谷歌仍感到滿意,他們的流量并沒(méi)有實(shí)質(zhì)性的變化。不過(guò),就像谷歌和 Facebook 改變了人們獲取新聞的方式一樣,遠(yuǎn)離傳統(tǒng)搜索引擎的轉(zhuǎn)變最終會(huì)發(fā)生。”

Perplexity 的一眾粉絲則表示 LeptonAI “借鑒”了他們的界面。


而其他粉絲則一臉懵“這是有專(zhuān)利嗎?人家只是演示而已。”


對(duì) Perplexity 的挑釁,賈揚(yáng)清大佬罕見(jiàn)地進(jìn)行了正面回?fù)簦皩?duì)話搜索”的領(lǐng)導(dǎo)者地位并不是來(lái)源于 Perplexity:“靈感在有一次賈揚(yáng)清和微軟最年輕的技術(shù)專(zhuān)家吳憂喝咖啡的時(shí)候,討論 RAG 的效果究竟是源自搜索還是源自大模型,為了分析這個(gè)問(wèn)題,所以自己手搭了一個(gè) demo,同時(shí)展示 Lepton 對(duì)于 AI 創(chuàng)作者的效率提升。值得一提的是,吳憂是微軟的搜索、對(duì)話式搜索等技術(shù)背后的核心技術(shù)領(lǐng)導(dǎo)者。”

并表示在發(fā)布這個(gè) demo 之初已經(jīng)聲明要開(kāi)源該演示工具的全部代碼當(dāng)天下午,LeptonAI 如約將其開(kāi)源,采用Apache-2.0 許可證

開(kāi)源地址如下:https://github.com/leptonai/search_with_lepton

會(huì)話式搜索引擎原理是什么樣的?

作為一款想取代谷歌的搜索引擎,從表面看來(lái),Perplexity 的工作原理是:當(dāng)用戶輸入一個(gè)查詢時(shí),它會(huì)理解并重新構(gòu)建這個(gè)查詢,從實(shí)時(shí)索引中提取出相關(guān)鏈接。然后,Perplexity 將回答用戶查詢的任務(wù)交給 LLM,要求它閱讀所有鏈接,并從每個(gè)鏈接中提取出相關(guān)段落整合內(nèi)容,最終形成一段精準(zhǔn)答案。

目前,大語(yǔ)言模型(LLM)主要面臨兩大挑戰(zhàn):數(shù)據(jù)陳舊、偶發(fā)幻覺(jué)。由于基礎(chǔ)模型所使用的預(yù)訓(xùn)練數(shù)據(jù)集具有明確的截止日期,因此無(wú)法根據(jù)最新數(shù)據(jù)做出響應(yīng)。即使是當(dāng)前最強(qiáng)大的模型,也往往會(huì)因數(shù)據(jù)過(guò)時(shí)而編造答案,也就是人們常說(shuō)的“幻覺(jué)”問(wèn)題。

對(duì)于無(wú)法訪問(wèn)最新數(shù)據(jù),可以有兩種方法,第一種是通過(guò)搜索引擎,通過(guò)執(zhí)行網(wǎng)絡(luò)搜索并向大模型提交輸來(lái)改善決策質(zhì)量。Perplexity AI 更依賴于這種方法。


第二種方法是,通過(guò)所謂檢索增強(qiáng)生成(RAG),這項(xiàng)成熟技術(shù)可以解決一定程度的“幻覺(jué)”問(wèn)題。與前面提到的動(dòng)態(tài)調(diào)用搜索 API 方法不同,RAG 強(qiáng)調(diào)從公開(kāi)數(shù)據(jù)存儲(chǔ)中檢索數(shù)據(jù),例如向量數(shù)據(jù)庫(kù)或者由外部維護(hù)的全文搜索索引等。


通過(guò)對(duì) Perplexity Copilot 底層技術(shù)的深入研究,還有專(zhuān)家稱其靈感來(lái)自論文《FreshLLMs:使用搜索引擎增強(qiáng)更新大語(yǔ)言模型》(FreshLLMs: Refreshing Large Language Models with Search Engine Augmentation)提出的搜索引擎增強(qiáng)大模型。

FreshLLM 提出了按搜索內(nèi)容的發(fā)布日期順序注入熱門(mén)搜索摘要的想法。除了添加上下文之外,文章還建議配合少量提示詞,引導(dǎo)大模型根據(jù)具體示例做出回應(yīng)。論文作者還嘗試了一種名為 FRESHPROMPT 的技術(shù)解決大模型無(wú)法回復(fù)實(shí)時(shí)問(wèn)題的局限性,這項(xiàng)技術(shù)將來(lái)自搜索引擎的最新上下文信息注入經(jīng)過(guò)預(yù)訓(xùn)練的大模型當(dāng)中。

面對(duì)給定問(wèn)題,這種方法會(huì)先在搜索引擎上查詢?cè)搯?wèn)題,檢索全部搜索結(jié)果,包括答案框、相關(guān)結(jié)果及其他有用信息(包括知識(shí)圖譜、公共問(wèn)答平臺(tái)上的信息,以及其他用戶搜索過(guò)的相關(guān)問(wèn)題等)。之后,再利用這些信息指導(dǎo)大模型對(duì)檢索到的證據(jù)進(jìn)行推理,基于多條提示詞改善模型輸出準(zhǔn)確響應(yīng)的能力。

Perplexity AI 底層以兩套在線大語(yǔ)言模型為基礎(chǔ),同時(shí)借助內(nèi)部數(shù)據(jù)承包商構(gòu)建起高質(zhì)量、多樣化的大型訓(xùn)練數(shù)據(jù)集,打造了這么一套大模型搜索產(chǎn)品。這兩套模型分別為 pplx-8b-online 和 pplx-70b-online,可以通過(guò) API 公開(kāi)訪問(wèn),允許開(kāi)發(fā)者將該技術(shù)整合進(jìn)自己的應(yīng)用程序與網(wǎng)站當(dāng)中。

在 RAG based search 中,召回 + 排序出相關(guān)內(nèi)容,然后再由模型來(lái)推理生成。在大模型同質(zhì)化的年代,對(duì)于對(duì)話式搜索引擎來(lái)說(shuō),召回 + 排序才是核心競(jìng)爭(zhēng)力。


而 LeptonAI,正如賈揚(yáng)清所說(shuō),他們焦點(diǎn)在于一個(gè)幫助開(kāi)發(fā)者構(gòu)建人工智能應(yīng)用程序的現(xiàn)代云平臺(tái),而不是做一個(gè)搜索引擎。那么基于此目的來(lái)通過(guò)調(diào)用已有基礎(chǔ)架構(gòu)方式構(gòu)建出來(lái)的搜索引擎,其實(shí)也相對(duì)簡(jiǎn)單,所以能用不到 500 行代碼來(lái)實(shí)現(xiàn)。

至于后續(xù)開(kāi)源工作,LeptonAI 表示將給吃瓜群眾奉上 GitHub 網(wǎng)址,InfoQ 會(huì)在第一時(shí)間將代碼同步到文章下的評(píng)論中。

內(nèi)容推薦

在人工智能領(lǐng)域,大模型已成為推動(dòng)技術(shù)革新和行業(yè)進(jìn)步的關(guān)鍵力量。這些模型不僅在自然語(yǔ)言處理領(lǐng)域取得重大突破,而且在圖像識(shí)別、語(yǔ)音合成等多個(gè)領(lǐng)域都展現(xiàn)了巨大潛力。為了深入探討這一領(lǐng)域,我們精選了 QCon 全球軟件開(kāi)發(fā)大會(huì)上一系列關(guān)于大模型應(yīng)用的精彩演講,并經(jīng)過(guò)嘉賓授權(quán),「AI 前線」特別為您提供這些演講的精彩 PPT。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
ChatGPT成為“X因素”,百度再度掀起搜索大戰(zhàn)?
大模型推理成本排行榜來(lái)了:賈揚(yáng)清公司效率領(lǐng)跑
AI搜索Perplexity來(lái)了,谷歌搜索真正有了對(duì)手
急了,急了!
Perplexity AI會(huì)話搜索引擎官網(wǎng)入口 Perplexity AI會(huì)話搜索引擎入口
a16z整理了AI大模型領(lǐng)域的經(jīng)典閱讀資料
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 茂名市| 绍兴市| 巩留县| 中江县| 泾阳县| 南涧| 博乐市| 武安市| 育儿| 海原县| 德钦县| 萍乡市| 湘西| 墨脱县| 紫金县| 伊春市| 达州市| 克什克腾旗| 榆林市| 瓦房店市| 甘谷县| 诸暨市| 北票市| 商丘市| 屏山县| 皮山县| 柏乡县| 七台河市| 屯昌县| 马关县| 奎屯市| 肇庆市| 金门县| 桐城市| 定陶县| 正阳县| 涟源市| 仙桃市| 襄城县| 大庆市| 顺平县|