精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
Karpathy看好的Agents學會自動退換貨了!英偉達H100加持,給LLM插入最強外接大腦


  新智元報道  

編輯:編輯部
【新智元導讀】全世界最有「料」的平臺來了!Amazon Bedrock基礎模型上新,商用Agents加快應用開發,矢量引擎賦予大模型記憶,亞馬遜云科技憑借技術創新成為端到端的生成式AI領導者。

最近,AI圈依然是大事頻發,幾天一個爆炸性新聞。
Meta聯手微軟高調開源了Llama 2,它在2萬億個token上訓練,秒殺許多開源語言模型,并且還能免費商用。
OpenAI科學家Karpathy最近搞的明星項目「Baby Llama」,已經可以用C語言跑Llama 2 7B了。
而就在幾天前,Stability AI正式發布了下一代文生圖模型——Stable Diffusion XL 1.0。
這次的1.0版本是Stability AI的旗艦版生圖模型,也是最先進的開源生圖模型。
在目前的開放式圖像模型中,SDXL 1.0是參數數量最多的。官方表示,這次采用的是全新的架構,基礎模型的參數規模達到35億,同時還有一個66億參數大小的細化模型。
而如此強大的生圖模型,已經可以在Amazon Bedrock上一鍵訪問了!

基礎模型全面上新

就在上周,亞馬遜云科技發布了一大波基礎模型上新。
除了剛剛提到的SDXL 1.0,Amazon Bedrock還增加了對Cohere基礎模型以及ChatGPT最強競品——Anthropic的Claude 2的支持。
Cohere研發的大語言模型Command,是一個能夠接受用戶個性化命令訓練的模型,專注于提供文本搜索、文本分類和文本生成三大AI能力。
另外,Anthropic推出的Claude 2,其處理能力已經更新到10萬個token。相較之前版本,Claude 2在數學、代碼、推理能力方面有明顯的提升。
同時,開發者還可以通過機器學習中心Amazon SageMaker Jumpstart,一鍵開發各類熱門開源模型。
比如,Meta最新的Llama 2、世界最大開源社區Hugging Face托管的Falcon、Flan等等。

Agents改變游戲規則

不過,基礎模型雖然在各種任務上有強大的泛化能力,但隨著應用場景的不斷擴展,僅靠模型本身已經很難去完成一些復雜的任務了。
比如預定航班或退回購買的商品這種簡單的任務,開發者都必須經歷多個步驟——通過提供特定的說明和配置、訪問相關知識源、編寫代碼將任務分解,然后應用才能通過一系列API調用采取行動。
在這個過程中,開發者必須配置和管理基礎架構,設置數據安全和隱私策略,繁瑣又耗時。
而前段時間AutoGPT的爆火,則給了學界和工業界一個全新的探索方向——集成了大語言模型的Agents。

Karpathy曾將AutoGPT稱為快速工程的下一個前沿
概括來說,AI智能體可以通過最簡單的形式運行循環,并且在每一次的迭代中,都會生成自主指令和操作。因此,它們既無需依賴人類來引導對話,還具有高度的可擴展性。
以AutoGPT為例,我們每分配一個任務,它都會給出一個相應的解決計劃。
比如,需要瀏覽互聯網或使用新數據,它便會調整其策略,直到任務完成。這就像擁有一個能處理各種任務的私人助手,如市場分析、客戶服務、市場營銷、財務等。
正如今年加入OpenAI的大牛、前特斯拉AI總監Karpathy所說:「Agents代表著AI的一種未來。」
亞馬遜云科技也在這個領域進行了自己的探索,并且創新性地提出了全新的Amazon Bedrock Agents。
基于Amazon Bedrock提供的Agents功能,開發者可以輕松創建各種生成式AI應用,來完成復雜任務,并根據專有知識源提供最新答案。
以往得耗費幾個小時編碼來實現的過程,現在無需任何手動編碼,只要單擊幾下,Agents就能自動分解任務,創建計劃。
這樣一來,生成式AI應用程序分分鐘就搞出來了。
那么,Amazon Bedrock Agents是如何讓基礎模型加速工作流的呢?具體可分為以下四個步驟:
第一步:定義指令和編排,將復雜任務分解為多個步驟
第二步:檢索增強生成(RAG),配置FM與公司數據互動
第三步:完成交互,執行API調用以滿足用戶請求
第四步:在云中安全托管
Amazon Bedrock Agents可以通過簡單的API鏈接到公司數據,將其轉換為機器可讀的格式,就能生成準確響應。然后自動調用API,滿足用戶請求。
基于Amazon Bedrock,用戶可以任意選擇適合自己用例的基礎模型,然后用自然語言給它下指令。
比如告訴它,「你現在是一個智能體,需要幫助處理保險索賠和管理待處理文書的工作」。
然后,對Agents發出命令「向所有有未結索賠和待處理文書工作的保單持有人發送提醒」,它馬上理解了我們的請求,把任務分成多個步驟——收集未結保險索賠、查找索賠 ID、發送提醒,然后執行了相應的操作。
而且,有了Amazon Bedrock Agents的功能,用于電商的AI程序不僅可以回答簡單的問題,還能完成復雜的任務,比如更新訂單、管理交易。
比如,客戶發出想要退回一雙鞋,可以直接說:「我想把這雙黑色鞋換成棕色的」。
Agents收到信息后,就會連接到公司數據,自動將文本轉換成機器可讀格式,向模型提供相關信息,然后調用正確的API來滿足這一請求。

英偉達H100最強加持

然而,基礎模型性能不斷提升,所帶來的是動輒幾百萬億的參數。
這種復雜性的暴漲,也極大地增加了模型訓練和微調的時間——最新的LLM需要數月的時間來進行訓練。
與此同時,HPC領域也呈現出了類似的趨勢。隨著精度的提高,用戶收集的數據集已經達到了Exabyte級別。
為了滿足高性能和可擴展性的算力需求,亞馬遜云科技全新推出了搭載英偉達最強GPU——H100的Amazon Elastic Compute Cloud(EC2)P5實例。
相較于上一代,Amazon EC2 P5 實例不僅可以將訓練時間縮短高達6倍(從幾天縮短到幾小時),而且還能使訓練成本降低高達40%。
具體來說,Amazon EC2 P5 實例共搭載了8個NVIDIA H100 Tensor Core GPU,配備640 GB高帶寬GPU顯存,同時還有第三代AMD EPYC處理器、2 TB系統內存、30 TB本地NVMe存儲,以及高達3200 Gbps的總網絡帶寬。
堪稱配置拉滿的性能,為最苛刻、計算密集的生成式AI應用提供了支持,包括問答系統、代碼生成、視頻和圖像生成、語音識別等,非常適合訓練和運行日益復雜的LLM和CV模型。
基于全新的Amazon EC2 P5 實例,用戶可以探索此前難以觸及的問題,并且更快地迭代出解決方案。
此外,為了滿足用戶對大規模和低延遲的需求,亞馬遜云科技還推出了搭載有Amazon EC2 P5實例的第二代EC2 UltraClusters。
作為云中規模最大的ML基礎設施,EC2 UltraClusters可提供高達20 exaflops的總計算能力,以及跨20,000多個NVIDIA H100 GPU的低延遲。

給模型插入「外接大腦」

從智能體的構建中我們不難看到,所有基于大模型搭建好的應用,想要獲取實時數據,都需要建立在檢索增強生成(RAG)之上。
而這一技術是向量數據庫能夠在AI應用中發揮重要作用的根本。
為什么這樣說?那就得看看,檢索增強生成能實現什么。
比如,當你問ChatGPT「芭比」電影好看嗎?
顯然,ChatGPT是無法及時回復最新的相關信息。這對于企業來講,用戶咨詢最新內容時,應用無法做出回應,大大降低了生產力。
有了檢索增強生成,便能夠補充特定領域的知識。大模型參數雖大,但無法記住許多長尾數據,還需要通過搜索召回相關領域的知識。
這里,對專業領域知識的補充就離不開,向量數據庫、搜索引擎等。
另一方面,大模型的知識很容易過時,僅靠微調模型,讓知識更新是行不通的。
微調模型需要耗費大量算力、時間,關鍵是天天微調根本不現實。
要知道,對于企業來講,業務數據必須是實時的。因此向量數據庫、搜索引擎都能夠幫助模型,獲得新數據,同時重訓模型周期也被拉長。
由于向量數據庫對「高維嵌入」有強大的檢索能力,與大模型結合較為簡單,因此成為RAG最常用的數據存儲形式。
微軟Build大會上,曾介紹了其產品如何將較少的上下文感知LLM與向量搜索結合起來,來創造更有吸引力的體驗。
這其中基本的想法,也就是在LLM中,添加向量搜索,以進行檢索增強生成。
而向量化,就是將數據轉化為維度,如下你可以看到兩種維度:大小,和類型。
其中大小有兩個值(大和小),類型有2個值(樹和動物)。這只是一個概念例子,還可以擴展到更多的值。
除了圖片,還可以進行單詞/句子向量搜索,向量搜索能夠捕捉到語義表示。
假設你有數百個,甚至數萬個文檔數據庫作為背景,是無法放在ChatGPT提示框中,但可以通過向量搜索來縮小最有可能的包含答案的上下文。
對于數據庫,既可以儲存文檔和嵌入,也可以用來存儲查詢,并根據相關查詢來找到最相關文檔,這樣就可以通過?檔檢索增強LLM。
今年英偉達GTC大會上,黃仁勛首提向量數據庫,并推出了新庫RAFT,用于加速索引、數據加載和近鄰檢索。
其重要意義在于,向量數據庫是大模型的「海馬體」,能夠讓LLM實時進行信息召回。
通過把實時資訊、市場行情等實時變化的信息置入模型中,就能使其提供更精準的結果。
Amazon OpenSearch Serverless向量引擎
同樣在亞馬遜云科技峰會上,首次推出了——Amazon OpenSearch Serverless向量引擎。
開發者們通過這個工具,就可以輕松使用向量數據庫,快速構建基于大模型的搜索體驗。
總的來說,Amazon OpenSearch Serverless向量引擎引入了簡單、可擴展和高性能的向量存儲和搜索功能。
開發者可以快速存儲和查詢各種ML模型(包括Amazon BedRock提供的模型)生成的數十億個向量嵌入,響應時間僅為毫秒級。
當前,生成式AI大爆發,所有垂直領域的企業都在轉向這一熱潮,并探索通過集成高級對話生成AI應用程序,以改變用戶體驗,以及和數字平臺交互的方法。
亞馬遜云科技推出的這項工具,通過使用向量嵌入,能夠增強ML搜索和生成式AI。
向量嵌入在用戶私有數據上進行訓練,并能表示信息的語義和上下文屬性。
這樣做的優勢在于,能夠及時處理用戶的查詢,以查找最接近的向量,并將其與其他元數據組合在一起,進而無需依賴外部數據源或其他應用程序代碼集成結果。
值得一提的是,向量引擎是基于Amazon OpenSearch Serverless構建,因此無需擔心后端基礎架構的大小、調整和擴展。
所有數據都持久保存在Amazon Simple Storage Service (Amazon S3) 中。
當向量數量從原型開發時的幾千個增長到生產時的上億個甚至更多,向量引擎將無縫擴展,無需重新索引或重新加載數據來擴展基礎架構。
此外,向量引擎還為索引和搜索工作負載提供獨立計算,因此開發者可以實時無縫地攝取、更新和刪除向量,同時確保用戶體驗不受查詢性能的影響。
借助對Amazon OpenSearch Serverless的向量引擎支持,開發人員將擁有一個簡單、可擴展和高性能的解決方案,來構建機器學習增強的搜索體驗和生成性人工智能應用程序,而無需管理向量數據庫基礎設施。

全球生成式AI領導者

隨著數據量大爆發、可高度擴展算力的可用性、以及機器學習技術的進步,讓生成式AI足以改變每個行業。
因此,越來越多的企業希望快速采用最新技術,創造價值。
選擇正確的模型,使用公司數據安全定制模型,并將其集成到應用程序中是一個復雜的過程,都需要花費大量時間、和高度專業化的知識。
恰恰,亞馬遜云科技Amazon Bedrock簡化了這一流程,通過簡單的API訪問一流的基礎模型。
通過Amazon Bedrock Agents這一完全托管的服務,開發者能夠輕松創建基于生成式AI的應用程序,以完成各種用例的復雜任務。
其中Vector Database,能夠幫助開發者的應用程序實時存儲數據,及時召回信息,提供更好的用戶體驗。
Amazon EC2 P5 實例更是為模型訓練節省大量時間和算力。
基于以上的創新,真正詮釋了亞馬遜云科技是端到端的生成式AI領導者,幫助企業開發者釋放生成式AI的潛力,創造價值。
同時,亞馬遜云科技不斷降低生成式AI的門檻,更是致力于GenAI普惠的領導者。
前段時間,亞馬遜云科技剛剛宣布了編程助手Amazon CodeWhisperer可用,能夠使用底層基礎模型幫助開發人員提高工作效率。
它可以根據開發人員使用自然語言留下的注釋和IDE(集成開發環境)中的歷史代碼實時生成代碼建議。
這次,Amazon CodeWhisperer首次與Amazon Glue Studio Notebooks實現集成,能夠幫助用戶優化使用體驗,提高開發效率。
通過Amazon Glue Studio Notebooks,開發人員用特定語言來編寫任務,然后Amazon CodeWhisperer會推薦一個或多個可以完成此任務的代碼片段。
Amazon CodeWhisperer針對最常用的API進行了優化,例如Amazon Lambda或Amazon Simple Storage Service(Amazon S3),使其成為構建應用程序開發者們的絕佳編碼伴侶。
除此之外,亞馬遜云科技還提供了7門免費的技能培訓課程,幫助開發者以使用生成式AI。
其中,還聯手吳恩達推出了「用大型語言模型構建生成式AI」新課程。

醫療領域已有落地應用

今年這波AI大模型的浪潮,也激發了人們對生成式AI在醫療行業的應用的探索。
比如前幾天,谷歌發布了一個「通才生物醫學AI」——Med-PaLM M多模態模型。這個多模態生成模型能夠利用醫學的豐富數據,使用相同的模型權重集解釋臨床語言、醫學圖像和基因組學。
同樣,對于AI在醫療行業的應用,亞馬遜云科技也同樣有所行動,發布了一款面向醫療保健軟件提供商的全新服務——Amazon HealthScribe。
Amazon HealthScribe通過使用使用生成式AI的機器學習模型和語音識別,能自動起草臨床文檔,幫助臨床醫生轉錄和分析他們與患者的對話。
它的自然語言處理功能,還可以從對話中提取復雜的醫學術語,比如藥物和醫學狀況。病史、要點、就診原因,一應俱全。
Amazon HealthScribe中的AI功能,正是由Amazon Bedrock提供支持的,通過預訓練模型,用戶就可以從初創公司以及亞馬遜自身構建生成式AI了。
可以說,作為全球云計算的開創者,亞馬遜云科技看到了AI浪潮當下,生成式人工智能的潛力和重要性。
生成式AI能夠有改變每一個應用程序、每一個業務、甚至每一個行業。
數據處理、算力和機器學習的進步,正在加速許多企業從實驗到部署的轉變。
通過提供Amazon Bedrock等服務,以及與行業領導者的合作,這家公司正在普及對生成性人工智能的訪問。
在不斷創新的基礎上,亞馬遜云科技正在讓開發者,讓世界重新構想體驗,把最好的產品帶入生活。
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
大模型時代,亞馬遜AWS堅守長期主義
生成式AI的價值與機遇,這家云服務商給出了詳細解答
打造生成式AI應用,什么才是關鍵?
?亞馬遜加入AI競賽推出大語言模型Titan以及生成式AI服務Bedrock
OpenAI早就不卷大模型,開始卷AI Agents了?這是一篇來自OpenAI應用研究主管關于Agent的萬字長文
幾分鐘開發 AI 應用成為可能,為什么說大模型中間件是 AI 必備軟件?
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯系客服!

聯系客服

主站蜘蛛池模板: 比如县| 扶风县| 洛宁县| 库车县| 贵溪市| 克什克腾旗| 梨树县| 连南| 米脂县| 彭州市| 孝义市| 天全县| 江门市| 仪征市| 广安市| 吉林市| 台江县| 彩票| 凤山市| 宁德市| 独山县| 搜索| 武功县| 水城县| 长阳| 清丰县| 大兴区| 庆安县| 靖西县| 黄龙县| 沁源县| 望奎县| 普兰店市| 安阳市| 嘉定区| 泰宁县| 澄迈县| 芦山县| 永丰县| 平和县| 汉沽区|