精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
Stable家族上新!全新編碼工具StableCode,16000上下文,5個(gè)Python文件同編輯


yu  新智元報(bào)道  

編輯:桃子
【新智元導(dǎo)讀】「Stable」家族又上新了!全新編碼工具StableCode,最大支持16000上下文。

繼文生圖Stable Diffusion、SDXL1.0、語(yǔ)言模型StableLM之后,獨(dú)角獸Stability AI又放大招了。

剛剛,Stability AI宣布推出,首個(gè)用于編碼的生成式AI產(chǎn)品——StableCode。

StableCode提供了三種不同模型:通用基本模型、指令模型,已經(jīng)支持多達(dá)16,000個(gè)token的長(zhǎng)上下文窗口模型。

目前,它能夠支持Python、Go、Java、JavaScript、C、markdown和C++編程語(yǔ)言的開發(fā)。

建在BigCode之上


具體來(lái)講,StableCode通過(guò)使用3種不同的模型,來(lái)幫助程序員們編碼,從而提高效率。

我們都知道,訓(xùn)練任何大模型都依賴于數(shù)據(jù),對(duì)于StableCode,這些數(shù)據(jù)來(lái)自BigCode項(xiàng)目。

其實(shí),使用BigCode作為L(zhǎng)LM生成AI代碼工具的基礎(chǔ)并不是一個(gè)新想法。

5月,HuggingFace和ServiceNow早就推出了向公眾開放的StarCoder LLM,它就是基于BigCode打造的。

基礎(chǔ)模型首先在BigCode的堆棧數(shù)據(jù)集(v1.2)中的各種編程語(yǔ)言上進(jìn)行訓(xùn)練。

Stability AI的首席研究科學(xué)家Nathan Cooper在采訪中表示,StableCode的訓(xùn)練涉及對(duì)BigCode數(shù)據(jù)的重要過(guò)濾和清理。

然后,再使用Python、Go、Java、Javascript、C、markdown和C++等流行語(yǔ)言上進(jìn)行進(jìn)一步訓(xùn)練。

總的來(lái)說(shuō),Stability AI在HPC集群中560億的token上訓(xùn)練了模型。

基礎(chǔ)模型訓(xùn)練完成后,指令模型針對(duì)特定用例進(jìn)行調(diào)整,以幫助解決復(fù)雜的編程任務(wù)。

大約120,000個(gè)以Alpaca格式的代碼指令/響應(yīng)對(duì)在基礎(chǔ)模型上進(jìn)行了訓(xùn)練。

使用StableCode Instruct生成對(duì)給定指令的響應(yīng)代碼

16000上下文,5個(gè)Python文件同編輯


StableCode 是那些希望學(xué)習(xí)更多編碼知識(shí)的人的理想構(gòu)件,而更長(zhǎng)上下文窗口模型則是確保為開發(fā)者提供單行和多行自動(dòng)完成建議的完美助手。

該模型可同時(shí)處理更多代碼(比之前發(fā)布的上下文窗口為16,000個(gè)token的開放模型多2-4 倍)。

這樣,開發(fā)者們可以同時(shí)查看或編輯相當(dāng)于5個(gè)平均大小的Python文件。

Cooper解釋說(shuō),更長(zhǎng)的上下文可以使用更專業(yè)和復(fù)雜的代碼生成提示。這也意味著開發(fā)者們可以讓StableCode查看包含多個(gè)文件的中型代碼庫(kù),以幫助理解和生成新代碼。

StableCode使用Pytorch深度學(xué)習(xí)庫(kù)完成一個(gè)相對(duì)復(fù)雜的python文件(灰色文本顯示StableCode的預(yù)測(cè))

與所有現(xiàn)代生成AI模型一樣,StableCode也是基于Transformer架構(gòu)。

StableCode沒(méi)有使用ALiBi方法來(lái)定位Transformer模型中的輸出,而是使用了一種稱為旋轉(zhuǎn)位置嵌入(RoPE)的方法。

Cooper說(shuō),Transformer模型中的ALiBi方法傾向于更重視當(dāng)前token,而不是過(guò)去的token。

在Stability AI看來(lái),這不是代碼的理想方法,因?yàn)榕c自然語(yǔ)言不同,代碼沒(méi)有一個(gè)帶有開頭、中間和結(jié)尾的固定敘述結(jié)構(gòu)。

代碼函數(shù)可以為應(yīng)用程序流程中的任何點(diǎn)定義。

那么,StableCode與其他模型相比,效果如何?

Stability AI將其與有相似的參數(shù)和訓(xùn)練的token數(shù)量的模型進(jìn)行了比較。其中,使用流行的HumanEval基準(zhǔn),采用標(biāo)準(zhǔn)的pass@1和pass@10指標(biāo)。

StableCode的基準(zhǔn)分?jǐn)?shù)

與類似大小(3B)模型的比較

30億參數(shù)StableCode


StableCode-Instruct-Alpha-3B是一個(gè)30億參數(shù)的純解碼器指調(diào)優(yōu)的代碼模型,預(yù)先在不同的編程語(yǔ)言集上進(jìn)行了訓(xùn)練。

用法

該模型旨在按照指令生成代碼。用于訓(xùn)練模型的數(shù)據(jù)集以Alpaca格式化。使用以下代碼片段開始使用 StableCode-Instruct-Alpha-3B 生成代碼:

from transformers import AutoModelForCausalLM, AutoTokenizertokenizer = AutoTokenizer.from_pretrained('stabilityai/stablecode-instruct-alpha-3b')model = AutoModelForCausalLM.from_pretrained(  'stabilityai/stablecode-instruct-alpha-3b',  trust_remote_code=True,  torch_dtype='auto',)model.cuda()inputs = tokenizer('###Instruction\nGenerate a python function to find number of CPU cores###Response\n', return_tensors='pt').to('cuda')tokens = model.generate(  **inputs,  max_new_tokens=48,  temperature=0.2,  do_sample=True,)print(tokenizer.decode(tokens[0], skip_special_tokens=True))

模型詳情

- 開發(fā)者:Stability AI

- 模型類型:StableCode-Instruct-Alpha-3B 模型是基于Transformer解碼器架構(gòu)的自回歸語(yǔ)言模型。

模型架構(gòu)

訓(xùn)練

StableCode-Instruct-Alpha-3B是帶有代碼指令數(shù)據(jù)集的StableCode-Completion-Alpha-3B上的指令微調(diào)版本。

參考資料:

https://stability.ai/blog/stablecode-llm-generative-ai-coding

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Stability AI進(jìn)軍編程領(lǐng)域,發(fā)布首個(gè)用于代碼生成的大語(yǔ)言模型
OpenAI史詩(shī)級(jí)更新!最強(qiáng)大模型炸場(chǎng),128K上下文、價(jià)格暴降2/3,還能定制專屬GPT
奧特曼最新透露:急缺GPU,擬開源GPT
豈止DALL·E!現(xiàn)在AI畫家都會(huì)建模、做視頻了,以后會(huì)什么簡(jiǎn)直不敢想
StarCoder 代碼助手: 愿源代碼與你同在!
StarCoder: 最先進(jìn)的代碼大模型
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 剑阁县| 乃东县| 洪洞县| 双牌县| 古田县| 新干县| 高要市| 曲周县| 青州市| 台山市| 玉树县| 哈密市| 长岛县| 永丰县| 龙门县| 眉山市| 曲水县| 张掖市| 青川县| 那曲县| 古丈县| 吉安市| 深泽县| 和静县| 墨脱县| 中牟县| 逊克县| 临漳县| 芦山县| 永修县| 安福县| 淳安县| 合作市| 澄江县| 梁河县| 瑞丽市| 巴里| 镇平县| 固镇县| 普格县| 藁城市|