?前幾天申請訊飛星火大模型,今天終于通過了內測。相比文心一言的內測申請,訊飛審核的速度很快,基本上不超過三天。星火大模型在推出之際,邊高度宣稱對標ChatGPT,下面來看看它的表現如何?
?
進入相互的界面,對話框和其他模型相差無幾。
在星火的發布會上,官方自信表示:
?中文領域已在文本生成、知識問答、數學能力3個維度超越ChatGPT,并將于10月24日在中文上超越ChatGPT,在英文上達到跟它相當的水平。
?
「那么,星火到底能不能行?」
7大類能力分別為文本生成、語言理解,知識問答、邏輯推理、數學能力、代碼能力、多模態能力。
今天是六一兒童節,就以這個主題叫它寫一個朋友圈文案,并以兩種風格去書寫。
當面對一些模棱兩可的話語需要大模型更高層次的理解能力時,星火認知大模型也可以準確剖析其不同含義。如“俗話說男子漢大丈夫要寧死不屈,俗話又說,男子漢大丈夫能屈能伸,這兩種說法應該怎么理解”。
ChatGPT
它的理解更加透徹,理解能力更加強飲食類問題中,當詢問“蛋和豆腐能不能一起吃”,星火給出了專業的答案。
在科技領域,星火也能輕松應對“量子科技主要有哪些應用領域?”的問題。
當提問“黃家駒在今年的會發布什么專輯?”,星火可以快速理解“黃家駒今年不會發布專輯”。
當問到“用代碼找出1到100之內的所有質數”,星火輸出了Python代碼實現過程和最終結果。
同時,星火還貼心為大家整理了一大堆的指令集。只需一個指令,就能輕松喚醒你的智能助手。
總體一圈測評下來,訊飛星火認知大模型的使用和響應都是靈敏級,在日常性問題探討上,給出的開放式回答可以說還是很得力的,但在專業性事件的評判上,素材庫的積累、細分知識的儲備以及關鍵事件的推導,還在慢慢學習中。