https://mp.weixin.qq.com/s/vHhYIuvjmsMAx_sssUzImg
大家好,我是夙愿學長,一名利用課余時間探索 AI 的斜桿青年。
如果你關注 AI 大模型、AI 提示詞、AI 寫作這幾個領域的話,你就知道,Claude3-Opus 模型在寫作任務上表現得非常出色。
光說你可能感受不出來,我們上一個案例:
下面我使用 KimiChat 內置的 小紅書濃人文案 提示詞,分別在 Claude3-Opus 和 KimiChat 中測試寫一段手工類的筆記文案:
很明顯,Claude3-Opus寫出來的文案非常是真人寫的,而且情緒感十足,反觀右邊 kimichat,文字冷冰冰的,沒有“濃人”的感覺,還一股子“AI味”。
進行到這一步的時候,我得到了一個結論:
如果你發現用 AI 大模型寫文案怎么調提示詞,其輸出的內容都很爛,大概率不是人的問題,是大模型本身的問題。
也就是說,與其鉆研怎么打磨優化提示詞,不如先鉆研出哪個大模型才擅長寫作類任務。
Claude 不錯,這個結論我們已經知道了,但是由于眾所周知的原因,Claude 在國內很難用得上。
而正好我的 AI 陪伴群的群友問到我國內哪家大模型比較適合寫文案,于是我今天花了點時間,找到國內比較熱門的大模型,挨個去測試了一下,結果出乎意料。
首先,有請我們的參賽選手:
通義千問:https://tongyi.aliyun.com/qianwen/
萬知:https://www.wanzhi.com/
躍問 AI:https://stepchat.cn/chats/new
智譜清言:https://chatglm.cn/main/alltoolsdetail
DeepSeek:https://www.deepseek.com/
Kimi Chat:https://kimi.moonshot.cn/
訊飛星火:https://xinghuo.xfyun.cn/spark
文心一言:https://yiyan.baidu.com/
測試方法:
輸入小紅書濃人文案的提示詞---等待大模型回復---輸入“主題:性價比最高的鼠標”
首先,先上兩個直接被 pass的「考生」,文言一言 3.5 和訊飛星火認知大模型,我還沒輸入主題,大模型就開始創作內容了,不仔細看規則。
接下來是其他大模型輸出的結果,我在圖片的第一行標注的大模型的名稱,建議點開放大左右滑動查看。
一輪測試下來,我發現萬知、Kimi Chat、DeepSeek的表現還不錯,把這三個同時打開對比一下:
從綜合表現來看,我個人對萬知的表現最滿意,標題有網感、正文 AI 味相對較少、而且還幫忙寫了筆記標簽。
有趣的是,萬知和 DeepSeek 這兩家都是最近新上線的產品, 果然是長江后浪推前浪。
介紹,簡單介紹一下萬知和 DeepSeek 的“來路”:
萬知是一款為中國人身定制的一站式 AI 工作平臺,提供個人特助服務,幫助用戶提升工作效率。AI 技術在職場生態中的應用越來越受到重視,萬知的推出將為用戶提供更便捷高效的工作體驗。
?? 萬知是一款為中國人身定制的一站式 AI 工作平臺,提供個人特助服務。
?? 萬知提供了三大 AI 秘技: 知識問答、文檔閱讀和 PPT 生成,幫助用戶完成工作任務。
?? AI 能夠秒速讀取5000頁文檔,快速生成 PPT,并支持手機和 PC 端之間的接力修改。
DeepSeek-V2 基于 2 千億 MoE 模型底座,其綜合能力表現十分出色,中文綜合能力(AlignBench)在開源模型中最強與 GPT-4-Turbo,文心 4.0 等閉源模型在評測中處于同一梯隊。
英文綜合能力(MT-Bench)同樣處于第一梯隊,英文綜合能力與最強的開源模型 LLaMA3-70B 處于同一梯隊,超過最強 MoE 開源模型 Mixtral8x22B。
以上,enjoy~