一、深夜破防實錄
就在幾天前的深夜,我面帶不屑的試用了一下最新的DeepSeek深度思考模式,盯著滿屏的測試數據看著這個國產AI用幾十秒就碾碎了我三個月的科研心血!
作為NLP領域科研者,我正苦心鉆研「如何通過Agent讓大模型學會深度思考」。可DeepSeek團隊直接祭出「模型內深度思考」的殺手锏,讓AI的思考過程如同人類般自然!
沒錯,這可能是目前最讓打工人顱內高潮的AI工具!前幾天App Store免費榜直登榜首,逼得硅谷連夜開研討會封殺下架DeepSeek,又憑一己之力讓英偉達股價暴跌,我個牛馬都跟著熱血沸騰起來了!
二、深度思考模式使用指南
2.1 三秒上手指南
目前 DeepSeek 提供了如下使用方式:
網頁端:https://chat.deepseek.com 直接使用
API開放平臺:直接使用代碼調用API,不過需要充值,還是略有些小貴的~。推薦兩個好用的API平臺
2. 硅基流動:https://cloud.siliconflow.cn/models
3. 移動端:掃碼即裝
https://download.deepseek.com/app/ (二維碼自動識別)
?? 注意:普通模式只是 V3 模型開胃菜,深度思考按鈕才是通往新世界的大門。
2.2 你可能不知道的隱藏開關
點擊聯網搜索,讓R1模型接入互聯網,化身信息黑客:不論是arXiv最新論文還是最新新聞,它會應知盡知。
三、基礎講解
被GPT虐哭的社畜靠DeepSeek封神?
曾經伺候GPT時有多卑微:
親愛的GPT4,請先列框架再填充案例,最后加5個諧音梗,比例3:7…求求了!
每次提問GPT前都得看著一堆提示詞框架陷入沉思,阿巴阿巴......令人頭皮發麻。
如今調教DeepSeek R1時就有多囂張:
給初一表弟搞個英語提分計劃,別扯口語!
幾十秒后,基礎、題型和考試計劃直接甩你臉上,連各種技巧、策略都事無巨細的標注了。最后還不忘提醒你要勞逸結合、關注身心健康,它真的,我哭死!
——這哪是AI?分明是請了個海淀名師!
四、使用技巧:讓讀者直呼“臥槽”
技巧1:一套公式榨干AI潛力
雖然直接對 DeepSeek 進行提問已經有非常恐怖的效果,但 DeepSeek 又不是你肚子里的蛔蟲,不可能完全知道你的所有信息。
用好下面這套公式,更清晰的描述你的需求,才可以得到更優秀的回答。
萬能公式 = xx人(在xx條件下)為了xx人做xx事,要達到xx效果
xx人:指出提問者的身份,讓AI代入你的身份
xx條件:約束條件,用來約束AI讓它的回答向著你想要的方向發展
為了xx人:指出這段內容是要寫給誰的,明確目標用戶畫像
做xx事:你要做什么事
xx效果:這件事的預期結果是什么
如:我是一個瘦子,請為我這個上班族(995)設計無器械訓練和飲食方案,要求通過增肌的方式增加體重。
可以看出,給出的方案非常詳細且合理。當然,如果你還需要針對性的更詳細一些的方案,完全可以繼續提問做針對性的優化。
技巧2:把AI逼成“說人話的教授”
一遇到專業問題,DeepSeek 立刻秒成教授,這回答怕是也只有 DeepSeek 的學生才聽得懂了。
問它“DeepSeek的MoE架構為啥省成本?”
——回答全是天書!這誰看得懂?
但只要加3個字:“說人話!”
就能得到一個通俗易懂的答案了。
技巧3:貼身模仿
一句“模仿 X的文風/語氣寫X”的提示詞讓AI秒變該領域博士級專家。
當打游戲偶遇隊友陰陽怪氣時,我默默輸入:”打王者榮耀時隊友技術差還陰陽怪氣,用貼吧暴躁老哥語氣,噴爆這垃圾隊友!“
下一秒,屏幕炸出一串祖安文學:
——救命!這唾沫星子快從屏幕噴我臉上了!
缺陷
“但注意!這玩意兒主要有兩大問題:
別問敏感問題(懂的都懂);
別讓它寫長篇內容(上下文最長64K token,最大輸出8K token)。
上下文長度包括輸入長度(如用戶提問、對話歷史等)和輸出長度。
token 是模型用來表示自然語言文本的基本單位,也是我們的計費單元,可以直觀的理解為“字”或“詞”;通常 1 個中文詞語、1 個英文單詞、1 個數字或 1 個符號計為 1 個 token。
一般情況下模型中 token 和字數的換算比例大致如下:
1 個英文字符 ≈ 0.3 個 token。
1 個中文字符 ≈ 0.6 個 token。
“都聽到這了,還不趕緊去用起來 DeepSeek R1,這AI能讓你每天早下班幾小時,轉發起來幫助其他打工人!但轉發時記得屏蔽老板!否則下次裁員名單…你懂的。”
最后小小的感嘆一下,在 DeepSeek 出來之前我一直感覺國內AI幾乎只會跟跑,而 DeepSeek 首次實現了某個方向的世界領先。作為國內AI模型創新者,在嚴重的國外芯片封鎖下用自己的實力打了他們的臉,我覺得有必要正視一下咱們國內的創新力量了。