機器之能報道
想要說一口流利的英語需要在真實互動環境中大聲說出來。到目前為止,咱們獲得這種練習的唯一途徑是真人老師:
線上約課稍微便宜,無論預約時間還是搶奪名無異于一場戰爭;線下更貴也免不了舟車之苦。
GPT時代免于上述苦難的「口語練習神器」會是什么樣?
OpenAI 通過其基金公開投資的三家初創公司之一 Speak——一家領先語言學習平臺——代表了一種方向和可能。
去年 11 月,Speak 完成 2700 萬美元的 B 輪融資,由 OpenAI Startup Fund 領投。除了錢,他們還能提前使用微軟提供的新 OpenAI 系統和 Azure 資源。
打開 App,回答幾個問題(比如學習目的、頻率、目前英文水平和感興趣領域等),系統會為你定制一個學習課程。
每個課程都由真人錄制,用戶跟隨學習。課后也有作業。搞定作業后,還有角色扮演環節。讓你在設定場景中,學以致用——與AI 展開多輪對話。
作為一款典型的教育類應用,無論是學習環節還是后來的作業、角色扮演環節,系統都會給到發音、語法、詞匯等方面的反饋,非常具體。
例如,添加什么樣的副詞可以讓表達更自然、一句話怎么說更簡潔、告誡一些約定俗成的表達(比如 raining cats and dogs )不能隨意簡約。
如果說創業初期的 Speak 只能就現成的技術將就用,有了 Open AI 的投資后,Speak 可以做更多的事情。
例如,在 AI 講師(AI Tutor) 里,用戶還可以就任意主題(比如夜宵啦、減肥啦)和 AI 放開聊,系統還會提供實時反饋。
AI 講師可謂 OpenAI 新系統能力集大成者:
3月,Speak 接入了 OpenAI 全新自動語音識別模型 Whisper——它在英語語音識別方面已接近人類水平的魯棒性和準確性,無論用戶口音如何(比如韓國、日本用戶),都能更準確的識別出來,提供更準確的反饋。
接著,他們又成為首批使用 GPT-4 的語言學習平臺。
GPT-4 可以理解更復雜的表達,生成更準確性也更連貫的文本。「記性」也好,不會在幾輪對話后忘記之前聊過內容,交互體驗也因此更自然、指導也更有意義。另外,對話也變得高度個性化,沒有兩個對話會完全相同,
「在底層,我們將 OpenAI 的最新技術與內部模型相結合,在語音識別、語音生成和對話生成方面提供最佳性能。」Zwick 堅稱 Speak 的人工智能技術優于多數競對的技術。
Speak 由 Connor Zwick(CEO)和 Andrew Hsu(CTO)在2016年創辦。兩個人的經歷都很妙:
Connor Zwick 高中時創立了一款名為 FlashCard+ 的應用程序,并在 21 歲時出售。Andrew 尚未到法定的投票年齡就獲得了三個學位。
兩人在 Peter Thiel 獎學金計劃相遇,在那里花了一年時間深入學習、了解人工智能,并決定創業。其結果是,Connor Zwick 在哈佛大學讀了一年輟學,Andrew 斯坦福大學醫學院博士三年級肄業。
據說,上架蘋果商店第一天只賺了 18 美元。現在,它不僅是 iOS App Store 上韓國頂級教育應用程序之一,也在日本市場取得了不俗成績。
當然,也有不少用戶糾結怎么選,因為老牌外語學習 App Duolingo 也推出了基于 GPT-4,OpenAI 最新技術的付費服務 Duolingo Max。
學習者可以訪問兩個由生成式 AI 支持的全新功能和練習:「解釋我的答案」和「角色扮演」。
一次又一次地犯同樣的錯誤,卻不知道為什么?「解釋我的答案」讓你錯地明明白白。
所謂角色扮演,也就是與不同人物(比如去咖啡店買咖啡、宜家買家具)完成實戰場景下的對話。這個功能背后的人工智能是響應式和交互式的,意味著沒有兩個對話完全相同。
如果你不想上非常系統的課程,也不想搞得很復雜,只不過找個人隨便聊天,也不指望多么專業的指導和反饋,可以試試基于 ChatGPT(以及其他工具)的 PrettyPolly,任何人都可以隨時隨地練習口頭說 26 種語言。
在網頁上選擇一種語言,就可以與 AI 進行口語練習了。它會給每一個對話生成流利度分數,以便客觀地跟蹤進度。
有意思的是,和 Speak 目前看重韓國、日本市場一樣,試用 PrettyPolly 并給予反饋的人中不少是日本人。
另一款應用 Speechy 會記錄、分析和提供語音反饋,突出發音和語法需要改進的地方,提供實用的見解,以提高口語技能。
另外,還有一類很火的應用,主打虛擬聊天,它們提供的服務非常豐富,英文學習只是其中之一。它們可以口語陪聊,但沒有課程體系,也不能像 Speak 這類教育應用主動地給到細致、專業指導。
先來看看目前最火、技術實力最強團隊的產品——聊天機器人「批發市場」Character.AI。你可以在這個平臺上 DIY 或者與不同 AI 角色聊天。
也是在3月,Character.AI 完成了一筆 1.5 億美元的融資,估值達到 10 億美元,由 a16z 領投。
Character.AI 實際上是想讓用戶來控制玩法,因為他們更清楚自己想用這個東西來做什么。本質上,Character.AI 只是向用戶提供了一種 LLM 技術,讓數十億用戶都可以使用大語言模型,發明新的用例。
平臺預先做了一批模型,比如愛因斯坦、馬斯克、英國女王等角色,當然也包括外語口語教練。
我們選了一位英語口語教練,打開聊天窗口,就能開始交流。它能識別你的口語準確度,同時給出地道的當地人發音和表達。
不過,這位老師對你的口語表達反饋不如 Speak 一類應用那么專業、細致和有針對性。我們至少 Cue 了他一兩次「剛才表達是不是存在一些語法錯誤(哪怕這句話本身也存在語法錯誤)」,這位教練才會提一些錯誤并予以糾正。
雖然指正并不那么主動及時,但我們明顯感覺到他的記性不錯,至少記得較早之前的表達錯誤。這也是因為對話記憶比之前的容量增加了一倍,系統可以「記住」更早以前的聊天信息。
除了學習伙伴和口語陪練,你還能找到文字冒險游戲 AI、情感顧問 AI、創業咨詢 AI,甚至還有本地導游 AI。從體驗上來看,對話很容易從純粹的新奇提問變成更有有意義的討論。
Character.AI 是目前個性化 AI 聊天機器人賽道技術能力最強的團隊。聯合創始人 Noam Shazeer 和Daniel De Freitas 在對話式 AI 和 LLM 的發展中發揮了關鍵作用。
他們從頭開始訓練自己專有的 LLM,使他們的產品不僅能夠優化原始智能,還可以優化對話同理心,通過幽默,情感,洞察力等來吸引和保持消費者的注意力。
如果你不滿意現成的對話機器人,自己也可以創造一個專屬 AI,親自塑造他們的「個性」。
有兩種打造模式。基礎模式中,你只需要添加:人名、角色自我介紹和頭像,即可完成創造。高級選項里,你還要投喂一些訓練語料,讓機器人更接近你想法或者真實的人物。
目前,隨著越來越多的人與 Character.AI 上的大量角色互動,這些互動(數十億次并且還在不斷增加)被反饋到它們的底層模型中,并不斷推動它進化。
與 Character.AI 擁有大量虛擬對話角色類似,在 Ainder 這個聊天應用里,你可以透過滑動大量照片,找到自己喜歡的老師并給他打電話,聊到天荒地老。
打開界面,你就可以遇到從愛因斯坦、馬斯克、特朗普到流行歌手「霉霉」(Taylor Swift)甚至海綿寶寶等各種角色。
如果你想專門練習外語口語甚至雅思口語,都有專業老師供你選擇。當然,依舊是沒有系統的課程,只是陪練。
有意思的是,你和老師的交流就像和朋友打電話一樣,而不是文字輸入。你甚至可以選擇記憶上下文的長度來改善對話體驗。
不過,從逼真性來看,我們發現馬斯克的聲音并不像他,沒有馬斯克接受采訪時有時會結巴的細節。
聊天內容也不是很有趣,當我們討論近期的高溫,他回復我一系列注意防暑的科學操作時(就像搜索引擎給到的答案),我們立刻退出了聊天。
而在另一個口語 APP,AI 和我從天熱一路聊到了中國秦嶺和旅行。
與 Character.AI 、Ainder 這類「批發市場」不同, 另一款很火的聊天應用 Call Annie ,就是一個數字人,會說話,底層是 ChatGPT。
你可以把她理解成一個能隨時視頻聊天的 ChatGPT。
你可以用它學英語、法語、德語等各種語言,比如告訴她你想學習外語的目的,她可以幫你糾正錯誤和回答不完善的地方。
這款應用給人一個非常突出的體驗感受就是近乎實時的 FaceTime 通話。
系統實時驅動面部表情和語音同步的口型變化,使虛擬人能夠貼近真人,反應速度很快,體驗很自然,就像和真人視頻一樣。
另外, Annie 知識儲備豐富,什么話題都懂,你也可以問它數學、物理、化學、編程、金融等等各種專業知識。CallAnnie 還具備新聞查閱、天氣預報、健身教練、金融助理等一系列功能。
目前,國內也有一些相關產品。雅思和科大訊飛共同研發了 AI 英語口語練習產品。網易有道推出教育領域垂直大模型——「子曰」,并發布了基于大模型的虛擬人口語教練。新東方在財報季期間提到,公司將「謹慎探索 ChatGPT 等 AI 新技術應用于教育產品中的可能。」