作為以AI搜索為主的全能AI助手,天工AI的背后有強大的MoE大模型,能夠越來越精確地獨立完成規劃、調用、組合外部工具及信息;月活躋身國內AI獨立應用Top 3,激烈的市場競爭中不斷發展壯大,為中國用戶將AI“用起來”提供了一個優質選擇。
全文共 5473 字,閱讀大約需要 15 分鐘
作者 | 王曉玲 羅立璇
AI的技術和產品演進越來越快。Kimi刷完屏,GPT-4o又再次占領聚光燈。但不管是從業者還是用戶,已經不再像以前那么容易激動了。
除非,是能讓用戶親身體驗到AI降臨奇跡時刻,真正給用戶帶來實際幫助的產品。
目前,海外AI領域的當紅炸子雞,要數AI搜索引擎Perplexity,連英偉達創始人黃仁勛都“每天會用”。自2022年創立至今不到三年,Perplexity的最新估值已經接近30億美元,被認為是谷歌未來在搜索引擎領域的主導地位的有力挑戰者。
谷歌也確實在追逐AI搜索這個AI時代新的風口,與Perplexity跑在了同一條賽道上。I/O開發者大會上,谷歌除了宣布對自己的AI多模態模型Gemini進行升級,還對自己的搜索業務進行了大刀闊斧的AI化改造。
通過融合Gemini大模型的能力,谷歌演示的AI概覽(AI Overviews)能為搜索用戶提供多步驟推理能力。簡單來說,你可以要求谷歌搜索尋找一家評分4.5以上、人均消費150元左右、距你公司半小時車程的中餐廳,它會進行研究,將符合要求的餐廳呈現在AI概覽中,為答案配上相應的圖片,并生成清晰的關鍵信息對比表格。
就效果而言,雖然谷歌圍繞AI搜索進行了一番賣力的輸出,但這些看上去很炸裂的功能,其實我們中國也有,大可不必去氪金。
不僅在美國有Perplexity,在中國,昆侖萬維也早在2023年8年就上線了中國第一款基于自研大模型和自研搜索引擎的AI搜索產品——天工AI搜索。并且,在此之前,天工AI搜索就具備了與谷歌AI概覽一樣的多步驟推理、對比表格生成、圖文并貌呈現等能力。
與谷歌的AI概覽依托Gemini大模型實現一樣,天工AI搜索強悍能力的養成,也有賴于采用MoE(混合專家模型)架構的千億級參數開源大模型天工3.0。相比天工2.0,天工3.0不但新增了搜索增強、研究模式、調用代碼及繪制圖表、多次調用聯網搜索等能力,還集成了AI PPT、AI視頻轉繪、AI圖片生成、AI漫畫創作、AI音樂生成等多模態能力。
作為以AI搜索為主的全能AI助手,天工AI的背后有強大的MoE大模型,能夠越來越精確地獨立完成規劃、調用、組合外部工具及信息;月活躋身國內AI獨立應用Top 3,激烈的市場競爭中不斷發展壯大,為中國用戶將AI“用起來”提供了一個優質選擇。
據今年3月,QuestMobile發布的《2024生成式AI及AIGC應用洞察報告》,天工AI的月活,已經接近千萬,僅次于抖音的豆包百度的文心一言。
一年前,當昆侖萬維剛剛發布天工AI時,大多數人都不會想到這個結果。
AGI的遠大愿景高懸在頭頂,PMF的現實需求在腳下。朱嘯虎和楊植麟引發的爭論,讓技術信仰派和市場信仰派的分歧擺在了臺面上,但這兩者并非不可調和。在曇花一現的噱頭型產品之外,依然有人在不斷將AI雪球滾大,尋找技術與市場的最佳契合點。
“一款產品,一站式滿足所有愿望”
對于打工人,這次天工大模型3.0更新帶來的AI助手的體驗升級,讓我們看到了原生自中國本土語境的AI助手,已經具備將大模型能力的運用推進到解決現實工作中的復雜需求上。
當然,能干和會干是完全不同的兩個維度。
即使是全球范圍影響力最大的ChatGPT,也從去年6月開始不得不面臨流量下滑的問題。除了競品變多以外,核心問題是,它不能完全理解人類提出的復雜問題,給出的回答有時并不靠譜,甚至會產生“幻覺”,在嚴肅的工作環境中難以帶來顛覆性地效率提升。
所以,在這次測試天工AI的時候,我就給自己設定了一個虛擬的工作角色,嘗試處理這個角色日常工作中可能會遇到的一些業務問題——一名試圖進入短劇行業的制片人,“我”需要盡快了解這個行業,并且對執行層面的工作有框架性的了解,以便有效地安排項目的流程和計劃。
在這個過程中,我需要:
*海量搜索資料
*大量閱讀
*內容結構
*文案撰寫
*配圖樣例
*BGM配樂
*最后做成PPT
接下來我們用天工AI一站式完成任務,開始測試。我選擇在手機端下載安裝APP“天工AI智能助手”進行體驗。當然,你也可以在網頁端點擊www.tiangong.cn,或者在小程序端搜索【天工AI智能助手】,開啟體驗。
首先,我肯定需要了解行業的最新全貌,進行一些市場調查,來確認這個方向是否可行。
還給了一些熱門的短劇參考,附帶圖文:
到這里,天工AI很好地完成了工作,并且在具體的數據、案例背后,都提供了相應的信源參考。對任意一個細節存疑的用戶,都可以進一步查看相應的資料。而且,天工AI的搜索結果里,在進行了條件限定的前提下,提供的都是最新信息,不需要浪費更多時間進行區分了。
而且,在總結完了我需要的答案以后,天工AI還在篇尾進一步細化了我的模糊問題,引導更深入的提問,比如“2024年最熱榜單”“現在什么題材的短劇最火”,來幫助我進一步了解短劇行業的全貌。
在這里,我使用了“增強”模式。在“增強”模式下,天工AI會檢索更多網頁,提供相對全面和個性化的答案,而“研究”模式結構更細致,內容更深入,還能自動總結大綱和知識圖譜,使得答案更清晰。
但時間緊急,我需要盡快了解情況,所以我回到了簡潔模式,開始進行下一步提問。
我對霸總題材格外感興趣,還需要收集相關具體的資料。
從參考鏈接中可以看到,天工AI不單檢索了文字資料,并且還檢索了視頻內容,這正是需要拍攝短劇內容的我最需要的。并且可以針對每個搜索落地頁進行AI速讀,大大節省我自己翻江倒海的時間。
之前搜索資料,文字、音頻、視頻等媒體形式,都需要分開檢索,并進行閱讀、收聽、觀看,消耗很多時間。而現在一個AI助手,已經能同時解決這個問題。
另外,我還想讓天工AI幫我分析一下當下最紅的標桿案例,爆紅的反套路霸總短劇《我在霸總短劇里當保姆》,也順利完成了。
這確實是我需要的答案。想象一下,如果你是一個公司里的打工人,在開例會的時候,你的老板在早會中隨意發問,“王媽最近很火啊?這是怎么回事?”的時候,你只需要在天工AI輸入一個問題,就能有理有據、頭頭是道地給老板一個靠譜分析,絕對算是一個加分項。
在看完了這些資料以后,作為制片人的我更加確認我想拍霸總題材了。這時候,我嘗試讓天工AI嘗試幫我創作劇本大綱,看一下相關的套路。
我還想了解根據之前的內容,相應的分鏡劇本該怎么寫,天工AI也幫我創作了出來。
顯然,我們不能期待AI幫助我們人類在創意層面無中生有,但天工AI依然給我生成了一個大綱和分鏡頭的模板,讓我的工作有了一個更清晰的推進方向。
不過話又說回來了,天工AI編纂出來的劇情,和奈飛以及抖音上的一些流水線“行活兒”相比,也沒有那么難看,一些糊弄事兒的、甚至比不過AI 的編劇可能真的會被淘汰。
天工AI的優勢是具備多模態應用,除了文字處理,也能做圖做音樂,作為生產工具,在同一個App內切換起來非常方便。有了劇本,我讓天工圖片生成助手幫我畫一個分鏡圖,內容分別是:1、艾米麗進入莊園 ;2、艾米麗坐在客廳;3、艾米麗在莊園發現了一間密室;4、艾米麗站在密室門口。
但圖片助手顯然對畫分鏡圖沒有什么經驗。后來,我降低難度,分別讓它畫了這四個場景。
如果是用來做項目PPT,其中有兩張用來做海報圖也還不錯。
天工3.0發布同時推出了天工音樂大模型,同樣主打簡單易用。作為制片人,我只要選擇好自己喜歡的參考曲目,并準備好歌詞,就能創作一首原創歌曲。當然,歌詞可以是已有的詩詞作品,也可以交給天工AI進行生成。
與此同時,這個新功能甚至還配備了新的智能助理,主打一個高效交互。例如,我用林黛玉的白海棠詩(其實上傳任何內容都可以,甚至菜譜也行)完成了一支古風歌曲后,想把它分享到微信群。當我在對話框里,問了關于這首歌如何分享的問題后,天工AI立即就為我推薦了專門的音樂分享小管家。
作為第一次嘗試的低成本制作,這首歌已經可以直接用到我的短劇中,沒有版權問題。
與此同時,制片人當然還有一份最重要的工作,那就是找錢。我又讓天工AI幫我找了找可能會對短劇項目感興趣的投資人。
誠然,在現實的場景里,當然有很多項目的融資,靠的是人際關系和小道消息。但是,至少先了解公開層面里,誰對短劇項目感興趣、愿意投入,背后的資源能夠和項目相結合,已經算是做好了基礎的市場調查工作。
另外,天工AI在研究模式下還能幫我生成思維導圖和大綱,并能夠將搜索到的答案一鍵轉化為帶有示意圖和圖表的PPT,以便我更好地向投資人說明行業潛力。
可以看到,在“我”的每一步工作里,都已經能很好地和AI助手協作,并且產生有意義的結果。
集成多模態能力的AI助手
站在用戶角度看,簡捷有用,才是生產力工具的硬核實力。大多數需要用AI來幫忙完成的工作,無論是AI搜索還是AI助理,我們都希望它是一個全能同事,幫忙寫文案的后,也能幫忙配圖、生成圖表。
因此,天工AI搜索在研究模式中,會支持搜索結果的多模態呈現。像前文演示的那樣,在搜索結果出來后,既能輸出大綱,形成PPT,方便我在會議上分享,也能畫出思維導圖,方便作為資料保存。
多種實用功能聚集,就是天工3.0的最大特色。官方資料顯示,天工3.0是全球首個多模態“超級模型”(Super Model),其集成了AI搜索、AI寫作、AI長文本閱讀、AI對話、AI語音合成、AI圖片生成、AI漫畫創作、AI圖片識別、AI音樂生成、AI代碼寫作、AI表格生成等多項能力,是大模型時代的“超級應用”。
“超級模型”背后,天工AI從2.0版本就開始采用MoE 混合專家模型,相比Transformer大模型,前者計算效率更高、計算速度更快,能夠在不大幅增加算力成本的同時,有效增加模型容量,甚至能達到萬億參數級別。
同時,MoE大模型中的各個專家模型基于不同數據分布和構建模式搭建,能支持針對特定領域進行優化。通過調整專家模型的數量、類型和組合方式,可以多樣化構建、擴展MoE大模型,使其可以靈活地應對各種復雜任務。
這也是目前大模型發展的重要方向。天工3.0發布一個月后,OpenAI發布了新一代旗艦生成模型GPT-4o,產品新增了文本、語音、圖像三種模態的理解能力。比OpenAI晚一天,谷歌推出了擁有強大多模態理解能力和實時對話功能的未來AI助手Project Astra,并且發布了文生圖模型Imagen 3、文生視頻模型Veo,以及音樂創作大模型Music AI Sandbox。
幾天后的上海創新創業青年50人論壇上,Moonshot AI月之暗面創始人楊植麟談到,自己也關注到了GPT-4o的多模態能力,“這個也是我們持續重點投入的方向。”
而在昆侖萬維董事長兼CEO方漢看來,GPT-4o展示了超級個人助理的交互新形式。從共同選擇布局大模型多模態能力來看,GPT-4o和Project Astra展示出來的能力,同樣也是天工AI正在逐漸接近的下一代超級個人助理的終極交互形態。
不難發現,雖然天工AI整體定位于生產力增強工具,卻也是目前市面上AI對話App中,相對C端友好型產品。
新用戶習慣使用的天工AI網頁版界面干凈簡潔。用戶打開之后默認進入AI搜索界面,主頁面中央的搜索框,是我們再熟悉不過的,左邊的邊欄上半部分排例著天工3.0對話助手、AI文檔分析、AI圖片生成、AI音樂等一應功能,下半部分則列有口語練習,豆瓣推薦,旅游規劃師等實用小助手,甚至還有熱梗百科,每天更新網絡熱點,也方便吃瓜群眾使用AI搜索這種高階工具深度追蹤熱事件。
“買時生產力,買后愛奇藝”是大家對于平板使用的自嘲,實際上AIGC產品也同樣如此,目前市面上的AIGC App卸載率都在30-40%左右,甚至ChatGPT也有用戶留存率不高的問題。
讓用戶在摸索用大模型提升生產力的同時,娛樂應用提供的情緒價值,或許是提高留存率的好辦法。
為什么是昆侖萬維
在將人工智能列為公司未來十年的發展戰略后,昆侖萬維在這個方向上能夠堅持下占得一席之地的原因不僅是具備先發優勢,還有在先發之后,快速在垂直領域形成了技術領先,并利用領先的技術和產品的創新,促成了用戶體量的增長。
正如方漢所說,在當前的AI領域,討論產品開發和商業邏輯時,技術驅動無疑是核心動力。而技術紅利當下在這個領域中發揮著重要的作用。例如,OpenAI的文本大模型一鳴驚人,一舉奠定了自己在大模型領域的地位,當然也吸引了全球海量用戶。
在5月15日的一次演講中,方漢透露,一個月前發布的天工音樂大模型的評分已經達到SOTA水平。SOTA(State of the art)是指目前能夠實現的最佳結果,也就是“最新技術”的最佳狀態。
“在評分對比上,我們與全球領先的Suno模型進行了對比。結果顯示,我們大概在三項指標(人聲&BGM音質、人聲自然度、發音可懂度)上領先,而在另外三項上稍顯落后。但總的來說,我們的評分已經達到全球最頂尖的SOTA水平。”方漢說。
作為國內AI搜索產品的鼻祖,天工AI搜索的產品體驗和用戶規模提升,也依賴于昆侖萬維技術積累。在天工3.0支撐實現的AI搜索升級中,昆侖萬維引入了檢索增強生成技術RAG(Retrieval-Augmented Generation),針對用戶的復雜Query進行拆解、細化、并進行追問、信息理解與補全,然后發放給對應的專家模型處理。
依靠RAG技術與MoE大模型的結合,天工AI搜索得以減少“幻覺”,完成包括產業研究、產品橫評、信息分析、圖片生成、圖表繪制等多種復雜用戶需求,拉開與傳統搜索的差距,將搜索結果的獲取時間從3-10分鐘,壓縮到5-10秒,在AI搜索領域收獲技術紅利。
這個優勢的取得是搜索引擎+大模型自研經驗積累的結果。昆侖萬維旗下擁有千萬級DAU、面向全球十余種語言市場的新聞推薦產品Opera News,已經是非洲用戶規模最大的新聞客戶端。昆侖萬維已經通過Opera News產品,在數據抓取、數據清理等搜索引擎技術上擁有了5年的技術積累。
2020年,昆侖萬維建立團隊立項大模型研發時,確定了自研路線。5年搜索引擎再加上3年的大模型研發的積累,昆侖萬維才有了做AI搜索的底氣。AI搜索從產品立項到完成僅花費了半年時間。經過一年時間的迭代,天工AI搜索已經在一定程度上走在了國外同行的前面。
接下來,天工AI還準備在小說、漫畫、音樂、視頻等AIGC垂直領域內,繼續達到SOTA水平,進一步加強技術紅利,從C端獲取更多用戶。也因為在C端上有長期積累,天工AI的產品開發和商業邏輯才能持續聚焦C端市場,養成獨特的競爭力。
《這屆年輕人,能整頓頂流水果嗎》