'1985 年,Windows 1.0 的發布開創了個人計算的新紀元。
它解決了一個根本性問題:讓普通人能夠輕松使用計算機。
統一的圖形界面、直觀的操作方式、標準化的開發環境,
Windows 構建了第一個真正意義上的軟件生態系統。
然而,這是一個相對封閉和單一的世界。
軟件需要安裝,更新要手動,使用場景局限于辦公桌前。
它就像一座固定的城堡,堅固但缺乏靈活性。
'2008 年,當喬布斯發布 App Store 時,你是否意識到這是一場革命?
還記得第一次用手機下載應用的感覺嗎?
一鍵安裝,即點即用。App Store 讓軟件走出城堡,變成了口袋里的百寶箱。
朋友圈、外賣、打車、支付...每個 App 都是一個精致的工具。
但是,你是否也經常為手機里塞滿了各種 App 而困擾?
為什么要在不同 App 之間來回切換?
為什么它們不能像我們的大腦一樣,自然地協同工作?'
近日,我參加了火山引擎 Force 冬季大會
在 COZE 1.5 的演講,
我看到 AI 時代 AI 應用平臺,
下一代 APP Store 新范式。
字節對扣子的描述是:新一代 AI 應用開發平臺
但我覺得,字節的野心不止是應用開發平臺,
因為,我倔強認為,
未來,人人都是 AI 創作者,
亦是 AI 的協作者。
包括,演講者開篇舉例幾歲開始用
COZE 實現了自己的 AI 應用的封裝。
所以,就有以下更新。
扣子上現在可以開發和發布擁有完整前后端的 AI 應用,本期支持發布為 API、扣子商店、模板,未來開發 API、Web SDK 可以期待更多發布渠道的上線。
未來你可以把你設計 AI 工作流封裝到你的應用,包括硬件終端。
以一個具體場景展現:
我打開筆記本,登入扣子平臺。她的眼前是一個干凈的開發界面。
# 前端界面:一個簡單的AI寫作助手
@app.route('/')
def index():
return render_template('index.html')
# 后端邏輯:處理用戶輸入并調用AI
@app.route('/generate', methods=['POST'])
def generate_text():
user_input = request.json['prompt']
response = ai.generate(user_input)
return jsonify({'result': response})
完成后,她看著部署選項:
'發布為 API' - 讓其他開發者能夠調用
'發布到扣子商店' - 直接面向終端用戶
'存為模板' - 供其他開發者參考和復用
點擊部署,幾秒鐘后系統提示:'部署成功!'
我打開扣子商店,自己的應用已經安靜地躺在那里,等待被發現和使用。
未來,接口進一步開拓。
扣子開發工具中增加了 UI Builder,一口氣更新了 17 個 UI 組件,終于不再只有一來一回的對話式交互了!可以期待一波移動端適配的組件!
各種圖生圖、圖文創作、文件總結,不再需要多輪的對話式交互,可以通過上傳框/輸入框+展示區實現
可以通過導航條切換功能頁面,而無需依賴于自然語言指令切換功能場景
開關、下拉菜單、數值輸入框,更好地規范用戶的輸入,避免模型執行不穩定,一次多個輸入可以由表單完成
由按鈕等組件直接觸發事件,精準調用工作流,不再依賴模型調用函數
無限畫布,像用 figma 做設計一樣搭建應用
比如:
就是我們設計的 AI 工作流產品可以更可視化,人性化了
可直接搭建 H5/小程序類移動端頁面,并直接托管發布到微信小程序和抖音小程序
~20 種 UI 組件
十幾種移動 UI 模板
對話式 UI 和交互式 UI 均提供
扣子工作流中增加了知識庫寫入能力、SQL 查詢數據庫能力、知識庫查詢時的查詢改寫和結果重排開關。
這些場景可以更好地實現了:
制作一個 AI 筆記本,每次將碎片化的思考輸入,后續可以用自然語言來搜索/整理
制作一個知識庫文件上傳的頁面,A 部門和 B 部門可以分別上傳文件到各自的知識庫里
制作一個客服質檢管理頁面,當質檢人員對 AI 回復感到滿意時,可以將該問答對存入知識庫以備后續調用
建立一個健身打卡的應用,可以根據用戶的需求準確查詢調取特定日期、類型的打卡記錄
建立一個學習語言的應用,可以記錄用戶的錯題并調取用來復習
最新多模態模型搶先體驗
豐富的多模態模型,今天新發布的豆包·視覺理解模型、豆包文生圖 2.1 和 豆包音樂模型,在扣子都能通過插件的方式第一時間體驗到,期待接下來會有一大批有意思的多模態 AI 應用在扣子誕生!
優勢點:
精準的識別:使用大模型的 ASR 進行語音轉文本,具備上下文理解能力(比如上文出現過的名詞能在識別中復用,說話風格和代稱也有更好理解),并對噪聲、垂直領域、中英混說等復雜場景識別效果提升
強大的 AI Agent 能力:扣子作為 AI Agent 搭建平臺,包含了 Agent 各項能力,如記憶(文件盒子、數據庫、變量)、知識(文本、表格、照片)、技能(插件、觸發器)、編排(工作流、圖像流)等
低延遲:使用了 RTC(Real-Time Communication)方案,把鏈路中的延遲充分降低
自然的語音效果:使用大模型的 TTS 進行文本轉語音,根據上下文,智能預測文本的情緒、語調等信息;生成超自然、高保真、個性化的語音,在自然度、音質、韻律、氣口、情感、語氣詞表達等方面更像真人;同時對中英文混說也有很好的支持。
信息輸入輸出增加了圖片信息和聲音信息,
聲音可以是你的克隆聲音
這時候,各種老師,家長們有福了
一個場景:未來 2025 年深圳某智能硬件展區。
小王正在演示他們的新產品:一個小巧的辦公桌面音箱,頂部有個呼吸燈在柔和地閃爍。
'看這里,'他指著音箱背面的接口,'Type-C 供電,3.5mm 音頻輸出,還有這個...'
他手指點了點一個帶有特殊標識的端口:'扣子硬件認證接口。任何通過認證的 AI 模塊都能即插即用。'
展臺上,幾個不同形狀的 AI 模塊整齊排列:
離線語音識別模塊
實時翻譯模塊
本地大語言模型模塊
'插上去就能用,'他拿起一個模塊,'不需要聯網,也不用擔心數據安全。企業可以根據需求隨時更換。'
旁邊的顯示屏正播放著演示:一位員工對著音箱說:'幫我總結下午會議的要點。'呼吸燈閃了閃,音箱開始用自然的語氣復述會議內容。
'未來這個端口會成為標準配置,'小王說,'就像 USB 一樣普及。'
他打開手機里的扣子硬件開發平臺,上面顯示著最新的模塊認證指南。
平臺,用戶,交互端,交互方式,創造方式,分發模式
平臺,用戶,交互端,交互方式,創造方式,分發模式
不是軟件吞噬硬件,
也不是硬件吞噬軟件,
是一個
從軟硬協同到 AI 流程,
從編碼到提示工程,
從下載到即時使用。
早上醒來,你說:'幫我規劃今天的行程。'
這個簡單的請求會觸發什么?
過去:
你需要打開日歷 App 查看安排
打開地圖 App 查看路線
打開天氣 App 查看預報
打開郵件 App 確認會議...
現在:
AI 助手直接整合所有信息
理解你的習慣和偏好
主動提供完整的建議
隨時根據變化調整方案
也許有一天:
我們不再區分什么是應用,什么是平臺
不再關心某個功能在哪里,
只需要表達我們想要什么,
然后看著它自然地實現,
'這個愿景可能看起來很理想化,
但技術的發展往往比我們想象的更快。
這是正在發生的改變。
作者介紹周知:
AI 覺醒派主理人,AI 工作流專家
AI 覺醒派 COZE 代表作品:
小覺醒思維助手,Suno 音樂歌詞專家、智能筆尖,
未來想成為超級個體的你,鏈接我,
加入我的 AI 學習社群,領取 AI 覺醒包。
一起探索成為 AI 作家,AI 歌手,AI 藝術家。