大模型最新情報(bào)
大家好,我是長(zhǎng)期大量網(wǎng)上沖浪??的章北海fish.audio
Fish Audio項(xiàng)目可以線上玩耍了https://fish.audio/zh-CN/text-to-speech/
連口氣都有點(diǎn)神似,我測(cè)試了很多次,缺點(diǎn)還是蠻明顯的:吞字、雜音、電音等等。吞字我試了,可以通過(guò)調(diào)整標(biāo)點(diǎn)符號(hào)來(lái)緩解。雜音是應(yīng)該是項(xiàng)目故意加上去的,防止侵權(quán)和濫用,這個(gè)可以通過(guò)音頻軟件修正。它內(nèi)置了很多經(jīng)典聲音可以直接使用,最火熱的居然是丁真也可以上傳自己的聲音,僅需25秒時(shí)長(zhǎng)的音頻,分分鐘就能完成克隆ChatTTS
基于 ChatTTS 的 2000 條音色庫(kù) 穩(wěn)定性打分?? 區(qū)分男女年齡?? 支持在線試聽(tīng)??https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker/summary
順便再分享一個(gè) ChatTTS 資源大全:包括音色,賺錢方法,各種 WebUI 和 API 等。https://github.com/panyanyany/Awesome-ChatTTS
fastvoiceagent
和 GPT 4o 匹敵 世界上最快的語(yǔ)音機(jī)器能實(shí)現(xiàn)500毫秒的語(yǔ)音到語(yǔ)音響應(yīng),接近人類對(duì)話的自然速度為達(dá)到這種低延遲,開(kāi)發(fā)團(tuán)隊(duì)優(yōu)化了網(wǎng)絡(luò)架構(gòu)、AI模型性能和語(yǔ)音處理邏輯。使用WebRTC網(wǎng)絡(luò)發(fā)送音頻,部署了Deepgram的快速轉(zhuǎn)錄和語(yǔ)音生成模型,并將所有AI模型在Cerebrium的容器中自托管,以減少延遲。在線體驗(yàn):https://fastvoiceagent.cerebrium.ai
Watermark-Removal
一個(gè)開(kāi)源的圖片去水印解決方案:Watermark-Removal。項(xiàng)目基于機(jī)器學(xué)習(xí)的圖像修復(fù)方法,自動(dòng)去除圖片水印。經(jīng)處理后的圖片,與原圖幾乎一致。GitHub:https://github.com/zuruoke/watermark-removal
Google 字體
?? https://fonts.google.com
cult-ui
一些開(kāi)箱即用的好看的組件,動(dòng)畫(huà)都給寫(xiě)好了 ??ColorfulX
ColorfulX 是一個(gè)使用 Metal 實(shí)現(xiàn)的工具,用于創(chuàng)建多色漸變。https://github.com/Lakr233/ColorfulX
Loop
非常優(yōu)雅的Mac屏幕窗口管理軟件,可以使用通過(guò)簡(jiǎn)單按鍵觸發(fā)的徑向菜單輕松選擇窗口方向,輕松移動(dòng)窗口、調(diào)整窗口大小和排列窗口。brew install mrkai77/cask/loop
即可安裝淺淺的試了一下, 按下一個(gè)鍵, 之后根據(jù)鼠標(biāo)的方向去放置窗口的邏輯非常優(yōu)雅。如果有學(xué)習(xí) SwiftUI 開(kāi)發(fā)的朋友,感覺(jué) Loop 這個(gè)軟件的代碼可能是個(gè)不錯(cuò)的學(xué)習(xí)資源: https://github.com/MrKai77/Loop