簡單的文字壁紙生成工具
https://wallpaper.1step.dev/
大家都在生成視頻還有語音,總要有人幫生成音效吧???
今年最被低估的AI模型之一,重現李小龍功夫音
?? MMAudio是一個全新的AI音頻生成工具,可以自動為視頻生成環境音效和動作音效,為AIGC領域視聽同步生成的難題帶來了突破性進展。
??code:https://github.com/hkchengrex/MMAudio
Demo:https://replicate.com/zsxkib/mmaudio
拓展閱讀:https://mp.weixin.qq.com/s/F5RkV5bD_itV720yvfZ3-Q
?重點
● ?? 工具簡介:MMAudio由伊利諾伊大學和索尼聯合開發,能夠基于視頻內容自動生成合適的音效,包括背景音(如風聲、鳥鳴)和動作音(如碰撞聲、武術動作聲)。
● ?? 音效實例:
經典場景重現:為《閃靈》等經典電影片段補充逼真的音效。
動態音效匹配:精確重現李小龍的功夫音及雙節棍的聲音同步效果。
普通視頻增強:對原有音頻較差的視頻添加符合語義和時間的高質量音效,如旅行記錄、日常生活片段等。
● ?? 技術亮點:生成一個8秒音頻僅需1.23秒,多模態聯合訓練未影響其單模態任務表現,甚至可以生成背景音樂和人聲。
● ?? 實際應用:適用于內容創作者、短視頻制作人和影視后期團隊,為視頻提供更生動的表現力,顯著提升觀眾體驗。
? 總結:MMAudio為AI視頻生成注入了重要的聲音元素,不僅讓視聽同步生成成為可能,還降低了視頻音效制作的門檻,是AIGC領域的一大進步。
聽播客時會下載音頻,用ASR轉為文字,用LLM提取播客關鍵信息。
或許大家也用得上,于是一個博主把蘋果播客下載做成了小工具。
LINK:https://podcast.biotin.buzz
ASR:
Whisper Transcription(蘋果商店應用,免費)
夸克(PC端內置音頻ASR,需會員)
https://huggingface.co/spaces/hf-audio/whisper-large-v3
https://huggingface.co/spaces/sanchit-gandhi/whisper-jax
(HF spaces,免費但體驗欠佳)
某博主AI 寫了一個小紅書長文排版圖片生成工具
輸入標題和長文內容可以批量導出帶序號的 3:4 圖片
支持 Markdown 格式渲染
基于自己對爆款小紅書長文內容觀察和小紅書運營專家@王夢珂Mengke 的建議搞得。
后續會加更多主題,每個元素都支持自定義是否顯示
目前有個比較大的問題是支持 markdown 渲染之后
分頁邏輯不夠精準,每頁的內容不是多了就是少了
感覺這部分算法不是 AI 能夠搞定的
鏈接在這里將就用:
https://soft-pavlova-a78812.netlify.app/
Deepseek 公布了 V3 的測試報告和詳細訓練論文,真的很牛批
他們自測的成績整體跟 GPT-4o 和 Claude 3.5 對齊了
海外社區普遍驚嘆他們用 Llama 405B 十分之一的算力成本訓練了一個更大更強的模型
另外繼續卷價格45 天內,每百萬輸入1 元,輸出 tokens 2 元
這個價格和這個質量,麻了呀
DeepSeek V3 已經可以在 Cursor 中使用
將 https: //openrouter.ai/api/v1 添加為 OpenAI Base URL
使用 deepseek/deepseek-chat 作為模型
在聊天中使用(不要在代碼編輯器中使用)
這里嘗試:https://chat.deepseek.com/a/chat/
對現在工作不滿意的朋友可以看看這個倉庫??整理了國內外遠程工作列表:https://github.com/greatghoul/remote-working