✍️ Gate 廣場「創作者認證激勵計劃」進行中!
我們歡迎優質創作者積極創作,申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵!
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟:
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面,等待審核
讓優質內容被更多人看到,一起共建創作者社區!
活動詳情:https://www.gate.com/announcements/article/47889
Runway 把語音塞進視頻 Agent,獨立 TTS 廠商的日子更難了
語音直接內嵌到影片 Agent,產品化變快了
RunwayML 悄悄在 Characters API 裡加了自訂語音,TTS 直接塞進即時影片 Agent。開發者不用再自己對接獨立語音服務了。
這是明擺著的綁定打法:Runway 的 GWM-1 世界模型把「文字轉語音」和臉部表情合成連在一起,品牌虛擬形象做客服、做遊戲 NPC 的量產速度能快不少。底層用的是 ElevenLabs 的 eleven_ttv_v3,可以用提示詞設計音色,也能拿 10 秒樣本克隆聲音,口型和手勢自動對上。
一個值得注意的信號:Twitter 上幾乎沒有人討論,但團隊說這是「用戶呼聲最高」的功能。API 優先的發布方式本來就不走行銷路線,直接面向真正做事的人。
獨立語音服務面臨結構性壓力
這次更新把 TTS 定位成了「基礎設施層」,不再是獨立產品。ElevenLabs 在背後出力,但綁定模式反過來加速了純 TTS 被「整合化」的趨勢。
ElevenLabs v3 在情感表達和技術指標上不輸同行,但 Runway 的「影片優先」才是分水嶺:企業要的是成套的 Agent,不是零件。開發者自然會往掌握全棧的多模態平台遷移。
別被「革命性克隆」這類說法帶偏——主流廠商的音質差距不大,真正拉開距離的是多模態場景下的整合能力。
我的看法:多模態綁定降低了非專業用戶的門檻,Runway 在對手分散、各自為戰的局面裡佔了便宜。
投資角度,市場還沒充分計入「影片優先 + 全棧綁定」帶來的黏性溢價。企業角度,少對接幾個供應商本身就是省錢省心。
說白了:誰先押注整合式影片 Agent,誰就有先發優勢。多模態平台受益,獨立 TTS 承壓。忽視綁定趨勢的企業大概率會被動追趕——當「語音」變成預設能力,部署節奏取決於 API 可達性和全鏈路一致性,不是單點音質。
重要性:中等
分類:產品發布|行業趨勢|開發者工具
結論: 做產品的和企業採購,現在是「早期窗口期」,值得盡快驗證切入。只押語音賽道的投資者和廠商,現在是「防守期」,得加速往多模態和整合能力轉。資源會流向一體化平台和能快速產品化的團隊,純 TTS 玩家短期不佔優。