Google在本月的「Made on YouTube」活動上宣布,YouTube將推出AI嘴形同步(lip-sync)功能,旨在解決機器翻譯影片內容長期存在的「聲畫不同步」難題。該功能將首先在包括英語、德語、法語和西班牙語等等約20種語言,未來幾個月將陸續涵蓋更多語種。

據了解,YouTube自動配音與自動翻譯一直因會自動重製影片標題和音軌受到爭議,不少用戶希望有統一選項來關閉此類自動化翻譯與配音。多語言使用者和B站創作者紛紛回饋,AI生成的翻譯與真人翻譯相比品質參差不齊。目前,YouTube尚未提供全局關閉配音的功能,用戶需要逐個影片手動調整音軌,這也促使部分開發者推出如「YouTube Anti-Translate」等瀏覽器插件,專門屏蔽自動翻譯與配音圖層。
這次更新的重點突破在於,AI嘴形同步功能能夠透過人工智慧技術,讓自動產生的音軌與影片中人物口型完美對齊,大幅提升觀感,實現更流暢、更自然的視訊體驗。創作者可透過YouTube Studio自主選擇開啟嘴形同步配音功能,首批試點面向YouTube合作夥伴計畫成員,Google後續預計將其推廣至所有影片。
在多語言配音方面,YouTube依托自研AI模型(包括Gemini與Aloud)產生多語言音軌,不僅還原原說話者聲音的情感和語調,還能對背景音和人聲進行分離。根據Google披露,部分頻道啟用多語種配音後,非母語觀眾數量達到三倍成長,顯示出強勁的成長潛力。
儘管AI自動配音和嘴形同步技術在拓展創作者觀眾群和廣告營收方面作用顯著,但關於其是否會影響原內容的真實性和觀眾體驗仍有不少爭議。支持者認為,該舉措便利了全球觀眾收看,提升內容影響力;而批評者則擔心自動化會損害原作的獨特風格。 AI嘴形同步能否徹底彌合理想與現實間的差距,業界仍在持續觀察其影響。








