近日,哔哩哔哩(B站)在世界人工智能大会上正式推出自研的“AI原声翻译功能”,旨在为海外用户提供更优质的游戏、科技、二次元等内容体验。这一功能的发布标志着B站全球化战略的进一步深化,也是其自5月宣布合并国际版与国内版APP后的重要举措。
该功能突破了传统机器翻译的局限,不仅能自动擦除中文字幕并替换为英文翻译,实现弹幕翻译及界面按钮的英文适配,更能精准还原UP主的声线、音色和气口。通过内部代号为“IndexTTS2”的语音生成模型,该技术实现了对原视频语音情感和说话人身份的有效分离,同时支持语音时长与翻译内容的完美匹配。此外,基于翻译语言的口型模拟技术进一步提升了视频的本地化观感。
在技术实现上,B站团队采用了大语言模型(LLM)构建翻译引擎,并创新性地开发了多目标奖励模型,结合语音时长匹配、原声翻译标准与UP主独特风格,通过对抗式强化学习持续优化翻译效果。针对游戏、二次元等领域专有名词和流行梗点密集的特点,团队引入Deep Research深度挖掘技术,确保译文准确传达文化内涵。字幕处理方面则整合了多模态大模型OCR技术和STTN网络视频重绘技术,实现高精度字幕检测与无痕擦除。
据透露,B站计划根据市场需求逐步扩展语言支持,日语等语种已被列入后续开发计划。这一功能的推出不仅解决了跨语言内容传播的障碍,也为B站拓展海外市场提供了强有力的技术支撑。通过持续优化AI翻译技术,B站致力于为全球用户创造无差别的视频观看体验,进一步推动中国原创内容的国际化传播。
© 版权声明
文章版权归作者所有,未经允许请勿转载。