谷歌近日为Google Docs推出了一项基于AI技术的语音朗读功能,旨在通过语音形式呈现文档内容,提升用户的阅读体验和工作效率。该功能目前仅支持英文文档,且仅限于桌面端使用。
这一新功能允许用户高度自定义音频输出,包括选择不同的AI语音风格和调整播放速度。用户可以从多种预设语音中选择,如旁白者、教育者、说服者等,以满足不同场景的需求。播放速度支持从0.5倍到2倍速的调整范围,确保用户能够以最舒适的节奏听取内容。
操作流程十分简便:用户只需在工具菜单中选择”音频”选项,点击”收听此标签”即可启动语音朗读。文档作者还可以通过插入音频按钮,将可自定义的语音内容直接嵌入文档中,方便其他读者一键收听。这种设计不仅增强了文档的互动性,也为内容分享提供了新方式。
该功能主要面向Google Workspace的商业版、企业版和教育版用户,以及订阅了AI Pro和Ultra服务的用户。谷歌表示,这一创新源于其Gemini多模态大型语言模型的技术支持,该模型在语音生成的自然度和流畅度方面表现优异。
值得注意的是,谷歌早在今年四月就曾透露将文档转换为AI播客的计划。此次推出的功能可以视为该计划的延续,为用户提供了更直接的文档听取方式。特别是对于需要频繁处理大量文档的专业人士,以及视力受损的用户群体,这项功能将显著提升工作效率和可访问性。
目前,谷歌正在逐步向符合条件的用户推送该功能。虽然现阶段仅支持英语,但未来可能会扩展至更多语言和移动端平台。这一创新标志着AI技术在办公软件领域的深入应用,预示着未来可能出现更多智能化文档处理工具。
© 版权声明
文章版权归作者所有,未经允许请勿转载。