谷歌为Google Docs推出AI语音朗读功能，支持自定义语音风格与播放速度

AI产品动态8个月前发布 AI视野

谷歌近日为Google Docs推出了一项基于AI技术的语音朗读功能，旨在通过语音形式呈现文档内容，提升用户的阅读体验和工作效率。该功能目前仅支持英文文档，且仅限于桌面端使用。

这一新功能允许用户高度自定义音频输出，包括选择不同的AI语音风格和调整播放速度。用户可以从多种预设语音中选择，如旁白者、教育者、说服者等，以满足不同场景的需求。播放速度支持从0.5倍到2倍速的调整范围，确保用户能够以最舒适的节奏听取内容。

操作流程十分简便：用户只需在工具菜单中选择”音频”选项，点击”收听此标签”即可启动语音朗读。文档作者还可以通过插入音频按钮，将可自定义的语音内容直接嵌入文档中，方便其他读者一键收听。这种设计不仅增强了文档的互动性，也为内容分享提供了新方式。

该功能主要面向Google Workspace的商业版、企业版和教育版用户，以及订阅了AI Pro和Ultra服务的用户。谷歌表示，这一创新源于其Gemini多模态大型语言模型的技术支持，该模型在语音生成的自然度和流畅度方面表现优异。

值得注意的是，谷歌早在今年四月就曾透露将文档转换为AI播客的计划。此次推出的功能可以视为该计划的延续，为用户提供了更直接的文档听取方式。特别是对于需要频繁处理大量文档的专业人士，以及视力受损的用户群体，这项功能将显著提升工作效率和可访问性。

目前，谷歌正在逐步向符合条件的用户推送该功能。虽然现阶段仅支持英语，但未来可能会扩展至更多语言和移动端平台。这一创新标志着AI技术在办公软件领域的深入应用，预示着未来可能出现更多智能化文档处理工具。

AI产品动态 # AI语音朗读 # Gemini模型 # GoogleDocs # 办公软件 # 文档处理 # 语音合成 # 谷歌

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

xAI免费开放Grok 4模型：技术普惠还是市场策略？

xAI免费开放Grok 4模型：技术普惠还是市场策略？

AI产品动态 # AI免费模型 # GPT-5竞争 # Grok4

8个月前

DeepSeek推出V3.2-Exp实验模型：自研DSA稀疏注意力机制大幅提升长文本处理效率

DeepSeek推出V3.2-Exp实验模型：自研DSA稀疏注意力机制大幅提升长文本处理效率

AI产品动态 # AI模型 # API降价 # DeepSeek

7个月前

英伟达发布开源自动驾驶模型Alpamayo-R1，L4级具身智能迎来关键突破

英伟达发布开源自动驾驶模型Alpamayo-R1，L4级具身智能迎来关键突破

AI产品动态 # AI技术 # Alpamayo-R1 # L4级自动驾驶

4个月前

马斯克宣布xAI的Grok 3.5将系统性重编人类知识体系，引发科技界热议

马斯克宣布xAI的Grok 3.5将系统性重编人类知识体系，引发科技界热议

AI产品动态 # AI # Grok3.5 # xAI

10个月前