谷歌于2025年8月6日正式推出Gemini AI聊天机器人的新功能“Storybook”,该功能通过多模态技术将用户输入的简单文字描述或上传的草图照片转化为定制化的图文故事书。每本生成的故事书包含10页内容,每页均配有AI生成的插图和可朗读的文本段落,支持黏土动画、动漫、漫画等多种视觉风格定制。值得注意的是,用户可上传儿童画作等图片素材作为故事创作基础,实现个性化内容生成。
目前,该功能已面向全球用户开放,覆盖桌面端和移动端设备,并支持包括简体中文在内的所有Gemini现有语言。实测显示,生成的故事书可分享、导出及打印,但存在角色服装、外形在跨页面间一致性不足的技术局限。例如,同一角色的服饰颜色在不同页面可能出现偏差。
此次更新被视为谷歌在多模态内容生成领域的重要探索,尤其针对儿童教育及家庭娱乐场景。通过降低故事书创作门槛,该功能为家长和教育工作者提供了激发儿童阅读兴趣的新工具。未来,谷歌或需进一步优化跨模态内容连贯性,以提升用户体验。
© 版权声明
文章版权归作者所有,未经允许请勿转载。