谷歌Gemini AI推出Storybook功能：将文字和草图转化为定制化故事书

AI产品动态10个月前发布 AI视野

谷歌于2025年8月6日正式推出Gemini AI聊天机器人的新功能“Storybook”，该功能通过多模态技术将用户输入的简单文字描述或上传的草图照片转化为定制化的图文故事书。每本生成的故事书包含10页内容，每页均配有AI生成的插图和可朗读的文本段落，支持黏土动画、动漫、漫画等多种视觉风格定制。值得注意的是，用户可上传儿童画作等图片素材作为故事创作基础，实现个性化内容生成。

目前，该功能已面向全球用户开放，覆盖桌面端和移动端设备，并支持包括简体中文在内的所有Gemini现有语言。实测显示，生成的故事书可分享、导出及打印，但存在角色服装、外形在跨页面间一致性不足的技术局限。例如，同一角色的服饰颜色在不同页面可能出现偏差。

此次更新被视为谷歌在多模态内容生成领域的重要探索，尤其针对儿童教育及家庭娱乐场景。通过降低故事书创作门槛，该功能为家长和教育工作者提供了激发儿童阅读兴趣的新工具。未来，谷歌或需进一步优化跨模态内容连贯性，以提升用户体验。

文章版权归作者所有，未经允许请勿转载。

谷歌Gemini AI推出Storybook功能：将文字和草图转化为定制化故事书

OpenAI更新ChatGPT：新增心理健康提醒与谨慎回应功能

Anthropic发布Claude Opus 4.1模型，AI编程与数据分析能力再升级

相关文章

亚马逊推出AI视觉购物功能Lens Live，实时摄像头搜索重塑移动购物体验

谷歌Gemini登陆Wear OS手表：AI助手开启智能穿戴交互新时代

阿里开源Z-Image图像生成模型：60亿参数实现商业级画质，技术门槛大幅降低

阿里巴巴瓴羊推出行业首款数据分析Agent系统，10秒响应20分钟生成专业报告

最新资讯

热门AI工具

热门资讯