谷歌近日宣布对其人工智能助手Gemini Live进行重大升级,新增实时画面提示功能并深度整合消息、电话、时钟等核心应用,该更新将于8月28日随Pixel 10系列首发亮相。此次升级标志着AI助手在环境感知与多任务协同方面的技术突破。
核心升级功能包括基于摄像头的实时物体识别系统。用户通过手机摄像头扫描环境时,Gemini Live可即时在屏幕上高亮标记目标物品。例如面对杂乱工具箱时,系统能精准识别并突出显示特定工具,该技术采用新一代生成式AI图像分析引擎,显著提升识别准确率。测试显示,在复杂场景中定位目标物体的平均耗时不超过1.5秒。
深度应用整合实现跨场景无缝协作。用户在与助手对话过程中可随时插入操作指令,典型场景包括:规划路线时若发现可能迟到,只需口头指令”给联系人发送晚到10分钟通知”,系统将自动生成并发送包含预估到达时间的短信。该功能目前已实现与安卓原生应用的深度API对接,未来两周将扩展至iOS平台。
技术架构方面,此次升级整合了Project Astra计划的核心模块,通过增强型语音引擎实现多轮对话中的人类情感模拟。用户可自定义语音交互的语速与语调参数,系统支持实时对话打断与语义衔接,响应延迟控制在400毫秒以内。据内部测试数据,新版本在多任务场景下的指令执行准确率达93.7%。
市场推进计划显示,视觉引导功能将分三阶段落地:8月28日首批登陆Pixel 10设备,9月初覆盖主流安卓机型,iOS版本预计在10月中旬推送。谷歌同时确认,现有Gemini Live用户可通过订阅服务提前体验部分增强功能,企业用户将获得定制化API接口。
© 版权声明
文章版权归作者所有,未经允许请勿转载。