谷歌Gemini Live重磅升级：实时画面提示+多应用整合，8月28日首发Pixel 10

谷歌近日宣布对其人工智能助手Gemini Live进行重大升级，新增实时画面提示功能并深度整合消息、电话、时钟等核心应用，该更新将于8月28日随Pixel 10系列首发亮相。此次升级标志着AI助手在环境感知与多任务协同方面的技术突破。

核心升级功能包括基于摄像头的实时物体识别系统。用户通过手机摄像头扫描环境时，Gemini Live可即时在屏幕上高亮标记目标物品。例如面对杂乱工具箱时，系统能精准识别并突出显示特定工具，该技术采用新一代生成式AI图像分析引擎，显著提升识别准确率。测试显示，在复杂场景中定位目标物体的平均耗时不超过1.5秒。

深度应用整合实现跨场景无缝协作。用户在与助手对话过程中可随时插入操作指令，典型场景包括：规划路线时若发现可能迟到，只需口头指令”给联系人发送晚到10分钟通知”，系统将自动生成并发送包含预估到达时间的短信。该功能目前已实现与安卓原生应用的深度API对接，未来两周将扩展至iOS平台。

技术架构方面，此次升级整合了Project Astra计划的核心模块，通过增强型语音引擎实现多轮对话中的人类情感模拟。用户可自定义语音交互的语速与语调参数，系统支持实时对话打断与语义衔接，响应延迟控制在400毫秒以内。据内部测试数据，新版本在多任务场景下的指令执行准确率达93.7%。

市场推进计划显示，视觉引导功能将分三阶段落地：8月28日首批登陆Pixel 10设备，9月初覆盖主流安卓机型，iOS版本预计在10月中旬推送。谷歌同时确认，现有Gemini Live用户可通过订阅服务提前体验部分增强功能，企业用户将获得定制化API接口。

文章版权归作者所有，未经允许请勿转载。

谷歌Gemini Live重磅升级：实时画面提示+多应用整合，8月28日首发Pixel 10

OpenAI官宣GPT-6开发：记忆功能重构人机交互，用户可定制专属AI伙伴

马斯克AI聊天机器人Grok再陷隐私泄露与言论失控危机，37万条用户数据遭曝光

相关文章

全球首款家务人形机器人NEO开启预售 – OpenAI投资的1X Technologies推出2万美元家用助手

Gambo AI推出全球首款氛围编程工具，5分钟快速生成可商用游戏

微软Azure Copilot实现重大升级：从对话助手到自主执行AI代理平台

Meta全球开放AI语音翻译功能：支持英西双语，保留原声语调与唇同步

最新资讯

热门AI工具

热门资讯