科大讯飞AIUI平台升级,引入情绪识别等多模态能力,已接入22亿终端 科大讯飞在深圳举办的“智能交互产品升级发布会”上,正式推出新一代AIUI交互平台及多款核心产品。此次升级以星火大模型为技术基座,重点引入情绪识别、创意生成等类人多模态能力,推动人机交互从功能型工具向... AI产品动态# AI技术# 人机交互# 多模态融合 6个月前
宇树科技获机器人关节控制专利,实现人体动作98.6%精准映射 杭州宇树科技获得国家知识产权局授权的新型机器人关节控制专利,实现人体动作98.6%精准实时映射,延迟低于50毫秒。该技术突破将推动工业自动化、远程医疗等领域的人机协作模式革新,计划2026年商业化落地... AI新闻资讯# 专利技术# 人机交互# 动作捕捉 2个月前
Meta与雷朋联手推出新一代智能眼镜,集成HUD与AI助手,售价800美元起 Meta与雷朋合作推出新一代智能眼镜Meta Ray-Ban Display,集成单眼HUD、sEMG手环输入和AI语音助手,支持实时翻译与导航。了解产品售价、功能亮点及Meta在AR领域的战略布局。 AI产品动态# AI助手# AR眼镜# HUD技术 3个月前
谷歌Gemini登陆Wear OS手表:AI助手开启智能穿戴交互新时代 谷歌Gemini全面适配Wear OS智能手表,实现语音控制、跨应用操作及游戏场景AI搜索,Pixel用户专享视频生成工具订阅服务,引领可穿戴设备AI交互革命。 AI产品动态# AI助手# CircletoSearch# Gemini 5个月前
谷歌Gemini Live语音助手五大升级:个性化语音与历史人物叙事功能上线 2025年11月谷歌Gemini Live语音助手重磅更新,新增语速调节、风格化语音、历史人物视角叙事等五大核心功能,搭载gemini-2.5-pro模型,全面提升语音交互个性化体验。 AI产品动态# AI技术更新# AI语音助手# 人机交互 1个月前
全球首个视频转网页评测基准IWR-Bench发布,GPT-5综合得分仅36.35分暴露AI交互逻辑短板 上海AI实验室与浙江大学发布全球首个视频转网页评测基准IWR-Bench,系统性评估28款主流AI模型动态网页生成能力。研究显示GPT-5交互功能得分仅24.39%,深度解析五大技术瓶颈与行业应用前景... AI新闻资讯# 人工智能# 人机交互# 前端开发 2个月前
谷歌发布神经操作系统:Gemini 2.5 Flash驱动UI实时生成,人机交互迎来变革 深度解析谷歌最新神经操作系统:基于Gemini 2.5 Flash模型的实时UI生成技术,具备极低延迟和成本优势,支持百万级token处理,将重塑操作系统市场格局。了解技术架构、性能指标及2025年企... AI产品动态# AI操作系统# Gemini2.5Flash# UI生成 3个月前
宇树科技获沉浸式机器人遥操作专利授权,革新远程人机交互模式 宇树科技沉浸式机器人遥操作专利整合第一人称映射与VR仿真,提升远程操作精度与直觉性,覆盖工业制造、医疗手术及灾害救援场景,助力人机交互革新。 AI新闻资讯# VR控制# 专利授权# 人机交互 2个月前
AI语音克隆实现以假乱真:研究证实合成语音与真人录音难以区分 伦敦大学研究证实:最新AI语音合成技术已达到与真人录音难以区分的水平。本文深度解析语音克隆的技术突破、商业应用前景及面临的伦理安全挑战,为关注人工智能发展的读者提供专业见解。 AI新闻资讯# AI语音合成# 人工智能伦理# 人机交互 3个月前
小米开源语音大模型Xiaomi-MiMo-Audio:7B级别性能全球领先,超越谷歌Gemini与OpenAI GPT-4o 小米发布全球领先的开源语音大模型Xiaomi-MiMo-Audio,在MMAU和Big Bench音频测试中超越谷歌Gemini与OpenAI GPT-4o。了解其亿小时训练数据、少样本学习能力及在智... AI产品动态# AI开源# 人机交互# 多模态AI 3个月前