谷歌发布Gemini 2.5计算机使用模型:AI可直接操作界面实现自动化交互
2025年10月8日,谷歌正式发布Gemini 2.5计算机使用模型,该AI模型具备视觉推理能力,可直接操作浏览器和应用程序界面,支持13种基础操作,实现低延迟自动化交互,为开发者提供革命性的界面自动...
OpenAI发布Sora 2视频生成模型:实现物理规律精准模拟,24小时登顶App Store前三
OpenAI于2025年9月发布新一代视频生成模型Sora 2,实现物理规律精准模拟和多镜头一致性,支持音视频同步生成。Sora App上线24小时登顶App Store前三,下载量达16.4万次,推...
ChatGPT平台化转型加速:周活用户突破8亿,API处理能力达60亿token/分钟
深度解析OpenAI ChatGPT平台化转型战略:周活用户突破8亿,API处理能力达60亿token/分钟。了解Apps SDK、AgentKit工具集及Codex商用版如何重塑互联网入口格局,推动...
AI视野:每日AI资讯速递 | 2025-09-30
专业AI资讯平台,追踪人工智能发展前沿,每日精选AI领域重要新闻、技术突破和商业应用,让您快速了解全球AI最新动态与发展方向 | AI视野(www.ai4yes.com)
德国海德堡启用AI停车执法系统,违章率下降23%效率提升7倍
深度解析德国海德堡AI停车执法系统:集成摄像头与雷达技术实现99.7%车牌识别,日均处理量达人工7倍,推动智慧城市交通管理升级与商业化落地实践。
阿里云AI实训营启动Agent创客征集令,10名开发者集结备战2025云栖大会
阿里云AI实训营正式启动Agent创客征集令,首批10名开发者集结,将基于百炼平台在2025云栖大会进行AI Agent开发实践。了解如何通过可视化工具ADP和高代码框架ADK降低开发门槛,推动智能体...
Hume AI发布Octave 2多语言语音模型,新增阿拉伯语等12种语言支持
Hume AI最新推出Octave 2多语言语音模型,支持12种语言包括阿拉伯语和印地语,在情感识别基础上优化韵律建模,自然度提升23%。该模型将应用于医疗问诊和跨境客服,已与多家呼叫中心运营商达成合...
AI语音克隆实现以假乱真:研究证实合成语音与真人录音难以区分
伦敦大学研究证实:最新AI语音合成技术已达到与真人录音难以区分的水平。本文深度解析语音克隆的技术突破、商业应用前景及面临的伦理安全挑战,为关注人工智能发展的读者提供专业见解。
优必选与天奇股份达成3000万工业人形机器人合作,Walker S系列加速智能制造落地
优必选科技与天奇股份达成3000万元工业人形机器人Walker S系列采购合作,预计2025年完成交付。Walker系列累计合同金额达4.3亿元,已在比亚迪、吉利、富士康等龙头企业投入实训,推动人形机...
量子计算新突破:加州理工构建6100原子量子系统,实现规模与精度双飞跃
加州理工学院研究团队在《自然》杂志发布突破性成果,成功构建全球最大6100个中性原子量子比特系统,单比特精度99.98%,相干时间13秒,标志着量子计算从实验室走向实际应用的关键转折点。