AI视野

帅气的我简直无法用语言描述!

大晓机器人发布ACE具身研发范式及开悟世界模型3.0,引领具身智能新突破

2025年大晓机器人发布ACE具身研发范式、开源开悟世界模型3.0及A1模组,解决行业数据瓶颈,推动具身智能商业化。联合壁仞科技等构建国产化生态,重塑全球技术竞争路径。
2个月前

《自然》期刊力挺中国AI治理倡议,呼吁全球共建统一监管框架

《自然》期刊最新社论呼吁全球响应中国AI治理倡议,参与构建统一国际监管框架。文章强调中国通过WAICO等举措填补领导力真空,推动AI可追溯性、安全评估等务实措施,为应对AI风险提供关键解决方案。
2个月前

微软开源TRELLIS.2:40亿参数AI模型革新图像到3D生成,助力游戏与工业设计

微软最新开源AI工具TRELLIS.2是一款40亿参数的3D生成模型,专为高保真图像到3D转换设计。它基于3D VAE架构,支持1536³分辨率PBR资产生成,在H100 GPU上仅3秒即可生成512...
2个月前

谷歌AI助手CC开放候补注册:整合Gmail与日历,重塑晨间信息处理

谷歌实验室正式推出AI助手CC,基于Gemini多模态模型开发,面向美国及加拿大成年用户开放候补注册。该工具通过“Your Day Ahead”每日摘要邮件整合Gmail、云端硬盘和日历,实现邮件交互...
2个月前

Meta加码AI视频创作:发布MovieGen与Edits,构建“专业+普惠”双轨生态

Meta最新推出AI视频生成模型MovieGen与移动端编辑应用Edits,实现文本指令编辑与个性化视频生成,并升级AI广告工具包视频功能。本文深入解析Meta在AI视频领域的布局,探讨其“专业+普惠...
2个月前

xAI推出Grok Voice Agent API:支持多语言实时语音交互,定价0.05美元/分钟

xAI于2025年12月推出Grok Voice Agent API,提供支持多语言、平均响应<1秒的实时语音技术,兼容OpenAI规范,定价0.05美元/分钟。适用于车载导航、智能家居等场景,与GP...
2个月前

OpenAI正式推出ChatGPT应用商店(BETA),AI生态迈向“超级应用”新阶段

OpenAI于2025年12月18日正式发布ChatGPT应用商店(BETA),支持用户直接调用Adobe、Booking.com等第三方应用,提升场景实用性。本文解读平台功能、开发者准入、商业化探索...
2个月前

美团开源SOTA虚拟人视频生成模型LongCat-Video-Avatar,实现动作拟真与情感表达突破

美团最新开源虚拟人视频生成模型LongCat-Video-Avatar实现三大技术突破:支持文本/图片/视频多模式生成、5分钟长视频稳定生成、情感化动作表达。本文详解其解耦无条件引导、跨片段隐空间拼接...
2个月前

谷歌发布AI助手CC:基于Gemini大模型,整合Gmail、日历打造个性化工作流

谷歌实验室推出基于Gemini大模型的AI助手CC,深度融合Gmail、日历等核心服务,提供自动化晨间简报、邮件预起草等功能。目前面向美加用户开放早期访问,加速AI个人助手赛道竞争。
2个月前

微软与Kimi合作升级Office:AI Agent技术驱动办公自动化革新

微软与Kimi合作推出AI驱动的Office新功能,通过AI Agent实现文档处理、数据分析等自动化,提升工作效率,重塑办公场景。了解技术细节与市场影响。
2个月前