AI视野:每日AI资讯速递 | 2025-12-19

AI每日资讯7小时前发布 AI视野

1. OpenAI发布GPT-5.2-Codex智能体编程模型,实现专业软件工程领域技术突破

2025年12月18日,OpenAI正式推出GPT-5.2-Codex智能体编程模型。该模型基于GPT-5.2通用架构,整合前代终端操作能力,核心创新在于’上下文压缩’技术,显著提升代码重构、跨平台迁移等长周期任务的执行效率。在SWE-Bench Pro和Terminal-Bench 2.0等权威测试中,其准确率分别达到56.4%和64.0%,较前代提升明显。新模型针对Windows 10/11原生环境进行深度优化,增强系统工具调用、文件路径管理等操作的可靠性。视觉理解能力取得突破,可精准解析UI截图、技术图表及设计草图,并直接生成可运行的前端或全栈原型代码。开发闭环能力方面,模型已实现从代码库导航、缺陷修复到提交Pull Request的全流程自动化,被定位为开发者的’智能体伙伴’。目前付费ChatGPT用户已可通过Codex界面体验新模型,API访问权限计划在未来几周内逐步开放。 查看详情>>

2. 阿里千问与高德地图实现系统级对接,火山引擎发布豆包大模型1.8版,国产大模型竞争进入全系统构建新阶段

12月18日,国内AI领域迎来两项重要进展:阿里千问App与高德地图深度整合,实现物理世界服务能力突破;火山引擎发布豆包大模型1.8版,优化多模态Agent能力并推出行业首个“AI节省计划”。市场数据显示,国产大模型调用占比持续攀升,行业竞争焦点正从模型性能转向数据、算力与场景落地的全系统构建能力。 查看详情>>

3. 我国发布首个虚拟数字人国家标准,客服型数字人技术规范正式出台

12月18日,《信息技术 客服型虚拟数字人通用技术要求》国家标准正式发布,这是虚拟数字人领域首个国家级技术规范,明确了形象生成、多模态交互、情感交互等六大核心模块的技术要求,标志着行业进入标准化发展新阶段。 查看详情>>

4. OpenAI拟以7500亿美元估值融资千亿,亚马逊或投百亿美元加码AI军备竞赛

OpenAI正洽谈新一轮数百亿至千亿美元融资,估值或达7500亿美元,较三个月前跃升50%。亚马逊拟投资100亿美元,延续“算力绑定”合作模式。行业资本持续涌入生成式AI赛道,头部企业加速算力基建布局。 查看详情>>

5. Meta暂停开放Horizon OS合作计划,元宇宙战略转向质量深耕

Meta于2025年底宣布暂停向第三方设备制造商开放其混合现实操作系统Meta Horizon OS的合作计划,标志着其元宇宙战略从规模扩张转向聚焦自研软硬件开发。本文分析其战略调整背景、市场环境变化及对XR行业的影响。 查看详情>>

6. Google将Opal集成至Gemini网页端,零代码AI应用开发门槛大幅降低

Google近日宣布将“氛围编程”工具Opal正式集成至Gemini网页端,用户无需编程基础即可通过自然语言创建个性化AI应用,并保存为可复用的Gems助手。这一更新推动了AI开发的大众化进程。 查看详情>>

7. 火山引擎发布Seedance 1.5 Pro:突破音画同步技术,AI视频生成进入声画融合新阶段

字节跳动火山引擎在FORCE原动力大会上推出新一代音视频创作模型Seedance 1.5 Pro,该模型采用原生音视频联合生成架构,实现毫秒级音画同步、电影级运镜控制和增强语义理解三大突破,已在豆包App和即梦AI平台开放使用。 查看详情>>

8. 微软与Kimi合作升级Office:AI Agent技术驱动办公自动化革新

微软与Kimi深度合作,基于AI Agent技术为Office套件带来智能化升级,实现文档生成、数据分析等任务的自动化,提升办公效率并应对市场竞争。 查看详情>>

9. 谷歌发布AI助手CC:基于Gemini大模型,整合Gmail、日历打造个性化工作流

谷歌实验室正式推出基于Gemini大模型的AI助手CC,面向美加成年用户开放早期访问。该助手深度整合Gmail、日历等谷歌服务,提供晨间简报、邮件预起草等自动化功能,旨在提升日常工作效率。 查看详情>>

10. 美团开源SOTA虚拟人视频生成模型LongCat-Video-Avatar,实现动作拟真与情感表达突破

美团LongCat团队开源全新虚拟人视频生成模型,通过创新技术实现动作拟真度、长视频稳定性与身份一致性三大突破,支持文本、图片、视频三种生成模式,推动虚拟人技术进入新阶段。 查看详情>>

11. OpenAI正式推出ChatGPT应用商店(BETA),AI生态迈向“超级应用”新阶段

2025年12月18日,OpenAI推出ChatGPT应用商店(BETA),将ChatGPT从对话工具升级为综合性智能服务平台。用户可通过分类浏览或指令直接调用Adobe、Apple Music等第三方应用,实现酒店预订、文档转换等场景操作,同时开发者可提交应用审核并利用配套工具参与生态建设。 查看详情>>

12. xAI推出Grok Voice Agent API:支持多语言实时语音交互,定价0.05美元/分钟

2025年12月18日,xAI正式发布Grok Voice Agent API,向全球开发者开放已在Tesla车辆验证的实时语音代理技术。该API支持数十种语言,平均响应时间低于1秒,兼容OpenAI Realtime API,提供多款情感化语音角色,适用于车载、智能家居等场景。 查看详情>>

13. Meta加码AI视频创作:发布MovieGen与Edits,构建“专业+普惠”双轨生态

Meta近期在AI视频领域持续发力,推出高级视频生成模型MovieGen与移动端编辑应用Edits,旨在简化创作流程并赋能内容生产者。MovieGen支持文本指令编辑与个性化视频生成,其人物保护与运动自然度表现突出;同时,AI广告工具包升级视频功能,助力广告主高效制作动态素材。行业分析认为,Meta正通过覆盖不同技术层级的双轨策略,重塑短视频内容生产格局。 查看详情>>

14. 谷歌AI助手CC开放候补注册:整合Gmail与日历,重塑晨间信息处理

谷歌实验室基于Gemini模型推出AI助手CC,面向美加成年用户开放候补注册。该工具通过每日摘要邮件整合待办事项与日程,支持邮件交互管理,目前仅限个人账户使用。 查看详情>>

15. 微软开源TRELLIS.2:40亿参数AI模型革新图像到3D生成,助力游戏与工业设计

微软近日开源了其最新AI工具TRELLIS.2,这是一款拥有40亿参数的大型3D生成模型,专为高保真图像到3D转换而设计。该模型基于原生3D VAE架构,支持生成高达1536³分辨率的PBR纹理资产,并具备高效压缩能力,在英伟达H100 GPU上生成512³模型仅需约3秒。TRELLIS.2突破了传统3D建模限制,可处理复杂拓扑与材质,支持生成.glb格式文件,适用于游戏开发、虚拟现实、电商展示等领域,大幅优化3D内容生产流程。 查看详情>>

16. 《自然》期刊力挺中国AI治理倡议,呼吁全球共建统一监管框架

国际权威期刊《自然》近期连续发表社论,支持中国提出的人工智能治理倡议,强调全球需协同应对AI监管真空,并肯定中国在推动成立世界人工智能合作组织(WAICO)及实施可操作治理措施方面的领导作用。 查看详情>>

17. 大晓机器人发布ACE具身研发范式及开悟世界模型3.0,引领具身智能新突破

2025年12月18日,大晓机器人发布行业首创的ACE具身研发范式、开源开悟世界模型3.0及具身超级大脑模组A1,通过“以人为中心”理念解决数据瓶颈,推动机器人商业化落地。同时与壁仞科技等企业达成生态合作,加速国产化技术路径构建。 查看详情>>

18. 甲骨文与OpenAI获密歇根州批准建设1.4吉瓦数据中心,能源合作重塑AI基建格局

美国密歇根州公共服务委员会正式批准DTE能源为甲骨文与OpenAI的“星际之门”数据中心供电,项目规划电力容量达1.4吉瓦,预计带动超4500亿美元投资,采用企业直购电模式引发行业变革。 查看详情>>

19. 理想汽车硅谷AI研发中心正式筹建,聚焦辅助驾驶技术全球化布局

理想汽车近日启动美国硅谷AI研发中心建设,重点攻坚辅助驾驶领域,并大规模招聘高端算法人才。该中心是其全球第四座研发枢纽,旨在加速技术迭代并为新兴市场提供支持,标志着理想从中国市场向跨国技术企业转型迈出关键一步。 查看详情>>

AI咨询发布:AI视野 | 全球AI信息聚合平台

© 版权声明

相关文章