AI视野:每日AI资讯速递 | 2025-12-17

AI每日资讯5小时前发布 AI视野

1. OpenAI发布GPT Image 1.5:图像生成速度提升4倍,API成本降低20%

2025年12月17日,OpenAI正式推出新一代图像生成模型GPT Image 1.5,在ChatGPT平台及API端全面开放。新模型在生成质量、编辑功能和效率上实现重大突破,支持多图并行生成,文本渲染效果优化,并为企业用户提供成本优化。本文解读其核心性能、商业化策略及行业竞争影响。 查看详情>>

2. 阿里巴巴发布通义万相2.6:国内首个支持角色扮演的AI视频生成模型,开启影视创作新纪元

2025年12月16日,阿里巴巴正式推出通义万相2.6系列模型,作为国内首个具备角色扮演功能的视频生成AI,支持基于输入视频的角色外观与音色生成定制化内容,实现从分镜设计到配音的全流程自动化,已上线阿里云百炼平台,将大幅降低专业视频创作门槛。 查看详情>>

3. 字节跳动发布Seedance 1.5 pro音视频生成模型:AI内容创作进入视听融合新阶段

字节跳动推出新一代音视频生成模型Seedance 1.5 pro,实现文本/图像到同步音视频的完整创作流程。模型通过深度整合音视频模块,精准控制语音与画面的时空同步,支持多语言及方言拟真,并引入智能运镜算法,可生成电影级视觉效果的视频内容。 查看详情>>

4. 小米开源MoE模型Xiaomi MiMo-V2-Flash发布:150token/秒生成速度创纪录,性能比肩DeepSeek-V3.2

小米正式发布开源MoE模型Xiaomi MiMo-V2-Flash,凭借每秒150token的生成速度、3090亿总参数及混合注意力架构实现性能突破。模型在SWE-Bench和多语言测试中表现优异,代码能力接近Claude 4.5 Sonnet,推理成本仅为其2.5%。同步推出在线体验平台,全面开源并开放限时免费API服务。 查看详情>>

5. OpenAI移动端布局加速:ChatGPT应用全面覆盖iOS与Android平台,语音识别与跨设备同步成亮点

本文报道OpenAI在移动端的最新进展,其官方ChatGPT应用已登陆iOS和Android平台,集成Whisper语音识别系统,支持多语种输入,并引发下载热潮。应用覆盖美国、印度等市场,提升用户活跃度,同时OpenAI可能提前推出GPT-5.2模型以应对竞争。 查看详情>>

6. 英伟达推出Nemotron 3开源AI模型系列,以MoE与Mamba-Transformer混合架构提升多智能体协作效率

英伟达正式发布Nemotron 3开源AI模型系列,涵盖Nano、Super和Ultra三种规格,采用混合潜在专家(MoE)与Mamba-Transformer混合设计,旨在优化多智能体系统的跨行业协作。轻量级Nano模型已上线Hugging Face,支持高效任务处理与百万级上下文窗口,而中高端型号聚焦复杂AI工作流,计划2026年发布。该系列通过开源工具库和数据集降低开发门槛,已获制造业、网络安全等领域早期采用,有望推动产业智能化升级。 查看详情>>

7. Canva AI正式登陆中国:对话式设计开启“边聊边改”新纪元,2026设计趋势报告同步发布

全球设计平台Canva可画于2025年底面向中国市场推出对话式AI助手Canva AI,通过自然语言交互简化设计流程,同步发布《2026设计趋势》及《中国视觉表达洞察》报告。新功能深度适配电商、社交媒体等本土场景,数据显示情绪化表达、国风日常化及中小商家视觉需求成为三大创作趋势,标志着AI正推动中国创意工作流进入“对话即设计”的新阶段。 查看详情>>

8. 苹果联手博通研发AI服务器芯片“Baltra”,专注推理任务,预计2027年部署

苹果公司正加速推进垂直整合战略,与博通合作研发代号“Baltra”的首款AI服务器芯片,专注于AI推理任务,采用台积电3nm制程,目标2027年完成部署。该芯片优化低精度INT8运算,提升能效比,满足Siri等场景的高并发需求,是苹果减少对英伟达依赖、构建从终端到云端技术闭环的关键举措。 查看详情>>

9. 腾讯元宝AI写作模式上线,一键生成万字小说,覆盖全平台免费使用

腾讯元宝于12月15日正式推出AI“写作模式”,通过聊天交互输入简单灵感,即可自动生成故事大纲、人物设定及数万字连贯正文,支持多题材、模仿文风,适配网文创作、剧本写作等场景,由混元与DeepSeek双模型驱动,全平台免费开放。 查看详情>>

10. 全球首个“人源化”心脏类器官问世,为心律失常研究带来革命性突破

美国密歇根州立大学团队成功培育出全球首个具备免疫细胞的人源化心脏类器官,该模型能自主跳动并模拟炎症引发的心律失常,为药物研发提供精准测试平台,有望打破30余年无新药僵局。 查看详情>>

11. Chai Discovery完成1.3亿美元B轮融资,AI制药估值达13亿美元

AI生物技术公司Chai Discovery宣布完成1.3亿美元B轮融资,由General Catalyst和Oak HC/FT领投,OpenAI等跟投,公司估值达13亿美元。其核心AI模型Chai 2在抗体从头设计领域实现突破,加速药物研发从“试错”向“精准设计”转型。 查看详情>>

12. 谷歌TPU订单翻倍,联发科助力挑战英伟达AI芯片霸主地位

谷歌大幅增加对联发科TPU v7e芯片订单,规模翻倍以加速AI芯片量产,联合Anthropic、Meta等客户拓展生态,采用双供应商策略突破产能瓶颈,卡位商业化芯片市场。 查看详情>>

13. IBM开源AI智能体框架CUGA发布:多智能体协同实现企业流程自动化

IBM推出开源AI智能体框架CUGA,通过动态任务分解与多智能体协同技术,提升企业工作流程自动化效率。该系统在WebArena和AppWorld基准测试中表现优异,支持与Langflow等平台集成,为企业级AI应用提供灵活解决方案。 查看详情>>

14. 无问芯穹发布企业级智能体服务平台,加速AI智能体规模化落地与商业化

12月16日,无问芯穹在2025 INFINI DAY论坛上正式推出企业级智能体服务平台,通过开箱即用的Agent能力模板和托管服务,帮助企业应对智能体部署中的技术挑战,实现从开发到变现的全链路解决方案。平台强调“陪伴式落地”服务,已获金融、医疗等领域首批客户应用。 查看详情>>

15. 多模态AI为何数不清六根手指?揭秘模型在空间认知与逻辑推理的结构性缺陷

近期,主流多模态AI模型在识别六指手图像时出现系统性错误,即使面对明确提示仍坚持输出“五根手指”。本文从数据偏差、架构局限及工程应对三个层面,深入解析生成式AI在视觉理解与逻辑推理中的根本问题,并探讨未来突破方向。 查看详情>>

16. 全球首款情感交互人形机器人“爱湫-AIQ”在川发布,集成ELA大模型实现精准情绪反馈

四川具身人形机器人科技有限公司于2025年12月16日发布全球首款情感交互人形机器人“爱湫-AIQ”。该机器人以龙蜥为设计原型,集成全球首个“情感-语言-动作”大模型(ELA)与多模态情感计算引擎,交互理解准确率达92%,并首创3D超短焦投影表情系统,支持超200种微表情。产品已规划康养陪护与城市服务两大应用场景,并同步推出AI动漫系列强化IP生态。 查看详情>>

17. 即梦AI网页版全面升级,推出AI片场一站式创作解决方案,视频3.5 Pro模型实现音画同步突破

即梦AI网页版于12月16日完成重大升级,正式发布“AI片场”一站式创作解决方案。升级涵盖核心模型、交互工具及全流程优化,重点推出全球首发视频3.5 Pro模型,实现音画同步生成技术,支持方言、乐器等复杂场景。同时,智能多帧2.0、图像生成矩阵迭代及全新画布系统,为视频制作、海报设计、AI漫剧等提供高效支持,降低创作门槛。 查看详情>>

18. 商汤科技发布小浣熊3.0 AI办公智能体,实现交付效率与数据分析能力双重突破

商汤科技正式推出新一代AI办公智能体“小浣熊3.0”,在交付效率、理解深度及工作流整合三大维度实现技术跃迁。产品搭载多模态智能体创作引擎,支持碎片化信息自动解析与专业演示文稿生成,并具备百万级数据实时分析能力,业务分析精度达95%,将传统分析周期缩短90%。 查看详情>>

19. 菜鸟与蜜雪集团达成AI供应链合作,推动智能管理系统升级以应对全球化挑战

菜鸟与蜜雪集团于12月16日宣布科技合作,共同建设以人工智能为核心的智能供应链管理系统,旨在将蜜雪集团的传统供应链升级为AI驱动模式,提升效率并降低成本。该系统整合销售预测、智能补货等功能,预计将原材料供应效率提升30%以上,减少15%库存资金占用,并于2026年完成首批试点部署。 查看详情>>

20. Databricks完成超40亿美元L轮融资,估值达1340亿美元,加速AI与数据分析业务扩张

Databricks宣布启动规模超40亿美元的L轮融资,估值提升至1340亿美元,资金将用于强化AI软件研发及全球团队扩充。公司年度经常性收入增至48亿美元,数据仓库产品收入突破10亿美元,凸显AI浪潮下企业数据应用需求增长。 查看详情>>

AI咨询发布:AI视野 | 全球AI信息聚合平台

© 版权声明

相关文章