AI视野:每日AI资讯速递 | 2025-09-03

1. 腾讯混元开源HunyuanWorld-Voyager:全球首个原生3D重建超长漫游世界模型

腾讯混元团队于2025年9月2日发布并开源业界首个支持原生3D重建的超长漫游世界模型HunyuanWorld-Voyager。该模型在斯坦福WorldScore排行榜综合能力第一,突破传统3D生成长距离漫游与视角一致性问题,支持RGB-D视频联合建模,实现动态场景扩展,显著提升VR、游戏开发等领域效率。 查看详情>>

2. 阿里通义实验室开源多智能体框架AgentScope 1.0正式发布,支持全生命周期开发

阿里通义实验室于2025年9月发布生产级开源智能体开发框架AgentScope 1.0,该框架通过三层架构设计、异步实时干预、智能上下文管理等技术突破,为开发者提供从构建、运行到监控的全流程解决方案,显著提升多智能体应用开发效率。 查看详情>>

3. 即梦AI与火山引擎战略合作:全面开放企业级API服务,赋能多场景AI创作

即梦AI与火山引擎达成战略合作,正式面向企业开放文生图、视频生成、数字人等多款AI模型API服务,基于自研Seedream/Seedance算法,为企业提供高效稳定的图像与视频生成解决方案,覆盖营销、教育、游戏等多行业场景。 查看详情>>

4. DeepSeek公开大模型训练技术细节:预训练与优化训练双阶段突破,能耗降低30%

DeepSeek公司近日公开其大模型训练技术,详细解析预训练与优化训练两大核心环节。其V3模型参数规模达6850亿,采用MoE架构和FP8混合精度技术,显著降低计算成本与能耗,并在多项基准测试中表现卓越,为AI行业提供重要工程实践参考。 查看详情>>

5. OpenAI推出家长控制功能应对青少年心理健康风险,ChatGPT安全升级全面解析

本文报道OpenAI因青少年心理健康诉讼事件推出家长控制新功能,包括账户权限管理、高风险对话干预和紧急联系人机制,并探讨AI伦理责任与技术平衡的行业挑战。 查看详情>>

6. 微软开源rStar2-Agent数学推理模型:140亿参数超越6710亿大模型,主动式强化学习突破

微软研究院开源rStar2-Agent模型,仅140亿参数在数学推理任务中超越DeepSeek-R1等大模型。采用主动式强化学习架构,支持高并发工具调用,训练高效,泛化能力卓越,为小参数模型高性能推理提供新范式。 查看详情>>

7. 微信安卓8.0.63内测版发布:新增实况图片发送与订阅号优化,API级别提升至34

微信安卓8.0.63内测版于2025年9月2日推出,支持实况图片发送、订阅号分类标签优化和权限设置调整,API级别升至34以提升性能与安全。安装包体积243.98MB,适配Android 7.0+系统。 查看详情>>

8. 智谱推出GLM Coding Plan开发者套餐:每月20元起,GLM-4.5性能全球领先

智谱于9月1日正式发布GLM Coding Plan开发者专属套餐,基础版每月20元即可使用旗舰模型GLM-4.5。该模型在多项国际评测中超越GPT-4.1和Gemini-2.5-Pro,工具调用能力全球第一,成本仅为同类产品的1/7。 查看详情>>

9. 谷歌Gemini API全面上线URL Context功能,革新AI文档处理与多模态理解

谷歌正式在Gemini API中推出URL Context功能,允许开发者通过API指令AI模型深度处理网页、PDF和图像等内容,支持最大34MB文档解析,实现多模态数据理解和批量URL分析,有望重塑RAG架构并推动AI在数据分析领域的应用。 查看详情>>

10. 微软Copilot免费升级:多文件分析功能全面开放,跨文档处理效率倍增

微软Copilot推出免费多文件分析功能,支持单次上传3份关联文件协同处理,集成GPT-5推理引擎,适用于求职匹配、旅行规划及学习场景,提升办公自动化与知识管理效率。 查看详情>>

11. 苹果推出革命性AI图像生成系统STARFlow,挑战DALL-E与Midjourney市场地位

苹果联合学术机构发布突破性AI图像生成系统STARFlow,通过融合标准化流与自回归Transformer架构,实现高分辨率图像生成性能飞跃。该系统支持端到端训练、浏览器部署及医疗影像精准控制,或重塑行业竞争格局。 查看详情>>

12. 腾讯优图开源Youtu-Agent智能体框架:低成本替代闭源方案,效率提升10倍

腾讯优图实验室正式开源高性能智能体框架Youtu-Agent,基于开源模型实现接近商业API性能(WebWalkerQA准确率71.47%),成本仅为商用方案1/8。创新YAML声明式配置支持自然语言生成代码,学术论文解析等任务仅需13行配置,效率提升10倍,覆盖学术研究、数据分析等场景。 查看详情>>

13. 微软免费为美政府提供Copilot AI服务,三年价值60亿美元

微软与美国总务管理局(GSA)达成协议,免费为联邦机构提供Microsoft 365 Copilot AI服务,旨在推动政府数字化转型。该计划首年可节省30亿美元,涵盖Azure、Dynamics 365等产品,并包括技术部署支持。 查看详情>>

14. 苹果开放FastVLM浏览器试用版:本地运行85倍速视频字幕生成,重塑AI交互体验

苹果公司在Hugging Face平台推出FastVLM视觉语言模型试用版,该模型基于自研MLX框架优化,支持Apple Silicon芯片Mac本地运行,视频字幕生成速度提升85倍且模型体积缩减三分之二。具备实时画面识别、隐私保护及离线应用特性,为社交媒体创作、辅助技术和可穿戴设备提供突破性解决方案。 查看详情>>

15. 视觉中国AIGC标识系统升级:双标识体系应对AI版权管理新规

视觉中国于2025年9月1日完成vcg.com和cfp.cn平台AIGC标识系统升级,响应国家《人工智能生成合成内容标识办法》。新系统采用显性水印与隐性元数据双重标识,新增搜索筛选及下载合规提示功能,同步覆盖500px中国区,推动AI生成内容版权透明化管理。 查看详情>>

16. 国务院印发《人工智能+行动意见》 工业大模型加速落地赋能全流程

国务院印发《关于深入实施人工智能+行动的意见》,推动工业大模型技术在化工、钢铁等流程工业中实现设备预测性维护与智能决策。文章介绍褚健团队研发的时间序列大模型在陕西榆林化工企业的应用,以及工业AI数据联盟成立、我国AI产业架构与算力发展现状。 查看详情>>

17. 华盛昌DeepSense大模型通过国家AI备案,首开测量领域垂直AI先河

华盛昌科技自主研发的DeepSense深度感测大模型正式通过国家生成式AI服务备案,成为国内仪器仪表测量领域首个获批垂直大模型。该模型融合AI技术与行业经验,提供设备运维、故障诊断与预测性维护智能化解决方案,推动工业监测数字化升级。 查看详情>>

18. Mistral AI发布企业级平台Mistral Medium 3.1:多模态性能超越GPT-4o,成本降低80%

法国AI独角兽Mistral AI推出新一代企业级AI平台Mistral Medium 3.1,其在多模态处理、长上下文支持和代码生成等关键指标上超越GPT-4o与Claude 3.7,同时通过MoE架构将企业部署成本压缩至传统方案的1/8。该平台已获微软Azure整合支持,正重塑全球AI竞争格局。 查看详情>>

19. Flowith推出多模态AI人生模拟器flolife.me,革新游戏体验

Flowith团队近日发布多模态AI人生模拟器flolife.me,通过整合多模态画布、NanoBanana技术和Multi-Agent系统,为用户提供高度自由化的人生模拟。玩家可自定义角色属性,AI算法生成动态人生轨迹,包括事件触发、分支选择和可视化时间线。产品支持人格模板导入和社交分享功能,上线24小时内引发热议,未来计划拓展至教育仿真和心理疗愈领域。 查看详情>>

20. 清华大学联合团队突破搜索智能体训练瓶颈:自搜索强化学习(SSRL)实现高效Sim2Real迁移

清华大学、上海人工智能实验室与上海交通大学联合提出自搜索强化学习(SSRL)方法,通过结构化提示和格式化奖励机制激发LLM内部知识,显著提升搜索智能体训练效率与稳定性,并首次实现模拟到真实场景的有效迁移。研究已开源全部代码与数据。 查看详情>>

AI咨询发布:AI视野 | 全球AI信息聚合平台

© 版权声明

相关文章