1. 微软开源VibeVoice-1.5B音频模型,突破90分钟长语音合成技术壁垒
微软研究院于2025年8月26日宣布开源VibeVoice-1.5B音频模型,该模型通过创新架构实现单次连续合成90分钟超长语音,较业界上限提升50%。采用动态音色稳定算法解决音色失真与语义连贯性难题,显著降低有声书、在线教育等内容制作成本,并支持实时交互场景。 查看详情>>
2. Meta推出AI音频翻译功能:Facebook与Instagram Reels支持实时多语言翻译
Meta正式发布基于AI的Reels短视频音频翻译功能,支持英语与西班牙语实时互译,可实现口型同步与音色匹配。该功能显著降低多语言视频制作门槛,帮助创作者触达全球受众。 查看详情>>
3. 马斯克xAI申请“Macrohard”商标,公开挑战微软AI生态
埃隆·马斯克旗下xAI公司正式提交“Macrohard”商标申请,涵盖AI软件与云计算领域,直接对标微软。同步开源Grok 2.5模型,但陷隐私争议,科技巨头竞争升级。 查看详情>>
4. 腾讯会议AI纪要功能正式上线,实时智能协同重塑会议效率新标准
腾讯会议于8月25日全端上线AI纪要功能,通过深度整合AI技术实现每2分钟自动推送会议总结,精准提取决策项与任务分配,提升会后执行效率60%,并严格保障企业级信息安全。功能已免费开放,支持与腾讯元宝无缝衔接。 查看详情>>
5. DeepFuture发布全球首个GPT-5视频生成智能体Video Ocean,颠覆传统视频制作模式
硅谷科技公司DeepFuture正式推出全球首款接入GPT-5的视频生成平台Video Ocean,通过自然语言指令即可生成1-5分钟高质量视频,完播率达78%,支持全自动脚本创作、分镜设计与后期剪辑,已获彭博社等权威媒体机构应用 查看详情>>
6. 钉钉8.0“蕨”版本重磅发布:全面转向AI原生,重构未来工作方式
钉钉十周年发布会上正式发布AI原生8.0版本“蕨”,推出钉钉One、AI搜问、AI表格等十余款AI产品,以智能体驱动信息流,实现从“人找事”到“事找人”的范式转移,彻底颠覆传统办公模式。 查看详情>>
7. 苹果与谷歌谈判引入Gemini大模型,Siri将迎AI革命性升级
苹果正与谷歌深入谈判,计划通过Gemini技术全面升级Siri的AI能力,以弥补自研AI进展滞后。合作涉及本地化定制模型,可能推迟至2026年发布,同时苹果保持与OpenAI等企业的多方案并行推进。 查看详情>>
8. 微信AI播客灰度测试:双人对话式新闻播客上线,基于混元大模型语音生成
微信近日在“快讯”功能中启动AI播客灰度测试,通过腾讯混元大模型将文字新闻转化为双人对话式音频内容,适用于通勤、家务等碎片化场景。目前仅部分用户可体验,入口位于“快讯”页面的“听快讯”按钮。 查看详情>>
9. 豆包AI内置短视频无法关闭引争议,家长担忧孩子学习分心
字节跳动旗下AI产品“豆包”因内置短视频功能无法彻底关闭引发广泛讨论。多位家长反映,孩子使用豆包学习时答案下方自动附带抖音短视频链接,且功能无法永久关闭,导致学习时间被娱乐内容占据。本文事件背景、用户反馈及行业伦理讨论。 查看详情>>
10. 苹果2025年推出企业级AI管理工具,支持ChatGPT企业版集成与多供应商兼容
苹果公司将于2025年9月软件更新中发布企业级AI管理工具,强化数据安全与权限管控,支持OpenAI ChatGPT企业版集成,并采用模块化设计兼容多AI服务商。更新还包括Vision Pro快速重置、共享Mac认证模式等设备管理增强功能。 查看详情>>
11. 硅基流动发布DeepSeek-V3.1大模型:混合推理架构与160K上下文窗口实现突破
深度求索团队研发的DeepSeek-V3.1大语言模型正式上线,采用创新混合推理架构,参数量达6710亿,上下文窗口扩展至160K,在编程、复杂搜索和多步推理任务中表现卓越,API服务已面向开发者开放。 查看详情>>
12. 英伟达发布Jetson AGX Thor人形机器人计算平台,AI算力提升7.5倍加速商业化进程
英伟达于2025年8月25日推出专为人形机器人设计的Jetson AGX Thor计算平台,采用Blackwell架构GPU和ARM Neoverse CPU,AI算力达200TOPS,较上一代提升7.5倍,支持多模态传感器融合与低延迟处理,推动物流、医疗等场景机器人应用。开发者套件起售价3499美元,全球同步销售。 查看详情>>
13. OpenAI与英国政府谈判免费开放ChatGPT Plus服务,推动AI普惠化
OpenAI正与英国政府商讨全民免费开放ChatGPT Plus服务的提案,若达成协议,英国将成为首个由政府推动AI普惠服务的国家。本文解析谈判进展、服务升级及行业影响。 查看详情>>
14. 群核科技发布空间大模型SpatialGen:用AI生成可交互3D场景,推动空间智能革命
群核科技在首届技术开放日推出空间大模型SpatialGen,支持自然语言生成可交互3D室内设计场景,同步发布SpatialLM1.5语言模型。本文解析技术原理、应用场景及开源战略,展望AI在空间智能领域的行业影响。 查看详情>>
15. 夸克健康大模型实现“主任医师级”AI能力,医疗AI推理突破性进展
夸克发布《QuarkMed Technical Report》,披露其健康大模型通过中国12门核心学科主任医师笔试,成为国内首个达成该里程碑的AI模型。模型整合1万亿Token医疗数据,采用分阶段强化学习策略,在MedQA等权威测试中表现优异,疑难疾病诊断准确率达85.51%。 查看详情>>
16. Mobile-Agent-v3跨平台多代理框架发布:革新移动设备自动化操作技术
X-PLUG团队推出第三代Mobile-Agent-v3框架,通过多模态大语言模型与视觉感知技术实现Android、PC等跨终端自动化操作。该框架采用多代理协作架构,任务完成率提升30%,已应用于汽车智能座舱领域并集成至通义大模型解决方案。项目代码已开源,助力制造业、服务业跨设备自动化流程。 查看详情>>
17. Coinbase强制推行AI工具引发裁员风波,CEO坦言政策激进但必要
Coinbase首席执行官布赖恩·阿姆斯特朗在播客中证实,公司解雇了拒绝使用GitHub Copilot和Cursor等AI编程工具的工程师。公司要求一周内全员注册AI工具,并设定了本季度50%代码由AI生成的激进目标,远高于行业30%的平均水平。事件引发了对AI强制政策与企业管理的讨论。 查看详情>>
18. 沙特Humain启动AI数据中心建设,2030年目标1.9吉瓦算力布局
沙特AI公司Humain正式启动利雅得与达曼数据中心建设,计划2026年投运。项目采用英伟达GB300芯片,联合AMD、高通及AWS打造区域性AI基础设施,助力沙特实现数据本地化与阿拉伯语大模型战略。 查看详情>>
19. 马来西亚SkyeChip发布首款国产边缘AI芯片MARS1000,突破12nm制程与4TOPS算力
马来西亚科技企业SkyeChip于2025年8月25日正式推出自主研发的边缘AI处理器MARS1000,采用12nm工艺,具备4TOPS算力与3W超低功耗。该芯片面向工业物联网、智能安防及自动驾驶领域,预计2026年实现月产50万片,助力马来西亚半导体产业升级。 查看详情>>
20. 跃然创新完成2亿元A轮融资,全球首款AI玩具BubblePal销量突破20万台
深圳跃然创新科技(Haivivi)宣布完成2亿元A轮系列融资,由中金资本、红杉中国等领投。公司旗下全球首款AI玩具BubblePal销量达20万台,第二代产品CocoMate即将发布,融合多IP生态与端到端语音交互技术。 查看详情>>
AI咨询发布:AI视野 | 全球AI信息聚合平台。
© 版权声明
文章版权归作者所有,未经允许请勿转载。