AI视野:每日AI资讯速递 | 2025-08-20

AI每日资讯11小时前发布 AI视野

1. DeepSeek-V3.1重磅升级:128K上下文窗口震撼发布,长文本处理能力翻倍

DeepSeek官方宣布V3.1版本重大升级,上下文窗口从64K扩展至128K,支持10-13万汉字超长文本处理。多步推理性能提升43%,代码生成和数学计算准确性显著增强,同时大幅降低幻觉现象38%。 查看详情>>

2. 通义千问开源Qwen-Image-Edit图像编辑模型:实现语义与外观双重编辑突破

阿里巴巴通义千问团队推出开源图像编辑模型Qwen-Image-Edit,整合视觉语义与外观控制模块,支持中英文多行文本像素级编辑,在GEdit等基准测试达到SOTA水平,24G显存即可运行。 查看详情>>

3. 英伟达Blackwell架构中国特供版B30A芯片9月送样,算力超H50%但存监管变数

英伟达基于Blackwell架构的专供中国AI芯片B30A进入最终测试阶段,单芯片设计性能超现售H20芯片50%,内存带宽精准控制在1398GB/s以符合美国出口限制。同期推出的RTX6000D推理芯片与B30A均计划9月交付工程样品,但受中美技术管制与中方安全审查影响,量产前景仍存不确定性。 查看详情>>

4. 腾讯推出大模型训练库WeChat-YATT,多模态训练效率提升15%

腾讯正式发布大模型训练工具库WeChat-YATT,支持强化学习与多模态训练优化,显著降低硬件消耗并已集成腾讯云TI平台。本文解析其技术特性、应用场景及行业影响。 查看详情>>

5. 奥特曼罕见警告:美国低估中国AI进展,开源生态重塑全球竞争格局

OpenAI CEO山姆·奥特曼公开表示,美国半导体管制难以遏制中国AI发展。中国开源模型集群突破,阿里Qwen3等模型性能超越美国产品,推动OpenAI首次推出开源模型gpt-oss。全球AI竞争进入生态体系对抗新阶段。 查看详情>>

6. 苹果Xcode 26集成Claude大模型,AI编程助手生态迎来多模型时代

苹果在Xcode 26 Beta 7中原生集成Anthropic Claude模型,开发者可直接调用Sonnet 4.0和Opus 4进行代码生成与优化,无需手动API配置。这一更新扩展了Swift Assist的多模型架构,涵盖自研模型、ChatGPT及本地方案,提升开发效率与工作流灵活性。 查看详情>>

7. 宇树科技突破多传感器融合技术:机器人动态建图精度提升40%

杭州宇树科技公开新型动态时空同步建图专利,通过点云畸变校正和多传感器时间对齐技术,实现厘米级定位误差,显著提升机器人在物流、救援等复杂场景的自主作业能力。 查看详情>>

8. OpenAI发布GPT-5系列模型:推理能力突破与争议并存,API成本大幅降低

2025年8月8日,OpenAI正式推出GPT-5系列模型,包括基础版、Mini、Nano及企业级Pro版本。新模型在编程效率(SWE-bench达74.9%)、数学推理(AIME准确率94.6%)和长文本处理(400K tokens)实现突破,但多模态能力未支持音视频生成引发争议。API定价低至每百万token 1.25美元,企业场景应用覆盖医疗、金融领域。 查看详情>>

9. Meta启动第四次AI重组,超级智能实验室拆分为四大部门加速AGI研发

Meta Platforms正加速AI战略调整,计划六个月内对AI部门进行第四次重组,将超级智能实验室拆分为TBD实验室、产品开发、基础设施和FAIR实验室四大部门,聚焦AGI研发与算力基建,资本支出预算增至660-720亿美元。 查看详情>>

10. 百度蒸汽机2.0版本8月21日发布:全球首个中文优化AIGC视频模型升级音视端到端能力

百度蒸汽机(MuseSteamer)作为全球首个支持中文场景深度优化的AIGC视频生成模型,注册用户突破30万,2.0版本将推出Turbo、Lite、Pro及有声版全系产品,升级音视端到端建模和电影级画质,谨防虚假网站诈骗。 查看详情>>

11. OpenAI开源两款MoE模型gpt-oss-120B/20B:支持消费级设备部署,硅基流动国际站同步上线

OpenAI时隔六年重返开源领域,发布轻量级MoE模型gpt-oss-120B和gpt-oss-20B。两款模型采用混合专家架构与MXFP4量化技术,支持单张H100 GPU或消费级设备部署,性能接近闭源o系列模型。硅基流动国际站已提供在线体验及API服务,适用于数据安全敏感场景的本地AI部署。 查看详情>>

12. 淘宝灰度测试“AI万能搜”功能:用自然语言交互重构电商搜索

淘宝移动端正测试“AI万能搜”功能,通过自然语言交互和多模态内容输出,覆盖穿搭、礼品推荐等消费场景,整合商品、视频及图文生成决策报告,推动电商搜索逻辑变革。 查看详情>>

13. 人工智能成中意中欧合作新增长点,贾桂德大使阐述治理共识与前景

中国驻意大利大使贾桂德在《外交报》发表署名文章,系统分析中意、中欧在人工智能领域的合作机遇与治理共识,强调双方在智能向善、开放标准、包容发展三大方向的协同,并提议通过联合研发、标准互认深化医疗、制造等具体领域合作,为全球数字治理提供中欧方案。 查看详情>>

14. 英伟达开源Nemotron-Nano-9B-V2模型:90亿参数性能比肩主流,吞吐量达6.3倍

英伟达最新开源小型语言模型Nemotron-Nano-9B-V2在数学推理、代码生成和长上下文处理等任务中表现卓越,仅需单个A10 GPU即可运行,大幅降低AI部署门槛。 查看详情>>

15. NASA与谷歌联合研发AI太空医疗系统CMO-DA,为深空探索任务提供实时医疗支持

NASA与谷歌合作测试基于AI的医疗辅助系统CMO-DA,该系统整合多模态大语言模型,能诊断250种太空医学场景,在深空任务通信延迟情况下为宇航员提供自主医疗支持,目前已实现踝关节损伤88%的诊断准确率。 查看详情>>

16. 蚂蚁集团AI医疗打假专区上线,AI拍图识别虚假广告准确率98.7%

蚂蚁集团8月18日启动医疗广告打假专项行动,旗下AQ应用推出行业首个AI医疗辟谣专区,整合300+三甲医院AI分身和30万医师资源,通过拍照识别、资质核验等功能秒级输出安全报告,专为老年群体打造防骗体系,覆盖超1亿用户。 查看详情>>

17. Grammarly重大更新2025:AI写作工具全面升级,推出学术诚信检测功能

Grammarly于2025年8月19日发布重大更新,推出基于Coda技术的模块化文档界面及多款AI写作工具,包括读者反应、评分器、引文查找器和释义器。平台同步推出抄袭检测和AI内容识别工具,强化学术诚信保障,展现向综合性AI写作解决方案的转型。 查看详情>>

18. Higgsfield推出Draw-to-Video功能:用箭头绘制即可生成电影级AI视频

AI初创公司Higgsfield发布革命性Draw-to-Video功能,用户只需在图片上绘制箭头和标记区域,结合简单指令即可生成专业级动态视频,彻底改变传统文本生成模式。该技术基于自研DoP I2V-01模型,集成70多种电影运镜模板,大幅降低视频创作门槛。 查看详情>>

19. ElevenLabs推出商用AI音乐生成API,破解版权难题助力多行业降本增效

AI音频技术公司ElevenLabs正式发布Eleven Music API商用服务,通过授权数据训练和多重法律防护机制,为影视、游戏、广告等行业提供合规AI音乐生成方案。该技术支持多语种风格定制,将音乐授权成本降低90%以上,目前已获20家跨行业企业内测接入。 查看详情>>

20. Paradigm完成500万美元种子轮融资,AI智能体重构电子表格数据自动化

AI电子表格平台Paradigm宣布获500万美元融资,由General Catalyst领投。其创新性将5000+AI智能体嵌入单元格,实现自动数据抓取与分析,支持GPT-5、Gemini等多模型切换,已服务安永、Etched等企业客户。 查看详情>>

AI咨询发布:AI视野 | 全球AI信息聚合平台

© 版权声明

相关文章