人工智能技术

百度蒸汽机2.0全球首发多人有声视频生成，成本直降70%

百度蒸汽机MuseSteamer 2.0实现全球首个多人有声中文视频一体化生成，采用多模态时空规划技术，支持电影级画质与高精度语音还原，成本降低70%，已通过百度搜索、绘想平台开放商用。

11个月前

阿里巴巴发布通义万相2.6：国内首个支持角色扮演的AI视频生成模型，开启影视创作新纪元

阿里巴巴通义万相2.6模型正式发布，作为国内首个支持角色扮演的AI视频生成技术，可实现基于人物外观与音色的定制化视频生成，提升至15秒时长，适用于影视、广告及短剧制作，现已上线阿里云百炼平台，助力企业...

AI产品动态 # AI商业化 # AI视频生成 # 人工智能技术

7个月前

华为昇腾完成通义千问Qwen3-VL-30B-A3B多模态模型0day适配，AI生态建设迈入新阶段

华为昇腾生态完成阿里云通义千问Qwen3-VL-30B-A3B多模态模型的0day适配，实现发布即适配。该模型具备视觉代理、代码生成等能力，在昇腾平台推理效率提升40%，助力企业降低多模态AI应用门槛...

AI产品动态 # AI生态适配 # 人工智能技术 # 华为昇腾

9个月前

蚂蚁技术研究院发布LLaDA2.0系列扩散大模型，参数突破百亿颠覆传统架构

蚂蚁技术研究院2025年发布LLaDA2.0离散扩散大语言模型，参数规模突破千亿，采用WSD训练策略降低90%成本，推理速度达535 tokens/s，在代码生成与数学推理任务中超越传统模型。模型已开...

AI产品动态 # AI大模型 # LLaDA2.0 # 人工智能技术

7个月前

Hcompany发布Holo1.5开源多模态模型系列 720亿参数UI任务模型突破界面理解瓶颈

Hcompany发布Holo1.5开源多模态模型系列，720亿参数Holo-72B-UI模型在UI理解任务中达到89.3%完成率，支持自然语言操作Android应用。了解开源模型性能优势、技术特性及商...

AI产品动态 # AI多模态模型 # Hcompany # Holo1.5

10个月前

阿里云通义万相开源Wan2.2-Animate动作生成模型，单图驱动视频生成实现技术突破

阿里云通义万相团队开源Wan2.2-Animate动作生成模型，突破单图生成动态视频技术，支持文本指令控制与4K实时生成，性能超越StableAnimator和Runway商业模型。开发者可通过Git...

AI产品动态 # AI视频生成 # 人工智能技术 # 动作生成模型

10个月前

快手发布可灵2.5 Turbo视频生成模型：成本降28%，动作幅度提升30%

快手正式发布可灵2.5 Turbo视频生成模型，实现动作幅度提升30%、成本降低28%的重大突破。该模型强化复杂指令理解能力，提升视觉一致性25%，为短视频创作者提供更经济高效的AIGC解决方案。

AI产品动态 # AIGC # 人工智能技术 # 可灵AI

10个月前

苹果发布UniGen 1.5多模态AI模型：统一架构实现图像理解、生成与编辑一体化

苹果研究团队推出多模态AI模型UniGen 1.5，实现图像理解、生成与编辑一体化集成，通过创新编辑指令对齐和统一奖励系统提升任务准确度，在多项测试中表现优异，为AI视觉领域带来重要技术突破与应用前景...

AI产品动态 # AI模型突破 # UniGen1.5 # 人工智能技术

7个月前

阶跃星辰开源图像生成模型NextStep-1.1：150亿参数自回归模型实现视觉伪影系统性优化

阶跃星辰于2025年12月开源NextStep-1.1图像生成模型，该150亿参数自回归模型通过基于流的强化学习技术，系统性解决视觉伪影问题，提升细节保真度与训练稳定性，现已托管于Hugging Fa...

AI产品动态 # AI开源 # NextStep-1.1 # 人工智能技术

6个月前

蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer，推理速度提升10.7倍

蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer，实现10.7倍推理速度提升，支持LLaDA等主流dLLM，在HumanEval代码生成任务中达1011 tokens/秒，推动AI推理效率新...

AI产品动态 # AI开源 # dInfer # 人工智能技术

9个月前

百度蒸汽机2.0全球首发多人有声视频生成，成本直降70%

阿里巴巴发布通义万相2.6：国内首个支持角色扮演的AI视频生成模型，开启影视创作新纪元

华为昇腾完成通义千问Qwen3-VL-30B-A3B多模态模型0day适配，AI生态建设迈入新阶段

蚂蚁技术研究院发布LLaDA2.0系列扩散大模型，参数突破百亿颠覆传统架构

Hcompany发布Holo1.5开源多模态模型系列 720亿参数UI任务模型突破界面理解瓶颈

阿里云通义万相开源Wan2.2-Animate动作生成模型，单图驱动视频生成实现技术突破

快手发布可灵2.5 Turbo视频生成模型：成本降28%，动作幅度提升30%

苹果发布UniGen 1.5多模态AI模型：统一架构实现图像理解、生成与编辑一体化

阶跃星辰开源图像生成模型NextStep-1.1：150亿参数自回归模型实现视觉伪影系统性优化

蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer，推理速度提升10.7倍

热门AI工具

最新资讯