人工智能技术

腾讯混元大模型开源翻译模型1.5版，覆盖33种语言与方言，轻量化部署实现突破

腾讯混元大模型团队开源翻译模型1.5版本，推出1.8B和7B两款模型，覆盖33种国际语言及5种民汉/方言翻译。1.8B模型专为移动端优化，内存仅1GB，响应速度提升55%；7B模型优化翻译准确性，解决...

6个月前

阶跃星辰开源图像生成模型NextStep-1.1：150亿参数自回归模型实现视觉伪影系统性优化

阶跃星辰于2025年12月开源NextStep-1.1图像生成模型，该150亿参数自回归模型通过基于流的强化学习技术，系统性解决视觉伪影问题，提升细节保真度与训练稳定性，现已托管于Hugging Fa...

AI产品动态 # AI开源 # NextStep-1.1 # 人工智能技术

6个月前

AI视频生成新突破：Luma AI发布Ray3 Modify模型，实拍视频高保真修改保留表演细节

Luma AI最新发布的Ray3 Modify模型实现重大突破，首次支持对实拍视频进行高保真AI修改，完整保留演员表演细节。该技术通过角色参考图像和关键帧控制，实现服装、场景无缝转换及连贯过渡镜头生成...

AI产品动态 # AI突破 # AI视频生成 # LumaAI

7个月前

苹果发布UniGen 1.5多模态AI模型：统一架构实现图像理解、生成与编辑一体化

苹果研究团队推出多模态AI模型UniGen 1.5，实现图像理解、生成与编辑一体化集成，通过创新编辑指令对齐和统一奖励系统提升任务准确度，在多项测试中表现优异，为AI视觉领域带来重要技术突破与应用前景...

AI产品动态 # AI模型突破 # UniGen1.5 # 人工智能技术

7个月前

即梦AI网页版全面升级，推出AI片场一站式创作解决方案，视频3.5 Pro模型实现音画同步突破

即梦AI网页版全面升级，正式推出AI片场一站式创作解决方案，核心亮点为全球首发视频3.5 Pro模型，实现音画同步生成技术，支持方言与复杂声画匹配。升级包括智能多帧2.0、图像生成矩阵及全流程画布系统...

AI产品动态 # AI创作工具 # AI视频生成 # AI设计

7个月前

阿里巴巴发布通义万相2.6：国内首个支持角色扮演的AI视频生成模型，开启影视创作新纪元

阿里巴巴通义万相2.6模型正式发布，作为国内首个支持角色扮演的AI视频生成技术，可实现基于人物外观与音色的定制化视频生成，提升至15秒时长，适用于影视、广告及短剧制作，现已上线阿里云百炼平台，助力企业...

AI产品动态 # AI商业化 # AI视频生成 # 人工智能技术

7个月前

阿里巴巴开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型，语音技术实现音色克隆与轻量化识别突破

阿里巴巴通义大模型团队开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型，实现3秒音色克隆、多语言情感控制及轻量化高精度识别，降低延迟50%，支持实时场景与创意产业应用，加速语音...

AI产品动态 # AI开源 # Fun-ASR-Nano # Fun-CosyVoice

7个月前

蚂蚁技术研究院发布LLaDA2.0系列扩散大模型，参数突破百亿颠覆传统架构

蚂蚁技术研究院2025年发布LLaDA2.0离散扩散大语言模型，参数规模突破千亿，采用WSD训练策略降低90%成本，推理速度达535 tokens/s，在代码生成与数学推理任务中超越传统模型。模型已开...

AI产品动态 # AI大模型 # LLaDA2.0 # 人工智能技术

7个月前

OpenAI加速开发代号“Garlic”新一代大语言模型，挑战谷歌Gemini 3技术领先地位

OpenAI加速开发代号“Garlic”的新一代大语言模型，在编程与逻辑推理任务中超越谷歌Gemini 3.0。本文深入解析该模型的技术创新、市场策略及2026年发布计划，探讨其对AI行业竞争格局的潜...

AI新闻资讯 # AI竞争 # Garlic模型 # GPT-5.2

7个月前

Runway发布Gen-4.5登顶全球视频生成榜首，AI视频生成技术实现电影级突破

Runway新一代视频生成模型Gen-4.5以1247分ELO评分登顶全球Video Arena榜单，超越谷歌Veo 3与OpenAI Sora 2 Pro。模型在运动质量、物理规律模拟和视觉逼真度上...

AI产品动态 # AI视频生成 # Gen-4.5 # Runway

7个月前

腾讯混元大模型开源翻译模型1.5版，覆盖33种语言与方言，轻量化部署实现突破

阶跃星辰开源图像生成模型NextStep-1.1：150亿参数自回归模型实现视觉伪影系统性优化

AI视频生成新突破：Luma AI发布Ray3 Modify模型，实拍视频高保真修改保留表演细节

苹果发布UniGen 1.5多模态AI模型：统一架构实现图像理解、生成与编辑一体化

即梦AI网页版全面升级，推出AI片场一站式创作解决方案，视频3.5 Pro模型实现音画同步突破

阿里巴巴发布通义万相2.6：国内首个支持角色扮演的AI视频生成模型，开启影视创作新纪元

阿里巴巴开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型，语音技术实现音色克隆与轻量化识别突破

蚂蚁技术研究院发布LLaDA2.0系列扩散大模型，参数突破百亿颠覆传统架构

OpenAI加速开发代号“Garlic”新一代大语言模型，挑战谷歌Gemini 3技术领先地位

Runway发布Gen-4.5登顶全球视频生成榜首，AI视频生成技术实现电影级突破

热门AI工具

最新资讯