即梦AI网页版全面升级,推出AI片场一站式创作解决方案,视频3.5 Pro模型实现音画同步突破 即梦AI网页版全面升级,正式推出AI片场一站式创作解决方案,核心亮点为全球首发视频3.5 Pro模型,实现音画同步生成技术,支持方言与复杂声画匹配。升级包括智能多帧2.0、图像生成矩阵及全流程画布系统... AI产品动态# AI创作工具# AI视频生成# AI设计 3天前
阿里巴巴发布通义万相2.6:国内首个支持角色扮演的AI视频生成模型,开启影视创作新纪元 阿里巴巴通义万相2.6模型正式发布,作为国内首个支持角色扮演的AI视频生成技术,可实现基于人物外观与音色的定制化视频生成,提升至15秒时长,适用于影视、广告及短剧制作,现已上线阿里云百炼平台,助力企业... AI产品动态# AI商业化# AI视频生成# 人工智能技术 3天前
阿里巴巴开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型,语音技术实现音色克隆与轻量化识别突破 阿里巴巴通义大模型团队开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型,实现3秒音色克隆、多语言情感控制及轻量化高精度识别,降低延迟50%,支持实时场景与创意产业应用,加速语音... AI产品动态# AI开源# Fun-ASR-Nano# Fun-CosyVoice 4天前
蚂蚁技术研究院发布LLaDA2.0系列扩散大模型,参数突破百亿颠覆传统架构 蚂蚁技术研究院2025年发布LLaDA2.0离散扩散大语言模型,参数规模突破千亿,采用WSD训练策略降低90%成本,推理速度达535 tokens/s,在代码生成与数学推理任务中超越传统模型。模型已开... AI产品动态# AI大模型# LLaDA2.0# 人工智能技术 5天前
OpenAI加速开发代号“Garlic”新一代大语言模型,挑战谷歌Gemini 3技术领先地位 OpenAI加速开发代号“Garlic”的新一代大语言模型,在编程与逻辑推理任务中超越谷歌Gemini 3.0。本文深入解析该模型的技术创新、市场策略及2026年发布计划,探讨其对AI行业竞争格局的潜... AI新闻资讯# AI竞争# Garlic模型# GPT-5.2 2周前
Runway发布Gen-4.5登顶全球视频生成榜首,AI视频生成技术实现电影级突破 Runway新一代视频生成模型Gen-4.5以1247分ELO评分登顶全球Video Arena榜单,超越谷歌Veo 3与OpenAI Sora 2 Pro。模型在运动质量、物理规律模拟和视觉逼真度上... AI产品动态# AI视频生成# Gen-4.5# Runway 3周前
腾讯开源10亿参数轻量OCR模型HunyuanOCR,多项基准测试达SOTA水平 腾讯正式开源1B参数轻量OCR模型HunyuanOCR,在OmniDocBench、OCRBench等权威测试中获SOTA成绩,支持14种语言识别,适用于文档解析、视频字幕识别等场景,推动AI文本识别... AI产品动态# HunyuanOCR# OCR模型# 人工智能技术 3周前
百度发布猎户座AI引擎与慧播星数字人技术,开启AI战略新阶段 百度2025年发布猎户座AI引擎和慧播星数字人技术重大突破。猎户座开放25年搜索技术积累,支持多智能体协作;慧播星数字人全球开放,双11GMV增长91%,罗永浩同款技术平台化,加速AI技术商业化落地。 AI产品动态# AI引擎# 人工智能技术# 慧播星数字人 1个月前
蚂蚁数科发布多语种多模态大模型训练框架,突破小语种AI理解瓶颈 蚂蚁数科在香港金融科技节发布创新多语种多模态大模型训练框架,通过语言感知优化机制提升小语种理解能力,在主流多语言VQA基准测试中准确率提升9.5%,评测总分超越GPT-4o、Gemini等国际主流模型... AI产品动态# 人工智能技术# 多模态AI# 多语种大模型 2个月前
蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,推理速度提升10.7倍 蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,实现10.7倍推理速度提升,支持LLaDA等主流dLLM,在HumanEval代码生成任务中达1011 tokens/秒,推动AI推理效率新... AI产品动态# AI开源# dInfer# 人工智能技术 2个月前