腾讯混元开源全球首个800亿参数工业级多模态生图模型,开启AI图像生成新纪元 腾讯混元团队开源全球首个800亿参数工业级多模态生图模型混元图像3.0,支持1000+字符文本理解和多语言文字渲染,在Github和Hugging Face可免费下载使用,推动AI图像技术普及。 AI产品动态# AI图像生成# 人工智能# 多模态模型 2个月前
腾讯混元ASR语音识别大模型接入ima平台,手机App端实现高效语音输入 腾讯混元ASR语音识别大模型正式接入ima平台,实现手机App端高效语音输入,识别速度达每分钟300字。该技术采用创新双编码器流式架构,支持复杂场景及智能续写,助力人机交互体验升级。 AI产品动态# ASR语音识别# ima平台# 人工智能 4个月前
腾讯开源全球首个全链路混元3D 2.1生成大模型,适配消费级显卡 腾讯在计算机视觉领域顶级会议CVPR 2025上宣布开源混元3D 2.1大模型。作为全球首个全链路开源的工业级3D生成模型,该技术实现了从模型权重、训练代码到数据处理流程的完整开放,显著降低了3D内容... AI产品动态# 3D生成# AI# 开源技术 6个月前
LiblibAI接入腾讯混元3.0与优图视频模型,国产开源AI实现多模态突破 2025年11月13日,LiblibAI宣布正式接入腾讯混元图像3.0和优图视频特效模型,提供800亿参数工业级多模态生成能力,实现从静态图像到动态视频的全流程创作,显著降低电商、教育、社交媒体等领域... AI产品动态# AI创作# LiblibAI# 图像生成 2周前
腾讯混元发布新一代图像生成模型HunyuanImage 2.1,支持2K高清与多语言生成 腾讯混元发布新一代开源图像生成模型HunyuanImage 2.1,支持原生2K分辨率输出、1000token超长文本解析与中英文混合嵌入,配套PromptEnhancer提示词优化工具,适用于商业设... AI产品动态# AI图像生成# AI设计工具# 多模态AI 3个月前
腾讯混元再推四款轻量化开源模型,边缘计算与消费级硬件迎来AI普惠新突破 腾讯混元发布四款轻量化开源大模型,覆盖0.5B-7B参数规模,支持消费级硬件与边缘计算场景,具备256K长文本处理与多Agent决策能力,已应用于腾讯会议、智能座舱等产品,推动AI技术低成本普惠化落地... AI产品动态# AI开源# 多Agent框架# 大模型应用 3个月前
腾讯混元团队发布SRPO技术:解决AI文生图皮肤过油问题,真实感提升3倍 腾讯混元团队发布SRPO技术,通过语义相对偏好优化解决Flux模型人像生成皮肤过油问题,真实感提升3倍,训练效率达75倍提升。代码已开源,推动AI生成内容在影视游戏领域应用。 AI产品动态# AI生成图像# SRPO# 图像优化 2个月前
腾讯混元开源Hunyuan-MT-7B翻译模型上线硅基流动平台,支持33种语言互译 腾讯混元团队开源轻量化翻译模型Hunyuan-MT-7B正式入驻硅基流动平台,支持33种语言互译与5种民汉翻译,具备70亿参数与32K上下文处理能力。了解免费AI翻译解决方案如何助力开发者实现高效跨语... AI产品动态# AI翻译模型# Hunyuan-MT-7B# NLP技术 2个月前
腾讯混元开源Hunyuan-MT-7B翻译模型,WMT2025竞赛斩获30项冠军 腾讯混元开源的Hunyuan-MT-7B模型以70亿参数规模获得WMT2025竞赛30项冠军,支持33种语言及方言互译,稀缺语种准确率提升22%。模型已应用于腾讯会议等产品,延迟降低40%,专业术语翻... AI产品动态# AI翻译模型# HuggingFace# WMT2025 3个月前
腾讯混元开源视频音效生成模型HunyuanVideo-Foley,AI驱动影视音效制作变革 腾讯混元开源视频音效生成模型HunyuanVideo-Foley,通过扩散模型技术实现85%以上音画同步准确率,助力影视与游戏行业降低制作成本,支持环境音与动作音效自动生成。 AI产品动态# AI音效生成# 多模态AI# 开源模型 3个月前