微软发布自研图像生成模型MAI-Image-1,LMArena榜单跻身前十 微软正式推出首款完全自研图像生成模型MAI-Image-1,在LMArena文生图排行榜中跻身前十。该模型在真实感光影处理、生成速度等方面表现优异,将集成至Copilot和Bing Image Cre... AI产品动态# LMArena# MAI-Image-1# 图像生成模型 3周前
Mistral AI开源多模态推理模型Magistral Small 1.2:240亿参数支持视觉与多语言处理 深度解析Mistral AI最新开源推理模型Magistral Small 1.2的技术特性:240亿参数规模、多模态输入支持、可验证推理架构及商业应用场景,助力开发者构建下一代企业级AI解决方案。 AI产品动态# AI技术# MistralAI# 人工智能 1个月前
腾讯混元开源视频音效生成模型HunyuanVideo-Foley,AI驱动影视音效制作变革 腾讯混元开源视频音效生成模型HunyuanVideo-Foley,通过扩散模型技术实现85%以上音画同步准确率,助力影视与游戏行业降低制作成本,支持环境音与动作音效自动生成。 AI产品动态# AI音效生成# 多模态AI# 开源模型 2个月前
字节跳动发布Seedream 4.0:多模态AI图像生成技术实现突破性升级 字节跳动Seedream 4.0多模态AI图像生成模型正式发布,实现文生图与编辑功能统一架构,支持秒级4K图像生成、多模态交互与企业级应用,推动游戏设计、广告制作等领域的生产力革新。 AI产品动态# AI商用工具# AI图像生成# Seedream4.0 2个月前
MiniMax发布海螺2.3视频生成模型:肢体动作与微表情实现技术突破 MiniMax发布新一代海螺2.3视频生成模型,在肢体动作、微表情和风格化处理实现技术突破,配合Media Agent工具实现全流程自动化创作,生成速度提升50%,为专业创作者提供高效视频生成解决方案... AI产品动态# AI技术# MediaAgent# MiniMax 1周前
阶跃星辰发布开源语音大模型Step-Audio 2 mini,多模态架构革新语音交互 阶跃星辰发布开源语音大模型Step-Audio 2 mini,突破端到端多模态架构,在MMAU、URO Bench测试中领先,中文识别错误率仅3.19%,已与吉利、TCL合作落地,推动语音交互技术革新... AI产品动态# Step-Audio# 人工智能# 多模态AI 2个月前
英伟达发布全模态理解模型OmniVinci,多模态基准测试领先19.05% 英伟达发布革命性全模态理解模型OmniVinci,在多模态基准测试中以19.05%优势领先,训练数据消耗仅0.2万亿Token,效率提升6倍。创新OmniAlignNet模块和时序编码技术实现精准跨模... AI产品动态# AI训练效率# OmniVinci# 人工智能模型 1周前
谷歌Gemini 3官宣2026年发布:瞄准GPT-5技术差距,智能代理能力将迎重大突破 谷歌正式宣布Gemini 3将于2026年发布,目标直指缩小与GPT-5技术差距。新一代模型将突破300万token上下文,强化智能代理自主决策能力,深度整合Workspace与地图生态,为企业级AI... AI产品动态# AI大模型# GPT-5# MoE架构 2天前
百度文心App 5.0重磅升级:AI搜索创作全面进化,月活达3.65亿 深度解析百度文心App 5.0版本重大升级:从文小言到文心的品牌升级,全场景AI搜索能力提升,多模态创作功能新增魔法漫画、创意修图等特色功能,月活用户3.65亿的背后技术支撑与市场布局。 AI产品动态# AIGC# AI应用# AI搜索 3天前
LiblibAI完成1.3亿美元B轮融资,创国内AI应用最大单笔融资纪录 2025年AI应用层重大融资:LiblibAI完成1.3亿美元B轮融资,创国内AI应用赛道纪录。平台整合图像视频3D建模技术,服务2000万创作者,从模型聚合转型AI专业创作工作室,获红杉中国、CMC... AI新闻资讯# AI创作平台# AI应用# AI融资 3天前