Mistral AI开源多模态推理模型Magistral Small 1.2:240亿参数支持视觉与多语言处理 深度解析Mistral AI最新开源推理模型Magistral Small 1.2的技术特性:240亿参数规模、多模态输入支持、可验证推理架构及商业应用场景,助力开发者构建下一代企业级AI解决方案。 AI产品动态# AI技术# MistralAI# 人工智能 1个月前
阿里云通义万相开源Wan2.2-Animate动作生成模型,单图驱动视频生成实现技术突破 阿里云通义万相团队开源Wan2.2-Animate动作生成模型,突破单图生成动态视频技术,支持文本指令控制与4K实时生成,性能超越StableAnimator和Runway商业模型。开发者可通过Git... AI产品动态# AI视频生成# 人工智能技术# 动作生成模型 1个月前
小米开源语音大模型Xiaomi-MiMo-Audio:7B级别性能全球领先,超越谷歌Gemini与OpenAI GPT-4o 小米发布全球领先的开源语音大模型Xiaomi-MiMo-Audio,在MMAU和Big Bench音频测试中超越谷歌Gemini与OpenAI GPT-4o。了解其亿小时训练数据、少样本学习能力及在智... AI产品动态# AI开源# 人机交互# 多模态AI 1个月前
OpenAI推出GPT-5 Thinking功能并研发儿童版,AI技术进入深度优化新阶段 OpenAI推出GPT-5 Thinking功能,响应速度提升40%,支持代码生成与实时调试。同步研发儿童版AI,布局教育细分市场。了解GPT-5技术优势、应用场景及行业竞争态势。 AI产品动态# AI儿童版# AI商业化# ChatGPT 2个月前
OpenAI Evals重大更新:原生音频评估功能上线,语音模型测试效率提升40% OpenAI Evals推出原生音频评估功能,支持直接上传音频文件进行端到端测试,消除转录失真,提升40%评估可信度。适用于语音助手、语音识别及AI语音生成的质量监控,加速语音AI产品迭代。 AI产品动态# AI测试工具# OpenAI# 多模态AI 2个月前
百度文心大模型X1 1.1版本重磅升级:智能体与多模态能力突破,推理成本降17% 百度文心大模型X1 1.1版本实现智能体深度任务规划、多模态能力提升及工具调用优化,在金融、医疗、制造领域表现卓越,推理成本降低17%,适用于企业API调用与私有化部署。 AI产品动态# AI技术# 人工智能# 企业AI应用 2个月前
字节跳动发布Seedream 4.0:多模态AI图像生成技术实现突破性升级 字节跳动Seedream 4.0多模态AI图像生成模型正式发布,实现文生图与编辑功能统一架构,支持秒级4K图像生成、多模态交互与企业级应用,推动游戏设计、广告制作等领域的生产力革新。 AI产品动态# AI商用工具# AI图像生成# Seedream4.0 2个月前
腾讯混元发布新一代图像生成模型HunyuanImage 2.1,支持2K高清与多语言生成 腾讯混元发布新一代开源图像生成模型HunyuanImage 2.1,支持原生2K分辨率输出、1000token超长文本解析与中英文混合嵌入,配套PromptEnhancer提示词优化工具,适用于商业设... AI产品动态# AI图像生成# AI设计工具# 多模态AI 2个月前
字节跳动即梦AI 4.0发布:多模态图像生成技术实现三大功能整合 字节跳动即梦AI 4.0版本实现多模态技术突破,整合文生图/编辑/组图三大功能,支持2K图像1.8秒生成与4K输出,精准响应自然语言指令,显著降低AI图像创作门槛。 AI产品动态# AI技术突破# 人工智能# 即梦AI 2个月前
T-Mall发布“天算”医疗AI一体机,多模态诊断准确率超副主任医师水平 T-Mall发布国内首款获批多模态AI诊断一体机,集成千亿参数模型,支持12类医学影像实时分析,提升病灶检出率18.7%,采用联邦学习保障数据安全,2024年落地基层医疗。 AI产品动态# AI一体机# T-Mall# 人工智能医疗 2个月前