vivo发布端侧多模态模型BlueLM-2.5-3B,突破GUI理解与能效比极限 vivo AI Lab最新发布的BlueLM-2.5-3B端侧多模态模型,以3B参数量实现GUI深度理解,创新思考预算机制提升数学推理能力,端侧部署内存仅1.4GB,为移动AI应用树立新标杆。 AI产品动态# AI模型# BlueLM# GUI理解 4个月前
快手可灵AI推出视频音效功能,实现音画同步创作新突破 快手可灵AI最新推出视频音效功能,通过自研多模态模型Kling-Foley实现视频与立体声音效的同步生成,显著提升创作效率与沉浸感。该技术或将成为AI视频赛道差异化竞争的关键,助力创作者降低70%后期... AI产品动态# AI视频# 可灵AI# 多模态模型 4个月前
阿里云通义千问发布多模态模型Qwen VLo,实现图像与文本高质量协同创作 阿里云通义千问发布新一代多模态模型Qwen VLo,支持动态分辨率训练与生成,提升文本逻辑连贯性,适用于法律文书、学术论文等专业场景,加速AI与产业融合。 AI产品动态# AI# QwenVLo# 多模态模型 4个月前
西安交大研发SongCi模型:AI突破法医病理诊断,准确率提升30% 西安交通大学研发的SongCi多模态AI模型在法医病理诊断领域实现重大突破,通过自监督对比学习技术使诊断一致性提高30%,为司法鉴定与公共安全提供智能解决方案。 AI新闻资讯# 人工智能# 医学诊断# 医疗AI 3个月前
松下发布多模态大模型OmniFlow,实现文本、图像与音频自由转换 | AI技术突破 松下近日正式推出多模态大模型OmniFlow,该模型支持文本、图像、音频之间的任意转换生成,标志着多模态AI技术迈向更灵活、高效的商业化应用阶段。 AI产品动态# AI技术# 图像生成# 多模态模型 5个月前
国产AI图像生成工具星流Agent中文版发布,深度优化中文场景支持 星流AI发布中文版星流Agent,突破中文图像生成技术瓶颈。基于自研Star-3模型,优化中文字体渲染与提示词理解,集成10万+LoRA模型库,支持电商、新媒体等场景。与腾讯云合作提升30%推理速度... AI产品动态# AI图像生成# 中文AI工具# 国产AI技术 4个月前
OpenAI重新开放GPT-4o访问并推出模型切换功能,同时推荐GPT-4.1系列 OpenAI宣布GPT-4o模型重新开放访问,支持文本、图像及音频交互处理,同时为付费用户提供模型切换功能。新一代GPT-4.1系列在长文档分析和专业场景中表现更优。 AI产品动态# AI技术# GPT-4.1# GPT-4o 3个月前
OpenAI发布GPT-5系列模型:多任务处理能力再升级,迈向AGI关键一步 OpenAI推出革命性GPT-5模型,实现文本/图像/语音统一处理,上下文窗口扩展至200万Token,微软生态首批接入。了解这一AI技术里程碑如何重塑行业竞争格局。 AI产品动态# AGI# AI技术# GPT-5 3个月前
OpenAI与Meta人才争夺战:高薪挖角VS跨学科培养,谁将主导AI未来? 深度对比OpenAI与Meta的AI人才战略:Meta斥资1亿美元挖角GPT-4o核心团队,OpenAI以21万年薪跨学科驻留计划反制。解析300万人才缺口下,两种模式如何影响AGI与多模态模型的技术... AI新闻资讯# AGI# Meta# OpenAI 4个月前
昆仑万维开源Skywork UniPic多模态模型:1.5B参数实现图像生成与编辑一体化 昆仑万维开源Skywork UniPic多模态模型,1.5B轻量化参数实现图像生成、理解与编辑一体化能力,支持高分辨率细节建模,性能接近百亿参数专用模型,为开发者提供可落地的统一视觉基座。 AI产品动态# AI开源# SkyworkUniPic# 图像生成 3个月前