昆仑万维开源Skywork UniPic多模态模型:1.5B参数实现图像生成与编辑一体化 昆仑万维开源Skywork UniPic多模态模型,1.5B轻量化参数实现图像生成、理解与编辑一体化能力,支持高分辨率细节建模,性能接近百亿参数专用模型,为开发者提供可落地的统一视觉基座。 AI产品动态# AI开源# SkyworkUniPic# 图像生成 6天前
全球首个多模态工业信号基座模型FISHER发布,推动工业智能化升级 清华大学与上海交通大学联合团队发布全球首个多模态工业信号基座模型FISHER,实现异质工业信号统一处理,技术开源推动工业AI普惠化。 AI新闻资讯# AI# FISHER# 上海交通大学 2周前
谷歌发布MedGemma 27B与MedSigLIP医疗AI模型,推动跨模态医学应用 深度解读谷歌最新医疗AI模型MedGemma 27B与MedSigLIP的技术特性:27B参数多模态模型在MedQA达87.7%准确率,4亿参数轻量编码器实现专业级医学影像理解,推动临床诊断效率革命。 AI产品动态# MedGemma# MedSigLIP# 人工智能 4周前
vivo发布端侧多模态模型BlueLM-2.5-3B,突破GUI理解与能效比极限 vivo AI Lab最新发布的BlueLM-2.5-3B端侧多模态模型,以3B参数量实现GUI深度理解,创新思考预算机制提升数学推理能力,端侧部署内存仅1.4GB,为移动AI应用树立新标杆。 AI产品动态# AI模型# BlueLM# GUI理解 4周前
OpenAI与Meta人才争夺战:高薪挖角VS跨学科培养,谁将主导AI未来? 深度对比OpenAI与Meta的AI人才战略:Meta斥资1亿美元挖角GPT-4o核心团队,OpenAI以21万年薪跨学科驻留计划反制。解析300万人才缺口下,两种模式如何影响AGI与多模态模型的技术... AI新闻资讯# AGI# Meta# OpenAI 1个月前
国产AI图像生成工具星流Agent中文版发布,深度优化中文场景支持 星流AI发布中文版星流Agent,突破中文图像生成技术瓶颈。基于自研Star-3模型,优化中文字体渲染与提示词理解,集成10万+LoRA模型库,支持电商、新媒体等场景。与腾讯云合作提升30%推理速度... AI产品动态# AI图像生成# 中文AI工具# 国产AI技术 1个月前
谷歌发布开源多模态模型Gemma 3n:专为移动设备设计的AI突破 谷歌推出开源多模态模型Gemma 3n,专为移动设备优化,支持图像、音视频及文本处理,内存需求极低。采用MatFormer架构,动态调整规模,提升效率。适用于医疗、无障碍等隐私敏感场景。 AI产品动态# AI# Gemma3n# 多模态模型 1个月前
快手可灵AI推出视频音效功能,实现音画同步创作新突破 快手可灵AI最新推出视频音效功能,通过自研多模态模型Kling-Foley实现视频与立体声音效的同步生成,显著提升创作效率与沉浸感。该技术或将成为AI视频赛道差异化竞争的关键,助力创作者降低70%后期... AI产品动态# AI视频# 可灵AI# 多模态模型 1个月前
阿里云通义千问发布多模态模型Qwen VLo,实现图像与文本高质量协同创作 阿里云通义千问发布新一代多模态模型Qwen VLo,支持动态分辨率训练与生成,提升文本逻辑连贯性,适用于法律文书、学术论文等专业场景,加速AI与产业融合。 AI产品动态# AI# QwenVLo# 多模态模型 1个月前
月之暗面开源多模态模型Kimi-VL-A3B-Thinking-2506,性能超越GPT-4o 月之暗面(Moonshot AI)开源多模态模型Kimi-VL-A3B-Thinking-2506,性能超越GPT-4o,在数学推理、视频理解等任务中表现优异,实现效率与性能双重优化。开发者可通过Hu... AI产品动态# AI# GPT-4o# Kimi-VL-A3B-Thinking-2506 1个月前