谷歌发布开源多模态模型Gemma 3n:专为移动设备设计的AI突破 谷歌推出开源多模态模型Gemma 3n,专为移动设备优化,支持图像、音视频及文本处理,内存需求极低。采用MatFormer架构,动态调整规模,提升效率。适用于医疗、无障碍等隐私敏感场景。 AI产品动态# AI# Gemma3n# 多模态模型 1个月前
InstaDeep推出生物多模态对话智能体ChatNT,革新生物学研究范式 InstaDeep推出生物多模态对话智能体ChatNT,革新生物学研究范式。该模型通过自然语言交互即可处理DNA、RNA和蛋白质序列,显著降低了生物学家使用AI工具的技术门槛,被学界视为生物信息学领域... AI产品动态# AI# 基因研究# 多模态模型 2个月前
蚂蚁集团与Inclusion AI开源多模态模型Ming-Omni,支持图像、音视频全模态处理 蚂蚁集团与Inclusion AI共同发布开源多模态大模型Ming-Omni,该模型可统一处理图像、文本、音频及视频输入,并具备跨模态生成能力,成为全球首个在功能上与GPT-4o对标且完全开源的多模态... AI产品动态# AI开源# 多模态模型# 蚂蚁集团 2个月前
面壁智能开源多模态模型MiniCPM-V 4.0,图像理解能力超越主流模型 面壁智能开源新一代多模态模型MiniCPM-V 4.0,图像理解能力超越GPT-4.1等主流模型。该模型针对移动端优化,首token延迟低于2秒,解码速度达17 token/s以上,实现高效端侧部署。 AI产品动态# AI# MiniCPM-V4.0# 图像理解 3天前
OpenAI发布GPT-5系列模型:多任务处理能力再升级,迈向AGI关键一步 OpenAI推出革命性GPT-5模型,实现文本/图像/语音统一处理,上下文窗口扩展至200万Token,微软生态首批接入。了解这一AI技术里程碑如何重塑行业竞争格局。 AI产品动态# AGI# AI技术# GPT-5 2天前
西安交大研发SongCi模型:AI突破法医病理诊断,准确率提升30% 西安交通大学研发的SongCi多模态AI模型在法医病理诊断领域实现重大突破,通过自监督对比学习技术使诊断一致性提高30%,为司法鉴定与公共安全提供智能解决方案。 AI新闻资讯# 人工智能# 医学诊断# 医疗AI 2天前
OpenAI重新开放GPT-4o访问并推出模型切换功能,同时推荐GPT-4.1系列 OpenAI宣布GPT-4o模型重新开放访问,支持文本、图像及音频交互处理,同时为付费用户提供模型切换功能。新一代GPT-4.1系列在长文档分析和专业场景中表现更优。 AI产品动态# AI技术# GPT-4.1# GPT-4o 5小时前