快手可灵AI推出视频音效功能,实现音画同步创作新突破 快手可灵AI最新推出视频音效功能,通过自研多模态模型Kling-Foley实现视频与立体声音效的同步生成,显著提升创作效率与沉浸感。该技术或将成为AI视频赛道差异化竞争的关键,助力创作者降低70%后期... AI产品动态# AI视频# 可灵AI# 多模态模型 1个月前
阿里云通义千问发布多模态模型Qwen VLo,实现图像与文本高质量协同创作 阿里云通义千问发布新一代多模态模型Qwen VLo,支持动态分辨率训练与生成,提升文本逻辑连贯性,适用于法律文书、学术论文等专业场景,加速AI与产业融合。 AI产品动态# AI# QwenVLo# 多模态模型 1个月前
月之暗面开源多模态模型Kimi-VL-A3B-Thinking-2506,性能超越GPT-4o 月之暗面(Moonshot AI)开源多模态模型Kimi-VL-A3B-Thinking-2506,性能超越GPT-4o,在数学推理、视频理解等任务中表现优异,实现效率与性能双重优化。开发者可通过Hu... AI产品动态# AI# GPT-4o# Kimi-VL-A3B-Thinking-2506 2个月前
松下发布多模态大模型OmniFlow,实现文本、图像与音频自由转换 | AI技术突破 松下近日正式推出多模态大模型OmniFlow,该模型支持文本、图像、音频之间的任意转换生成,标志着多模态AI技术迈向更灵活、高效的商业化应用阶段。 AI产品动态# AI技术# 图像生成# 多模态模型 2个月前
InstaDeep推出生物多模态对话智能体ChatNT,革新生物学研究范式 InstaDeep推出生物多模态对话智能体ChatNT,革新生物学研究范式。该模型通过自然语言交互即可处理DNA、RNA和蛋白质序列,显著降低了生物学家使用AI工具的技术门槛,被学界视为生物信息学领域... AI产品动态# AI# 基因研究# 多模态模型 2个月前
蚂蚁集团与Inclusion AI开源多模态模型Ming-Omni,支持图像、音视频全模态处理 蚂蚁集团与Inclusion AI共同发布开源多模态大模型Ming-Omni,该模型可统一处理图像、文本、音频及视频输入,并具备跨模态生成能力,成为全球首个在功能上与GPT-4o对标且完全开源的多模态... AI产品动态# AI开源# 多模态模型# 蚂蚁集团 2个月前