蚂蚁数科发布多语种多模态大模型训练框架,突破小语种AI理解瓶颈 蚂蚁数科在香港金融科技节发布创新多语种多模态大模型训练框架,通过语言感知优化机制提升小语种理解能力,在主流多语言VQA基准测试中准确率提升9.5%,评测总分超越GPT-4o、Gemini等国际主流模型... AI产品动态# 人工智能技术# 多模态AI# 多语种大模型 2小时前
蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,推理速度提升10.7倍 蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,实现10.7倍推理速度提升,支持LLaDA等主流dLLM,在HumanEval代码生成任务中达1011 tokens/秒,推动AI推理效率新... AI产品动态# AI开源# dInfer# 人工智能技术 3周前
谷歌Veo 3.1视频模型技术突破:8秒高清视频生成,实现音画同步 谷歌最新发布Veo 3.1文生视频模型实现重大技术突破,支持8秒720p高清视频生成,首次实现音画同步输出。模型在语义解析精度、视觉保真度和错误率控制方面显著提升,展现AI视频生成领域最新进展。 AI产品动态# AI视频生成# GoogleVids# VertexAI 3周前
华为昇腾完成通义千问Qwen3-VL-30B-A3B多模态模型0day适配,AI生态建设迈入新阶段 华为昇腾生态完成阿里云通义千问Qwen3-VL-30B-A3B多模态模型的0day适配,实现发布即适配。该模型具备视觉代理、代码生成等能力,在昇腾平台推理效率提升40%,助力企业降低多模态AI应用门槛... AI产品动态# AI生态适配# 人工智能技术# 华为昇腾 4周前
谷歌相册AI图生视频重磅升级:新增自定义提示词功能,视频生成精准度提升40% 谷歌相册6.48版本推出AI图生视频自定义提示词功能,用户可通过自然语言指令精准控制视频生成方向,基于Veo 3模型的技术升级使生成准确率提升40%,实现从随机创作到精准定制的跨越。 AI产品动态# AI视频生成# Veo模型# 人工智能技术 4周前
快手发布KAT系列Agentic Coding大模型,KAT-Coder以73.4%解决率创代码智能新纪录 快手发布KAT系列Agentic Coding大模型,KAT-Coder以73.4%解决率刷新代码智能纪录,KAT-Dev-32B开源模型表现优异。了解国产AI代码大模型的技术突破与国际竞争力。 AI产品动态# AgenticCoding# AI大模型# 人工智能技术 1个月前
快手发布可灵2.5 Turbo视频生成模型:成本降28%,动作幅度提升30% 快手正式发布可灵2.5 Turbo视频生成模型,实现动作幅度提升30%、成本降低28%的重大突破。该模型强化复杂指令理解能力,提升视觉一致性25%,为短视频创作者提供更经济高效的AIGC解决方案。 AI产品动态# AIGC# 人工智能技术# 可灵AI 1个月前
Luma AI发布全球首款多模态推理视频模型Ray3,支持4K HDR生成与智能修正 Luma AI推出全球首款多模态推理视频模型Ray3,支持16位HDR生成、4K输出与智能修正功能,深度集成Adobe工作流。了解其技术优势、商业应用及对AI视频行业的影响。 AI产品动态# Adobe# AI视频生成# LumaAI 1个月前
阿里云通义万相开源Wan2.2-Animate动作生成模型,单图驱动视频生成实现技术突破 阿里云通义万相团队开源Wan2.2-Animate动作生成模型,突破单图生成动态视频技术,支持文本指令控制与4K实时生成,性能超越StableAnimator和Runway商业模型。开发者可通过Git... AI产品动态# AI视频生成# 人工智能技术# 动作生成模型 1个月前
Hcompany发布Holo1.5开源多模态模型系列 720亿参数UI任务模型突破界面理解瓶颈 Hcompany发布Holo1.5开源多模态模型系列,720亿参数Holo-72B-UI模型在UI理解任务中达到89.3%完成率,支持自然语言操作Android应用。了解开源模型性能优势、技术特性及商... AI产品动态# AI多模态模型# Hcompany# Holo1.5 2个月前