字节跳动豆包平台推出AI驱动3D模型生成工具,助力游戏开发与多模态AI生态 了解字节跳动豆包平台最新AI驱动的3D模型生成工具,支持图像和混合生成模式,专注于游戏开发和工业级应用,预计短期开放,助力多模态AI生态发展。 AI产品动态# AI3D生成# AIGC# 多模态AI 9个月前
美的医疗发布国产医学影像多模态智能诊断大模型,实现基层医疗AI关键技术突破 美的医疗正式发布国产自主知识产权的医学影像多模态智能诊断大模型,实现肺结核、肺炎等胸部疾病自动检测与报告生成。该模型采用轻量化设备端与高精度云端双架构,适配不同医疗机构需求,已进入临床验证,计划202... AI产品动态# DR影像# 人工智能# 医学影像 5个月前
蚂蚁数科发布多语种多模态大模型训练框架,突破小语种AI理解瓶颈 蚂蚁数科在香港金融科技节发布创新多语种多模态大模型训练框架,通过语言感知优化机制提升小语种理解能力,在主流多语言VQA基准测试中准确率提升9.5%,评测总分超越GPT-4o、Gemini等国际主流模型... AI产品动态# 人工智能技术# 多模态AI# 多语种大模型 7个月前
中国AI技术周报:腾讯混元图像3.0全球夺冠,快手可灵2.5Turbo领跑视频生成 2025年10月最新AI技术动态:腾讯混元图像3.0在国际评测中获全球文生图模型综合第一,快手可灵2.5Turbo在视频生成双赛道登顶。全球大模型形成技术梯队,AI产业化在政务、医疗等领域加速落地,市... AI新闻资讯# AI产业化# AI技术# 人工智能 7个月前
谷歌相册AI图生视频重磅升级:新增自定义提示词功能,视频生成精准度提升40% 谷歌相册6.48版本推出AI图生视频自定义提示词功能,用户可通过自然语言指令精准控制视频生成方向,基于Veo 3模型的技术升级使生成准确率提升40%,实现从随机创作到精准定制的跨越。 AI产品动态# AI视频生成# Veo模型# 人工智能技术 8个月前
谷歌Gemini 3深度思考模式正式开放:性能全面超越Pro版,AI推理能力再突破 2025年12月5日,谷歌正式开放Gemini 3的深度思考模式(Deep Think),在GPQA、AIME等测试中性能全面超越Pro版本。该模式提升多模态融合、代码生成及安全防护能力,已集成至Ge... AI产品动态# AI安全# AI模型# Gemini3 6个月前
阿里通义千问开源Qwen3-VL视觉理解模型,4B/8B双版本实现多模态突破 阿里通义千问正式开源Qwen3-VL系列视觉理解模型,4B与8B版本通过密集架构实现显存优化,在STEM问答、VQA、OCR等任务中综合性能领先竞品,支持端侧实时AI应用,推动国产多模态模型小型化技术... AI产品动态# AI部署# Qwen3-VL# 具身智能 7个月前
谷歌Mixboard AI工具公测:生成式AI重塑创意设计流程 本文深度解析谷歌Mixboard AI工具的核心功能与技术优势,探讨其如何通过Gemini 2.5 Flash模型和自然语言交互,为家居设计、活动策划等场景提供高效可视化解决方案。 AI产品动态# Mixboard# NanoBanana# 公测 8个月前
腾讯推出大模型训练库WeChat-YATT,多模态训练效率提升15% 腾讯推出大模型训练库WeChat-YATT,专注强化学习与多模态优化,支持中文语境预训练并降低15%硬件消耗。了解其分布式框架、云集成能力及在微信智能客服等场景的应用前景。 AI产品动态# AI基础设施# WeChat-YATT# 多模态AI 9个月前
MiniMax发布海螺2.3视频生成模型:肢体动作与微表情实现技术突破 MiniMax发布新一代海螺2.3视频生成模型,在肢体动作、微表情和风格化处理实现技术突破,配合Media Agent工具实现全流程自动化创作,生成速度提升50%,为专业创作者提供高效视频生成解决方案... AI产品动态# AI技术# MediaAgent# MiniMax 7个月前