阿里通义千问开源Qwen3-VL视觉理解模型,4B/8B双版本实现多模态突破 阿里通义千问正式开源Qwen3-VL系列视觉理解模型,4B与8B版本通过密集架构实现显存优化,在STEM问答、VQA、OCR等任务中综合性能领先竞品,支持端侧实时AI应用,推动国产多模态模型小型化技术... AI产品动态# AI部署# Qwen3-VL# 具身智能 3周前
Google NotebookLM视频功能重磅升级:集成Gemini Nano Banana技术实现文档自动转视频 Google NotebookLM集成Gemini Nano Banana技术实现文档自动转视频功能升级,提供水彩、纸艺等6种视觉风格和Brief/Explainer双格式,面向教育课件、企业报告等场... AI产品动态# AI技术升级# AI视频生成# GeminiNanoBanana 3周前
微软发布自研图像生成模型MAI-Image-1,LMArena榜单跻身前十 微软正式推出首款完全自研图像生成模型MAI-Image-1,在LMArena文生图排行榜中跻身前十。该模型在真实感光影处理、生成速度等方面表现优异,将集成至Copilot和Bing Image Cre... AI产品动态# LMArena# MAI-Image-1# 图像生成模型 3周前
中国AI技术周报:腾讯混元图像3.0全球夺冠,快手可灵2.5Turbo领跑视频生成 2025年10月最新AI技术动态:腾讯混元图像3.0在国际评测中获全球文生图模型综合第一,快手可灵2.5Turbo在视频生成双赛道登顶。全球大模型形成技术梯队,AI产业化在政务、医疗等领域加速落地,市... AI新闻资讯# AI产业化# AI技术# 人工智能 3周前
谷歌Gemini 3.0震撼发布:AI直接生成完整网页游戏,前端开发迎来革命 谷歌Gemini 3.0旗舰AI模型10月22日发布,突破性实现自然语言直接生成完整网页和游戏,采用万亿参数混合专家系统,在专业基准测试中超越主流竞品,将彻底改变前端开发工作流程。 AI产品动态# AI模型# Gemini3.0# 人工智能 3周前
马斯克xAI加速研发世界模型,瞄准游戏与机器人领域新突破 深度解析马斯克xAI公司世界模型技术研发进展:从人才挖角到商业化布局,探讨其在游戏生成与机器人控制领域的应用前景,分析行业竞争格局与技术挑战。 AI新闻资讯# AGI# xAI# 世界模型 3周前
Elastic收购Jina AI:开启多模态AI搜索新纪元,向量搜索技术迎来重大突破 Elastic完成对Jina AI战略收购,深度整合向量搜索与多模态AI技术。Jina AI核心模型将融入Elastic搜索平台,提升多语言文档和视觉文档检索效率,为企业提供更智能的搜索解决方案。 AI新闻资讯# AI搜索# Elastic# JinaAI 4周前
腾讯混元图像3.0登顶全球文生图榜首,元宝App可一键生成专业级图像 腾讯混元图像3.0登顶全球文生图榜单第一,正式登陆元宝App。这款800亿参数开源模型支持2048×2048超高分辨率,可实现表情包、人像写真等专业级图像生成,已助力电商、游戏行业提升80%开发效率。 AI产品动态# AI商业化# AI图像生成# 元宝App 4周前
谷歌相册AI图生视频重磅升级:新增自定义提示词功能,视频生成精准度提升40% 谷歌相册6.48版本推出AI图生视频自定义提示词功能,用户可通过自然语言指令精准控制视频生成方向,基于Veo 3模型的技术升级使生成准确率提升40%,实现从随机创作到精准定制的跨越。 AI产品动态# AI视频生成# Veo模型# 人工智能技术 4周前
国内首个对话式音乐创作Agent Tunee公测:用自然语言生成完整音乐作品 趣丸科技正式推出国内首个对话式音乐创作Agent Tunee,支持自然语言交互生成完整音乐作品,包含AI作曲、编曲、人声合成及MV制作功能,公测期间免费使用。 AI产品动态# AI音乐创作# Tunee# 人工智能 1个月前