腾讯混元图像3.0登顶全球文生图榜首,元宝App可一键生成专业级图像 腾讯混元图像3.0登顶全球文生图榜单第一,正式登陆元宝App。这款800亿参数开源模型支持2048×2048超高分辨率,可实现表情包、人像写真等专业级图像生成,已助力电商、游戏行业提升80%开发效率。 AI产品动态# AI商业化# AI图像生成# 元宝App 4周前
阿里通义万相Wan2.5发布:实现音画同步AI视频生成,10秒1080P影视级输出 阿里巴巴正式发布通义万相Wan2.5 Preview模型,突破多模态AI生成技术,实现音画同步的10秒1080P视频生成能力,支持文生视频、图生视频等核心功能,大幅降低影视内容制作成本。 AI产品动态# AI技术# AI视频生成# 云栖大会 1个月前
商汤科技杨帆:AI重构知识产权全链条效率,大模型加速专利转化与侵权监测 深度解读上海知识产权国际论坛核心议题:商汤科技展示AI如何通过大模型技术提升专利检索、侵权监测效率,实现知识产权全场景智能化,并分享AI与知识产权全球治理的前瞻思考。 AI新闻资讯# AI治理# 专利转化# 人工智能 2周前
阿里通义千问开源Qwen3-VL视觉理解模型,4B/8B双版本实现多模态突破 阿里通义千问正式开源Qwen3-VL系列视觉理解模型,4B与8B版本通过密集架构实现显存优化,在STEM问答、VQA、OCR等任务中综合性能领先竞品,支持端侧实时AI应用,推动国产多模态模型小型化技术... AI产品动态# AI部署# Qwen3-VL# 具身智能 3周前
谷歌相册AI图生视频重磅升级:新增自定义提示词功能,视频生成精准度提升40% 谷歌相册6.48版本推出AI图生视频自定义提示词功能,用户可通过自然语言指令精准控制视频生成方向,基于Veo 3模型的技术升级使生成准确率提升40%,实现从随机创作到精准定制的跨越。 AI产品动态# AI视频生成# Veo模型# 人工智能技术 4周前
OpenAI秘密测试GPT-Alpha智能体:基于GPT-5的多模态AI或将重塑行业 OpenAI被曝正在测试基于GPT-5模型的全新AI智能体GPT-Alpha。该技术突破传统生成式AI边界,支持文本、代码、图像多模态协同处理,具备高级推理与工具使用能力。本文详解其核心功能、应用场景... AI新闻资讯# AI技术# GPT-5# GPT-Alpha 1个月前
智谱AI推出免费“AI Slides”功能,自动生成动态PPT颠覆传统办公 智谱AI最新推出免费AI Slides功能,基于GLM-Experimental模型实现自然语言生成动态PPT,支持动画效果与多人协作,助力市场/销售人员分钟级完成专业演示文稿制作,突破传统订阅制商业... AI产品动态# AI生成PPT# GLM-Experimental# 办公自动化 4个月前
MiniMax Agent全新升级,新增智能图像搜索等四大功能提AI协作效率 MiniMax Agent是MiniMax官方推出的AI生产力工具,主要说明该工具通过新增智能图像搜索、稳定的图像生成、多语言支持及多样化文档导出四大核心功能,进一步提升多模态能力与长任务处理效率。 AI产品动态# AI工具# MiniMax# 图像生成技术 5个月前
DeepSeek-OCR开源:30亿参数OCR模型实现长文本处理突破,97%识别精度引领多模态AI新范式 DeepSeek团队开源30亿参数OCR模型DeepSeek-OCR,采用创新光学压缩技术实现97%识别精度。该模型在长文本处理、多分辨率输入方面表现卓越,为金融、医疗、出版行业提供高效数字化解决方案... AI产品动态# AI开源模型# DeepSeek-OCR# OCR技术 2周前
国内首个对话式音乐创作Agent Tunee公测:用自然语言生成完整音乐作品 趣丸科技正式推出国内首个对话式音乐创作Agent Tunee,支持自然语言交互生成完整音乐作品,包含AI作曲、编曲、人声合成及MV制作功能,公测期间免费使用。 AI产品动态# AI音乐创作# Tunee# 人工智能 1个月前