腾讯AI工作台ima升级:新增AI播客生成等四项核心能力,提升内容创作效率 腾讯AI工作台ima最新升级,新增AI播客生成、批量文件处理等四项核心功能,显著提升知识管理与内容创作效率。了解腾讯混元大模型如何驱动多模态AI技术落地,助力企业智能化转型。 AI产品动态# AI工作台# AI播客# ima升级 6个月前
字节跳动开源全模态PyTorch训练框架VeOmni,革新多模态AI研发效率 深度解析字节跳动VeOmni全模态训练框架:通过算子融合、自动并行策略等核心技术实现300亿参数模型高效训练,开源首日获500+星标,重塑多模态AI工程化标准。 AI产品动态# AI开源# PyTorch框架# 分布式训练 6个月前
可灵AI 2.1首尾帧功能重磅发布,视频生成效果提升235%突破技术瓶颈 可灵AI推出2.1首尾帧功能,视频生成效果较前代提升235%,GSB评分行业领先,支持复杂运镜与艺术风格切换,已应用于宣传片、AI短剧等场景,全球用户超2200万。 AI产品动态# AI创作工具# AI视频生成# 可灵AI 5个月前
智源研究院发布OmniGen2:新一代开源统一图像生成模型,多模态能力全面升级 深度解析智源研究院OmniGen2图像生成模型技术亮点:40亿参数开源架构,支持文本到图像无缝切换,在GenEval测试中评分0.86。了解其反思机制、多模态生成能力及FlagScale推理加速方案。 AI产品动态# AI生成模型# 多模态AI# 开源项目 7个月前
谷歌Gemini AI助手正式登陆Google TV,开启家庭娱乐智能新纪元 谷歌Gemini AI助手正式登陆Google TV平台,支持自然语言交互的个性化影视推荐、剧情回溯及跨设备生态联动。本文详解Gemini在电视端的功能特性、支持机型及对智能家居生态的影响。 AI产品动态# AI助手# GoogleTV# TCL电视 4个月前
全球首个开源多模态AI记忆系统MIRIX发布,实现长期记忆突破 全球首个开源多模态AI记忆系统MIRIX正式发布,通过创新六维记忆架构实现35%准确率提升与99.9%存储优化,推动AI从临时工具向持续数字伴侣转型。包含技术原理、性能对比及下载指南。 AI产品动态# MIRIX# NYU# UCSD 6个月前
谷歌Gemini CLI工具1.2.0版本发布:新增音视频支持但功能尚未完全开放 深度解析谷歌Gemini CLI 1.2.0版本更新内容,包括技术栈升级、新增功能及使用限制。了解这款基于Gemini 2.5 Pro的多模态AI命令行工具如何提升开发效率,以及其未来的音视频支持计划... AI产品动态# AI工具# GeminiCLI# 命令行工具 7个月前
淘宝灰度测试“AI万能搜”功能:用自然语言交互重构电商搜索 深度解读淘宝“AI万能搜”功能:基于自然语言交互和多模态内容生成,重构电商搜索逻辑,覆盖穿搭推荐、商品对比等场景,技术整合大模型与协同过滤算法,推动行业搜索模式变革。 AI产品动态# AI搜索# 多模态AI# 淘宝 6个月前
DeepFuture发布全球首个GPT-5视频生成智能体Video Ocean,颠覆传统视频制作模式 DeepFuture发布全球首个接入GPT-5的视频生成智能体Video Ocean,支持通过自然语言生成1-5分钟高质量视频,完播率提升3倍,适用于新闻、科普、商业演示等多场景,现已开放企业版订阅服... AI产品动态# AIGC# DeepFuture# GPT-5 5个月前
阿里云通义万相开源Wan2.2-Animate动作生成模型,单图驱动视频生成实现技术突破 阿里云通义万相团队开源Wan2.2-Animate动作生成模型,突破单图生成动态视频技术,支持文本指令控制与4K实时生成,性能超越StableAnimator和Runway商业模型。开发者可通过Git... AI产品动态# AI视频生成# 人工智能技术# 动作生成模型 4个月前