百度推出多模态数字人互动直播间 文心4.5T技术实现声音形象协调 百度在“AI Day”开放日上正式发布业界首个双数字人互动直播间,标志着多模态数字人技术进入商业化应用新阶段。该技术基于文心大模型4.5T驱动,实现了语言、声音、形象的深度协同,为电商、教育、娱乐等领... AI产品动态# AI技术# 多模态AI# 数字人直播 8个月前
马斯克圣诞礼物引爆争议:X平台Grok AI图片编辑功能上线,创作者集体抗议 本文深度解读马斯克在X平台推出的Grok AI图片编辑功能:技术实现包括自然语言修图、图转视频等创新,同时分析其引发的版权失控、创作者抵制及行业影响。探讨AI技术便利与创作权益的冲突,展望社交媒体生态... AI产品动态# AI图片编辑# AI新闻# Grok模型 1个月前
Meta开源SAM Audio音频分离模型:多模态提示技术重塑音频编辑行业 Meta最新开源的SAM Audio多模态音频分离模型,通过文本、视觉和时间段提示实现精准声音分离,适用于音乐制作、播客降噪等场景。本文解析其PE-AV核心技术、应用优势及开源资源,探讨AI音频处理的... AI产品动态# AI工具# Meta# SAMAudio 2个月前
腾讯混元发布新一代图像生成模型HunyuanImage 2.1,支持2K高清与多语言生成 腾讯混元发布新一代开源图像生成模型HunyuanImage 2.1,支持原生2K分辨率输出、1000token超长文本解析与中英文混合嵌入,配套PromptEnhancer提示词优化工具,适用于商业设... AI产品动态# AI图像生成# AI设计工具# 多模态AI 5个月前
盛数科技Vidu视频大模型全球内测:一键生成产品广告成片,AI视频商业化加速 盛数科技Vidu视频大模型全球内测上线,核心功能一键生成可直接投放的产品广告成片,基于Vidu Q2模型实现多主体一致性控制与高清音画同步,平均生成时间3分钟内,助力电商、美妆等行业降低70%制作成本... AI产品动态# AI视频生成# MaaS# Vidu大模型 2个月前
LiblibAI完成1.3亿美元B轮融资,创国内AI应用最大单笔融资纪录 2025年AI应用层重大融资:LiblibAI完成1.3亿美元B轮融资,创国内AI应用赛道纪录。平台整合图像视频3D建模技术,服务2000万创作者,从模型聚合转型AI专业创作工作室,获红杉中国、CMC... AI新闻资讯# AI创作平台# AI应用# AI融资 3个月前
字节跳动发布Seedream 4.0:多模态AI图像生成技术实现突破性升级 字节跳动Seedream 4.0多模态AI图像生成模型正式发布,实现文生图与编辑功能统一架构,支持秒级4K图像生成、多模态交互与企业级应用,推动游戏设计、广告制作等领域的生产力革新。 AI产品动态# AI商用工具# AI图像生成# Seedream4.0 5个月前
苹果联手谷歌!Siri将搭载Gemini 2.5 Pro实现三大突破 深度解析苹果与谷歌Gemini 2.5 Pro合作:Siri将实现128K上下文处理、AI网络搜索与多模态交互三大突破,2026年春季随iOS 26.4推送。了解1.2万亿参数模型技术优势及苹果隐私保... AI产品动态# AI语音助手# iOS26.4# Siri升级 3个月前
英伟达发布全模态理解模型OmniVinci,多模态基准测试领先19.05% 英伟达发布革命性全模态理解模型OmniVinci,在多模态基准测试中以19.05%优势领先,训练数据消耗仅0.2万亿Token,效率提升6倍。创新OmniAlignNet模块和时序编码技术实现精准跨模... AI产品动态# AI训练效率# OmniVinci# 人工智能模型 3个月前
OpenAI宣布GPT-4o API服务将于2026年2月终止,开发者需迁移至GPT-5.1 OpenAI宣布GPT-4o API服务将于2026年2月16日正式终止,影响全球开发者。本文提供详细迁移指南、GPT-5.1性能优势分析及行业影响解读,帮助开发者顺利完成技术过渡。 AI产品动态# AI技术升级# API终止# GPT-4o 2个月前