豆包语音推出AI多人有声剧自动化方案,文本到成品全流程AI生产 豆包语音团队推出AI多人有声剧全流程自动化方案,通过多角色TTS演播系统和AI后期链路,实现从文本到成品的智能生产,制作周期缩短90%,成本降低70%,首批作品已在番茄小说APP上线。 AI产品动态# AI技术# AI有声剧# TTS技术 3个月前
百度智能云宣布空间智能技术全面商用,预计催生千亿级市场 百度智能云宣布空间智能技术进入规模化商用阶段,覆盖游戏、电商等八大产业,预计催生千亿级市场。其全栈解决方案助力企业突破技术瓶颈,推动数字经济新增长。 AI新闻资讯# 3DGC# AI技术# 多模态大模型 6个月前
全球首个气溶胶-气象耦合AI模型投入试运行,我国气象预报精度提升30% 我国成功研发全球首个气溶胶-气象耦合AI预报模型,通过人工智能技术实现气象与气溶胶双向模拟,预报精度提升30%,支持5公里分辨率沙尘预报与全球环境监测,推动高精度气象预报技术发展。 AI新闻资讯# AI技术# 人工智能# 气溶胶模型 2个月前
Meta开源AU-Net架构:突破语言模型分词限制,实现多尺度学习 深度解析Meta最新开源的AU-Net语言模型架构:采用自回归U-Net技术实现原始字节级学习,在DCLM数据集测试中准确率达73.7%,显著提升多语言处理与复杂文本理解能力,为AI语言技术发展带来全... AI新闻资讯# AI技术# AU-Net架构# Meta 7个月前
谷歌搜索引擎推出音频概览,AI生成播客式总结需在实验室网站启用 谷歌近日在美国推出了一项创新测试功能,允许用户通过移动搜索直接生成AI驱动的音频概述,将传统文字搜索结果转化为播客风格的对话式内容。 AI产品动态# AI技术# 多模态交互# 搜索引擎优化 8个月前
OpenAI发布GPT-Realtime语音对话模型:延迟降低、多语言支持与图像感知成亮点 OpenAI于2025年发布新一代语音对话模型GPT-Realtime,实现端到端单架构设计,降低延迟并提升交互自然度。支持高保真语音、多语言切换及图像感知功能,定价降低20%,加速B端场景落地。了解... AI产品动态# AI商业化# AI技术# GPT-Realtime 5个月前
华为开源盘古大模型核心产品,推动昇腾生态战略加速AI产业落地 华为开源盘古系列大模型核心产品,包括70亿参数的盘古Embedded 7B和720亿参数的盘古Pro MoE,推动昇腾生态战略发展。该技术显著提升AI推理性能,为产业应用提供强大支持。 AI产品动态# AI技术# 华为# 开源 7个月前
MiniMax推出通用智能体MiniMax Agent,重新定义人机协作边界 深度解析MiniMax推出的革命性通用智能体产品MiniMax Agent如何通过长程任务处理、多模态转换和开放生态三大核心技术重塑生产力。了解这款估值12亿美元的AI独角兽如何将开发效率提升300... AI产品动态# AI技术# MiniMax# 人机协作 8个月前
昆仑万维开源多模态框架Skywork UniPic 2.0,实现文本图像双模态处理 昆仑万维发布并开源新一代多模态框架Skywork UniPic 2.0,整合理解、生成与编辑能力,支持文本和图像双模态处理,显著降低开发者应用门槛,推动多模态AI技术商业化进程。 AI产品动态# AI技术# SkyworkUniPic2.0# 多模态框架 6个月前
Rokid Glasses智能眼镜搭载支付宝“看一下支付”功能 将于6月底交付 Rokid Glasses智能眼镜搭载支付宝“看一下支付”功能,将于6月底正式交付。该产品全球订单量已突破25万台,标志着智能眼镜正式进入支付时代。 AI产品动态# AI技术# RokidGlasses# 支付宝 8个月前