AI视野 | 全球AI信息聚合平台
  • 首页
  • AI工具
    • 智能聊天
    • 职场办公
    • 个人助手
    • 写作应用
    • 图像处理
    • 音频处理
    • 视频处理
    • 设计工具
    • 开发编程
    • 智能体
    • 智慧搜索
    • 教育应用
    • 商业应用
    • 生态应用
  • AI资讯
    • AI每日资讯
    • AI产品动态
    • AI新闻资讯
  • 站内排行榜
  • AI排行榜
    • 全球AI排行榜Top30 | 2025年07月
    • 中国AI排行榜Top30 | 2025年07月
    • 智能聊天AI排行榜Top20 | 2025年07月
    • 职场办公AI排行榜Top20 | 2025年07月
    • 个人助手AI排行榜Top20 | 2025年07月
    • 写作应用AI排行榜Top20 | 2025年07月
    • 图像处理AI排行榜Top20 | 2025年07月
    • 音频处理AI排行榜Top20 | 2025年07月
    • 视频处理AI排行榜Top20 | 2025年07月
    • 设计工具AI排行榜Top20 | 2025年07月
    • 开发编程AI排行榜Top20 | 2025年07月
    • 智慧搜索AI排行榜Top20 | 2025年07月
    • 智能体AI排行榜Top20 | 2025年07月
    • 教育应用AI排行榜Top20 | 2025年07月
    • 商业应用AI排行榜Top20 | 2025年07月
    • 生态应用AI排行榜Top20 | 2025年07月
    • 往期AI排行榜
    • 首页
    • AI工具
      • 智能聊天
      • 职场办公
      • 个人助手
      • 写作应用
      • 图像处理
      • 音频处理
      • 视频处理
      • 设计工具
      • 开发编程
      • 智能体
      • 智慧搜索
      • 教育应用
      • 商业应用
      • 生态应用
    • AI资讯
      • AI每日资讯
      • AI产品动态
      • AI新闻资讯
    • 站内排行榜
    • AI排行榜
      • 全球AI排行榜Top30 | 2025年07月
      • 中国AI排行榜Top30 | 2025年07月
      • 智能聊天AI排行榜Top20 | 2025年07月
      • 职场办公AI排行榜Top20 | 2025年07月
      • 个人助手AI排行榜Top20 | 2025年07月
      • 写作应用AI排行榜Top20 | 2025年07月
      • 图像处理AI排行榜Top20 | 2025年07月
      • 音频处理AI排行榜Top20 | 2025年07月
      • 视频处理AI排行榜Top20 | 2025年07月
      • 设计工具AI排行榜Top20 | 2025年07月
      • 开发编程AI排行榜Top20 | 2025年07月
      • 智慧搜索AI排行榜Top20 | 2025年07月
      • 智能体AI排行榜Top20 | 2025年07月
      • 教育应用AI排行榜Top20 | 2025年07月
      • 商业应用AI排行榜Top20 | 2025年07月
      • 生态应用AI排行榜Top20 | 2025年07月
      • 往期AI排行榜

    AI语音技术

    共 6 篇AI资讯
    AI语音技术
    排序
    发布更新浏览
    Deepdub推出新一代语音AI模型Lightning2.5,实时语音处理效率提升30%

    Deepdub推出新一代语音AI模型Lightning2.5,实时语音处理效率提升30%

    Deepdub新一代语音AI模型Lightning2.5实现30%延迟降低,提升实时翻译与语音助手效率。了解AI语音技术最新进展及行业应用前景。
    AI产品动态# AI语音技术# Deepdub# 人工智能创新
    5个月前
    Cartesia完成1亿美元融资推出Sonic-3语音模型,SSM架构突破Transformer限制

    Cartesia完成1亿美元融资推出Sonic-3语音模型,SSM架构突破Transformer限制

    美国AI语音技术公司Cartesia完成1亿美元融资,正式推出第三代语音模型Sonic-3。采用创新SSM架构突破Transformer限制,实现接近人类水平的英文语音合成和2秒内中文响应速度,已获S...
    AI产品动态# AI语音技术# Cartesia# Sonic-3
    3个月前
    xAI推出Grok Voice Agent API:支持多语言实时语音交互,定价0.05美元/分钟

    xAI推出Grok Voice Agent API:支持多语言实时语音交互,定价0.05美元/分钟

    xAI于2025年12月推出Grok Voice Agent API,提供支持多语言、平均响应<1秒的实时语音技术,兼容OpenAI规范,定价0.05美元/分钟。适用于车载导航、智能家居等场景,与GP...
    AI产品动态# AI语音技术# GrokVoiceAgent# OpenAI竞争
    2个月前
    阿里发布Qwen3-TTS语音模型升级版:音色克隆3秒完成,支持10种语言与动物声纹拟人化

    阿里发布Qwen3-TTS语音模型升级版:音色克隆3秒完成,支持10种语言与动物声纹拟人化

    阿里巴巴发布Qwen3-TTS-VD/VC语音模型升级版,实现3秒极速音色克隆、支持10种语言及动物声纹拟人化,在WER指标上超越GPT-4o等国际模型。集成49种音色与8种方言,提供200毫秒低延迟...
    AI产品动态# AI应用# AI语音技术# Qwen3-TTS
    1个月前
    阶跃星辰开源全球首个LLM架构音频编辑模型Step-Audio-EditX,语音编辑进入自然语言指令时代

    阶跃星辰开源全球首个LLM架构音频编辑模型Step-Audio-EditX,语音编辑进入自然语言指令时代

    阶跃星辰于2025年11月开源全球首个基于LLM架构的音频编辑模型Step-Audio-EditX,支持自然语言指令编辑,30亿参数实现高性能低门槛部署,在方言表现力和情感传递准确率方面领先行业,推动...
    AI产品动态# AI语音技术# Step-Audio-EditX# 大语言模型
    3个月前
    火山引擎发布豆包语音识别模型2.0:多模态视觉与多语种支持实现技术突破

    火山引擎发布豆包语音识别模型2.0:多模态视觉与多语种支持实现技术突破

    火山引擎推出豆包语音识别模型2.0,实现多模态视觉识别与13种语言支持,通过PPO强化学习提升推理准确率20%,适用于跨国会议、多语言内容生产等场景,推动语音识别行业技术革新。
    AI产品动态# AI突破# AI语音技术# 人工智能
    2个月前
    没有了

    热门AI工具

    最新资讯

    AI视野 | 全球AI信息聚合平台
    AI视野 - 全球AI信息聚合平台,拓展AI视野,致力于打造全面专业的AI信息平台。 整合全球最全面的AI应用资源库,实时追踪最新AI行业资讯与技术动态,深度解析AI产品发展趋势,提供多维度的AI应用排名。 以专业视角为您打开AI视野,了解全球AI领域动态,助力您在AI智能时代把握先机,智领未来。

    AI资讯 站内排行 全球AI排行榜Top30 中国AI排行榜Top30 往期AI排行榜 关于我们

    扫码加公众号AI视野 | 全球AI信息聚合平台
    扫码加公众号
    扫码加微信AI视野 | 全球AI信息聚合平台
    扫码加微信
    Copyright © 2026 AI视野 | 全球AI信息聚合平台  粤ICP备2025421237号 
    AI工具
    AI工具AI资讯