Hume AI发布Octave 2多语言语音模型,新增阿拉伯语等12种语言支持

AI产品动态3小时前发布 AI视野

据科技媒体TechCrunch报道,人工智能初创公司Hume AI于6月4日宣布,其新一代多语言语音模型Octave 2已完成最终测试,计划在未来两周内正式向企业客户开放。该模型在保留前代产品情感识别能力的基础上,新增对阿拉伯语、印地语和泰语等关键市场的支持,总语言覆盖量达12种。

知情人士向路透社透露,Octave 2的研发耗时18个月,特别优化了南亚地区语言的韵律建模。测试数据显示,其印地语语音合成的自然度达到4.2分(5分制),较行业基准高出23%。公司首席执行官Alan Cowen在开发者简报会上强调,新版本将首先应用于医疗问诊和跨境客服场景。

行业分析机构ABI Research指出,这标志着多模态AI竞争进入新阶段。目前亚马逊的Alexa团队和谷歌DeepMind分别有类似项目处于封闭测试阶段,但Hume凭借先发优势已与三家跨国呼叫中心运营商达成战略合作。值得注意的是,Octave 2暂未公布具体定价方案,其商用前景仍取决于企业客户的部署成本评估。

(综合TechCrunch、路透社消息)

© 版权声明

相关文章