xAI推出Grok Voice Agent API:支持多语言实时语音交互,定价0.05美元/分钟 xAI于2025年12月推出Grok Voice Agent API,提供支持多语言、平均响应<1秒的实时语音技术,兼容OpenAI规范,定价0.05美元/分钟。适用于车载导航、智能家居等场景,与GP... AI产品动态# AI语音技术# GrokVoiceAgent# OpenAI竞争 5个月前
腾讯发布AI程序员Ada:全天候智能编程工具重构软件开发范式 腾讯正式发布AI程序员Ada技术预览版,实现从需求分析到代码生成、测试部署的全流程自动化。了解Ada如何通过自然语言编程重构软件开发范式,降低故障修复时间,提升开发效率。探索AI编程工具的未来发展趋势... AI产品动态# AI程序员# 人工智能# 代码生成 7个月前
Anthropic正式推出Claude Code插件系统,AI编程助手进入生态化时代 Anthropic于2025年10月推出Claude Code插件系统,包含斜杠命令、子代理、MCP服务器和钩子四大核心组件,支持开发者定制AI编程工作流,现已开放公开测试,助力企业CI/CD流程整合... AI产品动态# AI编程# Anthropic# ClaudeCode 7个月前
谷歌发布神经操作系统:Gemini 2.5 Flash驱动UI实时生成,人机交互迎来变革 深度解析谷歌最新神经操作系统:基于Gemini 2.5 Flash模型的实时UI生成技术,具备极低延迟和成本优势,支持百万级token处理,将重塑操作系统市场格局。了解技术架构、性能指标及2025年企... AI产品动态# AI操作系统# Gemini2.5Flash# UI生成 8个月前
小红书发布FireRedTTS-2:新一代多语言对话合成模型,实现零样本声音克隆与实时流式生成 小红书FireRedTTS-2模型突破语音合成技术瓶颈,支持实时流式多语言对话生成与单句声音克隆,自然度媲美真实录音。开源代码覆盖中英日韩法等语言,适用于语音识别和交互数据构建。 AI产品动态# AI语音合成# FireRedTTS-2# 声音克隆 8个月前
智微智能发布“智擎”机器人大脑控制器,支持多芯片平台与定制化方案 智微智能发布“智擎”系列机器人大脑域控制器,基于NVIDIA Jetson平台,提供高性能AI算力,支持工业、服务及人形机器人应用,已通过车规认证并实现多家人形机器人厂商合作,加速具身智能产业商业化进... AI产品动态# AI算力# NVIDIAJetson# 人形机器人 9个月前
微软Copilot Labs上线AI语音生成工具,支持情感化叙事与多角色对话 探索微软Copilot Labs最新AI语音生成工具:支持情感化输出与多角色故事模式,免费生成英文音频,了解微软在生成式AI领域的技术布局与社区共创战略。 AI产品动态# AI语音生成# CopilotLabs# 人工智能工具 9个月前
谷歌翻译推出AI语言学习功能,挑战多邻国等专业平台 谷歌翻译推出AI驱动的语言学习功能,支持103种语言的交互式练习,包括听力和口语训练。通过实时翻译和个性化学习路径,挑战多邻国等平台,重塑语言学习市场。 AI产品动态# AI语言学习# 人工智能# 多邻国 9个月前
Kimi模型输出速度突破100 Tokens/秒!限时5折优惠助力AI开发 Kimi开放平台实现kimi-k2-turbo-preview模型输出速度峰值100 Tokens/秒,较40 Tokens版本提升50%。支持128K长文本与工具调用,限时5折优惠输入低至2元/百万... AI产品动态# AI大模型# API优惠# Kimi 9个月前
谷歌为Google Docs推出AI语音朗读功能,支持自定义语音风格与播放速度 谷歌正式推出Google Docs AI语音朗读功能,支持英文文档多风格语音自定义和速度调节,基于Gemini模型提升办公效率,适合企业及视障用户使用。 AI产品动态# AI语音朗读# Gemini模型# GoogleDocs 9个月前