全国首个机器人博士诞生!上戏录取具身智能机器人“学霸01” 上海理工大学研发的具身智能机器人“学霸01”成为全国首位机器人博士,入选上海戏剧学院,融合AI与艺术教育,具备高难度舞台表演与情感交互能力,推动产学研创新范本。 AI产品动态# 上海戏剧学院# 产学研合作# 人工智能 12小时前
微软Edge测试版推出AI视频实时翻译功能,支持多语言但硬件要求高 专业解读微软Edge浏览器Beta版的AI视频实时翻译功能:支持多语言互译,但高硬件需求成挑战。了解技术细节、兼容性及未来扩展计划,助力SEO内容策略。 AI产品动态# AI翻译# Beta测试# Edge浏览器 12小时前
小红书发布FireRedTTS-2:新一代多语言对话合成模型,实现零样本声音克隆与实时流式生成 小红书FireRedTTS-2模型突破语音合成技术瓶颈,支持实时流式多语言对话生成与单句声音克隆,自然度媲美真实录音。开源代码覆盖中英日韩法等语言,适用于语音识别和交互数据构建。 AI产品动态# AI语音合成# FireRedTTS-2# 声音克隆 12小时前
百度发布PP-OCRv5:0.07B参数实现多语言文本识别,效率提升13% 百度开源PP-OCRv5 OCR模型,参数量仅0.07B却实现中英日等40余种语言高精度识别,移动端处理速度达370字符/秒,适用于文档扫描、工业质检等实时场景,免费下载部署。 AI产品动态# HuggingFace# OCR# PP-OCRv5 12小时前
微软Live Interpreter API正式发布:实时多语言翻译技术重塑跨语言沟通 微软Live Interpreter API正式推出,支持76种语言实时翻译,低延迟、保留语音特征并确保数据安全。了解其在会议、教育、电商等场景的应用,推动全球化数字效率提升。 AI产品动态# AI翻译# Azure# LiveInterpreterAPI 12小时前
Meta发布MobileLLM-R1系列小参数模型,性能超越大参数竞品 Meta AI发布MobileLLM-R1系列轻量级模型,950M参数版本以不足5T token训练量在MATH/编程测试中超越Qwen3 0.6B,开创低参数量高精度AI新范式,推动移动端AI应用落... AI产品动态# AI模型# MetaAI# 开源模型 12小时前
xAI发布Grok 4 Fast:推理速度提升10倍,重塑AI实时交互新标准 xAI于2025年9月发布Grok 4 Fast版本,推理速度较标准版提升10倍,支持256K上下文窗口和多模态输入。了解其技术突破、性能测试及在金融、科研领域的应用前景。 AI产品动态# AI应用# Grok4Fast# xAI 12小时前
Stability AI发布Stable Audio 2.5:AI音频生成效率与质量大幅提升,支持3分钟高质量输出 Stability AI最新推出Stable Audio 2.5模型,提升AI音频生成效率与质量,支持3分钟输出、音频修复和移动创作,基于全授权数据确保合规,适用于广告、影视及音乐行业。 AI产品动态# AI音频生成# StabilityAI# StableAudio2.5 4天前
B站IndexTTS-2.0重磅开源:工业级零样本TTS实现情感与时长精准控制 哔哩哔哩开源IndexTTS-2.0零样本语音合成系统,实现工业级情感与时长精准控制。支持中英混合发音校正和实时参数调节,适用于视频配音、有声读物等场景,降低语音合成技术成本。 AI产品动态# AIGC# AI语音合成# IndexTTS 4天前
去哪儿旅行国庆前推出AI旅行工具箱,重构全链条服务体验 去哪儿旅行基于大模型技术推出AI旅行工具箱,覆盖行程规划、机票咨询与智能客服全场景,助力用户国庆出行高效定制个性化旅程,提升旅游行业数字化服务水准。 AI产品动态# AI旅游# 人工智能# 去哪儿旅行 4天前