百度发布PP-OCRv5:0.07B参数实现多语言文本识别,效率提升13% 百度开源PP-OCRv5 OCR模型,参数量仅0.07B却实现中英日等40余种语言高精度识别,移动端处理速度达370字符/秒,适用于文档扫描、工业质检等实时场景,免费下载部署。 AI产品动态# HuggingFace# OCR# PP-OCRv5 2个月前
微软Live Interpreter API正式发布:实时多语言翻译技术重塑跨语言沟通 微软Live Interpreter API正式推出,支持76种语言实时翻译,低延迟、保留语音特征并确保数据安全。了解其在会议、教育、电商等场景的应用,推动全球化数字效率提升。 AI产品动态# AI翻译# Azure# LiveInterpreterAPI 2个月前
Meta发布MobileLLM-R1系列小参数模型,性能超越大参数竞品 Meta AI发布MobileLLM-R1系列轻量级模型,950M参数版本以不足5T token训练量在MATH/编程测试中超越Qwen3 0.6B,开创低参数量高精度AI新范式,推动移动端AI应用落... AI产品动态# AI模型# MetaAI# 开源模型 2个月前
xAI发布Grok 4 Fast:推理速度提升10倍,重塑AI实时交互新标准 xAI于2025年9月发布Grok 4 Fast版本,推理速度较标准版提升10倍,支持256K上下文窗口和多模态输入。了解其技术突破、性能测试及在金融、科研领域的应用前景。 AI产品动态# AI应用# Grok4Fast# xAI 2个月前
Stability AI发布Stable Audio 2.5:AI音频生成效率与质量大幅提升,支持3分钟高质量输出 Stability AI最新推出Stable Audio 2.5模型,提升AI音频生成效率与质量,支持3分钟输出、音频修复和移动创作,基于全授权数据确保合规,适用于广告、影视及音乐行业。 AI产品动态# AI音频生成# StabilityAI# StableAudio2.5 2个月前
B站IndexTTS-2.0重磅开源:工业级零样本TTS实现情感与时长精准控制 哔哩哔哩开源IndexTTS-2.0零样本语音合成系统,实现工业级情感与时长精准控制。支持中英混合发音校正和实时参数调节,适用于视频配音、有声读物等场景,降低语音合成技术成本。 AI产品动态# AIGC# AI语音合成# IndexTTS 2个月前
去哪儿旅行国庆前推出AI旅行工具箱,重构全链条服务体验 去哪儿旅行基于大模型技术推出AI旅行工具箱,覆盖行程规划、机票咨询与智能客服全场景,助力用户国庆出行高效定制个性化旅程,提升旅游行业数字化服务水准。 AI产品动态# AI旅游# 人工智能# 去哪儿旅行 2个月前
美图联合阿里云通义万相推出AI视频生成新功能,打造沉浸式创作体验 美图联合阿里云通义万相推出AI视频生成解决方案,提供文生视频、图生视频、动漫风格转换等功能,支持一键生成演唱会舞台/复古美漫等特效,降低创作门槛,提升视频制作效率。 AI产品动态# AI影像技术# AI视频生成# 美图秀秀 2个月前
微软发布Visual Studio 2026预览版:AI深度集成重塑开发体验,性能提升70% 微软Visual Studio 2026预览版正式推出,深度集成AI辅助编程功能,包括代码片段生成、漏洞预判和性能优化。新版本加载速度提升70%,支持ARM架构,减少37%代码返工,重塑开发工作流。 AI产品动态# AI编程# IDE更新# VisualStudio2026 2个月前
英伟达发布Scene It to Believe It AI工具:文本生成3D模型,革新创意工作流 探索英伟达2025年推出的AI工具Scene It to Believe It:通过文本描述自动生成3D模型,集成Blender编辑,适用于游戏、影视制作。了解技术原理、硬件要求及行业影响。 AI产品动态# AI生成3D# Blender集成# SceneIttoBelieveIt 2个月前