人工智能技术

即梦AI网页版全面升级，推出AI片场一站式创作解决方案，视频3.5 Pro模型实现音画同步突破

即梦AI网页版全面升级，正式推出AI片场一站式创作解决方案，核心亮点为全球首发视频3.5 Pro模型，实现音画同步生成技术，支持方言与复杂声画匹配。升级包括智能多帧2.0、图像生成矩阵及全流程画布系统...

7个月前

谷歌相册AI图生视频重磅升级：新增自定义提示词功能，视频生成精准度提升40%

谷歌相册6.48版本推出AI图生视频自定义提示词功能，用户可通过自然语言指令精准控制视频生成方向，基于Veo 3模型的技术升级使生成准确率提升40%，实现从随机创作到精准定制的跨越。

AI产品动态 # AI视频生成 # Veo模型 # 人工智能技术

9个月前

阿里国际开源多模态大模型Ovis2.5：视觉推理突破，中小企业AI应用门槛大降

阿里国际发布并开源多模态大模型Ovis2.5，9B与2B版本在OpenCompass评测领先，支持动态分辨率与跨模态推理。适用于电商、翻译及终端设备，助力企业低成本AI转型，技术全面开源。

AI产品动态 # Ovis2.5 # 人工智能技术 # 多模态大模型

11个月前

苹果推出革命性AI图像生成系统STARFlow，挑战DALL-E与Midjourney市场地位

深度解析苹果STARFlow AI系统的技术突破：通过标准化流与Transformer融合实现高效图像生成，支持端到端训练与本地化部署，在医疗影像、电商视觉领域具颠覆性潜力。

AI产品动态 # STARFlow # Transformer # 人工智能技术

10个月前

阿里巴巴开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型，语音技术实现音色克隆与轻量化识别突破

阿里巴巴通义大模型团队开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型，实现3秒音色克隆、多语言情感控制及轻量化高精度识别，降低延迟50%，支持实时场景与创意产业应用，加速语音...

AI产品动态 # AI开源 # Fun-ASR-Nano # Fun-CosyVoice

7个月前

蚂蚁数科发布多语种多模态大模型训练框架，突破小语种AI理解瓶颈

蚂蚁数科在香港金融科技节发布创新多语种多模态大模型训练框架，通过语言感知优化机制提升小语种理解能力，在主流多语言VQA基准测试中准确率提升9.5%，评测总分超越GPT-4o、Gemini等国际主流模型...

AI产品动态 # 人工智能技术 # 多模态AI # 多语种大模型

8个月前

腾讯混元大模型开源翻译模型1.5版，覆盖33种语言与方言，轻量化部署实现突破

腾讯混元大模型团队开源翻译模型1.5版本，推出1.8B和7B两款模型，覆盖33种国际语言及5种民汉/方言翻译。1.8B模型专为移动端优化，内存仅1GB，响应速度提升55%；7B模型优化翻译准确性，解决...

AI产品动态 # AI翻译 # WMT25 # 人工智能技术

6个月前

快手发布KAT系列Agentic Coding大模型，KAT-Coder以73.4%解决率创代码智能新纪录

快手发布KAT系列Agentic Coding大模型，KAT-Coder以73.4%解决率刷新代码智能纪录，KAT-Dev-32B开源模型表现优异。了解国产AI代码大模型的技术突破与国际竞争力。

AI产品动态 # AgenticCoding # AI大模型 # 人工智能技术

9个月前

DeepSeek-V3.1重磅升级：128K上下文窗口震撼发布，长文本处理能力翻倍

DeepSeek-V3.1实现重大技术突破：上下文窗口扩展至128K，多步推理性能提升43%，幻觉概率降低38%。专为长文档分析、代码库理解和复杂计算场景优化，为企业级AI应用提供领先解决方案。

AI产品动态 # AI模型升级 # DeepSeek # MoE架构