Luma AI发布全球首款多模态推理视频模型Ray3,支持4K HDR生成与智能修正 Luma AI推出全球首款多模态推理视频模型Ray3,支持16位HDR生成、4K输出与智能修正功能,深度集成Adobe工作流。了解其技术优势、商业应用及对AI视频行业的影响。 AI产品动态# Adobe# AI视频生成# LumaAI 4个月前
DeepSeek-V3.1重磅升级:128K上下文窗口震撼发布,长文本处理能力翻倍 DeepSeek-V3.1实现重大技术突破:上下文窗口扩展至128K,多步推理性能提升43%,幻觉概率降低38%。专为长文档分析、代码库理解和复杂计算场景优化,为企业级AI应用提供领先解决方案。 AI产品动态# AI模型升级# DeepSeek# MoE架构 6个月前
蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,推理速度提升10.7倍 蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,实现10.7倍推理速度提升,支持LLaDA等主流dLLM,在HumanEval代码生成任务中达1011 tokens/秒,推动AI推理效率新... AI产品动态# AI开源# dInfer# 人工智能技术 4个月前
快手发布KAT系列Agentic Coding大模型,KAT-Coder以73.4%解决率创代码智能新纪录 快手发布KAT系列Agentic Coding大模型,KAT-Coder以73.4%解决率刷新代码智能纪录,KAT-Dev-32B开源模型表现优异。了解国产AI代码大模型的技术突破与国际竞争力。 AI产品动态# AgenticCoding# AI大模型# 人工智能技术 4个月前
蚂蚁技术研究院发布LLaDA2.0系列扩散大模型,参数突破百亿颠覆传统架构 蚂蚁技术研究院2025年发布LLaDA2.0离散扩散大语言模型,参数规模突破千亿,采用WSD训练策略降低90%成本,推理速度达535 tokens/s,在代码生成与数学推理任务中超越传统模型。模型已开... AI产品动态# AI大模型# LLaDA2.0# 人工智能技术 2个月前
百度发布猎户座AI引擎与慧播星数字人技术,开启AI战略新阶段 百度2025年发布猎户座AI引擎和慧播星数字人技术重大突破。猎户座开放25年搜索技术积累,支持多智能体协作;慧播星数字人全球开放,双11GMV增长91%,罗永浩同款技术平台化,加速AI技术商业化落地。 AI产品动态# AI引擎# 人工智能技术# 慧播星数字人 3个月前
腾讯开源10亿参数轻量OCR模型HunyuanOCR,多项基准测试达SOTA水平 腾讯正式开源1B参数轻量OCR模型HunyuanOCR,在OmniDocBench、OCRBench等权威测试中获SOTA成绩,支持14种语言识别,适用于文档解析、视频字幕识别等场景,推动AI文本识别... AI产品动态# HunyuanOCR# OCR模型# 人工智能技术 2个月前
谷歌Veo 3.1视频模型技术突破:8秒高清视频生成,实现音画同步 谷歌最新发布Veo 3.1文生视频模型实现重大技术突破,支持8秒720p高清视频生成,首次实现音画同步输出。模型在语义解析精度、视觉保真度和错误率控制方面显著提升,展现AI视频生成领域最新进展。 AI产品动态# AI视频生成# GoogleVids# VertexAI 4个月前
Runway发布Gen-4.5登顶全球视频生成榜首,AI视频生成技术实现电影级突破 Runway新一代视频生成模型Gen-4.5以1247分ELO评分登顶全球Video Arena榜单,超越谷歌Veo 3与OpenAI Sora 2 Pro。模型在运动质量、物理规律模拟和视觉逼真度上... AI产品动态# AI视频生成# Gen-4.5# Runway 2个月前
苹果发布UniGen 1.5多模态AI模型:统一架构实现图像理解、生成与编辑一体化 苹果研究团队推出多模态AI模型UniGen 1.5,实现图像理解、生成与编辑一体化集成,通过创新编辑指令对齐和统一奖励系统提升任务准确度,在多项测试中表现优异,为AI视觉领域带来重要技术突破与应用前景... AI产品动态# AI模型突破# UniGen1.5# 人工智能技术 1个月前