阿里云通义万相开源Wan2.2-Animate动作生成模型,单图驱动视频生成实现技术突破 阿里云通义万相团队开源Wan2.2-Animate动作生成模型,突破单图生成动态视频技术,支持文本指令控制与4K实时生成,性能超越StableAnimator和Runway商业模型。开发者可通过Git... AI产品动态# AI视频生成# 人工智能技术# 动作生成模型 3个月前
面壁智能发布VoxCPM 0.5B语音生成模型:支持中英双语与实时流式输出,开源可商用 面壁智能发布VoxCPM 0.5B参数语音生成基座模型,支持中英双语流式输出与高精度音色克隆,在自然度和韵律表现达SOTA水平。模型已开源,适用于智能语音交互与数字内容创作。 AI产品动态# TTS技术# VoxCPM# 人工智能 3个月前
DeepSeek-R1登《自然》封面:全球首个获同行评审认证的开源大模型 DeepSeek-R1成为全球首个登上《自然》封面的主流大语言模型,通过纯强化学习框架降低算力消耗与数据依赖,技术细节经同行评审认证,推动AI研发开源化发展。 AI产品动态# DeepSeek# 人工智能# 大语言模型 3个月前
阿里巴巴开源通义DeepResearch智能体系统,自动化研究技术超越OpenAI 阿里巴巴开源全球首个完整技术栈深度研究智能体通义DeepResearch,权威测试性能超越OpenAI,支持自定义研究策略与多轮推理,推动金融分析、医药研发领域自动化研究变革。 AI产品动态# OpenAI# 人工智能# 开源AI 3个月前
全球首个完全开源语音大模型LLaSO发布,支持87种语言精准识别 深度逻辑智能发布全球首个完全开源语音大模型LLaSO,支持87种语言高精度识别,噪声环境准确率提升23%,适用于智能家居、车载交互及医疗金融领域,推动语音AI技术协同创新与产业生态发展。 AI产品动态# AI技术# LLaSO框架# 人工智能 3个月前
Hcompany发布Holo1.5开源多模态模型系列 720亿参数UI任务模型突破界面理解瓶颈 Hcompany发布Holo1.5开源多模态模型系列,720亿参数Holo-72B-UI模型在UI理解任务中达到89.3%完成率,支持自然语言操作Android应用。了解开源模型性能优势、技术特性及商... AI产品动态# AI多模态模型# Hcompany# Holo1.5 3个月前
Anthropic发布LLM Agent工具开发指南:三步流程提升AI效率,响应压缩41% Anthropic发布LLM Agent工具开发指南,详解MCP协议下的三步迭代流程与五项核心原则,通过动态压缩算法实现41%响应压缩,降低边缘计算成本,并开源47种工具及测试用例库。 AI产品动态# AI工具开发# Anthropic# LLMAgent 3个月前
腾讯优图开源Youtu-GraphRAG框架:突破图检索增强生成技术,精准度提升16.62% 腾讯优图实验室开源Youtu-GraphRAG框架,通过图谱与大语言模型融合,实现Token成本降低90.71%与推理准确率提升16.62%。了解技术架构、应用场景及开源详情,助力企业知识管理与AI部... AI产品动态# GraphRAG# RAG技术# 大语言模型 3个月前
阿里发布Qwen3-Next高稀疏MoE模型:90%成本降低与10倍推理性能提升 阿里巴巴通义千问发布下一代Qwen3-Next高稀疏MoE架构,800亿参数模型训练成本降90%,推理吞吐量提升10倍,开源80B模型支持金融分析与供应链优化场景。 AI产品动态# MoE架构# 人工智能# 大模型 3个月前
自变量机器人开源WALL-OSS具身智能大模型:单卡RTX 4090可部署,零样本泛化能力突破 自变量机器人开源WALL-OSS具身智能大模型,支持单RTX 4090显卡低成本部署,提供端到端多模态架构与零样本泛化能力,加速服务机器人与工业自动化应用创新,阿里云领投近10亿元融资。 AI产品动态# AI大模型# 人工智能部署# 具身智能 3个月前