商汤科技开源NEO原生多模态架构,引领AI进入“原生架构”时代 商汤科技于2025年12月1日开源与南洋理工大学联合研发的NEO原生多模态架构,通过原生图块嵌入、统一注意力等创新技术,实现视觉与语言的深层融合,推动多模态AI进入“原生架构”时代,加速产业级技术标准... AI产品动态# AI基础设施# NEO架构# 人工智能 2个月前
谷歌AI新框架颠覆科研模式:先打草稿后修正,数小时完成数月工作 谷歌最新AI框架采用先打草稿后迭代的创新方法,通过实时整合arXiv等平台论文,将科研流程压缩至数小时,在单细胞数据分析等任务中准确率提升14%,现已开源供学术界验证使用。 AI新闻资讯# 人工智能框架# 动态知识管道# 大语言模型 4个月前
Moonshot AI开源Kosong框架:Python智能体开发迎来革命性突破 深度解析Moonshot AI开源的Kosong框架:支持多模型自由切换的Python智能体开发工具,具备插件化设计和标准化工具集成,5分钟快速部署体验,助力开发者高效构建AI应用。 AI产品动态# AI开发框架# Kosong# MoonshotAI 3个月前
腾讯开源全球首个全链路混元3D 2.1生成大模型,适配消费级显卡 腾讯在计算机视觉领域顶级会议CVPR 2025上宣布开源混元3D 2.1大模型。作为全球首个全链路开源的工业级3D生成模型,该技术实现了从模型权重、训练代码到数据处理流程的完整开放,显著降低了3D内容... AI产品动态# 3D生成# AI# 开源技术 8个月前
法国Kyutai实验室开源多语言语音合成模型TTS,实现低延迟实时语音交互 法国Kyutai实验室发布开源语音合成模型Kyutai TTS,支持12种语言200毫秒低延迟生成,创新融合情感语音建模与边缘计算,MOS评分4.2分。适用于智能客服、游戏陪玩等场景,GitHub已开... AI产品动态# AI# KyutaiTTS# 多语言处理 7个月前
Firecrawl开源AI就绪检查器:助力网站优化适应AI搜索新时代 Firecrawl开源AI就绪检查器工具,帮助开发者评估网站AI适配性、LLMs.txt合规性和内容质量,提升网站在AI搜索时代的可见性与竞争力。了解如何通过开源工具优化网站以适应AI驱动搜索环境。 AI新闻资讯# AI工具# AI搜索# LLMs.txt 5个月前
国内首个具身智能国标VLA模型XR-1开源,北京人形机器人创新中心发布完整技术生态 2025年12月18日,北京人形机器人创新中心开源国内首个通过具身智能国标测试的VLA大模型XR-1,配套RoboMIND 2.0数据平台与ArtVIP数据集,实现“大脑+小脑+本体”全技术链,推动机... AI产品动态# VLA大模型# 人工智能# 人形机器人 1个月前
Meta开源SAM Audio音频分离模型:多模态提示技术重塑音频编辑行业 Meta最新开源的SAM Audio多模态音频分离模型,通过文本、视觉和时间段提示实现精准声音分离,适用于音乐制作、播客降噪等场景。本文解析其PE-AV核心技术、应用优势及开源资源,探讨AI音频处理的... AI产品动态# AI工具# Meta# SAMAudio 2个月前
合合信息发布AI Agent云资源管理终端Chaterm,开启智能化交互新时代 合合信息在2025亚马逊云科技中国峰会上发布AI Agent跨平台云资源管理终端Chaterm,通过自然语言交互和开源技术,显著提升云资源管理效率,降低运维成本,引领智能化运维新趋势。 AI产品动态# AIAgent# Chaterm# 云资源管理 8个月前