巨人网络联合清华西工大发布三项AI音视频生成技术,GitHub全面开源 巨人网络联合清华西工大发布YingVideo-MV音乐视频生成、YingMusic-SVC歌声转换和YingMusic-Singer歌声合成三项AI技术,支持镜头与音乐毫秒级同步、零样本声音克隆,代码... AI新闻资讯# AI多模态生成# 巨人网络# 开源AI 2周前
清华大学发布AI教育应用指导原则,禁止AI生成内容直接作为学业成果 清华大学发布首部《人工智能教育应用指导原则》,明确禁止将AI生成内容直接作为学业成果,确立主体责任、合规诚信等五大核心原则,为高校AI教育应用提供规范性指导。 AI新闻资讯# AI规范# 人工智能教育# 学术诚信 2周前
华为清华联合发布WorldGrow世界模型,单卡30分钟生成272㎡高精度数字空间 华为与清华大学联合研发的WorldGrow世界模型实现重大技术突破,单卡30分钟生成272㎡高精度数字空间,物理规则模拟达工业级标准,有效解决自动驾驶训练数据瓶颈,推动建筑可视化、智能家居布局应用发展... AI产品动态# AI技术# WorldGrow# 世界模型 2个月前
清华与智谱AI发布Glyph框架:实现3-4倍文本压缩,突破大模型长上下文处理瓶颈 清华大学与智谱AI联合研发的Glyph框架实现突破性进展,通过视觉-文本压缩机制达到3-4倍文本压缩率,128K上下文窗口VLM可处理百万级token内容,显著提升内存效率与推理速度,为金融法律等领域... AI产品动态# AI技术突破# Glyph框架# 文本压缩 2个月前
清华团队凭类脑AI项目夺冠国际大学生创新大赛,项目估值达2亿美元 清华大学万格智能团队凭借类脑架构AI项目在国际大学生创新大赛夺冠,其智人HRM模型实现推理能力突破,项目估值2亿美元,展现中国在AI前沿领域的创新实力。 AI新闻资讯# AI模型# 人工智能# 创业融资 2个月前
巨人网络与清华联合发布开源方言语音合成大模型DiaMoE-TTS,突破方言AI技术壁垒 巨人网络与清华大学联合研发的多方言语音合成大模型DiaMoE-TTS正式开源,采用MoE架构和IPA标准化体系,解决方言合成技术难题,支持广东话、四川话等多方言场景,推动语言多样性数字化保护。 AI新闻资讯# AI大模型# DiaMoE-TTS# SATLab 2个月前
清华与生数科技联合发布AudioLBM框架,音频超分技术突破192kHz母带级音质 清华大学与生数科技联合发布AudioLBM音频超分框架,实现从波形域到隐空间的范式转变,支持任意采样率转换至192kHz母带级音质。了解该技术如何提升语音清晰度、音乐细节,并应用于老旧录音修复和沉浸式... AI新闻资讯# AI音频技术# AudioLBM# Bridge-SR 2个月前
面壁智能发布VoxCPM 0.5B语音生成模型:支持中英双语与实时流式输出,开源可商用 面壁智能发布VoxCPM 0.5B参数语音生成基座模型,支持中英双语流式输出与高精度音色克隆,在自然度和韵律表现达SOTA水平。模型已开源,适用于智能语音交互与数字内容创作。 AI产品动态# TTS技术# VoxCPM# 人工智能 3个月前
双模态激光雷达突破:华科大联合团队实现毫米级精度与毫秒级响应 华中科技大学与清华大学联合研发的双模态激光雷达系统实现技术突破,兼具毫米级精度与毫秒级响应能力,支持500米远距探测和120°广角成像,为L4/L5级自动驾驶及智能机器人提供核心感知解决方案。 AI新闻资讯# 人工智能# 华中科技大学# 智能设备 3个月前
清华大学与IDEA联合研发GUAVA框架:单张照片0.1秒生成3D化身,实时渲染破局元宇宙基建 清华大学与IDEA研发的GUAVA框架实现单张照片0.1秒生成高保真3D化身,渲染速度50帧/秒,突破传统多视角限制。技术入选ICCV 2025,开源代码推动影视、游戏与虚拟会议应用,助力元宇宙基础设... AI产品动态# 3D化身生成# GUAVA框架# IDEA 4个月前