字节跳动开源全模态PyTorch训练框架VeOmni,革新多模态AI研发效率 深度解析字节跳动VeOmni全模态训练框架:通过算子融合、自动并行策略等核心技术实现300亿参数模型高效训练,开源首日获500+星标,重塑多模态AI工程化标准。 AI产品动态# AI开源# PyTorch框架# 分布式训练 6个月前
雷鸟创新与蚂蚁集团战略合作:AI+AR眼镜实现无感支付新突破 雷鸟创新与蚂蚁集团达成战略合作,推出全球首款支持支付宝“看一下支付”的AR眼镜雷鸟X3 Pro,实现通过视线交互完成支付,标志着智能穿戴设备在无感支付领域的技术突破。 AI产品动态# AI# AR眼镜# 数字支付 6个月前
AI视频生成技术重大突破:Pika Labs发布音频驱动表演模型 Pika Labs发布音频驱动表演模型,实现静态图像与音频的智能联动,生成精确口型同步和自然表情变化的视频内容,革新视频制作流程。 AI产品动态# AI视频生成# PikaLabs# 人工智能 6个月前
Figure Robotics人形机器人Figure 02通过Helix模型实现家庭洗衣与叠衣技能 Figure Robotics的Figure 02人形机器人通过Helix视觉-语言-动作模型,在不改变神经网络架构的情况下,仅通过增加数据集便掌握了洗衣与叠衣两项家庭场景任务,展示了AI技术在家庭服... AI产品动态# AI技术# FigureRobotics# Helix模型 6个月前
Rokid推出粤语交互智能眼镜海外版,加速全球化布局 Rokid在香港推出支持粤语交互的智能眼镜海外版,集成多个AI模型,具备多语言翻译、智能提词等功能,由CSL Mobile独家预售,加速全球化布局。 AI产品动态# AI# CSLMobile# Rokid 6个月前
Anthropic突破性升级:Claude Sonnet 4模型实现百万级Token上下文窗口支持 Anthropic公司Claude Sonnet 4模型实现百万级Token上下文窗口突破,处理能力达原有五倍,支持《哈利波特》全集规模文本分析,现已在API和Amazon Bedrock平台开放。 AI产品动态# AI# Anthropic# ClaudeSonnet4 6个月前
优刻得与智谱达成战略合作,全面集成GLM-4.5大模型技术 优刻得与智谱达成战略合作,全面集成GLM-4.5及GLM-4.5V多模态模型,通过UModelVerse平台提供一站式AI服务,加速大模型技术在产业端的商业化应用。 AI产品动态# GLM-4.5# MaaS# 云计算 6个月前
昆仑万维开源多模态框架Skywork UniPic 2.0,实现文本图像双模态处理 昆仑万维发布并开源新一代多模态框架Skywork UniPic 2.0,整合理解、生成与编辑能力,支持文本和图像双模态处理,显著降低开发者应用门槛,推动多模态AI技术商业化进程。 AI产品动态# AI技术# SkyworkUniPic2.0# 多模态框架 6个月前
浙江大学“白犀”机器人以16.33秒刷新四足机器人百米世界纪录 浙江大学“白犀”四足机器人以16.33秒刷新百米世界纪录,核心技术涵盖动力学建模与智能控制,未来将应用于灾害救援与极端地形运输。 AI产品动态# 人工智能# 吉尼斯纪录# 四足机器人 6个月前
字节跳动推出DiT大模型视频字幕无痕擦除技术,提升全球化传播效率 字节跳动推出基于DiT大模型的视频字幕无痕擦除技术,实现像素级修复与多语言适配,提升视频全球化传播效率。该技术已通过万集视频验证,成功率100%,适用于短剧出海、跨境电商等场景。 AI产品动态# AI技术# DiT大模型# 全球化传播 6个月前