OpenAI发布GPT-5系列模型:多任务处理能力再升级,迈向AGI关键一步 OpenAI推出革命性GPT-5模型,实现文本/图像/语音统一处理,上下文窗口扩展至200万Token,微软生态首批接入。了解这一AI技术里程碑如何重塑行业竞争格局。 AI产品动态# AGI# AI技术# GPT-5 10个月前
阿里通义千问发布两款轻量化开源AI模型,推动端侧AI技术普及 阿里巴巴通义千问团队发布两款轻量化开源AI模型Qwen3-4B系列,性能超越竞品,专为移动终端和物联网设备优化,推动端侧AI技术普及,加速国产AI生态商业化进程。 AI产品动态# 人工智能# 开源模型# 端侧AI 10个月前
字节跳动Seed团队推出实验性扩散语言模型Seed Diffusion Preview,代码生成速度提升5.4倍 字节跳动Seed团队推出实验性扩散语言模型Seed Diffusion Preview,代码生成速度提升5.4倍。该模型在多项基准测试中表现优异,尤其在代码编辑任务中展现出更强的全局规划能力,为复杂结... AI产品动态# AI# SeedDiffusion# 代码生成 10个月前
中国团队Lovart设计Agent全球开放注册,AI设计工具迎来范式升级 中国团队研发的Lovart设计Agent正式向全球开放注册,核心功能ChatCanvas实现AI设计工具从生成助手到创作伙伴的升级。整合多模态模型,提升设计效率80%,支持自然语言精准修改,引发全球创... AI产品动态# AI设计# ChatCanvas# Lovart 10个月前
字节跳动豆包AI助手推出可视化编程功能,零基础用户也能轻松开发应用 字节跳动豆包AI助手推出'应用创造1.0'功能,通过可视化编辑界面让零基础用户也能轻松开发应用,操作耗时平均降低80%,重塑低代码开发市场格局。 AI产品动态# AI编程# 低代码开发# 可视化编辑 11个月前
Rokid与支付宝联合推出全球首款语音支付智能眼镜,开启可穿戴支付新时代 Rokid联合支付宝推出全球首款支持语音支付的智能眼镜,创新“看一下支付”功能,适用于多场景并保障交易安全,预计6月交付,同步布局AR导航生态,引领可穿戴设备支付技术革新。 AI产品动态# AR导航# Rokid# 可穿戴设备 11个月前
松下发布多模态大模型OmniFlow,实现文本、图像与音频自由转换 | AI技术突破 松下近日正式推出多模态大模型OmniFlow,该模型支持文本、图像、音频之间的任意转换生成,标志着多模态AI技术迈向更灵活、高效的商业化应用阶段。 AI产品动态# AI技术# 图像生成# 多模态模型 11个月前
豆包电脑版上线AI播客功能 语音拟真度获用户高度评价 豆包电脑版及网页版全量上线“AI播客”功能,用户可通过上传PDF或网页链接一键生成双人对话式播客内容。该功能基于豆包大模型团队研发的语音播客模型,其语音效果因高度拟人化、自然停顿及语气词模拟等特点引发... AI产品动态# AI应用# AI播客# 科技新闻 11个月前
蚂蚁数科发布多语种多模态大模型训练框架,突破小语种AI理解瓶颈 蚂蚁数科在香港金融科技节发布创新多语种多模态大模型训练框架,通过语言感知优化机制提升小语种理解能力,在主流多语言VQA基准测试中准确率提升9.5%,评测总分超越GPT-4o、Gemini等国际主流模型... AI产品动态# 人工智能技术# 多模态AI# 多语种大模型 7个月前
Soul AI Lab开源播客语音合成模型SoulX-Podcast,支持多方言60分钟稳定对话 Soul AI Lab开源播客语音合成模型SoulX-Podcast,采用LLM+Flow Matching技术,支持中英文及四川话等方言,具备零样本音色克隆、跨方言音色转换能力,可稳定输出60分钟自... AI产品动态# AIGC# AI语音合成# SoulX-Podcast 7个月前