xAI推出Grok iOS应用“Imagine”功能:支持带音频的视频生成,实现多风格电影级创作 xAI推出Grok iOS应用“Imagine”功能,支持带音频的视频生成与多风格电影级内容创作。基于Grok 4混合专家架构,实现多模态实时转化、无限滚动生成及物理引擎集成,加速AI在创意产业的渗透... AI产品动态# Grok# xAI# 埃隆·马斯克 10个月前
OpenAI推出GPT-5 Thinking功能并研发儿童版,AI技术进入深度优化新阶段 OpenAI推出GPT-5 Thinking功能,响应速度提升40%,支持代码生成与实时调试。同步研发儿童版AI,布局教育细分市场。了解GPT-5技术优势、应用场景及行业竞争态势。 AI产品动态# AI儿童版# AI商业化# ChatGPT 8个月前
T-Mall发布“天算”医疗AI一体机,多模态诊断准确率超副主任医师水平 T-Mall发布国内首款获批多模态AI诊断一体机,集成千亿参数模型,支持12类医学影像实时分析,提升病灶检出率18.7%,采用联邦学习保障数据安全,2024年落地基层医疗。 AI产品动态# AI一体机# T-Mall# 人工智能医疗 9个月前
Meta开源SAM Audio音频分离模型:多模态提示技术重塑音频编辑行业 Meta最新开源的SAM Audio多模态音频分离模型,通过文本、视觉和时间段提示实现精准声音分离,适用于音乐制作、播客降噪等场景。本文解析其PE-AV核心技术、应用优势及开源资源,探讨AI音频处理的... AI产品动态# AI工具# Meta# SAMAudio 5个月前
谷歌Gemini 2.5 Flash图像模型发布:多模态编辑精度超越GPT-4o 15% 深度解析谷歌Gemini 2.5 Flash图像模型的技术突破:多模态编辑精度超GPT-4o 15%,支持角色一致性保持与多图像融合,商业化成本降低25%。了解AI图像生成行业最新竞争格局与应用前景。 AI产品动态# AI商业应用# AI图像生成# OpenAI竞争 9个月前
xAI免费开放Grok 4模型:技术普惠还是市场策略? 深度解析xAI免费开放Grok 4模型的战略意义:技术参数全面对比GPT-5,揭秘12小时5次的使用限制策略,探讨多模态AI发展现状及对普通用户的实际影响。 AI产品动态# AI免费模型# GPT-5竞争# Grok4 10个月前
马斯克xAI加速研发世界模型,瞄准游戏与机器人领域新突破 深度解析马斯克xAI公司世界模型技术研发进展:从人才挖角到商业化布局,探讨其在游戏生成与机器人控制领域的应用前景,分析行业竞争格局与技术挑战。 AI新闻资讯# AGI# xAI# 世界模型 7个月前
Reka AI完成1.1亿美元B轮融资,估值突破10亿美元跻身独角兽 美国AI技术公司Reka AI完成1.1亿美元B轮融资,估值突破10亿美元,由英伟达与Snowflake联合领投。该公司专注于大型语言模型及多模态AI技术研发,成为新晋AI独角兽。了解最新AI行业融资... AI新闻资讯# AI融资# RekaAI# Snowflake 10个月前
生数科技Vidu Q2生图功能重磅升级:文生图与编辑模块上线,AI创作效率革命性提升 生数科技Vidu Q2生图功能完成重大升级,新增文生图与图像编辑模块,支持5秒快速生成、批量创作与跨模态工作流。该工具在权威评测中超越GPT-5,尤其适用于电商、短剧等工业化内容生产场景,实现创作效率... AI产品动态# AIGC# AI图像生成# ViduQ2 6个月前
腾讯开源10亿参数轻量OCR模型HunyuanOCR,多项基准测试达SOTA水平 腾讯正式开源1B参数轻量OCR模型HunyuanOCR,在OmniDocBench、OCRBench等权威测试中获SOTA成绩,支持14种语言识别,适用于文档解析、视频字幕识别等场景,推动AI文本识别... AI产品动态# HunyuanOCR# OCR模型# 人工智能技术 6个月前