多模态AI

xAI推出Grok iOS应用“Imagine”功能：支持带音频的视频生成，实现多风格电影级创作

xAI推出Grok iOS应用“Imagine”功能，支持带音频的视频生成与多风格电影级内容创作。基于Grok 4混合专家架构，实现多模态实时转化、无限滚动生成及物理引擎集成，加速AI在创意产业的渗透...

10个月前

OpenAI推出GPT-5 Thinking功能并研发儿童版，AI技术进入深度优化新阶段

OpenAI推出GPT-5 Thinking功能，响应速度提升40%，支持代码生成与实时调试。同步研发儿童版AI，布局教育细分市场。了解GPT-5技术优势、应用场景及行业竞争态势。

AI产品动态 # AI儿童版 # AI商业化 # ChatGPT

8个月前

T-Mall发布“天算”医疗AI一体机，多模态诊断准确率超副主任医师水平

T-Mall发布国内首款获批多模态AI诊断一体机，集成千亿参数模型，支持12类医学影像实时分析，提升病灶检出率18.7%，采用联邦学习保障数据安全，2024年落地基层医疗。

AI产品动态 # AI一体机 # T-Mall # 人工智能医疗

9个月前

Meta开源SAM Audio音频分离模型：多模态提示技术重塑音频编辑行业

Meta最新开源的SAM Audio多模态音频分离模型，通过文本、视觉和时间段提示实现精准声音分离，适用于音乐制作、播客降噪等场景。本文解析其PE-AV核心技术、应用优势及开源资源，探讨AI音频处理的...

AI产品动态 # AI工具 # Meta # SAMAudio

5个月前

谷歌Gemini 2.5 Flash图像模型发布：多模态编辑精度超越GPT-4o 15%

深度解析谷歌Gemini 2.5 Flash图像模型的技术突破：多模态编辑精度超GPT-4o 15%，支持角色一致性保持与多图像融合，商业化成本降低25%。了解AI图像生成行业最新竞争格局与应用前景。

AI产品动态 # AI商业应用 # AI图像生成 # OpenAI竞争

9个月前

xAI免费开放Grok 4模型：技术普惠还是市场策略？

深度解析xAI免费开放Grok 4模型的战略意义：技术参数全面对比GPT-5，揭秘12小时5次的使用限制策略，探讨多模态AI发展现状及对普通用户的实际影响。

AI产品动态 # AI免费模型 # GPT-5竞争 # Grok4

10个月前

马斯克xAI加速研发世界模型，瞄准游戏与机器人领域新突破

深度解析马斯克xAI公司世界模型技术研发进展：从人才挖角到商业化布局，探讨其在游戏生成与机器人控制领域的应用前景，分析行业竞争格局与技术挑战。

AI新闻资讯 # AGI # xAI # 世界模型

7个月前

Reka AI完成1.1亿美元B轮融资，估值突破10亿美元跻身独角兽

美国AI技术公司Reka AI完成1.1亿美元B轮融资，估值突破10亿美元，由英伟达与Snowflake联合领投。该公司专注于大型语言模型及多模态AI技术研发，成为新晋AI独角兽。了解最新AI行业融资...

AI新闻资讯 # AI融资 # RekaAI # Snowflake

10个月前

生数科技Vidu Q2生图功能重磅升级：文生图与编辑模块上线，AI创作效率革命性提升

生数科技Vidu Q2生图功能完成重大升级，新增文生图与图像编辑模块，支持5秒快速生成、批量创作与跨模态工作流。该工具在权威评测中超越GPT-5，尤其适用于电商、短剧等工业化内容生产场景，实现创作效率...

AI产品动态 # AIGC # AI图像生成 # ViduQ2

6个月前

腾讯开源10亿参数轻量OCR模型HunyuanOCR，多项基准测试达SOTA水平

腾讯正式开源1B参数轻量OCR模型HunyuanOCR，在OmniDocBench、OCRBench等权威测试中获SOTA成绩，支持14种语言识别，适用于文档解析、视频字幕识别等场景，推动AI文本识别...

AI产品动态 # HunyuanOCR # OCR模型 # 人工智能技术

6个月前

xAI推出Grok iOS应用“Imagine”功能：支持带音频的视频生成，实现多风格电影级创作

OpenAI推出GPT-5 Thinking功能并研发儿童版，AI技术进入深度优化新阶段

T-Mall发布“天算”医疗AI一体机，多模态诊断准确率超副主任医师水平

Meta开源SAM Audio音频分离模型：多模态提示技术重塑音频编辑行业

谷歌Gemini 2.5 Flash图像模型发布：多模态编辑精度超越GPT-4o 15%

xAI免费开放Grok 4模型：技术普惠还是市场策略？

马斯克xAI加速研发世界模型，瞄准游戏与机器人领域新突破

Reka AI完成1.1亿美元B轮融资，估值突破10亿美元跻身独角兽

生数科技Vidu Q2生图功能重磅升级：文生图与编辑模块上线，AI创作效率革命性提升

腾讯开源10亿参数轻量OCR模型HunyuanOCR，多项基准测试达SOTA水平

热门AI工具

最新资讯