人工智能技术

腾讯开源10亿参数轻量OCR模型HunyuanOCR，多项基准测试达SOTA水平

腾讯正式开源1B参数轻量OCR模型HunyuanOCR，在OmniDocBench、OCRBench等权威测试中获SOTA成绩，支持14种语言识别，适用于文档解析、视频字幕识别等场景，推动AI文本识别...

7个月前

百度发布猎户座AI引擎与慧播星数字人技术，开启AI战略新阶段

百度2025年发布猎户座AI引擎和慧播星数字人技术重大突破。猎户座开放25年搜索技术积累，支持多智能体协作；慧播星数字人全球开放，双11GMV增长91%，罗永浩同款技术平台化，加速AI技术商业化落地。

AI产品动态 # AI引擎 # 人工智能技术 # 慧播星数字人

8个月前

蚂蚁数科发布多语种多模态大模型训练框架，突破小语种AI理解瓶颈

蚂蚁数科在香港金融科技节发布创新多语种多模态大模型训练框架，通过语言感知优化机制提升小语种理解能力，在主流多语言VQA基准测试中准确率提升9.5%，评测总分超越GPT-4o、Gemini等国际主流模型...

AI产品动态 # 人工智能技术 # 多模态AI # 多语种大模型

8个月前

蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer，推理速度提升10.7倍

蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer，实现10.7倍推理速度提升，支持LLaDA等主流dLLM，在HumanEval代码生成任务中达1011 tokens/秒，推动AI推理效率新...

AI产品动态 # AI开源 # dInfer # 人工智能技术

9个月前

谷歌Veo 3.1视频模型技术突破：8秒高清视频生成，实现音画同步

谷歌最新发布Veo 3.1文生视频模型实现重大技术突破，支持8秒720p高清视频生成，首次实现音画同步输出。模型在语义解析精度、视觉保真度和错误率控制方面显著提升，展现AI视频生成领域最新进展。

AI产品动态 # AI视频生成 # GoogleVids # VertexAI

9个月前

华为昇腾完成通义千问Qwen3-VL-30B-A3B多模态模型0day适配，AI生态建设迈入新阶段

华为昇腾生态完成阿里云通义千问Qwen3-VL-30B-A3B多模态模型的0day适配，实现发布即适配。该模型具备视觉代理、代码生成等能力，在昇腾平台推理效率提升40%，助力企业降低多模态AI应用门槛...

AI产品动态 # AI生态适配 # 人工智能技术 # 华为昇腾

9个月前

谷歌相册AI图生视频重磅升级：新增自定义提示词功能，视频生成精准度提升40%

谷歌相册6.48版本推出AI图生视频自定义提示词功能，用户可通过自然语言指令精准控制视频生成方向，基于Veo 3模型的技术升级使生成准确率提升40%，实现从随机创作到精准定制的跨越。

AI产品动态 # AI视频生成 # Veo模型 # 人工智能技术

9个月前

快手发布KAT系列Agentic Coding大模型，KAT-Coder以73.4%解决率创代码智能新纪录

快手发布KAT系列Agentic Coding大模型，KAT-Coder以73.4%解决率刷新代码智能纪录，KAT-Dev-32B开源模型表现优异。了解国产AI代码大模型的技术突破与国际竞争力。

AI产品动态 # AgenticCoding # AI大模型 # 人工智能技术

9个月前

快手发布可灵2.5 Turbo视频生成模型：成本降28%，动作幅度提升30%

快手正式发布可灵2.5 Turbo视频生成模型，实现动作幅度提升30%、成本降低28%的重大突破。该模型强化复杂指令理解能力，提升视觉一致性25%，为短视频创作者提供更经济高效的AIGC解决方案。

AI产品动态 # AIGC # 人工智能技术 # 可灵AI

10个月前

Luma AI发布全球首款多模态推理视频模型Ray3，支持4K HDR生成与智能修正

Luma AI推出全球首款多模态推理视频模型Ray3，支持16位HDR生成、4K输出与智能修正功能，深度集成Adobe工作流。了解其技术优势、商业应用及对AI视频行业的影响。

AI产品动态 # Adobe # AI视频生成 # LumaAI

10个月前

腾讯开源10亿参数轻量OCR模型HunyuanOCR，多项基准测试达SOTA水平

百度发布猎户座AI引擎与慧播星数字人技术，开启AI战略新阶段

蚂蚁数科发布多语种多模态大模型训练框架，突破小语种AI理解瓶颈

蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer，推理速度提升10.7倍

谷歌Veo 3.1视频模型技术突破：8秒高清视频生成，实现音画同步

华为昇腾完成通义千问Qwen3-VL-30B-A3B多模态模型0day适配，AI生态建设迈入新阶段

谷歌相册AI图生视频重磅升级：新增自定义提示词功能，视频生成精准度提升40%

快手发布KAT系列Agentic Coding大模型，KAT-Coder以73.4%解决率创代码智能新纪录

快手发布可灵2.5 Turbo视频生成模型：成本降28%，动作幅度提升30%

Luma AI发布全球首款多模态推理视频模型Ray3，支持4K HDR生成与智能修正

热门AI工具

最新资讯