Claude桌面版正式发布:新增智能截图与语音交互,性能提升40% 2025年10月22日Anthropic正式发布Claude桌面版,新增智能截图识别和Caps Lock语音输入功能,内存占用降低40%,响应延迟减少62%,支持macOS/Windows跨平台使用... AI产品动态# AI性能优化# AI桌面应用# Anthropic 2周前
DeepSeek-OCR开源:30亿参数OCR模型实现长文本处理突破,97%识别精度引领多模态AI新范式 DeepSeek团队开源30亿参数OCR模型DeepSeek-OCR,采用创新光学压缩技术实现97%识别精度。该模型在长文本处理、多分辨率输入方面表现卓越,为金融、医疗、出版行业提供高效数字化解决方案... AI产品动态# AI开源模型# DeepSeek-OCR# OCR技术 2周前
阿里通义千问开源Qwen3-VL视觉理解模型,4B/8B双版本实现多模态突破 阿里通义千问正式开源Qwen3-VL系列视觉理解模型,4B与8B版本通过密集架构实现显存优化,在STEM问答、VQA、OCR等任务中综合性能领先竞品,支持端侧实时AI应用,推动国产多模态模型小型化技术... AI产品动态# AI部署# Qwen3-VL# 具身智能 3周前
Google NotebookLM视频功能重磅升级:集成Gemini Nano Banana技术实现文档自动转视频 Google NotebookLM集成Gemini Nano Banana技术实现文档自动转视频功能升级,提供水彩、纸艺等6种视觉风格和Brief/Explainer双格式,面向教育课件、企业报告等场... AI产品动态# AI技术升级# AI视频生成# GeminiNanoBanana 3周前
微软发布自研图像生成模型MAI-Image-1,LMArena榜单跻身前十 微软正式推出首款完全自研图像生成模型MAI-Image-1,在LMArena文生图排行榜中跻身前十。该模型在真实感光影处理、生成速度等方面表现优异,将集成至Copilot和Bing Image Cre... AI产品动态# LMArena# MAI-Image-1# 图像生成模型 3周前
中国AI技术周报:腾讯混元图像3.0全球夺冠,快手可灵2.5Turbo领跑视频生成 2025年10月最新AI技术动态:腾讯混元图像3.0在国际评测中获全球文生图模型综合第一,快手可灵2.5Turbo在视频生成双赛道登顶。全球大模型形成技术梯队,AI产业化在政务、医疗等领域加速落地,市... AI新闻资讯# AI产业化# AI技术# 人工智能 3周前
谷歌Gemini 3.0震撼发布:AI直接生成完整网页游戏,前端开发迎来革命 谷歌Gemini 3.0旗舰AI模型10月22日发布,突破性实现自然语言直接生成完整网页和游戏,采用万亿参数混合专家系统,在专业基准测试中超越主流竞品,将彻底改变前端开发工作流程。 AI产品动态# AI模型# Gemini3.0# 人工智能 3周前
马斯克xAI加速研发世界模型,瞄准游戏与机器人领域新突破 深度解析马斯克xAI公司世界模型技术研发进展:从人才挖角到商业化布局,探讨其在游戏生成与机器人控制领域的应用前景,分析行业竞争格局与技术挑战。 AI新闻资讯# AGI# xAI# 世界模型 3周前
Elastic收购Jina AI:开启多模态AI搜索新纪元,向量搜索技术迎来重大突破 Elastic完成对Jina AI战略收购,深度整合向量搜索与多模态AI技术。Jina AI核心模型将融入Elastic搜索平台,提升多语言文档和视觉文档检索效率,为企业提供更智能的搜索解决方案。 AI新闻资讯# AI搜索# Elastic# JinaAI 4周前
腾讯混元图像3.0登顶全球文生图榜首,元宝App可一键生成专业级图像 腾讯混元图像3.0登顶全球文生图榜单第一,正式登陆元宝App。这款800亿参数开源模型支持2048×2048超高分辨率,可实现表情包、人像写真等专业级图像生成,已助力电商、游戏行业提升80%开发效率。 AI产品动态# AI商业化# AI图像生成# 元宝App 4周前