百度健康发布行业首款可控AI创作平台Dr.Flow,医疗内容创作效率提升60倍
百度健康发布行业首款可控AI创作平台Dr.Flow,整合选题、脚本生成、合规审核及视频制作全流程,单条视频制作时间从10小时缩短至10分钟,内置超150万医学素材,助力健康从业者高效生产权威内容并实现...
盛数科技Vidu视频大模型全球内测:一键生成产品广告成片,AI视频商业化加速
盛数科技Vidu视频大模型全球内测上线,核心功能一键生成可直接投放的产品广告成片,基于Vidu Q2模型实现多主体一致性控制与高清音画同步,平均生成时间3分钟内,助力电商、美妆等行业降低70%制作成本...
阶跃星辰发布Step-GUI系列AI Agent,开启图形界面智能体规模化应用时代
阶跃星辰发布Step-GUI系列AI Agent,实现图形界面智能体规模化应用。技术包含云端模型、端侧开源模型及MCP协议,支持200+应用,10分钟手机部署,已与荣耀、OPPO等厂商合作,推动终端设...
微信输入法iOS版3.0重磅更新:全面重构大模型,支持15种方言语音输入
微信输入法iOS版3.0正式上线,通过全面重构底层大模型,实现语音识别准确率与速度双提升。新版本突破性支持15种方言输入,取消时长限制,新增离线模式,严格遵循隐私保护原则。探索微信输入法如何借助AI技...
小米发布开源大模型MiMo-V2-Flash:3090亿参数、代码能力全球Top2,加速AGI生态布局
小米正式发布开源大模型MiMo-V2-Flash,采用混合专家架构,总参数量达3090亿,代码能力位列全球开源模型Top2。模型通过KV缓存压缩和并行Token验证技术,推理速度提升2.6倍,定价每百...
腾讯混元世界模型1.5正式开源:国内首个实时交互式3D世界建模技术突破
腾讯混元世界模型1.5正式开源,实现文本或图片输入实时生成可自由探索的3D交互场景,具备24FPS高清视频流、几何一致性及多视角交互能力,为AI内容生成与具身智能研究提供全链路技术基础设施。
谷歌发布Gemini 3 Flash模型:成本仅Pro版1/4,速度提升3倍,成AI市场新标杆
谷歌推出Gemini 3 Flash模型,以Pro版1/4的成本实现3倍运行速度,在MMMU-Pro基准测试中超越GPT-5.2。该模型已集成至Gemini应用与谷歌搜索,标志AI竞赛进入白热化阶段...
OpenAI宣布ChatGPT深度集成Apple Music,自然语言指令实现个性化音乐推荐
OpenAI宣布ChatGPT与Apple Music深度集成,用户可通过自然语言指令实现个性化音乐推荐与播放控制。本文解读该功能的技术实现、行业影响及ChatGPT应用生态扩展趋势。
AI视野:每日AI资讯速递 | 2025-12-17
专业AI资讯平台,追踪人工智能发展前沿,每日精选AI领域重要新闻、技术突破和商业应用,让您快速了解全球AI最新动态与发展方向 | AI视野(www.ai4yes.com)
Databricks完成超40亿美元L轮融资,估值达1340亿美元,加速AI与数据分析业务扩张
Databricks完成超40亿美元L轮融资,估值达1340亿美元,年度经常性收入增长至48亿美元。本文详解其融资背景、业务进展及AI战略布局,为企业与投资者提供前沿行业洞察。