硅基流动发布DeepSeek-V3.1大模型:混合推理架构与160K上下文窗口实现突破 硅基流动DeepSeek-V3.1大模型正式上线:6710亿参数、160K超长上下文支持,混合推理架构显著提升效率,在SWE编程基准和复杂推理任务中突破性能纪录,API服务性价比领先。 AI产品动态# AI技术# DeepSeek-V3.1# 人工智能 5个月前
xAI开源Grok 2.5大模型:代码/数据全面开放,同步预告Grok 3突破性能力 xAI正式开源Grok 2.5大模型,提供500GB数据与42个模块,商业授权限年收入百万美元以下企业。详解Grok 3的百万级文本处理、电池故障预测能力,及移动端多模态功能升级,洞察AI开源战略与竞... AI产品动态# AI开源# Grok# xAI 5个月前
谷歌Gemini大模型能耗报告发布:文本生成单次仅0.24瓦时,Gemma 3轻量版同步亮相 谷歌发布Gemini大模型能耗报告:文本生成单次仅耗电0.24瓦时,同步推出轻量级Gemma 3 270M模型。深度解析其Transformer架构优化、40%能耗降低技术,及在移动端多模态处理场景的... AI产品动态# AI能耗# Gemma3# Transformer架构 5个月前
Character.AI以超10亿美元估值寻求融资 年化收入预计达5000万美元 Character.AI以超10亿美元估值启动融资,采用谷歌技术授权与独立运营混合模式。平台月活2.33亿,年收入预计5000万美元,揭示AI角色扮演赛道商业化与资本合作新范式。 AI新闻资讯# AI商业化# AI融资# Character.AI 5个月前
阿里巴巴启动千人AI人才招聘计划,加速多模态AI生态布局 阿里巴巴集团启动近年最大规模AI人才招聘,释放30-60万年薪岗位,覆盖大模型、多模态识别及智能硬件研发,揭示其加速AI应用落地的战略转型。了解头部企业AI人才竞争趋势与职业机会。 AI新闻资讯# AI招聘# 人工智能# 多模态AI 6个月前
360智脑发布Light-IF系列AI模型,突破复杂指令遵循性能瓶颈 360智脑发布革命性Light-IF系列AI模型,采用创新框架解决大语言模型指令遵循难题。全系模型32B至1.7B参数规格即将开源,性能超越同类产品,提供完整技术路线图与评估工具,推动AI行业发展。 AI产品动态# 360智脑# AI# Light-IF 6个月前
苹果突破性MTP技术:大语言模型响应速度提升5倍 苹果最新MTP技术通过并行token预测使大语言模型响应速度提升5倍,采用动态验证机制保障输出质量,为移动端AI交互提供突破性解决方案。 AI新闻资讯# AI加速# MTP技术# 大语言模型 6个月前
腾讯推出智能问答框架WeKnora,助力企业级文档问答场景 腾讯推出智能问答框架WeKnora,集成OCR与跨模态建模技术,支持多模态文档解析与语义检索。提供私有化部署方案,适用于金融、法律等高敏感场景,助力企业知识管理智能化。 AI产品动态# WeKnora# 企业级应用# 大语言模型 6个月前
香港浸会大学SatImp方法突破大语言模型知识管理难题 香港浸会大学SatImp技术通过三阶段干预注意力头实现LLM知识精准控制,有效解决灾难性遗忘与隐私合规问题,相关代码已开源并加速敏感领域应用落地。 AI新闻资讯# AI伦理# 人工智能# 大语言模型 6个月前
Anthropic突破性AI技术:人格向量精准调控大模型性格特征 深度解析Anthropic人格向量技术原理:通过高维向量空间定位谄媚/激进等特征神经元集群,采用动态抑制算法实现AI行为精准调控,Claude模型有害请求拒绝率提升40%。 AI新闻资讯# AI安全# Anthropic# 人工智能 6个月前