蚂蚁集团推出AGI多模态应用“灵光”,开启视觉交互新纪元

蚂蚁集团近日宣布即将推出全新AGI多模态应用“灵光”,目前已在腾讯应用宝、vivo应用商店等平台上线并开启邀约内测。该应用由支付宝(杭州)数字服务技术有限公司开发,用户可通过手机号或支付宝账号直接登录。

“灵光”的核心功能“AGI相机”引发行业广泛关注。该功能通过AI能力识别并理解现实世界,不仅限于简单的图片识别,更强调认知层面的理解和生成能力。行业分析认为,其功能可能与元宝App、豆包App的图片识别功能类似,但“灵光”在多模态推理和场景分析方面更具优势。

蚂蚁集团在多模态AI技术领域早有布局。今年4月,其发布的模型首次实现图像理解与生成的统一;5月推出的Ming-Lite-omni-Preview版本,在模态支持能力上可媲美GPT-4o,进一步整合了语音和图像的生成与理解。这些技术积累为“灵光”的发布奠定基础。此外,蚂蚁集团近期在招聘平台大量招募“多模态理解与生成算法”专家,显示出对该技术的持续投入。

作为蚂蚁集团“AI First”战略的重要落地形式,“灵光”是继支小宝、安诊儿、AQ后的第四款AI独立APP。分析指出,依托支付宝庞大的用户基础和支付数据,“灵光”有望在信息处理和视觉交互领域占据领先地位,并可能在未来三年为蚂蚁集团带来可观的增量收入。

随着“灵光”的推出,蚂蚁集团在人工智能领域的布局更加完善。该应用的发布不仅预示着多模态AI应用新一轮竞争的开始,也标志着蚂蚁集团在AGI赛道的重要进展。未来,随着技术不断成熟,“灵光”或将在更多应用场景中展现其智能识别能力。

© 版权声明

相关文章