近日,腾讯云自研数据分析智能体TCDataAgent在国际权威评测基准BIRD-Bench的“自然语言转SQL(NL2SQL)”全球榜单中表现卓越,以75.74分的成绩位列全球第三,创下中国团队在该领域的最佳记录。这一成绩超越了IBM、Meta等国际科技巨头,标志着国产AI技术在数据库智能分析领域的重大突破。
BIRD-Bench被业界公认为NL2SQL领域最具挑战性的评测平台,其评测标准极为严苛。系统需将自然语言问题(如“找出未通过质检的订单”)精准转换为SQL语句,并确保生成的SQL能在包含大量“脏数据”的真实企业级数据库中高效执行。此次评测覆盖金融、医疗、体育等37个行业场景,总数据量达33GB,测试题目超过1万条,全面考察系统对复杂语义的理解及数据库实操能力。
TCDataAgent的核心技术优势体现在三大创新方向:
1. 错误自动修正机制:通过数据库约束验证,可自动识别并修复SQL中的结构性或语义性错误,显著降低传统方法因语义模糊导致的误判率;
2. 数据库内容感知技术:模型深度结合数据库实际内容生成SQL,使意图识别准确率与结果可信度大幅提升;
3. 高质量训练迭代:采用后训练技术筛选最优SQL样本进行模型优化,有效增强对复杂查询的适应性。
该技术成果已获数据库领域顶级国际会议VLDB收录。实验数据显示,其核心模块可集成至其他NL2SQL系统,最高提升查询准确率18.3%。目前,TCDataAgent已作为腾讯云企业级智能分析工具开启内测,支持用户通过自然语言直接完成复杂数据查询与趋势分析,推动“零门槛”数据分析的普及。
© 版权声明
文章版权归作者所有,未经允许请勿转载。