跳到主要内容

AI 评测

评测功能概述

"评测"功能用于验证 AskTable AI 的分析准确度与稳定性。通过创建评测集,您可以添加多条"自然语言问题 + 预期 SQL"的评测用例。系统会自动执行评测任务,将 AI 模型的输出结果与您的标准答案进行比对。系统将计算通过率,帮助您发现潜在偏差并改进模型表现。

评测首页

核心价值

  • 系统验证: 验证 AI 在复杂或关键业务问题上的准确度。
  • 效率提升: 系统自动执行评测并生成报告,无需手动比对。
  • 改进指引: 通过结果对比可快速定位出错场景,从而提升模型表现。
  • 多场景支持: 可创建多个评测集,用于不同业务场景或团队。