跳到主要内容

创建评测用例

评测用例是进行 AI 准确度比对的基本单元,包含一个自然语言问题和正确的预期 SQL。

1. 启动用例创建

  1. 在评测集详情页(如:评测集A),点击右上角的 【+ 创建评测用例】 按钮。
评测集详情页

2. 填写用例信息

"创建评测用例" 对话框中,定义您的测试场景:

创建评测用例对话框
字段描述示例
选择角色 (可选)如果您的 AI 具备多角色模式,可在此选择。无角色
问题 (*)输入一个清晰的自然语言问题。"卖的最好的 10 个商品是哪些?"
预期 SQL (*)输入针对上述问题的标准、正确的 SQL 查询语句SELECT p.product_name, SUM('d.quantity') ... LIMIT 10

3. 智能生成与辅助

  • 生成 SQL: 输入问题后,点击 【生成 SQL】。系统会根据数据源结构自动填充"预期 SQL"内容,方便您核对和优化。
  • 撤销生成: 如果自动生成结果不理想,您可以点击 【撤销生成】

4. 完成创建

点击 【创建】 按钮。用例将添加到评测集列表中,例如添加了"卖的最好的 10 个商品是哪些?"和"不止关注一次的客户有哪些?"两个用例。

评测用例列表