跳到主要内容

评测报告

评测报告概览了历史任务的执行情况和整体成功率。

1. 进入报告页面

  1. 点击评测集详情页右上角的 【查看报告】 按钮,或在评测详情页点击面包屑导航中的 【评测报告】

2. 报告核心指标

报告列表页显示了历次评测任务的概况:

评测报告列表
任务字段描述示例
ID评测任务的唯一标识符(例如:ata_task_2BbOK...)。ata_task_15GHTH3Q...
评测类型本次评测所使用的 AI 模型配置。默认模型
状态任务是否已完成。已完成
评测用例数量本次任务运行的用例总数。2
评测用时(秒)任务总耗时。7
成功率本次任务的最终准确率。50%

3. 查看详情

点击任务 ID(如 ata_task_15GHTH3Q...),即可进入该任务的评测详情页面,查看每个用例的具体比对结果。