评测报告
评测报告概览了历史任务的执行情况和整体成功率。
1. 进入报告页面
- 点击评测集详情页右上角的 【查看报告】 按钮,或在评测详情页点击面包屑导航中的 【评测报告】。
2. 报告核心指标
报告列表页显示了历次评测任务的概况:

| 任务字段 | 描述 | 示例 |
|---|---|---|
| ID | 评测任务的唯一标识符(例如:ata_task_2BbOK...)。 | ata_task_15GHTH3Q... |
| 评测类型 | 本次评测所使用的 AI 模型配置。 | 默认模型 |
| 状态 | 任务是否已完成。 | 已完成 |
| 评测用例数量 | 本次任务运行的用例总数。 | 2 |
| 评测用时(秒) | 任务总耗时。 | 7 |
| 成功率 | 本次任务的最终准确率。 | 50% |
3. 查看详情
点击任务 ID(如 ata_task_15GHTH3Q...),即可进入该任务的评测详情页面,查看每个用例的具体比对结果。