管理数据
数据源创建完成后,可通过数据管理页面维护其元数据和配置。完善的数据源配置能让 AI 更好地理解业务字段语义,提供更准确的分析结果。
一、连接数据 源
二、访问数据管理页面
点击左侧导航栏 【数据】>【数据源】,进入数据源列表页。

列表中每个数据源以卡片形式展示,包含:
- 名称 — 数据源的自定义名称
- ID — 系统生成的唯一标识,可点击复制
- 描述 — 数据源的业务描述
- 表/列数量 — 包含的表和字段数量
- 状态 — 绿色勾号表示同步正常,黄色圆圈表示处理中
- 更新时间 — 最后一次同步的时间
每张卡片右上角有快捷操作:
- 速查(对话图标)— 跳转到对话页面,基于该数据源直接提问
- 更多(三点图标)— 展开菜单,可删除数据源
点击卡片进入该数据源的详情页。
三、编辑基本信息
点击详情页右上角的 【编辑】 按钮,打开基本信息对话框。

可修改:
- 数据名称 — 数据源的显示名称
- 描述 — 数据源的业务描述,有助于 AI 理解数据背景
四、编辑连接配置(仅数据库类型)
对于数据库类型的数据源,点击详情页右上角的 【连接配置】 按钮,可修改连接信息。

可修改:
- 主机地址 — 数据库服务器地址
- 端口 — 数据库连接端口
- 用户名 — 数据库认证用户名
- 密码 — 留空则不修改密码
- 数据库 — 可输入多个数据库名称,用英文逗号分隔;为空表示全部数据库
修改后点击 【保存】,系统会重新测试连接并同步元数据。
五、数据概览与字段配置
数据概览是数据源详情页的默认 Tab,也是最核心的配置区域。

5.1 页面结构
- 左侧树形导航 — 按 schema → 表的层级组织,点击表名在右侧查看其字段
- 右侧字段表格 — 展示选中表的所有字段及其配置
5.2 表描述
表名右侧的编辑图标可修改该表的业务描述,帮助 AI 理解该表的用途。
5.3 字段配置
字段表格包含以下列:
| 列 | 说明 |
|---|---|
| 列名 | 数据库中的原始字段名 |
| 备注 | 字段的业务含义描述。左侧图标标识来源:数据库图标(来自数据库原始备注)、机器人图标(AI 自动生成)、编辑图标(人工编辑)。点击编辑图标可修改 |
| 数据类型 | 字段的数据类型(NUMERIC、STRING、DATETIME 等) |
| 隐藏 | 开关。隐藏后,AI 识别时会忽略该字段,适用于密码、内部 ID 等敏感或无关字段 |
| AI 索引 | 开关。开启后 AI 会为该字段生成语义索引,提高自然语言查询的命中率。绿色勾号表示索引已就绪 |
| 脱敏加密 | 下拉选择。对包含隐私数据的字段进行脱敏,如手机号、身份证号等 |
| 更新时间 | 该字段配置最后修改的时间 |
5.4 重新选择数据表
数据库类型的数据源,在数据概览页右上角有 【重新选表】 按钮,可增删需要同步的数据表。
5.5 元数据导入/导出
点击数据概览页右上角的 ··· 菜单,支持:
- 导出元数据 — 将表描述、字段备注、训练数据等配置导出为 JSON 文件
- 导入元数据 — 导入 JSON 文件,覆盖表描述和字段备注,追加训练数据
六、文件管理(仅文件类型)
Excel/CSV 类型的数据源,详情页会有 【文件管理】 Tab。

- 文件列表 — 显示已上传的文件,支持预览、下载、删除
- 上传新文件 — 拖拽或点击上传
.xlsx、.xls、.csv文件,支持同时上传多个
七、训练数据
训练数据 Tab 用于管理该数据源专属的训练集。

每条训练数据包含:
- 用户问题 — 自然语言问题
- 正确 SQL — 对应的正确 SQL 语句(可选)
- 来源 — 手动添加或从对话中收集
- 是否启用 — 开关控制该条训练数据是否生效
训练数据可以帮助 AI 学习特定的查询模式和业务术语,提升回答准确度。详见 训练集文档。
八、评测集
评测集 Tab 用于验证 AI 对该数据源的分析准确度。

点击 【创建评测集】,添加"自然语言问题 + 预期 SQL"的评测用例,批量验证 AI 的分析准确度。详见 评测文档。
九、删除数据源
点击详情页右上 角的 ··· 菜单,选择 【删除数据】,确认后该数据源及其所有配置将被永久删除。