跳到主要内容

管理数据

数据源创建完成后,可通过数据管理页面维护其元数据和配置。完善的数据源配置能让 AI 更好地理解业务字段语义,提供更准确的分析结果。

一、连接数据源

二、访问数据管理页面

点击左侧导航栏 【数据】>【数据源】,进入数据源列表页。

数据源列表页

列表中每个数据源以卡片形式展示,包含:

  • 名称 — 数据源的自定义名称
  • ID — 系统生成的唯一标识,可点击复制
  • 描述 — 数据源的业务描述
  • 表/列数量 — 包含的表和字段数量
  • 状态 — 绿色勾号表示同步正常,黄色圆圈表示处理中
  • 更新时间 — 最后一次同步的时间

每张卡片右上角有快捷操作:

  • 速查(对话图标)— 跳转到对话页面,基于该数据源直接提问
  • 更多(三点图标)— 展开菜单,可删除数据源

点击卡片进入该数据源的详情页

三、编辑基本信息

点击详情页右上角的 【编辑】 按钮,打开基本信息对话框。

编辑基本信息

可修改:

  • 数据名称 — 数据源的显示名称
  • 描述 — 数据源的业务描述,有助于 AI 理解数据背景

四、编辑连接配置(仅数据库类型)

对于数据库类型的数据源,点击详情页右上角的 【连接配置】 按钮,可修改连接信息。

编辑连接配置

可修改:

  • 主机地址 — 数据库服务器地址
  • 端口 — 数据库连接端口
  • 用户名 — 数据库认证用户名
  • 密码 — 留空则不修改密码
  • 数据库 — 可输入多个数据库名称,用英文逗号分隔;为空表示全部数据库

修改后点击 【保存】,系统会重新测试连接并同步元数据。

五、数据概览与字段配置

数据概览是数据源详情页的默认 Tab,也是最核心的配置区域

数据概览页

5.1 页面结构

  • 左侧树形导航 — 按 schema → 表的层级组织,点击表名在右侧查看其字段
  • 右侧字段表格 — 展示选中表的所有字段及其配置

5.2 表描述

表名右侧的编辑图标可修改该表的业务描述,帮助 AI 理解该表的用途。

5.3 字段配置

字段表格包含以下列:

说明
列名数据库中的原始字段名
备注字段的业务含义描述。左侧图标标识来源:数据库图标(来自数据库原始备注)、机器人图标(AI 自动生成)、编辑图标(人工编辑)。点击编辑图标可修改
数据类型字段的数据类型(NUMERIC、STRING、DATETIME 等)
隐藏开关。隐藏后,AI 识别时会忽略该字段,适用于密码、内部 ID 等敏感或无关字段
AI 索引开关。开启后 AI 会为该字段生成语义索引,提高自然语言查询的命中率。绿色勾号表示索引已就绪
脱敏加密下拉选择。对包含隐私数据的字段进行脱敏,如手机号、身份证号等
更新时间该字段配置最后修改的时间

5.4 重新选择数据表

数据库类型的数据源,在数据概览页右上角有 【重新选表】 按钮,可增删需要同步的数据表。

5.5 元数据导入/导出

点击数据概览页右上角的 ··· 菜单,支持:

  • 导出元数据 — 将表描述、字段备注、训练数据等配置导出为 JSON 文件
  • 导入元数据 — 导入 JSON 文件,覆盖表描述和字段备注,追加训练数据

六、文件管理(仅文件类型)

Excel/CSV 类型的数据源,详情页会有 【文件管理】 Tab。

文件管理
  • 文件列表 — 显示已上传的文件,支持预览、下载、删除
  • 上传新文件 — 拖拽或点击上传 .xlsx.xls.csv 文件,支持同时上传多个

七、训练数据

训练数据 Tab 用于管理该数据源专属的训练集。

训练数据

每条训练数据包含:

  • 用户问题 — 自然语言问题
  • 正确 SQL — 对应的正确 SQL 语句(可选)
  • 来源 — 手动添加或从对话中收集
  • 是否启用 — 开关控制该条训练数据是否生效

训练数据可以帮助 AI 学习特定的查询模式和业务术语,提升回答准确度。详见 训练集文档

八、评测集

评测集 Tab 用于验证 AI 对该数据源的分析准确度。

评测集

点击 【创建评测集】,添加"自然语言问题 + 预期 SQL"的评测用例,批量验证 AI 的分析准确度。详见 评测文档

九、删除数据源

点击详情页右上角的 ··· 菜单,选择 【删除数据】,确认后该数据源及其所有配置将被永久删除。

后续步骤