Data Engineering Agent 常用提问模板

本文提供 Data Engineering Agent 的常用提问模板。你可以直接复制模板,把表名、任务名、字段名、任务目录和时间范围替换成自己的业务对象。涉及调度发布、重跑补数、数据质量规则创建、数据源同步等变更类操作时,应先让 Agent 输出影响范围并请求确认。

完整执行类提问通常包含六类信息:

  • 目标:要查询、建模、创建任务、配置调度、发布、诊断还是治理
  • 对象:涉及哪个 catalog、schema、表、任务、任务组或作业实例
  • 位置:创建 Studio 任务时,明确已有任务目录或文件夹
  • 范围:时间范围、分区范围、业务过滤条件、是否包含历史数据
  • 产出:只要方案、只创建草稿、直接查询、创建目标表、发布调度还是返回诊断报告
  • 约束:是否允许执行查询、是否允许建表写入、是否允许发布、是否需要先确认

但这并不意味着所有用户都需要一开始就把这些信息一次说全。

更自然的方式通常是:

  • 先用探索性问题确认对象和范围
  • 再用完整执行类问题推动任务真正落地

先探索,再执行

下面这些问题更适合作为第一句,用来帮助 Agent 把问题提清楚。

探索当前环境和对象

探索某个需求该从哪里开始

探索任务是否可复用

探索当前任务还缺什么

探索最近一次运行情况

先确认 Agent 能做什么

适合第一次进入 Data Engineering Agent,或者不确定当前环境开放了哪些工具和权限时使用。

如果要确认当前上下文:

临时取数

适合快速确认一个数据结果,不需要沉淀为周期任务。

示例:

解释表结构和字段含义

适合接手陌生表,或者字段名相似、容易误用的场景。

如果你已经知道业务口径,可以补充:

指标规范设计

适合在建模和开发前统一业务口径,避免后续任务、看板和分析结果口径不一致。

如果业务口径容易混淆,可以追问:

创建 SQL 草稿任务

适合把一段查询或转换逻辑沉淀为 Studio 任务,但暂时不发布。

创建任务时要明确任务目录,不要让 Agent 自行猜测目录。如果目标目录尚未创建,建议先在 Studio 任务树中创建目录,再让 Agent 创建任务草稿。

示例:

如果只是测试功能,可以使用临时目录和更保守的约束:

复核草稿任务

适合任务创建后,检查 Agent 生成的 SQL 是否符合预期。

如果要让 Agent 帮你解释 SQL:

创建分层数据管道草稿

适合让 Agent 先生成数仓分层方案,再创建多个任务草稿。

示例:

创建组合任务

适合需要创建多节点任务、查看画布结构或验证任务组相关能力的场景。

如果你要创建的是组合任务本身:

如果你希望这个对象作为任务组处理,应说清楚:

如果你要的是在组合任务中新增节点并绑定依赖,应明确要求复核画布:

复核组合任务和 DAG

适合组合任务或 Flow 创建后,确认节点和依赖是否真的落到画布中。

如果你怀疑 Agent 只创建了对象,但没有真正落图:

从指标到数仓建设

适合已经完成指标口径设计,需要把指标沉淀为 Silver / Gold 或 DWD / DWS 任务链路的场景。

如果方案确认后需要生成 SQL:

如果需要创建 Studio 草稿任务:

配置调度和依赖

适合草稿任务已经检查通过,需要进入周期运行前的配置阶段。该类操作会修改任务配置或发布状态,应先确认影响范围。

示例:

如果只想保存调度配置、不想进入调度系统,应明确说明:

保存配置后,建议继续确认:

发布前检查

适合任务即将上线前,让 Agent 帮助做最后检查。

如果是数据产出任务,可以补充:

发布前应单独确认调度影响:

确认发布时使用:

如果只是验证调度流程,可以补充:

查看任务状态和运行历史

适合确认任务是否已发布、是否运行过、是否有下一次计划运行。

如果只想确认调度状态:

取消发布和清理测试任务

适合任务已经发布,但需要停止后续计划触发或清理测试产物。

取消发布前先确认影响:

确认取消发布:

清理测试任务前:

清理测试任务时建议在界面中完成删除,并确认:

复核 VCluster 和运行影响

适合调度发布前确认任务实际使用的计算集群和运行影响。

如果 Agent 前后返回的 VCluster 不一致,可以追问:

如果 SQL 是只读查询,也建议确认:

运维诊断

适合任务失败、超时、结果为空或产出异常时使用。

如果不知道具体实例,可以先问:

如果已经有运行实例和执行实例,可以直接诊断:

重跑前建议先问:

数据质量规则建议

适合上线前或数据异常排查时使用。建议先让 Agent 输出规则建议;创建、修改或删除规则前,应确认规则类型、阻塞行为和影响范围。

如果确认要创建规则,可以继续:

如果你要先查询现有规则:

如果你要创建一个低风险测试规则:

如果你要删除测试规则并确认清理结果:

运行监控和空态解释

适合想知道“为什么监控页没有数据”或想先确认是否真的有实例可诊断的场景。

如果最近 24 小时为空:

如果想判断空态是不是正常:

数据源和同步排查

适合数据接入、同步延迟或同步失败场景。数据源创建、同步任务创建和同步配置修改属于变更类操作,应先输出方案并请求确认。

创建同步任务前可以问:

MCP、CLI 和 SDK 配置查看

适合排查外部工具连接、自动化集成或本地开发环境配置问题。

如果要准备接入方案:

高影响操作确认

删除、下线、补数、重跑、修改依赖、修改调度周期前,建议使用更严格的确认模板。删除类操作是否可由 Agent 直接完成,取决于当前工具开放范围;如果 Agent 不能直接删除,应在界面中手动操作。

确认后再说:

相关文档

联系我们
预约咨询
微信咨询
电话咨询
邮件咨询