Data Engineering Agent 常见误区
本文整理使用 Data Engineering Agent 时最常见的误区,重点解释"看起来像完成了,但实际还没有完成"的场景。
误区 1:创建草稿等于已经运行
创建 Studio 草稿任务只会把对象和代码保存到任务树或 IDE 中,不会自动执行 SQL,也不会自动创建目标表。草稿、运行、发布是三个独立阶段:草稿表示元数据已创建,运行表示代码真正执行,发布表示进入调度系统。
误区 2:保存调度等于已经发布
保存调度配置只会把 Cron、重试、超时、依赖等参数写入任务元数据,不等于任务已经进入调度系统。只有执行发布操作后,任务才会按周期触发。
误区 3:组合任务创建成功等于节点依赖已落好
组合任务或 Flow 对象创建成功,只说明容器对象创建了。还需要继续确认节点是否存在、DAG 是否为空、依赖边是否连上、节点内容是否真的写入到了该组合任务内部。应在 Studio 画布中实际复核 DAG,不能只看 Agent 的口头返回。
误区 4:监控页为空等于系统异常
监控为空通常表示最近时间范围内没有运行实例,或当前工作空间只是开发或测试空间,或任务从未发布或执行。应先扩大时间范围,再确认任务是否有运行历史,不要直接判断为系统异常。
误区 5:DQC 创建成功等于规则已经执行
创建 DQC 规则只表示治理规则元数据已创建,不代表规则已经被触发执行。尤其当触发方式是
REST 手动触发时,不能把"已创建规则"理解为"已完成校验"。
误区 6:Agent 能查到对象等于 Agent 一定能删除对象
有些对象可以查询,但删除不一定有对应 API 能力。实际操作中,Agent 可能能够确认对象状态,但仍需要用户在 Studio 界面里手动删除。遇到这种情况,先问清楚 Agent 能不能直接删除;如果不能,让 Agent 先帮你确认影响范围,再在界面中操作。
误区 7:元数据变更不算变更
创建草稿任务、创建组合任务、创建 DQC 规则、保存调度配置,虽然不一定写业务表数据,但都会改变 Studio 或治理元数据,因此仍应复核结果——检查对象是否创建在正确目录、规则和配置是否落对、DAG 是否符合预期。
相关文档
联系我们
