Data Engineering Agent 运行监控指南
本文介绍如何使用 Data Engineering Agent 查看任务运行监控信息,重点覆盖运行实例、失败实例、补数任务和监控空态的解释方式。
先看什么
运行监控不只是“有没有失败”,还应该回答以下问题:
- 最近有没有运行实例
- 运行结果是成功、失败还是超时
- 是否存在补数任务
- 是否有实例可以继续查看日志、上下游或重跑入口
空监控是常见场景
在新工作空间、测试空间、仅创建草稿但未执行的空间中,运行监控可能完全为空。
常见表现:
- 最近 24 小时无运行实例
- 最近 30 天无运行实例
- 无失败实例
- 无补数任务
这类结果首先应解释为“当前没有运行历史”,而不是系统异常。
推荐检查顺序
- 先查最近 24 小时
- 如果为空,再查最近 30 天
- 如果仍然为空,再判断: 当前工作空间是否只是开发空间 任务是否只创建了草稿但未执行 任务是否从未发布到调度系统
推荐提问
查看最近 24 小时:
扩大到最近 30 天:
解释空态:
有实例时继续看什么
如果监控中有实例,下一步应继续看:
- 实例 ID
- 任务 ID / 任务名称
- 状态
- 运行时间
- 错误摘要
- 是否可以继续查看日志
- 是否可以继续查看上下游依赖
- 是否存在重跑或补数入口
推荐提问:
补数任务怎么看
补数任务不是所有空间都会有。如果监控返回“无补数任务”,应理解为:
- 当前时间范围内没有创建过补数
- 或当前工作空间本来就没有进入补数阶段
这不代表补数能力不可用。
文档中应强调的一个事实
在实际操作中,最近 24 小时和最近 30 天都可能没有任何运行记录、失败实例和补数任务。这是正常结果,尤其在测试空间和新建空间中非常常见。
因此,运行监控文档必须覆盖“空态解释”,不能只写“有失败实例时怎么排查”。
相关文档
联系我们
