Data Engineering Agent 运行监控指南

本文介绍如何使用 Data Engineering Agent 查看任务运行监控信息,重点覆盖运行实例、失败实例、补数任务和监控空态的解释方式。

先看什么

运行监控不只是“有没有失败”,还应该回答以下问题:

  • 最近有没有运行实例
  • 运行结果是成功、失败还是超时
  • 是否存在补数任务
  • 是否有实例可以继续查看日志、上下游或重跑入口

空监控是常见场景

在新工作空间、测试空间、仅创建草稿但未执行的空间中,运行监控可能完全为空。

常见表现:

  • 最近 24 小时无运行实例
  • 最近 30 天无运行实例
  • 无失败实例
  • 无补数任务

这类结果首先应解释为“当前没有运行历史”,而不是系统异常。

推荐检查顺序

  • 先查最近 24 小时
  • 如果为空,再查最近 30 天
  • 如果仍然为空,再判断: 当前工作空间是否只是开发空间 任务是否只创建了草稿但未执行 任务是否从未发布到调度系统

推荐提问

查看最近 24 小时:

扩大到最近 30 天:

解释空态:

有实例时继续看什么

如果监控中有实例,下一步应继续看:

  • 实例 ID
  • 任务 ID / 任务名称
  • 状态
  • 运行时间
  • 错误摘要
  • 是否可以继续查看日志
  • 是否可以继续查看上下游依赖
  • 是否存在重跑或补数入口

推荐提问:

补数任务怎么看

补数任务不是所有空间都会有。如果监控返回“无补数任务”,应理解为:

  • 当前时间范围内没有创建过补数
  • 或当前工作空间本来就没有进入补数阶段

这不代表补数能力不可用。

文档中应强调的一个事实

在实际操作中,最近 24 小时和最近 30 天都可能没有任何运行记录、失败实例和补数任务。这是正常结果,尤其在测试空间和新建空间中非常常见。

因此,运行监控文档必须覆盖“空态解释”,不能只写“有失败实例时怎么排查”。

相关文档

联系我们
预约咨询
微信咨询
电话咨询
邮件咨询