Skip to content

功能教程:自动化交付任务中心

在资源发现池完成硬件规划并下发任务后,自动化交付任务中心将接管所有的装机流程。本模块是 hrnrOS 的“流水线车间”,您可以在这里全局掌控所有批次任务的流转进度,并深入节点对异常设备进行精准排障与强行干预。

1. 任务大盘与状态概览

进入 [自动化交付任务中心] 页面,您将看到所有已创建的装机任务批次。系统提供了高度直观的资产统计矩阵,帮助您一眼看清任务大盘:

  • 设备状态统计矩阵: 每一行任务都会实时展示该批次下资产的数字面板:

    • 总: 该批次包含的物理机总数。
    • 处理中: 正在跑流水线的机器数量。
    • 成功: 已经完成所有步骤,正式交付的机器。
    • 失败: 在某个环节遭遇报错,流程中断的机器。
  • 全局状态徽章:

    状态标签说明
    执行中批次内至少有一台设备仍在执行流水线。
    全部成功批次内所有物理机均完美走完全部节点。
    部分失败任务已结束,部分机器交付成功,但有机器因报错而滞留。
    全部失败批次内所有机器均交付失败。

任务列表概览


2. 细粒度流水线监控

对于正在执行或存在异常的任务,点击列表右侧的 监控流水线” 按钮,即可打开高频轮询的详情弹窗。

系统将装机过程解构为 8 个标准动作节点(视您在向导中的勾选项动态显示):

  1. BMC 注入 → 2. 带外验证 → 3. 硬件压测 → 4. 阵列配置 → 5. 系统安装 → 6. 集成探针 → 7. 连通检测 → 8. 交付入库

如何阅读进度指示器:

  • ● 灰色圆点: 尚未执行,正在等待前置任务。
  • ● 蓝色圆点: 当前正在激烈执行中的节点。
  • ● 绿色圆点: 已经顺利通过的节点。
  • ● 红色圆点: 发生致命报错,任务在此节点中断。

流水线监控弹窗


⚠️ 核心能力:异常干预与断点续做

在真实的物理机房中,网络抖动、阵列卡超时或硬盘坏道随时可能导致装机中断。hrnrOS 拒绝“一坏就全盘重来”的粗暴逻辑,允许您进行单机、单节点的精准干预。

当设备状态变为 交付失败 时:

  1. 点击该设备的资产行,下方会自动展开红色的报错详情面板。

  2. 查看报错原因: 面板内会抓取引擎底层的原始报错日志(如:RAID 创建超时,未检测到 /dev/sdb)。

  3. 执行人工决策:

    • 重试环节 (Retry): 如果您判断报错是偶发性的(如 PXE 下载内核时网络闪断),点击此按钮。引擎将仅针对当前失败的节点重新下发指令。(首选推荐)

    • 强制跳过 (Force Skip):[高危操作] 如果您明确知道报错不影响最终业务(例如某块非系统盘的 SMART 告警导致硬件压测不通过,但您仍想强行装机),点击此按钮。引擎将无视当前节点的错误,强制将流水线推进到下一步。

提示: “强制跳过”功能赋予了运维人员极大的灵活性,但也意味着您接管了机器隐患的责任。请仅在您完全理解报错背景的情况下使用此功能。


3. 任务清理与资源回退

自动化交付任务是一个瞬态过程。当一批服务器成功交付入库后,它们便成为了 CMDB 中的正式资产。 交付完成

删除任务 会发生什么?

  • 对于已成功的设备: 没有任何影响。机器已正常运行并在 CMDB 中挂牌。
  • 对于失败或未完成的设备: 系统的“安全回退机制”将被触发。删除任务后,这些“半成品”设备会被自动解除绑定,并安全回退到【资源发现池】中
  • 典型应用场景: 一批机器中有 90 台成功,10 台因为网线没插好彻底失败。您可以直接删除该任务清理看板,随后去资源发现池中重新圈选这 10 台被回退的机器,再次发起新一轮的交付。