Skip to content

功能教程:RAID 卡健康分析

RAID (Redundant Array of Independent Disks) 控制器是企业级服务器中保障数据冗余和性能的关键部件。HrnrOS 的 RAID 卡健康分析功能,通过采集并智能解析主流 RAID 卡(如 LSI/Broadcom MegaRAID, HBA 卡)的日志,帮助您主动发现逻辑驱动器(LD)降级、物理磁盘(PD)故障、电池问题等严重风险。

RAID 卡健康分析功能概览

  • 主流厂商支持: 专注于分析业界广泛使用的 LSI/Broadcom 系列 RAID/HBA 控制器的日志。
  • 智能日志解析: 内置强大的规则引擎,能够自动从海量、复杂的控制器日志中提取关键的故障和预警信息。
  • 风险发现与建议: 将解析出的问题格式化为清晰的“发现项 (Finding)”,每个发现项都包含严重等级分析结论处理建议日志原文证据
  • 直观状态呈现: 根据发现项的最高严重等级,给出主机的 RAID 总体状态(如 Healthy, Degraded, Failed)。

步骤 1: 进入 RAID 卡健康分析页面

在 Web 界面左侧的硬件健康分析菜单中,点击 “RAID卡健康分析”,进入功能主界面。

(/assets/images/raid_health_tutorial_main_page.png) (截图描述:展示 RAID 卡健康分析主界面,布局与其他健康分析页面一致。)

步骤 2: 触发健康分析

  1. 定位客户端: 在列表中找到您想要分析的在线客户端。
  2. 开始分析: 点击该行“操作”列下的 “分析RAID卡” 按钮。

系统会向客户端发送指令,在后台执行日志采集和云端分析。下方展开的区域会显示分析进度。

步骤 3: 查看分析报告

分析完成后(通常需要一到两分钟),展开区域将展示详细的 RAID 健康报告。

  1. 主机概览: 报告顶部会显示该主机的 RAID 总体状态(例如 “Warning” 或 “Healthy”)和报告生成时间。
  2. 发现项列表:
    • 如果系统在日志中发现了任何问题或预警信息,它们会以“发现卡片”的形式逐条列出。
    • 每个卡片都用颜色和标签标明了严重等级Critical, Warning, Info)。
    • 卡片内部清晰地说明了分析结论(发生了什么问题)和处理建议(您应该怎么做)。
  3. 追溯证据:
    • 在每个发现卡片下方,您可以点击 “点击查看证据 (日志原文)” 来展开和查看导致此条分析结论的原始日志片段,便于深度排查和验证。

(/assets/images/raid_health_tutorial_view_report.png) (截图描述:展示一个客户端展开后的 RAID 报告。总体状态为 “Warning”。下方有一个黄色的 “Warning” 级别的发现卡片,标题为 “Physical Drive Predicted to Fail”,内容包含了分析、建议,并且底部的日志证据部分已被展开。)

如果报告显示 "未发现任何异常或警告",则说明您的 RAID 系统当前状态良好。如果出现 “Critical” 或 “Warning” 级别的发现,请务必根据处理建议及时介入,以防数据丢失。