核心功能概览
HrnrOS 不仅仅是一个装机工具,它是专为大规模数据中心设计的全生命周期服务器运维平台。从裸金属自动发现、系统部署,到日常监控、故障诊断与修复,提供了一站式的解决方案。
📦 1. 资产全生命周期管理 (CMDB)
构建精准、动态的硬件资产台账,实现从“设备入库”到“退役”的全流程闭环。
- 自动发现与录入: 支持 PXE 自动发现新设备,或通过 Excel 批量导入资产编号与 BMC 信息。
- 深度硬件审计: 自动采集并记录服务器的 CPU、内存、硬盘、网卡、GPU 等详细配置,支持 BOM (物料清单) 管理。
- 批量 Agent 部署: 内置向导,一键为 Linux 服务器批量推送监控 Agent,支持前置 IPMI 安全校验。
- 操作审计日志: 全程记录资产的变更、维护与操作历史,确保数据可追溯。
🚀 2. 企业级 PXE 自动化部署
支持异构环境下的裸金属服务器全自动系统安装,适配主流 Linux、Windows 及国产信创系统。
- 广泛的 OS 支持: 覆盖 RHEL/CentOS、Ubuntu/Debian、Windows Server 及麒麟/欧拉等国产系统。
- 可视化硬件配置: 独创的 两阶段配置 流程,支持在安装前自动扫描物理磁盘,并可视化配置 RAID 级别 (RAID 0/1/5/10) 及 网络 Bond。
- Windows 专属优化: 支持 Windows 自动化分区(C盘/数据盘)、驱动注入及 RDP 远程桌面 自动开启。
- IPMI 流水线日志: 实时展示电源控制、引导顺序设置等底层操作的时间轴日志。
🩺 3. 全栈硬件健康监控 (Nexus Monitor)
具备“自我感知”与“自愈能力”的监控平台,不仅是被动告警,更是主动维护。
- 全维度感知: 实时监控 CPU 核心温度、内存 ECC 错误、GPU 显存/功耗、硬盘 SMART 及 RAID 卡电池状态。
- 基准变更管理: 引入 “硬件基准快照” 机制,智能识别合法的硬件升级与非法的硬件丢失。
- 智能自愈 (Self-Healing): 当 Agent 失联或系统假死时,自动尝试 SSH 服务重启或 IPMI 电源循环,无需人工干预。
- 一键热升级: 支持在 Web 界面对全网服务器的 Agent 进行批量无感升级。
🔬 4. 深度硬件性能诊断
提供一整套专业的 Stress Testing (压力测试) 工具,用于主动验证服务器在高负载下的稳定性与性能极限。
- CPU 深度诊断: 提供 Fast Check (快速体检) 和 Full Stress (全量压测) 两种模式,深度检测 CPU 计算错误与稳定性。
- 内存压力测试: 通过高强度的读写负载,检测内存条的纠错能力与带宽性能。
- 硬盘 I/O 基准: 支持多盘并发测试,实时监控读写带宽、IOPS 与延迟,自动生成性能分析报告。
- GPU 算力验证: 针对 AI 服务器,提供 GPU 满载压力测试,监控温度、功耗与显存状态。
- 全网链路测速: 基于
netperf,支持任意两台服务器之间的点对点带宽与延迟测试。
🛠️ 5. 高效系统运维 (System Ops)
为运维人员打造的“瑞士军刀”,无需跳板机,浏览器即是控制台。
- WebSSH 与 SFTP: 集成全功能终端,支持免密登录,并提供可视化的文件上传/下载工具栏。
- 一键 RDP 连接: 针对 Windows 服务器,通过本地协议唤起远程桌面客户端,自动填充凭据,实现“点击即连”。
- 批量密码管理: 支持批量初始化 Linux Root 密码,并提供加密的密码台账下载功能。
- 批量脚本执行: 支持向多台服务器并发下发 Shell 脚本,并实时回显执行日志 (
stdout/stderr)。
🎮 6. IPMI 带外批量管理
服务器的“急救室”,在操作系统瘫痪时提供底层控制能力。
- 状态实时巡检: 自动轮询 BMC 网络连通性与电源状态(开机/关机)。
- Web 控制台 (NoVNC): 一键获取临时凭据并跳转至 BMC Web 管理页面,内置 30分钟密码自动轮换 机制保障安全。
- 批量电源控制: 支持批量开机、关机、重启及 PXE 启动设置。
- 故障修复: 提供 BMC 连接自动修复及高危的“恢复出厂设置”功能。
💡 7. 现场运维辅助工具
解决数据中心现场“找盘难、排障难”的痛点。
- 物理磁盘定位 (点灯): 无 Agent 模式,通过 SSH 直接控制硬盘背板,点亮指定硬盘的定位灯 (Locate LED),支持 NVMe、RAID 及 HBA 直通盘。
- 一键日志采集: 自动化收集 RAID 卡日志 (MegaCli/StorCli)、GPU 调试信息、网卡统计及系统消息,支持在线高亮搜索与下载。
⬆️ 8. 固件升级与维护
自动化完成高风险的底层固件更新,无需进入复杂的 BIOS/UEFI 界面。
- 智能设备检测: 自动识别服务器上的 LSI/Broadcom RAID 卡与 HBA 卡型号及当前固件版本。
- 实时进度反馈: 通过 WebSocket 实时展示升级日志和进度条,确保操作透明可控。
- 安全校验机制: 严格的文件命名约定与校验,防止刷错固件导致硬件损坏。
🌐 9. 灵活的网络服务模式
适配各种复杂的网络环境,无论是独立部署还是融入现有网络。
- 多网段并行服务: 单台服务器可同时服务于多个物理网口或 VLAN,每个网段独享 DHCP/TFTP/HTTP 服务,物理隔离互不干扰。
- Standalone Mode (独立模式): 提供完整的 DHCP 和 PXE 服务,适合隔离网络或新机房交付。
- External DHCP (外部模式): 仅提供 TFTP/HTTP 引导服务,兼容现有的 DHCP 服务器,避免 IP 冲突。
- IP 资源池管理: 集中管理数据中心 IP 地址段,直观展示 IP 的占用、空闲及预留状态。