前提和假设
在开始安装之前,请先参考 LiCO 最佳配置来确认集群硬件使用了正确的驱动及设置。您可以通过以下链接获取 LiCO 最佳配置文档:
在开始安装之前,请先参考 LeSI 18A_SI 最佳配置来为操作系统安装正确的安全补丁。您可以通过下面的链接获取最佳配置文档:
在管理节点上添加 CentOS/RedHat 或 SLES-12-SP3-Server/SLES-12-SP3-SDK 本地或者在线的基础源。
本文档没有特别指出,所有命令都是在 管理节点 上执行。
若需要打开 防火墙 请参考 集群服务汇总 中的端口,修改防火墙规则。
我们建议您定期修补漏洞、及时更新组件和操作系统,从而预防安全漏洞,如何升级OS包,请参考 如何升级操作系统。
本文档是针对典型的包含管理、登陆和计算三种节点的集群的安装文档。如下图所示。但 LiCO 也支持运行在仅包含管理和计算节点的集群上,针对这类集群,请将文档中提示安装在登陆节点上的 LiCO 模块安装到管理节点上。
- 管理节点
它作为 HPC 集群的核心,肩负着集群管理、监控、调度、策略管理、用户和账户管理等主要功能。
- 计算节点
顾名思义,就是完成计算的任务。
- 登录节点
它是集群联系外部网络或集群之间的纽带。用户需要通过它来完成用户的登录并用它来上传应用数据,开发编译程序,提交调度任务等。
- 并行文件系统
提供共享存储功能,通常节点和并行文件系统之间是高速网络相连。本文档使用 NFS 共享文件系统,并不涉及并行文件系统的安装。
- 节点BMC网络
BMC 网络用来访问节点的 BMC 系统。
- 节点eth网络
Ethernet 网络用来对各节点进行管理,也可以用来传输计算数据。
- 高速网接口
高速网络是可选的。一般用来支持并行文件系统,也可以用来传输计算数据。
特别说明
请将下文中出现 <*_USERNAME> 和 <*_PASSWORD> 的部分替换为实际用户名和密码。
部署集群环境
安装LiCO
本章主要介绍 LiCO 服务在集群中的分布状况及安装配置。
Note
若您希望快速安装 LiCO,请参考: 如何快速安装LiCO