前提和假设

  • 在开始安装之前,请先参考 LiCO 最佳配置来确认集群硬件使用了正确的驱动及设置。您可以通过以下链接获取 LiCO 最佳配置文档:

  • 在开始安装之前,请先参考 LeSI 18A_SI 最佳配置来为操作系统安装正确的安全补丁。您可以通过下面的链接获取最佳配置文档:

  • 在管理节点上添加 CentOS/RedHat el7SLES-12-SP3-Server/SLES-12-SP3-SDK sle12 本地或者在线的基础源。

  • 本文档没有特别指出,所有命令都是在 管理节点 上执行。

  • 若需要打开 防火墙 请参考 集群服务汇总 中的端口,修改防火墙规则。

  • 我们建议您定期修补漏洞、及时更新组件和操作系统,从而预防安全漏洞,如何升级OS包,请参考 如何升级操作系统

  • 本文档是针对典型的包含管理、登陆和计算三种节点的集群的安装文档。如下图所示。但 LiCO 也支持运行在仅包含管理和计算节点的集群上,针对这类集群,请将文档中提示安装在登陆节点上的 LiCO 模块安装到管理节点上。

architecture-cn

管理节点

它作为 HPC 集群的核心,肩负着集群管理、监控、调度、策略管理、用户和账户管理等主要功能。

计算节点

顾名思义,就是完成计算的任务。

登录节点

它是集群联系外部网络或集群之间的纽带。用户需要通过它来完成用户的登录并用它来上传应用数据,开发编译程序,提交调度任务等。

并行文件系统

提供共享存储功能,通常节点和并行文件系统之间是高速网络相连。本文档使用 NFS 共享文件系统,并不涉及并行文件系统的安装。

节点BMC网络

BMC 网络用来访问节点的 BMC 系统。

节点eth网络

Ethernet 网络用来对各节点进行管理,也可以用来传输计算数据。

高速网接口

高速网络是可选的。一般用来支持并行文件系统,也可以用来传输计算数据。

特别说明

请将下文中出现 <*_USERNAME><*_PASSWORD> 的部分替换为实际用户名和密码。

部署集群环境

如果集群环境已经存在(检查 组件列表 中软件都已经安装,并且能通过检查点 检查点A , 检查点B)则可以跳过此章节。

安装LiCO

本章主要介绍 LiCO 服务在集群中的分布状况及安装配置。

Note

若您希望快速安装 LiCO,请参考: 如何快速安装LiCO