集群系统

     产品概述:

       高性能计算集群系统建设的目的是为了得到更高的计算性能,更快的解决科研过程中遇到的大量的密集型计算问题同时希望集群系统在CPU或GPU数量增加时能带来系统性能的线性提升。

通过集群系统强大的计算能力计算或模拟实验运算出来的结果,来辅助完成学术和探索方面的研究和证实,这些学术和探索方面的研究课题包括分子动力学、材料化学、计算化学、物理化学、结构力学、流体力学、有限元领域、生物计算、基因研究、航空航天、气象、石油勘探开发等领域。


产品特点:

基于Linux系统,采用主流的Cluster集群架构、业界最成熟的x86硬件架构、软件技术以及主流国际技术标准,遵循高度安全和可靠的苛刻要求。

硬件方面可根据用户应用软件特点进行个性化定制,将用户需要的定制化产品直接送达用户现场,安排技术工程师现场完成调试,对用户日常使用进行技术协助,便于用户快速上手使用。

软件方面包括计算节点操作系统、集群计算作业调度管理系统、并行算法环境搭建(多机并行:MPI技术;多线程并行:OpenMP技术)、集群应用软件部署环境、高性能计算互联支持等。 

产品优势:

²高性能

我们的集群系统选择了业界领先的高密度机架服务器,采用英特尔最新Skylake架构的至强系列处理器,计算网络使用200Gb的FDR Infiniband ,非常适合计算密集型和通信密集型应用;大容量、高性能、高容错、高可扩展性的分布式并行存储系统为集群提供了强大的存储支持。

²高可靠性

我们的集群系统采用冗余电源,热插拔硬盘和RAID技术,后备电容,可实现错误检查和纠正技术(ECC)的内存条,高容错存储系统等设备和技术保证系统的可靠稳定运行。

²可扩展性

我们的集群系统设计为用户预留了自由的可扩展空间,用户可根据业务的增长,灵活地增配计算节点,扩充计算网络,提升计算性能;扩充存储系统的容量和性能,满足增长的数据存放和IO性能需求。

²绿色节能

我们的集群系统均采用绿色节能产品,选取低功耗部件,采用专业的散热设计,避免不必要的能耗损失,真正实现绿色高效能计算。

产品配置:

产品名称

技术规格

1 硬件系统

1.1 计算系统

CPU计算节点

Intel® Xeon®Platinum/Gold可扩展处理器;≥6个DDR4 3200MHz/DDR5 4800MHz ECC REG内存插槽,最大支持6TB ECC 内存;2*板载千兆RJ45网络接口+1*IPMI管理网口+1*100G/200G IB网卡;850W-2000W黄金或铂金级全模组(1+1)冗余电源

GPU计算节点

Intel® Xeon®Platinum/Gold可扩展处理器;≥6个DDR4 3200MHz/DDR5 4800MHz ECC REG内存插槽,最大支持6TB ECC 内存;2*板载千兆RJ45网络接口+1*IPMI管理网口+1*100G/200G IB网卡;支持PCIe5.0x16/PCIe4.0x16/PCIe3.0x16,可搭载NVIDIA Geforce、Quadro、Tesla系列显卡;850W-2000W黄金或铂金级全模组(1+1)冗余电源

管理登陆节点

Intel® Xeon®Platinum/Gold可扩展处理器;≥6个DDR4 3200MHz/DDR5 4800MHz ECC REG内存插槽,最大支持6TB ECC 内存;2*板载千兆RJ45网络接口+1*IPMI管理网口+1*100G/200G IB网卡;850W-2000W黄金或铂金级全模组(1+1)冗余电源

存储节点

Intel® Xeon®Platinum/Gold可扩展处理器;≥6个DDR4 3200MHz/DDR5 4800MHz ECC REG内存插槽,最大支持6TB ECC 内存;支持2个M.2 PCIe 固态硬盘,支持≥24个SATA3.0 7200RPM 6GB/s 企业级机械硬盘,可支持RAID0,RAID1,RAID5,RAID10等多种存储方案;2*板载千兆RJ45网络接口+1*IPMI管理网口+1*100G/200G IB网卡;850W-2000W黄金或铂金级全模组(1+1)冗余电源

1.2 网络系统

计算网络

≥36口100G/200G InfiniBand交换机,冗余电源

管理网络

24/48口10/100/1000M自适应电口交换机,带1G/10G SFP+光口

2 软件系统

操作系统

Linux CentOS

集群管理调度系统

面向高性能集群管理和作业调度的平台,监控CPU平均使用率、内存剩余率、磁盘剩余、磁盘IO速率等。提供邮件、短信实时告警功能,提供历史告警信息查询功能,能按时间体现集群系统总体运行情况,可生成PDF、EXCEL格式的报表,提供用户管理,IP管理,Hosts管理,进程管理,服务管理,文件管理,远程开机/关机管理等功能。作业调度支持多队列管理,各个队列可设置不同管理策略;支持非法作业及残留作业的查询和清理功能;支持提供灵活的集群配置能力,可以完成对整个集群的检测和配置;支持作业记账和统计分析功能。

应用开发环境

编译器

GNU编译器,支持C/C++/Fortran

Intel编译器,支持C/C++/Fortran

数学库

MKL、ACML、BLAS、LAPACK、ScaLAPACK、FFTW等

并行环境

OpenMP并行环境

OpenMPI、MPICH2、MVPAICH2等MPI并行环境(支持InfiniBand和以太网)

3 机房环境系统

机柜

42U标准服务器机柜

不间断电源(UPS)

为系统提供后备电源支持,在线式

机房专用空调

为系统提供符合要求的恒温恒湿环境

环境监测系统

对机房环境进行监测、预警、报警,实时掌握设备运行环境情况


一键电话 公司邮箱 返回顶部