沈阳金杯延锋
- 一、项目概述
1.1、项目背景
沈阳金杯延锋汽车内饰系统有限公司准备采用虚拟化与云计算技术来构建IT系统,提升IT系统的资源利用率,但是传统SAN在企业基础设施池化、云化中面临的主要问题:
-
存储资源弹性问题:多业务负载、资源的动态需求变化
-
存储扩展的问题:共享、扩展面临了诸多的瓶颈和问题(机头、前后端网络、CPU/Cache与HDD不同步问题)
-
形态和实施的成本、复杂性问题:独立的存储网络,建设成本高、实施复杂(初始实施、扩减容等)
-
容错和可靠性问题:大规模集群中容忍的故障域问题(跨机柜、跨机房),硬盘重建时间长问题
- 1.2、项目需求
目前沈阳金杯延锋汽车内饰系统有限公司现有数据网络存在的挑战包括:
• 服务器数量众多,管理变得越来越复杂,每台服务器的相关管理参数不能统一管控,需要每台服务器单独查看系统的相关参数,如硬件是否有问题告警,CPU、内存使用率是否正常;
• 服务器系统性能利用率低,部门服务器安装应用,当使用率变低时,无法给其它业务提供使用,造成资源浪费;
• 新业务系统上线周期长,部署慢,新业务上线,需要业务供应商提供设备硬件参数要求,需要采购硬件,调试安装硬件,部署业务,这样上线一个新的业务IT这边需要准备很长时间;
• 目前金杯延锋使用的是传统的SAN存储,SAN存储扩展性差,无法支撑新业务的性能需求,如有新业务上线,服务器需要单独采购价格较高的HBA卡,并且随着业扩的扩张,相关的存储交换机等配件无法继续使用,需要采购性能更高的存储交换机,并且这种存储在维护成本相对较高,如有硬盘和其它部件损坏更换维护的成本比较高;
• 新业务走向互联网化,传统架构无法实现线性扩展能力;
• 应用系统缺乏高可用性保护,目前延锋数据保护都是采用双机保护的方式,这样需要多购买备份服务器,增加维护复杂性且这种方式浪费服务器资源,但这种业务保证方式,如一台服务器工作,就需要另一台服务器做备份,防止主服务器出现问题,导致业务不可恢复,这是传统数据部署方式无法避免的弊端;
• 机房及电能空间资源有限,传统机房部署业务就是不断上架服务器及相关设备,会导致机房空间越来越少,并且随着设备的数量越来越多,机房的每年的耗电量也是一笔不小的开支。
1.3、应用调研
目前,经过我单位与延锋汽车的沟通,客户将来会上线一批新的业务,客户需求将未来上线的新业务与客户部分客户的老业务迁移到新的虚拟化平台上,实现更加高效、合理、面向未来的数据架构。
针对上述问题,建议客户使用华为超融合(FusionCube)一体机解决上述问题,为满足业务平台日益增长的存储需求,为业务平台提供高安全性、高可靠性、高可用性和开放性的存储服务。
FusionCube一体机系统基于分布式处理技术、虚拟化技术和集群技术实现,作为云计算资源池存储资源池的一部分,为计算资源池提供高速、可靠、安全的块存储服务。
二、设计原则
在方案设计中我们将遵循以下总体原则:
以业务需求为导向
技术架构最终是为业务服务的,因此技术架构的设计一定要以业务的需求为导向,充分考虑非功能需求,例如系统的重要程度、安全要求、业务连续性等。
遵循互联网标准
新业务系统都是面向互联网和物联网业务,因此架构体系要遵循互联网数据中心设计和建设标准,吸收互联网架构的优势。
提高资源利用率
现已经部署了大量的服务器,资源使用率低是较突出的一个问题,因此在项目中,提高资源利用率成为一个重要的任务。
动态扩展性
在IT发展趋势中,动态基础架构已经成为IT基础架构的发展方向。使IT基础架构成为一个动态、灵活、具有弹性的IT基础架构,同时在IT实时地运营过程可进行灵活的资源动态调整。资源扩展要体现在计算资源和存储资源的同时扩展。
分布式一切
应用系统的高可用性是保障服务等级的重要因素,在架构设计中应该以软件定义为主,借助软件的分布式架构满足高可用性要求,实现系统架构和平台架构的无单点故障、无单点瓶颈问题,保障新一代的业务系统健壮性。
安全性
在系统设计中,安全性是一个非常重要的问题。在架构中需要考虑到虚拟化架构内外部的安全,包括数据安全等问题,以保证整个系统长期安全稳定的运行。
三、网络架构拓补图
四、华为超融合的介绍及优势
4.1项目技术方案
(1)FusionCube 总体架构
(2)华为FusionCube解决方案各组件说明
名称 |
说明 |
FusionCube Center |
FusionCube的管理软件,管理其中的虚拟化资源、硬件资源,提供系统监控管理和运维管理等功能。 |
FusionCube Builder |
提供现场快速安装部署FusionCube系统软件,可用于现场更换虚拟化平台软件或者更新版本。 |
FusionCube分布式块存储 |
使用分布式存储技术,通过合理有序组织服务器的本地磁盘(SAS/SATA/NL-SAS HDD、SSD或者NVMe SSD),提供高性能高可靠的块存储业务。 |
硬件平台 |
服务器使用E9000/X6800/X6000/机架服务器,支持计算、存储、交换、电源模块化设计,计算和存储节点按需混配,计算、存储都在服务器内部署完成,支持GPU,SSD PCIe等IO加速扩展,支持丰富的交换模块10GE,根据业务要求灵活配置。 |
华为FusionCube超融合基础设施是华为公司IT产品线的旗舰产品。FusionCube遵循开放架构标准,融合服务器、分布式存储及网络交换机为一体,无需外置存储、交换机等设备,并预集成了分布式存储引擎、虚拟化平台及管理软件,资源可按需调配、线性扩展。
(3)预集成
华为FusionCube依托华为高效的端对端交付能力,能从用户报价开始,根据用户业务需求,直接交付给用户开箱即用的产品,极大地简化了用户的安装、调测时间,从几周甚至数月的调测时间缩减到几个小时之内。
预集成包括如下内容:
-
硬件预安装:设备上柜、线缆预绑 (E9000)。
-
软件预安装:BIOS和系统盘RAID设置、虚拟化软件FusionCompute、平台管理软件FusionCube Center软件安装、存储软件(FusionCube块存储)预安装。
-
带柜运输:立柜运输(仅E9000支持)。
(4)兼容多种虚拟化平台
兼容多种主流虚拟化平台,包括FusionSphere和VMware vSphere。FusionCube支持为虚拟化平台提供统一的计算、存储和网络资源。
-
支持FusionSphere虚拟化平台软件的预安装和自动安装部署,一次性完成虚拟化平台、FusionCube等软件的安装,提高系统部署效率。
-
集成虚拟化平台资源监控功能,一个管理界面即可提供整个系统的日常运维。
(5)计算/存储/网络融合
FusionCube不再是单独的计算、网络、存储设备,而是预置集成的一体化设备,实现了计算、存储和网络资源的融合,无需额外配置存储、网络等资源。
-
在计算、存储融合方面,通过在服务器中部署分布式存储引擎,减少了数据的访问时延,提升整体访问效率。
-
在计算、网络融合方面,通过网络自动部署,用户无需关心网络具体配置,系统可自动配置网络资源,并实现与计算、存储资源的联动。
(6)分布式块存储
FusionCube内置FusionCube块存储为业务提供存储服务,FusionCube块存储是一种分布式存储系统,采用独特的并行架构、创新的缓存算法、自适应的数据分布算法,既消除了热点也提高了性能,并且能够以超快的重建时间实现自动化自修复,提供卓越的可用性和可靠性。
-
线性扩展和弹性
FusionCube块存储采用全分布式DHT架构,将所有元数据按规则分布在各节点,避免了元数据瓶颈,支持线性扩展。FusionCube块存储采用了独特的数据分块切片技术,以及基于DHT Hash的数据路由算法,可以将卷的数据均匀的分散到较大的资源池故障域范围内,使得每个卷可以获得更大的IOPS和MBPS性能,也使得每个硬件资源的负载相对均衡。
-
高性能
FusionCube块存储免锁化调度的IO软件子系统,彻底解决了分布式锁冲突,使得IO路径上无需进行任何锁操作和元数据查询,IO路径短、时延低;分布式的无状态机头,可以充分发挥各个硬件节点的能力,大大提升了系统的并发IOPS和并发MBPS。FusionCube块存储支持采用SSD做主存提供极致性能,同时支持采用分布式的SSD cache技术,配合大容量的SAS/SATA/NL-SAS盘做主存,使得系统的性能可以具备SSD的性能和SAS/SATA/NL-SAS的容量。
-
高可靠性
FusionCube块存储支持多种数据冗余保护机制,如2副本、3副本、EC等;在此基础上,FusionCube块存储支持设置灵活的数据可靠性策略,允许将不同的副本放在不同的服务器上,保证在服务器故障的情况下,数据仍然不丢失、仍然可访问。同时FusionCube块存储采用对有效数据分片进行数据的冗余保护,在硬盘、服务器故障的时候,能够对有效数据进行并行重建,1TB硬盘的重建时间小于30分钟,大大增强系统的可靠性。
-
丰富的存储高级功能
-
精简配置,当用户对卷进行写操作时才分配实际物理空间,来为用户提供比物理存储资源更多的虚拟存储资源。
-
卷快照,将用户的逻辑卷数据在某个时间点的状态保存下来,作为快照点;快照不限次数且性能不下降。
-
链接克隆,基于增量快照提供链接克隆,一个快照可以创建出多个克隆卷,各个克隆卷刚创建出来时的数据内容与快照中的数据内容一致,后续对于克隆卷的修改不会影响到原始的快照和其他克隆卷。
(7)虚拟化/数据库混合部署
FusionCube支持在一套系统中同时提供虚拟化和物理混部署,通过虚拟化部署提高资源利用率和实现云化管理,同时又可以通过物理服务器部署数据库服务,满足数据库的高性能要求。
-
FusionCube同时为虚拟化和数据库提供计算、存储和网络资源,并提供统一的运维管理服务。
-
支持物理服务器的自动安装部署,并通过管理界面为数据库所需存储、网络等资源提供向导式配置,大大缩短了数据库业务上线周期。
(8)自动化部署
FusionCube采用预集成方式自动化部署系统,极大降低现场操作的复杂性,提升部署效率和质量:
-
通过预安装、预集成、预验证,降低用户安装、部署的复杂度,减少用户安装部署时间。
-
支持设备上电自动发现,以及向导式的系统初始化配置,实现快速完成系统计算、存储和网络资源初始化,大幅缩短业务上线时间。
-
提供自动化安装部署工具,实现现场虚拟化平台快速切换和版本升级。
(9)统一运维管理
FusionCube支持服务器、交换机等硬件设备的统一管理,也提供计算、存储和网络等资源的统一管理,大幅提高运维效率和服务质量:
-
通过一个统一的管理界面提供机箱、服务器、交换机等硬件设备的日常维护,实时掌控系统中计算、存储和网络资源的运行状态,方便维护人员使用。
-
自动监控IT资源和系统运行状态,对系统故障和潜在风险实时报警,告警可以通过邮件的方式通知维护人员。
支持快速自动完成新资源的扩容,自动发现待扩容设备,通过向导式的扩容配置,快速完成资源扩容。
4.2、超融合架构优势
|
超融合架构 |
传统数据中心基础架构 |
性能 |
尽可能提供本地吞吐,并使用SSD保证应用IO需求。不存在性能瓶颈 |
随着访问集中存储的服务器越来越多,性能瓶颈将日益凸显 |
横向扩展 |
可以简单的在集群中增加节点以扩展集群规模和性能 |
由于架构限制,无法实现横向扩展 |
高可用性 |
可以通过三副本的方式容忍最多两个节点同时故障,并且硬件故障时数据重建速度快,性能几乎不受影响 |
通过raid技术实现高可用性,但面对硬件故障时,性能下降严重。 |
整合比 |
虚拟机密度高,是传统2倍以上 |
虚拟机密度低 |
安装配置 |
开箱即用的部署方式,只需30分钟即可完成安装配置 |
需要准备大量安装实施前的信息收集和整理工作,并且由专人进行安装部署,最少需要2天时间 |
管理维护 |
统一WEB界面管理,维护方便 无需配置LUN、卷、Raid组 |
需要专门存储管理软件,配置复杂。需要厂商支持。 |
空间占用 |
使用超融合架构:3台6U高,总共包含3个节点(包含服务器和存储) 总共占用空间6U |
使用传统架构:15台2路服务器至少占用30U,存储至少需要4U 总共占用空间34U |
耗电 |
使用超融合架构:3台服务器,每台服务器耗电500W计算,共耗电1500W,电费按平均0.8元计算。
运行三年电费支出约:31536元 |
使用传统架构:15台服务器,每台服务器耗电500W计算,存储耗电1500w,总共耗电9000W,电费按平均0.8元计算。
运行三年电费支出约为:189216元 |
-
五、超融合方案解决延锋汽车的实际需求
5.1、统一运维管理
客户目前的网络状况是分散的业务管理,无法时时掌握相关服务器的的相关情况,FusionCube通过FusionCube Center管理系统实现整个系统的统一管理,功能包括资源管理、性能监控、告警管理、操作日志管理、权限管理、硬件管理、健康检查和日志收集。
FusionCube Center 管理界面
FusionCube Center 管理界面说明
功能 |
说明 |
资源管理 |
支持存储、虚拟化以及物理计算资源的接入和管理。VMware场景下还支持iSCSI卷的管理。 |
性能监控 |
支持资源集群、服务器和虚拟机的CPU利用率、内存利用率、网络流量以及磁盘IO的统计。 |
告警管理 |
提供查看告警信息、清除告警、屏蔽告警的功能。 |
操作日志管理 |
提供操作日志查看和导出。 |
权限管理 |
提供用户创建、删除以及密码修改功能;同时支持用户角色配置、密码策略配置,域名认证及配置功能。 |
硬件管理 |
支持对机框、服务器、交换机的接入管理、名称和IP修改。 |
健康检查 |
支持系统各节点的系统检查,支持硬件兼容性检查功能。 |
日志收集 |
支持FusionCube Center管理系统以及FusionCube块存储各节点的日志收集,并在界面提供日志包下载功能。 |
5.2、业务自动故障恢复
目前当客户业务服务器出现故障,会造成业务中断,需要IT人员排查相关的问题,恢复业务,从处理故障到业务恢复需要一段时间,还有可能业务短时间无法恢复,而华为超融合解决方案,无需人工干预,系统会自动故障业务主机并且自动恢复相关业务,减少意外宕机对业务的影响。
5.3、节约物理机数量
现在为了满足业务的需求,必须将整台服务器专用于每个工作负载,并且关键业务还需要单独的一台服务器作为备份机器,以确保稳定性和可靠性,因此,导致了现在大多数服务器的利用率都低于10%,有多台备份服务器系统资源浪费,华为超融合方案提供了整合服务器和提高利用率的安全途径,而且不会产生与其他整合方法相关的复杂性和中断。因此,华为超融合解决方案能够显著减少所需服务器的数量,并可充分利用每台服务器,从而降低了再服务器硬件上的花费。
5.4、随时上线新业务
现在新业务系统上线周期长,部署慢,新业务上线,需要业务供应商提供设备硬件参数要求,需要采购硬件,调试安装硬件,部署业务,这样上线一个新的业务IT这边需要准备很长时间,如果采用华为超融合解决方案,上线新业务无需以上流程,只需要IT管理员在管控平台新建虚拟机,一台满足业务的服务器就上线了,随时可以上线新业务。
5.5、节约购买硬件费用
传统的硬件服务器硬件架构需要单独的存储,每台存储的价格基本都是在十几万到几十万或者几百万之间,并且随着业务的扩张需要不断的升级存储,且存储的维护费用也很高,华为超融合架构使用服务器自身的硬盘作为存储,不需要存储设备,节省掉存储这方面的开支,并且服务器自身的硬盘当做存储,价格比存储硬盘价格低廉,具有很高的性价比。
5.6、节约用电和制冷成本
降低业务的服务器数量,就可以显著降低供电和制冷成本。同时还可以避免为满足业务的扩展对供电和制冷要求的不断提高而产生的高额升级和扩展费用。
六、硬件平台介绍
华为FusionCube兼容多种计算存储融合硬件平台,包括E9000刀片服务器平台、X6800和X6000高密服务器平台和机架服务器平台。
本项目采用的硬件平台为2288H V5
2288H V5机架服务器
形态 |
2P机架服务器 |
处理器 |
1/2 个Intel Xeon SP(81/61/51/41系列) |
内存插槽 |
24个DDR4 DIMM插槽,最高2666MT/s |
硬盘数量 |
8个2.5英寸SAS/SATA硬盘 12/16个3.5英寸SAS/SATA/NLSAS硬盘 12个NVMe SSD盘 |
RAID支持 |
支持RAID0、1 |
板载网卡 |
支持2*GE+2*10GE接口 |
PCIe扩展 |
1个灵活LOM插卡,可选配2*GE或4*GE或2*10GE 最大支持8个标准PCIe插槽:4个全高全长的PCIe3.0 x16标准卡(信号为x8),3个全高半长的PCIe3.0 x16标准卡(信号为x8),1个全高半长的PCIe3.0 x8标准卡(信号为x8),1个RAID卡专用的PCIe扩展卡,1个灵活LOM插卡 |
七、系统软硬件配置清单
序号 |
类型 |
型号 |
主要性能描述 |
数量 |
|
1 |
超融合一体机 |
华为 FusionCube HCI(V5) |
服务器部分:3*2288H V5 存储融合管理计算节点主机,每节点配置[2颗英特尔至强银牌4214 CPU(2.2G,12核,L3 Cache 16.5MB) / 6*32GB RDIMM DDR4 2933MHz 内存 / 2*600GB SAS 10K 硬盘(2.5")+8*2TB SATA 7.2K 硬盘(3.5") / 12Gb SAS RAID卡,支持RAID0,1,10 / 板载2*GE以太网电口+2*10Gb光口(满配多模光模块)+1*10Gb双光端口卡(非板载,满配多模光模块)+1*800GB PCIe NVMe SSD卡 / 2U静态滑轨套件 / 面板 ] / 3年原厂7*10*ND现场保修服务 |
1 |
|
2 |
超融合网络交换机 |
华为 S6720-30C-EI-24S-AC |
S6720-30C-EI-24S组合配置(24个万兆SFP+,2个40GE QSFP+,单子卡槽位,含2个600W交流电源) / 3个SFP-GE-电接口模块(100m,RJ45)+8个光模块-SFP+-10G-多模模块(850nm,0.3km,LC)+1条1米QSFP+-40G-高速电缆(线缆含模块) / 1年原厂7*10*ND标准保修服务 |
2 |
|
3 |
虚拟化软件 |
华为 FusionSphere 6.x |
FusionSphere虚拟化套件高级版, 备注:6颗CPU许可,含1年软件服务 |
1 |