NetApp EF570全闪存阵列的配置和评测方法资料概述

描述

去年,NetApp在其大数据分析的产品组合中引入了几款新产品,包括最新的全闪存阵列(AFA),NetApp EF570。EF570是一款中端AFA,是专为2U系统设计的高性能、高可用、简单和高性价比的产品。

NetApp声称EF570具有“极端”的性能,虽然我们并不夸张,但该公司引用了一些令人印象深刻的数据。NetApp声称该阵列可以达到100万以上的IOPS和21GB / s的连续带宽,延迟低于100微秒。所有这些性能都针对专门的混合工作负载的环境,包括大数据分析。除了承诺的性能之外,该阵列还支持多种高速主机接口,包括32Gb光纤通道,25Gb iSCSI,100Gb InfiniBand,12Gb SAS和基于InfiniBand的100Gb NVMe。这不仅有助于速度的提升,还有助于保持持续的存储网络投资。

与几个其他的NetApp系统一样,高可用性是内置的; 在这里,EF570也不例外。该阵列没有单点故障,并带有完全冗余的I / O路径和自动故障转移,还具备6个9的可用性。EF570还提供了常见的数据管理功能,包括快照,卷拷贝和镜像。同时,SANtricity OS可确保数据完整性,防止静默数据损坏。该阵列能够通过后台监控和广泛的诊断数据和分析来检测和解决大多数问题。

NetApp EF570采用模块化设计,易于扩展。一个 2U系统可以支持高达367TB的容量,如果添加4个扩展架,可以使总容量高达1.8PB。通过SANtricity GUI,用户可以在不增加管理复杂性的情况下进行扩展,并在不到10分钟的时间内访问其数据。这种高扩展性和大容量的特点使EF570具有很高的性价比。能够扩展到1.8PB的能力也增加了该阵列的吸引力,可以避免将来的叉车式升级。

NetApp EF570配置

阵列

设计和建造

如上所述,EF570是2U AFA。与绝大多数NetApp产品(至少是最近的产品)一样,边框看起来与时尚的裸金属外壳一样,通风口和NetApp品牌标志在左侧。挡板下面是24个2.5英寸硬盘托架,垂直穿过阵列的前部。阵列的右侧有NetApp品牌标志,电源,Attention和Locate按钮和LED在左侧。

我们再看到设备后部,可以清楚地看到高可用性/冗余设计。该阵列从左到右是一个镜像设置。底部充满了PSU。上半部分有两个控制器。控制器配置有四端口32Gb HIC(主机接口卡),每个控制器有两个ASIC。未使用片上FC端口,这将为每个控制器提供一个额外的ASIC路径。对于我们的测试,我们在双32Gb交换机上使用了最佳的布局。

管理

在我们之前的NetApp评测中,我们查看了该公司的ONTAP操作系统。虽然ONTAP是更受欢迎且知名度高的操作系统,但EF系列实际上是由SANtricity OS提供支持的。

SANtricity的主屏幕为管理员提供整个系统的布局。可以轻松地看到性能(IOPS,MB / s和CPU或按不同的时间框架查看),容量以及存储层次结构。屏幕左侧是选项卡:主页,存储,硬件,设置和支持。

在Storage main选项卡下,有几个选项可供选择,以深入了解一个存储正在执行的操作,包括:池和卷组,卷,主机,性能,快照,异步镜像和同步镜像。

单击池和卷组,我们可以查看所有容量或预留容量。用户可以从那里创建新池或卷组,为其添加容量或编辑它们。

在“卷”下,用户可以创建或编辑卷,也可以获取有关当前卷的信息,例如名称,状态,是否启用精简配置,分配位置,LUN数量,属于哪个池或卷组,以及容量。

我们总是对性能比较感兴趣,对于想要了解其存储性能的管理员,他们可以通过存储功能下的性能部分进行检查。在这里,为用户提供了一些不同指标下的性能视图,可以将其视为逻辑视图,物理视图或应用程序和工作负载视图。

深入了解物理性能,可以选择查看控制器、通道或硬盘的性能。

“硬件”选项卡显示硬件及其运行方式。在正面,用户可以检查硬盘,以查看一切是否正常运行以及是否需要换出某些东西(用颜色表示,蓝色表示正常)。

硬件选项后面的也是类似,只有时间控制器和PSU采用颜色编码,以确保它们正常运行。

“设置”选项卡显示有关系统和iSCSI设置或用户要添加的其他设置的常规信息。此选项卡下还有各种配置选项。

性能

应用程序的工作负载分析

NetApp EF570的应用程序工作负载基准测试包括SysBench的MySQL OLTP性能测试和模拟TPC-C工作负载的Microsoft SQL Server OLTP性能测试。在每种情况下,我们使用26个Toshiba PX04SV SAS 3.0 SSD,配置成2个12个硬盘组成的RAID10,并固定到每个控制器。剩余2个SSD作为备件。然后创建两个5TB的卷,每个磁盘组一个。在我们的测试环境中,这为我们的SQL和Sysbench工作负载创建了均衡负载。

SQL Server性能

每个SQL Server VM配置有两个虚拟磁盘:100GB卷用于引导,500GB卷用于数据库和日志文件。从系统资源的角度来看,我们为每个VM配置了16个vCPU,64GB的DRAM并利用了LSI Logic SAS SCSI控制器。虽然之前测试的Sysbench工作负载在存储I / O和容量方面都使平台达到了饱和,但SQL测试正在寻找延迟性能。

此测试使用再Windows Server 2012 R2客户虚拟机上运行的SQL Server 2014,并且由Quest的Benchmark Factory for Databases进行压力测试。虽然此基准测试的传统用法是在本地或共享存储上测试大型的3,000级的数据库,但在此次迭代中,我们专注于在NetApp EF570上均匀分布四个1,500级数据库(每个控制器两个VM)。

SQL Server Testing Configuration (per VM)

Windows Server 2012 R2

Storage Footprint: 600GB allocated, 500GB used

SQL Server 2014

Database Size: 1,500 scale

Virtual Client Load: 15,000

RAM Buffer: 48GB

Test Length: 3 hours

2.5 hours preconditioning

30 minutes sample period

SQL Server OLTP Benchmark Factory LoadGen Equipment

Dell EMC PowerEdge R740xd Virtualized SQL 4-node Cluster

8 Intel Xeon Gold 6130 CPU for 269GHz in cluster (Two per node, 2.1GHz, 16-cores, 22MB Cache)

1TB RAM (256GB per node, 16GB x 16 DDR4, 128GB per CPU)

4 x Emulex 16GB dual-port FC HBA

4 x Mellanox ConnectX-4 rNDC 25GbE dual-port NIC

VMware ESXi vSphere 6.5 / Enterprise Plus 8-CPU

对于SQL Server,NetApp EF570以快速的一致的方式执行,测量3,160 TPS并在所有四个VM上进行,总计为12,642.245 TPS。

阵列

所有VM都以3ms的响应时间执行。

阵列

Sysbench性能

每个  Sysbench  VM配置有三个虚拟磁盘,一个用于启动(~92GB),一个带有预构建的数据库(~447GB),第三个用于被测数据库(270GB)。从系统资源的角度来看,我们为每个VM配置了16个vCPU,60GB的DRAM并利用了LSI Logic SAS SCSI控制器。Load gen系统是Dell R740xd服务器。

Dell PowerEdge R740xd Virtualized MySQL 4 node Cluster

8 Intel Xeon Gold 6130 CPU for 269GHz in cluster (two per node, 2.1GHz, 16-cores, 22MB Cache)

1TB RAM (256GB per node, 16GB x 16 DDR4, 128GB per CPU)

4 x Emulex 16GB dual-port FC HBA

4 x Mellanox ConnectX-4 rNDC 25GbE dual-port NIC

VMware ESXi vSphere 6.5 / Enterprise Plus 8-CPU

Sysbench Testing Configuration (per VM)

CentOS 6.3 64-bit

Storage Footprint: 1TB, 800GB used

Percona XtraDB 5.5.30-rel30.1

Database Tables: 100

Database Size: 10,000,000

Database Threads: 32

RAM Buffer: 24GB

Test Length: 3 hours

2 hours preconditioning 32 threads

1 hour 32 threads

对于Sysbench,我们测试了几组VM,包括8,16和32个VM。这些测试的目的是展示给定阵列在中等饱和度的工作负载下的执行情况。在性能结果方面,并非所有的测评都会让我们失望,但NetApp EF570就是这样。在8VM负载下,EF570的测量值为22,951 TPS,超过了大多数阵列。16VM时,EF570仍然没有任何减速迹象,增加到令人难以置信的39,635 TPS。然而,在32VM,EF570达到57,347 TPS,停止增加不是因为缺少I/O,而是我们的8台主机上的CPU达到了饱和。

考虑到8,16和32VM工作负载的平均延迟,NetApp EF570继续给我们留下了深刻印象。在8VM时,它的测量值低至11.15ms,当负载增加到16VMs时仅增加到12.98ms。在32vms,大多数阵列开始失去动力,EF570仅增加到17.98ms。

纵观99%的延迟,NetApp EF570开始展现出了真实的实力,它不仅能够保持强大的吞吐量,而且具有极低的峰值延迟。

VDBench工作负载分析

在对存储阵列进行基准测试时,应用程序测试是最好的,合成测试排在第二位。虽然不是实际工作负载的完美表示,但综合测试确实使基准存储具有可重复性,从而可以轻松地在不同的解决方案之间进行逐项比较。这些工作负载提供了一系列不同的测试配置文件,包括“four corners”测试,常见的数据库传输大小测试,以及来自不同VDI环境的trace。所有这些测试都使用了常见的vdBench工作负载生成器,脚本引擎可以在大型计算测试集群中自动执行和捕获结果。这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。在阵列方面,我们使用了Dell PowerEdge R740x服务器集群:

简介:

4K随机读:100%读取,128个线程,0-120%iorate

4K随机写:100%写,64线程,0-120%iorate

64K顺序读:100%读取,16个线程,0-120%iorate

64K顺序写入:100%写入,8个线程,0-120%iorate

合成数据库:SQL和Oracle

VDI完全克隆和链接克隆trace

在4K峰值读性能方面,EF570以亚毫秒级延迟启动,并在510K IOPS附近短暂超过1ms,并在1ms内回落至近100万次IOPS。该阵列的峰值达到103万IOPS,延迟时间为2ms,然后才下降。

对于4K随机写入性能,在 200K的IOPS之前,EF570的延迟均小于1ms。EF570的 IOPS峰值大约为223K,延迟为4ms,然后稍微下降。

切换到64K顺序工作负载,直到大约190K IOPS或12GB / s,EF570都具有亚毫秒级延迟性能,峰值为247,692 IOPS,延迟2.1ms。

对于64K写入,直到接近结束或80K IOPS(5GB / s)时,AFA具有亚毫秒级延迟。该阵列的峰值为80,675 IOPS或5.04GB / s,延迟为3.2ms。

继续我们的SQL工作负载,EF570能够以1,029,910 IOPS达到峰值,延迟为818μs。

对于SQL90-10,阵列峰值为876,833 IOPS,延迟为957μs。

SQL 80-20是第一个在1ms延迟时接近峰值的SQL测试,峰值性能为740,691 IOPS,延迟为1.2ms。

接下来是我们的Oracle工作负载。EF570 1ms时的IOPS接近峰值。峰值为721,615 IOPS,延迟为1.35ms。

Oracle 90-10在整个过程中具有亚毫秒的延迟性能,峰值为875,567 IOPS,延迟为675μs。

Oracle 80-20继续保持亚毫秒级的延迟,峰值为738,238 IOPS,延迟为808μs。

接下来,我们切换到我们的VDI克隆测试,Full和Linked。对于VDI全克隆启动,EF570在1ms内达到了835K IOPS。峰值为841,945 IOPS,延迟为1.2ms。

对于VDI FC Initial Login,250K IOPS 之前,EF570的延迟低于1ms。峰值为262,141 IOPS,延迟为3.3毫秒。

对于VDI FC Monday Login,300K IOPS 之前,EF570具有亚毫秒级延迟。峰值为331,146 IOPS,延迟为1.5ms。

对于VDI LC Boot,EF570具有亚毫秒级延迟,峰值为519,975 IOPS,延迟为980μs。

VDI LC Initial Login延迟仍然低于1毫秒,峰值为269,995 IOPS,延迟为944μs。

对于VDI LC Monday Login,在270K的 IOPS之前,EF570能够保持1ms的延迟。峰值为299,663 IOPS,延迟为1.7ms。

结论

NetApp EF570是针对中端市场的2U全闪存阵列。EF570采用模块化设计,使其具有高可用性,并且可以轻松扩展。该阵列的一个非常有趣的方面是它的性能。NetApp表示,EF570可以达到100万IOPS和高达21GB / s的顺序带宽。并且该公司声称,所有的这些都可以在不到100μs的时间内完成。通过性价比来看,这种高性能、高可用性和简单的管理和扩展的特点,使其成为一个有吸引力的选择。

从应用程序性能来看,NetApp EF570能够创造我们实验室的新记录。在Benchmark Factory的四个3ms 的SQL VM测试中,SQL Server的性能表明,EF570能够实现非常紧凑和一致的性能。在我们扩展的Sysbench基准测试中,EF570得分非常高,以至于在阵列耗尽可用的I / O之前我们的计算集群已经饱和。在8VM时,我们测量到了22.9K TPS。在16VM时,EF570的TPS推升至39.6K,超过我们在RAID0 NVMe-oF闪存阵列上进行Sysbench测试的高记录。在32VMs,我们达到了测试集群的最高点,创造了57.3K的TPS结果。在所有这些结果中,平均值和第99百分位数的都很低而且很光滑。

在我们的VDBench结果中,EF570表现强劲,在一些基准测试中突破了100万的IOPS,包括4K读(103万,只有2ms延迟)和SQL(1,029,910 IOPS,延迟仅818μs)。在顺序读写方面,EF570分别能够以2.1毫秒和3.2毫秒的延迟达到15.5GB / s的读性能和5.04GB / s的写性能。该阵列还有其他一些值得称呼的性能参数。在SQL 90-10中,它达到了877K 的IOPS(957μs),在SQL 80-20上,它达到741K的 IOPS(1.2ms),在Oracle中,我们看到722K的 IOPS(1.35ms),在Oracle 90-10上,我们看的了876K的 IOPS(675μs),对于Oracle 80-20,我们看到了738K 的IOPS(808μs),对于VDI FC Boot,我们测得了842K的 IOPS(1.2ms),而对于VDI LC Boot,我们看到了520K的 IOPS(980μs)。

NetApp将EF570定位到了中端市场,但这主要是因为可扩展性。通常情况下,当我们考虑中端市场时,会让人联想到价格和性能。在这里,我们清楚的认为 EF570可能具有中端市场价格,但它提供了企业级的性能配置,可以打破我们在实验室中看到的所有内容。此外,在一些测试(32VM Sysbench)中,达到了我们计算集群的峰值,这意味着可能会有更好的性能。当涉及到块存储工作负载(如分析和新兴的AI风格的使用案例)时,延迟和可用性就意味着金钱,拥有专为此工作而设计的存储工具非常重要。NetApp EF570是这些工作负载的完美解决方案。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分