Storage

使用Weka™实现数百万IOPS的网络文件系统

By Ryan Meredith - 2020-06-24

我们如何在整个数据中心共享现代NVMe™驱动器的性能? 对于这个问题,有许多相互竞争的答案,也有许多公司提出了令人兴奋的解决方案.

正确的解决方案取决于正在使用的应用程序的需求. 跨服务器和应用程序共享数据的最简单方法是将数据加载到远程文件系统上. 基于文件的解决方案(如NFS和Windows SMB)由于易于使用而无处不在, 但人们并不知道它们的表现特别出色. 如果您需要远程文件系统存储和超高性能怎么办? Many high-value, file-system-based工作负载, 比如人工智能训练和推理, 能从高性能文件存储中获益吗. That’s where Weka™ comes in.

我在美光解决方案工程实验室的团队最近完成了一个概念验证,使用Weka将我们的主流美光7300 PRO与NVMe固态硬盘共享. 其结果——从一个文件系统获得数百万IOPS——是令人兴奋的.

Test Configuration

Weka构建了一个高性能、并行、共享的文件系统,称为WekaFS. According to Weka, 在生产环境中,部署通常至少运行8个节点, 但是,如果用户不需要用于节点重建的虚拟备用容量,则它可以在少至6个节点的情况下运行.

我们的测试使用4 + 2(数据+奇偶校验)擦除编码配置中的6个节点进行数据保护. Weka支持N + 2和N + 4擦除编码配置,支持两个或四个数据保护节点. 随着以数据为中心的节点数量的增加, 发生了两件事:写性能提高,数据暴露的可能性降低. (参见Weka数据保护 white paper for details.)

下面是我们在测试中使用的配置(图1):

  • 6x戴尔™R740xd 2U与2个英特尔6142处理器(16核2.60GHz)
  • 1x 100gbe Mellanox™ConnectX™-每台服务器5个网卡
  • 6x 7300 PRO 7.每台服务器68TB ssd(总共36个驱动器)
  • 9个前io负载发生器,每个具有100 GbE网卡
  • Cumulus™Linux™100gbe交换机(启用巨型帧)
  • WekaFS version 3.6.1
  • CentOS™ 7.6.1810 (kernel 3.10.0-957.el7.x86_64)

图1:测试基础架构概述
图1:测试基础架构概述

 

我们用的是美光7300 PRO 7.68TB SSD由于其高容量和令人信服的性能而适合此测试(表1)。.

Weka的安装和配置非常简单, 使我们能够快速配置这个系统. 对于那些在安装过程中需要帮助的人,Weka有一个很棒的支持团队.

表1:Micron 7300的性能特征

Model Capacity
4KB
Random Read (IOPs)
4KB
Random Write (IOPs)
4KB Random 
70/30 (IOPs)
128KB
Sequential Read 
128KB 
Sequential Write 
Micron 7300 PRO 7.68TB
520k 85k 190k 3.0 GB/s 1.8 GB/s

Test Methodology

评估使用美光7300 PRO固态硬盘的Weka解决方案的性能, 我们执行传统的“四角”测试策略, providing 100% read, 100%写和70%读/30%写混合, 小块工作负载用于测试每秒的操作数,大块工作负载用于测试100%的读写吞吐量.

我们使用9个客户端节点(每个节点运行8个)执行所有测试 fio 执行作业),每个客户端针对共享文件系统上的单独文件夹. 对于每个工作负载,我们增加队列深度(QD),直到确定最大性能级别. 我们将Weka配置为使用19个CPU内核, 其中6个内核专门用于管理每个Weka数据节点中6个数据驱动器的I/O.

Performance Results

我们的前三个测试主要关注以每秒输入/输出操作(IOPS)衡量的4KB块大小。. 我们还提供以微秒(µs)为单位的平均延迟。.

图2:小块、100%随机读取性能结果

图2:小块、100%随机读取性能结果

使用100% 4KB随机读取,我们看到性能随着队列深度的增加而不断提高. 在QD32中,达到的最大性能超过4.而平均延迟增加到487µs,比QD16增加63%(图2)。.

图3:小块、100%随机写入性能结果

图3:小块、100%随机写入性能结果

使用100% 4KB随机写, 当我们在626左右从QD1移动到QD4时,我们看到性能的快速增长,000 IOPS. 移动到更高的队列深度, IOPS显著稳定, 最多696个,延迟从QD8的830µs增加到1.QD16时6ms(图3).

In our experience, 在这种性能水平下,对远程文件系统的4KB随机写入实现亚毫秒级延迟是令人印象深刻的. 需要注意的是,写性能受到部署的数据节点数量的严重影响. 使用更多节点可以提高总体写性能.

图4:小块,70%读/30%写性能结果

图4:小块,70%读/30%写性能结果

最后,对于IOPS性能,我们使用4KB的70%读/30%写工作负载进行测试. I/O性能在1以上时达到峰值.600万IOPS,读时延467µs,时延3.QD16的写时间为6 ms(图4).

我们的下一个测试系列侧重于大块(128KB)顺序工作负载. 大块I/O测试试图模拟视频流等用例, 数据库决策支持系统, 或者大数据分析工作负载. 这种类型的工作负载测试以每秒千兆字节(GB/s)为单位测量数据吞吐率。.

图5:大块、100%顺序读性能结果

图5:大块、100%顺序读性能结果

首先,我们在队列深度范围内测试128KB顺序100%读取. 我们的最大性能在QD16时达到,在2时达到62 GB/s.平均延迟3毫秒(图5).

图6:大块、100%顺序写性能结果

图6:大块、100%顺序写性能结果

我们的测试表明,100% 128KB顺序写工作负载在QD16时也达到了最大吞吐量. 但是就像128KB的顺序读取工作负载一样, QD16写性能反映了相对于QD8延迟的增加, in this case, 大约高出86%(图6).

Conclusion

我们的测试表明,使用Weka可以获得令人印象深刻的性能. Micron NVMe SSDs, 比如美光7300, 在易于管理的文件系统解决方案中能否达到高水平的性能. 通过提供数据保护的软件定义解决方案产生数百万IOPS和GB/s的吞吐量, Weka突破了高性能文件存储的界限.

美光的7300固态硬盘NVMe提供了你所期望的NVMe的出色性能,成本和功耗通常在SATA解决方案中看到. 这些因素使得7300成为广泛部署场景(如Weka提供的基于文件的存储基础设施)的首选驱动器.

More Info

要了解有关Weka分布式文件系统的更多信息,请下载 WekaFS datasheet.

要了解更多沙巴体育安卓版下载美光NVMe固态硬盘的信息,如美光7300, 访问microron的数据中心SSD页面.com

Also, 请随时了解有关在数据中心解决方案中使用ssd的最新讨论, 就像Weka提供的那样, by following us on Twitter 和我们联系在一起 LinkedIn.

Ryan Meredith

Ryan Meredith

瑞安·梅雷迪思是美光存储事业部数据中心工作负载工程总监, 测试新技术,以帮助建立美光在人工智能和NVMe-oF/TCP等领域的思想领导力和意识, 以及全闪存软件定义的存储技术.

+