数据中心应用英特尔傲腾数据中心级持久内存的五大用例

作为英特尔新一代的内存和存储技术,英特尔傲腾数据中心级持久内存是多年来成功打入市场的极具变革性的创新技术之一。它拥有十分广泛的用途,并将大容量、DRAM般的性能以及数据持久性集于一身。如今,全球生态系统内的创新者们,正在不断发现这一革命性技术的更多用途。我们接下来重点讲述其中一部分用例,来展现该产品对数据中心将产生哪些重大影响。

1、使用SAP HANA进行内存分析

在当下这个数据爆炸的时代,内存数据库的部署正迎来快速增长。SAP很早便开始与英特尔围绕傲腾数据中心级持久内存展开合作,而SAP HANA也是该产品最初的用例之一。对于内存数据库而言,快速且经济实惠的大容量持久内存有着巨大的潜在优势,下面便是两个部署场景。

在现有的SAP HANA部署中,系统容量可以通过“扩展节点”——扩展现有处理节点的数据容量这一方式获得提升。英特尔的分析显示,与全DRAM的配置相比,配备7.5 TB DRAM和傲腾数据中心级持久内存的扩展节点,可以使数据库主存储中的可用数据增加25%,同时节省超过10%的系统硬件成本1。

在另一个场景中,不断增长的SAP HANA部署需要将多个老旧、内存受限的节点整合到全新、现代化的4插槽“扩展节点”中。这种情况下,搭载傲腾数据中心级持久内存的配置可以实现两倍于内存数据的容量,同时每数据库TB的总系统成本能够降低39%2。因此,无论是更新现有的SAP HANA部署,还是启动全新的部署,傲腾数据中心级持久内存的优势都非常明显——数据越多、成本越低。除上述成本和存储空间方面的优势外,英特尔傲腾数据中心级持久内存还能让大型分析系统实现更快重启,时间从几分钟缩短为几秒钟。如需了解更多傲腾数据中心级持久内存在内存数据库支持方面的案例,还可参考英特尔与Aerospike、Gigaspaces、微软、Oracle和Redis Labs的合作。

2、多租户数据库服务器虚拟化

企业对数据库服务的需求不断增长的同时,多租户数据库即服务(database-as-a-service)虚拟化已成为数据库经济、高效扩展的关键。通常情况下,随着每台服务器出现越来越多的虚拟机实例以及数据库规模不断扩大,系统的内存资源会变得越来越紧张,而不断增加DRAM只会导致成本过高。这种情况下,傲腾数据中心级持久内存兼具的大容量和经济性,成为了实现更高虚拟机密度和经济性扩展的一大突破口。

为此,英特尔在搭载Hyper-V的微软Windows Server 2019上进行了两个系统的虚拟化对比测试,且两个系统同时运行OLTP云基准测试。其中,一个平台配备768GB的DDR4 DRAM,另一个平台配备192GB的DDR4 DRAM加1TB的傲腾数据中心级持久内存。在这一场景中,采用傲腾数据中心级持久内存的系统可支持多达36%的虚拟机,且每虚拟机的成本能降低30%3,从而实现了每节点虚拟机密度更大的情况下,成本获得大幅降低。

3、内容分发网络(CDN)视频流

此外,内容分发网络(CDN)在扩展方面也会遇到上述类似的问题。据预测,2017年到2022年,IP总流量将增长3倍,其中超过80%的流量都来自视频,而这些视频的绝大部分则来自现代化边缘服务器上产生的流传输或直播视频4。在此背景下,内容提供商需要增加每台服务器的数据流数量,因而也就需要更多内存。而英特尔傲腾数据中心级持久内存在大容量和经济性方面的优势,同样能帮助内容提供商通过经济实惠的方式进行扩展。

在比较中,假定服务质量(QoS)等于标准HTTP GETs的99%这一目标设定。配备第二代英特尔至强金牌6252处理器和1.5TB内存的平台,均能在这一QoS下提供高质量视频。然而,配备傲腾数据中心级持久内存的平台可降低超过40%的内存成本5,这意味着随着边缘端内容交付的增加,这一举措可以快速节省大量成本。

4、利用SAS VIYA平台进行人工智能/机器学习分析

SAS VIYA是一个用来进行高级分析的多产品家族,其中包括用于复杂数据分析任务(如图像、语言和情感分析)的内存人工智能和机器学习。在SAS VIYA平台的扩展方面,如果使用大量DRAM来扩展,硬件平台的成本会显著增加。在英特尔的测试中,当同时在SAS VIYA平台运行3个分析模型时,用户可以使用配备1.5 TB DRAM或1.5 TB傲腾数据中心级持久内存及192GB DRAM的平台来实现类似的分析吞吐量。然而,后一种搭载傲腾数据中心级持久内存的配置能够以高达43%的内存成本节约来提供同一水平的机器学习服务6。因此,英特尔将继续提升AI性能,降低AI成本,并推动这一强大技术成为主流。

5、超融合基础架构扩展

值得一提的是,英特尔傲腾数据中心级持久内存的优势并不仅限于大规模、多TB级别的应用。在适当场景下,一定数量的持久内存能产生重大影响。例如,随着软件定义的超融合基础架构在现代化的公有云和私有云中越来越受欢迎,微软Azure HCI等Windows Server软件定义技术已成为领先的解决方案之一,而超融合基础架构的经济性在很大程度上便取决于每节点的虚拟机密度。

英特尔在一项测试中比较了运行微软Windows Storage Spaces Direct的不同内存配置,一种是384GB的DDR4 DRAM,另一种是分布在四节点上的512GB英特尔傲腾数据中心级持久内存和192GB的DRAM。测试结果显示,使用傲腾数据中心级持久内存获得的额外内存容量,能使每个节点的虚拟机数量增加35%。此外,傲腾数据中心级持久内存在做到这一点的同时,还使每台虚拟机的硬件成本降低了27%,且不需要占用巨大的多TB内存

VMware 6.7 对PMEM的支持


  PMem即持久性内存,性能上接近传统内存,成本上和flash ssd差不多。上图展示的就是使用传统存储和PMem的区别。

  左边是传统存储,上面是CPU,中间是内存,下面是存储和存储控制器。读数据的时候,数据块先从存储中读到CPU的缓存中,再推送给内存存放,当有数据变化的时候,内存和CPU之间就会有一些交互进行数据更改,最终CPU会将变化的数据提交给硬盘保存。这一套流程相对来说效率会低一些,PMem则可以让CPU和存储之间进行直接的交互,明显提高了效率。

  6.7之后我们又引入了虚拟NVDIMM,可以在虚拟机内进行虚拟设备的添加,一个虚拟NVDIMM设备作为虚拟硬件存在,去实现一些特定功能。每个虚拟机可以支持64个虚拟NVDIMM设备。


  上图中有两个虚拟机,他们有各自不同的访问方式。右边是一个传统的虚拟机,它如果要想使用PMem设备,必须要通过存储策略来进行设置,然后添加一个PMem虚拟磁盘,基于这样的存储策略完成存储的读取和访问,这种方式被叫做虚拟磁盘模式。

  左侧的是一个比较先进的虚拟机,我们叫它PMem-aware,这个虚拟机中的应用程序和OS知道底层是什么样的存储,也就是持久性内存,这样的话虚拟机在进行读写的时候,就可以通过虚拟设备直接访问存储,这种方式叫做直接访问模式。这两种方式功能上是一样的,只不过内部原理实现不同。

  基于虚拟磁盘的方式虽然在效率和性能上会低一些,但是使用范围更广。第一它支持所有虚拟机版本硬件,第二对于传统的OS也支持,只不过不支持IO filters。同样也可以使用Storage vMotion将虚拟机迁移到传统存储中。还可以在主机和datastore之间进行迁移。

  新的技术在性能上当然会更高一些,但是有很多限制,第一必须是最新版本的虚拟机(14或以上),第二只支持最新的操作系统(Windows server 2016或者RHEL 7.4),支持的应用程序也必须要读到PMem环境,最后的限制是不能将虚拟机迁移到传统存储设备上。

更多用途尚待挖掘

如今,集大容量、经济性和数据持久性于一身的英特尔傲腾数据中心级持久内存,已成为一项具有多样用途并得到广泛应用的技术。上面介绍的五大用例,不只是这一革命性技术为数据中心和数字服务带来变革的冰山一角,还是开启傲腾数据中心级持久内存未来更多广泛应用的一大开端。在不断探索的道路上,英特尔将与更多客户携手合作,来共同发现傲腾数据中心级持久内存更多、更精彩的用途。

如需深入了解英特尔傲腾数据中心级持久内存及如何使用该内存帮助您和您的客户,请访问intel.com/optane

  1. 数据库主存储中的可用数据增加了25%(1.25 倍),节省了10% 的成本(1.10 倍):基准:基于Lightning Ridge的单节点4 路英特尔至强铂金8280M处理器,搭载48x 128 GB DDR4 2666 MHz GB总内存,SUSE 15上ucode待定,60x 英特尔固态盘DC S4600系列 SATA 480GB TB,在5.83TB 数据库上运行的SAP HANA分析工作负载,超线程关闭,睿频关闭,测试由英特尔在2019 年 3 月 15 日进行。新配置:基于Lightning Ridge的单节点4路英特尔至强铂金8280L处理器,搭载24x 128GB DRAM及24x 256GB英特尔傲腾 DC PMEM总内存,SUSE 15上的ucode待定,75x英特尔固态盘DC S4600 系列 SATA 480GB,在7.3TB数据库上运行SAP HANA 分析负载,超线程关闭,睿频关闭,测试由英特尔在2019年3月15 日进行。

成本脚注(截至2019年3月15日的定价):基准成本:系统总成本 =$171,453 [cpu成本 =$52048,按容量计算内存子系统成本:48x128GB = $91,834,存储成本= $19,968,机箱、PSUs、启动驱动器等 =$7603] VS新配置成本:系统总成本 =$152,609 [cpu 成本 =$52048,按满载容量计算内存子系统成本:=$67,998($16,998 的 DDR4 + $51,000的英特尔傲腾 DC PMEM),存储成本=$24,960,机箱、PSU、启动驱动器等=$7603]。

  1. 每个数据库的总系统成本降低高达39%(1.39 倍):基准:基于Lightning Ridge的 5节点4 路英特尔至强铂金8280L处理器,搭载6TB总内存(48插槽/128 GB/2666),SUSE 15上 ucode待定,60x英特尔固态盘 DC S4600 系列SATA 480GB,在3TB数据库上运行SAP HANA* 分析负载,超线程关闭,睿频关闭,测试由英特尔在2019 年 3 月 15 日进行。新配置:基于 Lightning Ridge 的5节点4路英特尔至强铂金 8280M 处理器,搭载9TB总内存(24x 256GB 英特尔傲腾DCPMM + 24x 128GB DDR4 2666),SUSE 15上ucode待定,90x 英特尔固态盘DC S4600系列SATA 480GB,在6TB数据库上运行SAP HANA* 分析负载,超线程关闭,睿频关闭,测试由英特尔在2019年3月15 日进行。

成本脚注(截至 2019年3月15 日的定价):基准成本:每TB数据库的总系统成本:$67,215 [cpu 成本 = $52048,按容量计算内存子系统成本:48x128GB = $91834,存储成 = $20,160,机箱、PSU、启动驱动器等=$7603,单系统成本=$201,645] VS新配置成本:每TB 数据库的总系统成本:$40,717 [cpu 成本 = $52048,按满载容量计算内存子系统成本:=$96,917($45,917 的 DDR4 + $51,000 的英特尔傲腾 DC PMEM),存储成本=$38,156,机箱、PSU、启动驱动器等=$7603,单系统成本=$244,300]。

  1. 对于采用英特尔傲腾 数据中心级持久内存模块 (DCPMM) 的多租户虚拟化OLTP数据库,每个节点可增加36%的虚拟机(1.36倍):单节点2路26核第二代英特尔至强可扩展处理器,超线程开启,睿频开启,768GB 0(24插槽/32GB/2666 DDR),1 个三星PM963 M.2 960GB,7 个三星PM963 M.2 960GB,4个英特尔固态盘 S4600 (1.92TB),1 个英特尔X520 SR2 (10Gb),Windows服务器2019 RS5-17763,OLTP Cloud Benchmark,测试由英特尔在2019 年 3 月 31日进行。单节点2 路26核第二代英特尔至强可扩展处理器,超线程开启,睿频开启,192GB,1TB(12插槽/16 GB/2666 DDR + 8插槽/128GB/2666英特尔傲腾 DCPMM),1 个三星PM963 M.2 960GB,7个三星PM963 M.2 960GB,4个英特尔固态盘S4600 (1.92TB),1 个英特尔X520 SR2 (10Gb),Windows服务器2019 RS5-17763,OLTP云基准测试,测试由英特尔在2019年1月31日进行。

对于采用英特尔傲腾数据中心级持久内存模块 (DCPMM)的多租户虚拟化OLTP数据库,每个虚拟机可降低30%的成本(1.30 倍):成本脚注(截至 2019年3月15 日的定价):基准成本:系统总成本:$29,408 [cpu 成本= $7310,按容量计算内存子系统成本:24X 64GB = $16,998,存储成本= $2,100,机箱、PSU、启动驱动器等=$3000] VS新配置成本:系统总成本:$22,024 [cpu 成本 = $7,310,按满载容量计算内存子系统成本:=$9,614($2,690的DDR4 + $6,924的英特尔傲腾 DC PMEM),存储成本=$2,100,机箱、PSU、启动驱动器等=$3,000]。

  1. 来源: 思科视觉网络指数:预测和趋势,2017–2022, 2018年11月28日https://www.cisco.com/c/en/us/solutions/collateral/service-provider/visual-networking-index-vni/white-paper-c11-741490.html

  2. 高质量视频内容传输的内存成本降低高达 40%(1.40 倍):基准:基于S2600WFT平台的单节点2路英特尔至强金牌2.10 GHz 6252处理器,1.5 TB总内存(24x 64 GB,2666 MT/秒),CentOS Linux 7.5.1804 版(内核)4.19.0-rc3+ ucode 0x04000010,4.19.0-rc3+(主机),英特尔固态盘DC P4510系列1TB,2个双端口英特尔以太网控制器XXV710用于25GbE SFP28 (rev 02) NUMA Aligned 100Gbps LAG,Apache流量服务器7.1.4,NGINX 1.12.2,超线程开启、睿频开启,数据集= 512 X 103,1 MB 随机网页内容,测试由英特尔在2019年1月15日进行。
    新配置:基于S2600WFT平台的单节点2路英特尔至强金牌2.10 GHz 6252处理器,搭载192GB + 1.5 TB 总内存(12x 128 GB 英特尔傲腾DCPMM + 12x 16GB 2666 MT/秒DDR4),CentOS Linux 7.5.1804 版(内核)4.19.0-rc3+ ucode 0x04000010,4.19.0-rc3+(主机),英特尔固态盘DC P4510系列1TB,2 个双端口英特尔以太网控制器XXV710用于25GbE SFP28 (rev 02) NUMA Aligned 100Gbps LAG,Apache流量服务器7.1.4,NGINX 1.12.2,超线程开启、睿频开启,数据集= 512 X 103,1 MB 随机网页内容,测试由英特尔在2019年1月15日进行。

成本脚注(截至 2019 年 3 月 15 日的定价):基准成本:系统总成本:$29,408 [cpu 成本= $7310,按容量计算内存子系统成本:24X 64GB = $16,998,存储成本 = $2,100,机箱、PSU、启动驱动器等 =$3000] VS新配置成本:系统总成本:$22,024 [cpu 成本 = $7310,按满载容量计算内存子系统成本:=$9,614($2,690 的 DDR4 + $6,924 的英特尔傲腾 DC PMEM),存储成本=$2,100,机箱、PSU、启动驱动器等=$3,000]。

  1. 运行SAS机器学习工作负载时,内存成本降低高达43%(1.43 倍):基准:基于Purley Wolfpass (2S) 的单节点2路英特尔至强8280 处理器,24x 64GB DDR4 1536GB总内存,CentOS 7.6上的ucode 0x4000013,4.19.8,1 个1.5TB英特尔固态盘 DC P4610 系列NVMe硬盘,运行3个并发逻辑回归任务的SAS机器学习工作负载,每个任务为400GB 数据,超线程开启,睿频开启,运行时间=15:39分钟,测试由英特尔在2019 年2月14日进行。新配置:基于 Purley Wolfpass (2S) 的单节点2路英特尔至强8280 处理器,1536GB 总内存(12x 128GB 英特尔傲腾 DCPMM + 12x 16GB DDR4),CentOS 7.6上的ucode 0x4000013, 4.19.8, 1 个1.5TB 英特尔固态盘DC P4610系列NVMe硬盘,运行3个并发逻辑回归任务的SAS机器学习工作负载,每个任务为400GB 数据,超线程开启,睿频开启,运行结果=16:0分钟,测试由英特尔在2019 年2月15日进行

成本脚注(截至 2019 年 3 月 15 日的定价):基准成本:系统总成本:$38,316 [cpu成本= $20,018,按容量计算内存子系统成本:24X 64GB=$16,998,机箱、PSU、启动驱动器等=$1,300],VS新配置成本:系统总成本:$30,932 [cpu成本= $20,018,按满载容量计算内存子系统成本:=$9,614($2,690 的 DDR4 + $6,924 的英特尔傲腾 DC PMEM),机箱、PSU、启动驱动器等=$1,300]。

  1. 超融合基础架构的虚拟机数量最高增加35%(1.35 倍),成本降低27%(1.27 倍):基准:基于 S2600WFD平台的4节点2路英特尔至强金牌 6230 处理器,384 GB 总内存(24x 16GB DDR4,2933 MT/秒),ucode 0x04000013,运行 Windows服务器2019,10.0.17763,2 个英特尔傲腾固态盘 P4800X 375GB,1x Chelsio 25G NIC (iWARP),工作负载:vmfleet 和 diskspd 结果=41 台虚拟机(设置:基准设置:Vmfleet 测试:每个虚拟机带1个内核,8 GB 内存,40 GB VHDX,测试设置:线程= 2,缓冲区大小= 4KiB,模式:随机,持续时间= 300 秒,队列深度= 16,30%写入,操作系统:Windows服务器2019标准版(带更新补丁的台式机版本),超线程开启,睿频开启,微软测试时间:2019 年 2 月 15 日。新配置:基于 S2600WFD平台的4节点2路英特尔至强金牌6230处理器,512GB总内存(12x 16GB DDR4 + 4x 128GB英特尔傲腾 DCPMM),ucode 0x04000013,运行Windows服务器2019,10.0.17763,2个英特尔傲腾固态盘P4800X 375GB,1x Chelsio 25G NIC (iWARP),工作负载:vmfleet和diskspd结果=56台虚拟机(设置:基准设置:Vmfleet 测试:每个虚拟机带1个内核,8 GB内存,40 GB VHDX,测试设置:线程= 2,缓冲区大小= 4KiB,模式:随机,持续时间 = 300 秒,队列深度 = 16,30% 写入,操作系统:Windows服务器2019标准版(带更新补丁的台式机版本),超线程开启,睿频开启,微软测试时间:2019 年 2 月 15 日。

成本脚注(截至 2019 年 3 月 15 日的定价):基准成本:总系统成本(4个节点):$136,882 [cpu 成 = $3,788,按容量计算内存子系统成本:24x 16GB= $5,379,存储 = $8,338,机箱、PSU、启动驱动器等 =$1300,总系统成本=$34,220],VS新配置成本:系统总成本:(4 个节点):$135,355 [cpu成本= $3,788,按满载容量计算的内存子系统成本= $4,998($2,690的 DDR,$2,308的英特尔傲腾 DC PMEM),存储= $8,338,机箱、PSU、启动驱动器 = $1,300,系统总成本=$33,839]。

英特尔和英特尔标识是英特尔公司在美国和其他国家(地区)的商标。

*文中涉及的其它名称及品牌属于各自所有者资产。

点赞

发表评论

电子邮件地址不会被公开。必填项已用 * 标注