查看原文
其他

中国信通院吴美希等:算力五力模型——一种衡量算力的综合方法

The following article is from 信息通信技术与政策 Author 吴美希,杨晓彤


0  引言
数字经济时代,万物万联产生各种各样的大数据,在数据已成为劳动、资本、土地和技术之外的第5个生产要素的背景之下,数字经济的腾飞离不开算力的支持,算力就是数字经济时代的生产力。
2020年3月4日,中共中央政治局常务委员会召开会议,首次将数据中心纳入“新基建”范畴。2020年4月20日,国家发展和改革委员会明确新型基础设施的范围,数据中心作为算力基础设施,成为信息基础设施的重要组成部分。随后,在2020—2021年,国家部委相继出台《关于加快构建全国一体化大数据中心协同创新体系的指导意见》《全国一体化大数据中心协同创新体系算力枢纽实施方案》《新型数据中心发展三年行动计划(2021—2023年)》等政策文件,对数据中心对于算力的支撑的地位和作用进行了进一步明确。数字经济发展离不开算力,算力发展离不开数据中心。
对于算力如何度量和表示,业界一直在不断地探索。从狭义上讲,算力是服务器通过对数据进行处理后实现结果输出的一种能力,目前为止使用最广泛的算力表示方法为“浮点运算次数”。每秒浮点运算次数(Floating-Point Operations Per Second,FLOPS)概念最早由Frank H.McMahon[1]在其报告中提出。国内外不少文献以及服务器产品参数都采用浮点运算次数对算力进行描述。例如,Yifan Sun[2]等使用FLOPS作为度量标准,评估CPU和GPU的单精度和双精度计算能力。从广义上讲,算力是一个包含计算、存储、传输(网络)等多个内涵的综合概念,是衡量数据中心计算能力的一个综合指标[3],所以目前亟需一个科学的方法来将算力的内涵充分表达出来。
多属性群决策[4-7](Multi-Attribute Group Decision Making,MAGDM)是多属性决策(Multi-Attribute Decision Making,MADM)和群体决策(Group Decision Making,GDM)交叉的研究方向,是现代决策科学的一个重要研究领域,其理论和方法已广泛应用于城市规划、经济管理、投资风险等领域。当下,对于不同数据中心间算力综合各类指标的评估问题可以归结为多属性群决策问题。为了综合评价算力,本文提出“算力五力模型”,将与数据中心计算能力高度相关的通用算力、智能算力、算效能力、存储能力、网络能力等不同量纲的指标进行融合比对,利用新的双向投影法[8]及TOPSIS方法[9-11]计算得到样本的相对贴近度,进而对不同样本的算力进行定级,解决了不同量纲变量难以直接比较的困难,提高了评估结果的综合性和有效性。本文为算力评估体系提供新的模型和方法,更好地指导和建议业界判断行业发展趋势,为未来算力规划和部署提供思路。
1  相关理论
1.1  相关定义
1.2  双向投影模型
2  算力五力模型
2.1  算力衡量指标的选择算力是数据中心的服务器通过对数据进行处理后实现结果输出的一种能力,是衡量数据中心计算能力的一个综合指标,数值越大代表综合计算能力越强[17]。在服务器主板上,数据传输的顺序依次为中央处理器[18](Central Processing Unit,CPU)、内存、硬盘和网卡,若针对图形则需要图形处理器[19](Graphics Processing Unit,GPU)。所以,从广义上讲,数据中心算力是一个包含计算、存储、传输(网络)等多个内涵的综合概念,是衡量数据中心计算能力的一个综合指标[20]
数据中心算力由数据处理能力、数据存储能力和数据流通能力三项指标决定。其中,数据处理能力,在应对以大数据、人工智能[21]为代表的新一代数字化技术产业趋势过程中,又可以区分为以CPU为代表的通用计算能力,和以GPU、AI芯片为代表的智能计算能力。前者主要用作执行一般任务,后者主要承担图形显示、大数据分析、信号处理、人工智能和物理模拟等计算密集型任务。综上,本文选取5个指标进行算力评估,分别为:通用算力、智能算力、算效能力、网络能力、存储能力。
通用算力:通用算力主要指由CPU为代表的通用计算能力,本次使用平均单机架“每秒浮点运算次数”来评估数据中心的通用算力,单位采用TFLOPS(FP32,单精度浮点算力)。
智能算力:智能算力主要指由GPU、AI芯片为代表的智能计算能力,本文使用平均单机架“每秒浮点运算次数”来评估数据中心的智能算力,单位采用TFLOPS(FP32,单精度浮点算力)。
算效能力:数据中心算效(CE)为数据中心算力与所有IT设备功耗的比值,是同时考虑数据中心计算性能与功率的一种效率,即“数据中心IT设备每瓦功耗所产生的算力”,本文算效的单位采用GFLOPS/W(FP32)。
其中,CP表示算力,为通用算力与智能算力的加和。网络能力:网络能力有很多衡量指标,本文主要采用网络带宽速度来衡量网络的性能,单位为Mbit/s,即每秒传输的比特位数。
存储能力:存储能力主要由存储容量、存储性能、存储安全3方面共同决定,本文采用每秒读写次数(Input/Output Operations Per Second,IOPS)来衡量存储的性能,即每秒的读写次数。
2.2  模型构造
本节将数据中心测量的信息与双向投影模型结合,给出利用双向投影法处理不同数据中心算力方面不同指标间信息的决策模型,构建算力五力模型,并通过实例分析,说明该决策模型具有良好的效果。模型具体步骤如下。
步骤2.2.1:根据数据将指标划分等级。具体将已有的数据取最大和最小值,在最大值与最小值的区间内进而划分等级,一般越理想的一端标记等级数越高。步骤2.2.2:将数据进行定级,并转化为优序数(0~1之间的实数)。具体按步骤2.2.1划分的等级数表对现有数据对号入座,确定相应的等级数,每个指标下,将不同数据中心两两对比,判断出一数据中心在某指标下优于或劣于另一数据中心的等级数,并通过优序数计算公式将各等级数转变到0~1之间,方便接下来处理。步骤2.2.3:确定正、负理想解,并根据定义4,通过计算确定出对应的向量。步骤2.2.4:据式(9)(10),分别计算出每个数据中心对应的投影值。步骤2.2.5:由式(11)计算得出每个数据中心的相对贴近度。步骤2.2.6:根据相对贴近度的值进行大小排序,并据相对贴近度的值对每个数据中心进行星级评定,最终得出结论。
3  算力五力案例分析
现给出6个数据中心对应的5个指标(通用算力、智能算力、算效能力、网络能力、存储能力)数据,如表1所示。

根据专家的经验和数据分布的情况,评估步骤如下。步骤3.1.1:根据数据将所选的5个指标进行分级,如表2所示。

步骤3.1.2:将表1的数据根据表2数据中心算力指标分级表进行定级,在每个指标下,每个数据中心的等级数两两进行比较,得到相对等级数并转化为优序数,如表3~表5所示。

表3  数据中心算力指标定级



步骤3.1.3:确定正、负理想解,并计算确定出相应的向量。A+= {[0. 57,0,0. 67,0. 67,0,0. 8],[0,0,1,0. 57,0,1],[0,0. 57,0. 67,0,0,0. 8],[0. 57,0,0. 57,0. 57,0. 8, 0. 8 ], [ 0. 57, 0, 0. 67, 0, 0. 67, 0. 67 ]}。A-={[ -0. 67,-0. 8,-0. 57,-0. 57,-0. 8,0],[ - 1,- 1,0,-0. 8,-1,0],[0. 8,0. 67,-0. 57,0. 8,0. 8,0],[ -0. 67,-0. 8,-0. 67,-0. 67,0,0],[ -0. 57,-0. 67,0,- 0. 67,0,0]}。A-A+= {[0. 8,1. 24],[1,1. 37],[0. 8,1. 24],[0. 8,1. 24],[0. 67,1. 14]}。A-A1= {[ 0. 23,1. 14], [ 1,1. 37], [ 0. 8,1. 24],[0. 23,0. 67],[0. 10,0. 57]}。A1A+= {[ 0. 10, 0. 57 ], [ 0, 0 ], [ 0, 0 ], [ 0. 13,0. 57],[0. 10,0. 57]};A-A2= {[ 0. 8,1. 24], [ 1,1. 37], [ 0. 23,1. 14],[0. 8,1. 24],[0. 67,1. 14]}。A2A+= {[0,0],[0,0],[0. 10,0. 57],[0,0],[0,0]}。A-A3= {[ 0. 10, 0. 57 ], [ 0, 0 ], [ 0. 10, 0. 57 ],[0. 23,0. 67],[0,0]}。A3A+= {[ 0. 23,1. 14],[ 1,1. 37],[ 0. 23,1. 14],[0. 13,0. 57],[0. 67,1. 14]}。A-A4= {[0. 10,0. 57],[0. 43,0. 8],[0. 8,1. 24],[0. 23,0. 67],[0. 67,1. 14]}。A4A+= {[ 0. 23, 1. 14 ], [ 0. 2, 0. 57 ], [ 0, 0 ],[0. 13,0. 57],[0,0]}。A-A5= {[0. 8,1. 24],[1,1. 37],[0. 8,1. 24],[0,0],[0,0]}。A5A+= {[ 0, 0 ], [ 0, 0 ], [ 0, 0 ], [ 0. 8, 1. 24 ],[0. 67,1. 14]}。A-A6= {[0,0],[0,0],[0,0],[0,0],[0,0]}。A6A+= {[ 0. 8, 1. 24 ], [ 1, 1. 37 ], [ 0. 8, 1. 24 ],[0. 8,1. 24],[0. 67,1. 14]}。
根据表5确定出正、负理想解,将每个数据中心在每个指标下的测度与正、负理想解距离计算出来,绘出图2,在下面组图中,红色线圈表示每个数据中心的每个指标距离相对正理想解的距离。若红色线圈越小,表示该数据中心各指标相对距离正理想解越近,则该数据中心越优;反之相反。蓝色线圈表示每个数据中心的每个指标距离相对负理想解的距离。蓝色线圈越大,表示该数据中心的指标距离负理想解越远,则该数据中心越优;反之相反。在图2组图中,我们可以较为直观地看出DC.6整体情况最不好,DC.1、DC.2整体相对更优。

步骤3.1.4:计算相应的投影值。得到相对应的模分别为如下。A-A+≈3.3392; A-A1≈2.6915; A1A+≈1.0077; A-A2≈3.2149。A2A+≈0.5793; A-A3≈1.0807; A3A+≈2.7735; A-A4≈2.3621。A4A+≈1.4385; A-A5≈2.6882; A5A+≈1.9808; A-A6≈0。A6A+≈3.3392。
在此,将每个数据中心得到的模(整体距离正、负理想解的距离)绘制成图3,红色线圈对应的数据中心越靠近中心位置,表示该数据中心整体距离正理想解越近,整体情况就越好;反之相反。蓝色线圈对应的数据中心越靠近图中的外延,表示该数据中心整体距离负理想解越远,整体情况便越好;反之相反。可较为直观地看出,图中DC.1、DC.2、DC.4、DC.5相对较好,DC.3、DC.6相对较差,这与最后得出的结论吻合。
图3  样本数据到正、负理想方案的距离
Pr jA-A+(A-A1)≈2.5085;Pr jA1A+(A-A+)≈2.2966。Pr jA-A+(A-A2)≈3.1669;Pr jA2A+(A-A+)≈1.3528。Pr jA-A+(A-A3)≈0.7713;Pr jA3A+(A-A+)≈3.1156。Pr jA-A+(A-A4)≈2.1685;Pr jA4A+(A-A+)≈2.3606;Pr jA-A+(A-A5)≈2.1642;Pr jA5A+(A-A+)≈1.9808;Pr jA-A+(A-A6)=0;Pr jA6A+(A-A+)≈3.3391。
步骤3.1.5:根据公式计算得出各数据中心的相对贴近度。C(A1)≈0.5220;C(A2)≈0.7007;C(A3)≈0.1984;C(A4)≈0.4788;C(A5)≈0.5221;C(A6)=0。
步骤3.1.6:根据相对贴近度的值进行大小排序,并依据表6确定各数据中心的星级,最终得出结论。对应可得:DC.1★★★★;DC.2 ★★★★★;DC.3 ★★;DC.4★★★;DC.5 ★★★★;DC.6 ★。

4  结束语
算力作为数据中心的重要能力支撑着人工智能、物联网、AR/VR等上层应用场景的发展,同时这些应用场景的快速普及也对数据中心算力水平提出了更高的要求。算力受到计算、网络、存储和功耗的共同影响,如果无法综合测量便无法进行改进,所以对数据中心算力进行综合评价就显得尤为重要。
本文基于对数据中心算力的研究,将通用算力、智能算力、算效能力、网络能力、存储能力划分等级,并应用双向投影法和TOPSIS方法对各数据中心进行评估,提出“算力五力模型”。该模型使得到的结果区分度更高,更加真实地反映出不同数据中心间的优劣关系。但本文所提出的方法没有考虑数据测量误差,不同指标间是否有固定比例搭配使得整体效能更优等因素,这将在未来的研究中进行探索。
参考文献
[1] McMahon FH. The livermore fortran kernels: a computer test of the numerical performance range[R], 1986.[2] Sun Y, Agostini NB, Dong Sun, et al. Summarizing CPU and GPU design trends with product data[J]. arXiv preprint arXiv:1911.11313, 2019.[3] 郭亮, 吴美希, 王峰, 等. 数据中心算力评估:现状与机遇[J]. 信息通信技术与政策, 2021,47(2):79-86.[4] Yue CY. Decision Theory and Method[M]. 北京:中国科学技术大学出版社, 2003.[5] Rao C, Chen W, Wang C. Research and application of fuzzy grey multi-attribute group decision making[C]. 2008 Chinese Control and Decision Conference. IEEE, 2008:2292-2295.[6] Jun G, Tao HU, Ting YU, et al. A multi-attribute group decision-making approach based on uncertain linguistic information[C]. 2019 Chinese Control And Decision Conference(CCDC). IEEE, 2019:4125-4128.[7] Fang WG, Hong Z. A multi-attribute group decisionmaking method approaching to group ideal solution[C]. 2007 IEEE International Conference on Grey Systems and Intelligent Services. IEEE, 2007:815-819.[8] Ye J. Bidirectional projection method for multiple attributegroup decision making with neutrosophic numbers[J]. Neural Computing and Applications, 2015,28(5):1-9.[9] Chen CT. Extensions of the TOPSIS for group decisionmaking under fuzzy environment[J]. Fuzzy sets and Systems, 2000, 114(1):1-9.[10] Shih HS, Shyur HJ, Lee ES. An extension of TOPSIS for group decision making[J]. Mathematical and Computer Modelling, 2007,45(7-8):801-813.[11] Aiping Y. A novel model for dynamic multi- attributes group decision-making based on vague set and its TOPSIS solution[C]. Proceedings of the 29th Chinese Control Conference. IEEE,2010:5539-5543.[12] 张金清. 序方法与均衡分析[M]. 上海:复旦大学出版社, 2003.[13] 张小芝, 朱传喜. 多属性决策的广义等级偏好优序法[J]. 系统工程理论与实践, 2013,33(11):2853-2858.[14] Zhang X, Liu P. A grey relational projection method for multi-attribute decision making based on intuitionistic trapezoidal fuzzy number[J]. Applied Mathematical Modelling, 2013,37(5):3467-3477.[15] Ye J. Bidirectional projection method for multiple attribute group decision making with neutrosophic numbers[J]. Neural Computing and Applications, 2017,28(5):1021-1029.[16] Opricovic S, Tzeng GH. Compromise solution by MCDM methods: a comparative analysis of VIKOR and TOPSIS[J]. European Journal of Operational Research, 2004,156(2):445-455.[17] 工业和信息化部. 新型数据中心发展三年行动计划(2021-2023 年)[EB/OL]. (2021-07-04)[2022-02-01]. http://www.gov.cn/zhengce/zhengceku/2021-07/14/content_5624964.htm.[18] Haywood A, Sherbeck J, Phelan P, et al. Investigating a relationship among CPU and system temperatures, thermal power, and CPU tasking levels[C]. 13th InterSociety Conference on Thermal and Thermomechanical Phenomena in Electronic Systems. IEEE, 2012:821-827.[19] Nickolls J, Dally W J. The GPU computing era[J]. IEEE micro, 2010,30(2):56-69.[20] 开放数据中心委员会. 数据中心算力白皮书[R], 2021.[21] Ignatov A, Timofte R, Denna M, et al. Real-time quantized image super-resolution on mobile npus, mobile ai 2021 challenge: Report[C]. Roceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2021:2525-2534.


作者简介



 吴美希 

中国信息通信研究院云计算与大数据研究所数据中心部工程师,高级业务主管,主要从事数据中心相关的政策支撑、产业咨询、技术研究和标准制定等工作。



 杨晓彤 

中国信息通信研究院云计算与大数据研究所数据中心部助理工程师,主要从事数据中心相关的政策支撑、产业咨询、技术研究等工作。


论文引用格式:

吴美希, 杨晓彤. 算力五力模型: 一种衡量算力的综合方法[J]. 信息通信技术与政策, 2022,48(3):13-21.



本文刊于《信息通信技术与政策》2022年 第3期



主办:中国信息通信研究院


《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“信息通信技术前沿的风向标,信息社会政策探究的思想库”,聚焦信息通信领域技术趋势、公共政策、国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动5G、工业互联网、数字经济、人工智能、区块链、大数据、云计算等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用的高端学术交流平台。


 

《信息通信技术与政策》投稿指南
为进一步提高期刊信息化建设水平,为广大学者提供更优质的服务,我刊官方网站已正式投入运行,欢迎投稿!




 




校  审 | 陈  力、珊  珊

编  辑 | 凌  霄


推荐阅读

中国信通院王少鹏等:算网协同对算力产业发展的影响分析
数字化转型专家谈



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存