0 引言
來源: 作者:吳美希,楊曉彤
論文引用格式:
吳美希, 楊曉彤. 算力五力模型: 一種衡量算力的綜合方法[J]. 信息通信技術與政策, 2022,48(3):13-21.
算力五力模型:一種衡量算力的綜合方法
吳美希 楊曉彤
(中國信息通信研究院云計算與大數據研究所,北京 100191)
摘要:提出“算力五力模型”來綜合評估數據中心的算力情況。該模型解決了算力評價過程中不同類型指標度量單位不統一的問題,同時結合雙向投影法和TOPSIS方法,更加科學有效地對算力綜合情況進行了評估。最后,通過算力說明該模型的有效性和實用性。
關鍵詞:算力;算效;算力基礎設施;數據中心
中圖分類號:F49 文獻標志碼:A
引用格式:吳美希, 楊曉彤. 算力五力模型: 一種衡量算力的綜合方法[J]. 信息通信技術與政策, 2022,48(3):13-21.
DOI:10.12267/j.issn.2096-5931.2022.03.003
0 引言
數字經濟時代,萬物萬聯產生各種各樣的大數據,在數據已成為勞動、資本、土地和技術之外的第5個生產要素的背景之下,數字經濟的騰飛離不開算力的支持,算力就是數字經濟時代的生產力。
2020年3月4日,中共中央政治局常務委員會召開會議,首次將數據中心納入“新基建”范疇。2020年4月20日,國家發展和改革委員會明確新型基礎設施的范圍,數據中心作為算力基礎設施,成為信息基礎設施的重要組成部分。隨后,在2020—2021年,國家部委相繼出臺《關于加快構建全國一體化大數據中心協同創新體系的指導意見》《全國一體化大數據中心協同創新體系算力樞紐實施方案》《新型數據中心發展三年行動計劃(2021—2023年)》等政策文件,對數據中心對于算力的支撐的地位和作用進行了進一步明確。數字經濟發展離不開算力,算力發展離不開數據中心。
對于算力如何度量和表示,業界一直在不斷地探索。從狹義上講,算力是服務器通過對數據進行處理后實現結果輸出的一種能力,目前為止使用最廣泛的算力表示方法為“浮點運算次數”。每秒浮點運算次數(Floating-Point Operations Per Second,FLOPS)概念最早由Frank H.McMahon[1]在其報告中提出。國內外不少文獻以及服務器產品參數都采用浮點運算次數對算力進行描述。例如,Yifan Sun[2]等使用FLOPS作為度量標準,評估CPU和GPU的單精度和雙精度計算能力。從廣義上講,算力是一個包含計算、存儲、傳輸(網絡)等多個內涵的綜合概念,是衡量數據中心計算能力的一個綜合指標[3],所以目前亟需一個科學的方法來將算力的內涵充分表達出來。
多屬性群決策[4-7](Multi-Attribute Group Decision Making,MAGDM)是多屬性決策(Multi-Attribute Decision Making,MADM)和群體決策(Group Decision Making,GDM)交叉的研究方向,是現代決策科學的一個重要研究領域,其理論和方法已廣泛應用于城市規劃、經濟管理、投資風險等領域。當下,對于不同數據中心間算力綜合各類指標的評估問題可以歸結為多屬性群決策問題。為了綜合評價算力,本文提出“算力五力模型”,將與數據中心計算能力高度相關的通用算力、智能算力、算效能力、存儲能力、網絡能力等不同量綱的指標進行融合比對,利用新的雙向投影法[8]及TOPSIS方法[9-11]計算得到樣本的相對貼近度,進而對不同樣本的算力進行定級,解決了不同量綱變量難以直接比較的困難,提高了評估結果的綜合性和有效性。本文為算力評估體系提供新的模型和方法,更好地指導和建議業界判斷行業發展趨勢,為未來算力規劃和部署提供思路。
1 相關理論
1.1 相關定義
1.2 雙向投影模型
2 算力五力模型
2.1 算力衡量指標的選擇
算力是數據中心的服務器通過對數據進行處理后實現結果輸出的一種能力,是衡量數據中心計算能力的一個綜合指標,數值越大代表綜合計算能力越強[17]。在服務器主板上,數據傳輸的順序依次為中央處理器[18](Central Processing Unit,CPU)、內存、硬盤和網卡,若針對圖形則需要圖形處理器[19](Graphics Processing Unit,GPU)。所以,從廣義上講,數據中心算力是一個包含計算、存儲、傳輸(網絡)等多個內涵的綜合概念,是衡量數據中心計算能力的一個綜合指標[20]。
數據中心算力由數據處理能力、數據存儲能力和數據流通能力三項指標決定。其中,數據處理能力,在應對以大數據、人工智能[21]為代表的新一代數字化技術產業趨勢過程中,又可以區分為以CPU為代表的通用計算能力,和以GPU、AI芯片為代表的智能計算能力。前者主要用作執行一般任務,后者主要承擔圖形顯示、大數據分析、信號處理、人工智能和物理模擬等計算密集型任務。綜上,本文選取5個指標進行算力評估,分別為:通用算力、智能算力、算效能力、網絡能力、存儲能力。
通用算力:通用算力主要指由CPU為代表的通用計算能力,本次使用平均單機架“每秒浮點運算次數”來評估數據中心的通用算力,單位采用TFLOPS(FP32,單精度浮點算力)。
智能算力:智能算力主要指由GPU、AI芯片為代表的智能計算能力,本文使用平均單機架“每秒浮點運算次數”來評估數據中心的智能算力,單位采用TFLOPS(FP32,單精度浮點算力)。
算效能力:數據中心算效(CE)為數據中心算力與所有IT設備功耗的比值,是同時考慮數據中心計算性能與功率的一種效率,即“數據中心IT設備每瓦功耗所產生的算力”,本文算效的單位采用GFLOPS/W(FP32)。
其中,CP表示算力,為通用算力與智能算力的加和。
網絡能力:網絡能力有很多衡量指標,本文主要采用網絡帶寬速度來衡量網絡的性能,單位為Mbit/s,即每秒傳輸的比特位數。
存儲能力:存儲能力主要由存儲容量、存儲性能、存儲安全3方面共同決定,本文采用每秒讀寫次數(Input/Output Operations Per Second,IOPS)來衡量存儲的性能,即每秒的讀寫次數。
2.2 模型構造
本節將數據中心測量的信息與雙向投影模型結合,給出利用雙向投影法處理不同數據中心算力方面不同指標間信息的決策模型,構建算力五力模型,并通過實例分析,說明該決策模型具有良好的效果。模型具體步驟如下。
步驟2.2.1:根據數據將指標劃分等級。具體將已有的數據取最大和最小值,在最大值與最小值的區間內進而劃分等級,一般越理想的一端標記等級數越高。
步驟2.2.2:將數據進行定級,并轉化為優序數(0~1之間的實數)。具體按步驟2.2.1劃分的等級數表對現有數據對號入座,確定相應的等級數,每個指標下,將不同數據中心兩兩對比,判斷出一數據中心在某指標下優于或劣于另一數據中心的等級數,并通過優序數計算公式將各等級數轉變到0~1之間,方便接下來處理。
步驟2.2.3:確定正、負理想解,并根據定義4,通過計算確定出對應的向量。
步驟2.2.4:據式(9)(10),分別計算出每個數據中心對應的投影值。
步驟2.2.5:由式(11)計算得出每個數據中心的相對貼近度。
步驟2.2.6:根據相對貼近度的值進行大小排序,并據相對貼近度的值對每個數據中心進行星級評定,最終得出結論。
3 算力五力案例分析
現給出6個數據中心對應的5個指標(通用算力、智能算力、算效能力、網絡能力、存儲能力)數據,如表1所示。
根據專家的經驗和數據分布的情況,評估步驟如下。
步驟3.1.1:根據數據將所選的5個指標進行分級,如表2所示。
步驟3.1.2:將表1的數據根據表2數據中心算力指標分級表進行定級,在每個指標下,每個數據中心的等級數兩兩進行比較,得到相對等級數并轉化為優序數,如表3~表5所示。
表3 數據中心算力指標定級
步驟3.1.3:確定正、負理想解,并計算確定出相應的向量。
A+= {[0. 57,0,0. 67,0. 67,0,0. 8],[0,0,1,0. 57,0,1],[0,0. 57,0. 67,0,0,0. 8],[0. 57,0,0. 57,0. 57,0. 8, 0. 8 ], [ 0. 57, 0, 0. 67, 0, 0. 67, 0. 67 ]}。
A-={[ -0. 67,-0. 8,-0. 57,-0. 57,-0. 8,0],[ - 1,- 1,0,-0. 8,-1,0],[0. 8,0. 67,-0. 57,0. 8,0. 8,0],[ -0. 67,-0. 8,-0. 67,-0. 67,0,0],[ -0. 57,-0. 67,0,- 0. 67,0,0]}。
A-A+= {[0. 8,1. 24],[1,1. 37],[0. 8,1. 24],[0. 8,1. 24],[0. 67,1. 14]}。
A-A1= {[ 0. 23,1. 14], [ 1,1. 37], [ 0. 8,1. 24],[0. 23,0. 67],[0. 10,0. 57]}。
A1A+= {[ 0. 10, 0. 57 ], [ 0, 0 ], [ 0, 0 ], [ 0. 13,0. 57],[0. 10,0. 57]};
A-A2= {[ 0. 8,1. 24], [ 1,1. 37], [ 0. 23,1. 14],[0. 8,1. 24],[0. 67,1. 14]}。
A2A+= {[0,0],[0,0],[0. 10,0. 57],[0,0],[0,0]}。
A-A3= {[ 0. 10, 0. 57 ], [ 0, 0 ], [ 0. 10, 0. 57 ],[0. 23,0. 67],[0,0]}。
A3A+= {[ 0. 23,1. 14],[ 1,1. 37],[ 0. 23,1. 14],[0. 13,0. 57],[0. 67,1. 14]}。
A-A4= {[0. 10,0. 57],[0. 43,0. 8],[0. 8,1. 24],[0. 23,0. 67],[0. 67,1. 14]}。
A4A+= {[ 0. 23, 1. 14 ], [ 0. 2, 0. 57 ], [ 0, 0 ],[0. 13,0. 57],[0,0]}。
A-A5= {[0. 8,1. 24],[1,1. 37],[0. 8,1. 24],[0,0],[0,0]}。
A5A+= {[ 0, 0 ], [ 0, 0 ], [ 0, 0 ], [ 0. 8, 1. 24 ],[0. 67,1. 14]}。
A-A6= {[0,0],[0,0],[0,0],[0,0],[0,0]}。
A6A+= {[ 0. 8, 1. 24 ], [ 1, 1. 37 ], [ 0. 8, 1. 24 ],[0. 8,1. 24],[0. 67,1. 14]}。
根據表5確定出正、負理想解,將每個數據中心在每個指標下的測度與正、負理想解距離計算出來,繪出圖2,在下面組圖中,紅色線圈表示每個數據中心的每個指標距離相對正理想解的距離。若紅色線圈越小,表示該數據中心各指標相對距離正理想解越近,則該數據中心越優;反之相反。藍色線圈表示每個數據中心的每個指標距離相對負理想解的距離。藍色線圈越大,表示該數據中心的指標距離負理想解越遠,則該數據中心越優;反之相反。在圖2組圖中,我們可以較為直觀地看出DC.6整體情況最不好,DC.1、DC.2整體相對更優。
步驟3.1.4:計算相應的投影值。
得到相對應的模分別為如下。
A-A+≈3.3392; A-A1≈2.6915; A1A+≈1.0077; A-A2≈3.2149。
A2A+≈0.5793; A-A3≈1.0807; A3A+≈2.7735; A-A4≈2.3621。
A4A+≈1.4385; A-A5≈2.6882; A5A+≈1.9808; A-A6≈0。
A6A+≈3.3392。
在此,將每個數據中心得到的模(整體距離正、負理想解的距離)繪制成圖3,紅色線圈對應的數據中心越靠近中心位置,表示該數據中心整體距離正理想解越近,整體情況就越好;反之相反。藍色線圈對應的數據中心越靠近圖中的外延,表示該數據中心整體距離負理想解越遠,整體情況便越好;反之相反。可較為直觀地看出,圖中DC.1、DC.2、DC.4、DC.5相對較好,DC.3、DC.6相對較差,這與最后得出的結論吻合。
圖3 樣本數據到正、負理想方案的距離
Pr jA-A+(A-A1)≈2.5085;Pr jA1A+(A-A+)≈2.2966。
Pr jA-A+(A-A2)≈3.1669;Pr jA2A+(A-A+)≈1.3528。
Pr jA-A+(A-A3)≈0.7713;Pr jA3A+(A-A+)≈3.1156。
Pr jA-A+(A-A4)≈2.1685;Pr jA4A+(A-A+)≈2.3606;
Pr jA-A+(A-A5)≈2.1642;Pr jA5A+(A-A+)≈1.9808;
Pr jA-A+(A-A6)=0;Pr jA6A+(A-A+)≈3.3391。
步驟3.1.5:根據公式計算得出各數據中心的相對貼近度。
C(A1)≈0.5220;C(A2)≈0.7007;C(A3)≈0.1984;C(A4)≈0.4788;C(A5)≈0.5221;C(A6)=0。
步驟3.1.6:根據相對貼近度的值進行大小排序,并依據表6確定各數據中心的星級,最終得出結論。對應可得:DC.1★★★★;DC.2 ★★★★★;DC.3 ★★;DC.4★★★;DC.5 ★★★★;DC.6 ★。
4 結束語
算力作為數據中心的重要能力支撐著人工智能、物聯網、AR/VR等上層應用場景的發展,同時這些應用場景的快速普及也對數據中心算力水平提出了更高的要求。算力受到計算、網絡、存儲和功耗的共同影響,如果無法綜合測量便無法進行改進,所以對數據中心算力進行綜合評價就顯得尤為重要。
本文基于對數據中心算力的研究,將通用算力、智能算力、算效能力、網絡能力、存儲能力劃分等級,并應用雙向投影法和TOPSIS方法對各數據中心進行評估,提出“算力五力模型”。該模型使得到的結果區分度更高,更加真實地反映出不同數據中心間的優劣關系。但本文所提出的方法沒有考慮數據測量誤差,不同指標間是否有固定比例搭配使得整體效能更優等因素,這將在未來的研究中進行探索。
參考文獻
[1] McMahon FH. The livermore fortran kernels: a computer test of the numerical performance range[R], 1986.
[2] Sun Y, Agostini NB, Dong Sun, et al. Summarizing CPU and GPU design trends with product data[J]. arXiv preprint arXiv:1911.11313, 2019.
[3] 郭亮, 吳美希, 王峰, 等. 數據中心算力評估:現狀與機遇[J]. 信息通信技術與政策, 2021,47(2):79-86.
[4] Yue CY. Decision Theory and Method[M]. 北京:中國科學技術大學出版社, 2003.
[5] Rao C, Chen W, Wang C. Research and application of fuzzy grey multi-attribute group decision making[C]. 2008 Chinese Control and Decision Conference. IEEE, 2008:2292-2295.
[6] Jun G, Tao HU, Ting YU, et al. A multi-attribute group decision-making approach based on uncertain linguistic information[C]. 2019 Chinese Control And Decision Conference(CCDC). IEEE, 2019:4125-4128.
[7] Fang WG, Hong Z. A multi-attribute group decisionmaking method approaching to group ideal solution[C]. 2007 IEEE International Conference on Grey Systems and Intelligent Services. IEEE, 2007:815-819.
[8] Ye J. Bidirectional projection method for multiple attributegroup decision making with neutrosophic numbers[J]. Neural Computing and Applications, 2015,28(5):1-9.
[9] Chen CT. Extensions of the TOPSIS for group decisionmaking under fuzzy environment[J]. Fuzzy sets and Systems, 2000, 114(1):1-9.
[10] Shih HS, Shyur HJ, Lee ES. An extension of TOPSIS for group decision making[J]. Mathematical and Computer Modelling, 2007,45(7-8):801-813.
[11] Aiping Y. A novel model for dynamic multi- attributes group decision-making based on vague set and its TOPSIS solution[C]. Proceedings of the 29th Chinese Control Conference. IEEE,2010:5539-5543.
[12] 張金清. 序方法與均衡分析[M]. 上海:復旦大學出版社, 2003.
[13] 張小芝, 朱傳喜. 多屬性決策的廣義等級偏好優序法[J]. 系統工程理論與實踐, 2013,33(11):2853-2858.
[14] Zhang X, Liu P. A grey relational projection method for multi-attribute decision making based on intuitionistic trapezoidal fuzzy number[J]. Applied Mathematical Modelling, 2013,37(5):3467-3477.
[15] Ye J. Bidirectional projection method for multiple attribute group decision making with neutrosophic numbers[J]. Neural Computing and Applications, 2017,28(5):1021-1029.
[16] Opricovic S, Tzeng GH. Compromise solution by MCDM methods: a comparative analysis of VIKOR and TOPSIS[J]. European Journal of Operational Research, 2004,156(2):445-455.
[17] 工業和信息化部. 新型數據中心發展三年行動計劃(2021-2023 年)[EB/OL]. (2021-07-04)[2022-02-01]. http://www.gov.cn/zhengce/zhengceku/2021-07/14/content_5624964.htm.
[18] Haywood A, Sherbeck J, Phelan P, et al. Investigating a relationship among CPU and system temperatures, thermal power, and CPU tasking levels[C]. 13th InterSociety Conference on Thermal and Thermomechanical Phenomena in Electronic Systems. IEEE, 2012:821-827.
[19] Nickolls J, Dally W J. The GPU computing era[J]. IEEE micro, 2010,30(2):56-69.
[20] 開放數據中心委員會. 數據中心算力白皮書[R], 2021.
[21] Ignatov A, Timofte R, Denna M, et al. Real-time quantized image super-resolution on mobile npus, mobile ai 2021 challenge: Report[C]. Roceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2021:2525-2534.
Five forces of computational power: a comprehensive method to measure computational power
WU Meixi, YANG Xiaotong
(Cloud Computing & Big Data Research Institute, China Academy of Information and Communications Technology, Beijing 100191, China)
Abstract: In this paper, the “Five Forces of Computational Power” is proposed to comprehensively evaluate the computational power of data centers. The model solves the problem that the measurement units of different types of indicators are not unified in the process of computational power evaluation, and combines the bidirectional projection method and TOPSIS method to evaluate the comprehensive situation of computational power more scientifically and effectively. Finally, an example is given to illustrate the validity and practicability of the model.
Keywords: computational power; computational efficiency; computational infrastructure; data center