找回密码
 立即注册

QQ登录

只需一步,快速开始

工控课堂 首页 工控文库 上位机编程 查看内容

手把手建立Roofline模型(CPU)

2022-10-24 20:05| 发布者: gk-auto| 查看: 822| 评论: 0|来自: www.cnblogs.com

摘要: Roofline模型原理Roofline模型是由加州理工大学伯利克提出的用来建立当前计算平台在不同的计算强度(Operational Intensity)下能够达到的理论计算上限 。论文和基础理论和应用Roofline Model与深度学习模型的性能分 ...

Roofline模型原理

Roofline模型是由加州理工大学伯利克提出的用来建立当前计算平台在不同的计算强度(Operational Intensity)下能够达到的理论计算上限 。论文和基础理论和应用 Roofline Model与深度学习模型的性能分析 。本文旨在教授如何根据当前开发环境机器建立该模型,并简单的介绍如何根据算法计算OI(计算强度)。

硬件参数" style="margin: 10px 0px; padding: 0px; font-size: 21px; line-height: 1.5; color: rgb(216, 216, 216); font-family: Lato, "PingFang SC", "Microsoft YaHei", sans-serif; background-color: rgb(32, 32, 32);">需要准备的硬件参数

对于CPU而言,我们需要一下参数:

频率内存带宽(double)Avx512 UnitFma
Intel® Xeon® Gold 61482.7GHz39.74GB/s22

其中Avx512、Fma并非是必备参数。

查询CPU相关指标方法或网站:

计算相关参数:
当前CPU的理论峰值:

=512AVXFMA32/64

AVX和FMA并不是必要参数,32/64取决于当前处理问题是单精度(32)或者双精度(64)

由上述公式,我们可以计算出Xeon Gold 6148的计算双精度理论性能峰值为2.7GHz*2(avx)*2(FMA)/64=86.4Gfplos。

计算当前内存带宽:

通常情况下我们可以通过 wikichip 搜索到,当然也可以通过 StreamBenchmark 程序获取。

建立Roofline模型

image

Roofline模型中的相关参数公式如下,并计算Xeon Gold 6148 的参数: