英特尔反击AMD数据中心AI性能声明称通过适当优化第五代Xeon比AMDEPYCTurin更快

导读 英特尔反击AMD数据中心AI性能声明:称通过适当优化,第五代Xeon比AMDEPYCTurinZen5更快1英特尔跟进了AMD对其第五代EPYCTurinCPU的数据中心A...

英特尔反击AMD数据中心AI性能声明:称通过适当优化,第五代Xeon比AMDEPYCTurin“Zen5”更快1

英特尔跟进了AMD对其第五代EPYCTurinCPU的数据中心AI性能声明,称第五代Xeon在经过正确的优化后速度更快。

AMD展示了其配备Zen5核心的第五代EPYCTurinCPU,在AI基准测试中击败了第五代Xeon芯片,但英特尔表示,如果使用正确的优化,第五代芯片将领先于EPYC

在2024年台北国际电脑展上,AMD正式宣布了其代号为Turin的第五代EPYCCPU系列,该系列采用了最新的Zen5核心架构。该公司与代号为EmeraldRapids的英特尔第五代Xeon系列相比,尤其是在AI吞吐量工作负载方面,取得了一些重大突破,但英特尔现已澄清,这些基准测试是在没有对其Xeon系列进行适当优化的情况下进行的,而实施这些优化后,即使是第五代Xeon在AI性能方面也应该能够轻松超越第五代EPYCTurin。

英特尔特别强调的基准测试是Llama2-7BChatbot,它基于INT4推理吞吐量,延迟为50ms。AMD展示了其第5代EPYCCPU在2S(双插槽)配置中,每个内核有128个,可提供高达671个token/s的性能,而英特尔第5代XeonPlatinum8592+芯片在相同的双插槽配置中,每个内核有64个,仅提供125个token/s的输出。对于AMDEPYCTurinCPU来说,这是一个巨大的5.4倍增益。

英特尔表示,基准测试是在没有适合第五代至强SKU的软件套件的情况下进行的,而AMD也没有在脚注中公布有关英特尔配置的任何细节。

蓝队现在已经在相同的AI工作负载下进行了性能基准测试,看起来结果截然不同。

使用英特尔PyTorch扩展(P99延迟),第五代EmeraldRapidsXeonCPU的输出性能比AMD展示的性能高出5.4倍。686Tokens/s的输出超过了AMD第五代EPYCZen5CPU的性能。这不仅要归功于英特尔对Llama2的软件优化,还要归功于第五代EmeraldRapids系列中增加的AI硬件加速器,它们提供了不错的提升。

英特尔并没有止步于此,该公司还表示,在其他两个工作负载(翻译和摘要)中,与AMD在2024年台北国际电脑展演示中使用结果相比,其性能提高了1.2倍到2.3倍。

免责声明:本文由用户上传,如有侵权请联系删除!