英伟达GPU“屠榜”,谷歌TPU“退赛”,MLPerf最新推理榜单出炉

微信扫一扫,分享到朋友圈

英伟达GPU“屠榜”,谷歌TPU“退赛”,MLPerf最新推理榜单出炉

MLPerf 推理基准测试第二版(v0.7)近日发布。

在数据中心分类下,英伟达 2 年前的推理卡 T4 依然能 ” 大杀特杀 “,7 月推出的 A100 毫无意外占据榜单第一名。

英伟达表示 A100 在数据中心推荐系统测试中,其表现出的性能比英特尔 Cooper Lake CPU 高 237 倍,即使是 T4 也比 CPU 高出 28 倍。

△ 图片来自英伟达官方

英伟达在官方博客中称,英伟达在第二版 MLPerf 推理榜中赢得了数据中心和边缘计算系统六个应用领域的所有测试。

可以看出,每项任务的前五名都被英伟达的 AI 加速硬件占据,包括 DGX A100、Quadro RTX 专业卡以及 T4。

△ 图片来自 Tirias Research

然而事情没有那么简单。

参赛厂商明增实减

MLPerf 是业内首套衡量机器学习软硬件性能的通用基准,由图灵奖得主 David Patterson 联合谷歌和几所著名高校于 2018 年发起。

MLPerf 组织去年第一次发布推理基准测试结果,当时的榜单非常混乱,从数据中心到手机的 AI 推理性能全都在一张表格中,没有做出场景区分。

这一次 MLPerf v0.7 将榜单分为 4 个部分:数据中心、边缘、手机、笔记本电脑。

除了之前的 ResNet 图像分类、SSD-Large 目标检测任务,MLPerf v0.7 推理还增加了 4 个基准测试:NLP 模型 BERT、推荐模型 DLRM、医学影响模型 3D U-Net 以及代表语音识别模型 RNN-T。

本次提交的测试数量也大大增加,从 43 个增加到 327 个,与之不成比例的是,提交成绩的公司数量仅仅从 9 个增加到 21 个。

看似竞争更加激烈,但实际上参与的硬件上游厂商反而更少了。上次提交成绩的阿里平头哥含光、谷歌 TPU都缺席了本次测试。

这导致英伟达在数据中心分类下的竞争对手只剩下 3 个:英特尔的 CPU、赛灵思和初创公司NEUCHIPS两家的 FPGA。

为何厂商不积极跑分

经过一年时间的完善,MLPerf 推理基准测试显然更加合理了,作为一个宣传硬件的绝佳窗口,为何各大厂商反而不积极了呢?

机器学习和 HPC 高级分析师 Karl Freund 认为,有 3 个原因导致 AI 芯片公司参加 MLPerf 态度冷淡:

像英特尔 Habana 和 Tenstorrent 之类的许多公司都还没有做好运行 MLPerf 等复杂基准的准备;

厂商要花费大量精力来运行和优化这些基准测试并参与同行评审过程;

除了英特尔、英伟达等大公司,大部分公司没有足够精力用在运行 MLPerf 上,他们主要是把资源花在与客户的合作上。

不过,Karl 依然认为英特尔在数据中心 AI 方面依旧是其他厂商难以比拟的。主要是因为英伟达有着惊人的软硬件优化,凭借其生态系统培养了很多开发人员。

而且英伟达在 AI 上投入巨大,最近还主导建设了全球第七快的 AI 超级计算机 Selene,投入数千万美元也是其他 AI 公司难以承受的。

所以在 AI 跑分这件事上,” 钞能力 ” 还是必不可少的。

虽然 MLPerf 不能完全反应真实情况,但英伟达 GPU 在榜单中巨大的占比只能说明:在 AI 生态中,英伟达依然是霸主。

参考链接:

https://blogs.nvidia.com/blog/2020/10/21/inference-mlperf-benchmarks/

https://mlperf.org/inference-results-0-7

https://www.forbes.com/sites/moorinsights/2020/10/21/why-cant-nvidia-be-bested-in-mlperf/

依图超车争夺AI创业第一股!冲刺科创板,募资75亿为造芯,去年营收91%投向研发

上一篇

量子位「MEET 2021智能未来大会」来啦!邀智能科技企业共探明日行业新格局

下一篇

你也可能喜欢

英伟达GPU“屠榜”,谷歌TPU“退赛”,MLPerf最新推理榜单出炉

长按储存图像,分享给朋友