美国的最新禁运,会让中国下代超算遭致命打击?告诉你实情!

2019年06月25日09:28

来源:环球网

  最近这几天,有许多美国媒体幸灾乐祸,认为中国超算行业将受到致命打击,离开了美国的 CPU,中国将造不出超算。事实是这样的吗?这个禁令对我国的超算行业有什么影响?

  据多家媒体报道 , 在当地时间 6 月 21 日,美国商务部以国家安全为由,再次将中国的 5 家实体列入进出口管制的实体清单,禁止它们从美国的供应商采购零部件,相关决定于 6 月 24 日生效。这五家实体与中国超算行业的 " 三巨头 " 中的两位相关,涉及到 " 曙光 " 和 " 神威 " 两款超算。这五家实体中的江南计算技术研究所就是 " 神威 " 超算的研发制造单位。而其他四家实体,中科曙光,天津海光(Higon)、成都海光集成电路、成都海光微电子技术全都与 " 曙光 " 系列超算有关。

  最近这几天,有许多美国媒体幸灾乐祸,认为中国超算行业将受到致命打击,离开了美国的 CPU,中国将造不出超算。事实是这样的吗?这个禁令对我国的超算行业有什么影响?本文将对这个问题进行详细分析。

  首先,美国为什么要再次对我国超算企业进行制裁?

  实际上,早在 2015 年初,美国商务部就将中国的四大超算中心列入了禁运清单。这源于美国长久以来的焦虑:在大约 40 年中,中国的超算行业从完全进口美国产品,到购买美国的 CPU 自己制造超算,再到使用自己的 CPU 和加速器制造超算 ; 从只有几台超算,在全世界超算市场里不值一提,到拥有超算的数量全球第一,大大超越美国;从拥有的超算性能低下排不上号,到称霸全球最快超算排行榜第一名多年;中国超算行业走出了一条完美的逆袭之路。

  世界超算组织 top500.org 每半年推出一次全球最快的 500 台超算排行榜。今年 6 月刚刚推出了最新的榜单。全球最快的 500 台超算数量按国家的分布图如下:

  ▲数据来源于 top500.rog,由笔者整理

  TOP500 榜单中,中国超算的数量达到了 219 台,占全球的 44%,世界第一;美国以 116 台的数量占全球的 23%,比中国落后甚多。

  要知道,在仅仅一年前的 2018 年 6 月,中国在 TOP500 中的超算总数还是 206 台,美国还是 124 台。这一年中,中国又有了进步,美国又在退步。从趋势来看,中国的优势会越来越大。

  由于超算在军事,科研和经济中的巨大作用,美国心里的焦虑是可以理解的。他们急于抑制住中国的发展势头,于是就把商业诚信和公平贸易原则仍进下水道,祭出了禁运大法。那么,这次的禁运措施对中国超算行业有什么影响?

  对中国正在研制中的三台超算影响不大

  在 2018 年夏天,美国的超算 SUMMIT 终于排上了 TOP500 的第一名,把霸榜多年的中国 " 太湖之光 " 挤到了第二名,它比 " 太湖之光 " 快 60% 左右;接着,美国的另一台超算 Sierra 投入使用,它以微弱的优势把 " 太湖之光 " 挤到了第三位。

  美国的媒体兴奋起来,一改多年的沉默,开始吹嘘下一代超算的威力。所谓超算,是指每秒钟运算一百亿亿次的超级计算机,比SUMMIT还好快许多倍。美国的超算计划在 2021 年左右投入使用,而中国为超算准备了三个方案,全部使用国产 CPU 和加速器,也计划在 2020 到 2021 年期间陆续投入使用。

  这里需要介绍一下加速器,超算的核心部件不止是 CPU,由于超算做的是密集的科学计算工作,CPU 执行这样的计算任务并不是效率最高的,拥有众多运算单元的加速器处理器的效率更高,比较典型的加速器芯片就是Nvidia公司的通用型 GPU,以及英特尔公司的至强Xeon Phi处理器。

  最近几年出现的超算有一个趋势,就是使用一颗 CPU 带多颗加速器的架构,计算任务主要由加速器芯片完成,CPU 主要做协调,通讯和分配任务的工作。

  那么,美国的这次禁运对我们的超算有什么影响呢?让我们来仔细看看。

  我国为下一代超算准备的三套方案,全都使用国产 CPU 和加速器芯片:

  天河三号超算:

  2018 年 5 月 19 日,国家超算天津中心展示了天河三号原型机,在 2018 年底投入使用。天河三号的全配置主机计划在 2020 年投入使用,性能计划为 1EFlops. 天河三号将使用国产飞腾 FT2000plus 或者后续型号的 CPU,以及国防科技大学的 Matrix2000plus 或者后续型号的加速器芯片。

  飞腾 CPU 采用 ARM 架构。

  Matrix2000 加速芯片是国防科大的通用DSP芯片,GPDSP,就像英伟达公司通用 GPU(GPGPU)那样,DSP(数字信号处理器)也拥有大量的运算单元。

  神威 E 级超算:

  神威系列超算是由江南计算机研究所研制的。2018 年 7 月神威原型机落户于国家超算济南中心,需要三年左右的研发时间,将在 2021 年正式投入使用。神威的 CPU 肯定是申威系列的最新型号,加速器可能也会采用 Matrix2000plus 或者其后续型号。

  申威系列 CPU 脱胎于DEC Alpha处理器架构。

  曙光超算:

  中科曙光主要使用X86 架构的 CPU。在最新的 TOP500 榜单里,共有曙光公司制造的 63 台超算。除了一台以外,其它 62 台全部使用英特尔的至强 CPU,有些超算还使用了英伟达的Tesla加速器芯片。

  猛的一看,似乎这次禁运对曙光公司是致命的打击。因为英特尔和英伟达的芯片以后都买不到了。但是,曙光公司早就有了全国产化布局。秘密就在这 62 台之外的那一台超算上。

  CPU:

  这台型号为 TC8600 的超算是 2018 年投入使用的,它的 CPU 采用的是天津海光公司的 Hygon Dhyana 处理器,32核,2Ghz频率。天津海光公司在 2016 年初得到了美国AMD公司的第一代ZEN架构的永久授权,起点相当高,要知道AMD公司在 2018 年才推出第二代ZEN2的架构。海光 3000 系列 CPU 使用的是 x86 通用架构,完全支持 Windows10 Pro, Windows Server2019, Linux Centos 7.x 等主流操作系统,而且还有类似AMD EPYC 的服务器版,最多 32 核 64 线程,基础频率 2.0GHz,加速频率可达 3.0GHz,而且涵盖了从 4 核到 32 核在内的多个产品线。

  在这次禁运公布后,海光公司无法再得到AMD新的产品架构授权,但这并不影响已经得到的授权。海光公司已经组建了超过 500 人的研发团队,有能力在已经得到的授权的基础上,进一步开发新的产品,提升 CPU 的性能。这也意味着未来X86 架构的 CPU 在中国可能会产生硬分叉,我们将从此与美国分道扬镳,走出自己的路来。

  加速器芯片:

  而这台曙光超算的加速器芯片更有意思:它的名称为 Deep Computing Processor。根据公开的新闻报道,曙光的加速器芯片是基于我国寒武纪公司的 AI 处理器架构研制的,全球独一无二。曙光公司的通稿上说:"2017 年 11 月,曙光基于寒武纪低功耗深度学习处理器,率先推出 PHANERON,引起业界广泛关注。时隔 6 个月,寒武纪发布性能更为强劲的 MLU100,曙光同步升级 PHANERON 产品,并发布一系列搭载寒武纪 MLU100 的服务器产品,保持着在智能服务器领域的持续领先 "

  这意味着曙光TC8600 超算应用于 AI 领域将拥有极大的优势。

  未来曙光公司的超算,应该就是基于海光公司的最新 CPU 和曙光自己设计的 PHANERON AI 加速芯片的最新版本。

  由此也可以看出美国商务部的这次禁运,也根本影响不了曙光公司的超算产品。

  禁运可能对曙光公司的商用超算产品线的影响巨大

  我们还需要看到,由于曙光公司的主要产品线都是基于英特尔的 CPU 和英伟达的加速器芯片,在这次禁运之后,这些产品线都难以为继了。从商业层面来说,对曙光公司的影响巨大。但是好在曙光有了全国产的 CPU 和加速器芯片替代产品。我们可以从排名第 43 的曙光TC8600 和排名第 88 位的曙光TC4600LP/W740l这两台超算的测试数据看出一些细节来:

  表格来源于top500.org,笔者进行整理分析

  曙光TC4600LP超算是基于英特尔至强CPU和英伟达Tesla加速器的产品。从以上测试数据来看,使用国产 CPU 和加速器的 TC8600 超算,在使用了 3 倍多的 CPU 核心数量以及5倍左右的加速器核心数量的情况下,跑分只不过增加到了 1.4 倍到 1.7 倍。但是功耗下降了很多,功耗效率提升了3倍多。

  笔者分析这主要是因为TC8600 采用的 AI 加速器并不适合传统的浮点运算,它只是在 AI 运算上具有巨大优势。

  这也意味着,曙光公司缺乏合适的加速器芯片,来提升系统的浮点运算能力。这可能会对曙光公司的商业发展产生不利影响。

  也许曙光公司的未来销售重点将转向 AI 运算。但是,也不排除未来曙光公司开发基于国产Matrix2000 加速芯片的产品。

  在这里必须介绍一下,为何曙光公司不能放弃X86 架构的 CPU。

  全球 TOP500 强的超算 100%都使用Linux操作系统的不同发行版。这些版本都为各自的 CPU 和加速器芯片做了优化。 而在超算上跑的应用软件也会受到 CPU 架构的影响。

  从目前来看,对X86 架构优化的Linux系统最成熟,应用软件最多,程序开发最容易,整个软件生态系统最成熟,稳定。而国产申威和飞腾 CPU 的系统则有些不足,软件工具为它们优化得少,编程也有些麻烦,系统 bug 也较多,整个软件生态系统只是解决了可用,离X86 系统那样的好用仍然有一定距离。

  所以,无论从国家的战略方面,还是从曙光公司的商业前景而言,X86 架构都是应该坚持做下去的。

  中国半导体制造技术的进步将极大地推进国产超算 CPU 和加速器芯片的性能

  中国的半导体制造业长期以来是我们最大的短板。在台积电和三星电子已经量产7纳米工艺,英特尔已经小规模量产 10 纳米工艺的时候,我国目前最先进的半导体制造工艺还是中芯国际的 28 纳米工艺。

  而在上面提到的国产 CPU,要么使用国产较落后的工艺,自主性能够保证,但性能落后;要么在海外找半导体代工企业生产,性能可以提升,但自主性无法得到保证,说不定什么时候就会被掐脖子。

  但这个状态很快就要结束了。中芯国际在 2018 年 8 月的第二季度业界报告中宣布,其 14 纳米生产工艺取得了重大进展,第一代FinFET技术研发已经进入了客户导入阶段。而正式量产则计划在 2019 年中期。所以,很快,我们就会拥有自己的 14 纳米半导体生产工艺了。

  14 纳米有多厉害?要知道,现在英特尔所有的台式机和服务器芯片都是 14 纳米的。英特尔在刚刚过去的台北电脑展上宣布会小规模量产 10 纳米工艺的低电压笔记本电脑处理器,并且预计未来几年 14 纳米仍然是它的主力工艺。只有AMD在台积电的代工下,刚刚宣布实现了 CPU 的 7 纳米工艺生产。

  如果国产超算 CPU 和加速器芯片都使用中芯国际的 14 纳米工艺生产,它们的性能将会得到一个飞跃。

  美国终将搬起石头砸自己的脚

  实际上,美国在 2015 年对中国的四大超算中心的禁运,已经砸了它自己的脚:英特尔的至强 Phi 加速器芯片停产。

  ▲图为美国《个人计算机》杂志当年对美国封杀中国四大超算中心,禁止因特尔提供至强Phi加速器芯片给它们的报道

  笔者在这里列一些事实:

  中国的天河 2 号超算分别使用了 3.2 万颗 Xeon E5 CPU 和 4.8 万颗 Xeon Phi 加速器。

  对于 Xeon Phi 的销量,Intel CEO 曾表示过 2016 年的目标是 10 万颗出货量。

  可见,单单我国的天河 2 号就能达到 Intel 2016 年约一半的 Xeon Phi 销量。

  2015 年 4 月 9 日,美国商务部宣布对中国的四家超算中心禁运英特尔的至强 Xeon 处理器和至强 Phi 加速器芯片。

  2016 年 6 月 18 日 , 至强 Phi 7290/7250 加速器价格直接腰斩。到 2017 年 8 月 24 日,英特尔宣布至强 Phi 7200 系列协处理器加速卡进入停产退市进程。

  ▲图为美国《个人计算机》杂志在当年的报道中也提到中国市场对于因特尔这一芯片的重要性,以及美国禁令将给因特尔带来沉重打击

  笔者毫不怀疑英特尔至强 Phi 加速器芯片的停产就是因为对中国的禁运。这甚至影响到了美国下一代超算的开发。美国的超算,CPU 可选择英特尔和 AMD 的X86 处理器以及 IBM 的 Power 处理器,而加速器芯片目前只有一个选择,就是英伟达的通用 GPU。

  那么美国商务部的这次禁运会有什么结果呢?笔者相信,在我们自力更生的努力之下,几年之后,世界上会出现几个新的超算 CPU 生态圈,彻底打破美国的垄断。

  实际上,美国《纽约时报》和《华尔街日报》也都不认为美国政府的这一打击中国超算的举动会阻碍中国的发展。这两家媒体采访几位不同的美国超算专家就表示,美国政府的行为虽然短期内或给中国的超算发展带来阻碍,却也会更加坚定中国开发本土技术替换美国科技的决心。

  而一件必然会要发生的事,就是在 2020 年和 2021 年,中国有三台超算将会冲击 TOP500 排行榜的冠军位置,把美国超算踢下去。让美国看看,谁才是超算领域的王者!


编辑:张馨予

我来说两句 0条评论 0人参与,