英特尔正式发布其全新服务器GPU 率先定义XPU时代
- 2020-11-19 16:58:00
- 技术管理员 原创
- 1189
11月11日,英特尔正式发布其全新服务器GPU,即首款数据中心的独显产品,该服务器基于Xe LP微架构,专为高密度、低时延的安卓云游戏和流媒体服务而设计。同时,英特尔还宣布将于12月正式交付相应的软件堆栈oneAPI Gold工具。英特尔此次同时推出了全新服务器GPU和oneAPI软件,意味着英特尔开始释放XPU的强大实力。
英特尔率先定义XPU时代
10年前,美国数据科学家舍恩伯格在《大数据时代》一书中对“大数据时代”作出系统阐释。
10年后,互联网、人工智能、云计算的发展正飞速推动全球数据量的增长。国际数据公司IDC统计显示,预计到2025年,全球数据量将比2016年的16.1 ZB(1 ZB=十万亿字节)增加10倍,达到163 ZB。
尽管越来越多的数据让现代人置身于信隐私泄露的恐慌之中,但不可否认的是,大数据正为硬件、软件乃至服务等市场带来前所未有的经济增长。
中国通信院发布的《大数据白皮书(2019)》显示,预计到2020年,全球大数据硬件、软件和服务的市场规模将分别达到150亿美元、200亿美元和210亿美元。这意味着基于大数据,将产生一个全球范围内价值560亿美元的市场。
但在这之前需要解决一个关键问题,在单一芯片算力受限的情况下,如何更好地发挥海量数据的真正价值?
对于这一问题,英特尔早已给出了答案。2015年,英特尔就开始斥资167亿美元收购当时全球第二大FPGA厂商Altera,此后,又接连收购主攻深度学习方向的Nervana Systems、计算视觉公司Movidius、自动驾驶视觉处理公司Mobileye和云端AI推理芯片已经商用的Habana Labs。
英特尔成为业界唯一一家拥有全类别AI芯片的公司之后,紧接着吸纳业界顶尖的芯片人才,并于2018年架构日提出制程、封装、架构、存储、互联、安全、软件的六大技术战略。
2018年的架构日在英特尔历史上具有划时代的意义,XPU异构愿景就诞生于此,即由标量(Scalar)、矢量(Vector)、矩阵(Matrix)、空间(Spatial)组成的SVMS架构,分别对应CPU、GPU、加速器和FPGA,可以进行多种异构组合。
这是英特尔首次、也是业界首次明确将单一架构之后的发展方向定义为XPU。
英特尔数据中心XPU产品和解决方案副总裁Jeff McVeigh表示: “XPU战略的提出,在于我们意识到需要不同类型的架构来服务于各种不同的工作负载,其中一些工作负载在本质上是标量的,另一些是向量、矩阵、空间等等。”
从Xe架构到独立显卡,实现XPU愿景的重要一步
英特尔在XPU战略上进展迅速,在其它芯片公司还处于大规模并购阶段时,就已经基于其丰富的技术经验推出了自有的首款面向数据中心的独显产品。
英特尔表示,这款GPU采用的是英特尔能效最高的图形架构,英特尔Xe LP微架构,拥有低功耗、独立片上系统(SoC)设计,并配备128比特管道和8GB专用板载低功耗DDR4显存。
另外,如果将英特尔服务器GPU同英特尔至强可扩展处理器组合,服务提供商可以在不改变服务器数量的情况下,单独扩展显卡容量,得以在每个系统上支持更多流和订阅用户,并且同时实现较低的总体拥有成本(TCO)。
通过在新华三3/4长、全高的x16 PCIe 3.0扩展卡内封装四个英特尔服务器GPU,即可在一个典型双卡系统中支持超过100个安卓云游戏并发用户。这一数量最高可扩展至160个并发用户,实际数量取决于具体的游戏和服务器配。
之所以说英特尔XPU战略进展迅速,是因为其从2019年底发布Xe架构到推出基于Xe架构的集成GPU和独立GPU产品,以及用于数据中心独显产品,间隔时间不到一年,就兑现了产品交付计划。
事实上,Xe架构作为一个基础GPU架构,属性灵活且扩展性强,能够衍生出多种针对不同领域和场景的GPU产品。
在英特尔2020年架构日上,英特尔官方首次详细介绍了可实现全扩展的Xe图形架构。按照不同的应用场景分,可将Xe架构分成四个系列:Xe LP、Xe HP、Xe HPC和Xe HPG。
Xe LP属于低功耗系列,是针对PC和移动计算平台的最高效架构,最高配置EU单元多达96组,并具有新架构设计,包括异步计算、视图实例化 (view instancing)、采样器反馈(sampler feedback)、带有AV1的更新版媒体引擎以及更新版显示引擎等。TigerLake SoC里集成的GPU、英特尔锐炬 Xe MAX 独立显卡和此次发布的面向数据中心的独显产品均采用这一架构。
作为首批使用英特尔首款数据中心独显产品的客户之一,腾讯先游云游戏总经理方亮认为:“SG1的编码能力非常强,它能够提供一个高密度、低延迟、灵活多样的视频编码能力,另外在我们所测试的产品中,英特尔SG1的性价比高,英特尔技术团队的支持也非常给力。”
Xe HP属于高性能系列,是业界首个多区块(multi-tiled)、高度可扩展的高性能架构,可提供数据中心级、机架级媒体性能,GPU可扩展性和AI优化。目前处于同客户共同测试的阶段,Xe HP产品将于明年推出。
Xe HPC属于高性能计算系列,可用于超级计算机。Xe HPG是一种为游戏优化的微架构,将具有加速的光线跟踪支持,Xe HPG产品预计将于2021年开始发货。
天下大同oneAPI,实现XPU的“灵魂互通”
一般而言,基于底层硬件架构的不同,完成同一项开发往往需要开发者使用不同的代码重写一次,需要付出极大的人力成本和财力成本。如果将硬件层面XPU的实现比喻成一个语言互不相通的团队,那么要想更好地释放团体的真正实力,还需要一台能够降低队员们沟通成本,甚至能够实现“灵魂互通”的机器。
虽然从生物算法的角度,目前还没有办法实现意识和“灵魂”的交换和交流,计算机应用程序的跨平台优化也一直是业界难点,但对于XPU而言,英特尔已经开发出帮助XPU团队释放真正实力的工具,即英特尔软件级oneAPI工具包。
英特尔官方表示,如果用上了oneAPI工具包,开发者就能够访问英特尔XPU的通用、开放且基于行业标准高的编程模型,释放底层硬件性能的同时降低软件开发和维护成本。
同时,“oneAPI能够把人们熟悉的语言和库上的代码,比如所有目前已经在至强处理器上运行的代码,无缝地迁移到GPU和其他的架构上。所以它确实有很多好处,比如代码重用,能够利用现有的库等等。如果你已经熟悉了一些库,比如TBB和其他来自英特尔的库,我们把它们进行了扩展以支持多种架构。这样已经使用过这些库的开发者可以继续做开源,支持GPU和其他XPU架构。”
“oneAPI让你不必有两种不同的配置,两种不同的构建,但是能够在设计点之间为完全相同的服务提供一些灵活性。”英特尔数据平台事业部副总裁,视觉基础架构事业部和NPG战略总经理LynnComp补充道。
oneAPI是英特尔在SuperComputing2019大会上首次提出且为实现统一、简化的跨架构编程模型的一个愿景,即不受限于单一厂商专用的代码构建,且能实现源有代码的集成。 借助oneAPI,开发者可以针对他们要解决的特定问题选择最佳的加速器架构,且无需为此一个架构和平台再重写软件。
英特尔初次提出这一愿景时,很多人认为其实现难度大,能够完成的可能性几乎为零。但今天英特尔却如期交付了oneAPI开发者工具包,足以证明其软件实力。
英特尔宣布,英特尔oneAPI工具包将于12月在本地和英特尔DevCould上免费提供,同时还将提供包括英特尔技术咨询工程师全球支持的商业版本。英特尔还会将英特尔Parallel Studio XE和英特尔System Studio工具套件迁移到oneAPI产品中。
值得一提的是,即便没有使用英特尔的芯片,oneAPI也能包容和支持,具有实现“天下大同”的能力,拥有广泛的生态系统,这也促使oneAPI得到更加广泛的业界支持。近期, 微软Azure和谷歌的TensorFlow已经宣布支持oneAPI,众多领先的研究机构、公司和大学也支持oneAPI。
小结
从收购FPGA公司到吸纳图形处理器顶尖人才,从发展单一架构到定义XPU时代,从Xe架构提出到如期交付产品,近些年英特尔一直在释放大数据潜力的产业领域探索,如今成长为业界唯一一家能够提供XPU芯片的全能性公司,且能为其应将提供相适配的软件、应用程序和生态,英特尔在数据在数据中心拥有独一无二的实力。