虚拟GPU来了,有些坑你本可以避开
Andrew
2018-11-30
次浏览
提起NVIDIA Virtual GPU软件,尽管它已出现了五个年头了,但相信很多用户都对它还是一无所知。但其实无论是桌面虚拟化的糟糕体验,还是工业设计中的数据安全难题,却都可以通过它来解决。于是,为了让大家避开这些坑,我们走访了NVIDIA的几位技术大咖,为我们详解了其中的奥秘。
用户曾经遇上过的那些坑
谈起用户遇到过的坑,NVIDIA中国区解决方案架构师李浩南谈起了当年的趣事:“在没有NVIDIA vGPU解决方案之前,因为虚拟化技术不能应用于GPU,使用传统图形工作站的用户要面临一系列的麻烦问题。首先是数据安全问题,为了保证安全性,大量的企业干脆就把USB接口封掉,然后再购买数据加密软件,来把硬盘进行全盘加密。好不容易过了这一关,更麻烦的事情还在后边等着他们。”
李浩南接着介绍说:“当随着业务复杂度升高,设计师提出一些特殊的工作站配置要求时,企业的IT经理往往要花很长时间重新改变硬件配置,才能满足业务需求。但接下来,麻烦事还是不断涌来:在制造业的场景里,PDM解决方案很常见,设计师使用传统的图形工作站的时候,设计数据都是保存PDM服务器上的,也就是说设计师在工作前,要先到PDM服务器上去拿数据。而这个过程却可能需要十几分钟,这种效率往往是设计师所不能忍受的。”
谈到这里,李浩南话锋一转:“但应用了vGPU技术之后,这些却都是过去时了。现在,图形工作站可通过vGPU的技术,进行集中化的管理不再有数据丢失的问题。vGPU在数据中心中实施完成之后,IT经理可以很容易地配置多GPU。于是,在设计室中,我们可以同时看到,一个GPU做3D建模,一个GPU做仿真;或者应用于影视后期里工作,一个GPU用来做动画建模,另外一个GPU用来做渲染。而最后一个效率问题,由于实际的虚拟工作站he PDM服务器在同一个数据中心的网络中,数据加载速度很快,原来十几分钟的等待时间,现在变成只有一、两分钟。”
提起vGPU技术,在冷冰冰的一连串字母之后,为制造业用户带来的却是安全、配置灵活、效率提升等实实在在的礼物。中国区云计算总监马庆胜表示:“在没有vGPU之前,企业的IT经理就要在在满足设计师工作需要,和解决数据安全中做出取舍。而有了vGPU,这个两难问题就迎刃而解。因此,应用传统图形工作站的行业,即图形重负载,对vGPU的接受程度非常高。同样的原因,vGPU带来的效率提升,使得它在人工智能深度学习的领域里,也得到了越来越广泛的应用。”
化整为零,让成本成为可变数
对一般新技术而言,效率的提升往往与高成本相伴。但在马庆胜眼中,vGPU技术却同时一项能够降低成本的技术。
马庆胜介绍说:“一家设计企业有300多个设计师,如果采用传统的图形工作站,企业每年正版设计软件的维护费有就要花去8000万到1亿元的高额支出。这家企业如果采用传统的图形工作站,需要为每名设计师都要配备相应的设计软件。但通过调查得知,设计师并不是每天8小时都在使用这些设计软件,于是通过NVIDIA vGPU解决方案,让设计师在不同的时段使用工作站内的设计软件。这样采用化整为零的方法,设计软件成本的下降数量就成了一个非常可观的数字。”
NVIDIA GPU虚拟化高级解决方案架构师张洁介绍了另一个节省成本的案例:“从2003年北大第一次开设了人工智能的课程,到2018年6月份,全国已经有50多个大学开设了人工智能课程。但是这个课程开设完了之后,学生需要有一个GPU的环境来实现他的实际操练、实际训练的过程。一般来说,如果没有GPU虚拟化,老师可能需要给每一个学生配一个物理GPU。而有了GPU虚拟化后,可以给每个学生提供一个虚拟的GPU来做实训、培训。也就是说学校在实训时,可以给学生一个切割的vGPU,让他们基本了解GPU怎么做加速的一些功能。这样当NVIDIA vGPU解决方案实现了GPU的资源灵活调度之后,在非教学时间,GPU的资源还可以通过虚拟化释放出来,老师可以把这些GPU资源再聚合起来做一些科研上的工作。”
当一项技术不仅能给用户带来礼物,还可以同时降低用户成本时,它的发展一定会进入一个飞跃期。而事实上,vGPU恰恰就经历了这样一个飞跃期。
vGPU的飞跃期
2013年,在NVIDIA刚刚推出了GPU虚拟化时, vGPU还略显青涩。然而仅仅用了五年时间,当2018年vGPU 7.0发布时,它已经经历了多次变身。从软硬一体到单纯的软件,从一个只能支持一个明确固定型号的GPU,到现支持最新Tesla系列的所有GPU,从对图形图像进行支持,解决客户在使用图形图像时的重负载应用时如何在数据中心部署的问题,到如今在虚拟GPU上实现GPU计算部分的能力的业务。
到了今天,vGPU 7.0已经可以把多个物理GPU分配给某一个虚拟机。还可以可配合VMware在数据中心实现带有GPU的虚拟机可实现动态的热迁移,让用户的业务在在整个迁移过程当中保持连续。此外,还加入了AI的特性,让用户可以从云端快速的把需要做人工智能业务的用户环境拖下来进行部署。
更为值得一提的是,NVIDIA vGPU已经建立了一个生态,支持多种虚拟化环境中GPU的虚拟化。这样,技术、应用场景、生态,为vGPU打造了一个潜力巨大的未来。
在多数用户心目中,NVIDIA是一家冷冰冰的硬件公司,但事实上,不断涌现的优秀软件应用,正在给NVIDIA的未来添加一丝丝暖意。而软硬件一体化之后的NVIDIA,在拥有双动力系统之后,其发展前景更是不可限量的。