找回密码
 立即注册
  • QQ空间
  • 回复
  • 收藏

英伟达最新GPUDirect储存技术,提升内存吞吐速度整整快了8.8倍 ...

admin| 2019-8-13 10:02 阅读 119 评论 0

  Nvidia发展GPUDirect储存技术,大幅提升GPU加载大型资料集的速度,使用GPUDirect储存技术,GPU加载资料集的工作不再完全需要仰赖CPU,因而解除了资料I/O的瓶颈。

  

  Nvidia发展了名为GPUDirect储存(GPUDirect Storage)的资料传输技术,加快位在各种储存的资料,传输到GPU内存的速度,可以将频宽增加至原本的2到8倍,而且还能降低端到端的延迟达3.8倍。

  由于人工智能以及高效能运算的资料集规模不断的增加,应用程序加载资料花费的时间越来越长,进而影响了应用程序的效能,而且特别是端到端架构,会因为缓慢的I/O使得运算速度日益提升的GPU无用武之地。Nvidia提到,将资料从储存器加载到GPU,过去都是由CPU负责,而这将会成为硬件效能的瓶颈。

  资料从NVMe磁盘传输到GPU内存的标准路径,是使用系统内存中的反弹缓冲区(Bounce Buffer),而GPUDirect储存技术避免使用反弹缓冲区,以减少额外的资料副本,并使用直接内存存取引擎(Direct Memory Access,DMA)将资料直接放到GPU内存中,为远端或是本地储存,诸如NVMe或NVMe over Fabric,和GPU内存之间,建立一个直接传输资料的路径,而这能有效减轻CPU I/O的瓶颈,提升I/O频宽和传输资料的量。

  Nvidia提到,GPUDirect储存技术的主要功能,就是透过这个新的档案系统,以直接内存存取的方式,将资料传输至GPU内存上。无论资源原本存放在什么位置,都能使用GPUDirect储存技术,这些储存可能位在机箱内、机架上甚至通过网络连接都可以。

  Nvidia在GPU资料科学平台RAPIDS中的GPU资料影格(GPU DataFrame,GDF)函式库cuDF上进行实验,发现使用GPUDirect存储技术,比起原始cuDF CSV读取程序,将资料传输到GPU内存的吞吐速度快了8.8倍。cuDF是让使用者在GPU上,用来加载、过滤、排序和探索资料集的函式库。

  Nvidia表示,应用这项新技术,远端储存、本机端储存以及CPU内存到GPU内存的频宽,可以在互相组合后加乘,以人工智能超级计算机DGX-2为例,从CPU系统内存到GPU内存的频宽限制为50 GB/s,但综合从系统内存、本机端硬盘以及NIC(Network Interface Card)的资料,最高频宽甚至可以达215 GB/s。

    文章点评
    相关文章
    2019-10-11 12:11
    硬件评测 为互联网而生的二手浪潮服务器SA5112M4,值不值得入手?
    基于能够承载其业务处理器和成本的考虑,二手服务器以其亲民的价格,极高的性价比和出色的性能等特性,越来越受中小企 <详情>
    2019-10-10 14:24
    IT新闻 谷歌拥有90万台服务器,且看数据中心5大发展趋势!
    据谷歌最新提供的电量消耗数据推算,谷歌在全球13个数据中心拥有约90万台服务器,使用的电力足够为20万户家庭供电。阿 <详情>
    2019-10-08 19:27
    硬件知识堂 企业如何选择服务器?需要考虑哪些因素?
    随着互联网的飞速发展,企业越来越离不开服务器,一个服务器的好坏往往决定了企业的发展。那么企业如何选择合适的服务 <详情>
    2019-09-29 15:52
    IT新闻 技嘉发布多款服务器响应AMD第二代EPYC,1U服务器提供128颗核心 ... ... ...
    十次方消息:响应AMD今年8月推出第二代EPYC处理器平台,技嘉也发布多款服务器,其中的R182-Z92是1U、2路的架构,搭配2 <详情>
    2019-09-27 17:55
    IT新闻 阿里“硬”了,重磅发布首款AI芯片!
    阿里巴巴第一颗芯片今天诞生!2019年9月25日,在杭州举行的阿里云栖大会上,阿里巴巴CTO、阿里云智能总裁、达摩院院长 <详情>
    2019-09-27 16:53
    硬件评测 搭配顶级GPU与特殊参考设计,华硕推出轻薄型创作者笔记本电脑 ... ... ...
    华硕针对内容创作者推出ProArt StudioBook系列笔电,其中的ProArt StudioBook One是效能最强大的一款,搭配了Nvidia最 <详情>
    2019-09-26 11:45
    IT新闻 甲骨文用1,060台Raspberry Pi 3 B+装置,打造出超级计算机丛集
      为了展示新发布的自主作业系统Oracle Autonomous Linux,甲骨文用1,060台Raspberry Pi 3 B+装置,打造出超级计算 <详情>
    2019-09-17 10:22
    IT新闻 IBM新一代大型主机Z15系统一天可执行最高1兆次网页运算
      IBM新一代大型主机z15新增多云环境资料安全防护,因应混合云及多云环境,Z15加入可端对端加密的TDO技术,并加入Op <详情>
    2019-09-17 09:50
    IT新闻 wifi20周岁了,最新一代标准届时速度将有重大突破
      1999年诞生的Wi-Fi标准,发表至今已届20个年头,目前最新一代标准为802.11ax(Wi-Fi 6),最晚将在2020年定案出炉, <详情>
    2019-09-12 10:58
    IT新闻 此消彼长的新兴高阶储存系统,谁将一直傲视群雄?
      在主流高阶储存大厂之外,还有数个新兴参与者也积极拓展高阶储存应用,但面对激烈竞争,个别厂商的发展情况有很大 <详情>
    十次方服务器实体机租赁
    关闭

    官方推荐 上一条 /1 下一条