生物分子模拟论坛

 找回密码
 我想注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 8736|回复: 1

[其他] Tesla P100 帕斯卡计算卡,性能相当于32台CPU服务器

[复制链接]
发表于 2016-6-28 09:55:28 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,下载更多分子模拟资源。

您需要 登录 才可以下载或查看,没有帐号?我想注册

x
为满足人们对现代数据中心前所未有的计算需求,NVIDIA 推出了适用于 PCIe 服务器的 NVIDIA® Tesla® P100 GPU 加速器,与 CPU 系统相比,该产品可实现性能与性价比的巨大飞跃。
现在人们对超级计算的需求高于以往任何时候。美国国家科学基金会的数据显示,大多数科学家无法在超级计算系统上获得足够的使用时间来完成其研究项目。此外,计算量繁重的深度学习应用程序越来越需要使用高性能计算 (HPC) 技术,研究人员正在运用人工智能技术来推动传统科学领域的进步。
PCIe 型 Tesla P100 GPU 加速器具备 NVIDIA Pascal™ GPU 架构无与伦比的性能与节能性,能够满足这些计算需求。它让人们能够创建“超级节点”,其吞吐量与 32 个以上的市售 CPU 节点相当,可令投资与运营成本节省 70%。
NVIDIA 加速型计算副总裁 Ian Buck 表示:“想要在高性能计算与人工智能超级计算方面满足研究人员不断增长的需求,加速型计算是必由之路。如果通过部署纯 CPU 系统来满足这一需求,则需要购置大量的市售计算节点,这会导致成本大幅提升的同时,性能却没有相应地大幅提升。如果使用性能更高的 Tesla P100 节点,那么需要的节点数量更少,而且可以大幅扩展性能,如此一来,客户便能够把钱更多地花费在计算上,而非花在基础设施上。”
PCIe 型 Tesla P100 采用标准的 PCIe 卡型设计,兼容当今的 GPU 加速型服务器。该产品经过专门优化,能够运行那些计算量最为繁重的人工智能与高性能计算数据中心应用程序。当运行 AMBER 分子动力学程序时,单台 Tesla P100 服务器的性能胜过 50 个纯 CPU 服务器节点,当运行 VASP 材料科学应用程序时,其性能胜过 32 个纯 CPU 节点。
今年晚些时候,升级版的 Piz Daint 系统将采用 PCIe 型 Tesla P100 加速器。该系统位于瑞士卢加诺瑞士国家超级计算中心,是欧洲最快的超级计算机。
苏黎世联邦理工学院计算物理学教授兼瑞士国家超级计算中心主任 Thomas Schulthess 表示:“Tesla P100 加速器可带来全新级别的性能与效率,能够解决当今最重要的一些计算难题。在 Piz Daint 上,4,500 个 GPU 加速型节点将升级至 Tesla P100 GPU,此举将使该系统的性能翻一番以上,进而让研究人员能够在各种领域中实现突破,其中包括宇宙学、材料科学、地震学以及气候学等等。”
PCIe 型 Tesla P100 是 NVIDIA Tesla 加速型计算平台系列中的最新产品。主要特性包括:
• 在处理混合型高性能计算任务方面可带来无与伦比的应用程序性能 — 双精度和单精度峰值性能分别为 4.7 Teraflops 和 9.3 Teraflops,基于 Pascal 架构的单个 Tesla P100 节点在性能方面相当于 32 台以上的市售纯 CPU 服务器。
• CoWoS 搭配 HBM2,可实现前所未有的效率 — Tesla P100 将处理器与数据统一到单一封装内,可带来前所未有的计算效率。基板上晶圆上芯片封装 (CoWoS) 搭配 HBM2 是一种创新的内存设计方式,与 NVIDIA Maxwell™ 架构相比可令内存带宽性能提升 3 倍,达到 720GB/秒。
• 页面迁移引擎可简化并行编程 — 让开发人员能够把更多的精力放在优化性能上,而非管理数据传输上。支持虚拟内存分页,让应用程序的大小能够超出 GPU 的物理内存容量。统一内存技术通过让开发人员能够将整个节点看作单一内存空间,从而可大幅提升生产率。
• 无与伦比的应用程序支持 — Tesla 平台是全球领先的高性能计算平台,该平台上有 410 款 GPU 加速型应用程序,其中包括 10 款顶级高性能计算应用程序中的 9 款。
CIe 型 Tesla P100 的规格参数
• 支持 NVIDIA GPU BOOST™ 技术,双精度性能高达 4.7 Teraflops、单精度性能高达 9.3 Teraflops、半精度性能高达 18.7 Teraflops
• 支持第三代 PCIe 互联 (双向带宽高达32GB/秒)
• 页面迁移引擎与统一内存能够增强可编程性
• ECC 保护可带来更高的可靠性
• 针对服务器而优化,可带来最高的数据中心吞吐量和可靠性
• 有两种配置可供选择:
     -16GB CoWoS HBM2 堆栈式内存,内存带宽高达 720GB/秒
      -12GB CoWoS HBM2 堆栈式内存,内存带宽高达 540GB/秒
上市情况
分迪科技搭载 NVIDIA Tesla P100 GPU 加速器的分子模拟平台预计将于 2016 年第四季度开始上市.
您需要登录后才可以回帖 登录 | 我想注册

本版积分规则

QQ|分迪科技|小黑屋|手机版|Archiver|生物分子模拟论坛 ( 蜀ICP备14009200号-3 )

GMT+8, 2024-11-19 18:38 , Processed in 0.061185 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表