evo视讯

evo视讯新闻

evo视讯

高端芯片设计

NVIDIA针对异质超等运算推出最新版编译器

返回列表

NVIDIA (辉达) 今天宣布推出 17.7 版 PGI 2017 编译器与工具,协助高效能运算系统开发者针对搭载多核 CPU 与异质化 GPU 加速器的系统,开发出效能更高的软体,同时大幅简化程式设计流程。

??克日释出的 PGI 17.7 编译器与工具的要害特点包括:

?? 支援Tesla V100 GPU: PGI OpenACC 与CUDA Fortran现已支援新款NVIDIA Volta GV100 GPU,提供更多影象体频宽、串流多重处理器、新一代NVIDIA NVLink以及全新微架构功效,堆砌出更好的效能与可编程功效。

?? OpenACC支援CUDA整合影象体:PGI 17.7 版编译器能利用 CUDA 整合影象体,简化针对 GPU 加速系统程式的编译流程。藉由开启简易编译器选项,OpenACC 即可在 CUDA 整合影象体中配置资料的存放位置,而不需撰写资料移动程式码或指令。

?? 支援多核 CPU 的 OpenMP 4.5 :初始针对 OpenMP 4.5 语法与功效的支援,即可针对大大都运行于多核CPU系统中的 OpenMP 4.5 平行处理进行编程。程式中的目标区块(TARGET)在预设支援条件设定后,会将多核系统当成目标,而PARALLEL 以及DISTRIBUTE等程式迴圈则能疏散到所有OpenMP执行绪进行平行处理。

?? 对Fortran语法的衍生类别进行深层复製: 透过 OpenACC 指令能在CPU主控端与GPU元件影象体之间搬移匯整或深层巢状Fortran资料物件,包括指标型物件的巡行与治理作业。

?? C++ 语言方面的改良:PGI 17.7 C++ 编译器内含许多逐次扩增的 C++17 功效,并将其汇整到 CUDA 9.0 NVCC 主编译器的支援範围内。在 LCALS 迴圈处理性能量测指标中效能平均提升了20%。

?? 在 OpenACC 程式区段中使用 C++14 Lambdas 函数:C++ 语言的lambdas函数,能在匿名函式物件被唿叫或是以参数形态被通报时,提供一种便当的要领来界说其物件。从 PGI 17.7 版开始,C++语言撰写程式的 OpenACC 运算区段都支援 lambdas 函数,包括针对差别编程模型或平台生成对应的程式码。 C++14 则引进更多lambdas函数用法,尤其是多类型的 lambdas函数。上述这些功效都可运用在 OpenACC 程式中。

?? 与cuSOLVER 函式库互通:透过使用 PGI 提供的介面模组与 PGI 17.7 内建的 PGI 版 cuSOLVER 函式库,即可唿叫包括 CUDA Fortran、OpenACC Fortran、C 以及 C++ 等语言的最佳化 cuSolverDN 函式。

?? 支援 NVIDIA Tesla GPU与多核 CPU 处理的 PGI Unified Binary:使用 OpenACC 编译出的程式不但支援 GPU 加速,还能在多核CPU上支援平行处理。在搭载GPU的系统上运行时, OpenACC 支援区段分载以及在GPU上执行程式。当在没有装置GPU的系统上运行时,OpenACC 的程式区段能疏散到系统中所有CPU焦点上同步处理。

?? 全新剖析功效支援 CUDA 整合影象体与OpenACC :PGI 17.7 Profiler现已加入多项全新 OpenACC 剖析功效,包括支援有连结 GPU 与无连结 GPU 的两种多核 CPU 平台,另外还新增全新的摘要(summary)检视功效,能显示处理每种 OpenACC 程式码结构所泯灭的执行时间。新增的 CUDA 统合影象体功效,能追踪出每项 CPU 分页过失对应到哪些程式码,以及这些程式码所涉及的资料所在位置,并支援全新 CUDA 整合影象体分页频繁的置换、节流、远端对应事件、NVLink以及其他诸多功效。

??PGI 17.7的其他功效与改良包括所有支援全方位平台情况模组、预製热门开源函式库与程式,以及新推出的《运用 OpenACC 执行平行运算》的教学系列影片 。


分享:
上一篇用途广泛的MCU芯片有哪些原厂? 返回列表 下一篇西部数据突破技术限制 推出高容量microSD存储卡
sitemap网站地图
友情链接:凯发k8娱乐官网  凯发k8娱乐官网  凯发k8娱乐官网