Year: 2016
CAM-Net Digest, Vol. 13 (2016), Iss. 7 : p. 6
Abstract
近日,高性能计算领域的旗舰国际会议International Conference on Supercomputing (ICS2016) 评审结果揭晓,中国科学院深圳先进技术研究院数字所云计算中心研究员喻之斌课题组博士生刘宇玺的论文barrier-aware warp scheduling for throughput processors 被录用为长文。
文章在首先观察到GPGPU上线程组内warp的同步即使在使用硬件机制实现的情况下对一大类含有频繁同步的应用程序仍造成了很大的性能损失。由于使用硬件机制实现同步,世界同行都忽视了同步问题带来的开销,云计算中心的研究人员反其道而行之,率先发现了这一问题,研究了同步开销的机理。
研究人员提出了两种相互配合的方法来减少同步开销:一是warp等待数最多优先调度MWF的方法,二是预取和发相配合的方法CFF。这两种方法比目前世界上最好的调度策略GTO的性能平均高出9%,最高达35%,且不降低所有含同步少的应用程序的性能。论文工作受到国际同行的高度评价,被认为观察到一个被忽视的问题,且提出了一个简单的解决方案,得到了显著的效果,得到两个5分(总分6分),一个4分和两个3分的高分。
You do not have full access to this article.
Already a Subscriber? Sign in as an individual or via your institution
Journal Article Details
Publisher Name: Global Science Press
Language: Chinese
DOI: https://doi.org/2016-CAM-14606
CAM-Net Digest, Vol. 13 (2016), Iss. 7 : p. 6
Published online: 2016-01
AMS Subject Headings: Global Science Press
Copyright: COPYRIGHT: © Global Science Press
Pages: 1