近日,高性能計算領(lǐng)域的旗艦國際會議International Conference on Supercomputing (ICS2016) 評審結(jié)果揭曉,中國科學(xué)院深圳先進技術(shù)研究院數(shù)字所云計算中心研究員喻之斌課題組博士生劉宇璽的論文barrier-aware warp scheduling for throughput processors 被錄用為長文。
文章在首先觀察到GPGPU上線程組內(nèi)warp的同步即使在使用硬件機制實現(xiàn)的情況下對一大類含有頻繁同步的應(yīng)用程序仍造成了很大的性能損失。由于使用硬件機制實現(xiàn)同步,世界同行都忽視了同步問題帶來的開銷,云計算中心的研究人員反其道而行之,率先發(fā)現(xiàn)了這一問題,研究了同步開銷的機理。
研究人員提出了兩種相互配合的方法來減少同步開銷:一是warp等待數(shù)最多優(yōu)先調(diào)度MWF的方法,二是預(yù)取和發(fā)相配合的方法CFF。這兩種方法比目前世界上最好的調(diào)度策略GTO的性能平均高出9%,最高達35%,且不降低所有含同步少的應(yīng)用程序的性能。論文工作受到國際同行的高度評價,被認為觀察到一個被忽視的問題,且提出了一個簡單的解決方案,得到了顯著的效果,得到兩個5分(總分6分),一個4分和兩個3分的高分。
深圳先進院學(xué)術(shù)論文被高性能計算領(lǐng)域頂級會議ICS2016錄用
相關(guān)資訊