近日,高性能計(jì)算領(lǐng)域的旗艦國際會(huì)議International Conference on Supercomputing (ICS2016) 評審結(jié)果揭曉,中國科學(xué)院深圳先進(jìn)技術(shù)研究院數(shù)字所云計(jì)算中心研究員喻之斌課題組博士生劉宇璽的論文barrier-aware warp scheduling for throughput processors 被錄用為長文。
文章在首先觀察到GPGPU上線程組內(nèi)warp的同步即使在使用硬件機(jī)制實(shí)現(xiàn)的情況下對一大類含有頻繁同步的應(yīng)用程序仍造成了很大的性能損失。由于使用硬件機(jī)制實(shí)現(xiàn)同步,世界同行都忽視了同步問題帶來的開銷,云計(jì)算中心的研究人員反其道而行之,率先發(fā)現(xiàn)了這一問題,研究了同步開銷的機(jī)理。
研究人員提出了兩種相互配合的方法來減少同步開銷:一是warp等待數(shù)最多優(yōu)先調(diào)度MWF的方法,二是預(yù)取和發(fā)相配合的方法CFF。這兩種方法比目前世界上最好的調(diào)度策略GTO的性能平均高出9%,最高達(dá)35%,且不降低所有含同步少的應(yīng)用程序的性能。論文工作受到國際同行的高度評價(jià),被認(rèn)為觀察到一個(gè)被忽視的問題,且提出了一個(gè)簡單的解決方案,得到了顯著的效果,得到兩個(gè)5分(總分6分),一個(gè)4分和兩個(gè)3分的高分。
深圳先進(jìn)院學(xué)術(shù)論文被高性能計(jì)算領(lǐng)域頂級會(huì)議ICS2016錄用
相關(guān)資訊