西门子

必发888手机版本登录:面向众核协处理器的高效能GPGPU片上网络研究

发布时间:2022-08-10 03:36:47 来源:必发88手机客户端 作者:必发88电脑客户端

  目前,GPGPU凭借其出色的并行计算能力,被广泛应用于科学计算和高性能计算领域。随着集成DRAM的带宽和GPGPU上计算单元的集成密度不断增加,GPGPU等众核协处理器对片上网络性能提出了更高的要

产品详情

  目前,GPGPU凭借其出色的并行计算能力,被广泛应用于科学计算和高性能计算领域。随着集成DRAM的带宽和GPGPU上计算单元的集成密度不断增加,GPGPU等众核协处理器对片上网络性能提出了更高的要求。然而,现有片上网络的研究成果不能满足GPGPU等众核协处理器的通信需求。一方面,不同于通用处理器的延迟敏感(latency-sensitive)特性,GPGPU是带宽敏感的(bandwidthsensitive),因此传统的减少片上网络延迟的相关优化技术对于提升系统性能收效甚微,优化访存性能是关键;另一方面,目前关于片上网络的研究大多侧重于网络本身的性能提升或功耗降低,但是,网络级性能的提升并不代表系统级性能的提升,系统性能驱动下的片上网络设计才更具实际意义。因此,针对目前面向GPGPU等众核协处理器的片上网络研究不足的现状,本课题从研究GPGPU特有的通信模式以及GPGPU片上网络面临的瓶颈问题出发,以低开销访存设计和高性能片上网络优化为目标,对访存调度策略、NoC仲裁机制、虚通道划分以及片上路由的微体系结构等方面进行优化设计,最终提出一个高效能的GPGPU片上网络实现框架。本文的主要研究成果包括:(1)提出了低开销访存调度策略目前流行的访存调度策略大多以乱序调度为基础,其基本思想是优化存储节点处访存请求的调度顺序,从而提高访存效率。在通用处理器上,乱序调度策略带来的面积和功耗开销尚可接受,但是GPGPU芯片上计算单元的高密度集成使得面积和功耗开销带来的矛盾愈发不可调和。基于此,本文分两个阶段解决该问题,第一阶段,本文提出了同源优先的仲裁机制(SSF仲裁机制),改进片上网络的传输机制,避免传输过程对访存特性造成干扰;第二阶段,在存储节点处采用基于按序调度的Batched-FIFO访存调度策略,简化调度逻辑结构,降低访存开销。随着GPGPU上集成的计算核心数越来越多,这种易实现、低开销的按序访存调度策略具有更好的实用性和可扩展性。(2)提出了基于目标节点的静态虚通道划分机制虚通道由于能够提高缓冲利用率,避免网络死锁,在当前的片上网络结构中被广泛使用。目前大多数虚通道划分机制的基本原理是,总是将空闲虚通道队列中的第一个分配给请求。这种划分机制容易导致路径的多样性,而路径多样性会降低访存请求的行缓冲访问局部性。因此本文提出了一种根据访存请求的目标节点信息来指导划分虚通道的静态虚通道划分机制,发挥虚通道技术优势的同时尽可能保留访存请求的访存特性,从而提升系统性能。(3)提出了面向存储节点的多端口片上路由微体系结构GPGPU中的片上网络分为请求网络和回复网络。回复网络中通常存在大量的读请求回复报文,这些报文由于携带读出的数据,报文数量多,长度大。因此,从存储节点出发到达计算节点的回复网络承受的流量负载过高,成为片上网络的性能瓶颈。为了缓解回复网络的负载压力,改善存储瓶颈,本文提出了一种轻量级的片上路由微体系结构设计方法,保持片上网络整体架构不变,只针对存储节点端的路由器增加本地Injection/Ejection端口。这样既能有效缓解存储系统的访存压力,提高系统性能,又能尽可能少地改动系统结构,保证负载均衡设计和前面提出的设计方案的兼容性。(4)提出了一种高效能GPGPU片上网络实现框架本文的最终目标是提出一个高效能的面向GPGPU的片上网络结构。因此,前面提出的设计方案分别以低功耗和高性能为目标,设计过程中保持了良好的正交性和兼容性。完成上述方案的设计实现并进行充分验证后,我们将上述研究成果整合到一起,形成一个完整的高效能GPGPU片上网络实现框架,并对它进行了测试与分析。实验结果表明,和目前流行的基于FR-FCFS访存调度策略的片上网络相比,本文设计的高效能GPGPU片上网络的系统性能在访存密集型程序上提高了10.5%,功耗开销降低了20%,能效比整体提高了36.9%。因此,本文提出的GPGPU片上网络对于访存密集型程序实现了高能效比,对于非访存密集型程序保持性能不损失,功耗不增加,而方案的设计实现复杂性远小于基于FR-FCFS等调度策略的片上网络结构。

  王宏伟;陆俊林;佟冬;程旭;;层次化的片上网络设计方法[J];北京大学学报(自然科学版)网络版(预印本);2007年01期

  林世俊;苏厉;金德鹏;曾烈光;;虚通道数和时钟比率对片上网络的影响[J];清华大学学报(自然科学版)网络.预览;2009年01期

  李贞妮;李晶皎;王爱侠;钟顺达;;片上网络跨时钟域的高速数据通信接口设计[J];单片机与嵌入式系统应用;2018年03期

  刘小丽;郇志轩;曹政;孙凝晖;;片上网络与系统域网络的协同设计探索[J];高技术通讯;2018年02期

  许川佩;凌景;胡聪;;动态带分复用的三维片上网络协同优化研究[J];仪器仪表学报;2016年12期

  丁永文;刘建辉;;片上网络体系结构设计分析[J];科技信息(学术研究);2007年31期

  黄翠;张大坤;宋国治;;三维片上网络映射算法研究综述[J];小型微型计算机系统;2016年02期

  宋国治;张大坤;涂遥;黄翠;王莲莲;;一种改进的基于粒子群的三维片上网络优化布局算法[J];计算机科学;2015年07期

  王佳文;李丽;潘红兵;李伟;张荣;;基于统计时分复用技术的三维片上网络[J];电子与信息学报;2012年10期

  钱悦;鲁中海;窦强;窦文华;;片上网络二维和三维结构的通信性能分析[J];计算机工程与科学;2011年03期

  木易;;Sonics进军中国市场 助力北京新岸线[J];电子技术应用;2010年11期

  李丽;许居衍;;片上网络技术发展现状及趋势浅析[J];电子产品世界;2009年01期

  李璐璐;裘雪红;周端;张剑贤;;片上网络容错技术研究[J];计算机科学;2018年03期

  胡森森;陈皇吉;;一种新颖的面向数据流量特征的片上网络设计[J];电讯技术;2018年05期

  赖国明;林小拉;;基于两级遗传算法的特定应用片上网络拓扑优化[J];计算机科学;2013年02期

  付斌章;韩银和;李华伟;李晓维;;面向高可靠片上网络通信的低成本可重构路由算法[A];第六届中国测试学术会议论文集[C];2010年

  欧阳一鸣;刘蓓;齐芸;;三维片上网络测试的时间优化方法[A];第六届中国测试学术会议论文集[C];2010年

  曹辉;巨新刚;于飞;;面向在轨信息处理的多层次紧耦合处理器设计和应用[A];航天电子军民融合论坛暨第十四届学术交流会优秀论文集(2017年)[C];2017年

  张哲;崔骞;高小鹏;龙翔;;面向多核平台的网络应用建模[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年

  杨中明;李玉柏;;NOC功耗分析与建模[A];四川省电子学会半导体与集成技术专委会2006年度学术年会论文集[C];2006年

  曹宇;胡文敏;;组播路由技术综述[A];第十五届计算机工程与工艺年会暨第一届微处理器技术论坛论文集(A辑)[C];2011年

  张颖;李华伟;李晓维;;采用SCAC和DICE触发器的可靠片上网络路由器[A];第六届中国测试学术会议论文集[C];2010年

  欧阳一鸣;朱兵;梁;;一种用于片上网络的自适应路由算法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年

  薛文良;马胜;许邦建;李晨;;面向GPGPU片上网络的高效动态虚通道划分机制研究[A];第二十届计算机工程与工艺年会暨第六届微处理器技术论坛论文集[C];2016年

  王琪;李思昆;;一种可信的大规模开关网络功耗分析方法[A];第十九届计算机工程与工艺年会暨第五届微处理器技术论坛论文集[C];2015年

  舒浩;区域集中全局分布式片上网络关键技术的研究与实现[D];西安电子科技大学;2016年

  黄敬雷;动态可重构专用片上网络拓扑结构生成算法研究[D];中国科学技术大学;2018年

  赵建武;片上网络系统可测试性设计及测试技术研究[D];电子科技大学;2009年

  张剑贤;高性能片上网络关键技术研究[D];西安电子科技大学;2012年

  姚磊;片上网络无虚通道容错路由技术研究[D];西安电子科技大学;2014年

  刘有耀;片上网络拓扑结构与通信方法研究[D];西安电子科技大学;2009年

  谭云飞;专用片上网络拓扑生成与映射优化算法研究[D];华南理工大学;2018年

  李志刚;可容错专用片上网络拓扑综合的研究[D];中国科学技术大学;2018年

  张壬申;基于FPGA的片上网络结构研究及路由算法设计与实现[D];东北大学;2015年

  刘文杰;面向众核协处理器的高效能GPGPU片上网络研究[D];国防科学技术大学;2017年

  孙成龙;片上网络中链路容错技术和通信方法研究[D];合肥工业大学;2017年

  陈姝燏;面向片上网络寿命优化的映射算法研究[D];电子科技大学;2018年

  吕骏华;CDMA片上网络优化设计及脆弱性研究[D];电子科技大学;2018年

  王春颜;基于FPGA的多核片上网络平台设计[D];电子科技大学;2018年

  武琼;片上网络任务映射与在线测试协同优化研究[D];电子科技大学;2018年

  清华大学微处理器与SOC 技术研究中心 陈磊 王惊雷 李兆麟 汪东升;片上网络:解决CMP互连瓶颈[N];计算机世界;2005年

  ST 提供;MPSoC时代的网络芯片技术[N];电子资讯时报;2007年

上一篇:IE-LINK W6-NEW WiFi带你寻找诗和远方 下一篇:中国微控制器(MCU)厂商盘点

返回

产品中心
新闻中心
员工活动