|
高通量计算关键技术
针对高通量计算高吞吐、高利用率、低延迟的需求,我们需要把当前计算机体系结构的设计从“速度导向”转向“通量导向”,从而确保计算机系统在满足高吞吐、低延迟的同时还能达到高利用率。针对上述目标,中国科学院计算技术研究所在高通量计算机研制过程中提出了一系列关键技术,包括高通量众核体系结构、高通量片上数据通路、标签化体系结构等。
高通量众核体系结构
针对高通量应用中的海量并发处理需求,我们提出了 Godson-T 众核处理器体系结构,以实现任务的高吞吐。相比于传统多核处理器,Godson-T 采用众核架构提供丰富的并发处理能力,并在片上网络、片上存储、同步模型和通信机制等方面采用创新性的设计方法,以实现任务的高吞吐和低延迟。
易扩展片上网络。Godson-T 采用易扩展的二维网格片上网络,同时支持拥塞感知和能耗感知的动态路由算法以实现高并发场景下的片上网络负载均衡,进而确保网络通信的低延迟。
细粒度可配置片上存储。Godson-T 的片上存储支持细粒度可配置,从而更好地适配高通量场景下复杂的数据访问模式,降低延迟。
快速同步机制。我们设计了片上同步管理结构,支持基于数据流的核间细粒度快速同步,相比传统的基于内存的同步机制,性能可获得数量级的提升。
可编程数据通信机制。Godson-T 提出了可编程数据传输引擎结构,可以快速实现数据的水平(片上处理器核之间)和垂直(从内存到片上存储)搬运,实现了数据通信的低延迟。
Godson-T 众核处理器结构受到国际同行的广泛关注,2011 年,处理器领域的知名期刊《微处理器报告》(Microprocessor Report)对 Godson-T 的研究成果进行了专门文章报道,并将其选入 2011 年全球十大服务器处理器之一。
高通量片上数据通路
“通量导向”的处理器数据通路设计也是确保“高吞吐、低延迟”的关键,我们借鉴城市交通管理的思路开展设计。高通量计算在结构特征、资源管理、调度策略等方面都非常类似于城市交通管理,两者的核心特征都是高通量,即在单位时间内完成尽可能多的处理请求,并保证 QoS,表 2 给出了两者的类比情况。
针对应用的新特点,高通量数据通路重点在最基本的数据读取、数据传输(访存通路)和数据处理3个环节进行了创新。
数据读取环节。针对应用中的大量细粒度访存需求,设计了基于硬件的访存请求收集表,通过对大量细粒度访存的收集并批量处理,同时通过时间敏感的收集窗口控制机制,避免长延迟导致的任务失效。
数据传输环节。针对大量细粒度访存的需求,提出了高密度路网的设计,从而提高片上网络的利用率和吞吐量。支持动态通路调整,能根据数据传输的压力,动态调整传输通路配置,提高通路利用率。此外,通过直连快速网络保障关键数据通路的低延迟。
数据处理环节。提出了硬件支持的全局实时任务调度机制,将任务按照优先级及剩余裕度时间进行调度,有效保障任务的 QoS;同时避免对时间裕度不足的失效任务进行调度,从而确保硬件资源的合理利用。