【48812】上海交大赵世振团队在光电混合数据中心无死锁路由方向获得重要发展
日期:2024-06-05 05:15:52   来源:常见问题

  近来,计算机网络体系尖端会议USENIX NSDI 2023在美国波士顿举行。本年恰逢NSDI举行建立20周年庆典,也是自2020年以来计算机网络体系范畴初次以全线下形式举行的世界盛会。上海交通大学电子信息与电气工程学院约翰·霍普克罗夫特计算机科学中心长聘教轨副教授赵世振受邀参会,陈述团队的最新研讨成果。

  赵世振团队规划了一种称为“扁平胖树”的网络架构,能够彻底消除光电混合数据中心的路由死锁,为光电混合数据中心支撑无损RDMA协议奠定根底,相关论文“Flattened Clos: Designing High-performance Deadlock-free Expander Data Center Networks Using Graph Contraction”(扁平“胖树”:高性能无死锁的数据中心直连拓扑架构)已被该会议接纳。本篇论文一切作者均来自上海交通大学,赵世振与其辅导的硕士生张琦周为一起榜首作者。

  RDMA在近年来因为其高带宽、低时延、低CPU占用率的特性而得到了各大数据中心提供商(包含微软、阿里巴巴等)的重视。微软、阿里巴巴也在活跃布置RDMA,并在传统胖树架构的数据中心内总结出一套较为有用的计划。但是,现有光电混合数据中心的路由计划并不能有用支撑RDMA。底子原因是:传统RDMA需求底层网络敞开PFC(Priority-based Flow Control)来确保网络无丢包;现有光电混合数据中心的路由算法大多存在循环缓冲区依靠(Cyclic Buffer Dependency,CBD),敞开PFC或许会引起网络呈现死锁。因而,怎么规划路由算法消除光电混合数据中心的CBD,是在光电混合网络中支撑RDMA的一个关键问题。

  为了消除CBD,论文提出了一个根据“图映射”的拓扑/路由联合规划的详细计划。首要,将每个电交换机拆分为k个虚拟交换机,并将这k个虚拟交换机放在不同的“层”中。利用光交换机重构逻辑拓扑,能确保只要相邻层的虚拟交换机能够互连。这样就把光电混合网络的逻辑拓扑映射成了一个具有层级结构的拓扑。然后,在路由寻觅中,要求每条途径一定要满意“Up-Down”的要求,即每条途径均是先从底层虚拟交换机发往上层虚拟交换机,然后再从上层虚拟交换机发往底层虚拟交换机。随后进行一个“图缩短”操作,把虚拟层级结构图中的每条Up-Down途径反映射成一条原图途径。上述办法生成的途径能够严厉证明不存在CBD,因而能完全避免网络死锁。

  现有工作中存在别的一种根据Edge-Disjoint Spanning Tree(EDST)的路由办法,能够在光电混合网络中消除CBD。但是,这种办法找出的途径长度远大于根据“图映射”的路由办法。试验标明,关于大型光电混合数据中心,根据“图映射”的路由办法可提供比根据EDST的路由办法高10余倍的网络吞吐。

  USENIX网络体系模块规划与完成会议(USENIX Symposium on Networked Systems Design and Implementation,NSDI)是计算机网络体系范畴久负盛名的尖端会议,侧重于网络和分布式体系的规划、完成和测验,着重跨学科及实用性,广受学术界及产业界重视。大会论文录入严厉,NSDI 2023录入率仅为16%,被选用的稿件反映了计算机网络体系范畴世界最前沿的研讨水平。

  赵世振,上海交通大学长聘教轨副教授,博士生导师。2010年结业于上海交通大学电子信息与电气工程学院,获学士学位。2015年结业于普渡大学电子与计算机工程专业,获博士学位。2015-2019年头上任于美国谷歌网络组。2019年起参加上海交通大学约翰·霍普克罗夫特计算机科学中心。现在主要是做光电混合数据中心网络架构的研讨,相关研讨成果宣布在NSDI,SIGMETRICS,ICNP,INFOCOM,TON等世界闻名会议与期刊。