语种
中文简体 中文繁体 English
营业厅
网上营业厅 掌上营业厅
返回顶部
央企首次!中国电信云计算研究院论文被计算机网络领域顶级会议录用
2026-05-14 云计算研究院

近日,由中国电信云计算研究院作为第一单位完成的独立自主研究成果《LEVELLER: Fair Communication Scheduling via Progress-Rate Awareness in Multi-Tenant Training Clusters》被国际计算机网络领域顶级会议ACM SIGCOMM(ACM Special Interest Group on Data Communication Conference)2026正式录用。该成果实现了央企以第一单位身份在ACM SIGCOMM发表独立自研论文的历史性突破,标志着中国电信在云计算网络基础研究与系统创新方面取得重要进展。

ACM SIGCOMM是计算机网络领域最具影响力的国际顶级学术会议之一,被中国计算机学会推荐目录列为CCF A类会议。五十多年来,SIGCOMM发表的诸多经典研究持续推动数据通信体系结构、网络协议、数据中心网络和互联网基础设施的演进,深刻影响了先进网络技术的发展方向。SIGCOMM对论文质量要求极高,强调基础性贡献、前瞻性影响与坚实的系统实现,录取率长期处于较低水平,近年来通常约为16%。其录用论文往往受到学术界与产业界的广泛关注,对创新技术落地和产业发展具有重要推动作用。据统计,截至2025年,尚未有央企以第一单位身份在ACM SIGCOMM上发表独立自主研发成果。此次中国电信云计算研究院以第一单位身份,将完全独立自主研发的成果写入这一国际顶级会议,实现了央企在计算机网络顶级学术舞台上的历史性突破。

图:LEVELLER设计架构(上)与效果(下)

本次被收录的论文《LEVELLER: Fair Communication Scheduling via Progress-Rate Awareness in Multi-Tenant Training Clusters》,解决GPU集群中多租户通信公平性难题。该工作由中国电信云计算研究院资深主任研究员李赓、实习生李泱(北京邮电大学在读博士生)、研究员臧明远以及中国电信集团首席科学家、中国电信云计算研究院院长吴杰教授完成。

当前,面向多租户的GPU集群已成为大模型训练(LLM)的核心基础设施。在多个训练任务共享网络资源的环境下,由于任务特性存在差异,现有主流通信调度系统难以保障公平性,常导致部分任务被“饿死”或进度滞后。通信不公平,不仅影响多租户的用户体验,制约集群的整体效能,更直接威胁到智算云服务的确定性(Cloud Integrity)和商业契约。

为此,该工作创新性提出归一化进度率(Normalized Progress Rate)指标,通过衡量任务在竞争环境下的实际进度与无干扰理想进度的比例,精准量化训练体验。这一任务无关的指标成功填补了底层flow-level公平性与上层模型训练job-level公平性之间的理论空白,是该领域的重要技术突破,或成为未来行业标准。基于该指标,研究团队构建了完备的公平性理论,并开发了LEVELLER系统,首次在多租户集群中针对任意工作负载实现通信调度的最大化-最小化公平(Max-Min Fairness)。

LEVELLER系统极具实用性与可扩展性,支持在RDMA和TCP现有硬件上直接部署。实验结果显示,在10种大语言模型的测试中,LEVELLER相比行业主流方案,提升最低进度率37%,优化公平性17%,同时保持极高的集群资源利用率。该工作为多租户AI集群提供了新的公平性基准,也为智算中心(AIDC)大规模训练通信调度提供切实可行的解决方案。

此外,中国电信云计算研究院陈子轩研究员参与完成的合作成果《Scale-up PIFO: Interleaving Multiple Priority Queues for High Speed Programmable Scheduling》也被ACM SIGCOMM 2026录用。该工作由复旦大学徐扬教授课题组牵头,面向AI数据中心和新型云网基础设施中交换机端口速率持续提升带来的高性能调度需求,针对传统单PIFO队列难以支撑1.6Tbps级线速处理、简单并行化又会引入调度误差等问题,提出高速可编程调度框架Scale-up PIFO。该框架通过交错并行多个PIFO队列提升调度吞吐,并设计Rank Range Load Balancing算法,在控制调度误差的同时保持硬件实现的简洁性,为下一代高速数据中心网络中的可编程QoS调度提供了新的技术路径。

近年来,央企在基础研究与原始创新领域持续积累、厚积薄发。中国电信云计算研究院研究团队在中国电信集团首席科学家、云计算研究院院长吴杰教授的带领下,持续深耕云计算网络基础技术与关键系统创新,从理论提炼到系统实证,在面向智能计算基础设施的网络关键问题上开展长期攻关。此次成果录用ACM SIGCOMM 2026,体现了中国电信云计算研究院在国际计算机网络研究前沿的原创创新能力,也表明央企不仅能够在重大工程建设中“扛大梁”,正在基础研究与原始创新中持续发出中国企业的技术声音。

未来,中国电信云计算研究院将继续坚持创新驱动发展,深化云计算网络基础技术布局,推动重点科研成果向核心技术能力转化,并融入天翼云平台能力体系,持续增强关键底座能力,不断提升自主创新水平与体系化竞争优势。同时,中国电信云计算研究院将进一步发挥在云计算、网络系统和智能计算基础设施领域的技术积累与人才优势,为中国电信“云—网—数—智”融合发展提供更加坚实的底层技术支撑。

扫一扫在手机打开当前页