[ChinaSys十周年特辑] 包云岗:ChinaSys十周年感想

(本文转载中科院计算所包云岗研究员发表于知乎的文章“ChinaSys十周年感想”,本次转载已获作者本人同意,查看原文请点击这里

ChinaSys是由国内一批计算机系统方向的学者于2011年创办,今年已经十周年了。5月22-23日,第20届ChinaSys在杭州举办。满满的两天日程,我认真地听完了80%的报告,说说自己的体会和感想。

一、ChinaSys十年见证中国进步

1、国内计算机系统方向的学术水平已经有质的变化

十年前创办ChinaSys的初衷是因为国内计算机系统结构方向国际顶会论文寥寥无几,所以希望通过交流对一些有潜力的工作多提建议,冲击国内顶会论文。

最初的几届ChinaSys以介绍未发表工作为主。随后几年,不断有年轻的新面孔出现在ChinaSys讲台上和会场中,而国际顶会论文的数量也不断攀高。今年的第20届ChinaSys出现了即使国际顶会论文也没有机会报告的情况,甚至仅ISCA论文就有8篇,以至于不得不分为两个ISCA专场。

ChinaSys十年见证了中国计算机系统方向学术水平的提升,也实现了ChinaSys成立的初衷。

2、计算机系统方向得到前所未有的关注

第20届ChinaSys采用线上线下方式。由于疫情防控要求,线下人数限制在100多人,但一开放注册很快就满了。而此时离会议时间还有好几周,于是很多人不得不只能观看在线直播。

出乎意料的是高峰期竟然有超过1.3万人在观看直播。这个数字让我对国内计算机系统方向发展充满信心。ChinaSys从成立之初就一直是对全国学术界和工业界免费开放的,但即使如此,最初几届也一直只有100人左右。

如今,注册人数上限秒杀,在线人数过万,这说明国内对计算机系统方向越来越重视了。这其中,有越来越多的高校老师和学生在关注,甚至是本科生;更重要的是有越来越多的业界工程师开始关注。这些都将进一步促进国内计算机系统方向的发展。

3、国内工业界的技术需求开始引领世界,并传递到学术界

对于高科技发展,我偏向于“需求驱动派”,或者说属于“巴斯德象限”科研模式的拥趸。因此也一直特别关注业界对前沿技术的需求发展动向。

2012年的一次调研,让我体会到当时国内业界对前沿技术的需求和硅谷企业还有大约5年的差距。当时为了调研业界对标签化体系结构的需求,我带着学生去BAT等大厂以及一些创业公司,向多位业界专家请教。当时得到的反馈是国内对数据中心多应用混合部署的需求不足,而彼时谷歌已经在数据中心大规模混部了。大约5年后,国内企业开始重视起来。

但这种局面开始改变了。这次ChinaSys听了清华陈文光教授介绍他在国内一家大厂兼职时所接触到的对图计算系统的需求,让我很是惊叹,比如:(1)业界已经需要以千万次QPS、百万TPS的速度处理高达万亿条边的大图,而且要保障99.9%分位延迟小于20ms(甚至10ms);(2)需要高性能精准仿真,6个月的数据在4小时内完成;(3)对于部署在三地五中心的系统,要实现故障1分钟发现,5分钟止血,10分钟恢复(1-5-10)。

yungang-1.jpg yungang-2.jpg

不谦虚地说,国内业界企业的一些技术需求已经是世界领先。而且更重要的是,在这次ChinaSys上,这些需求是由来自清华大学的学者来介绍,这意味着工业界的前沿需求和学术界的前沿研究已经无缝衔接起来了。当这个“前沿需求-前沿研究”循环转起来,国内的技术进步还会再加速。

4、越来越多的研究工作不仅发表了顶尖论文,还有对应开源项目

很多报告在快结束时会公布开源项目链接,这是一个很好的现象。牛顿说他的成就是站在巨人的肩膀上取得的,而开源的意义就是提供一杆靠着巨人肩膀的梯子,让其他人可以更容易爬上巨人的肩膀。

国外学术界发起了很多影响全世界的开源项目,比如LLVM、Spark、Ceph等等。然而国内学术界在开源方面还有较大差距,很高兴现在越来越多的老师和同学愿意把研究成果开源。虽然也有老师对开源心存顾虑,还犹豫该不该投入精力去维护开源项目和社区,担心投入太多精力后在现有学术评价体系下会无法形成竞争力,不如顶会论文效果直接。

但是,我的判断这些顾虑都是阶段性。只要有人去做开源,相信未来国内学术界肯定会出现若干个标杆性开源项目,在工业界和学术界形成影响力,那么就会产生示范作用,就会带动更多学术界开源项目。这是大势所趋。

二、ChinaSys未来发展建议

1、做报告的大学和研究机构过于集中

这次ChinaSys算上Keynote一共40个报告,其中清华8个、中科院8个(计算所+信工所+深先院)、华中科大5个、上海交大4个、北大2个,加起来27个报告就已经占了近70%了。

这么集中很容易给人感觉就是一个小圈子在玩,这并不是有利于国内系统方向整体实力的发展。如何能吸引让更多大学参与,是ChinaSys下一个十年需要重点思考和改变的议题。

2、平台性工作相对偏少

ChinaSys上的报告几乎都是已经发表在国际顶会上的论文,这是非常可喜的事。目前这些工作中很多是解决某个具体的点问题,有的是解决业界的某个具体的需求,有的是自由探索出来的前沿问题,但相对而言平台性工作还很少。让我印象深刻的是北大梁云团队的两篇ISCA工作,是在一个平台上的两个具体问题,期待以后ChinaSys上这类平台性工作能更多一些。

3、缺乏大学/研究所之间的合作共享平台

继续谈一下平台性工作。美国在系统领域有多个用于科研的合作共享平台,比如PlanetLab、CloudLab等,并且还能得到NSF的经费资助。这样的平台具有很大的意义:

yungang-3.jpg

其一,平台是创新想法的试验床,可以加速创新,也有利于创新想法的传播与应用。今年安排学生参加了ASPLOS的论文实验复现评估工作,两个都是微服务的工作,一个工作的实验平台是在CloudLab上,只用了3天就完成复现了,而另一个是作者自建的一个微服务环境,用了一个月,和作者反复沟通,最后还是没能复现。这也体现出统一实验平台的价值。

其二,平台可以集成各种创新技术,通过自身的运行和演进,使创新技术得到应用和验证,会有利于一项创新技术向产业界辐射。

其三,这种平台往往需要多个大学和研究机构联合开发,因此平台本身的建设就是一个有挑战的科研项目,将会有助于促进形成大学/研究所之间的紧耦合式合作模式,改变以前“拿项目、分经费、各干各”的模式。这方面,DARPA项目组织和管理模式具有很好的借鉴意义——DARPA ERI项目会要求每年有两次持续一周的封闭集成,所有子课题都要参加,集成效果会影响后续资助。

yungang-4.jpg

期待ChinaSys下一个十年!