处理器芯片是信息系统中负责运算与控制的中枢芯片,是技术壁垒最高、创新链条最长、产业辐射最广的战略性集成电路产品,是信息社会的核心物质基础。2022 年,我国处理器芯片进口额超 2000 亿美元,该品类是同期我国进口额最高的商品类别。处理器芯片已成为我国实现高水平科技自立自强必须攻克的核心领域。
从研制我国首款高性能通用处理器芯片龙芯 1 号开始,中国科学院计算技术研究所(以下简称计算所)在我国处理器芯片事业从萌芽、成长到壮大的全过程中,始终发挥着不可替代的中坚作用。2006 年,在孙凝晖院士牵头下,计算所成立中科院计算机系统结构重点实验室,系统开展处理器芯片体系结构基础研究;2010 年,实验室获批升级为计算机体系结构国家重点实验室,成为我国唯一长期聚焦处理器芯片体系结构的国家级科研平台;2017 年,实验室在科技部国家重点实验室评估中获评优秀;2022 年,根据科技部、中国科学院统一部署,实验室重组为处理器芯片全国重点实验室(计算所为依托单位,中国科大为共建单位),入选我国首批 20 个标杆全国重点实验室。
值此计算所建所 70 周年之际,我谨代表实验室撰文,系统回顾实验室科研攻关历程,展望实验室未来发展蓝图。
01
攻关历程:与我国处理器事业同频共振
实验室的科研攻关脉络,与我国处理器芯片自主研发的历史进程深度绑定,二十余年间完成了从通用处理器零的突破,到开创国际深度学习处理器新方向,再到探索开源芯片发展新模式的持续跨越,持续推动了我国处理器芯片产业的成长壮大。
2001 年实验室成立前,在时任计算所所长李国杰院士的部署下,计算所成立唐志敏研究员、胡伟武研究员领衔的龙芯课题组,正式开启我国高性能通用处理器自主研发征程。2002 年,胡伟武研究员牵头研制的龙芯 1 号成功流片,终结了我国信息产业 “无芯可用” 的被动局面,也为实验室后续发展奠定了技术与人才根基。
实验室成立后,孙凝晖院士敏锐捕捉到人工智能发展将带来的计算范式变革机遇,前瞻布局青年科研团队开展深度学习与处理器芯片交叉研究。2013 年,实验室陈云霁研究员团队与法国 Inria 联合提出 DianNao 系列深度学习处理器架构。2015 年,陈云霁研究员、陈天石研究员等人研制出国际首款深度学习处理器芯片寒武纪 1 号,相关成果被 Science 杂志评价为深度学习处理器领域的 “开创性进展”“先行者”“引领者之一”。
面对复杂的国际科技博弈形势,实验室为我国开辟了开源、共享、协同的处理器发展新路径。2021 年,实验室包云岗研究员团队成功研制第一代开源高性能 RISC-V 处理器核 “香山(雁栖湖)”,性能跻身国际开源处理器核第一梯队,为全球开源芯片生态建设贡献了中国方案。
历经二十余年深耕,实验室逐步构建起覆盖处理器芯片设计工具、体系结构、指令集、基础软件的完整研究体系。截至目前,实验室 9 人入选计算机硬件架构领域全球前 2% 科学家,人数位列全球第三、中国第一。实验室人员累计获得 8 项国家科技奖项,包括我国处理器芯片领域迄今为止唯一的国家自然科学奖。实验室人员创立的龙芯、寒武纪、海光等企业,占据了我国处理器产业半壁江山,总市值达万亿元,有力保障了我国信息产业与智能产业的安全稳定运行。
02
核心使命:构建中国主导的处理器新体系
美西方长期主导的国际主流处理器体系,历经数十年发展,已形成对全球产业的高度垄断。实践充分证明,仅对既有体系进行仿制跟踪、原位替换和点状突破,无法从根本上改变核心技术受制于人的被动局面。构建处理器新体系,才是实现核心技术突围、掌握发展主动权的唯一可行路径。
因此,孙凝晖院士提出,应当建设中国主导、技术先进、开放共享的处理器科技新体系。新体系绝非对国际主流体系的跟踪模仿,而是立足基础研究原始创新,通过研发模式、设计方法、体系结构、指令体系等维度的系统性创新,实现更低研制成本、更短研发周期、更高计算能效、更广生态覆盖的发展目标,形成差异化错位竞争优势,最终推动我国处理器芯片技术既有力支撑国家战略需求,也为全球计算技术进步贡献中国智慧。
03
创新实践:四大核心方向
围绕处理器新体系建设目标,实验室从新模式、新方法、新架构、新指令等维度,开展体系化创新。
一是创新开源协同的芯片研发新模式。针对主流体系闭源垄断形成的研发门槛高、生态封闭、创新主体受限的核心问题,实验室打破传统闭源研发固有范式,以开源开放为核心重构处理器全流程研发体系,建立可分解、可组合、可复用的模块化设计方法,搭建覆盖全流程的开源工具链与技术平台,大幅降低处理器研发门槛,汇聚全球开发者形成协同创新产业生态,为处理器技术创新开辟了全新组织模式。
二是创新智能化的芯片设计新方法。针对后摩尔时代芯片设计复杂度指数级增长、高端研发人才供给不足、研发周期拉长的行业共性难题,实验室围绕超大规模电路自动生成的核心科学问题开展长期攻关,突破传统人工设计固有局限,构建以人工智能为核心的处理器全自动设计方法学,重构芯片设计全流程范式,大幅缩短研发周期、降低研发成本。
三是创新通用智能融合的计算新架构。针对通用计算与智能加速割裂、智能时代能效瓶颈凸显的核心问题,实验室突破传统 CPU、GPU、NPU 分立的架构局限,构建动态自适应的新型计算架构,兼顾通用编程灵活性与智能计算能效优势,适配人工智能时代全场景计算需求,在受限工艺条件下实现计算能效量级提升,为后摩尔时代处理器发展提供了全新架构路线。
四是创新兼容开放的指令集新技术。针对不同指令架构生态割裂、应用迁移成本高、自主指令集生态建设难度大的核心痛点,实验室突破传统指令集架构局限,构建兼容开放、可扩展、可定制的新型指令技术体系,既能够高效兼容主流指令集现有软件生态、降低应用迁移成本,又能够支撑自主指令集持续技术创新,破解了自主体系生态建设的核心瓶颈,为新体系规模化落地与全球化发展奠定了基础。
04
面向 2049 年的长远展望
面向 2049 年新中国成立 100 周年、实现第二个百年奋斗目标的历史节点,实验室将以持续的基础研究为根本牵引,建成国际顶尖的计算机体系结构学术高地,成为全球处理器领域原始创新的核心策源地。我们相信,实验室的基础研究成果能有力推动处理器新体系的全球化布局与生态建设,形成与国际主流体系并行发展、优势互补的格局。到那时,国产处理器芯片不仅能全面支撑我国信息产业与智能产业的高质量发展,更有望走出国门、服务全球,为人类计算技术的演进提供更开放、更普惠、更高效的全新选择。