在国家自然科学基金项目(批准号:T2222026)等资助下,中国科学技术大学精准智能化学重点实验室商红慧教授、杨金龙教授团队与中国科学院计算技术研究所刘颖高级工程师、华东师范大学何晓教授等团队合作完成的研究成果“突破量子力学物性模拟极限:亿原子级生物系统的拉曼光谱计算(Pushing the Limit of Quantum Mechanical Simulation to the Raman Spectra of a Biological System with 100 Million Atoms)”成功入围2024年戈登·贝尔奖(https://sc24.supercomputing.org/2024/10/presenting-the-finalists-for-the-2024-gordon-bell-prize/)。这是中国唯一入围的研究成果,也是该团队继2021年后再次入围这一奖项。戈登·贝尔奖是国际高性能计算应用领域最高奖,由美国计算机协会(ACM)颁发,用于表彰世界范围内高性能计算的杰出成就,尤其是高性能计算应用于科学、工程和大规模数据分析领域的创新工作,被称为“超算领域的诺贝尔奖”。论文链接:https://dl.acm.org/doi/10.1109/SC41406.2024.00011。
拉曼光谱是研究生物分子结构的重要工具,广泛应用于药物开发、疾病诊断等领域,然而,拉曼光谱量子模拟计算量巨大。此前的拉曼光谱量子模拟仅能处理数千原子的小体系,研究团队开发的QF-RAMAN程序突破了这一限制,首次实现了包含1亿多原子的新冠病毒刺突蛋白在水溶液中的拉曼光谱量子模拟。这一突破得益于团队在算法设计和工程技术方面的多项创新。在传统密度泛函理论(DFT)和密度泛函微扰理论(DFPT)计算中,计算量随体系规模的增大呈现三次方增长,这使得计算通常只能局限于小型体系。针对这一问题,团队开发了将全电子全势密度泛函微扰理论与量子分块算法深度融合的新方法,通过将复杂生物分子分解为多个子系统,显著降低了计算复杂度。同时团队针对海量分块计算的负载均衡难题,开发了分块体量敏感的多级调度技术,提高了海量分块计算的并行可扩展性;针对小规模运算的异构加速难题,提出了弹性任务卸载技术;通过小规模运算的灵活聚合,大幅提高了异构加速器的硬件利用率。此外,QF-RAMAN程序采用OpenCL通用异构并行计算框架,能在不同硬件架构(CPU、GPU、SW等)的超级计算机上,借助OpenCL编译工具链(oneAPI、rocm、swcl等)实现跨平台运行。在最新一代神威超级计算机上,该程序利用96,000个计算节点(超过3,700万个计算核心),实现了399.9 PFLOP/s的双精度峰值性能;在东方超级计算机上,使用6,000个节点(24,000个GPU),也展现了85 PFLOP/s的优异性能。两台超算上的强弱扩展性能均接近理想值,充分展示了该方法的高效性和可扩展性。在此基础上,团队提出了适用于亿级原子体系的矩阵方程求解拉曼光谱的新算法,避免了直接对角化求解,为高精度拉曼光谱计算提供了全新方案,有效解决了大规模量子力学拉曼模拟中的关键技术难题。
这项研究不仅展示了我国在高性能计算和计算化学领域的领先地位,也将量子力学模拟扩展到前所未有的计算规模,为理解复杂生物系统开辟了新途径,也为量子力学模拟开辟了更多的应用场景。