近日,CoDesign 2025国际研讨会在日本大阪成功举办。本次大会由田纳西大学图灵奖得主杰克·唐加拉(Jack Dongarra)院士、中国科学院计算技术研究所孙凝晖院士与大阪大学刘丽君教授共同发起,吸引了来自世界各地的专家学者齐聚一堂,围绕极大规模计算与大数据挑战下的软硬件协同设计展开深入探讨,为全球高性能计算发展注入新动能。
开幕式与致辞:聚焦核心方向,共话发展挑战
开幕式上,主持人Sheng Di研究员与陶鼎文研究员介绍,本次会议聚焦算法、应用系统、系统软件与中间件、软硬件协同架构设计四大核心方向,涵盖高性能与可扩展计算关键领域。同时,会议设置了算法与计算模型、系统与体系结构设计等五大热点研究主题,并安排两场重要圆桌讨论,分别探讨“未来百亿亿次计算的发展方向”及“HPC与AI结合推动科学研究”。
Jack Dongarra教授通过视频致辞指出,在计算架构异构化、AI/ML工作负载兴起的背景下,CoDesign研讨会对推动软硬件协同设计意义重大,强调本届会议聚焦的异构系统架构等方向中“集成”的重要性。
钱德沛院士则强调人工智能已成为高性能计算发展的核心力量,模型规模增长带来算力需求指数式上升,同时能源消耗成算力发展瓶颈,建议通过推动异构架构、加强国际合作等应对挑战。
主题报告与技术分享:前沿成果频出,探索突破路径
会议期间,多位专家学者带来精彩的主题报告与技术分享。
卢宇彤教授围绕“高效能计算的协同设计与碎片化挑战”指出,系统碎片化影响算力协同与开发效率,软硬件及运行环境的协同设计是关键,还展望了高性能计算发展的十大趋势。
Shuaiwen Leon Song教授介绍了Together AI的“AI加速云”平台,其自研的推理引擎和优化策略表现优异,体现出构建全球级AI计算基础设施的野心。
Thomas C. Schulthess教授展示了瑞士CSCS建设的云原生超算平台ALPS,该平台支持弹性资源调度,秉持“科学即服务”理念,将支撑多个大型科研项目。
Xian-He Sun教授聚焦“内存墙”问题,提出相关理论和模型,介绍的Hermes系统通过优化数据流动方式突破性能瓶颈,强调未来计算系统应“以数据为中心”。
此外,众多专家学者还就大模型训练优化、超级计算机架构、调度算法、内存问题解决、数据压缩工具应用等方面分享了前沿技术成果与研究进展。
圆桌讨论:深入剖析热点,凝聚发展共识
在“未来百亿亿次计算的发展方向”及“HPC与AI结合推动科学研究”两场圆桌讨论中,专家们各抒己见。
关于HPC与AI结合,卢宇彤教授认为现阶段应坚持通用架构;Thomas Schulthess教授等认为更高集成度的CPU–GPU耦合架构是未来方向;对于AI辅助科学编程,专家们存在不同看法;同时指出Transformer并非AI for Science通用架构解法。
在未来百亿亿次计算方向,专家们探讨了Zeta Scale的定义、实现的必要性,以及系统可靠性等问题,认为Zeta Scale的追求是系统工程命题,系统功耗、系统可靠性是规模扩展的核心障碍。
本次CoDesign 2025国际研讨会为全球高性能计算领域的专家学者搭建了高效的交流平台,分享的前沿成果与达成的共识,将有力推动全球高性能计算与AI融合的发展,为应对未来计算领域的挑战与机遇提供重要指引。