北大学生优化清华系大模型,拿ASC全球超算大赛冠军

北大学生优化清华系大模型,拿ASC全球超算大赛冠军
2024年04月16日 18:29 量子位

克雷西 发自 上海

量子位 | 公众号 QbitAI

北京大学再次卫冕

第十一届ASC世界大学生超算竞赛总决赛,在上海大学落下帷幕。

北京大学再次斩获决赛冠军,亚军则被中山大学拿下。

经过前期初赛的角逐,来自多个国家和地区的300多支队伍,有25支进入到了决赛现场,经过5天的激烈比拼,冠亚军和包括大模型在内的各单项奖纷纷揭晓。

此外比赛中还设置了“超级团队赛”,来自西南石油大学、齐鲁工业大学、南方科技大学、上海大学、香港理工大学的联合团队获得了这一奖项,其中西南石油大学是首次杀入ASC决赛

中国科学院钱德沛院士表示,通过参加ASC竞赛这样高水平的前沿科技竞赛,(学生们)跨入超算大门,以赛代学,以赛促练,激发兴趣,快速成长,来年必定会成为我国乃至全球超算事业的中坚力量,创造无限的可能。

那么,此次的ASC竞赛都设置了哪些题目呢?

超算竞赛,不只是超算

ASC世界大学生超级计算机竞赛,由中国在2012年发起,与美国SC、德国ISC并称全球三大超算竞赛,今年是第11届。

参加决赛的25支队伍需要用前两天的时间,设计安装小型超算集群,完成后便不能再对硬件进行改动。

后面的两天,他们需要解决包括大模型在内的7道题目,涉及人工智能、行星科学、渗流力学、材料科学等不同学科,对算力的需求也不尽相同。

但比赛设置了3000瓦的总功率限制,一旦爆表则成绩取消,这对选手们对各个题目的预判有着严苛的要求,他们需要对CPU和GPU进行合理分配,才能在有限的功率下尽可能取得更高的综合性能。

竞赛中的一道题目是进行“跑分”——通过超级计算机浮点性能基准测试程序(HPL)来评估超算系统的计算性能。

ASC竞赛规则要求各参赛队伍自行设计超算系统,在总功耗3000W约束下正确完成包括HPL计算性能基准测试在内的各项计算任务。

比赛中,来自浙江大学的队伍获得了该测试的单项第一名。

不过,要说超算竞赛,就不能只说超算——

ASC超算竞赛题目涉及交叉学科,关注科学界的多种热门话题,参赛选手也拥有不同的专业背景。

炙手可热的大模型当然也不例外——从去年大模型热潮涌现开始,ASC就已将相关内容收录成了赛题。

大模型依然炙手可热

初赛阶段,参赛队伍要使用FP16或BF16精度,为知名开源大模型Llama2-70B构建并优化推理引擎,在组委会提供的1万样本数据集上实现尽可能高的推理吞吐量。

决赛阶段,要求参赛队伍基于智源研究院的开源大模型AquilaChat2-34B,构建并优化推理引擎。

在组委会提供的样本数据集上,选手需要使用4bit及以下量化来进行推理,在保证精度的前提下提升推理速度。

要想在这道赛题中取得佳绩,各参赛队伍需要充分了解并掌握大模型常见的并行方法,并学习使用各种技术来优化推理过程。

除了大模型之外,大赛的题目还涉及石油开采、火星大气模拟等热门科技话题。

石油开采渗流数值模拟

这是一道实际工程计算难题,也是本届e Prize计算挑战奖的指定赛题。

这道题目中,他们要对一款渗流数值模拟软件进行并行计算优化,研究多相流体在多孔介质中的复杂流动规律与特征。

多相流体渗流问题主要研究的是在多孔介质中,多种不同流体(如油、水、气等)的流动和相互作用过程。

多相流体渗流问题是渗流数值模拟研究渗流理论中最困难的,已经成为推动渗流力学理论进一步发展的关键学科之一,对算力的需求非常大

例如在油气开发中,油田网络在水平方向上的分辨率基本上是十米至百米的量级,网格划分非常粗,要想精细化描述油藏特征,就会大幅增加计算量。

ASC24超算竞赛设置了渗流数值模拟赛题。要求各参赛队伍根据组委会提供的数据集,模拟石油开采场景中油、气、水等多相流体的渗流情况,并优化大规模并行计算过程,提升离散算法的计算性能和并行效率。

火星大气模拟

不仅“可下五洋捉鳖”,还要“可上九天揽月”,在比赛中,选手们还需要解决的,是一道太空探索计算难题。

他们需要以中科院大气物理所研制的新一代火星大气模模式(Global Open Planetary atmospheric model for Mars,简称GoMars)中的动力框架为基础,通过优化并行通信和提高计算负载均衡,尽可能提升程序运行效率,以实现对火星大气状态更加精细、高效的求解预测。

火星大气的直接观测数据很少,火星大气模式是研究火星大气环境的重要方法。

GoMars根据多个火星探测器的观测结果以及国际火星大气全球数据集构建,可以模拟火星大气环境中沙尘、水和二氧化碳三个关键气象元素的循环,对火星地表气压、地表温度、纬向风、极地冰和沙尘等进行较好的模拟。

其中用于流体计算的动力框架GMCORE基于经纬网格构建,面向高分辨率模拟设计,需要满足高效性和准确性的双重考验,其中极具挑战性的问题是如何优化并行通信和提高计算负载均衡

GoMars赛题对参赛大学生而言是一项艰巨的挑战。选手们需要在给定的动力框架标准测试算例约束下,在保证计算精度的同时尽量缩短程序运行时间,在模拟精度、效率等多个维度中进行合理的平衡,从而获得理想的结果。

前面的几道题目,参赛队伍在赛前就已知晓以上赛题的大致方向,以便能够安排队伍的人员构成,但也有一道神秘赛题,直到决赛过程中才被揭晓。

探索新型材料

“神秘应用”的赛题为新型材料非平庸电子结构计算。所使用的WannierTools是一款基于紧束缚模型研究材料拓扑物性的开源软件。

参赛学生在3000W功耗限制下正确运行全部算例,并尽可能地缩短应用的运行时间。

这道赛题考察参赛者对石墨烯的朗道能级计算及拓扑材料表面态计算方法的理解,以及代码编译运行与程序优化的能力。

总之,这些题目不仅能考验同学们在计算领域的知识积淀,更体现了科学研究与计算技术加速融合的时代,跨学科学习能力的重要性。

而与此同时,这场竞赛不仅是技术的较量,更是友谊与知识的交流

超算竞赛,亦不只是竞赛

除了前面常规的赛题,ASC竞赛还设置了颇具特色的“超级团队赛”,考验了不同团队间选手们的沟通协作。

本次超级团队赛的应用赛题是ParaSeis地震波模拟。ParaSeis地震模型能够清晰地模拟地震波在地球内部的传播过程,进而应用于地震预测和地震危险性分析等领域。

在超级团队赛中,通过抽签,25支队伍组成了5个超级团队,他们将使用ParaSeis模拟真实地形下地震波的传播,通过相互交流、合作优化ParaSeis的算法和扩展性,并执行应用程序的编译、调试、优化工作。

最终,“超级团队”中各队伍成绩平均分,将作为该组团队的最终成绩。

超级团队赛对参赛选手来说,是一场技术与协作的双重考验

他们面临的是计算量和并行策略设计的双重难题,不仅需要参赛者具备坚实的数学和物理基础,还需具备强大的计算机编程能力和算法优化能力;

团队协作层面,超级团队内的5支队伍完全依靠随机抽签进行组合,队员可能有着不同的语言、文化背景,需要高效的协作沟通能力才能在挑战者脱颖而出。

而除了超级团队赛,这种合作交流也贯穿了始终。

获得冠军的北京大学代表队代表徐天乐同学就为我们介绍了这样的一段经历:

澳门科技大学今年是第一次参赛,他们找不到足够有经验的同学,每队一般是有五位队员,但他们只有三位,参赛经验也不充足。

他们在跑benchmark基本测试的时候都会遇到问题,我们正好跟他们有过交流,比较熟悉,他也会和我们提问,我们会花一些时间帮他们。

我觉得比赛最重要的是友谊和大家的收获,而不是说你必须要超过他多少,而且我觉得也没有花太多时间,(比赛中)大家都会(像这样)交流。

通过这5天的比拼交流,同学们既考验了自己的综合能力,也收获了知识、收获了友谊、收获了成长。

组委会特邀嘉宾,Intersect 360首席研究官Dan Olds表示说,未来的年轻人,可能创造出的新成绩,也许会是我们现在根本无法想象的

最后,完整获奖名单附上~

冠军:北京大学亚军:中山大学

超级团队奖:

上海大学 南方科技大学 齐鲁工业大学

西南石油大学 香港理工大学(中国香港)

e Prize计算挑战奖:台湾新竹清华大学(中国台湾)

最高计算性能奖:浙江大学

应用创新奖:山西大学 上海交通大学 北京航空航天大学

最佳人气奖:山西大学 国立科尔多瓦大学(阿根廷)

一等奖:

上海交通大学 浙江大学 国防科技大学 山西大学

暨南大学 北京航空航天大学 台湾新竹清华大学(中国台湾)

兰州大学 哈尔滨工业大学(深圳) 青海大学 华中科技大学

中国科学技术大学 香港理工大学(中国香港) 福州大学

南方科技大学 齐鲁工业大学 埃尔朗根-纽伦堡大学(德国)

西南石油大学 泰国农业大学(泰国) 国立科尔多瓦大学(阿根廷)

澳门科技大学(中国澳门) 上海大学 香港中文大学(中国香港)

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部