应用案例

8月28日,国家数据局在2024中国国际大数据产业博览会“数算一体,驱动未来”交流活动上发布《全国一体化算力网应用优秀案例集》。
编辑 | 数据君
为充分展示全国一体化算力网建设领域取得的应用成效,国家数据局组织开展了“全国一体化算力网应用优秀案例”征集遴选工作。各地方积极响应、踊跃参加,共推荐报送案例221个,涵盖多元算力一体化布局、东中西部算力的一体化协同、算力与数据算法一体化应用、算力与绿色电力一体化融合、算力发展与安全保障一体化推进等五个方向。首批遴选出25个优秀案例,旨在展现这一领域的探索成果和创新突破,加快推动全国一体化算力网建设,赋能经济社会发展。
一、多元算力一体化布局
1.构建算力基础设施 铸就多元算力一体化布局
2.异构融合、应用引领、促进数据互联互通的超算互联平台
3.临港算力创新实践 提升枢纽节点集约化成效
4.打造智算算力网AI开发平台 助力人工智能基础设施发展
5.构建算网融合平台 赋能行业场景应用
6.以算力赋能人工智能产业发展 打造东数西算成渝枢纽新引擎
7.贵州枢纽节点算力调度平台实践 融入全国一体化算力网规划
8.绿色智能算力“铁三角”赋能千行万业
9.构建算力调度服务体系 提升算力资源服务效能
10.算力跨域试验场 开源互联新生态
二、东中西部算力的一体化协同
11.“三重网络三重算”构建园区新质生产力
12.打造国家枢纽节点公共传输通道服务能力 有效提升“东数西算”网络传输效能
13.长三角枢纽芜湖集群算力公共服务平台 提供一站式算力服务
14.东西联动、融合创新 助力东西部数字经济融合发展
15.打造算力网实验场 加速融入全国一体化算力网
16.国产V2V自主可控协议体系 支撑东西部算力一体化协同
三、算力与数据算法一体化应用
17.“东数西算”实现“算力数据算法”融合 构建智驾行业数字化竞争力
18.基于算力、数据与算法一体的跨主体数据多方安全计算实践
19.构建基于“东数西渲”的渲染云基础设施底座
四、算力与绿色电力一体化融合
20.探索“绿电聚合供应”模式 实现京津冀枢纽张家口集群算电高效协同
21.内蒙古枢纽打造绿色可溯源和林格尔集群 推进算电协同发展
22.甘肃枢纽庆阳集群源网荷储一体化建设 推进算电协同深度融合
23.建设“零碳数据中心”助力算力与绿色电力一体化融合
五、算力发展与安全保障一体化推进
24.粤港澳枢纽韶关集群打造一体化安全体系,保障数据中心集群可控
25.打造宁夏枢纽节点云安全运营管理平台,有效保障网络与数据安全
01
构建算力基础设施铸就多元算力一体化布局
推荐单位:北京市政务服务和数据管理局、北京市通信管理局
申报单位:中国电信股份有限公司北京分公司、天翼云科技有限公司
随着人工智能大模型应用蓬勃发展,大模型训练存在的计算显存限制、风冷算力密度较低、智算资源利用率较低等问题日益突出。中国电信不断优化算力设施建设布局,加快研发落地息壤算力调度平台,显著提升算力协同调度能力,实现多元算力一体化布局。
一是建设超大规模高性能智算中心,赋能行业数字化转型。建设业内领先的液冷高性能公共智算中心,提供4000PFlops总算力供给,可满足万亿参数模型训练。采用基于全栈AI软硬件平台方案,实现算、存、网、电、冷一体化设计,实现电能利用上的增效,依托超大规模智算集群强大计算能力,赋能千行百业数字化、智能化转型。

二是打造智算服务平台,满足多场景需求。依托天翼云自主研发的“慧聚”“云骁”“息壤”三大平台,提供高算力、高吞吐、高兼容性训练能力,支持第三方算力以算力插件模式实现标准化接入,支持主流框架及芯片,有效满足大规模、高性能、多样化异构算力跨区域调度需求。

三是发布互联互通验证平台,提升算力协同效率。三大平台实现通算、超算、智算的统一资源注册接入,算网一体化调度,算力交易等核心功能,通过“算力调度服务”相关认证,不仅可以促进跨主体、跨地区、跨架构的算力互联互通,而且能够优化算力资源配置效率、增强多场景适应能力。
目前,息壤已接入智算算力22EFlops,纳管适配多种智算芯片,支撑北京区域近200家企事业单位数字化、智能化转型升级,产生了良好的经济社会效益。
02
异构融合、应用引领、促进数据互联互通的超算互联平台
推荐单位:天津市数据局
申报单位:国家高性能计算机工程技术研究中心
国家高性能计算机工程技术研究中心以应用引领、实现算力高效利用为目标,构建了国产软硬件协同、跨区域算力调度的超算互联平台。平台以互联网模式运营算力设施,实现了对分布式算力资源的统筹调度,形成了互利共惠的算力生态圈,促进了我国算力资源的高效利用。超算互联平台实现了三方面的技术和模式突破:
一是构建了多元异构算力资源池。通过应用封装、算力标准化等方式,连接“东数西算”工程西部(重庆)科学城先进数据中心等多种形态的算力资源,实现了全国14省20余城市100余家算力联合体成员的全面入网,统筹异构算力,完成多元算力高效组网。
二是打造了支撑算力互联服务的软件生态。通过建立共性工具库、数据集、应用软件库等,实现了连接上游270余家各类应用服务商、下游100余个行业的软件生态构建,支撑了1000余个应用场景的算力需求,促进算力供需方的高效对接,推动算力广泛应用。
三是支撑了算力应用领域的标准化体系建设。规范算力的接入、调度、服务和运营等,发布《超算互联网白皮书》,完成多项国家标准、团体标准的立项和研制,积极推动我国算力服务标准化发展。
截至目前,超算互联平台发布算力商品6000余款,服务用户超10万个,形成算力多元、领域全面、高效运行的服务平台,促进我国算力资源的网络化、普惠化、标准化发展,支撑构建全国一体化算力网建设。

03
临港算力创新实践提升枢纽节点集约化成效
推荐单位:上海市数据局
申报单位:临港算力(上海)科技有限公司
针对当前国内算力供给存在多元组合算力交付周期长、算力资源分散难以被集中调用等问题,临港算力(上海)科技有限公司与长三角国家枢纽节点上海青浦集群加强业务协同,通过一系列工程和技术创新实践,提升枢纽节点集约化成效。
一是建设创新型的“两弹一优”基础设施。临港算力网通过弹性供电、弹性供冷、机房气流组织优化的“两弹一优”,实现多元算力组合快速交付。弹性供电方面,通过机柜设备的“小母线+弹性方舱”配电系统,一舱解决不同客户集群部署模式带来的机柜功率变化需求。弹性供冷方面,采用冷冻水系统、热管多联系统、液冷系统等多种数据中心冷却手段,统筹预留基础设施管井及接口,实现制冷技术弹性应用。机房气流组织优化方面,通过流体动力学模拟计算机架和机房的气流组织,精细化设计冷热通道,开展建设性设计和周期性优化,综合提升供冷效率。

二是通过创新性研究解决行业难点问题。通过使用中距离跨区RDMA(远程直接内存访问)进行市内算力组网,解决算力资源分散无法被集中调用的问题。通过使用跨区RDMA协议和广域拓扑感知并行策略,对跨数据中心大模型训练提出针对性模型训练策略建议,为客户提供合适的解决方案,提升训练效率。联合国内算力上下游生态合作伙伴为客户提供适配测试服务。
自2023年9月投入运营以来,建设大规模商用液冷资源池,通过“两弹一优”实践创新解决机柜功率的变化需求,支持单列机柜功率密度从8kW到48kW之间灵活适配。目前,跨区RDMA组网已完成128、512卡30KM对比验证,训练效率可达单集群的95%以上,完成5家大模型训练性能测试,支撑星辰115B等基础大模型平稳训练,集群可用率达到90%以上。
04
打造智算算力网AI开发平台助力人工智能基础设施发展
推荐单位:江苏省数据局
申报单位:中科南京信息高铁研究院
当前,人工智能基础设施存在技术标准不统一、算力使用门槛高等问题。中科南京信息高铁研究院研发智算算力网AI开发平台,统筹纳管异构异属异域的智算资源,实现全局能用、好用。
一是汇聚三异智算算力资源,实现多元算力协同。智算算力网AI开发平台汇聚异构异属异域的三异智算算力资源,通过代理与适配两种并网模式构建一个全局可用的智算算力资源域,基于协同调度服务,实现智算算力资源的全局共享,构建了南京、昆山与郑州三地的智算算力网。

二是构建全流程AI能力体系,降低智算算力使用门槛。构建覆盖AI算法开发全生命周期的AI能力,提供6种AI开发框架、3种分布式训练加速框架、4种分布式并行训练策略以及弹性高性能推理等能力,提高大模型开发效率,适配4种底层智算异构资源,提供统一的智算算力网页。
三是创新平台运营模式,减少用户算力使用成本。通过构建融合运营模式整合多方运营平台,实现智算资源池统一运营,将账单管理、资源规格管理等业务模块进行统一管理。平台上线后,用户算力月度成本从10021.26元/P降至6062.79元/P,降幅达39.5%,与同类平台用户月度平均费用相比成本降低50.96%。

目前,智算算力网AI开发平台累计落地7个领域的50多个科研行业大模型,如翻译大模型“百聆”,抗体结构预测大模型,医疗大语言模型等,以“三异四入”模式,实现3个算力中心的“三异”算力并网,提供覆盖5个园区、15家重点企业、3所高校及200户家庭算力终端的“四入”服务。
05
构建算网融合平台赋能行业场景应用
推荐单位:山东省大数据局
申报单位:山东省计算中心(国家超级计算济南中心)、济南超算产业发展有限公司
当前,我国算力资源面临跨域调度难、国产算力生态欠佳等挑战。山东省计算中心(国家超级计算济南中心)贯彻落实构建全国一体化算力网的决策部署,统筹跨域多元算力融合一体化发展,打造了覆盖全省的一体化算力网工程,实现了多元算力的高效汇聚、纳管和服务。
一是突破算网融合技术壁垒,打造高性能算网平台。山东省计算中心加快推进长距无损网络通信、跨域算网资源全局调度等关键技术研发应用,成功推动“山东算网”平台上线,实现5种算力架构、3类12种算力集群、5类存储系统的接入和感知,支持大数据、人工智能、高性能计算等融合计算场景。
二是构建区域一体化算网体系,积极融入国家算力枢纽。建成以济南—青岛超算为两大核心节点、连接山东16市骨干节点和100余个边缘节点的省域算力网络,接入天津超算、鹏城云脑等国家级算力平台,融入京津冀、粤港澳大湾区、甘肃、宁夏、内蒙古等算力枢纽节点建设,实现与枢纽节点的算力共享。
三是融合跨域异构算力资源,推动算网赋能千行百业。汇聚融合全省16地市及周边省份算力资源,提供多元化算力服务,入网算力中心资源利用率平均提升40%,赋能海洋、空天、环保、教育、数字政府、人工智能等领域1000多个应用场景,打造算力产业链多元协同运营管理模式,构筑算网服务生态。
山东省计算中心“山东算网”平台汇聚了全省高性能算力、智能算力,提供行业数据集9PB、模型算法90种、计算软件1500余款等全要素算网服务,累计服务各类行业用户3000余家,直接经济效益10亿元,为用户节省算力与运维投入5亿元。

06
以算力赋能人工智能产业发展打造东数西算成渝枢纽新引擎
推荐单位:四川省发展和改革委员会(四川省数据局)
申报单位:智算云腾(成都)科技有限公司
为全面落实国家“东数西算”工程战略部署,作为成渝国家枢纽节点天府数据中心集群首批智算中心,成都智算中心以人工智能应用需求为牵引,持续提升高质量智能算力供给能力,强化高性能算力互联互通,不断提升算力资源利用率和软硬件适配水平,孵化算力调度与模型赋能相结合的创新成果,积极推动全国一体化算力网建设。
一是需求牵引,持续提升区域人工智能产业供给能级。在天府数据中心建设FP16、FP32等多精度、多样化智能算力,并通过多样化算力扩容建设强化高质量算力供给能力。累计服务本地用户200余家,平均降低算力成本约2/3,在智慧城市、医疗、交通等成都市优势领域孵化280余项人工智能解决方案,完成主流NLP大模型本地环境适配,实现区域化人工智能生态聚集。
二是跨域联动,重点推进西部高性能算力互联互通。立足成渝国家枢纽节点布局,筹划建设四川算力调度服务平台,探索共建川渝协同一体化算力调度体系,可调度算力超过200PFlops,覆盖成渝双城经济圈企业150家以上,实现西部地区高性能算力的高效互联与利用。建设鹏城实验室全国开源平台分中心和C2NET算力网西部运营中心,每年接入算力约11万卡时。
三是东西协同,积极开展人工智能大模型孵化研究。牵引东部算力需求,联合研究孵化了跨模态遥感数据生成式预训练大模型“空天·灵眸”、金融领域千亿级参数大模型“玉兰”、新一代短临气象预报基础模型“蓉城·夔牛”等多个人工智能大模型并成功落地应用,实现了东西部数据高质量传输和按需配置,算力资源使用效率持续保持95%以上。

07
贵州枢纽节点算力调度平台实践融入全国一体化算力网规划
推荐单位:贵州省大数据发展管理局
申报单位:贵州省算力科技有限责任公司
根据《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》等文件有关打造全国一体化的算力监测调度平台体系,促进算力资源跨地区高效协同的要求,贵州算力公司从贵州实际出发,着力打造全国一体化算力网络国家(贵州)枢纽节点调度平台(以下简称“调度平台”),汇聚全省算力资源,重点解决算力资源供需匹配不足、资源分散建设等问题,实现算力接入更可信、交易更便捷、调度更高效、服务更普惠,全面助力全国一体化算力网建设。
一是建设“大衍”算力调度平台,实现多元算力汇聚调度。调度平台突破算力度量、算力感知、算网融合多项技术,全面支持通算、智算、超算多种异构算力的统一接入、统一封装、统一调度;灵活根据算效、碳效、时延、安全等策略,实现算力有效调度,服务“东数西算”等重大工程。

二是建设高性能算力资源池,打造算力领域标杆案例。推动调度平台算力资源应用,贵州算力公司投资建设了气象高性能算力资源池,打造智算和超算一体的高性能算力资源平台,辅助贵州省气象局将气象预报空间分辨率从5公里精细至1公里,时间分辨率从3小时精细至1小时,进一步发挥气象防灾减灾第一道防线作用。

三是创新发放“算力券”,降低企业用算成本。以政府政策为引导,以调度平台为载体,创新发放“贵州算力券”,形成算力消费、数据资源流通与特色产业联动的激励机制,为企业提供多样化的激励,帮助用户降低用算成本费用门槛。
截至目前,调度平台已汇聚33个算力服务商、401个算力需求方,算力资源达4.5Eflops,对外可提供102项算力产品,累计完成算力交易28.85亿元,在算力资源汇聚与运营方面,为全国一体化算力网发展提供贵州实践经验。
08
绿色智能算力“铁三角”赋能千行万业
推荐单位:贵州省大数据发展管理局
申报单位:华为云计算技术有限公司
数字经济的快速扩张和人工智能技术的广泛应用,对高效算力资源配置和持续技术革新不断提出新需求。华为云计算技术有限公司建设绿色数据中心和人工智能平台,打造算力铁三角布局,提供全栈AI解决方案,赋能千行万业智能化发展。

一是构建算力“铁三角”。华为云在贵安、内蒙古(乌兰察布、和林格尔)以及芜湖等国家枢纽节点建立3个超大绿色智算数据中心,单数据中心规模超过百万台服务器,为京津冀经济圈、长三角经济圈、珠三角经济圈、中西部地区等地提供充沛的算力支持,支撑构建资源高效调度、设施绿色低碳、算力灵活供给、服务智能随需的算力基础设施,助力产业高端化、智能化、绿色化发展。
二是提供全栈AI解决方案。通过系统化工程,全面提升算力在人工智能等领域适配水平。华为云昇腾云服务全面适配行业主流的100余个大模型,盘古大模型在30多个行业、400多个应用场景中落地。
三是提升算力效能。通过CloudMatrix云基础设施、“擎天”软硬协同架构、瑶光云脑智能云操作系统、柔性计算技术、动态匹配智能运营等方式,显著提升华为云平台算力服务效能,支持从百亿到万亿参数模型的训练和推理。在同等算力条件下,CloudMatrix集群架构提升模型训练效率68%,讯飞星火大模型训练性能整体提升17%,美图AI绘画等业务推理提升30%。
09
构建算力调度服务体系提升算力资源服务效能
推荐单位:甘肃省发展和改革委员会
申报单位:丝绸之路信息港股份有限公司
为贯彻落实《关于深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》等文件精神,丝绸之路信息港股份有限公司作为甘肃省信息化龙头企业,规划建设甘肃省算力资源统一调度服务平台,实现全省算力资源的统一纳管、调度及服务,旨在提升算力资源利用效率,助力全国一体化算力网建设。
一、规划全省算力资源统一调度布局。通过整合兰州新区、酒泉、张掖等省内各数据中心算力资源,构建“1+N+X”的算力资源统一调度服务体系,即1个算力调度平台、N个数据中心、多个应用场景。该平台自2023年3月发布以来,已实现国家枢纽节点庆阳数据中心集群及省内各区域算力资源的统一编排和调度,形成“双核心N支点”全省算力网布局。
二、建立多源异构算力统一调度服务模式。为实现全省多源算力资源的有效管理,信息港公司规划了多源异构算力管理技术架构,有效屏蔽异构算力资源的差异性,支持对通用算力、高性能算力、智能算力等多源算力资源的统一管理和调度。

三、探索算力+金融运营模式。与政府部门合作建立全省算力资源统一调度机制,实现了算力资源统一入驻、用户统一认证、资源统一调度、服务统一规范。协同金融机构建立“算力+金融”创新服务模式,放大算力资源效能,促进算力产业生态集聚,推动数字信息产业发展。
截至目前,平台已整合7个数据中心资源,接入了阿里云、华为云、百度云、如意云在内的十余个异构算力供应商,整合算力资源达1876.49PFlops,服务算力用户114家,达成算力订单144笔,交易总额超2亿元。
10
算力跨域试验场 开源互联新生态
推荐单位:深圳市政务服务和数据管理局
申报单位:鹏城实验室、中关村视听产业技术创新联盟(暨新一代人工智能产业技术创新战略联盟)
针对全国一体化算力网建设过程中面临的“算力协同难、算力利用率低、应用生态建设难”等现实挑战,鹏城实验室依托“鹏城云脑”,打造了当前国内最大的算力网开源开放试验场。
一是技术创新。研发异构算力全栈贯通的开源开放软件栈,实现了硬件资源云化纳管和跨域算力协同调度。试验场当前可支持10余种算力芯片,实现分布于10省份16城市28个异构算力中心的接入,可调度总算力超过5E Flops,测试了T级互联实验网络,算力调度峰值带宽最高可达981.53 Gb/s,极大地加速了计算、网络与应用交叉技术的深度融合。

二是模式创新。以技术创新带动标准凝练、以共性标准加速算力互联、以普惠易用推进生态发展,形成了开源与标准化双向驱动推进生态发展的创新模式。围绕试验场建设,在国内外标准组织制定共性技术标准10余项,支撑试验场汇聚5万多个优质开源项目、近8000个开源模型、4000多个开源数据集等丰富资源,极大推动了应用完善与生态建设。
三是机制创新。探索了“国家实验室+产业联盟”的实施模式,实现了科研力量与市场机制的优化配置、协同创新与技术普惠。以试验场为技术支撑,联合韶关市人民政府打造了中国算力网粤港澳大湾区调度中心和韶关市数据产业研究院,为拓展算力网应用场景、探索商业落地模式打下扎实基础。
截至目前,跨域算力互联调度开源开放试验场已面向全社会提供大规模普惠算力资源,受益开发者数量近16万人。枢纽节点“鹏城云脑”已累计服务11家政府及科研单位、数十家重点人工智能企业,直接产生经济收入1.3亿元。试验场一方面极大推动了国内自主算力厂商的芯片完善与生态建设,直接支撑我国两大人工智能开源计算框架的技术联合,推动昇思MindSpore相关论文发表量在人工智能领域跃居全球第二,彰显出强大的技术创新孵化能力;另一方面,其关键技术直接支撑了“东数西算”粤港澳大湾区韶关枢纽建设,韶关集群已实现超过700P Flops算力资源的互联互通,招引百度、广州数据交易所、奇安信、浪潮等机构和企业入驻园区,展现了科技赋能经济的无限可能。
11
“三重网络三重算”构建园区新质生产力
推荐单位:江苏省数据局
申报单位:江苏未来网络集团有限公司
根据《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》等文件要求,为提升算力网络传输效能,统筹东中西部算力一体化协同,江苏未来网络集团结合实际场景需求,着力打造“三重网络三重算”体系,重点建设园区“一线通达全国最大规模算力资源池”的传输通道,创新企业“一站选择全国最具性价比算力服务”的运营模式,提升西部算力资源使用率,降低东部客户算力使用成本,提升算力普惠易用水平。
一是构建“南京-长三角-全国”的“1520”三重网络体系。基于未来网络基础设施(CENI)及其多元异构算力直连网,构建1ms南京城市算力网时延圈、5ms长三角区域一体化算力网时延圈、20ms枢纽节点间算力网时延圈,实现城市内、区域内、全国范围内的低时延、低抖动、大通量、高可靠的三重网络。
二是按需提供“南京-长三角-全国”的三重算力资源。利用“三重网络”能力,高速直连各类算力资源,为园区企业按需提供灵活多样的算、网、数一体化服务,显著增加园区运营收入,助力园区运营实现从“地产租金”向“算力服务费”的增值转变。
三是打造算网服务平台。实现“市-区域-全国”三层算、网资源一点统一接入、按需灵活选择。打造园区算网智能驾驶舱,精准掌握、动态更新、实时呈现园区可接入的算力资源池,已接入的算力需求企业,全面掌握可接入算力的实时报价等情况。
截至8月底,园区算网服务平台累计接入南京城域1000PFlops算力资源及西部近2000PFlops算力资源,已为50余家企业提供了定制化算网服务,每月形成近500万元运营服务费,有效降低了园区企业使用算力的成本,大幅提升了园区数字基础设施服务能力。



财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有