万兆联万卡 上海算力能级提升加速

万兆联万卡 上海算力能级提升加速
2024年01月25日 00:00 人民资讯

本文转自:文汇报

万兆联万卡上海算力能级提升加速

领跑全国,上海电信打造国内规模最大国产单池万卡液冷算力集群

  • 视觉中国

算力是数字世界的核心能源,经济增长智能升级、融合创新的新动力。从国家到地方,都高度重视和强化算力的大规模供给和运用,推动算力“新能源”像水电一样“即取即用”。2024年上半年,中国电信将在上海规划建设到达15000卡,总算力超4500P。其中,单池新建国产算力达万卡,是国内首个超大规模国产算力液冷集群。             ■郝俊慧             1月22日,作为建设上海城市“数字底座”的“国家队”和“主力军”,中国电信上海公司(以下简称“上海电信”)联合徐汇区政府共同举办“算力惠模都 万兆连速城”人工智能公共算力服务产品发布会。上海电信党委书记、总经理龚勃表示:中国电信积极发挥“头雁效应”,打造算力、存力、运力于一体的综合算力,在上海点亮“大规模算力集群暨人工智能公共算力服务平台”,这是全国首个国产单池万卡液冷算力集群,将助推上海抢占全国算力发展制高点。同日,上海电信发布一系列人工智能公共算力服务产品,龚勃表示:“我们将公共普惠、创新领先的算力供给,算、存、运一体的综合算力服务模式,全面赋能上海市人工智能产业生态。”             当天发布会宣布,“双万兆接入暨一跳入算服务”正式在徐汇区“模速空间”启用,上海电信将为入驻企业提供双万兆网络和“一跳入算”服务,以及算力算网免费试用和优惠商用资费。龚勃表示,将与徐汇区人民政府一起,共同推动模数空间成长为“配套最好的、最具竞争力的大模型创新社区”。             打破算力焦虑             实现多项自主创新技术突破             随着ChatGPT掀起人工智能发展新高潮,以AI为主要应用的智能算力成为未来算力增长点,支撑数字经济蓬勃发展的重要底座。大模型参数量和训练数据复杂性的快速增长,对智算系统提出大规模算力扩展需求。             为此,中国电信积极响应《上海市进一步推进新型基础设施建设行动方案(2023-2026年)》构建新网络、新算力要求,进一步推进具有上海特色的新型基础设施建设,加快推进上海城市数字化转型,提升城市能级和核心竞争力,迅速在临港投建支撑万亿级参数大模型训练的智能算力资源。             2024年上半年,中国电信将在上海规划建设到达15000卡,总算力超4500P。其中,单池新建国产算力达万卡,是国内首个超大规模国产算力液冷集群。             该集群采用新一代国产AI算力,实现了全栈自主创新和技术突破,通过高速RDMA(远程直接数据存取)连接各物理机节点,提供低延时、高吞吐量、无损通信网络和强大的并行计算能力,是目前规模最大的全国产液冷机房,多项技术指标领跑全国。             据了解,该集群最高可支持万亿参数大模型,便于各科研院校、大模型训练公司等机构和企业实现物理资源独享,无虚拟化损耗,满足AI计算、深度学习、图形渲染等复杂训练任务对算力的要求。             普惠算力 云端取用             推出AI公共算力服务产品             作为国际数字之都建设的主力军和急先锋,中国电信持续为丰富上海智能算力供给和生态打造贡献力量。             2021年,上海电信开始在青浦和临港前瞻性布局“东西两翼”智算中心,为此后汹涌而来的“算力风暴”奠定基座;2022年,上海电信在全球率先启动“全城上云”,打造云网边端安一体化的新一代综合性智能化信息基础设施——“智云上海”,重塑城市新网络;同年,上海电信宣布向社会提供公共算力服务,让算力像水、电资源一样随取随用,成为国内首个推出此服务的电信运营商。             2024年伊始,基于“智云上海”,上海电信正加快步伐推进智算能力建设和产品服务创新,让新算力成为激活新质生产力的重要引擎,基于“天翼云自研CloudOS4.0底座”,推出人工智能公共算力服务平台以及一系列“人工智能公共算力服务产品”,包括智算产品、弹性算网、算力调度平台和行业大模型等,从算力供给、算力输送、算力调度、到模型训练及推理应用,为大模型企业提供一站式服务。             通过图形加速型与计算加速型等不同类型的算力云主机,企业可在云端租赁算力,大幅减少了本地IT设备投入,降低企业使用算力的门槛。同时,为了破解算力资源利用率低和因为不同架构、不同云商而导致的算力资源统筹难现象,中国电信还推出具备三跨四互联特性的“息壤——全国算力一体化调度平台”,协同社会算力资源,推动算力服务“普惠化”“泛在化”“标准化”,使算力成为社会新型基础设施和基础公共资源。             此次发布的“弹性算力网络”,则让算力触手可及。大模型企业可根据业务实际需求,自由伸缩算力带宽。平日里,弹性算网可为企业日常办公提供基础速率,一旦出现突发性任务、周期性作业急需大带宽传输,当天即可发起动态提速,且提速期间,只需额外支付按时长/按流量使用的费用。             例如,在100Mbps带宽下,10TB数据需10天才能完成传输,通过“弹性算力网络”升速后,仅需2小时便可完成传输,且企业只需支付2小时费用,极大降低算网使用成本,助力人工智能企业加快大模型训练和迭代升级。             如今,通过覆盖全城的双万兆网络、边缘云、万卡智算中心和算力调度平台,“智云上海”已经建成一张灵活普适、注智开放、绿色环保的城市高速光传送网底座,为千行百业带来全新确定性极致体验,为上海打造算力时代的新一代信息基础设施底座。             “全光一跳入算”             厚植人工智能产业生态             作为上海新一代智能信息基础设施的建设主力军,上海电信一直致力于推动城市数字化转型和智能化升级,其建设规模和技术创新始终处于全球前列。             自2022年开始启建“全城上云”的“智云上海”之后,此次发布会是上海电信再次战略更新,运用“算力+网络+平台(算力调度平台)+服务(公共算力服务产品)”综合能力,为城市AI更新迭代和大模型产业生态升级打造智算承载底座,全力助推上海建设人工智能产业高地,打造“全城AI”的“智能上海”。             发布会上,上海电信宣布,将在“模速空间”率先落地双万兆接入和一跳入算服务,并提供算力和算网免费试用以及优惠商用资费。             “模速空间”是全国首个大模型专业孵化和加速载体、大模型创新高地和生态集聚区。上海电信为“模速空间”部署全球商用网络中最快、基于50G PON和5G-A技术的双万兆网络,新一代 OTN网络延伸入园,企业可申请专线带宽从原先的1Gbps跃迁百倍,最高可达100Gbps。同时,上海电信为入驻的大模型企业提供2Mbps~100Gbps带宽的一跳入算服务,从“模速空间”到位于临港新片区的中国电信临港智算中心,实现全光一跳直达,时延低至1ms,业务全程基于全光硬管道传输,端到端无拥塞,从而不再有传统IP网络抖动和丢包的困扰。             今后上海电信将以点带面,充分发挥“灯塔效应”,以公共普惠的算力、创新领先的算网服务,加速全市人工智能技术的研发和应用,满足全市各类人工智能企业的效率需求,实现算力资源随愿取用,厚植全市人工智能产业生态。             从连接到计算,以万兆联万卡,以智能兴百业。随着AI时代到来,上海电信将以此为契机,依托上海丰富的应用场景,发挥央企产业引导力,融合算网、算力、安全等各方优势,抢占算力制高点,进一步促推全市大模型技术应用赋能、产业发展和生态合作,充分发挥人工智能赋能百业、拉动发展的“乘数效应”,为上海建设成为具有全球影响力的人工智能产业新高地注入更多活力。             摄影 费锋

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部