2024年9月28日下午,备受瞩目的2024中国算力大会在主论坛上公布了最新一批DC Tech算力中心&算力强基等级认证结果。商汤科技的智算中心、蚂蚁集团的算力应用平台、中国移动的算力中心以及华为智能盘框产品均通过了严格的测试认证,中国信息通信研究院副院长魏亮为企业代表颁发证书。
算力中心认证结果发布仪式
DC Tech 智算认证体系(1.0)介绍
伴随人工智能技术的快速演进,智能算力已成为推动社会进步和产业升级的重要驱动力。中国信通院通过深入剖析智算产业链上下游,强化了智能算力的标准和认证体系,并于今年6月正式发布DC Tech智算认证体系(1.0),围绕智算基础设施、软硬件协同、工具平台、应用场景等方面制定标准规范,面向智能算力的供给方、需求方,开展系列测试认证工作,从技术研发、应用场景到运营管理等不同层面实现智算产业的全方位覆盖,有效推动智算产业标准化、规范化与专业化发展。
DC Tech智算中心算力性能等级认证
智算中心算力性能等级认证从理论算力、有效算力、算力能效、业务模型场景的支持能力、加分项共五个维度的技术要求对被测对象展开认证,根据最终得分情况划分为A-AAAAA级别。
商汤科技人工智能计算中心A1楼获得智算中心算力性能等级AAAAA认证证书。
上海新一代人工智能计算与赋能平台——商汤科技人工智能计算中心(简称:商汤临港AIDC)是服务上海建设“具有全球影响力的科创中心”战略目标的标杆项目。项目位于临港新片区,一期投资56亿元,主要建设园区智算大楼与科研行政大楼,用于AI智算中心平台硬件搭建、平台软件、平台管理系统与大模型应用等多方向研发。项目占地87亩,整体规划建筑面积13万平方米,一期已建成7万平方米。目前,商汤临港AIDC已经是国内AIDC建设的“样板间”。
本项目优势主要体现在以下方面:
大规模弹性算力,支持超大参数通用大模型训练。商汤临港AIDC可以提供大规模弹性算力,支持超大参数通用大模型训练;通过对海量计算资源的整合,商汤临港AIDC将使得AI大装置像流水线工厂,实现不同场景的算法模型的底层抽象,以模块化平台套件打造通用型服务平台,以低边际成本实现对新场景的规模化覆盖;凭借算力的突破,商汤临港AIDC还将为蛋白质折叠等多领域的重大基础科学研究,开创全新的科研范式。
低算力应用成本,促进生态创新。商汤临港AIDC可以为国产智能芯片提供大规模应用的环境,形成更具成本优势的AI算力服务。
领先高安全性能,实现从存储到计算多层保护。商汤临港AIDC拥有业界领先的高安全性能,具有高度完善的隐私和数据保护方案;通过独立的物理机房,商汤临港AIDC可保证完全的物理隔离,借助隐私安全计算技术,可面向不同客户,提供从计算、存储到网络等不同层面的资源隔离;商汤通过了ISO/IEC 27001、ISO/IEC 29151信息安全管理体系等认证,持续提供符合全球标准的可信安全服务。
低网络时延设计,提供低成本高质量网络服务。商汤临港AIDC坐落于上海临港,针对上海和长三角业务具备访问快、时延低等优势;商汤临港AIDC已接入国家(上海)新型互联网交换中心,作为该中心核心运营主体和发起单位之一,商汤将通过AIDC为行业提供低成本、高质量的网络服务和AI算力服务;得益于AIDC的集群网络设计,通过基于RDMA技术的高速通信网络,可以进一步提高训练数据层的高频交互效率。
DC Tech绿色算力等级认证(算力应用平台类)
绿色算力等级认证(算力应用平台类)从计算效用监控评估能力、算力资源全局调度优化能力、工作负载算力消耗优化能力、算力资源选择和迁移能力、计算效用评价指标共五个维度的技术要求对算力应用平台展开认证,根据最终得分情况划分为A-AAAAA级别。
蚂蚁集团 GreenOps 绿色减碳平台获得首个绿色算力等级(算力应用平台类)AAAA认证证书。
蚂蚁集团自2019年开始进行绿色计算技术创新和实践,围绕低碳算力选择能力、全局资源调度能力、工作负载优化能力和绿色监测评估能力进行了一系列核心技术攻关,打造出蚂蚁集团GreenOps绿色减碳平台,并将其应用到蚂蚁集团服务器集群。项目实现了绿色计算技术在蚂蚁集团日常和双十一高峰期间的大规模应用,有效解决了大规模集群资源合理分配、分钟级有效调度、智能流量预测等行业难题,显著提升了资源利用率,为各行业数据中心节能减排起到了示范效应。从2017年到2023年,蚂蚁集团服务器CPU利用率翻5倍。2023年,蚂蚁集团通过绿色计算技术共减少供应链上游数据中心碳排放72,026.70吨二氧化碳当量,相较于同等服务器规模的基准使用情景,使用绿色计算技术后,可减少高达26%的碳排放比例。
本项目创新性主要体现在以下方面:
统一调度能力。关键技术包括:在离线混部技术,蚂蚁首创Kata安全容器性能隔离技术架构,解决在线业务不受离线任务的影响难题;分时调度技术,采用CPU share的计算能力隔离技术,容器可使用的CPU资源通过与容器规格相对应的权重来分配;AI智能容量,提出基于AI算法的端到端弹性伸缩预测决策一体化系统,整体性能达到国际领先水平。
Serverless无服务器化。关键技术包括:应用级发布模式的Serverless 化,在基础设施平台实现了流量驱动实例分组能力、自动化运维能力、资源调度托管能力;模块级发布模式Serverless化,可获得非常快的启动速度以及 Serverless研发体验;对于新的业务和场景,提供函数级发布模式Serverless化,把部署运维粒度从微服务级别降低到函数级别,实现极简研发、快速部署、免运维,也进一步提升部署的密度,提升CPU利用率。
持续性能分析。通过Continuous Profiling技术,深入到系统内部,对应用程序、服务内部的行为以及执行过程进行持续地剖析,并且对于被分析对象的性能影响控制到1%以内,提供快速定位资源瓶颈以及根因分析能力。
一站式绿色监测评估。聚焦在碳排范围三的数据中心部分,为用户提供一站式的碳排放观测、分析、优化的能力。包括:持续性观测碳排放/CPU水位情况、多维度的账单、碳排放分析、优化建议、一键优化执行等功能。
DC Tech算力中心国标认证体系介绍
为促进算力技术创新与应用落地,中国信通院联合开放数据中心委员会(ODCC)等共同开展DC Tech算力中心国标认证,从高算力、高技术、高能效、高安全视角,开展了多项测试认证项目,为行业算力规划和建设部署保驾护航。基于GB/T43331《互联网数据中心(IDC)技术和分级要求》,考量算力中心在绿色节能、可用性、安全性、服务能力、算力算效和低碳等方面能力,全面覆盖数据中心、智算中心、超算中心及边缘数据中心,以期全面提升算力中心的技术水平与综合能力,催生新技术、新业态、新模式,推动我国算力产业的高质量发展。
DC Tech算力中心绿色等级认证
基于国家标准GB/T 43331《互联网数据中心(IDC)技术和分级要求》中绿色节能方向的技术及分级要求,通过对资源效率、节能技术、绿色管理、绿色创新四个领域的相应技术要求开展测试,实现对算力中心绿色节能能力分级认证,最终划分等级从低到高依次分为A—AAAAA级别。
中国移动(福建福州)数据中心获得算力中心绿色等级(运行类)AAAAA认证证书。
中国移动(福建福州)数据中心A-1楼数据中心,位于福州市长乐区中国移动(福建福州)数据中心园区内,建筑高度23.975m,局部地下一层,总建筑面积20501.73㎡,为丙类厂房建筑,耐火等级一级。
项目技术亮点:
在制冷方面,配置4台2500RT的高压冷水机组,三用一备,满足制冷需求,实现协同高效。室外设置开式蓄冷罐,断电时刻提供15min连续性制冷,冷冻水管路分A路、B路两套管路,可靠的双路管道供冷,实现在线切换,确保设备互不干扰。空调末端采用冷冻水型机房精密空调、冷冻水型列间机房空调等。
在电力供应方面,园区拥有全省业内首个自建110kV变电站,提供双路不同源市电,当期容量126000kVA;A-1楼设10台2000kW柴油发电机组,采用智能并机模式组成大油机池,冗余度极高,同时室外埋地油罐有效容量200m³,续航能力极强。双源市电供电和四路电源引接、前后端全2N冗余配置、多层多级线路保护,结合智能投切和功率跟踪等自控技术,实现低延时电气切换,确保数据中心供电稳定且安全。
在传输系统方面,具有高可靠的传输系统,多路由的传输保障,出局四路由,楼间双路由,楼层双路由;含全国干、省干传输核心节点;大带宽确保急速通畅,引入单波道200G、网络切片等技术,并向400G演进。电池采用铅酸蓄电池。监控等主要系统含有电力监控系统、楼宇自控系统、机房环境监控系统等。
算力强基行动介绍
为贯彻落实深化算力赋能行业应用的发展要求,算力强基行动持续深耕算力领域,锚定YD/T 3292整机柜服务器总体技术要求、YD/T 4028基于RoCE协议的数据中心高速以太无损网络测试方法、YD/T 4024数据中心液冷服务器系统总体技术要求和测试方法、T/CCSA 324-2021数据中心服务器能效测评规范、T/CCSA 325-2021数据中心存储能效测评规范等行业和团体规范,开展算力强基测试,为提升算力赋能成效提供保障。
DC Tech算力强基行动
此次测评基于ODCC-2024-05002《智能盘(框)技术要求及测试规范》作为测评标准,围绕智能盘框的核心功能,从接口协议、存储功能、数据缩减、可靠性、近数据处理能力、性能等方面对进行考量,验证智能盘框产品的综合能力。
华为OceanDisk1600智能盘框产品凭借其极高带宽、绿色集约、稳定可靠的特点,在“算力强基”行动中荣获“卓越产品”称号。
华为OceanDisk1600智能盘框通过单框2U 2PB的高容量密度和70GB/s的高性能密度,机柜空间可节约60%,能耗节约30%;借助自研DPU卡、高速NoF+网络和FLASHLINK智能盘控协同算法,带来最大350万IOPS、70GB/s带宽的高性能;采用多级可靠性设计,实现99.999%高可靠,已规模部署在万卡AI集群。
来源:中国算力大会