8月30日,阿里云宣布正式推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心为科研、公共服务和企业机构提供强大的智能计算服务,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
阿里云智能全球销售总裁蔡英华表示,希望通过开放飞天智算平台,为各行各业提供强大的融合算力、高效的全链路智能服务,同时在可支撑多种指令集芯片的基础上,大幅提升计算效率,并通过绿色低碳方面的能力,大大降低AI训练能耗。为各领域创新提供更高效、更开放、更绿色的智能计算服务。
据悉,飞天智算在技术减排、能源结构优化、区域布局优化、供应链减碳以及资源利用优化五个方面来降低单位算力的碳排放。在技术减排方面,通过液冷、电源技术以及智能运维等方式降低能耗,PUE最低可达1.09。
据悉两座超大规模智算中心由飞天智算平台支撑建设,以先进的技术架构,将衡量算力效率的核心指标“千卡并行计算效率”,从传统架构的40%提升至90%,可将算力资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
张北智算中心建设规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力。在云端,张北智算中心支撑AI预训练大模型、AI Earth、数字人等前沿AI应用,将成为全球最大的智算中心。
乌兰察布智算中心建设规模为3 EFLOPS(每秒300亿亿次浮点运算)AI算力,位于“东数西算”内蒙古枢纽节点,采用自然风冷、AI调温等绿色技术,实现绿色低碳。
两座超级智算中心能够实现规模和效率的突破,是自大数据AI一体化平台到算力基础设施体系化技术创新的结果。传统智算中心达到一定规模之后,增加算力资源反而会降低算力输出的能力。阿里云通过体系化的核心技术自研,改变了智能计算的损耗难题。
例如,在通信技术上,阿里云采用高性能自研Solar-RDMA网络,实现端对端最低2微秒延迟,配合阿里云自研的无阻塞通信技术,让计算过程中的数据交换速度提升了5倍以上。同时,自然风冷、液冷等绿色技术的应用,让智算中心的能耗降低,PUE最低可达1.09。
据介绍,这两座超大规模的智算中心正在服务于AI大模型训练、遥感探测、数字人、自动驾驶、生命科学、新药研发、元宇宙等前沿智能应用。其中,小鹏汽车基于飞天智算将自动驾驶模型训练提速近170倍。深势科技采用飞天智算让分子动力学仿真模拟训练效率提升了5倍。
来源:阿里云