摘要:当前人工智能计算需求正呈指数级增长,未来将占据80%以上的计算需求,承载这种需求的就是AI算力中心,即智算中心。智算中心要成为新基建的源动力,必须满足开放标准、集约高效和普适普惠三个基本要求。

新冠肺炎疫情,是人类共同面临的灾难。新一代信息技术在抗疫过程中发挥了巨大的作用,也使人们的生活和工作从线下搬到了线上。从早上醒来第一眼去查看疫情数据、查看同乘同航是否有确诊,到网课辅导、在线问诊、生鲜快递;从远程打卡、线上招聘、线上会议到文档协同、工作提交。从线下到线上,疫情加速了社会的智慧进化。

疫情加速了经济活动的变革

首先是疫情加速了经济活动的线上化变革。企业选择线上办公,各种在线办公平台用户规模指数级增长,其中钉钉平台超过1 500万家企业、2亿人协同办公;腾讯会议系统上线8天内扩容10万台云主机,涉及百万核计算资源投入,累计召开超过3亿场会议。工信部的数据显示,2020春节期间,移动互联网流量271.6万TB,同比增长36.4%。经济活动的线上化变革,让大家在这个过程中体验到了信息科技的价值和效率。

第二个明显的变化是社会服务和社会治理更加高效智能。疫情期间,运营商推出了“通信大数据行程卡”,2020年行程卡累计提供查询服务51亿次,日查询量稳定在2 500万次以上,全面覆盖我国16亿手机用户;中国铁路提供了确诊病例密接者查询服务。这些服务为社会防疫防控提供了有力支持。腾讯、阿里、浪潮提供的健康码在山东、北京、广东等省市陆续上线,几乎覆盖了所有出行人口。可以预想,健康码必将会成为未来传染病防控的必备手段。

在工业生产方面,中国工业机器人装机量占全球的36%,用于建设数字化车间和智能工厂,成为全球最大的智能制造市场,智能制造升级将进一步提速。这里面典型的例子就是浪潮智能工厂。整个生产制造过程弹性、透明、可追溯,智能技术贯穿了生产制造的全周期,实现同样的产能,用工数量下降50%,生产效率提高3倍,订单交付周期从18天缩短至5~7天。

智算中心是智慧时代的新型基础设施

看得见的是各种智慧服务,看不见的是新型的基础设施,支撑智慧化转型的正是以云计算、大数据、人工智能为核心的智慧计算。疫情期间,腾讯和阿里每天都在扩充云计算资源,用于支撑视频会议、在线办公等业务。百度地图则利用其每天响应位置服务请求千亿次所产生的大数据,通过数据定向、分析等途径助力流行病学调查。

人们见证了智慧计算是如何在这场战疫中发挥巨大作用。2020年3月4日,中央决定对人工智能、大数据中心等新基建提速,这也是在为智慧计算的发展提速。计算力就是生产力,智慧计算改造升级了生产力三要素,最终驱动了人类社会的转型升级。智慧计算将劳动者由人变成了人加上人工智能,劳动者可以呈现指数增长;将数据变成了一种新的生产资料,从有形到无形,生生不息,越用越多;将计算力驱动的信息化设备变成了生产工具,也是指数增长,生产力得到了前所未有的解放。

伴随生产力的升级,社会基础设施也在发生变化。农业时代的基础设施比较简单,就是水利、交通等;工业时代,则是人们熟悉的铁公机(铁路、公路、机场)、电网等;而智慧时代,必将需要新型的基础设施。可以和电力基础设施做类比。电力基础设施提供电力服务,其核心是生产电力的地方(即发电厂),像三峡电站、大亚湾核电站。智慧时代的新型基础设施,要能够对外提供各种算力的服务、数据的服务和AI的服务等。那么其核心就是计算力的生产中心。

计算是在不断发展的,从最初的数值计算逐渐演变为科学计算、关键计算和智慧计算。每种计算都有相应的计算力中心去支撑。科学计算的算力中心是超算中心;承载当前企业应用、政府应用和个人应用的算力中心是数量众多的各类数据中心;当前人工智能计算需求正呈指数级增长,未来将占据80%以上的计算需求,承载这种需求的就是AI算力中心,即智算中心。

2020年11月,国家信息中心信息化和产业发展部联合浪潮发布了《智能计算中心规划建设指南》,这是业界首个对智算中心的定义、架构、建设模式进行权威解读的报告。其对智能计算中心进行了明确定义:智能计算中心是基于最新人工智能理论,采用领先的人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的公共算力新型基础设施,通过算力的生产、聚合、调度和释放,高效支撑数据开放共享、智能生态建设、产业创新聚集,有力促进AI产业化、产业AI化及政府治理智能化。

据工信部统计,2020年上半年中国人工智能核心产业规模达到770亿元,人工智能企业超过了260家,中国已成为全球AI独角兽主要集中地之一。国务院印发的《新一代人工智能发展规划》指出,到2025年中国人工智能核心产业规模将超过4 000亿元,带动相关产业规模将超过5万亿元。智慧时代,计算力就是核心生产力。智能计算中心通过构建领先的AI算力基础设施,在承载智能化技术创新,促进数据开放共享,加速智能生态建设,带动智能产业的聚合等方面发挥巨大价值。

智算中心要成为新基建源动力的基本要求:开放标准、集约高效和普适普惠

智算中心要成为新基建的源动力,必须满足开放标准、集约高效和普适普惠这三个基本要求。开放标准,要求智算中心从硬件到软件、从芯片到架构、从建设模式到应用服务都应该是开放的、标准的;集约高效,要求智算中心的建设要有超大规模,要采用领先的技术,保证自身的先进性;普适普惠,则要求智算中心发挥基础设施的社会价值,服务大众。

首先是开放标准。回顾IT的历史,其实也是一部开放开源的历史。从传统的基础软件开源,到云、大数据、算法框架等新型基础软件的开源,再到芯片开放、硬件基础架构开放。开放变革了IT产业的生产模式和应用服务模式,持续推动着信息技术的发展,促进了整个IT产业的生态繁荣。开源开放的软硬件是智算中心发展的必由之路。

基础设施必然要以规模效应来实现降本增效,要能够快速高质量建设。这就要求智算中心要采用预生产、标准化、模块化的硬件来实现“装配式”建设。从标准化的节点单元、整机柜,到标准化的微模块数据中心,实现智算中心的快速建设。同时,不同的智算中心要能够互联互通,要能够做到管理上的互操作,统一的调度分发和监控运维,实现业务上的互连接和数据上的互流通。

其次,基础设施的超大规模要求智算中心应该是集约高效的。智算中心应采用领先的技术理念,融合架构就代表着数据中心体系结构的未来发展方向。通过硬件重构和软件定义,智算中心应可以实现存储资源和异构计算资源的弹性组合,也可以通过连接、池化和重构的技术,实现多种计算资源的高效协同。这些计算资源既包括目前使用的处理器、GPU、AI芯片等,也包括未来可能带来更大计算能力的量子计算、生物计算等。智算中心应采用浸没式液冷等领先的冷却技术,配合余热回收、相变储能等循环节能技术,达到PUE接近于1的目标,实现绿色节能。

再次,智算中心作为基础设施,要服务大众,提供算力服务、数据服务和智能服务,从而支撑智慧城市、智能制造、智能家居,以及智能医疗等行业的智慧化转型。但是行业用户的智慧化转型仍然存在着巨大的技术鸿沟,包括如何选择最合适的算法模型,如何从软、硬件两方面对算法做性能优化,如何对面向特定领域的智能算法进行高效敏捷的开发部署等诸多问题。要填补这些鸿沟,需要智算中心提供整合的、易用的开放服务平台。智算中心应建设先进的AI算力基础平台、AI算力调度平台、AI算法模型来打造人工智能开放服务平台,汇聚并赋能行业AI应用的开发者,加速开发各种各样的行业智慧应用,加速产业AI化。

所以,智算中心,不管你看得见或者看不见,它就在那里,源源不断产生智慧时代的动力——计算力。智算中心,就是这个时代的动力源。

来源: 中国人工智能学会通讯2021年1月