AI的运转需要全球10%用电量,为什么真的可以撑得下AI的发展吗?

AI的运转需要全球10%用电量,为什么真的可以撑得下AI的发展吗?,第1张

今天,世界上数以百万计的数据中心所占用的用电量还不到2%——这个统计数据包含了在它们庞大的服务器阵列上处理的各种工作负载。Applied Materials估计,运行人工智能的服务器目前只占全球电力消耗量的01%。


其他的科技公司高管也发出了警告。华为的安德斯安德烈(Anders Andrae)认为,到2025年,数据中心最终可能消耗全球十分之一的电力 ,不过他的估算涵盖了数据中心的所有用途,而不仅仅是人工智能。


落基山研究所的特别顾问乔纳森·库米(Jonathan Koomey)则相对乐观。他预计,尽管人工智能相关活动呈井喷式增长,但数据中心的能源消耗在未来几年仍将保持相对平稳。


这些大相径庭的预测突显出,人工智能对大规模计算未来的影响以及对能源需求的最终影响存在着不确定性。


毫无疑问,人工智能电力消耗非常大。训练和运行像深度学习模型这样的东西需要处理大量的数据,因而占用内存和处理器。人工智能研究机构OpenAI的一项研究表明,驱动大型人工智能模型所需的计算能力已经每三个半月翻一番。


Applied Materials自己也承认,它的预测是一种最糟糕的情况,意在突出缺乏软硬件新思维可能会造成的状况。该公司的企业战略和市场情报主管桑迪普·巴吉卡尔(Sundeep Bajikar)表示,公司假定,随着时间的推移,被用来训练人工智能模型的信息组合将会发生改变,相对于文本和音频信息,视频和其他图像的占比将会攀升。视觉数据的计算量更大,因此需要消耗更多的能量。


随着自动驾驶汽车和嵌入其他智能设备的传感器等设备的兴起,人工智能模型还将要处理有更多的信息。超高速5G无线连接的普及,将使得数据更容易在数据中心之间传输。


但悲观的预测忽略了几个可能限制人工智能电力消耗的重要进展。其中之一是由Facebook和亚马逊等公司开创的“超大规模”数据中心的兴起。


这种数据中心使用大量专门为特定任务定制的基本服务器阵列。这些机器比传统数据中心的服务器更加节能,因为后者需要处理更广泛的功能。当前向超大规模数据中心的过渡,再加上冷却和其他技术的进步,是过去几年新数据中心的能源消耗基本上被运转效率提高所抵消的一个重要原因。


新型微芯片也会有所帮助。Applied Materials的预测假定,人工智能的工作负载将继续在现有硬件上运行,这些硬件的效率在未来几年将会逐步提高。但许多的初创企业以及英特尔、AMD等大公司,都在开发利用光子学等技术的、节能性大幅提升的半导体,来驱动神经网络和其他的人工智能工具。


具有讽刺意味的是,对人工智能功耗限制贡献最大的实际上可能是人工智能本身。谷歌已经在使用其2014年收购的DeepMind开发的技术,来更有效地冷却它的数据中心。通过向人类 *** 作员提出建议,人工智能已经帮助该公司削减了40%的冷却费用;现在它能有效地独立运行数据中心的冷却系统。


人工智能还将用于优化数据中心运营的其他方面。而且,就像谷歌在冷却方面的成果一样,这将使得各类工作负载受益。这并不意味着,数据中心最终不会因为对人工智能魔法的需求不断增长而消耗更多的能量,但这是当下做出预测如此困难的又一个原因。

当前,国内外互联网巨头纷纷将人工智能作为下一次产业革命的突破口,积极加大投资布局,与此同时,随着人工智能技术进步和基础设施建设不断完善的推动下,全球人工智能应用场景将不断丰富,市场规模持续扩大。

“人工智能”一词最初是在1956年美国计算机协会组织的达特矛斯(Dartmouth)学会上提出的,人工智能发展至今经历过经费枯竭的两个寒冬(1974-1980年、1987-1993年),也经历过两个大发展的春天(1956-1974年、1993-2005年)。从2006年开始,人工智能进入了加速发展的新阶段,并行计算能力、大数据和先进算法,使当前人工智能加速发展;同时,近年来人工智能的研究越来越受到产业界的重视,产业界对AI的投资和收购如火如荼。

人工智能技术迈入深度学习阶段

机器学习是实现人工智能的一种重要方法,深度学习(Deep Learning)是机器学习(Machine Learning)的关键技术之一。深度学习自2006年由Jeffery Hinton实证以来,在云计算、大数据和芯片等的支持下,已经成功地从实验室中走出来,开始进入到了商业应用,并在机器视觉、自然语言处理、机器翻译、路径规划等领域取得了令人瞩目的成绩,全球人工智能也正式迈入深度学习阶段。

与此同时,全球人工智能领域对新技术的探索从未停止,新技术层出不穷,例如近年来一些新的类脑智能算法提出来,将脑科学与思维科学的一些新的成果结合到神经网络算法之中,形成不同于深度学习的神经网络技术路线,如胶囊网络等,技术的不断进步是推动全球人工智能的发展的不竭动力,这些新技术的研究和应用将加快全球人工智能的发展进程。

主要经济体加快人工智能战略布局

人工智能作为引领未来的战略性技术,目前全球主要经济体都将人工智能作为提升国家竞争力、维护国家安全的重大战略。自2013年以来,包括美国、中国、欧盟、英国、日本、德国、法国、韩国、印度、丹麦、芬兰、新西兰、俄罗斯、加拿大、新加坡、阿联酋、意大利、瑞典、荷兰、越南、西班牙等20多个国家和地区发布了人工智能相关战略、规划或重大计划,越来越多的国家加入到布局人工智能的队列中,从政策、资本、技术人才培养、应用基础设施建设等方面为本国人工智能的落地保驾护航。

人工智能领域新基建扩容趋势明显

人工智能新基建包含智能芯片、5G、感知网络、数据中心等支持人工智能发展的生产性设施建设,同时人工智能与实体经济深度融合做构建的智能经济形态也是人工智能领域新基建的一部分。近年来,全球人工智能发展的生产性设施建设步伐加快,2020年新冠疫情在全球爆发,对全球的经济生产活动产生较大的冲击,但值得注意的是,全球范围内的新基建业务扩容未被阻断,从各国政府到行业主要企业都积极参与到人工智能新基建的建设中。

人工智能芯片是人工智能的大脑,随着全球人工智能终端设备数量的增长以及边缘计算的需求逐步提升,全球人工智能芯片需求量快速增长,市场规模不断扩大。根据Tractica公布的数据显示,2019年全球人工智能芯片市场规模达110亿美元,预计2020年全球人工智能芯片市场规模将增加至175亿美元,2025年全球人工智能芯片市场规模有望突破720亿美元。

5G的低延迟、高速度和边缘计算能力可以推动人工智能设备更智能地进行大量的数据连接,提升人工智能设备的学习能力,与此同时将5G网络与人工智能技术相结合,可以有效提高5G网络的智能化程度,使网络从人工配置参数与使用专家的经验编制策略转变为网络智能配置参数与智能策略自动生成成为可能。由此可见,5G与人工智能的互促式发展可以加速全球人工智能应用突破与落地,因此,目前全球范围正在加快5G商用推广的步伐,全球5G基础设施建设如火如荼。

根据GSMA(全球移动通信系统协会)公布的数据显示,截至2020年7月底,全球38个国家已经部署了92张5G移动网络,较4月底增加了22张;截至2020年9月,全球5G终端达到18类362款,其中162款手机,113款已经上市,其中70%+支持SA(独立组网),5G商用正在加快。

根据爱立信公布的数据显示,截至2020年6月底,全球范围内共部署了约72万个5G基站,2020年8月这一数据增加至80万个,前瞻预计,到2020年底,全球5G基站总数将达到100万个。

近年来,随着计算能力越来越强,云计算、大数据、虚拟化等技术的出现,让人工智能有了可依赖的现实技术基础。人工智能的算法需要依赖海量的数据,利用海量的样本进行机器学习。数据中心天然就是一个海量数据库,每天生成的和转发的数据都在呈指数增长,有了这些数据,再利用大数据技术去分析,就能得到很多有意义的数据供人工智能学习;与此同时,人工智能要依赖计算,只有高速的计算能力才能在短时间完成指定的任务,现在的数据中心利用网络进行分布式计算,大大提高了计算能力,人工智能的学习能力可以得到大幅提升。数据中心为人工智能提供更多的技术支撑与创造无限可能。

全球数据中心建设加快有力的推动了人工智能的发展,从2017年开始,伴随着大型化、集约化的发展,全球数据中心数量开始缩减,但值得注意的是,随着行业集中度的逐步提升,全球超大型数据中心数量总体增长,据Cisco的统计数据显示,2019年,全球超大型数据中心数量约447个;至2020年,全球超大新数据中心将达到485个。

根据Gartner公布的数据显示,2017年底全球部署机架数达到4933万架,安装服务器超过5500万台,2019年全球数据中心部署的机架数量约为4954万架。预计2020年机架数将超过498万架,服务器超过6200万台。

人工智能商业化加速 应用场景愈发丰富

人工智能技术经过过去近10年的快速发展已经取得较大突破,随着人工智能理论和技术的日益成熟,人工智能场景融合能力不断提升,因此,近年来商业化应用已经成为人工智能科技企业布局的重点,欧洲、美国等发达国家和地区的人工智能产业商业落地期较早,中国作为后期之秀,近年来在政策、资本的双重推动下,人工智能商业化应用进程加快。目前,人工智能技术已在金融、医疗、安防、教育、交通、制造、零售等多个领域实现技术落地,且应用场景也愈来愈丰富

值得注意的是,尽管目前全球范围内人工智能商业化进程正加速推进,但受制于应用场景的复杂度、技术的成熟度、数据的公开水平等限制,全球人工智能仍处在产业化和市场化的探索阶段,落地场景的丰富度、用户需求和解决方案的市场渗透率仍有待提高。

人工智能市场规模快速增长

基于人工智能技术的各种产品在各个领域代替人类从事简单重复的体力或脑力劳动,大大提升了生产效率和生活质量,也促进了各个行业的发展和变革。

普华永道数据预测,受到下游需求倒逼和上游技术成型推动的双重动因,2020年全球人工智能市场规模将达到2万亿美元,预计未来几年市场将继续保持高速增长,到2030年全球市场规模将达到157万亿美元的规模,约合人民币104万亿元。

北美地区人工智能产业发展领先

近年来,人工智能在北美洲、亚洲、欧洲地区发展愈演愈烈。北美、亚洲和欧洲是全球人工智能发展最为迅速的地区。截止2019年底,北美地区共有2472家人工智能活跃企业,超级独角兽企业78家;亚洲地区活跃人工智能企业1667家,超级独角兽企业8家;欧洲地区活跃人工智能企业1149家,超级独角兽企业8家。

注:超级独角兽指的是估值超过100亿美元的企业

科技巨头纷纷布局人工智能行业

近年来,全球科技巨头纷纷布局人工智能。在美国地区,Google实行“全面开花”的策略,在云服务、无人驾驶、虚拟现实、无人机、仓储机器人等领域均有布局。Facebook依托社交网络,从产品中获得数据、训练数据,再将其人工智能产品反作用于社交网络用户。微软则致力于将人工智能技术应用到智能助手、AR/VR等领域,例如Skype及时翻译、小冰聊天机器人、Cortana虚拟助理等应用。在中国,互联网巨头企业如百度、腾讯和阿里均纷纷依托自身平台优势,构建人工智能服务产品,主要布局于人工智能应用层领域。

人工智能新一轮资本热潮方兴未艾

从生产方式的智能化改造,到生活水平的智能化提升,再到社会治理的智能化升级,新一代人工智能的应用驱动特征愈加明显,大量新兴应用场景持续培育形成。快速丰富的数据储备,逐渐清晰的业务逻辑,以及即将落地的商业价值,促使全球人工智能新一轮资本热潮方兴未艾。

根据CB Insights公布的数据显示,2014-2019年全球人工智能融资金额和融资次数逐年增长,2019年再创新高,融资金额达到26580亿美元,融资次数超过2000次。

—— 以上数据及分析均来自于前瞻产业研究院《中国人工智能行业市场前瞻与投资战略规划分析报告》。

近年来随着社会的发展,建设智慧城市已成为时代发展的必然趋势。在城市化进程不断加快的过程中,城市已经被赋予了前所未有的经济、政治和技术的权利,并被无可避免地推到了世界舞台的中心,发挥着主导作用。

在人工智能技术内核的支持下,智慧城市可将百万级的服务器连成一台超级计算,可以对整个城市进行全局的实时分析,自动调配公共资源。其实,简单的来说就是利用人工智能技术形成以数据为驱动的城市决策机制,根据实时数据调控配置公共资源。

所以,智慧城市不仅给我们带来快捷,同时还能够给我们带来清洁能源,即进行低碳模式生活,还可对城市资源进行能源管理,即所谓的智能能源+大数据驱动下的能效管理。

在国内,目前最严重的是污染,水污染、土壤污染、空气污染。而在智慧城市平台的建设基础上,城市资源不仅可以得到关键变量的参数化建模、仿真和控制,更重要的是它还能够将一个区域作为一个系统进行参数化建模和仿真,通过数据的检测、分析、反馈形成一个闭环系统,从宏观的整体来把握城市资源信息的控制和管理。

尤其是在人工智能迅速发展的当下,通过物联网、云计算等移动通信网络技术将最新的高科技产品嵌入到智慧城市里面,不断丰富城市科技内容。使原有的城市环境在新的技术基础上,不断改善环境污染、交通堵塞、能源紧缺、住房不足、失业、疾病等带来的不足。

智慧城市是一种循环再生的新型城市,它作为一种战略被提出至今,除了能够实现对城市核心系统的感知及互联互通,它还可以为现代化城市带来更高层次的智能化演变,带动更深入的群众体验及参与度,它是努力推进知识社会,面向下一代的创新突破,是构建创新20时代的城市新形态,更是解决当下城市、农村发展的关键所在。

发掘科技一家专业的物联网硬件方案公司:发掘科技

栾青认为, AI是把现实世界数字化的重要工具。有了人工智能,就可以在虚拟世界里更快生成人、物、场景,大大降低元宇宙的构建门槛和成本 。AR/VR与AI的结合,能跨行业解决很多不同问题。除了 游戏 、社交外,在工业、建筑、医疗等产业数字化领域,也有比较多的应用空间。

不过,栾青也指出,目前相关产业还是处于初期发展的阶段,不管是硬件体验、内容生成平台,还是所涉及的经济系统、授权认证系统等均需时间来建立。 五年通常被认为是硬件的一个迭代周期,而最终的成熟时间依然很难预测 。但在终极的数字世界建立之前,会有比较多的雏形形态,能够解决日常生活中的一些问题。

人工智能的核心,在于持续把现实世界数字化

栾青:不管是称其为元宇宙,还是叫混合现实,或者数字世界也好,类似的概念已经存在非常久了。目前来看,AI所起到的作用主要包括三个方面。

首先,人需要拥有一个新的身份,AI将帮助大家以数字分身Avatar,更好地进入到虚拟世界里;其次是虚拟世界的多模态人机交互体验,即这些数字人对不同的虚拟世界、不同服务进行人机的交互;第三,虚拟要与真实结合,AI可以更快速地构建虚拟世界。

《科创板日报》:当下已经有哪些落地的应用场景?

栾青:目前所基于的载体是各类屏幕、电子设备,比如手机、电脑、大屏,当然还有开始初步应用的VR和AR眼镜。

在To C的应用方面,包括了各种各样的VR社交应用、会议系统等。在To B的方向,较为常见的是通过智能数字人,来替代某一项服务的重复性劳动。比如在商场、银行、医院等,数字人可以帮助前台来完成刷卡、来访登记等这些简单、重复的工作。

AI还能实现三维内容的快速生成,比如通过无人机或者手机快速扫描,就可以把现实场景在数字空间里建立起来。这在智慧城市的管理,智能遥感技术的应用已经非常多了。

在今年冬奥会期间,我们就对冰壶赛场冰立方的整个场馆进行了三维数字化。通过AI技术捕捉冰壶在三维场景中的位置,成功实现了在超大空间范围内,远距离精准检测并识别定位跟踪可能被遮挡的运动冰壶。不仅如此,我们还通过“虚实结合”的方式,在现场大屏和咪咕视频还原冰壶的运动轨迹曲线。这不仅可以帮助运动员分析研判对战形式,适时调整战术,还能让观众更好地了解和感受冰壶运动的精髓。

《科创板日报》:完成对水立方场景的三维数字化重建,大概需要多久时间?

栾青:我们在场馆内走一圈的时间大概是十几、二十分钟,然后在两个小时之内就能把整个水立方冰壶比赛场馆进行完整建模。这还是普通服务器的建模速度,如果使用性能更强的服务器,还有可能会更快。

《科创板日报》:AI为现实世界数字化所带来的效率提升,您有没有相关的数据?

栾青:比如, 过去建立一个数字人,平均时长大概剩3-4个月。通过AI的优化之后,在初步情况下可达到一个月以内。未来我们还将会把整个流程优化到以天为单位的级别 ,这样可以让很多行业高效率使用自己的虚拟形象代言人,这是我们正在努力的方向。

可以说,现实世界数字化,是AI最核心在做的事情。如何更快生成人、物、场景,降低成本和门槛,而不是需要专业的设计师花很长时间才能做完。

《科创板日报》:所谓现实世界数字化,在产业化场景也有应用空间,比如说像工业领域一直在提的数字孪生。

栾青:是的, 三维建模和数字化管理是比较通用的技能,可以跨行业解决很多不同问题 。在工业、建筑、医疗等等,都有比较多的可能性。

其中,工业是非常典型的场景。我们也实现了许多工厂,包括对工业园区、工业厂房等的快速三维建模。通过快速三维建模后,对现有的各种摄像头设备或者其他分配的信号进行连接,就形成了一个典型的数字孪生场景。

AI的优势在于,不需要设计师进行场景的三维重建 ,这是一项较为劳动力密集的工作。我们用 普通的民用摄像头产品,甚至手机围绕现场走一圈就可以把场景快速地建立出来

而且这些部署的摄像头,可以实现三维高清定位,快速地标定至三维的空间位置中,这样不管厂区还是园区的数字化管理就会非常高效地进行。

数据化和硬件体验是两大挑战

《科创板日报》:“AI+XR”的结合应用还是处于初期发展阶段,您觉得可能还存在哪些挑战?

栾青:挑战主要有两个方面。

首先是体验。这是需要全行业一起解决的事情,包括大家常说的VR或AR内容生态,依赖整个行业一系列的技术提升,把整个体验和内容建立起来。

其次则是数据化。虚拟世界或者说数字世界的存在,最终要帮助到真实世界解决实际的问题。但挑战在于,很多的场景是具有长尾效应。比如在工厂,有些设备是在别的厂区见不到的,或者在这个特殊行业才拥有的,那就需要进行一系列长尾内容的数据化。 如何高效率低成本识别不同的内容,并且实时的数据化到我们系统当中,这也是一大挑战

《科创板日报》:虚拟现实应用要真正发展起来的话,可能涉及到哪些关键产业链?

栾青:首先 硬件的产业链肯定是第一步 。必须采用大家习惯、能够日常使用的体验方式,才能普及。就像手机如果非常重,又很昂贵,那么大家不太可能用起来,很多应用也无从落脚。

所以,硬件成本的降低,以及重量、散热、耗能等的提升,仍然要不断去攻克的瓶颈。由此来看, 光学显示,包括轻量化的芯片等,应该都会有较强的发展空间。同时,基于硬件的各种智能化,包括手势识别、面部驱动,三维人建模等内容工具,也亟待发展

内容生成平台也非常关键 。三维比二维的内容制作要复杂很多。以前可能只有 游戏 厂商,需要做复杂的三维内容,但投入也是非常大的。 如果我们希望走向全民普适,比如银行、商场、办事大厅等,都进入到三维数字世界之中,你发现成本就会变得非常巨大 。各种各样高效的内容生产工具和平台也会有一轮需要被突破的过程。

此外,如果所有人都需要在三维互联网进行更深入地交流,那么大规模云端的协同性计算,也会有一个巨大的发展契机。当然,还包括经济系统、授权认证系统等,都要在这个体系下被建立起来。

看好数字文创和数字人

《科创板日报》:您预估成熟期需要多久呢?

栾青:现在还比较难预测。不过, 在终极的数字世界建立之前,会有比较多的雏形形态,可以解决日常生活中比较多的问题

比如刚才提到的数字人在垂直领域的应用,已经可以消除很多服务体验和效率上的难点。并不一定非要有全新的硬件或者不同的内容生产生态。只要在专业领域做得比较好,就可以有效地提升生产效率。这种行业级别的应用,我们认为已经到来了。

全民的、普适性的三维互联网级别,可能还需要一定的发展周期,大家常说5年是一个硬件迭代周期,我们也拭目以待

《科创板日报》:目前比较有前景的应用,除了数字人之外还有哪些?

栾青:数字世界需要各种各样的内容,人是一方面,物是另一方面。把很多现实物品进行数字化,也已经成为一个重要的体验环节。

在这方面,数字文创拥有比较大的发展契机。我们已经与敦煌、故宫等大型IP合作,来进行数字内容的体验提升,更好地展示中国传统文化的魅力。

事实上,数字世界可以有更大的创造空间,展示现实文创产品展现不了的内容。 过去是数字赋能实物,现在是实物赋能数字,通过AI/AR的方式,把虚拟的数字内容附着在实体上面,这是我们对数字文创的定义

《科创板日报》:您在人工智能从事研究工作多年,您认为人工智能对人类而言,所具有的最大意义是什么?

栾青:人工智能本质上模拟了人类大脑处理信号的方式。在人工智能出现之前,计算机只能处理数字化的信号,没有办法表达自己的思想,依然需要人对这些信号进行解析,才让其变得有意义。

人工智能出现,首先是把现实世界数字化。这样计算机在很多领域就能看懂现实世界的信号,而不用依靠人力。计算机可以自动地、主动去做一些事情,这样提升了数据处理的效率。 其核心是解决了信息入口的问题。也就是原先需要人进行输入,现在整个世界的数据信息不断自动地流入到计算世界里。

当然,人工智能不只是解决入口问题,还要进行各种三维数字内容生成,这是另一价值所在。这方面,人工智能可以把许多重复性劳动替代掉,也是我认为未来重要的发展方向。

在“新基建”浪潮下,人工智能正成为经济增长的新引擎,各行各业开启智能化升级转型。算力在其中扮演了重要角色,是国家未来竞争力的集中体现。但事实是,在发展的过程中,高速增长的海量数据与更加复杂的模型,正在为算力带来更大的挑战,主要体现为算力不足,效率不高。


算力诚可贵:数据、算法需要更多算力支撑


众所周知,在人工智能发展的三要素中,无论是数据还是算法,都离不开算力的支撑,算力已成为人工智能发展的关键要素。


IDC发布的《数据时代2025》报告显示,2018年全球产生的数据量为33ZB (1ZB=1万亿GB),到2025年将增长到175ZB,其中,中国将在2025年以486ZB的数据量及278%的占比成为全球最大的数据汇集地。



另据赛迪顾问数据显示,到2030年数据原生产业规模量占整体经济总量的15%,中国数据总量将超过4YB,占全球数据量30%。数据资源已成为关键生产要素,更多的产业通过利用物联网、工业互联网、电商等结构或非结构化数据资源来提取有价值信息,而海量数据的处理与分析对于算力的需求将十分庞大。



算法上,先进模型的参数量和复杂程度正呈现指数级的增长趋势。此前 Open AI 发表的一项研究就显示,每三到四个月,训练这些大型模型所需的计算资源就会翻一番(相比之下,摩尔定律有 18 个月的倍增周期)。2012 至 2018 年间,深度学习前沿研究所需的计算资源更是增加了 30 万倍。



到2020年,深度学习模型对算力的需求达到了每天百亿亿次的计算需求。2020年2月,微软发布了最新的智能感知计算模型Turing-NLG,参数量高达到175亿,使用125POPS AI计算力完成单次训练就需要一天以上。随后,OpenAI又提出了GPT-3模型,参数量更达到1750亿,对算力的消耗达到3640 PetaFLOPS/s-day。而距离GPT-3问世不到一年,更大更复杂的语言模型,即超过一万亿参数的语言模型SwitchTransformer即已问世。


由此可见,高速增长的海量数据与更加复杂的模型,正在给算力带来更大的挑战。如果算力不能快速增长,我们将不得不面临一个糟糕的局面:当规模庞大的数据用于人工智能的训练学习时,数据量将超出内存和处理器的承载上限,整个深度学习训练过程将变得无比漫长,甚至完全无法实现最基本的人工智能。


效率价更高:环境与实际成本高企,提升效率迫在眉睫


在计算工业行业,有个假设是“数字处理会变得越来越便宜”。但斯坦福人工智能研究所副所长克里斯托弗•曼宁表示,对于现有的AI应用来说却不是这样,特别是因为不断增加的研究复杂性和竞争性,使得最前沿模型的训练成本还在不断上升。


根据马萨诸塞大学阿默斯特校区研究人员公布的研究论文显示,以常见的几种大型 AI 模型的训练周期为例,发现该过程可排放超过 626000 磅二氧化碳,几乎是普通 汽车 寿命周期排放量的五倍(其中包括 汽车 本身的制造过程)。



例如自然语言处理中,研究人员研究了该领域中性能取得最大进步的四种模型:Transformer、ELMo、BERT和 GPT-2。研究人员在单个 GPU 上训练了至少一天,以测量其功耗。然后,使用模型原始论文中列出的几项指标来计算整个过程消耗的总能量。


结果显示,训练的计算环境成本与模型大小成正比,然后在使用附加的调整步骤以提高模型的最终精度时呈爆炸式增长,尤其是调整神经网络体系结构以尽可能完成详尽的试验,并优化模型的过程,相关成本非常高,几乎没有性能收益。BERT 模型的碳足迹约为1400 磅二氧化碳,这与一个人来回坐飞机穿越美洲的排放量相当。



此外,研究人员指出,这些数字仅仅是基础,因为培训单一模型所需要的工作还是比较少的,大部分研究人员实践中会从头开发新模型或者为现有模型更改数据集,这都需要更多时间培训和调整,换言之,这会产生更高的能耗。根据测算,构建和测试最终具有价值的模型至少需要在六个月的时间内训练 4789 个模型,换算成碳排放量,超过 78000 磅。而随着 AI 算力的提升,这一问题会更加严重。


另据 Synced 最近的一份报告,华盛顿大学的 Grover 专门用于生成和检测虚假新闻,训练较大的Grover Mega模型的总费用为25万美元;OpenAI 花费了1200万美元来训练它的 GPT-3语言模型;谷歌花费了大约6912美元来训练 BERT,而Facebook针对当前最大的模型进行一轮训练光是电费可能就耗费数百万美元。


对此,Facebook人工智能副总裁杰罗姆•佩森蒂在接受《连线》杂志采访时认为,AI科研成本的持续上涨,或导致我们在该领域的研究碰壁,现在已经到了一个需要从成本效益等方面考虑的地步,我们需要清楚如何从现有的计算力中获得最大的收益。


在我们看来,AI计算系统正在面临计算平台优化设计、复杂异构环境下计算效率、计算框架的高度并行与扩展、AI应用计算性能等挑战。算力的发展对整个计算需求所造成的挑战会变得更大,提高整个AI计算系统的效率迫在眉睫。


最优解:智算中心大势所趋,应从国家公共设施属性做起


正是基于上述算力需求不断增加及所面临的效率提升的需要,作为建设承载巨大AI计算需求的算力中心(数据中心)成为重中之重。


据市场调研机构Synergy Research Group的数据显示,截至到2020年第二季度末,全球超大规模数据中心的数量增长至541个,相比2015年同期增长一倍有余。另外,还有176个数据中心处于计划或建设阶段,但作为传统的数据中心,随之而来的就是能耗和成本的大幅增加。



这里我们仅以国内的数据中心建设为例,现在的数据中心已经有了惊人的耗电量。据《中国数据中心能耗现状白皮书》显示,在中国有 40 万个数据中心,每个数据中心平均耗电 25 万度,总体超过 1000 亿度,这相当于三峡和葛洲坝水电站 1 年发电量的总和。如果折算成碳排放则大概是 9600 万吨,这个数字接近目前中国民航年碳排放量的 3 倍。


但根据国家的标准,到2022年,数据中心平均能耗基本达到国际先进水平,新建大型、超大型数据中心的 PUE(电能使用效率值,越低代表越节能)达到 14 以下。而且北上广深等发达地区对于能耗指标控制还非常严格,这与一二线城市集中的数据中心需求形成矛盾,除了降低 PUE,同等计算能力提升服务器,尤其是数据中心的的计算效率应是正解。


但众所周知的事实是,面对前述庞大的AI计算需求和提升效率的挑战,传统数据中心已经越来越难以承载这样的需求,为此,AI服务器和智算中心应运而生。


与传统的服务器采用单一的CPU不同,AI服务器通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合可以满足高吞吐量互联的需求,为自然语言处理、计算机视觉、语音交互等人工智能应用场景提供强大的算力支持,已经成为人工智能发展的重要支撑力量。


值得一提的是,目前在AI服务器领域,我们已经处于领先的地位。


近日,IDC发布了2020HI《全球人工智能市场半年度追踪报告》,对2020年上半年全球人工智能服务器市场进行数据洞察显示,目前全球半年度人工智能服务器市场规模达559亿美元(约3266亿人民币),其中浪潮以164%的市占率位居全球第一,成为全球AI服务器头号玩家,华为、联想也杀入前5(分别排在第四和第五)。


这里业内也许会好奇,缘何中国会在AI服务器方面领跑全球?



以浪潮为例,自1993年,浪潮成功研制出中国首台小型机服务器以来,经过30年的积累,浪潮已经攻克了高速互联芯片,关键应用主机、核心数据库、云数据中心 *** 作系统等一系列核心技术,在全球服务器高端俱乐部里占有了重要一席。在AI服务器领域,从全球最高密度AGX-2到最高性能的AGX-5,浪潮不断刷新业界最强的人工智能超级服务器的纪录,这是为了满足行业用户对人工智能计算的高性能要求而创造的。浪潮一直认为,行业客户希望获得人工智能的能力,但需要掌握了人工智能落地能力的和技术的公司进行赋能,浪潮就可以很好地扮演这一角色。加快人工智能落地速度,帮助企业用户打开了人工智能应用的大门。


由此看,长期的技术创新积淀、核心技术的掌握以及对于产业和技术的准确判断、研发是领跑的根本。


至于智算中心,去年发布的《智能计算中心规划建设指南》公布了智能计算中心技术架构,基于最新人工智能理论,采用领先的人工智能计算架构,通过算力的生产、聚合、调度和释放四大作业环节,支撑和引领数字经济、智能产业、智慧城市和智慧 社会 应用与生态 健康 发展。



通俗地讲,智慧时代的智算中心就像工业时代的电厂一样,电厂是对外生产电力、配置电力、输送电力、使用电力;同理智算中心是在承载AI算力的生产、聚合、调度和释放过程,让数据进去让智慧出来,这就是智能计算中心的理想目标。


需要说明的是,与传统数据中心不同,“智算中心”不仅把算力高密度地集中在一起,而且要解决调度和有效利用计算资源、数据、算法等问题,更像是从计算器进化到了大脑。此外,其所具有的开放标准,集约高效、普适普惠的特征,不仅能够涵盖融合更多的软硬件技术和产品,而且也极大降低了产业AI化的进入和应用门槛,直至普惠所有人。



其实我们只要仔细观察就会发现,智算中心包含的算力的生产、聚合、调度和释放,可谓集AI能力之大成,具备全栈AI能力。


这里我们不妨再次以浪潮为例,看看何谓全栈AI能力?


比如在算力生产层面,浪潮打造了业内最强最全的AI计算产品阵列。其中,浪潮自研的新一代人工智能服务器NF5488A5在2020年一举打破MLPerf AI推理&训练基准测试19项世界纪录(保证充足的算力,解决了算力提升的需求);在算力调度层面,浪潮AIStation人工智能开发平台能够为AI模型开发训练与推理部署提供从底层资源到上层业务的全平台全流程管理支持,帮助企业提升资源使用率与开发效率90%以上,加快AI开发应用创新(解决了算力的效率问题);在聚合算力方面,浪潮持续打造更高效率更低延迟硬件加速设备与优化软件栈;在算力释放上,浪潮AutoML Suite为人工智能客户与开发者提供快速高效开发AI模型的能力,开启AI全自动建模新方式,加速产业化应用。


那么接下来的是,智算中心该遵循怎样的发展路径才能充分发挥它的作用,物尽其用?


IDC调研发现,超过九成的企业正在使用或计划在三年内使用人工智能,其中745%的企业期望在未来可以采用具备公用设施意义的人工智能专用基础设施平台,以降低创新成本,提升算力资源的可获得性。


由此看,智能计算中心建设的公共属性原则在当下和未来就显得尤为重要,即智能计算中心并非是盈利性的基础设施,而是应该是类似于水利系统、水务系统、电力系统的公共性、公益性的基础设施,其将承载智能化的居民生活服务、政务服务智能化。因此,在智能计算中心规划和建设过程中,要做好布局,它不应该通过市场竞争手段来实现,而要体现政府在推进整个 社会 智能化进程的规划、节奏、布局。


总结: 当下,算力成为推动数字经济的根基和我国“新基建“的底座已经成为共识,而如何理性看待其发展中遇到的挑战,在不断高升算力的前提下,提升效率,并采取最佳的发展策略和形式,找到最优解,将成为政府相关部门以及相关企业的重中之重。

资讯 咨询机构IDC近日发布的《2017年中国AI基础设施市场跟踪报告》显示,2017年,中国GPU服务器市场迎来爆发式增长,市场规模为5.65亿美元(约合35亿元人民币),同比增长230.7%,约占中国X86服务器市场的6%。

该机构预测,未来五年GPU服务器市场仍将保持高速增长,2017~2022年复合增长率将超过43%。到2022年,GPU服务器的市场规模有望达到中国X86服务器市场整体规模的16%,将直接改变整个服务器市场的格局。

从厂商市场占有率来看,浪潮处于领先位置,曙光和新华三紧随其后。从行业分布来看,互联网是GPU服务器的主要用户群体,提供AIaaS的公有云服务提供商和AI解决方案提供商有望成为未来驱动市场增长的新动力。从市场趋势来看,2017年GPU服务器市场不再是一个小众的市场,几乎所有互联网用户和大量的AI初创公司都开始采购GPU服务器搭建自己的AI平台,主流的公有云厂商也都先后推出自己的AIaaS服务。

从AI生态系统建设来看,Nvidia具有明显优势,其Tesla系列产品在AI基础设施市场占据主导地位,尤其在线下训练场景中几乎垄断了市场。从其产品分布来看,P40和P100占据超过70%的市场份额,分别面向推理和训练工作负载,P4在2017年也取得了快速增长,主要面向1U紧凑型推理计算平台。

该机构中国服务器市场高级研究经理刘旭涛认为:“2017年是中国AI元年,也是AI生态和市场迅速发展的一年。在国家政策和资本的共同推动下,大量AI初创企业涌现、行业应用迅速落地。AI市场的火热推动了以GPU服务器为主的AI基础设施市场取得了爆发式增长,未来伴随AI市场的发展和繁荣,AI基础设施市场仍将保持快速增长。”他认为,目前,AI的应用以线下训练为主,使用者主要是拥有海量数据的用户群体,基础设施以GPU为主。未来,在线推理的应用将更加广泛,除了GPU,FPGA、ASIC等加速计算技术,甚至基于ARM架构的一些新的专用AI芯片都会迎来发展机遇。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/zz/13123393.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-06-04
下一篇 2023-06-04

发表评论

登录后才能评论

评论列表(0条)

保存