绿色人工智能:使应用程序更具可持续性的 7 种策略

发布时间:2024-01-26 14:45:03 浏览量:130次

本文深入探讨了一种全面的方法,阐明了如何准确估计与人工智能应用相关的碳足迹。它解释了人工智能对环境的影响,这是当今世界的一个关键考虑因素。

图片来自编辑

人工智能应用程序拥有无与伦比的计算能力,可以以前所未有的速度推动进步。然而,这些工具的运营严重依赖能源密集型数据中心,导致缺乏能源敏感性,这大大增加了它们的碳足迹。令人惊讶的是,这些人工智能应用已经占全球温室气体排放量的2.5%至3.7%,超过了航空业的排放量。

不幸的是,这种碳足迹正在快速增长。

目前,迫切需要测量机器学习应用程序的碳足迹,正如彼得·德鲁克(Peter Drucker)的智慧所强调的那样,“你无法管理你无法衡量的东西。目前,在量化人工智能对环境的影响方面存在严重缺乏清晰度,我们无法获得精确的数字。

除了测量碳足迹外,人工智能行业的领导者还必须积极关注优化碳足迹。这种双重方法对于解决围绕人工智能应用的环境问题和确保更可持续的前进道路至关重要。

哪些因素会影响 AI 应用程序的碳足迹

机器学习的使用增加需要增加数据中心,其中许多数据中心耗电,因此具有显着的碳足迹。2021 年,数据中心的全球用电量为 0.9% 至 1.3%。

2021 年的一项研究估计,到 1.86 年,这种使用量可以增加到 2030%。这个数字代表了数据中心能源需求的增长趋势。

© 数据中心的能源消耗趋势和使用份额

值得注意的是,能源消耗越高,碳足迹就越高。数据中心在处理过程中会发热,并可能出现故障,甚至因过热而停止运行。因此,它们需要冷却,这需要额外的能量。数据中心消耗的电力中约有40%用于空调。

计算 AI 应用的碳强度

鉴于人工智能的使用足迹越来越大,这些工具的碳强度需要考虑在内。目前,关于这一主题的研究仅限于对少数模型的分析,并没有充分解决所述模型的多样性问题。

这是一种进化的方法和一些有效的工具来计算人工智能系统的碳强度。

人工智能碳强度估算方法

软件碳强度(SCI)标准是估算AI系统碳强度的有效方法。与采用归因碳核算方法的传统方法不同,它使用结果计算方法。

结果方法试图计算干预或决定(例如产生额外单元的决定)引起的排放量的边际变化。而归因是指核算平均强度数据或排放的静态清单。

Jesse Doge等人发表的一篇关于“测量云实例中人工智能的碳强度”的论文采用了这种方法来引入更明智的研究。由于大量的 AI 模型训练是在云计算实例上进行的,因此它可以成为计算 AI 模型碳足迹的有效框架。本文改进了以下估计的SCI公式:

这是从以下方面提炼出来的:

源自

哪里:

E:软件系统消耗的能量,主要是图形处理单元 - GPU 是专门的 ML 硬件。

我:为数据中心供电的电网基于位置的边际碳排放量。

男:嵌入或隐含碳,即在使用、创建和处置硬件期间排放的碳。

R:功能单元,在本例中是一个机器学习训练任务。

C= O+M,其中 O 等于 E*I

本文使用该公式来估计单个云实例的用电量。在基于深度学习的 ML 系统中,主要电力消耗归功于 GPU,该公式中包含 GPU。他们在具有两个Intel Xeon E5-2630 v3 CPU(2.4GHz)和256GB RAM(16x16GB DIMM)的商品服务器中使用单个NVIDIA TITAN X GPU(12 GB)训练了一个BERT-base模型,以试验该公式的应用。下图显示了此实验的结果:

© 能耗和服务器组件之间的拆分

GPU占能耗的74%。尽管该论文的作者仍然声称它被低估了,但包含GPU是朝着正确方向迈出的一步。这不是传统估算技术的重点,这意味着在估算中忽略了碳足迹的主要贡献者。显然,SCI提供了一种更健康、更可靠的碳强度计算方法。

测量云计算实时碳足迹的方法

AI 模型训练通常在云计算实例上进行,因为云使其具有灵活性、可访问性和成本效益。云计算提供了大规模部署和训练 AI 模型的基础设施和资源。这就是为什么云计算上的模型训练正在逐渐增加的原因。

测量云计算实例的实时碳强度以确定适合缓解工作的领域非常重要。会计基于时间和特定位置的每单位能源边际排放量可以帮助计算运营碳排放量,正如 2022 年的一篇论文所做的那样。

开源工具云碳足迹 (CCF) 软件也可用于计算云实例的影响。

提高人工智能应用的碳效率

以下是优化人工智能系统碳强度的 7 种方法。

1. 编写更好、更高效的代码

优化的代码可以通过减少内存和处理器使用量将能耗降低 30%。编写碳效率代码涉及优化算法以加快执行速度,减少不必要的计算,以及选择节能硬件以更少的功耗执行任务。

开发人员可以使用分析工具来确定其代码中的性能瓶颈和优化区域。这个过程可以带来更节能的软件。此外,请考虑实现能源感知编程技术,其中代码旨在适应可用资源并确定节能执行路径的优先级。

2. 选择更高效的型号

选择正确的算法和数据结构至关重要。开发人员应选择能够最大程度地降低计算复杂性并因此降低能耗的算法。如果更复杂的模型只能产生 3-5% 的改进,但训练时间要多 2-3 倍;然后选择更简单、更快速的型号。

模型蒸馏是另一种将大型模型压缩为较小版本的技术,以使其在保留基本知识的同时更有效。这可以通过训练一个小模型来模仿大模型或从神经网络中删除不必要的连接来实现。

3. 调整模型参数

使用双目标优化来平衡模型性能(例如准确性)和能耗,从而调整模型的超参数。这种双目标方法可确保您不会为了另一个而牺牲一个,从而使您的模型更加高效。

利用参数高效微调 (PEFT) 等技术,其目标是获得类似于传统微调的性能,但可训练参数的数量减少。这种方法涉及微调模型参数的一小部分,同时冻结大多数预先训练的大型语言模型(LLM),从而显着减少计算资源和能耗。

4. 压缩数据并使用低能耗存储

实施数据压缩技术以减少传输的数据量。压缩数据需要较少的能量来传输,并且占用的磁盘空间也较小。在模型服务阶段,使用缓存可以帮助减少对在线存储层的调用,从而减少

此外,选择正确的存储技术可以带来显著的收益。例如。AWS Glacier 是一种高效的数据存档解决方案,如果不需要频繁访问数据,则比使用 S3 更具可持续性。

5. 清洁能源模型培训

如果您使用云服务进行模型训练,您可以选择运行计算的区域。为此选择一个使用可再生能源的地区,您可以减少多达 30 倍的排放量。AWS 博客文章概述了针对业务优化和可持续发展目标之间的平衡。

另一个选项是选择运行模型的适当时机。在一天中的某些时间;能源更清洁,这些数据可以通过付费服务(如电力地图)获取,该服务提供对不同地区电力碳强度的实时数据和未来预测。

6. 使用专门的数据中心和硬件进行模型训练

选择更高效的数据中心和硬件可以对碳强度产生巨大影响。特定于ML的数据中心和硬件的能源效率可以比一般数据中心和硬件高1.4-2和2-5倍。

7. 使用无服务器部署,如 AWS Lambda、Azure Functions

传统部署要求服务器始终在线,这意味着 24x7 全天候能耗。AWS Lambda 和 Azure Functions 等无服务器部署以最小的碳强度运行良好。

结语

人工智能行业正在经历指数级增长,渗透到商业和日常生活的方方面面。然而,这种扩张是有代价的——迅速增长的碳足迹有可能使我们进一步远离将全球气温上升限制在1°C的目标。

这种碳足迹不仅仅是当前的问题;它的影响可能会代代相传,影响到那些对它的创造没有责任的人。因此,必须采取果断行动来减少与人工智能相关的碳排放,并探索利用其潜力的可持续途径。确保人工智能的好处不会以牺牲环境和子孙后代的福祉为代价至关重要。

Ankur Gupta是一位工程领导者,在可持续发展,运输,电信和基础设施领域拥有十年的经验;目前担任优步的工程经理一职。在这个职位上,他在推动优步车辆平台的发展方面发挥着关键作用,通过整合尖端的电动和联网车辆,引领零排放的未来。


原文标题:Greening AI: 7 Strategies to Make Applications More Sustainable

原文链接:
https://www.kdnuggets.com/greening-ai-7-strategies-to-make-applications-more-sustainable

作者:Ankur Gupta

编译:LCR

热门课程推荐

热门资讯

请绑定手机号

x
确定