“地球影响、不断上升的财务成本和人力成本都是诱因。
(资料图片仅供参考)
作者:Sasha Luccioni |
编译:Poetry |
近几个月来,人工智能领域发展迅速,Dall-E、 GPT-4等一批又一批新机型相继问世。每周都有新的令人兴奋的模型、产品和工具出现。人们很容易被一波又一波的炒作所淹没,但这些闪亮的能力是以社会和地球的实际成本为代价的。
缺点包括开采稀有矿物的环境代价,数据注释的劳动密集型过程的人力成本,以及由于人工智能模型包含更多参数,培训所需的不断增加的财政投资。
让我们来看看最近几代这些模型的创新推动力ーー以及提高相关成本的因素。
01
更大的模型
近年来,人工智能模型变得越来越大,研究人员现在用数千亿个参数来测量它们的大小。“参数”是模型中使用的内部连接,用于基于训练数据学习模式。
对于像 ChatGPT 这样的大型语言模型(LLM) ,使用 Google 的 PalM 模型,我们已经从2018年的1亿个参数增加到2023年的5千亿个参数。这种增长背后的理论是,参数更多的模型应该有更好的表现,即使是在最初没有接受过训练的任务上,尽管这一假设仍未得到证实。
多年来模型规模的增长
更大的模型通常需要更长的培训时间,这意味着他们还需要更多的 GPU,这需要更多的资金,所以只有少数组织能够培训他们。
据估计,GPT-3的培训费用为460万美元,对大多数公司和组织来说是无法承受的。GPT-3有1750亿个参数。(值得注意的是,在某些情况下,培训模型的成本正在下降,例如最近由 Meta 培训的 LLaMA 模型。)
这在人工智能领域造成了一个数字鸿沟,一边是那些能够培养最尖端的 LLM 的人(大多数是大型科技公司和全球北方的富裕机构) ,另一边是那些不能培养 LLM 的人(非营利组织、初创企业,以及任何没有超级计算机或数百万云信用的人)。
建造和部署这些庞然大物需要大量的地球资源: 用于制造 GPU 的稀有金属,用于冷却巨大数据中心的水,用于保持这些数据中心在全球范围内全天候运行的能源... ...
所有这些往往被忽视,而只会去关注由此产生的模型的未来潜力。
02
地球影响
卡内基梅隆大学(Carnegie Melon University)教授艾玛?斯特鲁贝尔(Emma Strubell)针对 LLM 培训碳足印的一项研究估计,2019年培训的一个名为 BERT 的模型只有2.13亿个参数,排放了280公吨的碳排放,大致相当于5辆汽车一生的排放量。从那时起,模型不断增长,硬件变得更加高效,那么我们现在呢?
在最近的一篇学术文章中:一篇研究训练 BLOOM (一个1760亿参数的语言模型)所产生的碳排放的文章,比较了几个 LLM 的能源消耗和随后的碳排放,所有这些都是在过去几年中出现的。比较的目的是了解不同规模的长期有限管制措施的排放规模及其影响因素。
根据培训所使用的能源及其碳强度,如果使用可再生能源,培训一个2022年的 LLM 至少会排放25公吨的碳当量,就像 BLOOM 模型所做的那样。
如果使用碳密集型能源,如煤炭和天然气,GPT-3就是这种情况,这个数字迅速上升到500公吨的碳排放量,大约相当于一辆普通汽油动力汽车行驶100多万英里。
这种计算没有考虑用于训练模型的硬件的制造,也没有考虑在现实世界中部署 LLM 时产生的排放。
例如,ChatGPT 在一个月前的高峰时期曾受到数千万用户的询问,有数千份该模型并行运行,实时响应用户的询问,同时使用电力并产生数吨的碳排放。鉴于这些大型有限责任管理机制的保密性和缺乏透明度,很难估计其导致的确切排放量。
03
封闭的,专有的模型
让我们回到上面的 LLM 图。可能会注意到,ChatGPT 和 GPT-4都不在其中。为什么?因为我们不知道它们有多大。尽管已经发表了几篇关于它们的报告,但是我们对它们的大小和工作原理几乎一无所知。访问是通过 API 提供的,这意味着它们实际上是用户可以查询的黑盒。
这些盒子可能包含一个单一的模型(可能有一万亿个参数)或者多个模型。
下图显示了 LLM 最近发布的时间表以及每个模型创建者提供的访问类型。正如所看到的,最大的模型(Megatron、 PalM、 Gopher 等)都是闭源的。如果相信这样一个理论,即模型越大,它就越强大(我不这么认为) ,这意味着最强大的人工智能技术只有少数几个组织才能使用,而这些组织垄断了对它的使用权。
最近发布的 LLM 的时间表和每个模型创建者提供的访问类型
这有什么问题吗?这意味着很难对这些模型进行外部评估和审计,因为甚至不能确定每次查询时底层模型是否相同。这也意味着不能对它们进行科学研究,因为研究必须是可重复的。
唯一能够不断改进这些模型的人是最初培训这些模型的组织,这是他们不断改进模型并随着时间的推移提供新特性的方法。
04
人力成本
训练一个人工智能模型需要多少人?你可能认为答案是零,但是制造最近几代 LLM 所需的人力数量正在稳步上升。
当Megatron模型几年前出现的时候,研究人员宣称它们是人工智能的一个新时代,因为它们可以接受“原始数据”的训练。在这种情况下,原始数据意味着“未标记的数据”ーー书籍、百科全书文章和被大量刮取和收集的网站。
像 BERT 和 GPT-2这样的模型就是这种情况,它们在数据收集和过滤方面需要的人工干预相对较少。虽然这对模型创建者来说很方便,但也意味着各种各样不受欢迎的内容,如仇恨言论和色情内容,在模型训练过程中被吸收,然后通常被模型自己重复。
这种数据收集方法随着 RLHF (强化学习反馈)的出现而改变,这种技术被新一代的 LLMs (如 ChatGPT)所使用。顾名思义,RLHF 为 LLM 培训过程增加了额外的步骤,而这些步骤需要更多的人工干预。
基本上,一旦一个模型接受了大量未标记数据的训练(来自网络、书籍等) ,人们就会被要求与模型进行互动,提出提示(例如,“给我写一份巧克力蛋糕的食谱”) ,并提供他们自己的答案或评估模型提供的答案。这些数据被用来继续训练这个模型,然后再由人类进行测试,直到这个模型被认为足够好,可以发布到全世界。
这种 RLHF 训练使得 ChatGPT 广泛发布成为可能,因为它可能会拒绝回答许多类型的潜在有害问题。
RLHF 训练实例
但这种成功背后隐藏着一个肮脏的秘密: 为了保持人工智能的低成本,提供这种“人类反馈”的人是工资过低、受到过度剥削的工人。今年1月,《时代周刊》(Time)撰写了一篇关于肯尼亚工人每小时工资不到2美元检查数千条 OpenAI 信息的报道。这种工作可以产生长期的心理影响,正如我们在内容审核工作者身上看到的那样。
更糟糕的是,这些无名工人的努力并没有在人工智能模型附带的报告中得到承认。他们的劳动是无形的。
05
我们该怎么办?
对于这些模型的创造者来说,与其只关注规模和尺寸,为了性能而进行优化,不如培训更小、更有效的模型,让模型变得可访问,这样它们就可以被人工智能社区的成员重新使用和微调(即: 改编) ,而这些人工智能社区的成员不需要从头开始培训模型。投入更多精力改善这些模型的安全性和安保性ーー开发机器生成内容的水印、更可靠的安全过滤器以及在生成问题答案时引用来源的能力等功能ーー也有助于让 LLM 更容易访问和更强大。
作为这些模型的使用者(有时不顾我们自己的感受) ,我们有能力要求透明度,并反对在高风险场景中部署人工智能模型,比如提供心理辅助治疗或生成法医草图的服务。这些模型仍然太新,文档记录不足,而且不可预测,无法在可能产生如此重大影响的情况下部署。
下次有人说,最新的人工智能模型将造福全人类,或者它展示了人工通用智能的证据时,希望能想想它给人类和地球带来的隐性代价。这些只是这些系统更广泛的社会影响和成本的一小部分,比如对工作的影响,虚假信息和宣传的传播,以及对盗版的担忧。
生成性人工智能有许多隐性成本
目前的趋势是建立更大、更封闭、更不透明的模型。但是仍然有时间来反击,要求透明度,更好地理解 LLM 的成本和影响,同时限制它们在整个社会中的部署方式。美国的《算法责任法案》(Alobacmic Accountability Act)以及欧盟和加拿大关于人工智能治理的法律框架等立法正在界定我们的人工智能未来,并制定了保障措施,以确保未来几代人工智能系统在社会中的安全性和问责性。作为这个社会的成员和这些系统的使用者,我们应该让它们的创造者听到我们的声音。
Sasha Luccioni 博士是“Hugging Face”的研究员和气候负责人,她研究人工智能模型和数据集的伦理和社会影响。她还是机器学习女性(WiML)的主任,气候变化人工智能(CCAI)的创始成员,以及 NeurIPS 道德准则委员会的主席。
参考文献:
https://arstechnica.com/gadgets/2023/04/generative-ai-is-cool-but-lets-not-forget-its-human-and-environmental-costs/
本文提供的信息仅用于一般指导和信息目的,本文的内容在任何情况下均不应被视为投资、业务、法律或税务建议。
本文首发于微信公众号:出新研究。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。
-
行业前沿|生成式 AI 的人力和环境成本不断上升,未来何去何从?“地球影响、不断上升的财务成本和人力成本都是诱因。作者:SashaLuccioni|编译:Poetry|近几个月来
-
热文:德德玛的歌曲大全100首我从草原来_我从草原来 德德玛演唱歌曲1、《我从草原来》是德德玛演唱的歌曲,由纪征民填词,王星铭谱曲。2、王晓峰编曲,于2005年9月5日发行,收
-
六户地镇召开爱国卫生暨推进国家卫生县创建工作动员会中新网新疆新闻4月14日电 近日,六户地镇组织镇党委领导班子、“访惠聚”第一书记、村“两委”干部、人居
-
当前要闻:大V代客理财 ,多人巨亏!宝妈300万买房款几近亏光!当事人详述“惨剧”始末……多位投资人将证券账户交给大V“思辰超短逻辑”(以下简称思辰)打理,均遭受了大幅亏损。“亏掉的这300多万
-
热文:通城公安探索民生案件“快侦快破快返”机制,迅速破获盗窃案通城公安探索民生案件“快侦快破快返”机制,迅速破获盗窃案---通城公安始终以“小案不小、全力以赴”的决
-
7位数存款5年未动,电话空号,银行紧急寻人!4月13日, 银行发现7位数存款5年未动急寻人 的话题登上热搜,啥情况? 据河南电视台民生频道《小莉帮忙》报
-
吴尊友:全球新冠大流行已趋于结束是什么情况_头条焦点吴尊友:全球新冠大流行已趋于结束今天的热度非常高,现在也是在热搜榜上了,那么具体的吴尊友:全球新冠大
-
男女朋友第一次见面送什么礼物|今日精选第一次和女友见面,应该是正式见面,第一次见面不是应该给对方准备一份礼物,这是第一次次见面的。可以在待
-
【环球快播报】两家中国船厂又获8艘化学品船订单!英国船东再下单近日,英国船东UnionMaritime接连在两家中国船厂下单订造8艘18500载重吨化学品船,总价值达2 4亿美元(约合
-
消息!诺森德怎么去艾泽拉斯_诺森德怎么去1、还没开,游是肯定不行首先是人的疲劳死然后灵魂也不断的疲劳死,是肯定游不到的。
-
精彩看点:新城控股集团毛利率企稳,经营性现金流连续5年为正3月31日,新城控股(601155 SH)发布2022年年度报告。报告显示,2022年全年新城控股实现营业收入1154 57亿
-
当前热讯:这个“狱龄”20多年的老偷再次落网扬子晚报网4月14日讯(通讯员李杨记者陈咏)高邮警方14日通报一起惯犯盗窃案。该市公安局龙虬派出所抓获的
-
天天微资讯!南合文斗的歌曲 南合文斗今天来聊聊关于南合文斗的歌曲,南合文斗的文章,现在就为大家来简单介绍下南合文斗的歌曲,南合文斗,希望
-
ROG玩家国度“超神进化”线上发布会推出腾讯ROG游戏手机7系列新品|焦点热文2023年4月13日20点——ROG玩家国度今天在“超神进化”发布会上宣布了全新的腾讯ROG7系列游戏手机。腾讯ROG
-
当前速读:湖南县域高中“徐特立项目”启动!2年投资20亿建100所华声在线4月14日讯(全媒体记者杨斯涵黄京)改善办学条件,提高办学质量,扩大优质公办高中教育资源供给,
-
全球观点:美国商业地产危机怎么解决?这位大佬说:把办公室都推平!曾准确预言2008年次贷危机并趁机做空一举成名的KyleBass认为,需要拆除美国城市中的办公楼,因为需求没有恢
-
国家安全教育进校园_环球信息13日,“国家安全我先行”飞行棋争霸赛及国家安全教育主题观摩课在福州八中初中部举行,让全民国家安全教育
-
赫顿:亨德森还会留在红军多年,之后范迪克会接任队长 今日讯前热刺后卫赫顿接受了媒体的采访,被问及亨德森离队后谁将继任利物浦队长,赫顿发表了他的看法。赫顿表示:
-
环球时讯:AB角制(ab角)1、“AB角制度”就是A角对某项工作主要负责,B角应主动熟悉并协助做好该项工作,当A角出差或其他原因不能承
-
天蝎座的守护神视频_天蝎座的守护神 今日要闻1、哈迪斯是希腊神话中的冥神,朱庇特的哥哥。2、与朱庇特比拟,哈迪斯要有定力患上多,也深邃深厚患上多。
-
世界微速讯:甲流后,佛山6岁女童走路一瘸一拐!已出现多个病例,医生提醒检查结果发现小童的肌酸激酶和肌酸激酶同工酶的指标高于正常值的16倍综合病史、临床表现和检查结果最终确诊
-
选择大城市逐梦还是小城市安稳前不久有位读者提了个关于offer选择的问题,他的背景还是不错的,本科中流985,保研到了top2,研究方向是和
-
科伦药业(002422):预计公司与科伦斗山2023年度日常采购关联交易情况的公告4月13日,科伦药业发布预计公司与科伦斗山2023年度日常采购关联交易情况的公告。前次日常关联交易的预计和
-
注意!郑州东站附近别“违停”了郑州东站附近别违法停放车辆了!4月13日,为进一步规范辖区车辆停放秩序,减少道路交通安全隐患,郑州东站
-
中选药品平均降价56%,第八批国家药品集采预计每年可节省167亿元-当前关注中选药品平均降价56%,第八批国家药品集采预计每年可节省167亿元
-
速看:浙江发布入汛信息:超警洪水概率较大、山洪风险较高中新社杭州4月13日电(钱晨菲)记者13日从浙江省水利厅获悉,4月15日浙江将正式入汛。经最新会商研判,今年梅
-
新材料将节能效果提高10至20倍 成本降低20%至40%采用自主研发技术,开发出一种真空绝热复合材料,节能效果较传统保温材料提高10—20倍……近日,南京工业大
-
安信证券给予润建股份买入评级,三大业务齐头并进带动业绩增长,2023年Q1盈利能力快速回升,目标价格为50.83元安信证券04月13日发布研报称,给予润建股份(002929 SZ,最新价:42 87元)买入评级,目标价格为50 83元。评
-
每日动态!高通和小米在全球范围展示移动端米级定位,带来卓越定位体验要点:高通技术公司和小米公司在德国,利用搭载第一代骁龙& 174;8+移动平台的小米12TPro成功验证米级定位。
-
环球消息!拳皇98双人对打技巧 拳皇98双人对打今天来聊聊关于拳皇98双人对打技巧,拳皇98双人对打的文章,现在就为大家来简单介绍下拳皇98双人对打技巧,