A sede de água da IA é alarmante, mas pode se resolver sozinha
Comentário Antes um assunto abstrato de ficção científica e pesquisa acadêmica, o conceito de inteligência artificial se tornou o tópico de conversas à mesa de jantar nos últimos dois anos.
Essa mudança trouxe ampla conscientização sobre as implicações ambientais dessa tecnologia, mais proeminentemente centradas nas enormes somas de energia e água necessárias para treinar e implantar esses modelos. E é compreensível o porquê.
Um recente relatório descobriram que o consumo de água em data centers no norte da Virgínia, a capital mundial dos bit celeiros, aumentou em dois terços nos últimos cinco anos.
“O ChatGPT precisa ‘beber’ uma garrafa de 500 ml de água para uma conversa simples de aproximadamente 20 a 50 perguntas e respostas, dependendo de quando e onde o ChatGPT for implantado”, estimaram os pesquisadores em um artigo publicado no início do ano passado.
Para piorar a situação, isso foi para um modelo de classe GPT-3 medindo aproximadamente 175 bilhões de parâmetros, um número que parece positivamente pequeno para os padrões de hoje. Estima-se que o GPT-4 tenha algo entre 1,7 e 1,8 trilhão de parâmetros em tamanho e, como Trevor Cai da OpenAI colocou em sua palestra Hot Chips na semana passada, esses modelos só vão ficar maiores.
Embora isso não seja um bom presságio para o consumo de energia do datacenter, o mesmo pode não ser verdade para seu H2Ó vício. Pelo menos, não precisa ser.
Primeiro, vamos esclarecer algo antes que os comentários apontem o óbvio. Os data centers não consomem água de verdade. O problema real é que a água está sendo removida do ambiente local em vez de ser devolvida à sua fonte. Segundo, a infraestrutura de TI, relacionada à IA ou não, não é realmente o que está consumindo a água.
Mesmo quando resfriados a líquido, esses sistemas são geralmente circuitos fechados que perdem pouca ou nenhuma quantidade apreciável de fluidos durante a operação normal. O que está realmente devorando todo esse H2O são os manipuladores de ar do celeiro, geralmente chamados de resfriadores evaporativos ou de pântano, usados para evitar que esses sistemas superaqueçam.
No entanto, é importante notar que esta é uma decisão de design e os resfriadores evaporativos não são usados em todas as instalações. Se a Meta ou a Amazon estiverem montando um datacenter de IA no seu quintal, eles colocarão uma pressão na sua rede elétrica local, mas isso não significa necessariamente que eles vão chupar um quarto do abastecimento de água da sua cidade, como o Google faz em The Dalles, Oregon.
Em climas mais frios, resfriadores secos e o chamado “free cooling” são adequados, enquanto em regiões mais quentes e propensas à seca, não é incomum ver operadores de DC optarem por sistemas baseados em refrigerantes. A última vez que ouvimos, é exatamente isso que a Microsoft está fazendo com seus desenvolvimentos de DC em Goodyear, Arizona, embora somente após um disputa de águas residuais com a cidade.
Embora existam alternativas ao arrefecimento evaporativo, muitas delas têm como custo um maior consumo de energia, um bem já escasso, como a CBRE referiu recentemente. relatado.
Embora haja muito pouco a ser feito em relação às instalações de CD existentes, a decisão de empregar resfriamento evaporativo em novas construções se resume, em última análise, à ganância ou, para usar a linguagem politicamente correta, ao capitalismo.
Para os hiperescaladores em particular, tudo eventualmente se resume a margens. Se você puder fazer algo 5% mais barato ou mais eficientemente do que a concorrência, você pode lucrar muito mais, ou subcotá-los e conquistar sua base de clientes. E a água simplesmente é incrivelmente eficiente em retirar calor do ar em comparação com tecnologias alternativas. Isso significa menores custos de eletricidade ou a capacidade de construir instalações maiores e mais densas em locais com restrições de energia.
Mesmo em taxas industriais, os custos de eletricidade aumentam rapidamente. Então, em mercados onde os resfriadores evaporativos são viáveis, a tecnologia oferece uma vantagem competitiva.
Também pode ser argumentado que o consumo de água do refrigerador evaporativo é uma troca que vale a pena se isso significa queimar menos combustíveis fósseis para manter as luzes acesas, mas isso depende muito da localização. A natureza do resfriamento evaporativo significa que eles são mais eficientes em climas áridos, onde a água já é um recurso escasso.
No final das contas, tudo se resume a isso: você pode usar mais energia ou consumir mais água. Se a água for mais barata que a energia e, melhor ainda, percebida como abundante, como ao redor dos Grandes Lagos, você pode adivinhar quais operadores vão escolher.
No entanto, isso pode estar mudando. O ritmo da inovação em IA não parece que vai diminuir tão cedo. Neste clima, vimos chips ficarem cada vez mais quentes, passando da marca de um quilowatt, e impulsionando uma transição para o resfriamento líquido.
Os superchips Grace Blackwell da Nvidia que nós olhou para de volta à GTC são classificados para 2.700 W com dois deles projetados para caber em um único chassi RU. Para acomodar esse pacote incrivelmente denso, a Nvidia, sem surpresa, optou por resfriamento líquido direto (DLC).
Embora indiscutivelmente melhor em termos de eficiência operacional – o DLC é substancialmente mais energia eficiente do que queimar energia em ventiladores – também representa grandes dores de cabeça para os operadores de datacenters, pois muitas instalações mais antigas não podem ser adaptadas para acomodar essa tecnologia facilmente.
Embora isso seja uma dor de cabeça para alguns, a adoção generalizada do resfriamento líquido, talvez ironicamente, tem o potencial de cortar o consumo de água a longo prazo. Isso porque o coeficiente térmico mais alto do resfriamento líquido permite o uso de resfriadores secos, que funcionam um pouco como o radiador de um carro, mas em escala industrial.
Há também o potencial para reutilização de calor nesses cenários. Em um experimento mental apresentado no SC23, estimou-se que treinar um modelo do tamanho de um GPT-3 poderia gerar calor suficiente para sustentar cerca de 4,6 estufas e cultivar mais de um milhão de tomates. Vimos outros exemplos de data centers contribuindo também para redes de aquecimento urbano.
No entanto, até que uma massa crítica de sistemas de refrigeração líquida seja implantada, provavelmente continuaremos vendo manchetes sobre o consumo de água em data centers, para melhor ou para pior. ®