As GPUs se desgastam com o uso intenso?

Uma placa GPU em um fundo azul
Maxx-Studio/Shutterstock.com

Se você planeja fazer jogos intensivos, computação de GPU, renderização gráfica,  Folding@home ou mineração de criptografia em sua placa gráfica, pode estar preocupado que sua GPU se desgaste com o uso pesado. Mas será? Nós investigaremos.

Sim, mas é complicado

A maioria das informações sobre a vida útil das placas gráficas que você encontrará on-line é anedótica, com números que podem variar drasticamente dependendo de para quem você pergunta. Com centenas de modelos diferentes de placas gráficas lançados na última década, é difícil resumir dados de placas tão diferentes em simples generalizações.

Até agora, sabemos disso: de acordo com um relatório de 2020 de um varejista alemão , as placas gráficas mais recentes têm uma taxa de falha de cerca de 2-5% (medida em retornos ao varejista) em geral. E em 2021, a Nvidia ainda forneceu atualizações de driver para placas com cerca de 9 a 10 anos (como a série GTX 600), então você pode esperar uma década de uso de uma placa GPU bem tratada – embora isso possa ser outliers, como veremos adiante.

Independentemente dos números, há alguma física difícil em ação. Os materiais e componentes usados ​​na composição das placas de GPU não são mágicos: quanto mais você os usa, mais rápido as peças se degradam e é mais provável que falhem completamente. Portanto, o uso pesado afeta a vida útil.

Várias placas de GPU em um minerador de criptografia.
Como você verá, a mineração de criptografia diminuirá a vida útil de uma placa gráfica. socrates471/Shutterstock.com

Se você verá uma falha em sua placa de GPU depende de variáveis ​​muito diferentes, incluindo exatamente com que intensidade a GPU foi usada, a natureza e o grau de oscilações de temperatura no circuito, quantas vezes a placa foi ligada e desligada, e quão limpo é o ambiente operacional.

Como uma placa de GPU é um dispositivo complexo com muitas partes, cada uma pode falhar ou se degradar de maneiras diferentes. Passaremos por várias partes importantes de uma placa de GPU e examinaremos como elas podem se desgastar com o uso pesado ao longo do tempo.

Primeiro a ir: ventiladores de refrigeração

De todas as partes de uma placa gráfica que provavelmente falharão primeiro, teríamos que apontar para as ventoinhas de resfriamento (ou ventoinha), que são peças móveis físicas. Os ventiladores mantêm sua GPU resfriada afastando o ar quente do chip da GPU (com um dissipador de calor ) para que ela possa continuar operando.

Recomendado:  Como conectar um microfone externo ao GoPro
Uma placa GPU com ventoinhas giratórias.
FeelGoodLuck/Shutterstock.com

Por que o calor é ruim? Com calor suficiente, os transistores não funcionam corretamente , o que significa que a placa GPU não funcionará. Com ainda mais calor, os transistores nos chips da placa podem ser danificados permanentemente .

Com o tempo, os ventiladores de resfriamento geralmente ficam obstruídos com poeira, reduzindo sua capacidade de mover o ar com eficiência. Ou os ventiladores podem falhar completamente se um lubrificante interno quebrar. Qualquer um dos cenários aumentará a temperatura da GPU.

Cada GPU se protege do superaquecimento usando o estrangulamento térmico , que retarda a operação da GPU para diminuir a temperatura de operação. Isso limita severamente o desempenho. Portanto, se você tiver uma GPU que de repente está mais barulhenta do que o normal (a ventoinha está girando mais rápido) ou com desempenho pior, limpe completamente as ventoinhas de refrigeração e o dissipador de calor da sua GPU com ar comprimido.

Se uma ventoinha de refrigeração da GPU falhou completamente, geralmente você pode substituí-la se encontrar uma ventoinha equivalente em um fornecedor de peças de computador.

Outro suspeito: composto térmico com defeito

Entre cada dissipador de calor e chip GPU há uma camada de material condutor térmico , como uma massa de massa ou pasta que ajuda a transferir calor do chip GPU para o dissipador de calor.

Com o tempo, a pasta térmica pode rachar ou perder potência. Quando isso acontece, o dissipador de calor não esfria com a mesma eficácia e a temperatura da GPU aumenta. Como vimos na seção de ventiladores acima, altas temperaturas da GPU resultam em limitação térmica , o que diminuirá a velocidade da sua GPU.

A melhor solução nesse cenário é substituir a pasta térmica você mesmo. Você pode comprar pasta térmica de vendedores de peças de computador.

Falhas em outros componentes, solda

Além do chip GPU, uma placa gráfica incluirá dezenas de outros componentes eletrônicos, como capacitores, resistores, chips de memória e muito mais. Qualquer um deles pode falhar devido ao uso pesado ou exposição a muito calor. Alguns são mais propensos a falhar do que outros.

Uma foto de capacitores soltos em um PCB.
Andrei Kuzmik/Shutterstock.com

Os capacitores, em particular, são propensos a falhas ao longo do tempo. Eles são sensíveis a mudanças frequentes de temperatura e alguns são defeituosos quando produzidos pela primeira vez. Se você for habilidoso o suficiente para solucionar problemas de capacitores, poderá substituir capacitores ruins em uma placa de GPU se encontrar peças de reposição equivalentes.

Recomendado:  Como alterar o endereço “Responder a” em um e-mail enviado do Outlook

Além disso, a solda que une chips e componentes à placa de circuito da placa GPU pode envelhecer e rachar com o tempo devido a mudanças frequentes de temperatura, manuseio físico inadequado, armazenamento inadequado ou aquecimento excessivo. Então, sim, o uso pesado de GPU pode aumentar os riscos de falha na junta de solda. Reparar juntas de solda ruins pode ser tecnicamente difícil, mas não é impossível .

Falhas no próprio chip GPU

Portanto, a questão permanece: um chip de GPU pode eventualmente se desgastar com o uso pesado? A resposta é sim, teoricamente, em circunstâncias extremas. Mas você provavelmente verá a falha de outro componente na placa gráfica muito antes disso.

O chip GPU em sua placa gráfica contém milhões ou bilhões de transistores, gravados em um pedaço de silício. Os transistores envelhecem com o tempo , afetando seu desempenho. Quando transistores suficientes se comportam mal, o chip falha.

De acordo com a Semiconductor Engineering , existem várias razões principais pelas quais os transistores funcionam mal ao longo do tempo devido ao envelhecimento ( um dos quais é o calor ), e os erros são mais prováveis ​​quanto menor o tamanho do recurso no chip. Especialistas suspeitam que os chips de computador fabricados hoje não durarão tanto quanto os fabricados na década de 1990, mas prever uma vida útil exata ainda é uma suposição , já que a tecnologia é muito nova.

Uma ilustração de um chip GPU.
ZinetroN/Shutterstock.com

Atualmente, a NVIDIA não publica estimativas de MTBF (tempo médio entre falhas) para suas placas gráficas de consumo, mas a empresa as  publica para alguns de seus aceleradores gráficos industriais e comerciais. Por exemplo, a folha de dados do Tesla K20X GPU Accelerator cita o MTBF para o cartão (a 35C/95F) de 14,7 anos para um “ambiente não controlado” e 23,8 anos para um “ambiente controlado”. (Observe que, geralmente, espera-se que o hardware gráfico industrial seja mais robusto e aguente melhor sob uso pesado do que o hardware gráfico do consumidor.)

Curiosamente, podemos comparar esse número teórico com dados concretos de campo. Um dos poucos estudos empíricos da vida útil da GPU é cortesia de um artigo de 2020 intitulado “ GPU Lifetimes on Titan Supercomputer: Survival Analysis and Reliability ”, de autoria do Oak Ridge National Labs. O artigo relata a confiabilidade das 18.688 placas Nvidia K20X Kepler GPU usadas no supercomputador Cray XK7 Titan , agora aposentado, durante um período de quase 7 anos (2012-2019).

Recomendado:  Como organizar manualmente os álbuns no iTunes e macOS Music
O supercomputador Cray XK7 Titan
O supercomputador Cray XK7 forneceu dados valiosos sobre a vida útil da GPU. ORNL

Após alguns contratempos iniciais devido a problemas de conexão, eles encontraram confiabilidade relativamente alta com as placas gráficas do XK7 até 2016 (cerca de 3-4 anos), quando muitas começaram a falhar. Mas adivinhem? Eles rastrearam a maioria das falhas no primeiro lote de placas (antes da substituição) a um resistor defeituoso na placa de circuito da placa gráfica, não no próprio chip da GPU. No geral, os autores do estudo descobriram que o MTBF médio das placas de GPU muito usadas do K20X é de cerca de 3 anos (não 14-23 anos, conforme citado na folha de dados da Nvidia), com algumas das placas mais quentes no núcleo falhando primeiro. Eles concluíram que “a confiabilidade da GPU depende da dissipação de calor”.

Portanto, as chances são altas de que, se você usar sua placa gráfica tão intensamente quanto um dos maiores supercomputadores do mundo (na época), ela se desgastará mais rapidamente e que outros componentes, como ventiladores e resistores, falhem muito antes do próprio chip da GPU. . Exatamente quanto tempo você terá depende de fatores que não podemos prever.

Em última análise, o calor é o inimigo

No final, de todas as fontes que lemos, o fator decisivo mais importante para a duração de uma placa de GPU é o quão quente ela funciona. Quanto mais quente o cartão, mais rápido todos os seus componentes se degradam. Além disso, quanto mais quente a placa, mais ela diminui o desempenho para evitar falhas catastróficas. Um bom resfriamento estende a vida útil do seu cartão e aumenta seu desempenho.

Portanto, se você estiver minerando criptomoedas ou jogando, se mantiver sua placa GPU razoavelmente fria com ventoinhas limpas e funcionais e pasta térmica eficaz, provavelmente terá uma placa de alto desempenho que, se tiver sorte, pode durar até torna-se obsoleto e você atualiza.

Se você planeja comprar uma GPU usada , definitivamente deve levar em consideração seu histórico, incluindo como seu proprietário a tratou e usou. Cartões mais usados ​​(que funcionam agora) provavelmente funcionarão bem no curto prazo, mas são mais propensos a falhas no longo prazo. Não podemos colocar nenhum número exato na vida útil de uma placa, mas o uso pesado definitivamente desgasta as placas gráficas mais rapidamente.

Boa sorte!