GPUs são monolíticas; os fabricantes criam toda a GPU como um grande chip. Está se tornando mais difícil criar transistores menores, então os dias dos enormes chips GPU podem acabar em breve. Em vez disso, o futuro pode estar com o Módulo Multi-Chip (MCM).
Índice
O que é uma GPU MCM?
O conceito de GPU MCM é simples. Em vez de um grande chip GPU contendo todos os elementos de processamento, você tem várias unidades GPU menores conectadas entre si usando um sistema de conexão de largura de banda extremamente alta, às vezes chamado de “fabric”. Isso permite que os módulos se comuniquem entre si como se fizessem parte de uma GPU monolítica.
Criar módulos de GPU menores e uni-los é vantajoso em relação à abordagem monolítica. Para começar, você esperaria obter melhores rendimentos de cada wafer de silício , já que uma falha arruinaria apenas um módulo, em vez de uma GPU inteira. Isso poderia levar a GPUs mais baratas e tornar o dimensionamento de desempenho muito mais fácil. Se você quiser uma placa gráfica mais rápida, basta adicionar mais módulos!
Alguém se lembra de SLI e Crossfire?
A ideia de usar vários chips para impulsionar não é nova. Você deve se lembrar de uma época em que os PCs para jogos mais rápidos usavam várias placas gráficas conectadas entre si. A solução da NVIDIA era conhecida como SLI (Scalable Link Interface), e a AMD tinha Crossfire.
O dimensionamento de desempenho nunca foi perfeito, com a segunda placa adicionando talvez 50-70% de desempenho em média. O principal problema era encontrar uma maneira de dividir a carga de renderização entre duas ou mais GPUs. Esta é uma tarefa complexa, e tanto o SLI quanto o Crossfire tinham largura de banda limitada.
Houve também várias falhas gráficas e problemas de desempenho que resultaram desta abordagem. Micro-gagueiras eram galopantes no apogeu do SLI. Hoje em dia, você não encontrará esse recurso em GPUs de consumo e, graças à forma como os pipelines de renderização funcionam em jogos, o SLI não é mais viável. Placas topo de linha como a RTX 3090 ainda possuem NVLink, para conectar várias placas, mas isso é para cargas de trabalho GPGPU especiais , em vez de renderização em tempo real.
As GPUs MCM apresentam software como jogos ou software gráfico como uma única GPU monolítica. Todo o balanceamento de carga e coordenação são gerenciados no nível do hardware, portanto, os velhos tempos do SLI não devem retornar.
Já aconteceu com CPUs
Se a ideia de um MCM parece familiar, é porque esse tipo de tecnologia já é comum em CPUs. Especificamente, a AMD é conhecida por ser pioneira em designs de “chiplet” , onde suas CPUs são feitas de vários módulos conectados por “tecido infinito”. A Intel também cria produtos baseados em chips desde 2016 .
O Apple Silicon possui uma GPU MCM?
Os chips Apple Silicon mais recentes contêm várias GPUs independentes, portanto, não é incorreto considerá-los um exemplo de tecnologia de GPU MCM. Considere o Apple M1 Ultra , que é literalmente dois chips M1 Max colados por uma interconexão de alta largura de banda. Embora o Ultra contenha duas GPUs M1 Max, eles apresentam uma única GPU para qualquer software executado em seu Mac.
Esta abordagem de criar chips maiores e melhores colando vários módulos SoC (System on a Chip) provou ser bastante eficaz para a Apple!
A tecnologia MCM está chegando
No momento em que este artigo foi escrito, a próxima geração de GPUs era RDNA 3 da AMD e a série RTX 40 da NVIDIA. Vazamentos e rumores indicam uma forte chance de que RDNA 3 seja uma GPU MCM e os mesmos rumores abundam sobre as futuras GPUs da NVIDIA .
Isso significa que podemos estar à beira de um grande salto no desempenho da GPU, juntamente com uma potencial queda no preço, à medida que os rendimentos melhoram, reduzindo o preço das placas principais ou de última geração.