As CPUs estão ficando mais rápidas ao longo dos anos graças a componentes cada vez menores. Mas como estamos indo para o limite de quão pequenos circuitos podem chegar, para onde vamos? Uma resposta é fazer com que seus chips tenham um tamanho “escala de wafer”.
Índice
O que é “escala de bolacha”?
Dispositivos de circuito integrado, como CPUs, são criados a partir de cristais de silício. Para criar um dispositivo, um enorme cristal de silício cilíndrico é cortado em wafers circulares. Vários chips são então gravados na superfície do wafer. Uma vez que os chips estão prontos, eles são testados para encontrar unidades defeituosas, e essas são marcadas.
Os chips de trabalho são cortados do wafer e embalados como produtos finais para serem vendidos. O “rendimento” é o número de chips de trabalho que você obtém de um wafer. Qualquer parte da bolacha que é desperdiçada devido a falhas nos chips ou porque é um corte, tem que ser recuperada pelo dinheiro ganho com os chips de trabalho.
Um chip de escala de wafer usa todo o wafer para um único processador. Parece uma ótima ideia, mas houve alguns problemas sérios.
Chips em escala de wafer pareciam impossíveis
Houve algumas tentativas de “integrar” uma pastilha de silício inteira ao longo dos anos. O problema é que o processo usado para fazer microchips é imperfeito. Em qualquer wafer completo, é provável que haja falhas.
Se você imprimiu várias cópias do mesmo chip em um wafer, alguns quebrados não são o fim do mundo. No entanto, uma única CPU precisa ser impecável para funcionar. Então, se você tentasse integrar o wafer inteiro, essas falhas inevitáveis tornariam o chip gigante inteiro inútil.
Para contornar esse problema, os engenheiros tiveram que repensar como projetar um processador massivo que deveria funcionar como uma unidade integrada. Até agora, apenas uma empresa conseguiu fazer um processador em escala de wafer e teve que resolver sérios problemas técnicos para que isso acontecesse.
O Cerebras WSE-2
O Wafer-Scale Engine 2 da Cerebras Systems é um chip absolutamente massivo. Ele usa um processo de 7 nm, que é semelhante aos chips de 7 e 5 nanômetros que estão em vários dispositivos, como smartphones, laptops e computadores de mesa.
O WSE-2 foi projetado como uma malha de núcleos que estão todos conectados uns aos outros por uma enorme grade de interconexões de alta velocidade. Essa rede de módulos de núcleo de processador pode se comunicar, mesmo que alguns núcleos estejam com defeito. O WSE é projetado de forma que haja mais núcleos do que o anunciado, de acordo com o rendimento esperado de cada wafer. Isso significa que, embora cada chip tenha defeitos, eles não afetam em nada o desempenho projetado.
O WSE-2 foi projetado especificamente para acelerar aplicativos de IA que usam uma técnica de aprendizado de máquina conhecida como “ aprendizagem profunda ”. Comparado aos supercomputadores atuais usados para tarefas de aprendizado profundo, o WSE-2 é muito mais rápido, usando menos energia.
As vantagens das CPUs em escala Wafer
CPUs em escala de wafer resolvem muitos dos problemas com o design atual do supercomputador. Os supercomputadores são construídos a partir de muitos computadores menores e mais simples que estão conectados em rede. Ao projetar cuidadosamente as tarefas para esse tipo de projeto, é possível adicionar todo esse poder de computação.
No entanto, cada computador nessa matriz de supercomputadores precisa de seus próprios componentes de suporte, e aumentar a distância entre os vários pacotes de CPU individuais nessa rede apresenta muitos problemas de desempenho e limita os tipos de cargas de trabalho que podem ser feitas em tempo real.
Uma CPU em escala de wafer combina efetivamente o poder de processamento de dezenas ou centenas de computadores em um único circuito integrado, acionado por uma fonte de alimentação, todos alojados em um único chassi. Melhor ainda, você ainda pode conectar em rede vários computadores em escala de wafer para criar um supercomputador tradicional, mas exponencialmente mais rápido.
CPUs de escala Wafer para o resto de nós?
É improvável que tenhamos qualquer tipo de produto em escala de wafer para usuários regulares que não estão tentando construir um supercomputador, mas há elementos da filosofia “quanto maior melhor” evidentes também em eletrônicos de consumo.
Um ótimo exemplo é o system-on-a-chip (SoC) M1 Ultra da Apple , que são dois SoCs M1 Max conectados por uma interconexão de alta velocidade, que se apresenta como um único sistema com o dobro de recursos.
Os designs de CPU da AMD também aproveitaram os “ chilets ”, que são unidades de núcleo de CPU que podem ser feitas independentemente e depois “coladas” usando outro tipo de interconexão de alta velocidade. Agora que os circuitos podem parar de ficar menores nas CPUs, chegou a hora de construí-los e talvez até para cima, com projetos de circuitos 3D complexos, em vez dos circuitos 2D mais comuns que usamos hoje.