Os computadores geram números aleatórios para tudo, desde criptografia a videogames e jogos de azar. Existem duas categorias de números aleatórios – números aleatórios “verdadeiros” e números pseudo-aleatórios – e a diferença é importante para a segurança dos sistemas de criptografia.
Os computadores podem gerar números verdadeiramente aleatórios observando alguns dados externos, como movimentos do mouse ou ruído do ventilador, o que não é previsível, e criando dados a partir deles. Isso é conhecido como entropia. Outras vezes, eles geram números “pseudoaleatórios” usando um algoritmo para que os resultados pareçam aleatórios, embora não sejam.
Este tópico se tornou mais controverso recentemente, com muitas pessoas questionando se o chip gerador de número aleatório de hardware integrado da Intel é confiável. Para entender por que ele pode não ser confiável, você terá que entender como os números aleatórios são gerados em primeiro lugar e para que são usados.
Índice
Para que os números aleatórios são usados
Os números aleatórios têm sido usados por muitos milhares de anos. Quer seja jogar uma moeda ou jogar um dado, o objetivo é deixar o resultado final ao acaso. Os geradores de números aleatórios em um computador são semelhantes – eles são uma tentativa de alcançar um resultado aleatório imprevisível.
Os geradores de números aleatórios são úteis para muitos propósitos diferentes. Além de aplicações óbvias, como a geração de números aleatórios para fins de jogos de azar ou a criação de resultados imprevisíveis em um jogo de computador, a aleatoriedade é importante para a criptografia.
A criptografia requer números que os invasores não conseguem adivinhar. Não podemos simplesmente usar os mesmos números continuamente. Queremos gerar esses números de uma forma muito imprevisível para que os invasores não possam adivinhá-los. Esses números aleatórios são essenciais para a criptografia segura, quer você esteja criptografando seus próprios arquivos ou apenas usando um site HTTPS na Internet.
Números Aleatórios Verdadeiros
Você pode estar se perguntando como um computador pode realmente gerar um número aleatório. De onde vem essa “aleatoriedade”. Se for apenas um pedaço de código de computador, não é possível que os números que o computador gera sejam previsíveis?
Geralmente agrupamos os números aleatórios gerados pelos computadores em dois tipos, dependendo de como eles são gerados: números aleatórios “verdadeiros” e números pseudoaleatórios.
Para gerar um número aleatório “verdadeiro”, o computador mede algum tipo de fenômeno físico que ocorre fora do computador. Por exemplo, o computador pode medir a decadência radioativa de um átomo. De acordo com a teoria quântica, não há como saber com certeza quando ocorrerá o decaimento radioativo, então isso é essencialmente “pura aleatoriedade” do universo. Um invasor não seria capaz de prever quando o decaimento radioativo ocorreria, então eles não saberiam o valor aleatório.
Para um exemplo mais cotidiano, o computador pode contar com o ruído atmosférico ou simplesmente usar o momento exato em que você pressiona as teclas do teclado como uma fonte de dados imprevisíveis ou entropia. Por exemplo, seu computador pode notar que você pressionou uma tecla exatamente a 0,23423523 segundos após as 14h. Pegue o suficiente dos tempos específicos associados a esses pressionamentos de tecla e você terá uma fonte de entropia que pode usar para gerar um número aleatório “verdadeiro”. Você não é uma máquina previsível, então um invasor não consegue adivinhar o momento preciso em que você pressiona essas teclas. O dispositivo / dev / random no Linux , que gera números aleatórios, “bloqueia” e não retorna um resultado até que reúna entropia suficiente para retornar um número verdadeiramente aleatório.
Números Pseudo-Aleatórios
Os números pseudoaleatórios são uma alternativa aos números aleatórios “verdadeiros”. Um computador pode usar um valor de semente e um algoritmo para gerar números que parecem aleatórios, mas que são de fato previsíveis. O computador não coleta dados aleatórios do ambiente.
Isso não é necessariamente uma coisa ruim em todas as situações. Por exemplo, se você estiver jogando um videogame, não importa realmente se os eventos que ocorrem naquele jogo são causados por números aleatórios “verdadeiros” ou números pseudo-aleatórios. Por outro lado, se estiver usando criptografia, você não deseja usar números pseudoaleatórios que um invasor possa adivinhar.
Por exemplo, digamos que um invasor conheça o algoritmo e o valor da semente que um gerador de números pseudo-aleatórios usa. E digamos que um algoritmo de criptografia obtenha um número pseudo-aleatório desse algoritmo e o use para gerar uma chave de criptografia sem adicionar qualquer aleatoriedade adicional. Se um invasor souber o suficiente, ele poderá retroceder e determinar o número pseudo-aleatório que o algoritmo de criptografia deve ter escolhido nesse caso, quebrando a criptografia.
O NSA e o gerador de números aleatórios de hardware da Intel
Para tornar as coisas mais fáceis para os desenvolvedores e ajudar a gerar números aleatórios seguros, os chips Intel incluem um gerador de números aleatórios baseado em hardware conhecido como RdRand. Este chip usa uma fonte de entropia no processador e fornece números aleatórios ao software quando o software os solicita.
O problema aqui é que o gerador de números aleatórios é essencialmente uma caixa preta e não sabemos o que está acontecendo dentro dela. Se o RdRand contivesse uma porta dos fundos da NSA, o governo seria capaz de quebrar as chaves de criptografia que foram geradas apenas com dados fornecidos por aquele gerador de números aleatórios.
Essa é uma preocupação séria. Em dezembro de 2013, os desenvolvedores do FreeBSD removeram o suporte para o uso do RdRand diretamente como uma fonte de aleatoriedade, dizendo que não podiam confiar nele. [ Fonte ] A saída do dispositivo RdRand seria alimentada em outro algoritmo que adiciona entropia adicional, garantindo que quaisquer backdoors no gerador de números aleatórios não importariam. O Linux já funcionava dessa forma, randomizando ainda mais os dados aleatórios vindos do RdRand para que não fossem previsíveis mesmo que houvesse um backdoor. [ Fonte ] Em um recente AMA (“Ask Me Anything”) no Reddit, o CEO da Intel, Brian Krzanich, não respondeu a perguntas sobre essas preocupações. [ Fonte ]
Claro, isso provavelmente não é apenas um problema com os chips Intel. Os desenvolvedores do FreeBSD também chamavam os chips da Via pelo nome. Essa controvérsia mostra porque é tão importante gerar números aleatórios que sejam verdadeiramente aleatórios e não previsíveis.
Para gerar números aleatórios “verdadeiros”, os geradores de números aleatórios reúnem “entropia” ou dados aparentemente aleatórios do mundo físico ao seu redor. Para números aleatórios que realmente não precisam ser aleatórios, eles podem apenas usar um algoritmo e um valor inicial.
Crédito da imagem: rekre89 no Flickr , Lisa Brewster no Flickr , Ryan Somma no Flickr , huangjiahui no Flickr