Categories: Tecnologia

Como calcular um Z-Score usando o Microsoft Excel

Um Z-Score é um valor estatístico que informa quantos desvios padrão um determinado valor ocorre em relação à média de todo o conjunto de dados. Você pode usar as fórmulas AVERAGE e STDEV.S ou STDEV.P para calcular a média e o desvio padrão de seus dados e, em seguida, usar esses resultados para determinar o Z-Score de cada valor.

O que é um Z-Score e o que as funções AVERAGE, STDEV.S e STDEV.P fazem?

Um Z-Score é uma maneira simples de comparar valores de dois conjuntos de dados diferentes. É definido como o número de desvios padrão da média em que se encontra o ponto de dados. A fórmula geral é semelhante a esta:

= (DataPoint-AVERAGE (DataSet)) / STDEV (DataSet)

Aqui está um exemplo para ajudar a esclarecer. Digamos que você queira comparar os resultados do teste de dois alunos de álgebra ensinados por professores diferentes. Você sabe que o primeiro aluno teve 95% no exame final em uma classe e o aluno na outra classe teve 87%.

À primeira vista, a nota de 95% é mais impressionante, mas e se o professor da segunda classe desse um exame mais difícil? Você pode calcular o Z-Score da pontuação de cada aluno com base nas pontuações médias em cada classe e no desvio padrão das pontuações em cada classe. A comparação dos Z-Scores dos dois alunos pode revelar que o aluno com a pontuação de 87% se saiu melhor em comparação com o resto da classe do que o aluno com a pontuação de 98% em comparação com o resto da classe.

O primeiro valor estatístico de que você precisa é a ‘média’ e a função “AVERAGE” do Excel calcula esse valor. Ele simplesmente soma todos os valores em um intervalo de células e divide essa soma pelo número de células que contêm valores numéricos (ele ignora células em branco).

O outro valor estatístico de que precisamos é o ‘desvio padrão’ e o Excel tem duas funções diferentes para calcular o desvio padrão de maneiras ligeiramente diferentes.

As versões anteriores do Excel tinham apenas a função “STDEV”, que calcula o desvio padrão enquanto trata os dados como uma ‘amostra’ de uma população. O Excel 2010 dividiu isso em duas funções que calculam o desvio padrão:

  • STDEV.S: Esta função é idêntica à função anterior “STDEV”. Ele calcula o desvio padrão enquanto trata os dados como uma ‘amostra’ de uma população. Uma amostra de uma população pode ser algo como os mosquitos coletados para um projeto de pesquisa ou carros que foram separados e usados ​​para testes de segurança em colisões.
  • STDEV.P: Esta função calcula o desvio padrão enquanto trata os dados como a população inteira. Uma população inteira seria algo como todos os mosquitos da Terra ou cada carro em uma produção de um modelo específico.

O que você escolhe é baseado em seu conjunto de dados. A diferença normalmente será pequena, mas o resultado da função “STDEV.P” será sempre menor do que o resultado da função “STDEV.S” para o mesmo conjunto de dados. É uma abordagem mais conservadora presumir que há mais variabilidade nos dados.

Vejamos um exemplo

Para o nosso exemplo, temos duas colunas (“Valores” e “Z-Score”) e três células “auxiliares” para armazenar os resultados das funções “MÉDIA”, “DESVPAD.S” e “DESVPAD.P”. A coluna “Valores” contém dez números aleatórios centralizados em torno de 500, e a coluna “Z-Score” é onde calcularemos o Z-Score usando os resultados armazenados nas células ‘auxiliares’.

Primeiro, vamos calcular a média dos valores usando a função “AVERAGE”. Selecione a célula onde irá armazenar o resultado da função “AVERAGE”.

Digite a seguinte fórmula e pressione Enter -ou- use o menu “Fórmulas”.

= MÉDIA (E2: E13)

Para acessar a função através do menu “Fórmulas”, selecione o menu suspenso “Mais Funções”, selecione a opção “Estatística” e clique em “MÉDIA”.

Na janela Argumentos da função, selecione todas as células na coluna “Valores” como entrada para o campo “Número1”. Você não precisa se preocupar com o campo “Número2”.

Agora pressione “OK”.

A seguir, precisamos calcular o desvio padrão dos valores usando a função “STDEV.S” ou “STDEV.P”. Neste exemplo, mostraremos como calcular os dois valores, começando com “STDEV.S.” Selecione a célula onde o resultado será armazenado.

Para calcular o desvio padrão através da função “STDEV.S”, digite esta fórmula e pressione Enter (ou acesse através do menu “Fórmulas”).

= STDEV.S (E3: E12)

Para acessar a função através do menu “Fórmulas”, selecione a lista suspensa “Mais Funções”, selecione a opção “Estatística”, role um pouco para baixo e clique no comando “STDEV.S”.

Na janela Argumentos da função, selecione todas as células na coluna “Valores” como entrada para o campo “Número1”. Você também não precisa se preocupar com o campo “Número2” aqui.

Agora pressione “OK”.

A seguir, calcularemos o desvio padrão usando a função “STDEV.P”. Selecione a célula onde o resultado será armazenado.

Para calcular o desvio padrão através da função “STDEV.P”, digite esta fórmula e pressione Enter (ou acesse através do menu “Fórmulas”).

= STDEV.P (E3: E12)

Para acessar a função através do menu “Fórmulas”, selecione o menu suspenso “Mais Funções”, selecione a opção “Estatística”, role um pouco para baixo e clique na fórmula “STDEV.P”.

Na janela Argumentos da função, selecione todas as células na coluna “Valores” como entrada para o campo “Número1”. Novamente, você não precisa se preocupar com o campo “Número2”.

Agora pressione “OK”.

Agora que calculamos a média e o desvio padrão de nossos dados, temos tudo o que precisamos para calcular o Z-Score. Podemos usar uma fórmula simples que faz referência às células que contêm os resultados das funções “AVERAGE” e “STDEV.S” ou “STDEV.P”.

Selecione a primeira célula na coluna “Z-Score”. Usaremos o resultado da função “STDEV.S” para este exemplo, mas você também pode usar o resultado de “STDEV.P.”

Digite a seguinte fórmula e pressione Enter:

= (E3- $ G $ 3) / $ H $ 3

Como alternativa, você pode usar as seguintes etapas para inserir a fórmula em vez de digitar:

  1. Clique na célula F3 e digite =(
  2. Selecione a célula E3. (Você pode pressionar a tecla de seta para a esquerda uma vez ou usar o mouse)
  3. Digite o sinal de menos -
  4. Selecione a célula G3 e pressione F4 para adicionar os caracteres “$” para fazer uma referência ‘absoluta’ à célula (ela percorrerá “G3”> “ $ G $ 3 ″>“ G $ 3 ″> “ $ G3 ″> “G3” se continuar pressionando F4 )
  5. Tipo )/
  6. Selecione a célula H3 (ou I3 se estiver usando “STDEV.P”) e pressione F4 para adicionar os dois caracteres “$”.
  7. pressione Enter

O Z-Score foi calculado para o primeiro valor. É 0,15945 desvios padrão abaixo da média. Para verificar os resultados, você pode multiplicar o desvio padrão por este resultado (6,271629 * -0,15945) e verificar se o resultado é igual à diferença entre o valor e a média (499-500). Ambos os resultados são iguais, então o valor faz sentido.

Vamos calcular os Z-Scores do restante dos valores. Realce toda a coluna ‘Z-Score’ começando com a célula que contém a fórmula.

Pressione Ctrl + D, que copia a fórmula da célula superior para baixo por todas as outras células selecionadas.

Agora, a fórmula foi ‘preenchida’ para todas as células, e cada uma sempre fará referência às células corretas “AVERAGE” e “STDEV.S” ou “STDEV.P” por causa dos caracteres “$”. Se você receber erros, volte e certifique-se de que os caracteres “$” estão incluídos na fórmula que você inseriu.

Calculando o Z-Score sem usar células ‘Helper’

As células auxiliares armazenam um resultado, como as que armazenam os resultados das funções “AVERAGE,” “STDEV.S,” e “STDEV.P”. Eles podem ser úteis, mas nem sempre são necessários. Você pode ignorá-los completamente ao calcular um Z-Score usando as seguintes fórmulas generalizadas.

Aqui está um usando a função “STDEV.S”:

= (Valor-MÉDIA (valores)) / STDEV.S (valores)

E um usando a função “STEV.P”:

= (Valor-MÉDIA (Valores)) / STDEV.P (Valores)

Ao inserir os intervalos de células para os “Valores” nas funções, certifique-se de adicionar referências absolutas (“$” usando F4) para que quando você ‘preencher’ não esteja calculando a média ou o desvio padrão de um intervalo diferente de células em cada fórmula.

Se você tiver um grande conjunto de dados, pode ser mais eficiente usar células auxiliares porque ele não calcula o resultado das funções “MÉDIA” e “DESVPAD.S” ou “DESVPAD.P” a cada vez, economizando recursos do processador e acelerando o tempo que leva para calcular os resultados.

Além disso, “$ G $ 3” leva menos bytes para armazenar e menos RAM para carregar do que “AVERAGE ($ E $ 3: $ E $ 12).”. Isso é importante porque a versão padrão de 32 bits do Excel é limitada a 2 GB de RAM (a versão de 64 bits não tem nenhuma limitação na quantidade de RAM que pode ser usada).

maisroot

Recent Posts

O novo aplicativo “PC Manager” da Microsoft se parece muito com o CCleaner

Muitos aplicativos de limpeza estão disponíveis para Windows ao longo dos anos, mas hoje em…

1 ano ago

Como reiniciar um PS4

Seu PlayStation 4 está congelado? Seus jogos favoritos continuam travando? Reiniciar seu PS4 pode resolver…

1 ano ago

Veja por que as reticências são tão assustadoras ao enviar mensagens de texto…

A popularidade das mensagens de texto significou aprender uma forma totalmente nova de comunicação. Você…

1 ano ago

O telescópio James Webb acaba de capturar os “Pilares da Criação”

A foto dos "Pilares da Criação" tirada pelo Telescópio Espacial Hubble é uma das fotos…

1 ano ago

Você poderá baixar o Proton Drive mais cedo do que pensa

O Proton Drive saiu de seu estágio beta há algumas semanas, mas o aplicativo real…

1 ano ago

Como aumentar o zoom no Photoshop

Para ver suas fotos mais de perto ou para uma edição precisa , você pode…

1 ano ago