Os fenómenos que envolvem análises estatísticas caracterizam-se por suas semelhanças e variabilidades. As medidas de dispersão auxiliam as medidas de tendência central a descrever o conjunto de dados adequadamente. Indicam se os dados estão, ou não, próximos uns dos outros.
Desta forma, não há sentido calcular a média de um conjunto onde não há variação dos seus elementos. Existe ausência de dispersão e a medida de dispersão é igual a zero. Por outro lado, aumentando-se a dispersão, o valor da medida aumenta e se a variação for muito grande, a média não será uma medida de tendência central representativa.
Faz-se necessário, portanto, ao menos uma medida de tendência central e uma medida de dispersão para descrever um conjunto de dados. As quatro medidas de dispersão que serão definidas a seguir são: amplitude total, amplitude interquartílica, variância e desvio padrão.
Conteúdos
Amplitude
A amplitude total de um conjunto de dados é a diferença entre o maior e o menor valor observado. A medida de dispersão não levar em consideração os valores intermediários perdendo a informação de como os dados estão distribuídos e/ou concentrados.
Amplitude Interquartílica
A amplitude interquartílica é a diferença entre o terceiro e o primeiro quartil. Esta medida é mais estável que a amplitude total por não considerar os valores mais extremos e abrange 50% dos dados.
Variância e Desvio-Padrão
A diferença entre cada valor observado e a média é denominado desvio e é dado por
Ao somar todos os desvios, ou seja, ao somar todas as diferenças de cada valor observado em relação a média, o resultado é igual a zero (propriedade 5 da média). Isto significa que esta medida não mede a variabilidade dos dados. Para resolver este problema, vamos considerar o quadrado dos desvios em relação à média: . Calculando a média deste último obtém-se a variância:
Entretanto, ao calcular a variância observa-se que o resultado será dado em unidades quadráticas, o que dificulta a sua interpretação. O problema é resolvido extraindo-se a raiz quadrada da variância, definindo-se, assim, o desvio padrão:
Exemplo: 10, 15, 20
A = 20-10 = 10
variância:
desvio padrão:
Coeficiente de variação
O coeficiente de variação é uma medida de dispersão relativa definida como a razão entre o desvio padrão e a média:
A partir do coeficiente de variação pode-se avaliar a homogeneidade do conjunto de dados e, consequentemente, se a média é uma boa medida para representar estes dados. É utilizado, também, para comparar conjuntos com unidades de medidas distintas.
Um coeficiente de variação superior a 50% sugere alta dispersão o que indica heterogeneidade dos dados. Quanto maior for este valor, menos representativa será a média. Neste caso, opta-se pela mediana ou moda, não existindo uma regra prática para a escolha de uma destas medidas. O pesquisador, com sua experiência, é que deverá decidir por uma ou outra. Por outro lado, quanto mais próximo de zero, mais homogêneo é o conjunto de dados e mais representativa será sua média.
Exercício: Calcular a variância, o desvio padrão e o coeficiente de variação dos exemplos da distribuição de frequências.
Leia Também Sobre: