Reveja os apontamentos
utilizados pelo Prof. Carlos Tadeu da Silva, do Departamento de Matemática e Estatística da ESALQ, para apresentar as medidas de dispersão. Considere, principalmente, as explicações apresentadas para definir:
Desvio Padrão
- dá uma idéia do desvio médio absoluto com relação à média de um conjunto de observações (amostra)
Variância
- é o quadrado do desvio padrão
Coeficiente de Variação
- mede a dispersão relativa amostral, e é resultado de dividir o desvio padrão pela média da amostra [Desvio Padrão/Média * 100]
- dá uma idéia do desvio médio relativo com relação à média de um conjunto de observações (amostra)
Nota importante
Desvio padrão e erro padrão não são a mesma coisa. Vamos entender a diferença.
O desvio padrão é uma medida de precisão da média amostral. Ou seja, é uma medida que indica a dispersão dos dados dentro de uma amostra com relação à média da amostra. Assim sendo, quando menor o valor do desvio padrão, mais homogênea é a amostra.
Já o erro padrão é uma medida de variação de uma média amostral em relação à média da população. Para se chegar a uma estimativa do erro padrão, basta dividir o desvio padrão pela raiz quadrada do tamanho amostral.
Para que serve o erro padrão?
Através do erro padrão, pode-se estimar um intervalo de confiança para a média populacional a partir da média amostral calculada. Assim sendo, se estabelecermos, por exemplo, um nível de significância de 5%, é possível construir um intervalo de confiança que terá 95% de probabilidade de conter a média real da população.
Estude o caso ilustrado no quadro abaixo que analisa o volume observado nas embalagens de uma certa marca de suco de laranja.
Para cálculo do intervalo de confiança o erro padrão é multiplicado pelo percentil associado ao nível de significância observado em uma distribuição normal padrão, ou seja, que apresenta média 0 e desvio-padrão igual a 1.
Para o nível de significância de 5%, esse valor é de 1,96. Portanto, podemos concluir para o exemplo que existe a probabilidade de 95% do intervalo de 467,4 a 532,6 mililitros (500 ± 1,96 * 16,7) conter a média do verdadeiro volume das garrafas de suco de laranja.
Da mesma forma, pode afirmar que o intervalo entre 496,3 e 503,7 ml (500 ± 1,96 * 1,9) tem probabilidade de 95% de conter o volume médio de suco de laranja em todas as garrafas produzidas pelo fabricante.
A diferença entre desvio padrão e erro padrão
É muito frequente a confusão entre os conceitos de erro padrão e desvio padrão. Apesar de ambos tratarem da variação da média, são conceitos bem diferentes entre si.
O desvio padrão, como vimos, trata de um índice de dispersão da amostra em relação à média, enquanto o erro padrão é uma medida que ajuda a avaliar a confiabilidade da média calculada.