** FLS 6183 & FLP 0468 ** Lab 2: Erro de Mensuração ** Data: 15/09/2016 * Objetivo: * Os pressupostos do modelo de regressão enfatizam as propriedades que o erro deveria * apresentar. Neste laboratorio, vamos utilizar uma simulação para demonstrar como os * problemas envolvendo erro de mensuração de nossas variaveis podem levar a viés de * nossas estimativas e, principalmente, mostramos o mecanismo de transmissão. * Mesmo que o lab seja voltado para discutir o problema utilizando dados de simulação, * como pesquisadores, em nosso dia-a-dia, enfrentamos o problema de viés de mensuração * em nossas variáveis. Um caso clássico é o das perguntas em surveys sobre a renda dos * indivíduos. De um modo geral, os entrevistados não se lembram exatamente de sua * renda no mês de referência ou no ano anterior, reportando assim um valor aproximado, * inexato. Portanto, um pesquisador que trabalhe com esses dados, por exemplo, * tem que estar alerta sobre a possibilidade de se ter viés em sua variável. * O lab a seguir analisa este problema no modelo bivariado com dois exercícios: * a) o problema de viés na mensuração da variável independente e, * b) o problema de viês na mensuração na variavel dependente. clear * Vamos supor que temos a distribuição populacional da variável dependente (Y) e da * variável independente (X). Iremos chamar as medidas populacionais de Yt e Xt, * sendo t as "true measures" e as medidas observadas de Y e X. * Criamos um banco de dados com N=500, estipulamos que Xt tem uma média de 7 e um desvio * padrão de 8 e Yt tem uma média de 10 e um desvio padrão de 4. Além disso, * estipulamos que a correlação entre Xt e Yt é de 0.7. Finalmente, assinalamos que Yt * e Xt são variáveis aleatórias e apresentam distribuição normal. * Abaixo, criamos um banco de dados a partir das informações fornecidas acima. matrix m = (7,10) matrix sd = (8,4) matrix C = (1, .7 \ .7, 1) drawnorm Xt Yt, n(500) means (m) sds(sd) corr(C) seed(14092016) summarize corr Yt Xt * Sabemos que há erro de mensuração tanto em nossa variável dependente quanto * na variável independente. Assim, iremos criar duas variáveis aleatórias ey * (erro de mensuração de Y) e ex (erro de mensuração de X). Estipulamos que ey * apresenta uma distribuição normal com média de 0 e desvio padrão de 3 e ex também * apresenta distribuição normal, mas com média de 0 e desvio padrão de 6. gen ey=rnormal(0,3) gen ex=rnormal(0,6) * Desse modo, a variável observada Y é formada por Yt ("a medida verdadeira") e pelo * erro de mensuração ey. E, a variável observada X é composta por Xt ("a medida * verdadeira") e ex que é o erro de mensuração dessa variável. gen Y = Yt + ey gen X = Xt + ex * Dado que sabemos que há problemas envolvendo erro de mensuração em Y e em X, agora iremos * avaliar os efeitos da falta de confiabilidade de nossas medidas. * Exercício 1 * Avalie os efeitos da falta de confiabilidade de nossas medidas analisando a média da variável * dependente e da variável independente. * Exercício 2 * Avalie os efeitos da falta de confiabilidade de nossas medidas analisando a variância das * variáveis. * Exercício 3 * Supondo que Yt mensura perfeitamente a variável Y, porém X apresenta problema de erro de * mensuração aleatório, analise a covariância entre as variáveis dependente e independente. * Exercício 4 * Supondo que Yt mensura perfeitamente a variável Y, porém X apresenta problema de erro de * mensuração aleatório, analise a correlação entre as variáveis. * Exercício 5 * Ainda supondo que Yt mensura perfeitamente a variável Y, porém X apresenta problema * de erro de mensuração aleatório, avalie o efeito de tal problema sobre os resultados da * regressão bivariada entre Yt e Xt e da regressão entre Yt e X. Compare os resultados. * Exercício 6 * Agora, supondo que Xt mensura perfeitamente a variável X, porém Y apresenta problema de * erro de mensuração aleatório, avalie o efeito do erro de mensuração aleatório sobre os resultados * da regressão bivariada entre Yt e Xt e da regressão entre Y e Xt. Compare os resultados. * Exercício 7 * Discuta sobre os resultados encontrados no exercício 5 e 6 pensando especialmente sobre * os pressupostos do modelo de regressão linear.