#### AULA 10 - GEOESTATISTICA AULA 10.2 - NORMALIDADE E TENDENCIA #getwd() #rm(list=ls()) ### instalaCAo de pacotes necessArios install.packages("MASS") ### 1. CARREG DOS PCTES E IMPORT DO 'geodata' library(geoR) library(sf) library(maptools) library(MASS) # programa q faz a boxcox # importacao do geodata 'deng' # verificando o geodata 'deng' apos a importacao source("./resol_aulas_12_1a4/deng.R") head(deng$data) head(deng$coords) head(deng$borders) head(deng$covariates) plot(deng,low=T) ### 2. VERIFICACAO DA NORMALIDADE DA VAR DEPEND (INCID) E TRANSF COM 'boxcox' #### OBS.: ANTES APRESENTAR SLIDES # voltando ao bd 'deng' - var depend - incidencia de dengue plot(deng,low=T) # mostra curva da incid assimetrica # graf p verificar comportamento da var depend em rel eh distr normal de prob qqnorm(deng$data) # comportamento nao compativel com curva normal # teste para verific compor normal da var depend - Kolmogorov-Smirnov ks.test(deng$data,"pnorm",mean=mean(deng$data), sd=sqrt(var(deng$data))) # teste signif - p = 0,001505 - incid nao segue curva normal - necess de transf var # escolha da melhor transformacao dos dados - funcao 'boxcox' do pcte 'MASS' boxcox(deng)# nao faz pq tem valores iguais a zero # adicao da unidade as incid - nao serao alteradas - estao por 100 mil deng.nv <- deng # jogando o banco 'deng' em um novo obj deng.nv$data <- deng$data+1 boxcox(deng.nv) # grafico - mostra os valores de lambda as as log-veross # ampliacao do grafico boxcox(deng.nv,lam=seq(0,1,1/10)) # de 0 a 1 com passo de 0.1 em 0.1 # melhor opcao - lambda = 0.5 (raiz quadrada de y, isto eh, da incid) # express?o boxcox - y* = (y^lamda - 1) / lambda # lambda = 0.5 - raiz quadrada # lambda = 0.000 - raiz c?bica # lambda = 1 - sem transforma??o # lambda = 0 - log # lambda = -1 - inverso # teste da normalidade qqnorm(sqrt(deng.nv$data)) ks.test(sqrt(deng.nv$data),"pnorm",mean=mean(sqrt(deng.nv$data)), sd=sqrt(var(sqrt(deng.nv$data)))) plot(deng.nv,lam=0.5) # faz o 'plot' ja considerando a transfom pela raiz quad # apas transf - curva da incidencia mais prox da distr normal ### OBS.: daqui para frente uso o bd 'deng.nv' - e lam=0.5 ### 3. MODELAGEM DA TENDENCIA - modelo OLS plot(deng.nv,lam=0.5, low=T) # 'low=T' - para fazer linha de tendencia # vamos assumir o seguinte modelo OLS: inc ~ CH_3INST+ PROP_CASAS + CH_ATE2SM # tenho q ter um ideia previa sobre qual covar usar na regressao # o interesse aqui nao avaliar a relacao entre dengue e covar e explicar a tendencia # apos explicar a tendencia - faremos os demais passaos usando os residuos da regress deng.lm <- lm(sqrt(deng.nv$data)~CH_3INST+ PROP_CASAS+CH_ATE2SM,data=deng.nv) summary(deng.lm)# p = 2e-16 r2 = 0.3225 ### VERIFICACAO E CORRECAO DA TENDENCIA plot(deng.nv,lam=0.5,low=T,trend=~CH_3INST+CH_ATE2SM+PROP_CASAS) # nesse caso a funCAo 'plot' plota o erro (resIduos da regr) e nao o valor da incid. # mapa tematico dos residuos da incid points(deng.nv,lam=0.5,pt.div="quintile",xlab="leste",ylab="norte", trend=~CH_3INST+ PROP_CASAS+CH_ATE2SM) points(deng.nv,pt.div="quintile",xlab="leste",ylab="norte") # bem diferente! ### 4. EXPORTACAO DO 'geodata' 'deng.nv' dump("deng.nv","./resol_aulas_12_1a4/deng.nv.R")