library(lattice) library(epiDisplay) # Defina o diretório de trabalho: setwd("") setwd("D:/A1 DATA/Curso R 2020/Dados") # Importe o banco de dados "Rim.xls" e dê o nome de "rim". # Para isto, utilize o Menu # Dados -> Impotar arquivo de dados -> do arquivo Excel # Ou utilize o comando: rim <- readXL("D:/A1 DATA/Curso R 2020/Dados/Rim.xlsx", rownames=FALSE, header=TRUE, na="", sheet="kidney", stringsAsFactors=FALSE) names(rim) names(rim) <- list("individuo", "dep", "conc", "idade", "peso") # Análise descritiva #-------------------- par(mfrow=c(2,2)) boxplot(rim$dep, ylab="Depuração de creatinina (mg/dL)", col="lightpink") boxplot(rim$conc, ylab="Concentração de creatinina (mg/dL)", col="lightpink") boxplot(rim$idade, ylab="Idade (anos)", col="lightpink") boxplot(rim$peso, ylab="Peso (kg)", col="lightpink") scatterplotMatrix(~dep+conc+idade+peso, reg.line=FALSE, smooth=FALSE, spread=FALSE, diagonal = 'none', data=rim) par(mfrow=c(1,3)) plot(dep~conc, xlab="Concentração de creatinina (mg/dL)", ylab="Depuração de Creatinina (mg/dL)", data=rim) plot(dep~peso, xlab="Peso (kg)", ylab="Depuração de Creatinina (mg/dL)", data=rim) plot(dep~idade, xlab="Idade (anos)", ylab="Depuração de Creatinina (mg/dL)", data=rim) rcorr.adjust(rim[,c("dep","conc","idade","peso")], type="pearson", use="complete") Hist(rim$dep, scale="density", breaks="Sturges", col="darkgray") qqPlot(rim$dep, dist="norm", id.method="y", id.n=2, labels=rownames(rim)) shapiro.test(rim$dep) # Modelo de Regressão #----------------------- model <- lm(dep~conc+idade+peso, data=rim) summary(model) # Ou utilizando o Menu: Estatísticas -> Ajuste de Modelos -> Regressão Linear # Realizando um procedimento "stepwise forward" model.1 <- lm(dep~conc, data=rim) summary(model.1) model.2 <- update(model.1, .~. + idade) summary(model.2) anova(model.2,model.1) model.3 <- update(model.2, .~. + peso) summary(model.3) anova(model.3,model.2) # Intervalo de confiança para os coeficientes do modelo confint(mod.2) # Análise de Resíduos #---------------------- plot(fitted(model), residuals(model)) abline(h=0) plot(fitted(model), rstandard(model)) abline(h=0) hist(residuals(model)) qqPlot(residuals(model), dist="norm", id.method="y", id.n=2) # Ajustando um modelo com uma variável "dummy" #--------------------------------------------------- rim$id.menor50 <- ifelse(rim$idade<=50, 1, 0) rim$id.maior50 <- ifelse(rim$idade>50, 1, 0) rim$fid.maior50 <- factor(rim$id.maior50, levels=c(0, 1), labels=c("<=50", ">50")) model.4 <- lm(dep~conc+fid.maior50+peso, data=rim) summary(model.4) # Avaliando a presença de interação #----------------------------------- model.5 <- lm(dep~conc+fid.maior50+peso+fid.maior50*peso, data=rim) summary(model.5) # Análise de Resíduos #---------------------- plot(fitted(model.4), rstandard(model.4)) abline(h=0) hist(residuals(model.4)) qqPlot(residuals(model), dist="norm", id.method="y", id.n=2) #--------------------------------------------