## Estatística Descritiva ## Entrando com os dados dadosparaprogramaR.txt que estão na pasta C:/Amanda setwd("C:/Amanda") getwd() dados = read.table("dadosparaprogramaR.txt", dec = ",",header=T) #leitura de Dados em arquivo externo ## outra opção para entrar com os dados: dados = read.table(file=file.choose(), dec = ",",header=T) #leitura de Dados em arquivo externo attach(dados) names(dados) ## Medidas de posição e dispersão (que são calculadas em variáveis quantitativas) #média: mean(Salario) #variância: var(Salario) #desvio padrão: sd(Salario) #mediana: median(Salario) #quantis: quantile(Salario,0.9) #quartis: quantile(Salario,c(0.25,0.5,0.75)) #resumos numéricos: summary(Salario) ### Mudulo que determinas as Medidas de Posição e dispersão################### meuResumo <- function(x) { s <- c(length(x),mean(x, na.rm = T),median(x, na.rm = T), sd(x, na.rm = T), var(x, na.rm = T), length(which(is.na(x)))) names(s) <- c("n","média","mediana" , "desvio Padrão", "variância","NA") return(s) } meuResumo(Salario) ### Tabela de frequencia para dados qualitativos ################## table(EsT_Civ) table(EsT_Civ,G_Int) table( EsT_Civ,G_Int, R_proced) ## Tabela de proporções prop.table(table(EsT_Civ)) prop.table(table(EsT_Civ,G_Int)) prop.table(table(EsT_Civ,G_Int),1) prop.table(table(EsT_Civ,G_Int),2) # Gráfico de Barras barplot(table(EsT_Civ), col=c("green","red"), ylim=c(0,25), space=.8, width=c(.2,.2), main="Proporção de funcionario por estado civil", xlab="Estado Civil", ylab="Proporção de funcionários") text(locator(n=2),c("56%","44%")) ## ou barplot(table(EsT_Civ), ylim=c(0,25), space=.8, width=c(.2,.2),col=c("green","red"),legend=c("56%","44%"),main="Proporção de funcionario por estado civil", xlab="Estado Civil", ylab="Proporção de funcionários") ## Diagrama Circular ou Pizza pie(table(G_Int) ,col=c("red","yellow","green"),labels=c("1 Grau (33,3%)","2 Grau(50,0%)", "Superior(15,7%)")) title(main="Distribuição dos Funcionários por Grau de Instrução") pie(table(EsT_Civ),col=c("red","yellow"),labels=c("Casado (56%)","Solteiro(44%)" ,main="Distribuição dos Funcionários por Estado Civil") ) ## Gráfico de Pareto install.packages("qcc") library(qcc) pareto.chart(table(EsT_Civ)) pareto.chart(table(G_Int)) ### dados quaantitativos ################## ## Grafíco de dados discretos plot(table(N_filhos),xlab="Número de filhos",ylab="Número de Funcionários") plot(table(N_filhos)) hist(N_filhos) ## Gráfico de pontos stripchart(Salario, xlab="Salario (em s.m.)", pch= 20, method = "stack") abline(h = 0.98) points(mean(Salario), 0.93, pch = 17, col = "red", cex = 2) #Gráfico de Histograma# hist(Salario, breaks =c(4,8,12,16,20,24),xlab="salário",ylab="Densidade",prob=T,col="yellow", main="Dist. de salário dos funcionários da empresa",ylim=c(0,0.1), labels=c("27,8%","33,3%","22,2%","13,8%","2,8%")) ## Alternativamente h=hist(Salario, breaks =c(4,8,12,16,20,24),xlab="Salário",ylab="Número de Funcionários",col="yellow", main="Dist. de salário dos funcionários da empresa",axes=F, right = F, labels=c("27,8%","33,3%","22,2%","13,8%","2,8%")) axis(1,h$breaks) axis(2,h$counts) ## Tabela de Frequencia TDF=hist(Salario, breaks =c(4,8,12,16,20,24), right = F,plot=F) fabs=TDF$counts #Frequencia absoluta fr=fabs/length(Salario) # Frequencia relativa saida=cbind(fabs,fr) dimnames(saida)=list(c("4|-8","8|-12","12|-16","16|-20","20|-24"),c("f", "fr")) saida ## Tabela de Frequência usando a função cut fabs=table(cut(Salario, breaks=seq(4,24,4), labels=c("4|-8","8|-12","12|-16","16|-20","20|-24"), right=F)) fr=fabs/length(Salario) saida=cbind(fabs,fr) dimnames(saida)=list(c("4|-8","8|-12","12|-16","16|-20","20|-24"),c("f", "fr")) saida ## Diagrama de Caixas boxplot(Salario,col="yellow",ylab="Salario") boxplot(Salario,notch=TRUE, xlab="Salario",horizontal = T,col="green") boxplot(Salario~EsT_Civ, xlab="Salario",col=c("green","yellow")) boxplot(Salario~G_Int, xlab="Grau de Instrução", names=c("1 Grau", "2 Grau", "Superior"), ylab="Salario",main="Diagrama de caixas dos salarios dos func. por grau de instrução") ## Análise bivariada (quantitativo) plot(Salario[complete.cases(N_filhos)], N_filhos[complete.cases(N_filhos)], xlab = "Salario", ylab ="N defilhos", pch = 20) cor(Salario, N_filhos) x=c(1,2,3,4) y=c(2,4,6,8.5) cor(x,y) plot(x,y) lines(lowess(x,y), col = "blue")