# Estatística Descritiva # # Método Gráficos e Numéricos de John Tukey # # São Paulo, 01.04.2022 # Walter Ponge-Ferreira # # Referência: # Tukey, John # Exploratory Data Analysis # Addison Wesley, 1977. # #install.packages("readxl") library(readxl) library(UsingR) library(moments) setwd("~/PastaTecnica/R/PME3463 1 2022/Aula 02") rm(list=ls()) # Lista as abas da planilha excel_sheets("Dados dos alunos.xls") # Lê toda planilha dados <- read_excel("Dados dos alunos.xls") dados <- read_excel("Dados dos alunos.xls", sheet = "Turma 03A") class(dados) str(dados) head(dados) names(dados) dados$Gênero <- as.factor(dados$Gênero) dados$Turma <- as.factor(dados$Turma) str(dados) summary(dados) # Seleciona dados de peso mean(dados$Peso) mean(dados$Peso, na.rm = TRUE) dados$Peso <- as.numeric(dados$Peso) peso <- dados$Peso[!is.na(dados$Peso)] peso (x <- sort(peso)) sel <- is.na(dados$Peso) dados <- dados[!sel,] (i <- order(dados$Peso)) (n <- length(i)) dados$Nome[i] dados$Peso[i] dados[i,c("Nome","Peso","Gênero")] # Estatísticas Amostrais min(x) max(x) range(x) diff(range(x)) IQR(x) median(x) fivenum(x) quantile(x,c(0,0.25,0.50,0.75,1.00)) summary(x) mean(x) mean(x, trim = 0.0) # média aritmética mean(x, trim = 0.15) # média aparada -30% dos valores mean(x, trim = 0.25) # média aparada -50% dos valores mean(x, trim = 0.50) # mediana median(x) # Técnicas gráficas stem(x) DOTplot(x) boxplot(x) # outros diagramas de pontos stripchart(x, method="stack", xlab = "massa / kg", pch =16, offset = 0.5, cex = 2) grid() dotplot(x) dotchart(x) # Histograma n <- length(x) k <- sqrt(n) hist(x) hist(x, breaks = c(50,60,70,80,90,100,110)) hist(x, breaks = c(40,60,80,100,120)) hist(x, prob = TRUE) lines(density(x)) hist(x[-n],prob = TRUE) lines(density(x[-n])) # Momentos Estatísticos mean(x) sd(x) skewness(x) kurtosis(x) # excluindo valor máximo mean(x[-n]) sd(x[-n]) skewness(x[-n]) kurtosis(x[-n]) # FIM