# Script do Exercicio 3 # # Walter Ponge-Ferreira # 13/10/2016 # setwd("~/Data/PastaTecnica/R/Aula3") dir() rm(list=ls()) # Carrega bibliotecas adicionais library(UsingR) # para uso da função DOTplot library(moments) # para uso das funções skewness e kurtosis # Carrega os dados dados <- read.csv2("Bingo.csv") x <- dados$dm y <- dados$da d <- cbind(x,y) colnames(d) <- c("madeira","acrílico") # Estatística Descritiva range(x) diff(range(x)) quantile(x,c(0.00, 0.25, 0.50, 0.75, 1.00)) IQR(x) median(x) mean(x) var(x) sd(x) sd(x)/mean(x) skewness(x) kurtosis(x) summary(x) range(y) diff(range(y)) quantile(y,c(0.00, 0.25, 0.50, 0.75, 1.00)) IQR(y) median(y) mean(y) var(y) sd(y) sd(y)/mean(y) skewness(y) kurtosis(y) summary(y) # repete com resultados emparelhados apply(d,2,quantile,c(0.00, 0.25, 0.50, 0.75, 1.00)) apply(d,2,IQR) apply(d,2,median) apply(d,2,mean) apply(d,2,var) apply(d,2,sd) apply(d,2,sd)/apply(d,2,mean) summary(d) # Diagrama de Caixa-e-Bigodes boxplot(d, main = "Comparação das Bolinhas", ylab = "diâmetro - d / mm") # Histograma n <- length(y) # tamanho da amostra k <- log(n, base = 2) # número de faixas para histograma Rx <- diff(range(x)) # amplitude amostral de x Ry <- diff(range(y)) # amplitude amostral de y Rx/k # largura de faixa recomendada para variável x Ry/k # largura de faixa recomendada para variável y # Adotou-se a largura de faixa de 0.1 igual para as duas variáveis, x e y bin=seq(from=19.6,to=22.4,by=0.1) X.cut <- cut(x, bin, right = FALSE) Y.cut <- cut(y, bin, right = FALSE) x.freq <- table(X.cut) y.freq <- table(Y.cut) # Tabela de Frequencias cbind(x.freq) cbind(y.freq) matrix(data = c(x.freq,y.freq), ncol = 2) # Plota o histograma hist(x,breaks=bin, main="Bolinha de Madeira") # histograma de frequências abline(v=mean(x)-c(-1,0,1)*sd(x), col="red") abline(v=quantile(x,c(0.25,0.50, 0.75)), col="green") hist(x,breaks=bin,prob=TRUE, main="Bolinha de Madeira") # histograma de proporções lines(density(x)) hist(y,breaks=bin, main="Bolinha de acrílico") # histograma de frequências abline(v=mean(y)-c(-1,0,1)*sd(y), col="red") abline(v=quantile(y,c(0.25,0.50, 0.75)), col="green") hist(y,breaks=bin,prob=TRUE, main="Bolinha de acrílico") # histogrma de proporções lines(density(y)) # Intervalo de Confiança da média - Variância Conhecida sigma.x <- 0.3 # valor adotado z.val <- qnorm(0.975, mean = 0, sd = 1) # z crítico -> coeficiente de abrangência eo.x <- z.val*sigma.x/sqrt(n) # semi-amplitude do intervalo de x -> incerteza expandida mean(x)-eo.x mean(x)+eo.x sigma.y <- 0.1 # valor adotado eo.y <- z.val*sigma.y/sqrt(n) # semi-amplitude do intervalo de y -> incerteza expandida mean(y)-eo.y mean(y)+eo.y # Intervalo de Confiança da média - Variância Desconhecida alpha <- 0.05 # nível de significância t.val <- qt(1-alpha/2, df = n-1) # t crítico -> coeficiente de abrangência Sx <- sd(x) # desvio padrão amostral Sxm <- Sx / sqrt(n) # "erro padrão" = desvio padrão da média amostral -> incerteza padrão eo.x <- t.val*Sxm # semi-amplitude do intervalo de confiança de x mean(x)-eo.x mean(x)+eo.x mean(x) hist(x, breaks=bin, main="Bolinha de Madeira") abline(v=mean(x)+c(-1,0,1)*eo.x, col="cyan") DOTplot(x, main="Bolinha de Madeira") abline(v=mean(x)+c(-1,0,1)*eo.x, col="red") # Teste de hipótese e intervalo de confiança de x # H0: mu = mo <- hipótese nula # H1: mu <> mo (bi-caldal) <- hipótese alternativa t.test(x, mu = 20.6, alternative = "two.sided", conf.level = 1-alpha ) # repete para variável y Sy <- sd(y) Sym <- Sy / sqrt(n) eo.y <- t.val*Sym mean(y)-eo.y mean(y)+eo.y mean(y) hist(y,breaks=bin, main="Bolinha de Acrílico") abline(v=mean(y)-c(-1,0,1)*eo.y, col=c("red","green","red")) DOTplot(y, main="Bolinha de Acrílico") abline(v=mean(y)+c(-1,0,1)*eo.y, col=c("red","green","red")) t.test(y, mu = 20.6, alternative = "two.sided", conf.level = 1-alpha) # Intervalo de confiança da Variância # # P(lstar <= (n-1) s2 / sigma2 <= rstar) = 1 - alpha # # onde (n-1)*s2/sigma2 ~ chi2(n-1) # lstar = qchisq(alpha/2, df = n-1) rstar = qchisq(1-alpha/2, df = n-1) # para variável X var(x) (n-1)*var(x)*c(1/rstar, 1/lstar) # intervalo de confiança da variância de x sd(x) sqrt((n-1)*var(x)*c(1/rstar, 1/lstar)) # intervalo de confiança do desvio padrão # para variável y var(y) (n-1)*var(y)*c(1/rstar, 1/lstar) # intervalo de confiança da variânica de y sd(y) sqrt((n-1)*var(y)*c(1/rstar, 1/lstar)) # intervalo de confiança do desvio padrão # FIM