# Trabalho prático: Análise 1 - Testes de hipóteses library(knitr) library(kableExtra) library(reshape2) library(ggplot2) #output = "A_1.html" # Análise 1 no R Markdown # #n.usp <- 123456789 dados <- read.table("Choice_is_Yours_Fundos.csv",header=TRUE,sep=";",dec=",") # ##################################################################### # Análise da base 1 - Choice is Yours ############################# names(dados) # # Reordenando as níveis dos fatores table(dados$Categoria) dados$Categoria <- ordered(dados$Categoria, levels = c("Baixo Cap","Médio Cap","Gde.Vol.Cap")) table(dados$Categoria) # table(dados$Risco) dados$Risco <- ordered(dados$Risco, levels = c("Baixo","Médio","Alto")) table(dados$Risco) # # 2.1: Medidas Estatísticas: summary(dados) # # 2.2: Gráficos Estatísticos: # Gráficos para variáveis categóricas ----------------------------- # ggplot(dados, aes(x=Risco)) + geom_bar(stat="count", width=0.4, fill="steelblue") + ylab("Frequência absoluta") + theme_minimal(base_size=10) ggplot(dados, aes(x=Risco, fill=Categoria)) + geom_bar(stat="count", width=0.4) + ylab("Frequência absoluta") + scale_fill_brewer(palette="Blues")+ theme_minimal(base_size=18) ggplot(dados, aes(x=Risco, fill=Categoria)) + geom_bar(stat="count", width=0.8,position=position_dodge()) + ylab("Frequência absoluta") + scale_fill_brewer(palette="Blues")+ theme_minimal(base_size=18) # Gráficos para variáveis numéricas ----------------------------- # Histogramas # Retorno.3.Anos ggplot(dados, aes(x=Retorno.3.Anos)) + geom_histogram(aes(y=..density..), colour="black", fill="white",bins = 20)+ scale_x_continuous(name = "Retorno..3.Anos (%)") + geom_density(alpha=.2, fill="steelblue") ggplot(dados, aes(x=Retorno.5.Anos)) + geom_histogram(aes(y=..density..), colour="black", fill="white",bins = 20)+ geom_density(alpha=.2, fill="steelblue") ggplot(dados, aes(x=Retorno.2005)) + geom_histogram(aes(y=..density..), colour="black", fill="white",bins = 20)+ geom_density(alpha=.2, fill="steelblue") # # Boxplot para duas variáveis distintas, por ex. # Retorno.3.Anos e Retorno.5.Anos ---------- fill <- "#4271AE" line <- "#1F3552" ggplot(dados, aes(y = Retorno.3.Anos)) + geom_boxplot(fill = fill, colour = line,alpha = 0.7) + scale_y_continuous(name = "Retorno (%)",limits=c(-30, 45)) + scale_x_discrete(name = "Retorno.3.Anos") ggplot(dados, aes(x = Risco, y = Retorno.3.Anos)) + geom_boxplot(fill = fill, colour = line,alpha = 0.7) + scale_y_continuous(name = "Retorno (%)",limits=c(0, 45)) + scale_x_discrete(name = "Retorno.3.Anos") ggplot(dados, aes(y = Retorno.5.Anos)) + geom_boxplot(fill = fill, colour = line,alpha = 0.7) + scale_y_continuous(name = "Retorno (%)",limits=c(-30, 45)) + scale_x_discrete(name = "Retorno.5.Anos") ggplot(dados, aes(x = Categoria, y = Retorno.5.Anos)) + geom_boxplot(fill = fill, colour = line,alpha = 0.7) + scale_y_continuous(name = "Retorno (%)",limits=c(-30, 30)) + scale_x_discrete(name = "Retorno.5.Anos") ggplot(dados, aes(x = Risco, y = Retorno.5.Anos)) + geom_boxplot(fill = fill, colour = line,alpha = 0.7) + scale_y_continuous(name = "Retorno (%)",limits=c(-30, 30)) + scale_x_discrete(name = "Retorno.5.Anos") # # 3 Aplicar ao menos dois testes de hipóteses ######### Teste 1 ################################ # 3.1 Afirmativa a ser testada. # A média de "retorno 3 anos" é diferente considerando o fator Risco # 3.2 Hipóteses H0 e H1. # H0: mu_Baixo = mu_Médio = mu_Alto # H1: ao menos uma média é diferente das outras # # Teste anova: aov anova.1 <- aov(Retorno.3.Anos ~ Risco, data = dados) summary(anova.1) #3.3 Estatística teste. F_teste.1 <- 5.583 #3.4 Valor-P. valor.P1 <- 0.0039 #3.5 Conclusão sobre H0. Considerando alfa = 0,05 conclusao1 <- "Rejeita H0" #3.6 Conclusão com base na Afirmativa testada. # Apoia a afirmativa de que as médias são diferentes, # ou seja: conc.afirm.1 <- "A média de retorno 3 anos é diferente considerando o fator Risco" ######### Teste 2 ################################ # 3.1 Afirmativa a ser testada. # "A média de retorno 5 anos é diferente da # média de retorno 3 anos # 3.2 Hipóteses H0 e H1. # H0: mu_5 anos = mu_3 anos # H1: mu_5 anos diferente mu_3 anos # # Teste t: teste.t.2 <- t.test(dados$Retorno.5.Anos,dados$Retorno.3.Anos,var.equal = TRUE) teste.t.2 #3.3 Estatística teste. t_teste.2 <- -48.846 #3.4 Valor-P. valor.P2 <- 2.2e-16 #3.5 Conclusão sobre H0, para alfa = 0.05 conclusao2 <- "Rejeita H0" #3.6 Conclusão com base na Afirmativa testada. # Apoia a afirmativa de que A média de retorno 5 anos é diferente da # média de retorno 3 anos # ou seja: conc.afirm.2 <- "As médias são diferentes" ######### Teste 3 ################################ # 3.1 Afirmativa a ser testada. # "A média de retorno.2005 é maior para categoria de crescimento do que # para categoria de Valorização" # 3.2 Hipóteses H0 e H1. # H0: mu_Crescimento = mu_Valorização # H1: mu_Crescimento > mu_Valorização # # Teste t: teste.t.3 <- t.test(Retorno.2005 ~ Objetivo,var.equal = TRUE, data = dados,alternative = "greater") teste.t.3 #3.3 Estatística teste. t_teste.3 <- 2.2032 #3.4 Valor-P. valor.P3 <- 0.01393 #3.5 Conclusão sobre H0, para alfa = 0.05 conclusao3 <- 'Rejeita H0' #3.6 Conclusão com base na Afirmativa testada. # ou seja: conc.afirm.3 <- "Apoio a afirmativa de que: A média de retorno.2005 é maior para categoria de crescimento do que para categoria de Valorização" # A conclusão em R Markdow está em desenvolvimento * * * * * * * ## -------------------------------------------------- # Construindo o arquivo html ----------------------- # #rmarkdown::render('A1.Rmd', output_file = output, # #params = params, # envir = new.env(parent = globalenv())) #------------------------------------------------