# Os dados foram extraídos da revista Motor Trend US de 1974 # e abrangem o consumo de combustível e 10 aspectos do design # e desempenho de automóveis para 32 automóveis (modelos de 1973-74). # Obs: Esses dados já está no R e não precisa instalar nenhum pacote # Funcao para mostrar o banco de dados referente as 6 primeiras observacoes head(mtcars) # Se quiser mostrar 10 observacoes iniciais head(mtcars,10) # Construindo box-plot da variavei mpg considerando os diferentes cilindros boxplot(mpg~cyl,data=mtcars, main="Car Milage Data", xlab="Number of Cylinders", ylab="Miles Per Gallon") # Caso queira distinguir usando cores boxplot(mpg~cyl,data=mtcars, main="Car Milage Data", xlab="Number of Cylinders", ylab="Miles Per Gallon", col=c("red","green","blue")) # Usando table para 1 variavel table(mtcars$carb) # Usando a funcao table (em geral para duas variaveis categoricas ) table(mtcars$carb,mtcars$cyl) #Construindo o histograma pra a variavel continua considerando uma categoria # Metodo 1 #criando um banco de dados para cada grupo # pegando os valores apenas da variavel MPG qundo cyl eh igual a 4 var_resp_CYL_4 = mtcars$mpg[cyl == 4] # pegando os valores apenas da variavel MPG qundo cyl eh igual a 6 var_resp_CYL_6 = mtcars$mpg[cyl == 6] # pegando os valores apenas da variavel MPG qundo cyl eh igual a 8 var_resp_CYL_8 = mtcars$mpg[cyl == 8] #Graficos individuais hist(var_resp_CYL_4) hist(var_resp_CYL_6) hist(var_resp_CYL_8) #juntando todos is histogramas em uma so figura par(mfrow=c(1,3)) hist(var_resp_CYL_4) hist(var_resp_CYL_6) hist(var_resp_CYL_8) # Metodo 2 ( esse eh mais dificil pois requer um pouco mais de conhecimento) #Criando o banco de dados auxiliar apenas com as variaveis que eu quero data_hist = data.frame(cbind(mtcars$mpg,mtcars$cyl)) #renomeando os nomes das colunas colnames(data_hist)=c("mpg","cyl") #Transformando a variavel relacionada ao tipo de grupo para fator data_hist$cyl = as.factor(data_hist$cyl) #Verificando se de fato é fator ou nao is.factor(data_hist$cyl) #Criando o grafico de histograma de acordo com os grupos install.packages("ggplot2") library(ggplot2) ggplot(data_hist, aes(x = mpg)) + geom_histogram(aes(color = cyl, fill = cyl), position = "identity", bins = 30, alpha = 0.4) + scale_color_manual(values = c("red","green","blue")) + scale_fill_manual(values = c("red","green","blue")) # Criando uma nova matriz com as variáveis desejadas ncol(mtcars) # Como percebe esse banco de dados possui 11 variaveis # Suponha que so me interessa as variaveis mpg, cyl e hp mtcars_reduzido = cbind(mpg = mtcars$mpg,cyl = mtcars$cyl,hp = mtcars$hp) # Esse nome mpg, cyl e mpg sao os nomes das colunas que eu quero mtcars_reduzido = cbind(A = mtcars$mpg,B = mtcars$cyl,C = mtcars$mpg) # Aqui eu coloquei que as colunas se chamarão A, B e C. # Atribuindo os nomes das linhas dos dados originais ja que a quantidade de # linhas sao iguais row.names(mtcars_reduzido) = row.names(mtcars) head(mtcars_reduzido) # É necessario transformar para data.frame mtcars_reduzido = data.frame(mtcars_reduzido) # Agora vamos supor que queremos pegar os resultados da variável MPG que # possuem 4 cilindros (cyl = 4) mpg_cyl_4 = mtcars_reduzido$mpg[mtcars_reduzido$cyl ==4] #Agora iremos pegar os carros que tem 4 cilindros e HP maior do que 100 cyl_4_hp_100 = mtcars_reduzido$mpg[mtcars_reduzido$cyl ==4 & mtcars_reduzido$hp>100];cyl_4_hp_120