A3 - Covariância, Correlação e Regressão Linear
Para
esta análise, cada grupo deverá considerar uma base de dados que
contenha ao menos três variáveis quantitativas. A base pode ser obtida a
partir das bases disponibilizadas no tópico 5 ou então obtida pelo
próprio grupo.
A partir dos dados coletados, entregar:
1 Apresentação da base de dados (fonte, problema envolvido, ...) 1,0
2 Matriz de covariância entre as variáveis. 1,0
3 Análise de correlação entre as variáveis:
3.1 Matriz de correlação entre as variáveis (pode ser um correlograma) 1,0
3.2 Apresentar diagrama de dispersão para:
3.2.a as duas variáveis com maior correlação (maior módulo de \(r\)) 1,0
3.2.b as duas variáveis com menor correlação (menor módulo de \(r\)) 1,0
4 Regressão linear:
Propor um modelo de regressão linear simples ou múltipla,
ou seja, considerar uma variável como dependente (\(Y\)) e uma ou mais variáveis
como independentes (\(X_1\), \(X_2\), ...). Apresentar os seguintes itens:
4.1 Resultado obtido para o modelo: 2,0
4.1 a Equação do modelo: \(\hat{Y} = b_0 + b_1 X_1 + b_2 X_2 + \)...,
4.1 b Coeficiente de determinação, \(R^2\) e o significado.
4.1 c Significância (valor-\(P\)) para os coeficientes \(b_0\), \(b_1\), \(b_2\), ....
4.2 Análise de resíduos (\(\epsilon_i = Y_i - \hat{Y}_i \)): Obtenha os resíduos, apresente um boxplot dos valores dos resíduos e comente se a distribuição pode ser considerada uma distribuição normal (gaussiana). 2,0
4.3 Aplique o modelo para valores de \(X_1\), \(X_2\) ,... específicos, de forma a obter uma estimativa para \(Y\). 1,0