Atenção, essa lista é composta por 4 questões. Entregue a lista no formato que deseja via Stoa até às 23:59 do dia 13/03 (sexta-feira)
Defina o que é heterocedasticidade e explique suas consequências para a estimação de mínimos quadrados ordinários.
Esta questão não precisa ser entregue, mas você precisará fazer para conseguir fazer a questão 4.
a) Instale o RStudio em seu computador e abra o R
Para baixar o RStudio, acesse este site, é gratuito. Utilizamos o Rstudio pois é a interface mais “userfriendly” do R.
b) Caso não seja familiarizado com o R, assista este vídeo
c) Crie um novo projeto em um diretório
O diretório é a pasta onde ficará todos seus arquivos relativos ao projeto (seus scripts, saídas e base de dados) Caminho para criar o novo projeto:
file>>new project>>new directory>>new project>>“coloque o nome da pasta e selecione aonde você quer coloca-la”
d) Faça o download da base de dados que vamos usar na lista
A base de dados está no stoa na parte de Heterocedasticidade e se chama “[Monitoria 1] Base de dados”. Ela está em csv
e) Salve a base de dados no diretório (pasta) que você criou em seu computador
f) Instale os pacotes que vamos usar nessa lista
Para instalar utilize o comando install.packages. Depois de instalado em seu computador, não precisa instalar mais, só requisitar. Por isso, depois de instalar, coloque um # em frente ao install.packages para que não instale novamente. (Quando se coloca um # em frente ao comando, esse comando se torna um comentário)
Escreva no script retirando o primeiro #:
#install.packages("dplyr") #pacote para limpar as bases
#install.packages("ggplot2") #pacote para plotar gráficos
#install.packages("lmtest") #pacote para fazer testes de regressão multipla
#install.packages("sandwich") #pacote para calcular erros padrões robustos
Selecione e aperte “run” ou crtl+enter
a) Requisite os pacotes que você acabou de instalar
Para essa questão, copie no documento word o seu script.
library(dplyr)
library(ggplot2)
library(lmtest)
library(sandwich)
options(scipen = 999) #Caso deseje, esse comando serve para desligarmos a notação cientifica
b) Abra a base de dados
df<-read.csv("PNAD-2015-ajustada.csv")
c) Filtre o estado que você vai trabalhar. Atenção, cada pessoa tem um estado diferente para trabalhar de acordo com o número ded matrícula
c.1) Olhe o número de matrícula na tabela e olhe seu estado:
## N.mero.USP uf
## 1 3271350 53
## 2 4683222 41
## 3 5482495 53
## 4 7513613 50
## 5 7968020 50
## 6 8504632 13
## 7 8537747 41
## 8 8925191 26
## 9 8926139 29
## 10 9007424 12
## 11 9066146 53
## 12 9281626 35
## 13 9290032 25
## 14 9290794 28
## 15 9363499 22
## 16 9442455 11
## 17 9781415 32
## 18 9781478 24
## 19 9781735 41
## 20 9781801 24
## 21 9782020 21
## 22 9787151 15
## 23 9787338 24
## 24 9787359 43
## 25 9787370 15
## 26 9787384 25
## 27 9846705 50
## 28 9864042 27
## 29 10261741 24
## 30 10286850 21
## 31 10286912 27
## 32 10291703 50
## 33 10291828 14
## 34 10291832 17
## 35 10291936 29
## 36 10291940 23
## 37 10347805 50
## 38 10408160 24
## 39 10726203 51
## 40 10726270 17
## 41 10726349 25
## 42 10784053 31
## 43 10817312 25
c.2) Escreva o código para filtrar sua base de dados. Por exemplo, se meu estado fosse 33, eu escreveria o seguinte:
df<-df%>%
filter(uf==33) #função filter serve para filtrar a base de dados
Para esta parte, replique os comandos que foram dados na monitoria. A explicação sobre a base de dados também está no arquivo da monitoria.
Responda as perguntas para o seu estado .
Copie as saídas do console para o word e escreva as respostas das perguntas.
a) Faça a regressão múltipla da renda como função de: anos de estudo, raça, sexo, idade, idade ao quadrado. Interprete os resultados.
Lembre-se de gerar a variável de idade ao quadrado. Lembre-se de interpretar as dummies!
b) Plote o gráfico dos resíduos e dos valores ajustados \(\hat{y}\). Você acha que tem presença de heterocedasticidade?
c) Faça o teste Breusch-Pagan (LM) para heterocedasticidade. Qual foi o resultado?
d) Faça a correção de White manualmente para o erro-padrão robusto do \(\hat{\beta}\) variável de anos de estudo. Explique com suas palavras passo a passo como foi feito o cálculo.
e) Faça a correção de White para erros-padrão robusto para todos os coeficientes estimados usando o pacote do R. Os resultados são diferentes da estimação inicial? Porque?