Atenção, essa lista é composta por 4 questões. Entregue a lista no formato que deseja via Stoa até às 23:59 do dia 13/03 (sexta-feira)

Questão 1 - Conceitual

Defina o que é heterocedasticidade e explique suas consequências para a estimação de mínimos quadrados ordinários.

Questão 2 - Básico do R

Esta questão não precisa ser entregue, mas você precisará fazer para conseguir fazer a questão 4.

a) Instale o RStudio em seu computador e abra o R

Para baixar o RStudio, acesse este site, é gratuito. Utilizamos o Rstudio pois é a interface mais “userfriendly” do R.

b) Caso não seja familiarizado com o R, assista este vídeo

c) Crie um novo projeto em um diretório

O diretório é a pasta onde ficará todos seus arquivos relativos ao projeto (seus scripts, saídas e base de dados) Caminho para criar o novo projeto:

file>>new project>>new directory>>new project>>“coloque o nome da pasta e selecione aonde você quer coloca-la”

d) Faça o download da base de dados que vamos usar na lista

A base de dados está no stoa na parte de Heterocedasticidade e se chama “[Monitoria 1] Base de dados”. Ela está em csv

e) Salve a base de dados no diretório (pasta) que você criou em seu computador

f) Instale os pacotes que vamos usar nessa lista

Para instalar utilize o comando install.packages. Depois de instalado em seu computador, não precisa instalar mais, só requisitar. Por isso, depois de instalar, coloque um # em frente ao install.packages para que não instale novamente. (Quando se coloca um # em frente ao comando, esse comando se torna um comentário)

Escreva no script retirando o primeiro #:

#install.packages("dplyr")  #pacote para limpar as bases
#install.packages("ggplot2") #pacote para plotar gráficos
#install.packages("lmtest") #pacote para fazer testes de regressão multipla
#install.packages("sandwich") #pacote para calcular erros padrões robustos

Selecione e aperte “run” ou crtl+enter

Questão 3- Abrindo a base de dados

a) Requisite os pacotes que você acabou de instalar

Para essa questão, copie no documento word o seu script.

library(dplyr)
library(ggplot2)
library(lmtest)
library(sandwich)


options(scipen = 999) #Caso deseje, esse comando serve para desligarmos a notação cientifica

b) Abra a base de dados

df<-read.csv("PNAD-2015-ajustada.csv")

c) Filtre o estado que você vai trabalhar. Atenção, cada pessoa tem um estado diferente para trabalhar de acordo com o número ded matrícula

c.1) Olhe o número de matrícula na tabela e olhe seu estado:

##    N.mero.USP uf
## 1     3271350 53
## 2     4683222 41
## 3     5482495 53
## 4     7513613 50
## 5     7968020 50
## 6     8504632 13
## 7     8537747 41
## 8     8925191 26
## 9     8926139 29
## 10    9007424 12
## 11    9066146 53
## 12    9281626 35
## 13    9290032 25
## 14    9290794 28
## 15    9363499 22
## 16    9442455 11
## 17    9781415 32
## 18    9781478 24
## 19    9781735 41
## 20    9781801 24
## 21    9782020 21
## 22    9787151 15
## 23    9787338 24
## 24    9787359 43
## 25    9787370 15
## 26    9787384 25
## 27    9846705 50
## 28    9864042 27
## 29   10261741 24
## 30   10286850 21
## 31   10286912 27
## 32   10291703 50
## 33   10291828 14
## 34   10291832 17
## 35   10291936 29
## 36   10291940 23
## 37   10347805 50
## 38   10408160 24
## 39   10726203 51
## 40   10726270 17
## 41   10726349 25
## 42   10784053 31
## 43   10817312 25

c.2) Escreva o código para filtrar sua base de dados. Por exemplo, se meu estado fosse 33, eu escreveria o seguinte:

df<-df%>%
  filter(uf==33) #função filter serve para filtrar a base de dados 

Questão 4- Aplicação prática - Heterocedasticidade

Para esta parte, replique os comandos que foram dados na monitoria. A explicação sobre a base de dados também está no arquivo da monitoria.

Responda as perguntas para o seu estado .

Copie as saídas do console para o word e escreva as respostas das perguntas.

a) Faça a regressão múltipla da renda como função de: anos de estudo, raça, sexo, idade, idade ao quadrado. Interprete os resultados.

Lembre-se de gerar a variável de idade ao quadrado. Lembre-se de interpretar as dummies!

b) Plote o gráfico dos resíduos e dos valores ajustados \(\hat{y}\). Você acha que tem presença de heterocedasticidade?

c) Faça o teste Breusch-Pagan (LM) para heterocedasticidade. Qual foi o resultado?

d) Faça a correção de White manualmente para o erro-padrão robusto do \(\hat{\beta}\) variável de anos de estudo. Explique com suas palavras passo a passo como foi feito o cálculo.

e) Faça a correção de White para erros-padrão robusto para todos os coeficientes estimados usando o pacote do R. Os resultados são diferentes da estimação inicial? Porque?