/*MONITORIA ECONOMETRIA II - MONITOR: FELIPE COSTA*/ /*PROFESSOR: DANIEL SANTOS*/ *Limpando Stata: clear all *Desligando a opção "More" set more off *Abrindo a base de dados cd "F:\Monitorias Econometria II\" use PNAD2013_monit.dta *Explorar a base: browse *Descrição de um comando help summarize *ou também help sum // para abreviar *Estatísticas descritivas: *Vejamos alguns exemplos de comandos para tal propósito: summarize tab V0302 tab V0302 V0601 *Estatísticas descritas apenas dos homens: summarize if V0302==2 *Estatísticas descritas apenas das mulheres: summarize if V0302==4 *Criar dummy sexo: generate mulher = 0 recode mulher 0=1 if V0302==4 *Alternativamente, podemos criar a mesma dummy da seguinte maneira: tab V0302, gen(dum_sexo) drop mulher rename dum_sexo2 mulher *Corrigindo os valores da variável de salário: gen salario=V4719 recode salario 999999999999=. *Para verificar as diferenças advindas da correção de tal variável, faça as duas regressões abaixo: reg V4719 mulher reg salario mulher *Vamos corrigir agora algumas outras variáveis: ***Anos de estudo*** tab V4803 *Atente-se que o problema aqui está no fato de pessoas com 1 ano de estudo completo tem como resposta o número "2". Precisamos "corrigir"! gen educ = V4803 recode educ 1=0 2=1 3=2 4=3 5=4 6=5 7=6 8=7 9=8 10=9 11=10 12=11 13=12 14=13 15=14 16=15 17=. *Vá ao dicionário e veja por que o código "17" foi recodificado como missing acima! ***Raça*** *Vamos criar uma dummy para raça. Como é um fato estilizado conhecido que pessoas negras recebem menos salários, vamos criar uma dummy para quem se declara negro: gen negro = 0 // Não se esqueça que "gen" é a abreviação do comando "generate" *Se quiser checar que de fato a variável criada é br negro *Criar a regra para identificar quem é negro: recode negro 0=1 if V0404==4 recode negro 0=. if V0404==9 *Vá ao dicionário da PNAD disponibilizado e tente entender por que a resposta "9" deve ser tratada como missing! ***Idade*** gen idade = V8005 ***Estudante*** *Temos a V0602 que pergunta se a pessoa frequenta a escola. Podemos criar a partir dela uma dummy para identificar quem é estudante e se isso influencia no salário. *Obs: se você usar o "tab" para a variável V0602, vai perceber que nesta base, apenas cerca de 28% são estudantes. gen estudante = 0 recode estudante 0=1 if V0602==2 *Por fim, faça um exercício com as variáveis criadas e rode uma regressão em busca de explicar a variável "salario": reg salario idade mulher negro educ estudante *Regressão com interações entre as variáveis reg salario idade c.idade#c.idade mulher educ i.mulher#c.educ estudante negro i.negro#c.educ ***FIM***