************************************************************ ******EAE0324: Econometria I******************************** ******Professora: Paula Pereda****************************** ******Monitores: Bernardo Ostrovski e Igor Barreto********** ******São Paulo - Ago/2017********************************** ************************************************************ ******************************************************** *** ******(M) (O) (N) (I) (T) (O) (R) (I) (A) (01)*** ************************************************************ ************************************************************ ******NÃO RODAR NADA ANTERIOR À LINHA 30 !!!!*************** ************************************************************ ************************************************************ Após escrever um comando, utilizar "//" para acrescentar comentários: clear all //bla bla bla. Usando "*" antes de iniciar uma linha serve para a mesma finalidade, mas não pode se utilizar no meio da frase: * clear bla bla bla Utilizando "/*" no início, torna tudo em seguida lido como comentário, até que apareça um "*/" para finalizar: /* bla bla bla clear all bla bla clear all bla bla bla bla */ set more off, perm // Para os resultados descerem independentemente do tamanho do comando. use "C:\Users\Be\Documents\Stata\Stata14\ado\base\u\uslifeexp.dta", clear // Abrindo um arquivo .dta do computador, que já vem com o Stata. save "C:\Users\Be\Desktop\Stata\useduc.dta" //Salvando o .dta em uso em determinada pasta do computador. drop year // Deletar a variável "year". drop _all // Deletar todas variáveis. clear all // Limpar tudo mais que estiver em vigor. help cd /* Um dos comandos mais importantes a se usar, principalmente no início, é o help. Ele abre uma nova aba, do próprio Stata, explicando detalhadamente o funcionamento do comando desejado, com todas as opções dele e alguns exemplos. */ cd "C:\Users\Be\Desktop\Stata" // Definindo a pasta na qual trabalharemos a partir de agora. use uslifeexp.dta // Abrindo o arquivo uslifeexp.dta, já considerando que estamos no diretório definido acima. br // Para observar os dados que estão na base. Pode clicar no ícone da lupa, no alto da tela principal. destring, replace // Transformar variáveis texto em numérica. rename year ano // Renomear a variável "year" para "ano". OBS: O Stata diferencia maiúsculas e minúsculas, assim como acentos. Tente usar apenas minúsculas sem acentos. sort le // Ordenando os dados de forma crescente pela variável le=Expectativa de Vida. Note que 1918 é a menor de todas (Você saberia dizer o motivo?). order *, alphabetic // Ordenar as variáveis de forma alfabética. Existem outras opções além da alfabética save uslifeexp.dta clear all webuse uslifeexp // Abrindo a mesma base através do site do Stata (existem bases salvas lá e em muitos helps eles se utilizam delas) clear all use uslifeexp.dta summarize // Nos recupera uma tabela de estatísticas descritivas das variáveis da nossa base. sum // Alguns comandos permitem "shortcuts" na hora de serem usados. sum, detail // Mesma coisa que antes mas com algumas informações a mais. codebook, all // Fornece mais informações sobre as variáveis de interesse, além de mostrar o número de missings. log using log_uslifeexp, replace // O log funciona como um histórico do ocorrido. É útil para que possamos ler o que ocorreu no programa se deixarmos ele rodando. No caso do replace ele cria um novo mas poderíamos ir adicionando novos históricos no mesmo arquivo, usando o append ao invés de replace. summarize codebook, all log close translate log_uslifeexp.smcl log_uslifeexp.pdf // Vai transformar o arquivo log em pdf, permitindo uma leitura melhor. tabulate ano // Retorna as frequências de cada variável. tab ano tabstat le, stat(mean sd p50 p25 p75 p90 p95) // Retorna estatísticas de interesse sobre a variável le. generate log_le = ln(le) // Criando a variável que capta o logaritmo natural da expectativa de vida. label variable log_le "log(le)" // O label é como uma curta descrição da variável. gen dm_le = le - 64.829 lab variable dm_le "diferença de le para a média de le" gen dif_wb = le_w - le_b lab variable dif_wb "diferença de le_w para a le_b" gen a=_n // Gera uma variável que enumera as observações de 1 até o tamanho da base, de acordo com o sort feito pela última vez. gen me_exclua="_n" // Gera uma variável string escrito "_n" drop me_exclua // Deleta a variável "me_exclua". tostring a, replace // Agora a variável "a" passa a ser lida como texto. egen med_le = mean(le) // Cria uma variável a partir de alguma função. No caso, a média da variável expectativa de vida. gen dm_le2 = le - med_le // Veja que poderíamos ter criado "dm_le" dessa maneira. drop dm_le2 med_le tostring le, gen(le_string) force gen le1=substr( le_string,1,2) // Essa função é bastante útil para retirarmos apenas parte de variáveis que estão como texto (strings). Para quem usa Excel, funciona como o comando esquerda/left ou direita/right. destring le1, replace // No caso, criamos uma variável com a expectativa de vida, mas em as casas decimais. drop le_string gen faixa_le = 0 replace faixa_le = 1 if le1<50 replace faixa_le = 2 if 50<=le1 & le1<60 replace faixa_le = 3 if 60<=le1 & le1<70 replace faixa_le = 4 if le>=70 tab ano faixa_le // Tabula as informações da variável ano separando pela faixa de le. tabstat le, by( faixa_le) // Tabula algumas estatísticas da variável le conforme a faixa de le. destring a, replace corr dif_wb a // Verificando a correlação entre dif_wb e o tempo. Note que foi necessário passar a variável temporal para numérica. findit outreg2 // Para procurar determinado pacote. ssc install outreg2 // Instalando o pacote. /* Vamos criar um loop agora. Ele ajuda bastante quando precisamos rodar várias vezes o mesmo comando, para diferentes categorias, por exemplo. No caso abaixo, estamos com um exemplo simples, aonde escolhemos 3 variáveis (log_le dm_le dif_wb) e para cada uma retiramos algumas estatísticas. */ foreach var in log_le dm_le dif_wb { tabstat `var', by(faixa_le) } histogram faixa_le // Cria um histograma da variável selecionada. Veja pelo help do comando que é possível alterar cor, adicionar títulos, nome para os eixos, etc. graph twoway scatter le1 ano // Criar um gráfico a partir das variáveis le1 e ano. É possível criar gráficos manualmente, clicando na aba "Graphics", que fica no menu do alto da tela principal do Stata. scatter le1 ano // Note que era possível omitir os dois primeiros comandos, pois o Stata já entende que estamos criando um gráfico. * O gráfico abaixo foi feito manualmente, pelo próprio menu de criação/edição de gráficos: twoway (line le_male ano, lcolor(red) connect(ascending)), ytitle(Expectativa de vida dos homens (EUA)) yscale(lpattern(solid)) xtitle(Ano (1900-1999)) xscale(lpattern(solid)) legend(on) name(Gráfico_01) graph twoway (scatter le_male ano) (scatter le_female ano) // Se quiséssemos comparar o comportamento de duas variáveis com relação a uma mesma, poderíamos fazer dessa forma. scatter le_w le_b ano // Analogamente, também podemos resumir o comando acima. save uslifeexp.dta