Diagrama de temas
- Aula 1.1
- Aula 1.2
- Aula 1.3
- Aula 2.1
- Aula 2.2
- Aula 3.1
- Aula 3.2
- Aula 3.3
- Aula 4.1
- Aula 4.2
- Aula 5.1
- Aula 5.2
-
Dia 12/03/2025 (14:00 - 17:00)
Parte 3
-
4. Organização de arquivos de dados
Use nomes expressivos para arquivos e diretórios
Nomes expressivos de arquivos e diretórios permitem que sejam rapidamente encontrados. Isso promove a reprodutibilidade, facilita a que outras pessoas compreendam o conteúdo dos seus arquivos e dos seus fluxos de trabalho. Certifique-se de organizar os arquivos relacionados em pastas que podem ajudá-lo a categorizar e encontrar facilmente o que você precisa (por exemplo, dados brutos, scripts, resultados).
Proteja seus dados brutos
Não modifique (ou substitua) os dados brutos. Mantenha as saídas de dados separadas das entradas, para que você possa facilmente executar novamente o seu fluxo de trabalho conforme necessário. Isso é feito facilmente se você organizar seus dados em diretórios que separam os dados brutos de seus resultados, etc.
-
Atividade Prática
Organizando Dados Climáticos
Explore esta longa série de dados meteorológicos de Piracicaba com início no ano de 1902. Os dados climatológicos diários registrados nessa planilha foram extraídos da Série de Dados Climatológicos do Campus Luiz de Queiroz da USP em Piracicaba, mantida pelo Departamento de Engenharia de Biossistemas, da Escola Superior de Agricultura "Luiz de Queiroz" - Universidade de São Paulo (LEB/ESALQ/USP).
À série de dados original foram acrescidos os campos Estiagem (variável que categoriza o dia por grupo de "dias seguidos de seca"), Semestre (categoriza o semestre, 1 ou 2 ), ElNino (categoriza por intensidade do fenômeno El Niño, ), e Estacao (indica a estação climática: Verão 22/12-20/3, Outono 21/3-20/6, Inverno 21/6-22/9, e Primavera 23/9-21/12). Organize da forma que achar mais interessante um conjunto de informações extraídas dessa planilha para em seguida apresentá-las aos demais grupos no final da aula.
Confira se a planilha segue as sugestões discutidas até o momento no curso (para mais informação sobre tidy data, clique aqui). Em seguida, usando o ambiente RStudio Cloud (crie conta, se ainda não tiver) vamos explorar as características desses dados usando uma rotina R nesse tipo de ambiente aberto.
-