Programação
-
Olá!
Damos as boas vindas aos participantes da versão 2024 da disciplina
Processamento Reproduzível e Aberto de Dados Científicos (LCF5900)
Dados da Disciplina no Janus - Cursos em InglêsO conteúdo disponibilizado nestas páginas, em Português, apoia as aulas em Inglês
Objetivo:
O curso propõe um conjunto de procedimentos, e apresenta ferramentas, que permitem aos pesquisadores tratar os dados de forma aberta e reproduzível. O objetivo é desenvolver trabalhos científicos que permitam a qualquer pessoa compreender e replicar as etapas de uma análise, replicando-as novamente. A produção de resultados científicos reproduzíveis e abertos, e o uso de fluxos abertos de trabalho, permitem o compartilhamento de análises e a colaboração com outras pessoas, bem como a publicação aberta de dados e fluxos de trabalho para uma melhor disseminação do conhecimento científico.Justificativa:
A ciência aberta envolve a disponibilização de métodos, dados e resultados científicos para todos. Em 2009, Dan Gezelter (http://openscience.org/what-exactly-is-open-science/) citou os seguintes atributos para a ciência aberta:- transparência na coleta de dados;
- clareza na descrição dos métodos de processamento, análise e derivação de resultados;
- acesso público aos dados e métodos de processamento;
- transparência na comunicação dos resultados; e
- colaboração facilitada por mecanismos web.
Introduzimos neste curso os meios para que haja adesão a esses princípios e atributos. Este curso se inspira na forma como o Earth Lab da Universidade de Colorado, Boulder - EUA, forma novos pesquisadores. Ao final da disciplina, você estará familiarizado e terá certa fluência sobre os seguintes tópicos:
- Princípios do processamento reproduzível e aberto de dados;
- Fluxos de trabalho científico reproduzível e aberto;
- Organização de arquivos de dados;
- Uso de Jupyter Notebooks;
- Adoção do Git/GitHub para controle de versão;
- Introdução ao Python: variáveis, listas, pacotes, instruções condicionais, loops e funções;
- Introdução ao R: variáveis, vetores, pacotes, instruções condicionais, loops e funções;
- R tidyverse para manipulação de dados;
- R ggplot2 para geração de gráficos;
- R markdown para relatórios de análise de dados;
- R shiny para disponibilização de resultados na web.
Bibliografia: (Links conferidos em 01 de março de 2024)
- Wickham, Hadley; Çentinkaya-Hundel, Mine; Garret, Grolemund (2021) R for Data Science (2nd ed.). Disponível em: https://r4ds.hadley.nz/.
- Fernanda Peres (2021) Tutoriais sobre R. Disponível em: https://www.youtube.com/@FernandaPeres/playlists.
- Finding Your Way To R. Disponível em: https://education.rstudio.com/learn/.
- How do you create a statistical model using tidymodels Disponível em: https://www.tidymodels.org/start/.
- Leah Wasser & Max Joseph Learn to Use tidyverse and Clean Code to Work With Data in R. Earth Lab at Colorado University, Boulder - USA. Disponível em: https://www.earthdatascience.org/workshops/clean-coding-tidyverse-intro/.
- Learn the tidyverse Disponível em: https://www.tidyverse.org/learn/.
- Lista de livros criados com o pacote bookdown Disponível em: https://bookdown.org/.
- Manual do pacote rmarkdown. Disponível em: https://bookdown.org/yihui/rmarkdown-cookbook/.
- Manual do pacote bookdown Disponível em: https://bookdown.org/yihui/bookdown/.
- Marcus Nunes (2021) Workshop R. Disponível em: https://github.com/mnunes/workshopR.
- Principais marcadores markdown guide. Disponível em: https://www.markdownguide.org/cheat-sheet/.
- Statistical Inference via Data Science: A ModernDive into R and the Tidyverse. Disponível em: https://www.tidymodels.org/books/moderndive/.
- Yihui Xie, Christophe Dervieux & Emily Riederer (2021) R Markdown Cookbook. Disponível em: https://bookdown.org/yihui/rmarkdown-cookbook/.
Forma de avaliação:
Média aritmética de dois trabalhos submetidos para avaliação coletiva quanto à reprodutibilidade e qualidade do relatório disponibilizado em nuvemObservação:
A disciplina é apresentada de forma concentrada e pode contar com a participação de professor ou pesquisador internacional especialmente convidado como conferencista.