Programação
-
Olá!
Usaremos um sistema híbrido de ensino (aulas presenciais e à distância)
(clique aqui para acessar a Sala Principal)Damos as boas vindas aos participantes da versão 2023 da disciplina
Processamento Reproduzível e Aberto de Dados Científicos (LCF5900)O conteúdo disponibilizado nestas páginas, em Português, apoia as aulas em Inglês
Objetivo:
O curso propõe um conjunto de procedimentos, e apresenta ferramentas, que permitem aos pesquisadores tratar os dados de forma aberta e reproduzível. O objetivo é desenvolver trabalhos científicos que permitam a qualquer pessoa compreender e replicar as etapas de uma análise, replicando-as novamente. A produção de resultados científicos reproduzíveis e abertos, e o uso de fluxos abertos de trabalho, permitem o compartilhamento de análises e a colaboração com outras pessoas, bem como a publicação aberta de dados e fluxos de trabalho para uma melhor disseminação do conhecimento científico.Justificativa:
A ciência aberta envolve a disponibilização de métodos, dados e resultados científicos para todos. Em 2009, Dan Gezelter (http://openscience.org/what-exactly-is-open-science/) citou os seguintes atributos para a ciência aberta: transparência na coleta de dados; clareza na descrição dos métodos de processamento, análise e derivação de resultados; acesso público aos dados e métodos de processamento; transparência na comunicação dos resultados; e a colaboração facilitada por mecanismos web. Introduzimos neste curso os meios para que adesão a esses princípios e atributos. Este curso se inspira na forma como o Earth Lab da Universidade de Colorado, Boulder - EUA, forma novos pesquisadores.Conteúdo:
1. Processamento reproduzível e aberto de dados - introdução
2. Fluxos de trabalho científico reproduzível e aberto
3. Organização de arquivos de dados
4. Uso de Jupyter Notebooks
5. Uso de ferramentas que permitem trabalho colaborativo
5.1. DokuWiki para disponibilização de conteúdo web
5.2. Git/GitHub para controle de versão
6. Introdução ao R e Python
6.1. Programando em Python
6.2. Programando em R
7. Estruturando dados segundo princípios tidy
8. Gráficos como objetos - uso do pacote ggplot
9. Publicação de resultados com apoio dos pacotes rMarkdown
10. Trabalho de ConclusãoBibliografia (acesso em 30 de jun. de 2021):
Fernanda Peres Tutoriais sobre R
Finding Your Way To R
How do you create a statistical model using tidymodels
Introduction to Earth Data Science. Earth Lab at ColoradoUniversity, Boulder - USA
Learn the tidyverse
Lista de livros criados com o pacote bookdown
Manual do pacote rmarkdown
Manual do pacote bookdown
Marcus Nunes Workshop R
Principais marcadores markdown guide
Statistical Inference via Data Science: A Modern Dive into R and the Tidyverse
R Markdown CookbookForma de avaliação:
Média aritmética de dois trabalhos submetidos para avaliação coletiva quanto à reprodutibilidade e qualidade do relatório disponibilizado em nuvemObservação:
A disciplina é apresentada de forma concentrada e pode contar com a participação de professor ou pesquisador internacional especialmente convidado como conferencista.
OpenScience and OpenData: Pros & Cons according to chatGPT, a "trendy" AI LLM algorithm.
Prompt: Do you agree that access to data and science should be open and free? Positive or otherwise, what arguments would you use to build your case?
chatGPT: "As an AI language model, I do not have personal opinions or beliefs, but I can provide arguments for both sides of this issue.
On one hand, proponents of open access to data and science argue that making information free and easily accessible can benefit society as a whole. By removing financial barriers to information, more people can access knowledge and contribute to scientific progress. This can lead to the development of new technologies and innovations that can improve people's lives. In addition, open access can promote transparency and accountability in research, as well as increase collaboration among scientists and researchers.
On the other hand, some may argue that making data and science freely accessible can have negative consequences. For instance, making research findings available to the public can lead to misinterpretation or misuse of the data. Furthermore, some argue that researchers should be compensated for their work, and that open access may discourage investment in research.
Overall, the debate on whether access to data and science should be open and free is complex and multifaceted. While open access can lead to many positive outcomes, there are also potential drawbacks that need to be taken into account. Ultimately, the decision on whether to make data and science freely accessible should be based on careful consideration of the potential benefits and drawbacks."