Programação

  • Olá!
    Usaremos um sistema híbrido de ensino (aulas presenciais e à distância)
    (clique aqui para acessar a Sala Principal)

    Damos as boas vindas aos participantes da versão 2023 da disciplina
    Processamento Reproduzível e Aberto de Dados Científicos (LCF5900)

    O conteúdo disponibilizado nestas páginas, em Português, apoia as aulas em Inglês


    Objetivo:
    O curso propõe um conjunto de procedimentos, e apresenta ferramentas, que permitem aos pesquisadores tratar os dados de forma aberta e reproduzível. O objetivo é desenvolver trabalhos científicos que permitam a qualquer pessoa compreender e replicar as etapas de uma análise, replicando-as novamente. A produção de resultados científicos reproduzíveis e abertos, e o uso de fluxos abertos de trabalho, permitem o compartilhamento de análises e a colaboração com outras pessoas, bem como a publicação aberta de dados e fluxos de trabalho para uma melhor disseminação do conhecimento científico.

    Justificativa:
    A ciência aberta envolve a disponibilização de métodos, dados e resultados científicos para todos. Em 2009, Dan Gezelter (http://openscience.org/what-exactly-is-open-science/) citou os seguintes atributos para a ciência aberta: transparência na coleta de dados; clareza na descrição dos métodos de processamento, análise e derivação de resultados; acesso público aos dados e métodos de processamento; transparência na comunicação dos resultados; e a colaboração facilitada por mecanismos web. Introduzimos neste curso os meios para que adesão a esses princípios e atributos. Este curso se inspira na forma como o Earth Lab da Universidade de Colorado, Boulder - EUA, forma novos pesquisadores.

    Conteúdo:
    1. Princípios do processamento reproduzível e aberto de dados;
    2. Fluxos de trabalho científico reproduzível e aberto;
    3. Organização de arquivos de dados;
    4. Uso de Jupyter Notebooks;
    5. Adoção do Git/GitHub para controle de versão;
    6. Introdução ao Python;
    6.1 Variáveis, listas, pacotes, instruções condicionais, loops e funções;
    7. Introdução ao R;
    7.1. Variáveis, vetores, pacotes, instruções condicionais, loops e funções;
    8. R tidyverse para manipulação de dados;
    9. R ggplot2 para geração de gráficos;
    10. R markdown para relatórios de análise de dados;
    11. R shiny para disponibilização de resultados na web.

    Bibliografia:
    Fernanda Peres (2021) Tutoriais sobre R. Disponível em: https://www.youtube.com/channel/UCx1vXgGDXc7BH7bI1KC_o7Q. Acesso em 30 de jun. de 2021.

    Finding Your Way To R. Disponível em: https://education.rstudio.com/learn/. Acesso em 30 de jun. de 2021.

    How do you create a statistical model using tidymodels Disponível em: https://www.tidymodels.org/start/. Acesso em 30 de jun. de 2021.

    Leah Wasser & Jenny Palomino (2021) Introduction to Earth Data Science. Earth Lab at Colorado University, Boulder - USA. Disponível em: https://www.earthdatascience.org/courses/intro-to-earthdata-science/. Acesso em 30 de jun. de 2021.

    Learn the tidyverse Disponível em: https://www.tidyverse.org/learn/. Acesso em 30 de jun. de 2021.

    Lista de livros criados com o pacote bookdown Disponível em: https://bookdown.org/. Acesso em 30 de jun. de 2021.

    Manual do pacote rmarkdown. Disponível em: https://bookdown.org/yihui/rmarkdown-cookbook/. Acesso em 30 de jun. de 2021.

    Manual do pacote bookdown Disponível em: https://bookdown.org/yihui/bookdown/. Acesso em 30 de jun. de 2021.

    Marcus Nunes (2021) Workshop R. Disponível em: https://github.com/mnunes/workshopR. Acesso em 30 de jun. de 2021.

    Principais marcadores markdown guide. Disponível em: https://www.markdownguide.org/cheatsheet/. Acesso em 30 de jun. de 2021. 

    Statistical Inference via Data Science: A ModernDive into R and the Tidyverse. Disponível em: https://www.tidymodels.org/books/moderndive/. Acesso em 30 de jun. de 2021. 

    Yihui Xie, Christophe Dervieux & Emily Riederer (2021) R Markdown Cookbook. Disponível em: https://bookdown.org/yihui/rmarkdown-cookbook/. Acesso em 30 de jun. de 2021.

    Forma de avaliação:
    Média aritmética de dois trabalhos submetidos para avaliação coletiva quanto à reprodutibilidade e qualidade do relatório disponibilizado em nuvem

    Observação:
    A disciplina é apresentada de forma concentrada e pode contar com a participação de professor ou pesquisador internacional especialmente convidado como conferencista.


    OpenScience and OpenData: Pros & Cons according to chatGPT, a "trendy" AI LLM algorithm.

    Prompt: Do you agree that access to data and science should be open and free? Positive or otherwise, what arguments would you use to build your case?

    chatGPT: "As an AI language model, I do not have personal opinions or beliefs, but I can provide arguments for both sides of this issue.

    On one hand, proponents of open access to data and science argue that making information free and easily accessible can benefit society as a whole. By removing financial barriers to information, more people can access knowledge and contribute to scientific progress. This can lead to the development of new technologies and innovations that can improve people's lives. In addition, open access can promote transparency and accountability in research, as well as increase collaboration among scientists and researchers.

    On the other hand, some may argue that making data and science freely accessible can have negative consequences. For instance, making research findings available to the public can lead to misinterpretation or misuse of the data. Furthermore, some argue that researchers should be compensated for their work, and that open access may discourage investment in research.

    Overall, the debate on whether access to data and science should be open and free is complex and multifaceted. While open access can lead to many positive outcomes, there are also potential drawbacks that need to be taken into account. Ultimately, the decision on whether to make data and science freely accessible should be based on careful consideration of the potential benefits and drawbacks."