Kursthemen

  • Olá!

    Damos as boas vindas aos participantes da versão 2024 da disciplina

    Processamento Reproduzível e Aberto de Dados Científicos (LCF5900)

    O conteúdo disponibilizado nestas páginas, em Português, apoia as aulas em Inglês


    Objetivo:
    O curso propõe um conjunto de procedimentos, e apresenta ferramentas, que permitem aos pesquisadores tratar os dados de forma aberta e reproduzível. O objetivo é desenvolver trabalhos científicos que permitam a qualquer pessoa compreender e replicar as etapas de uma análise, replicando-as novamente. A produção de resultados científicos reproduzíveis e abertos, e o uso de fluxos abertos de trabalho, permitem o compartilhamento de análises e a colaboração com outras pessoas, bem como a publicação aberta de dados e fluxos de trabalho para uma melhor disseminação do conhecimento científico.

    Justificativa:
    A ciência aberta envolve a disponibilização de métodos, dados e resultados científicos para todos. Em 2009, Dan Gezelter (http://openscience.org/what-exactly-is-open-science/) citou os seguintes atributos para a ciência aberta:

    • transparência na coleta de dados;
    • clareza na descrição dos métodos de processamento, análise e derivação de resultados; 
    • acesso público aos dados e métodos de processamento;
    • transparência na comunicação dos resultados; e 
    • colaboração facilitada por mecanismos web.

    Introduzimos neste curso os meios para que haja adesão a esses princípios e atributos. Este curso se inspira na forma como o Earth Lab da Universidade de Colorado, Boulder - EUA, forma novos pesquisadores. Ao final da disciplina, você estará familiarizado e terá certa fluência sobre os seguintes tópicos:

    1. Princípios do processamento reproduzível e aberto de dados;
    2. Fluxos de trabalho científico reproduzível e aberto;
    3. Organização de arquivos de dados;
    4. Uso de Jupyter Notebooks;
    5. Adoção do Git/GitHub para controle de versão;
    6. Introdução ao Python: variáveis, listas, pacotes, instruções condicionais, loops e funções;
    7. Introdução ao R: variáveis, vetores, pacotes, instruções condicionais, loops e funções;
    8. R tidyverse para manipulação de dados;
    9. R ggplot2 para geração de gráficos;
    10. R markdown para relatórios de análise de dados;
    11. R shiny para disponibilização de resultados na web.

    Bibliografia: (Links conferidos em 01 de março de 2024)


    Forma de avaliação:
    Média aritmética de dois trabalhos submetidos para avaliação coletiva quanto à reprodutibilidade e qualidade do relatório disponibilizado em nuvem

    Observação:
    A disciplina é apresentada de forma concentrada e pode contar com a participação de professor ou pesquisador internacional especialmente convidado como conferencista.