Programação

  • Semana 1

  • Semana 2

    • Os grupos deverão entregar um documento em PDF contendo uma descrição dos dados com os quais trabalharão. Para isso, deverão apresentar resultados de uma análise estatística descritiva, tanto na forma numérica quanto na forma de gráficos e deverão incluir uma explicação textual sobre as descobertas mais interessantes, úteis e relevantes sobre os dados. Por fim, deve-se fazer qualquer discussão/reflexão que os membros do grupo considerem relevantes.

      Espera-se que o documento tenha entre 5 e 10 páginas de comprimento e ele deve ser escrito tendo em mente que o leitor não conhece os dados; esse documento é o primeiro contato do leitor com esses dados. Apenas 1 elemento do grupo deve entregar o trabalho no edisciplinas.

      Preferencialmente, ferramentas do ecossistema de Python devem ser usadas, pois é o ambiente que usaremos na disciplina. Mas caso haja algum resultado interessante que possa ser obtido com outro tipo de ferramenta, fiquem à vontade de inluir no trabalho (mas isso não é necessário).
  • Semana 3

    • Cada grupo deverá entregar um documento PDF de aproximadamente 3 páginas contendo uma lista de Questões de Pesquisa a serem respondidas até o final do semestre e um planejamento das atividades da equipe.

      As questões de pesquisa deverão ser extraídas a partir dos contatos com os clientes, mas redigidas pelo grupo. A resposta às questões de pesquisa devem ser interessantes o suficientes para gerar um artigo científico (ou seja, representar um conhecimento novo que é gerado) ou trazer um ganho significativo para o cliente por meio de geração de conhecimento).

      O planejamento deverá cobrir todo o período até o dia 14 de dezembro e indicar qual parte do projeto já estará pronta em cada uma das 7 entregas (vide https://edisciplinas.usp.br/mod/page/view.php?id=3126677). O detalhamento dos 30 dias iniciais do projeto deverá ser mais detalhado.

      Apenas um membro do grupo deverá efetuar a entrega no edisciplinas até às 12:00 (meio-dia) do dia 14 de setembro.

  • Semana 4 - 21/setembro

  • Semana 5 - 28/setembro

    Esclarecimentos sobre:

    • seminários
    • correção da Fase 2
    • próxima entrega, Fase 3
    Reuniões individuais com os grupos para avaliar andamento e dificuldades.
  • Semana 6 - 5/outubro

  • Semana 7 - 12/outubro (feriado)

  • Semana 8 - 19/outubro

    • Seminário 1: NLP: Como extrair valor de dados textuais (Verena Christian Saeta e Ricardo Tanaka)
    • Seminário 2: Artigo: Distinguishing causation and correlation: Causal learning from time-series graphs with trends (Nicolas Vana e Liang Shen)
    • Seminário 3: LGPD (Marcelo Cirilo)
  • Semana 9 - 26/outubro

    • Seminário 4: "Redução de Dimensionalidade para Visualização e Análise de Dados" (Wesley Seidel Carvalho e Tiago Lubiana Alves)
    • Seminário 5: Princípios de Visualização de dados científicos e aplicações com Bokeh (com base em 'The Visual Display of Quantitative Information') (Layane Menezes Azevedo e Gabriely Rangel Pereira)
    • Seminário 6: XGBoost - aplicações no setor de vestuário (Andre Marques e Denise Florio)
  • Semana 10 - 2/novembro (feriado)

    • Olá,

      Nesta semana de feriado e eleições norte-americanas, vamos estudar um pouco sobre Jornalismo de dados. Inicialmente, vocês devem dar uma lida nos seguintes documentos:

      • https://en.wikipedia.org/wiki/Data_journalism
      • https://en.wikipedia.org/wiki/Data-driven_journalism
      • https://datajournalism.com/
      e dar uma olhada nos seguintes exemplos interessantes:

      • https://archive.nytimes.com/www.nytimes.com/interactive/2009/11/06/business/economy/unemployment-lines.html?emc=eta1
      • https://github.com/newsdev
      • https://www.nytimes.com/2020/06/10/learning/over-60-new-york-times-graphs-for-students-to-analyze.html
      Finalmente, você deve buscar na Web, ou em qualquer veículo de imprensa, um exemplo interessante de jornalismo de dados de alta qualidade e, em seguida, escrever um texto de 10 a 30 linhas explicando do que se trata a matéria, por que ela é interessante e quais foram as estratégias usadas pelo jornalista para escrever uma matéria que você considerou de alta qualidade.

      Entregue seu texto num documento PDF contendo seu nome e a URL de onde está a matéria original. Caso seja uma notícia em um site que exige assinatura/pagamento para ter acesso, por favor, inclua no seu PDF a matéria na íntegra (se for Folha de São Paulo, Estadão ou New York Times não precisa fazer isso pois eu já tenho acesso).


  • Semana 11 - 9/novembro

    • Seminário 7: Transformers (Pedro Henrique Barbosa de Almeida e Thomas Palmeira Ferraz)
    • Seminário 8: Correlação vs. Causalidade bibliografia possível: A Survey of Learning Causality with Data: Problems and Methods; Testing for Causality: A Survey of the Current Literature (Brenda Ramires e Gabriel Miranda de Araujo)
    • Seminário 9: Visualização de grafos com NetworkX, Plotly e Dash (Gabriel Martins Trettel e Bruno Aristimunha Pinto)

  • Semana 12 - 16/novembro

    • Seminário 10: Pytorch (Izabela Fonseca e Felipe Noronha)
    • Seminário 11: Comparação de modelos de classificação (Giovana Martinelli e Jonatas Amorim)
    • Seminário 12: Tensorflow (Jônatas de Souza Nascimento e George Othon Silva Santos)

  • Semana 13 - 23/novembro

    • Seminário 13: Ciência de Dados Competitiva (Eduardo Rocha Laurentino e Artur Santos)
    • Seminário 14: Inferência de Impacto Causal (Erick Andrade e Felipe Willemann)

  • Semana 14 - 30/novembro

  • Semana 15 - 7/dezembro

  • Semana 16 - 14/dezembro

    • Apresentações de 10 minutos por grupo

      Caprichar na:

      1) Qualidade da Apresentação Oral

      2) Qualidade Visual (slides/vídeo/demonstração)

      3) Qualidade da documentação (README.md no Gitlab do projeto) (para 15/dezembro à 23:59)
          - Como rodar o software
          - Definir uma licença de distribuição
          - Descrição do problema e da solução que foi desenvolvida
          - Descrição dos dados
          - Quais coisas foram tentadas e não deram certo
          - Quais coisas deram certo e quais os resultados obtidos

      Lembre das Dicas para preparação de slides