Todos alunos deverão apresentar um seminário sobre um assunto relacionado a ciência de dados ao longo da disciplina.

Os seminários serão:

  • em duplas (nem mais nem menos)
  • de 25 a 30 minutos de duração (nem mais nem menos)
  • tópicos escolhidos de uma lista apresentada pelo professor ou sugira um novo tópico
  • tanto forma quanto conteúdo deverão ser de primeira linha
  • Pode ser em inglês ou em português (não pode misturar as duas línguas)

Dicas para elaboração de bons slides: https://www.ime.usp.br/~kon/ResearchStudents/dicasSlides.html

Cadastre a sua dupla e defina o seu tópico em https://forms.gle/eR9iXcb4UeKAY76v5

Tópicos possíveis para os seminários (os itens riscados já foram escolhidos)

  • Testes Estatísticos de Hipótese (quando aplicar cada um, exemplos concretos)
  • Lei Geral de Proteção de Dados (LGPD) no Brasil
  • Raspagem de dados com Scrapy e BeautifulSoup
  • Keras
  • PyTorch
  • TensorFlow
  • mlxtend (machine learning extensions)
  • Reproducible Experiment Platform (REP)
  • XGBoost
  • Hadoop para ciência de dados
  • Princípios de Visualização de dados científicos
    • bibliografia possível: The Visual Display of Quantitative Information e Beautiful Evidence de Edward Tufte
  • Visualização com Seaborn e Bokeh
  • Visualização com Plotly
  • Aplicações Web com Dash
  • Manipulação de grafos/redes com NetworkX
  • Creating an ML workflow for link prediction combining Neo4j and Spark
  • Visualização de grafos com NetworkX, Plotly e Dash
  • Correlação vs. Causalidade
    • bibliografia possível: A Survey of Learning Causality with Data: Problems and Methods; Testing for Causality: A Survey of the Current Literature
  • Artigo: Distinguishing causation and correlation: Causal learning from time-series graphs with trends
  • Ciência de dados Competitiva
  • Transformers
  • Comparação de modelos de Classificação
  • "Redução de Dimensionalidade para Visualização e Análise de Dados"
  • NLP: Como extrair valor de dados textuais
  • Princípios de Visualização de dados científicos e aplicações com Bokeh (com base em 'The Visual Display of Quantitative Information')

Cada dupla deve escolher um outro aluno da turma para ser o seu revisor e cadastrar o nome do revisor até o dia 1/outubro em https://docs.google.com/spreadsheets/d/1-tqAekY3gPdrN2wBn5r7WSI4BzOdqI-qRPe2LNnW8_w/edit

72h antes do seminário, o aluno deve enviar para o revisor (Cc: monitora Luciana) os slides completos do seminário. Em 24h o revisor deve devolver ao aluno apresentador (Cc: monitora) uma revisão detalhada dos slides sugerindo melhorias no conteúdo, listando coisas que não ficaram muito claras, indicando possíveis tópicos importantes que foram esquecidos e fazendo correções. Nos 2 dias seguintes, a dupla deve melhorar sua apresentação, ensaiar algumas vezes e apresentar no dia marcado para seus colegas de turma.

Haverá uma penalidade de 1,0 ponto para a dupla que não enviar os slides para o revisor Cc: monitora com a antecedência indicada acima e 2,0 pontos para aqueles que não enviarem.

Espera-se slides excelentes e uma apresentação oral muito boa.

Espera-se que o aluno tenha um bom conhecimento da área que está apresentando, portanto, ele deve estudar mais do que apenas aquilo que ele vai apresentar.

Última atualização: segunda-feira, 28 set. 2020, 17:05