Seminários dos alunos
Todos alunos deverão apresentar um seminário sobre um assunto relacionado a ciência de dados ao longo da disciplina.
Os seminários serão:
- em duplas (nem mais nem menos)
- de 25 a 30 minutos de duração (nem mais nem menos)
- tópicos escolhidos de uma lista apresentada pelo professor ou sugira um novo tópico
- tanto forma quanto conteúdo deverão ser de primeira linha
- Pode ser em inglês ou em português (não pode misturar as duas línguas)
Dicas para elaboração de bons slides: https://www.ime.usp.br/~kon/ResearchStudents/dicasSlides.html
Cadastre a sua dupla e defina o seu tópico em https://forms.gle/eR9iXcb4UeKAY76v5
Tópicos possíveis para os seminários (os itens riscados já foram escolhidos)
- Testes Estatísticos de Hipótese (quando aplicar cada um, exemplos concretos)
- incluir na bibliografia: https://dl.acm.org/doi/abs/10.5555/3122009.3176821
- Lei Geral de Proteção de Dados (LGPD) no Brasil
- Raspagem de dados com Scrapy e BeautifulSoup
KerasPyTorchTensorFlow- mlxtend (machine learning extensions)
- Reproducible Experiment Platform (REP
) XGBoost- Hadoop para ciência de dados
- Princípios de Visualização de dados científicos
- bibliografia possível: The Visual Display of Quantitative Information e Beautiful Evidence de Edward Tufte
- Visualização com Seaborn e Bokeh
- Visualização com Plotly
- Aplicações Web com Dash
- Manipulação de grafos/redes com NetworkX
- Creating an ML workflow for link prediction combining Neo4j and Spark
Visualização de grafos com NetworkX, Plotly e DashCorrelação vs. Causalidadebibliografia possível: A Survey of Learning Causality with Data: Problems and Methods; Testing for Causality: A Survey of the Current LiteratureArtigo: Distinguishing causation and correlation: Causal learning from time-series graphs with trendsCiência de dados CompetitivaTransformersComparação de modelos de Classificação"Redução de Dimensionalidade para Visualização e Análise de Dados"NLP: Como extrair valor de dados textuaisPrincípios de Visualização de dados científicos e aplicações com Bokeh (com base em 'The Visual Display of Quantitative Information')
Cada dupla deve escolher um outro aluno da turma para ser o seu revisor e cadastrar o nome do revisor até o dia 1/outubro em https://docs.google.com/spreadsheets/d/1-tqAekY3gPdrN2wBn5r7WSI4BzOdqI-qRPe2LNnW8_w/edit
72h antes do seminário, o aluno deve enviar para o revisor (Cc: monitora Luciana) os slides completos do seminário. Em 24h o revisor deve
devolver ao aluno apresentador (Cc: monitora) uma revisão detalhada dos slides
sugerindo melhorias no conteúdo, listando coisas que não ficaram muito
claras, indicando possíveis tópicos importantes que foram esquecidos e
fazendo correções. Nos 2 dias seguintes, a dupla deve melhorar sua
apresentação, ensaiar algumas vezes e apresentar no dia marcado para
seus colegas de turma.
Haverá uma penalidade de 1,0 ponto para a dupla que não enviar os slides para o revisor Cc: monitora com a antecedência indicada acima e 2,0 pontos para aqueles que não enviarem.
Espera-se slides excelentes e uma apresentação oral muito boa.
Espera-se que o aluno tenha um bom conhecimento da área que está apresentando, portanto, ele deve estudar mais do que apenas aquilo que ele vai apresentar.