Programação

  • Aula 01 (07/08) - Introdução ao Python

    Objetivos:

     - Introduzir o Google Colab, principal ferramenta de nossas aulas;

    - Apresentar os principais tipos de variáveis e estruturas de dados em Python

    Leitura Obrigatória: 

    Menezes, Nilo Ney Coutinho (2019). Capítulo 3 - “Variáveis e entrada de dados”, Capítulo 4 - “Condições”, Cap. 5 - “Repetições” e Capítulo 6 - “Listas” em “Introdução à Programação com Python”. Terceira Edição, Editora Novatec. pp. 49-136. 

    Bibliografia Complementar: 

    McKinney, Wes (2022) - Chapter 3. “Built-In Data Structures, Functions, and Files” in “Python for Data Analysis Data Wrangling with pandas, NumPy, and Jupyter”. Third Edition. O’Reilly. Matthes, Eric (2023) - Python Crash Course - A Hands-On, Project-Based Introduction to Programming. 3rd Edition. No Starch Press.

  • Aula 2 (14/08) - Condicionais e Loops

    Objetivos: 

    - Apresentar algumas declarações condicionais

     - Introduzir as estruturas de repetição (Loops) e suas duas principais formas. 

    Leitura Obrigatória: 

    Lutz, Mark (2013). Chapter 12 “if Tests and Syntax Rules”, Chapter 13 “While and for Loops”, and Chapter 14 “Iterations and Comprehensions” in “Learning Python”. 5th Edition, O”Reilly Media, Inc. 

    Bibliografia Complementar:

     Matthes, Eric (2023) - “Chapter 5: If Statements” and “Chapter 7: User Input and While Loops” in “Python Crash Course - A Hands-On, Project-Based Introduction to Programming”. 3rd Edition. No Starch Press.

  • Aula 3 (21/08) - Funções, Módulos e Introdução ao Numpy

    Objetivos: 

    - Apresentar as funções e como criá-las; 

    - Como importar módulos, convenções de importação e principais módulos; 

    - Introdução ao Numpy e seus principais módulos. 

    Leitura Obrigatória: 

    McKinney, Wes (2022) - Chapter 3. “Built-In Data Structures, Functions, and Files” and Chapter 4. “NumPy Basics: Arrays and Vectorized Computation” in “Python for Data Analysis Data Wrangling with pandas, NumPy, and Jupyter”. Third Edition. O’Reilly. 

    Bibliografia Complementar: 

    Lutz, Mark (2013). Chapter 16 “Function Basics”, Chapter 22 “Modules: The Big Picture”, Chapter 23 “Module Coding Basics” in “Learning Python”. 5th Edition, O”Reilly Media, Inc. 

    Matthes, Eric (2023) - “Chapter 8: Functions” in “Python Crash Course - A Hands-On, Project-Based Introduction to Programming”. 3rd Edition. No Starch Press.

  • Aula 4 (28/08) -Pandas, Dados e Estatísticas Resumidas

    Objetivos: 

    - Introduzir o aluno ao Pandas 

    - Como abrir arquivos Excel, .CSV, etc. 

    - Manipulação, Organização e Limpeza de Dados; 

    - Estatísticas Resumidas

    Leitura Obrigatória: 

    McKinney, Wes (2022) - Chapter 5. “Getting Started with pandas”, Chapter 6. “Data Loading, Storage, and File Formats”, Chapter 7. “Data Cleaning and Preparation” and “8. Data Wrangling: Join, Combine, and Reshape” in “Python for Data Analysis Data Wrangling with pandas, NumPy, and Jupyter”. Third Edition. O’Reilly

  • Aula 5 (11/09) - Visualização de Dados em Python

    Objetivos: 

    - Introduzir o aluno aos principais pacotes de visualização no Python; 

    - Identificação das melhores visualizações para cada tipo de dado; 

    - Destacar algumas visualizações específicas de Text as Data 

    Leitura Obrigatória:

     McKinney, Wes (2022) - Chapter 9. “Plotting and Visualization”, Chapter 10. “10. Data Aggregation and Group Operations” in “Python for Data Analysis Data Wrangling with pandas, NumPy, and Jupyter”. Third Edition. O’Reilly. 

    Bibliografia Complementar:

     Massaron, Lucas; Boschetti, Alberto (2019) - Chapter 5 “Visualization, Insights, and Results” in “Python Data Science Essentials” - A practitioner's guide covering essential data science principles, tools, and techniques. Third Edition. Published by Packt Publishing Ltd.

  • Aula 6 (18/09) - Aprendizado Estatístico e Aprendizado de Máquina

    Objetivos: 

    - Apresentar o aprendizado de máquina e principais tarefas;

     - Diferenciar Aprendizado Supervisionado de Não Supervisionado; 

    - Possíveis problemas que podem surgir e cuidados a se tomar 

    Leitura Obrigatória:

     Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “Introduction” e “2 Statistical Learning” in “An Introduction to Statistical Learning: with Applications in Python”. Springer. 

    Bibliografia Complementar: 

    Géron, Aurelien. (2022). “The Machine Learning Landscape” in “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems”

  • Aula 7 (02/10) - O Problema de Anotação do Training DataSet

    Objetivos: 

    - Compreender as principais abordagens e problemas na anotação de um banco de dados

    - Discussão dos conceitos de concordância dos anotadores, e possíveis fontes de viés na anotação.

    Leitura Obrigatória: 

    Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “Classification” in “An Introduction to Statistical Learning: with Applications in Python”. Springer. 

    Kuhn, Max and Johnsonn, Kjell. (2018). “Chapter 11 Measuring Performance in Classification Models” in “Applied Predictive Modeling”. Springer Science+Business Media, New York.

    Bibliografia Complementar:

    Géron, Aurelien. (2022). “3. Classification" in Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems

  • Aula 08 (09/10) - Classificação e Comparação de Modelos

    Objetivos: 

    - Treinamento de alguns modelos menos computacionalmente intensivos (Regressão Logística; LDA; QDA; Naive-Bayes; KNN)

    - Pré-processamento de texto para modelos de classificação (Bag-of-words e TF-IDF)

    - Obtenção dos resultados e comparação das performances.

    Leitura Obrigatória: 

    Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “Classification” in “An Introduction to Statistical Learning: with Applications in Python”. Springer. 

    Kuhn, Max and Johnsonn, Kjell. (2018). “Chapter 11 Measuring Performance in Classification Models” in “Applied Predictive Modeling”. Springer Science+Business Media, New York.

    Bibliografia Complementar:

    Géron, Aurelien. (2022). “3. Classification" in Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems

    Muller, Andreas; Guido, Sarah (2017) - "Supervised Learning" in Introduction to Machine Learning with Python - A Guide for Data Scientists. O’Reilly Media, Inc.

  • Aula 9 (16/10) - Overfitting, Reamostragem e Validação dos Resultados

    Objetivos: 

    - Alertar para evitar a confiança total na precisão como métrica dos seus resultados ;

    - Apresentar métodos que garantam a estabilidade dos resultados ;

    - Cross-Validation e Test Sets 

    Leitura Obrigatória: 

    Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “ Resampling Methods” in “An Introduction to Statistical Learning: with Applications in Python”. Springer. 

    Bibliografia Complementar: 

    Kuhn, Max and Johnsonn, Kjell. (2018). “Chapter 4 Over-Fitting and Model Tuning” in “Applied Predictive Modeling”. Springer Science+Business Media, New York.

  • Aula 10 (23/10) - Métodos de Classificação I : SVM e Decision Trees

    Objetivos:

     - Conhecer os principais métodos de classificação utilizados no aprendizado de máquina 

    Leitura Obrigatória: 

    Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “8 Tree-Based Methods” and “9 Support Vector Machines” in “An Introduction to Statistical Learning: with Applications in Python”. Springer. 

    Bibliografia Complementar: 

    Géron, Aurelien. (2022). “5. Support Vector Machines” e “6. Decision Trees” in “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems”

    Kuhn, Max and Johnsonn, Kjell. (2018). “Chapter 13 Nonlinear Classification Models ” in “Applied Predictive Modeling”. Springer Science+Business Media, New York.

  • Aula 11 (30/10) - Métodos de Classificação II: Mais árvores e Ensemble

    Objetivos: 

    - Apresentar outros modelos Tree-Based; 

    - Método Ensemble 

    Leitura Obrigatória: 

    Géron, Aurelien. (2022). “7. Ensemble Learning and Random Forests” in “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems” 

    Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “8 Tree-Based Methods” in “An Introduction to Statistical Learning: with Applications in Python”. Springer. 

    Bibliografia Complementar: 

    Kuhn, Max and Johnsonn, Kjell. (2018). “Chapter 14 Classification Trees and Rule-Based Models ” in “Applied Predictive Modeling”. Springer Science+Business Media, New York.

  • Aula 12 (13/11) - Métodos de Classificação III: Introdução ao Deep Learning

    Objetivos: 

    - Introduzir o que é o aprendizado profundo e como ele funciona 

    - Conceitos principais de aprendizagem profunda como learning rate, epochs, gradient descent, etc. 

    Leitura Obrigatória:

    Géron, Aurelien. (2022). “10. Introduction to Artificial Neural Networks with Keras” and “11. Training Deep Neural Networks” in “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems”. 

    Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “10 Deep Learning” in “An Introduction to Statistical Learning: with Applications in Python”. Springer

  • Aula 13 (27/11) - Classificação de Textos com BERT I - Construção do Banco de Dados

    Objetivos: 

    - Apresentar o BERT e como ele opera na classificação de textos; 

    - Destacar principais cuidados a se tomar na criação de um banco de dados; 

    - Stance Vs. Sentiment; 

    Leitura Obrigatória: 

    Géron, Aurelien. (2022). “2. End-to-End Machine Learning Project” in “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems”. 

    Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv:1810.04805v2 [cs.CL]. 

    Barberia, Lorena; Schmalz, Pedro; Roman, Norton (2023). When Tweets Get Viral - A Deep Learning Approach for the Sentiment Analysis of Covid-19 Vaccines Tweets of Brazilian Political Elites. working paper.

  • Aula 14 (04/12) - Classificação de Textos com BERT II - Pré-Processamento, Data-loader e Separação dos Dados

    Objetivos: 

    - O que é o pré-processamento e como fazê-lo para o BERT; 

    - Como criar o Data-Loader (utilizando Classes); 

    - Separando os bancos de treino e de teste, definindo a Cross-Validation. 

    Leitura Obrigatória: 

    Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv:1810.04805v2 [cs.CL]. 

    Barberia, Lorena; Schmalz, Pedro; Roman, Norton (2023). When Tweets Get Viral - A Deep Learning Approach for the Sentiment Analysis of Covid-19 Vaccines Tweets of Brazilian Political Elites. working paper

    • Tarefa ícone
      Laboratório 14 Tarefa
      Disponível se quaisquer:
      • Você faz parte de T-FLP0442-2023202
      • Você faz parte de T-FLS6513-1
    • Tarefa ícone
      Laboratório 14 Tarefa
      Disponível se: Você faz parte de T-FLP0442-2023201
  • Aula 15 (11/12) - Classificação de Textos com BERT III - Treinamento do Modelo e Resultados

    Objetivos: 

    - Como construir o Loop de Treinamento e Validação do BERT; 

    - Extraindo métricas de treinamento e validação; 

    - Definir os hiperparâmetros de treinamento. 

    Leitura Obrigatória: 

    Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv:1810.04805v2 [cs.CL]. 

    Barberia, Lorena; Schmalz, Pedro; Roman, Norton (2023). When Tweets Get Viral - A Deep Learning Approach for the Sentiment Analysis of Covid-19 Vaccines Tweets of Brazilian Political Elites. Working paper.