Kursthemen
-
Objetivos:
- Introduzir o Google Colab, principal ferramenta de nossas aulas;
- Apresentar os principais tipos de variáveis e estruturas de dados em Python
Leitura Obrigatória:
Menezes, Nilo Ney Coutinho (2019). Capítulo 3 - “Variáveis e entrada de dados”, Capítulo 4 - “Condições”, Cap. 5 - “Repetições” e Capítulo 6 - “Listas” em “Introdução à Programação com Python”. Terceira Edição, Editora Novatec. pp. 49-136.
Bibliografia Complementar:
McKinney, Wes (2022) - Chapter 3. “Built-In Data Structures, Functions, and Files” in “Python for Data Analysis Data Wrangling with pandas, NumPy, and Jupyter”. Third Edition. O’Reilly. Matthes, Eric (2023) - Python Crash Course - A Hands-On, Project-Based Introduction to Programming. 3rd Edition. No Starch Press.
-
Objetivos:
- Apresentar algumas declarações condicionais
- Introduzir as estruturas de repetição (Loops) e suas duas principais formas.
Leitura Obrigatória:
Lutz, Mark (2013). Chapter 12 “if Tests and Syntax Rules”, Chapter 13 “While and for Loops”, and Chapter 14 “Iterations and Comprehensions” in “Learning Python”. 5th Edition, O”Reilly Media, Inc.
Bibliografia Complementar:
Matthes, Eric (2023) - “Chapter 5: If Statements” and “Chapter 7: User Input and While Loops” in “Python Crash Course - A Hands-On, Project-Based Introduction to Programming”. 3rd Edition. No Starch Press.
-
Objetivos:
- Apresentar as funções e como criá-las;
- Como importar módulos, convenções de importação e principais módulos;
- Introdução ao Numpy e seus principais módulos.
Leitura Obrigatória:
McKinney, Wes (2022) - Chapter 3. “Built-In Data Structures, Functions, and Files” and Chapter 4. “NumPy Basics: Arrays and Vectorized Computation” in “Python for Data Analysis Data Wrangling with pandas, NumPy, and Jupyter”. Third Edition. O’Reilly.
Bibliografia Complementar:
Lutz, Mark (2013). Chapter 16 “Function Basics”, Chapter 22 “Modules: The Big Picture”, Chapter 23 “Module Coding Basics” in “Learning Python”. 5th Edition, O”Reilly Media, Inc.
Matthes, Eric (2023) - “Chapter 8: Functions” in “Python Crash Course - A Hands-On, Project-Based Introduction to Programming”. 3rd Edition. No Starch Press.
-
Laboratório 03 Aufgabe
-
Laboratório 03 Aufgabe
-
Objetivos:
- Introduzir o aluno ao Pandas
- Como abrir arquivos Excel, .CSV, etc.
- Manipulação, Organização e Limpeza de Dados;
- Estatísticas Resumidas
Leitura Obrigatória:
McKinney, Wes (2022) - Chapter 5. “Getting Started with pandas”, Chapter 6. “Data Loading, Storage, and File Formats”, Chapter 7. “Data Cleaning and Preparation” and “8. Data Wrangling: Join, Combine, and Reshape” in “Python for Data Analysis Data Wrangling with pandas, NumPy, and Jupyter”. Third Edition. O’Reilly
-
Laboratório 04 Aufgabe
-
Laboratório 04 Aufgabe
-
-
Objetivos:
- Introduzir o aluno aos principais pacotes de visualização no Python;
- Identificação das melhores visualizações para cada tipo de dado;
- Destacar algumas visualizações específicas de Text as Data
Leitura Obrigatória:
McKinney, Wes (2022) - Chapter 9. “Plotting and Visualization”, Chapter 10. “10. Data Aggregation and Group Operations” in “Python for Data Analysis Data Wrangling with pandas, NumPy, and Jupyter”. Third Edition. O’Reilly.
Bibliografia Complementar:
Massaron, Lucas; Boschetti, Alberto (2019) - Chapter 5 “Visualization, Insights, and Results” in “Python Data Science Essentials” - A practitioner's guide covering essential data science principles, tools, and techniques. Third Edition. Published by Packt Publishing Ltd.
-
Laboratório 05 Aufgabe
-
Laboratório 05 Aufgabe
-
Objetivos:
- Apresentar o aprendizado de máquina e principais tarefas;
- Diferenciar Aprendizado Supervisionado de Não Supervisionado;
- Possíveis problemas que podem surgir e cuidados a se tomar
Leitura Obrigatória:
Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “Introduction” e “2 Statistical Learning” in “An Introduction to Statistical Learning: with Applications in Python”. Springer.
Bibliografia Complementar:
Géron, Aurelien. (2022). “The Machine Learning Landscape” in “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems”
-
Laboratório 06 Aufgabe
-
Laboratório 06 Aufgabe
-
Objetivos:
- Compreender as principais abordagens e problemas na anotação de um banco de dados
- Discussão dos conceitos de concordância dos anotadores, e possíveis fontes de viés na anotação.
Leitura Obrigatória:
Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “Classification” in “An Introduction to Statistical Learning: with Applications in Python”. Springer.
Kuhn, Max and Johnsonn, Kjell. (2018). “Chapter 11 Measuring Performance in Classification Models” in “Applied Predictive Modeling”. Springer Science+Business Media, New York.
Bibliografia Complementar:
Géron, Aurelien. (2022). “3. Classification" in Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems
-
Laboratório 07 Aufgabe
-
Laboratório 07 Aufgabe
-
Objetivos:
- Treinamento de alguns modelos menos computacionalmente intensivos (Regressão Logística; LDA; QDA; Naive-Bayes; KNN)
- Pré-processamento de texto para modelos de classificação (Bag-of-words e TF-IDF)
- Obtenção dos resultados e comparação das performances.
Leitura Obrigatória:
Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “Classification” in “An Introduction to Statistical Learning: with Applications in Python”. Springer.
Kuhn, Max and Johnsonn, Kjell. (2018). “Chapter 11 Measuring Performance in Classification Models” in “Applied Predictive Modeling”. Springer Science+Business Media, New York.
Bibliografia Complementar:
Géron, Aurelien. (2022). “3. Classification" in Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems
Muller, Andreas; Guido, Sarah (2017) - "Supervised Learning" in Introduction to Machine Learning with Python - A Guide for Data Scientists. O’Reilly Media, Inc.
-
Laboratório 08 Aufgabe
-
Laboratório 08 Aufgabe
-
Objetivos:
- Alertar para evitar a confiança total na precisão como métrica dos seus resultados ;
- Apresentar métodos que garantam a estabilidade dos resultados ;
- Cross-Validation e Test Sets
Leitura Obrigatória:
Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “ Resampling Methods” in “An Introduction to Statistical Learning: with Applications in Python”. Springer.
Bibliografia Complementar:
Kuhn, Max and Johnsonn, Kjell. (2018). “Chapter 4 Over-Fitting and Model Tuning” in “Applied Predictive Modeling”. Springer Science+Business Media, New York.
-
Laboratório 09 Aufgabe
-
Laboratório 09 Aufgabe
-
Objetivos:
- Conhecer os principais métodos de classificação utilizados no aprendizado de máquina
Leitura Obrigatória:
Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “8 Tree-Based Methods” and “9 Support Vector Machines” in “An Introduction to Statistical Learning: with Applications in Python”. Springer.
Bibliografia Complementar:
Géron, Aurelien. (2022). “5. Support Vector Machines” e “6. Decision Trees” in “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems”
Kuhn, Max and Johnsonn, Kjell. (2018). “Chapter 13 Nonlinear Classification Models ” in “Applied Predictive Modeling”. Springer Science+Business Media, New York.
-
Objetivos:
- Apresentar outros modelos Tree-Based;
- Método Ensemble
Leitura Obrigatória:
Géron, Aurelien. (2022). “7. Ensemble Learning and Random Forests” in “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems”
Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “8 Tree-Based Methods” in “An Introduction to Statistical Learning: with Applications in Python”. Springer.
Bibliografia Complementar:
Kuhn, Max and Johnsonn, Kjell. (2018). “Chapter 14 Classification Trees and Rule-Based Models ” in “Applied Predictive Modeling”. Springer Science+Business Media, New York.
-
Laboratório 11 Aufgabe
-
Laboratório 11 Aufgabe
-
Objetivos:
- Introduzir o que é o aprendizado profundo e como ele funciona
- Conceitos principais de aprendizagem profunda como learning rate, epochs, gradient descent, etc.
Leitura Obrigatória:
Géron, Aurelien. (2022). “10. Introduction to Artificial Neural Networks with Keras” and “11. Training Deep Neural Networks” in “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems”.
Gareth James, Gareth; Witten, Daniela; Hastie, Trevor and Tibshirani, Robert. (2022). “10 Deep Learning” in “An Introduction to Statistical Learning: with Applications in Python”. Springer
-
Laboratório 12 Aufgabe
-
Laboratório 12 Aufgabe
-
Objetivos:
- Apresentar o BERT e como ele opera na classificação de textos;
- Destacar principais cuidados a se tomar na criação de um banco de dados;
- Stance Vs. Sentiment;
Leitura Obrigatória:
Géron, Aurelien. (2022). “2. End-to-End Machine Learning Project” in “Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems”.
Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv:1810.04805v2 [cs.CL].
Barberia, Lorena; Schmalz, Pedro; Roman, Norton (2023). When Tweets Get Viral - A Deep Learning Approach for the Sentiment Analysis of Covid-19 Vaccines Tweets of Brazilian Political Elites. working paper.
-
Laboratório 13 Aufgabe
-
Laboratório 13 Aufgabe
-
Aula 14 (04/12) - Classificação de Textos com BERT II - Pré-Processamento, Data-loader e Separação dos Dados
Objetivos:
- O que é o pré-processamento e como fazê-lo para o BERT;
- Como criar o Data-Loader (utilizando Classes);
- Separando os bancos de treino e de teste, definindo a Cross-Validation.
Leitura Obrigatória:
Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv:1810.04805v2 [cs.CL].
Barberia, Lorena; Schmalz, Pedro; Roman, Norton (2023). When Tweets Get Viral - A Deep Learning Approach for the Sentiment Analysis of Covid-19 Vaccines Tweets of Brazilian Political Elites. working paper
-
Laboratório 14 Aufgabe
-
Laboratório 14 Aufgabe
-
-
Objetivos:
- Como construir o Loop de Treinamento e Validação do BERT;
- Extraindo métricas de treinamento e validação;
- Definir os hiperparâmetros de treinamento.
Leitura Obrigatória:
Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv:1810.04805v2 [cs.CL].
Barberia, Lorena; Schmalz, Pedro; Roman, Norton (2023). When Tweets Get Viral - A Deep Learning Approach for the Sentiment Analysis of Covid-19 Vaccines Tweets of Brazilian Political Elites. Working paper.