{"nbformat":4,"nbformat_minor":0,"metadata":{"colab":{"provenance":[]},"kernelspec":{"name":"python3","display_name":"Python 3"},"language_info":{"name":"python"},"gpuClass":"standard"},"cells":[{"cell_type":"markdown","source":["# **Aula 3 - 21/08 - Funções, Métodos, Módulos, Bibliotecas e Numpy**\n","\n"],"metadata":{"id":"_ns7mAL7Sqmm"}},{"cell_type":"markdown","source":["

Quando começamos a desenvolver programas mais complexos, logo percebemos que repetir trechos de código leva a redundâncias e dificulta a manutenção. É aí que as funções entram em cena. Elas nos permitem agrupar um conjunto de instruções relacionadas em um único bloco, tornando nosso código mais organizado, legível e reutilizável. Imagine poder chamar uma função bem nomeada em vez de reescrever o mesmo código repetidamente.\n","\n","

Além disso, exploraremos como usar módulos em Python. Os módulos são como pastas de ferramentas que contêm conjuntos específicos de funções e classes. Eles nos permitem organizar nosso código em arquivos separados, facilitando a colaboração e a manutenção. Além disso, podemos aproveitar a rica biblioteca de módulos da comunidade Python para adicionar funcionalidades especializadas aos nossos programas.\n","\n","

Por fim, entraremos no mundo da computação numérica eficiente com o NumPy. Esta biblioteca poderosa oferece estruturas de dados otimizadas para operações matemáticas em arrays multidimensionais. Se você já trabalhou com matrizes ou dados científicos, você vai adorar as capacidades que o NumPy traz para suas aplicações.\n"],"metadata":{"id":"WbPvhjqETV7N"}},{"cell_type":"markdown","source":["### 1. Funções\n","\n"],"metadata":{"id":"D0rD_ajPUnll"}},{"cell_type":"markdown","source":["

Em Python, uma função é um bloco de código autônomo que realiza uma tarefa específica. Elas nos permitem agrupar um conjunto de instruções relacionadas sob um único nome, que pode ser chamado sempre que necessário. Em outras palavras, as funções promovem a reutilização de código, melhoram a legibilidade e reduzem erros."],"metadata":{"id":"sw2sE3Gw6Umh"}},{"cell_type":"markdown","source":["

Ao longo das aulas, já utilizamos algumas funções *built-in* do python, como o len(), print(), etc. Para mais informações sobre as funções que já vem com o Python, acesse o link"],"metadata":{"id":"4N0fcsyt3amT"}},{"cell_type":"markdown","source":["**Vantagens das Funções:**\n","\n","* Reutilização de Código: Você pode definir uma função uma vez e usá-la em várias partes do seu programa, evitando duplicação de código.\n","* Organização: Funções permitem que você divida seu programa em partes menores e mais gerenciáveis. Cada função pode se concentrar em uma tarefa específica.\n","* Manutenção: Se você precisa fazer uma alteração em uma parte do código, alterar apenas uma função afeta todas as ocorrências em que ela é chamada.\n","* Legibilidade: Ao dar nomes descritivos às funções, seu código se torna mais legível e autoexplicativo."],"metadata":{"id":"ldffHFkAruxV"}},{"cell_type":"markdown","source":["Exemplo simples da sintaxe de uma função:"],"metadata":{"id":"-GH1Gq8z9PiT"}},{"cell_type":"code","source":["def saudacao(nome):\n"," print(\"Olá,\", nome, \"!\")"],"metadata":{"id":"hD2aeWAxsJ0m"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":["

Neste exemplo, definimos a função utilizando \"def\", a chamando de \"saudacao\", e ela recebe um parâmetro/argumento \"nome\" e imprime uma mensagem utilizando ele. No entanto, ao rodar esta célula, nada acontece além de salvar a função dentro do Python. Você precisa também chamar a função, e atribuir algum valor ao argumento \"nome\""],"metadata":{"id":"alSi3RSz5h42"}},{"cell_type":"code","source":["saudacao(\"José\")\n"],"metadata":{"id":"hYUmRAmU5ay5","colab":{"base_uri":"https://localhost:8080/"},"executionInfo":{"status":"ok","timestamp":1692279125443,"user_tz":180,"elapsed":284,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"145fe92c-160f-4fb9-c22f-4945ac2a49bb"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["Olá, José !\n"]}]},{"cell_type":"markdown","source":["Outro exemplo de função pode ser o de pegar dois números como argumentos ('x' e 'y') e fazer a soma deles:"],"metadata":{"id":"o_U7KmyI8Yhq"}},{"cell_type":"code","source":["def soma(x,y):\n"," return x+y\n","\n","\n","soma(2,1)"],"metadata":{"id":"uHZIckGA-QRv","colab":{"base_uri":"https://localhost:8080/"},"executionInfo":{"status":"ok","timestamp":1692279284627,"user_tz":180,"elapsed":2,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"053beebc-5035-42ad-d070-dd332a689150"},"execution_count":null,"outputs":[{"output_type":"execute_result","data":{"text/plain":["3"]},"metadata":{},"execution_count":5}]},{"cell_type":"markdown","source":["Se você fizer uma função sem utilizar o return, ela vai retornar um valor *None*\n","\n"],"metadata":{"id":"lnQmA6sctNVT"}},{"cell_type":"code","source":["def imprima(x):\n"," print(x)\n","\n","imprima(\"Olá\")\n","\n","resultado = imprima(\"Olá\")\n","\n","print(resultado)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"BBY2JAp1tTgf","executionInfo":{"status":"ok","timestamp":1692279401459,"user_tz":180,"elapsed":245,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"49473116-cbf6-4fc2-f5d9-7e884029d226"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["Olá\n","Olá\n","None\n"]}]},{"cell_type":"markdown","source":["

Você também pode definir valores padrões para determinados argumentos se achar necessário. Imagine que estamos criando uma função que calcula o preço total de uma compra, considerando um desconto opcional. Vamos definir um valor padrão para o desconto, caso ele não seja especificado:"],"metadata":{"id":"1IOuK9irtuDR"}},{"cell_type":"code","source":["def calcular_preco_total(valor_produto, desconto=0):\n"," preco_com_desconto = valor_produto - (valor_produto * desconto / 100)\n"," return preco_com_desconto\n","\n","# Chamando a função com desconto padrão de 0%\n","preco_final1 = calcular_preco_total(100)\n","print(\"Preço com desconto padrão:\", preco_final1)\n","\n","# Chamando a função com desconto de 10%\n","preco_final2 = calcular_preco_total(100, 10)\n","print(\"Preço com desconto de 10%:\", preco_final2)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"Gakm2eJ8t4jq","executionInfo":{"status":"ok","timestamp":1692279925108,"user_tz":180,"elapsed":246,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"943b1781-01e7-4a67-d348-574ba9af2b7b"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["Preço com desconto padrão: 100.0\n","Preço com desconto de 10%: 90.0\n"]}]},{"cell_type":"markdown","source":["#### Docstrings"],"metadata":{"id":"u1gnj0aGyWtS"}},{"cell_type":"markdown","source":["

Pensando tanto na legibilidade quanto no seu \"eu futuro\", uma boa prática pode ser a de utilizar docstrings em suas funções. As docstrings são strings de documentação que fornecem informações sobre módulos, funções, classes ou métodos em Python. Elas são usadas para descrever o propósito, o funcionamento e os parâmetros de uma entidade do código, tornando o código mais compreensível e autoexplicativo.\n","\n","

As docstrings são delimitadas por três aspas (simples ou duplas) no início e no final da definição de uma entidade. Aqui está um exemplo de uma docstring para uma função:"],"metadata":{"id":"0AGr7r_OyYTB"}},{"cell_type":"code","source":["def calcular_media(valores):\n"," \"\"\"\n"," Calcula a média dos valores em uma lista.\n","\n"," Args:\n"," valores (list): Uma lista de valores numéricos.\n","\n"," Returns:\n"," float: A média dos valores.\n","\n"," Exemplo:\n"," >>> calcular_media([1, 2, 3, 4, 5])\n"," 3.0\n"," \"\"\"\n"," total = sum(valores)\n"," media = total / len(valores)\n"," return media"],"metadata":{"id":"mPvlxEm5y-DN"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":["Veja que a função ainda funciona da forma desejada."],"metadata":{"id":"MLEJBt22zK9I"}},{"cell_type":"code","source":["calcular_media([1,2,3,4,5])"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"sdma-dhDzBa1","executionInfo":{"status":"ok","timestamp":1692280847136,"user_tz":180,"elapsed":3,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"4c23423c-33ac-41f8-dc81-7545508de0f2"},"execution_count":null,"outputs":[{"output_type":"execute_result","data":{"text/plain":["3.0"]},"metadata":{},"execution_count":12}]},{"cell_type":"markdown","source":["Para consultar a documentação da função, pode se utilizar o atributo '\\_\\_doc\\_\\_'."],"metadata":{"id":"Gd5a5aoxzPKU"}},{"cell_type":"code","source":["print(calcular_media.__doc__)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"l2PgSQAgzXKA","executionInfo":{"status":"ok","timestamp":1692280912551,"user_tz":180,"elapsed":245,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"34251011-f52a-4160-8a5a-633b29e775a2"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["\n"," Calcula a média dos valores em uma lista.\n","\n"," Args:\n"," valores (list): Uma lista de valores numéricos.\n","\n"," Returns:\n"," float: A média dos valores.\n","\n"," Exemplo:\n"," >>> calcular_media([1, 2, 3, 4, 5])\n"," 3.0\n"," \n"]}]},{"cell_type":"markdown","source":["#### Métodos"],"metadata":{"id":"tzseg0Huz6by"}},{"cell_type":"markdown","source":["

Métodos são funções que estão associadas a objetos em Python. Eles permitem que você defina ações que um objeto pode realizar ou comportamentos que ele pode ter. Em termos simples, métodos são funções que são definidas dentro de uma classe e são acessadas através das instâncias dessa classe.\n","\n","

O conceito de classes é muito avançado para o intuito dessa aula. Mas o que importa destacar é a diferença entre funções no python, como len(), print(), input(), e métodos de objetos, como list.append(), list.extend(), list.insert(), etc. Todos os objetos em python possuem métodos próprios associados à eles, e é necessário sempre consultar a documentação para entender quais estão ao seu dispor. Por exemplo, olhe os métodos disponíveis para listas em Python. Também é possível consultar a documentação de determinado método utilizando o \"__doc__\"\n"],"metadata":{"id":"n8Z09J_x3RcF"}},{"cell_type":"code","source":["print(list.append.__doc__)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"WpKRbNIb6Myu","executionInfo":{"status":"ok","timestamp":1692282734222,"user_tz":180,"elapsed":285,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"b98ae500-e5d3-4e60-8917-962590599cb0"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["Append object to the end of the list.\n"]}]},{"cell_type":"markdown","source":["Se quiser, também pode listar todos os métodos e atributos de um objeto em Python utilizando o dir:"],"metadata":{"id":"Vpp1VtJ9Ogw1"}},{"cell_type":"code","source":["# Métodos e atributos do dicionário\n","\n","dicionario = {\"nome\":'josé'}\n","\n","dir(dicionario)"],"metadata":{"id":"cktm3ez0Om24","colab":{"base_uri":"https://localhost:8080/"},"executionInfo":{"status":"ok","timestamp":1692288174688,"user_tz":180,"elapsed":3,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"0615be68-b619-400c-a16e-7b39af24b9df"},"execution_count":null,"outputs":[{"output_type":"execute_result","data":{"text/plain":["['__class__',\n"," '__class_getitem__',\n"," '__contains__',\n"," '__delattr__',\n"," '__delitem__',\n"," '__dir__',\n"," '__doc__',\n"," '__eq__',\n"," '__format__',\n"," '__ge__',\n"," '__getattribute__',\n"," '__getitem__',\n"," '__gt__',\n"," '__hash__',\n"," '__init__',\n"," '__init_subclass__',\n"," '__ior__',\n"," '__iter__',\n"," '__le__',\n"," '__len__',\n"," '__lt__',\n"," '__ne__',\n"," '__new__',\n"," '__or__',\n"," '__reduce__',\n"," '__reduce_ex__',\n"," '__repr__',\n"," '__reversed__',\n"," '__ror__',\n"," '__setattr__',\n"," '__setitem__',\n"," '__sizeof__',\n"," '__str__',\n"," '__subclasshook__',\n"," 'clear',\n"," 'copy',\n"," 'fromkeys',\n"," 'get',\n"," 'items',\n"," 'keys',\n"," 'pop',\n"," 'popitem',\n"," 'setdefault',\n"," 'update',\n"," 'values']"]},"metadata":{},"execution_count":46}]},{"cell_type":"markdown","source":["#### Escopo de Variáveis\n","\n","O escopo de variáveis em Python se refere à região do código onde uma variável pode ser acessada e manipulada. O escopo determina onde uma variável é válida e em quais partes do programa ela pode ser utilizada.\n","\n","Existem dois principais tipos de escopo em Python:"],"metadata":{"id":"t3xq-yFNBcbC"}},{"cell_type":"markdown","source":["##### Escopo Local"],"metadata":{"id":"5UtZeve0BtTs"}},{"cell_type":"markdown","source":["Variáveis definidas dentro de uma função têm escopo local, o que significa que elas só podem ser acessadas dentro dessa função. Elas são visíveis apenas para o bloco de código em que foram definidas. Uma vez que a execução da função é concluída, as variáveis locais não podem mais ser acessadas."],"metadata":{"id":"dBJzvT0uBw8v"}},{"cell_type":"code","source":["def minha_funcao():\n"," variavel_local = 10\n"," print(variavel_local) # Acesso dentro da função\n","\n","minha_funcao()\n"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"__omNnw0Bwed","executionInfo":{"status":"ok","timestamp":1692284726322,"user_tz":180,"elapsed":429,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"90bd951b-8877-43b6-817d-105616db1f87"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["10\n"]}]},{"cell_type":"code","source":["# Agora, se eu tentar imprimir o valor da variável local, veja o que acontece:\n","\n","print(variavel_local)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/","height":210},"id":"zIORotwIB5-g","executionInfo":{"status":"error","timestamp":1692284727146,"user_tz":180,"elapsed":3,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"c5f61488-1a43-4148-cfe5-38fab81ce3a2"},"execution_count":null,"outputs":[{"output_type":"error","ename":"NameError","evalue":"ignored","traceback":["\u001b[0;31m---------------------------------------------------------------------------\u001b[0m","\u001b[0;31mNameError\u001b[0m Traceback (most recent call last)","\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m()\u001b[0m\n\u001b[1;32m 1\u001b[0m \u001b[0;31m# Agora, se eu tentar imprimir o valor da variável local, veja o que acontece:\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 2\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m----> 3\u001b[0;31m \u001b[0mprint\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mvariavel_local\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m","\u001b[0;31mNameError\u001b[0m: name 'variavel_local' is not defined"]}]},{"cell_type":"markdown","source":["##### Escopo Global\n","\n","Variáveis definidas fora de qualquer função ou bloco de código têm escopo global. Elas podem ser acessadas de qualquer parte do código, incluindo dentro de funções. No entanto, se você deseja modificar uma variável global de dentro de uma função, precisa usar a palavra-chave global para indicar que está se referindo à variável global, em vez de criar uma nova variável local com o mesmo nome. No entanto, isso não é recomendado, pois pode gerar problemas no seu código se outras partes dele dependem do valor da variável global do modo como está."],"metadata":{"id":"bdXz0vT-B8Q2"}},{"cell_type":"code","source":["variavel_global = 20\n","\n","def minha_funcao():\n"," global variavel_global\n"," variavel_global += 1\n"," print(variavel_global) # Acesso e modificação dentro da função\n","\n","minha_funcao()\n","print(variavel_global) # Acesso fora da função"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"Q1j4w5YVCI8H","executionInfo":{"status":"ok","timestamp":1692284788859,"user_tz":180,"elapsed":248,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"8a7351fe-6a92-4a2f-f931-c2be8ac17417"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["21\n","21\n"]}]},{"cell_type":"markdown","source":["É importante entender o escopo das variáveis, pois ajuda a evitar bugs e problemas de lógica no código. Variáveis locais são úteis para manter um contexto limitado a uma função, enquanto variáveis globais podem ser usadas para compartilhar informações entre várias partes do programa. É recomendável usar variáveis locais sempre que possível, pois isso ajuda a manter o código mais fácil de entender."],"metadata":{"id":"4HM68f_gCM60"}},{"cell_type":"markdown","source":["#### Funções Lambda"],"metadata":{"id":"llTf_GFqGNxo"}},{"cell_type":"markdown","source":["Funções lambda, também conhecidas como funções anônimas, são funções pequenas e simples que podem ser criadas de forma concisa usando a expressão lambda em Python. Elas são especialmente úteis quando você precisa de uma função temporária para um cálculo rápido e não deseja definir uma função completa usando a declaração def.\n","\n","A sintaxe básica de uma função lambda é a seguinte:"],"metadata":{"id":"1KeF4hsxGSeT"}},{"cell_type":"code","source":["lambda argumentos: expressao"],"metadata":{"id":"gQgQeawYGTFY"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":["As funções lambda têm as seguintes características:\n","\n","* Anonimato: As funções lambda são anônimas, o que significa que você não atribui um nome a elas como faz com as funções definidas com def.\n","\n","* Expressão Única: A expressão lambda deve ser uma única expressão que é avaliada e retornada quando a função é chamada. Não é possível incluir várias instruções ou blocos de código.\n","\n","* Uso Geral: As funções lambda são mais comumente usadas em situações onde uma função simples é necessária como argumento para outras funções, como map, filter e sorted.\n","\n","\n","Exemplo:"],"metadata":{"id":"yShAVlJEGUg3"}},{"cell_type":"code","source":["# Usando uma função lambda para calcular o quadrado de um número\n","quadrado = lambda x: x ** 2\n","\n","print(quadrado(5)) # Saída: 25\n","\n","# Usando uma função lambda como argumento para a função map\n","numeros = [1, 2, 3, 4, 5]\n","quadrados = list(map(lambda x: x ** 2, numeros))\n","print(quadrados) # Saída: [1, 4, 9, 16, 25]"],"metadata":{"id":"a2kTYlBMGjFf"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":["A função map é mais avançada. Se tiver interesse, pode descobrir mais sobre ela no [link](https://docs.python.org/3/library/functions.html?highlight=map#map).\n","\n","De forma geral, as expressões lambda são utilizadas quando não parece ser proveitoso fazer a definição de uma função completa."],"metadata":{"id":"Z3-nZIDTGnrw"}},{"cell_type":"markdown","source":["#### Imports"],"metadata":{"id":"TNmdzH4Ilytf"}},{"cell_type":"markdown","source":["O import em Python é uma construção que permite que você acesse funcionalidades de módulos externos ou bibliotecas para estender as capacidades do Python. Módulos são arquivos Python que contêm definições e declarações que podem ser reutilizadas em diferentes partes do seu programa. Importar um módulo permite que você use suas funções, classes e variáveis em seu próprio código.\n","\n","Existem diferentes maneiras de usar o import. Você pode importar um módulo inteiro usando a palavra-chave import. Por exemplo:\n"],"metadata":{"id":"uF3l5X3Kl0Ag"}},{"cell_type":"code","source":["import math\n","print(math.sqrt(25)) # Usando a função sqrt do módulo math"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"iSMAlHvWl5yQ","executionInfo":{"status":"ok","timestamp":1692294178622,"user_tz":180,"elapsed":4,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"9382cbff-a50d-410e-ce65-23074b4c9c38"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["5.0\n"]}]},{"cell_type":"markdown","source":["Se você quiser importar apenas partes específicas de um módulo, pode usar a instrução from ... import .... Por exemplo:"],"metadata":{"id":"CStbnWhhl--f"}},{"cell_type":"code","source":["from math import sqrt\n","print(sqrt(25)) # Não é necessário usar math.sqrt, apenas sqrt"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"-8bpTLK4mBPh","executionInfo":{"status":"ok","timestamp":1692294201407,"user_tz":180,"elapsed":257,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"416e965d-f48a-4a7a-db66-72db308a00ff"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["5.0\n"]}]},{"cell_type":"markdown","source":["Você também pode renomear módulos ao importá-los usando a palavra-chave as. Isso é útil quando o nome do módulo é longo ou pode causar conflitos com outros nomes."],"metadata":{"id":"bATVHSPtmGBv"}},{"cell_type":"code","source":["import numpy as np"],"metadata":{"id":"OjJNW2_2mHdJ"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":["Principais Imports Utilizados:\n","\n","Existem muitos módulos populares e bibliotecas externas em Python que estendem suas funcionalidades. Alguns dos principais módulos e suas funcionalidades incluem:\n","\n","* math: Fornece funções matemáticas como trigonometria, logaritmo e mais.\n","* random: Gera números aleatórios.\n","* datetime: Manipula datas e horas.\n","* os: Fornece funcionalidades para interagir com o sistema operacional.\n","* sys: Fornece acesso a variáveis e funções específicas do interpretador Python.\n","* json: Lida com a codificação e decodificação de dados JSON.\n","* requests: Faz solicitações HTTP para interagir com APIs da web.\n","* numpy: Biblioteca para computação numérica eficiente com arrays multidimensionais.\n","* pandas: Biblioteca para análise e manipulação de dados tabulares.\n","* matplotlib: Biblioteca para criação de gráficos e visualizações.\n","\n","\n","Esses são apenas alguns exemplos de módulos populares. O Python tem uma ampla variedade de bibliotecas para diferentes finalidades, e você pode encontrar mais de acordo com as necessidades específicas do seu projeto."],"metadata":{"id":"bKr_b8iPoQD6"}},{"cell_type":"markdown","source":["### Exercícios"],"metadata":{"id":"xS640Eo_B_A_"}},{"cell_type":"markdown","source":["1 - Crie uma função que recebe 3 números como parâmetros e exiba a soma entre eles. Depois, faça uma chamada à função."],"metadata":{"id":"TIwStOxHUTai"}},{"cell_type":"code","source":["def soma(n1, n2, n3):\n"," print(n1 + n2 + n3)\n","\n","\n","soma(2, 1, 3)"],"metadata":{"id":"6UVus0k3TOLV","colab":{"base_uri":"https://localhost:8080/"},"executionInfo":{"status":"ok","timestamp":1692283534140,"user_tz":180,"elapsed":240,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"a94bd34d-eeb4-487d-ea32-eb92a33508bf"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["6\n"]}]},{"cell_type":"markdown","source":["2 - Crie uma função que receba 2 números. O primeiro é um valor e o segundo um percentual (ex. 10%). Retorne (return) o valor do primeiro número somado do aumento percentual do mesmo. Execute a função para ver se o resultado está correto."],"metadata":{"id":"8MNj4OSyU8Us"}},{"cell_type":"code","source":["def perc(n1, n2):\n"," return n1 + (n1 * n2 / 100)\n","\n","print(perc(100,50))"],"metadata":{"id":"y_fLjaLvTOEy","colab":{"base_uri":"https://localhost:8080/"},"executionInfo":{"status":"ok","timestamp":1692283800096,"user_tz":180,"elapsed":2,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"36fdce65-1644-4240-cd42-31423700c104"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["150.0\n"]}]},{"cell_type":"markdown","source":["3 - Vá na documentação de strings no python ([Link](https://docs.python.org/3/library/stdtypes.html?highlight=upper#string-methods)). Com isso em mãos, crie uma função que recebe uma string como argumento e que deixa o primeiro caractere em maiúsculo. Chame a função ao final da célula."],"metadata":{"id":"YCLW__joVLop"}},{"cell_type":"code","source":["def capitaliza(str1):\n"," return str1.capitalize()\n","\n","\n","capitaliza(\"josé amava lírios.\")"],"metadata":{"id":"TWbms9g7TN-I","colab":{"base_uri":"https://localhost:8080/","height":35},"executionInfo":{"status":"ok","timestamp":1692284071094,"user_tz":180,"elapsed":6,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"15622a29-1e28-4700-d691-a80ebbe420a8"},"execution_count":null,"outputs":[{"output_type":"execute_result","data":{"text/plain":["'José amava lírios.'"],"application/vnd.google.colaboratory.intrinsic+json":{"type":"string"}},"metadata":{},"execution_count":21}]},{"cell_type":"markdown","source":["4 - Crie uma função que recebe uma lista de strings e as retorna totalmente em letras minúsculas."],"metadata":{"id":"g04JWLs3DBTt"}},{"cell_type":"code","source":["# Com List Comprehension\n","\n","def converter_para_lower(strings):\n"," strings_lower = [s.lower() for s in strings]\n"," return strings_lower\n","\n","# Ou\n","\n","def converter_para_lower2(strings):\n","\n"," strings_lower = []\n","\n"," for s in strings:\n"," strings_lower.append(s.lower())\n"," return strings_lower\n","\n","\n","# Lista de strings de exemplo\n","lista_strings = [\"Python\", \"É\", \"Uma\", \"Linguagem\", \"De\", \"Programação\"]\n","\n","# Chamando a função e imprimindo o resultado 1\n","strings_lower1 = converter_para_lower(lista_strings)\n","print(strings_lower1)\n","\n","# Chamando a função e imprimindo o resultado 2\n","strings_lower2 = converter_para_lower2(lista_strings)\n","print(strings_lower2)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"o8shTSEQDWzY","executionInfo":{"status":"ok","timestamp":1692285338109,"user_tz":180,"elapsed":254,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"3c5329fd-4cb6-4695-c6d5-6f7d74df7bc1"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["['python', 'é', 'uma', 'linguagem', 'de', 'programação']\n","['python', 'é', 'uma', 'linguagem', 'de', 'programação']\n"]}]},{"cell_type":"markdown","source":["5 - Crie uma função que receba três listas como argumentos e as junte em um dicionário. A função deve retornar o dicionário final. Execute a função utilizando as três listas abaixo, apresentando o resultado final em um print. Lembre-se, cada elemento da lista deve estar associado ao seu equivalente dentro do dicionário (i.e. \"Alice\" com \"Jonhson\" com \"alice@example.com\"). Dica: você vai precisar da função [zip](https://docs.python.org/3/library/functions.html?highlight=zip#zip) e revisar um pouco mais de [dicionários](https://docs.python.org/3/tutorial/datastructures.html?highlight=dictionaries#dictionaries)."],"metadata":{"id":"EVFVGeJ7Vfza"}},{"cell_type":"code","source":["# Listas de teste\n","primeiros_nomes = [\"Alice\", \"Bob\", \"Carol\", \"David\", \"Eve\"]\n","ultimos_nomes = [\"Johnson\", \"Smith\", \"Williams\", \"Brown\", \"Davis\"]\n","emails = [\"alice@example.com\", \"bob@example.com\", \"carol@example.com\", \"david@example.com\", \"eve@example.com\"]\n","\n","\n","def listas_em_dicionario(nomes, sobrenomes, emails):\n"," dicionario = {}\n"," for nome, sobrenome, email in zip(nomes, sobrenomes, emails):\n"," dicionario[nome] = {\"sobrenome\": sobrenome, \"email\": email}\n"," return dicionario\n","\n","\n","\n","dicionario = listas_em_dicionario(primeiros_nomes,ultimos_nomes, emails)\n","\n","\n","# Exemplo de como imprimir os valores de um dicionário depois do resultado da função.\n","\n","for nome, info in dicionario.items():\n"," print(f\"Nome: {nome}, Sobrenome: {info['sobrenome']}, Email: {info['email']}\")\n","\n","\n","\n","\n","\n"],"metadata":{"id":"NO3cS6etWG5V","colab":{"base_uri":"https://localhost:8080/"},"executionInfo":{"status":"ok","timestamp":1692288681023,"user_tz":180,"elapsed":252,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"eeb18aeb-3403-4c48-870c-e9f511d5c987"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["Nome: Alice, Sobrenome: Johnson, Email: alice@example.com\n","Nome: Bob, Sobrenome: Smith, Email: bob@example.com\n","Nome: Carol, Sobrenome: Williams, Email: carol@example.com\n","Nome: David, Sobrenome: Brown, Email: david@example.com\n","Nome: Eve, Sobrenome: Davis, Email: eve@example.com\n"]}]},{"cell_type":"markdown","source":["6 - Abaixo você encontra uma lista com temperaturas em graus Celsius. Crie uma função anônima que converta cada temperatura para Fahrenheit. Dica: para conseguir realizar este exercício, você deve criar sua função lambda, dentro de uma função. Fórmula: F = (C * 1,8) + 32"],"metadata":{"id":"KeELXjCYWZpy"}},{"cell_type":"code","source":["Celsius = [35, 25, 17, 28.5]\n","\n","# Modo conciso (tem exemplo parecido acima)\n","Fahrenheit = map(lambda x: (float(9)/5)*x + 32, Celsius)\n","\n","# Definindo a função\n","\n","def c_para_f(temps):\n"," fahrenheit = list(map(lambda x: (float(9)/5)*x + 32, temps))\n"," return fahrenheit\n","\n","\n","# Resultado do Modo extenso\n","\n","resultado = c_para_f(Celsius)\n","\n","print(list(resultado))\n","\n","# Resultado do modo conciso\n","print(list(Fahrenheit))\n","\n","# [95.0, 77.0, 62.6, 83.30000000000001]"],"metadata":{"id":"Sr0mYe09TN3y","colab":{"base_uri":"https://localhost:8080/"},"executionInfo":{"status":"ok","timestamp":1692287215300,"user_tz":180,"elapsed":2,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"38ebf83c-19cb-4aa9-d5b3-242d3879eb07"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[95.0, 77.0, 62.6, 83.30000000000001]\n","[95.0, 77.0, 62.6, 83.30000000000001]\n"]}]},{"cell_type":"markdown","source":["7 - Crie uma função que receba uma lista de números. Com essa lista, a função deve calcular média, moda, mediana e desvio padrão. Ao fim, deve imprimir cada um desses valores em linhas separadas. [Dica](https://docs.python.org/3/library/statistics.html?highlight=mean#statistics.mean)"],"metadata":{"id":"IPQxiTmqgmoD"}},{"cell_type":"code","source":["\n","import statistics as stat\n","\n","lista_nums = [72,42,24,48,124,23]\n","\n","def estatisticas(nums):\n"," media = stat.mean(nums)\n"," moda = stat.mode(nums)\n"," mediana = stat.median(nums)\n"," desvpad = stat.stdev(nums)\n","\n"," print(f'A média da lista é: {media}')\n"," print(f'A moda da lista é: {moda}')\n"," print(f'A mediana da lista é: {mediana}')\n"," print(f'O desvio padrão da lista é: {desvpad}')\n","\n","\n","estatisticas(lista_nums)\n","\n","\n","\n","\n","\n"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"VQ-CTfIrjqvk","executionInfo":{"status":"ok","timestamp":1692294413301,"user_tz":180,"elapsed":234,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"dc7ad671-96e2-4252-c551-6ef4e6608cc6"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["A média da lista é: 55.5\n","A moda da lista é: 72\n","A mediana da lista é: 45.0\n","O desvio padrão da lista é: 38.082804518575045\n"]}]},{"cell_type":"markdown","source":["8 - Calculadora Simples: Crie uma calculadora simples com funções para realizar operações de adição, subtração, multiplicação e divisão. A função principal deve pedir ao usuário qual operação deseja realizar e, em seguida, solicitar os números para a operação."],"metadata":{"id":"2Nw4AaC3WviX"}},{"cell_type":"code","source":["def adicao(a, b):\n"," return a + b\n","\n","def subtracao(a, b):\n"," return a - b\n","\n","def multiplicacao(a, b):\n"," return a * b\n","\n","def divisao(a, b):\n"," if b != 0:\n"," return a / b\n"," else:\n"," return \"Não é possível dividir por zero.\"\n","\n","def calculadora():\n"," print(\"Escolha a operação:\")\n"," print(\"1. Adição\")\n"," print(\"2. Subtração\")\n"," print(\"3. Multiplicação\")\n"," print(\"4. Divisão\")\n"," print(\"===================\")\n"," print(\" \")\n","\n"," escolha = input(\"Digite o número da operação desejada: \")\n","\n"," num1 = float(input(\"Digite o primeiro número: \"))\n"," num2 = float(input(\"Digite o segundo número: \"))\n","\n"," print(\" \")\n"," print(\"###### Resultado ######\")\n","\n"," if escolha == \"1\":\n"," resultado = adicao(num1, num2)\n"," elif escolha == \"2\":\n"," resultado = subtracao(num1, num2)\n"," elif escolha == \"3\":\n"," resultado = multiplicacao(num1, num2)\n"," elif escolha == \"4\":\n"," resultado = divisao(num1, num2)\n"," else:\n"," resultado = \"Operação inválida.\"\n","\n"," print(\"Resultado:\", resultado)\n","\n","# Chamar a função calculadora para realizar uma operação\n","calculadora()"],"metadata":{"id":"IHVI6n3EWZIb","colab":{"base_uri":"https://localhost:8080/"},"outputId":"4e474105-b034-4615-8f92-3835fade01e0","executionInfo":{"status":"ok","timestamp":1692295063370,"user_tz":180,"elapsed":4244,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}}},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["Escolha a operação:\n","1. Adição\n","2. Subtração\n","3. Multiplicação\n","4. Divisão\n","===================\n"," \n","Digite o número da operação desejada: 1\n","Digite o primeiro número: 1\n","Digite o segundo número: 1\n"," \n","###### Resultado ######\n","Resultado: 2.0\n"]}]},{"cell_type":"markdown","source":["### 2. Numpy"],"metadata":{"id":"FpvzYRmGtMfz"}},{"cell_type":"markdown","source":["NumPy (Numerical Python) é uma biblioteca fundamental em Python para computação numérica e científica. Ela fornece estruturas de dados eficientes para trabalhar com arrays multidimensionais e matrizes, além de funções matemáticas para operações numéricas de alta performance. NumPy é amplamente utilizado em áreas como análise de dados, aprendizado de máquina, visualização de dados e mais.\n","\n","**Principais Recursos e Vantagens do NumPy:**\n","\n","* Arrays Multidimensionais: O NumPy introduz o objeto ndarray, que é uma estrutura de dados eficiente para representar arrays multidimensionais. Isso permite que você realize operações numéricas em arrays de maneira eficiente.\n","\n","* Operações Numéricas Eficientes: NumPy oferece funções matemáticas e operadores para realizar operações elementares (adição, subtração, multiplicação, etc.) em arrays inteiros de maneira otimizada.\n","\n","* Broadcasting: NumPy permite que você realize operações entre arrays de diferentes formas e tamanhos, por meio do mecanismo de broadcasting, que automaticamente alinha as dimensões dos arrays.\n","\n","* Funções Matemáticas Avançadas: A biblioteca inclui funções para álgebra linear, transformada de Fourier, estatísticas, entre outras operações matemáticas complexas.\n","\n","* Integração com Outras Bibliotecas: NumPy é frequentemente usado como base para outras bibliotecas e bibliotecas de análise de dados, como Pandas, SciPy e Matplotlib.\n","\n","* Eficiência: As operações em NumPy são implementadas em C, o que garante alta eficiência computacional."],"metadata":{"id":"9hNLrbJTllgz"}},{"cell_type":"markdown","source":["Para importar a biblioteca, pode-se usar o seguinte código:"],"metadata":{"id":"9UjCIEbOvuMk"}},{"cell_type":"code","source":["import numpy as np"],"metadata":{"id":"GOERUpk5vxK8"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":["É convencionado dar um \"apelido\" à certas bibliotecas utilizando o \"as\" depois do import. Abaixo estão as conveções das principais bibliotecas para análises de dados:"],"metadata":{"id":"d2ZmWlxcvz42"}},{"cell_type":"code","source":["import numpy as np\n","import pandas as pd\n","import matplotlib.pyplot as plt"],"metadata":{"id":"P1uAIBF_wrt4"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":["Essas convenções são úteis para reduzir a digitação das funções dentro de cada uma dessas bibliotecas e são também amplamente reconhecidas por outros usuários."],"metadata":{"id":"maiaPuvBw1jA"}},{"cell_type":"markdown","source":["Para se ter uma noção da vantagem de se utilizar o Numpy, peguemos o exemplo de McKinney (2022, p. 85). Primeiro vamos gerar uma lista de um milhão de números:"],"metadata":{"id":"JIvUkuM1zwke"}},{"cell_type":"code","source":["array_milhao = np.arange(1_000_000)\n","lista_milhao = list(range(1_000_000))\n","\n"],"metadata":{"id":"UEBYU9n3z4N9","colab":{"base_uri":"https://localhost:8080/","height":211},"executionInfo":{"status":"error","timestamp":1692646349367,"user_tz":180,"elapsed":453,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"fa36005e-e026-4ac0-b7c1-30b8a1d882b6"},"execution_count":null,"outputs":[{"output_type":"error","ename":"NameError","evalue":"ignored","traceback":["\u001b[0;31m---------------------------------------------------------------------------\u001b[0m","\u001b[0;31mNameError\u001b[0m Traceback (most recent call last)","\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m()\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0marray_milhao\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mnp\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0marange\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;36m1_000_000\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 2\u001b[0m \u001b[0mlista_milhao\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mlist\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mrange\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;36m1_000_000\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 3\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n","\u001b[0;31mNameError\u001b[0m: name 'np' is not defined"]}]},{"cell_type":"markdown","source":["Multiplicando cada número da lista por 2 sem o numpy"],"metadata":{"id":"y56TWM3Z0QgX"}},{"cell_type":"code","source":["%%time\n","\n","my_list = []\n","\n","for i in lista_milhao:\n"," i = i * 2\n"," my_list.append(i)\n"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"8V1IbZ6e1mlK","executionInfo":{"status":"ok","timestamp":1692298330748,"user_tz":180,"elapsed":674,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"c48bc39c-7ce8-49ee-aaf0-5ec08671a037"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["CPU times: user 351 ms, sys: 31 ms, total: 382 ms\n","Wall time: 407 ms\n"]}]},{"cell_type":"markdown","source":["Sem o numpy, mas com list comprehension"],"metadata":{"id":"qx6AOT-R1kwC"}},{"cell_type":"code","source":["%%time\n","\n","my_list2 = [x* 2 for x in lista_milhao]"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"fQXMqP4h0PnT","executionInfo":{"status":"ok","timestamp":1692298333892,"user_tz":180,"elapsed":242,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"0328913d-ee41-434f-9ec2-ab24f99e066c"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["CPU times: user 57 ms, sys: 29.9 ms, total: 86.9 ms\n","Wall time: 92 ms\n"]}]},{"cell_type":"markdown","source":["Agora, utilizando o numpy:"],"metadata":{"id":"TT-JLEFq0ebn"}},{"cell_type":"code","source":["%%time\n","\n","array_milhao = array_milhao * 2"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"52Qx10UJ0f3k","executionInfo":{"status":"ok","timestamp":1692298335851,"user_tz":180,"elapsed":379,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"fb1c3b88-e2c1-496f-bedc-65f0f3e81a5b"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["CPU times: user 1.91 ms, sys: 0 ns, total: 1.91 ms\n","Wall time: 1.93 ms\n"]}]},{"cell_type":"markdown","source":["Percebe-se que é uma diferença considerável, e isso se torna cada vez mais importante conforme o tamanho do banco de dados que estamos trabalhando, se é texto ou não, e o nível de complexo do modelo de aprendizado de máquina, especialmente se ele for de *deep learning* com múltiplas camadas e epochs."],"metadata":{"id":"CNyLx3qL1IGT"}},{"cell_type":"markdown","source":["#### Criando um numpy array.\n","\n","existem várias maneiras de criar um array NumPy. Aqui estão algumas das principais formas de fazer isso:\n","\n","* 1 - Usando uma Lista Python:"],"metadata":{"id":"jC5uHVXd2NO3"}},{"cell_type":"code","source":["\n","lista = [1, 2, 3, 4, 5]\n","array = np.array(lista)\n","\n","print(array, type(array))"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"IMSMIxon3RVE","executionInfo":{"status":"ok","timestamp":1692298728475,"user_tz":180,"elapsed":262,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"48987bf2-fb06-416a-f83a-ac6cdfa02325"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[1 2 3 4 5] \n"]}]},{"cell_type":"markdown","source":["* 2 - Usando a Função numpy.array():"],"metadata":{"id":"mreG6S9O3e3L"}},{"cell_type":"code","source":["\n","array = np.array([1, 2, 3, 4, 5])\n","\n","print(array, type(array))"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"aGgpAQoB3gYT","executionInfo":{"status":"ok","timestamp":1692298784429,"user_tz":180,"elapsed":250,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"ce4689ba-d205-4794-db0b-8e5801bf049f"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[1 2 3 4 5] \n"]}]},{"cell_type":"markdown","source":["* 3 - Usando a Função numpy.arange(), como visto acima:"],"metadata":{"id":"diQk-yhh3m84"}},{"cell_type":"code","source":["array = np.arange(1, 11) # Cria um array com os números de 1 a 10\n","\n","print(array, type(array))"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"cIbkhKBM3qs5","executionInfo":{"status":"ok","timestamp":1692298826847,"user_tz":180,"elapsed":259,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"186fd6b2-405b-4723-9a67-e799688a5327"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[ 1 2 3 4 5 6 7 8 9 10] \n"]}]},{"cell_type":"markdown","source":["* 4 - Usando a Função numpy.linspace():"],"metadata":{"id":"h6qjfUXC3wYv"}},{"cell_type":"code","source":["array = np.linspace(0, 1, num=20) # Cria um array com 20 elementos igualmente espaçados entre 0 e 1\n","\n","print(array, type(array))"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"Q688Z-UB3xxl","executionInfo":{"status":"ok","timestamp":1692298878248,"user_tz":180,"elapsed":241,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"214ed030-4cb5-4bae-eb8e-146de8bc26f8"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[0. 0.05263158 0.10526316 0.15789474 0.21052632 0.26315789\n"," 0.31578947 0.36842105 0.42105263 0.47368421 0.52631579 0.57894737\n"," 0.63157895 0.68421053 0.73684211 0.78947368 0.84210526 0.89473684\n"," 0.94736842 1. ] \n"]}]},{"cell_type":"markdown","source":["* 5 - Usando a Função numpy.zeros():"],"metadata":{"id":"lfadhPj04Bnb"}},{"cell_type":"code","source":["array = np.zeros(45) # Cria um array com 45 elementos, todos iguais a 0\n","\n","print(array, type(array))"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"O0koyN--4D9B","executionInfo":{"status":"ok","timestamp":1692298935012,"user_tz":180,"elapsed":243,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"59ebd5a7-17ce-499f-bf11-e3ac0a67394d"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.\n"," 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.] \n"]}]},{"cell_type":"markdown","source":["* 6 - Usando a Função numpy.ones():"],"metadata":{"id":"CcN84dvr4L3d"}},{"cell_type":"code","source":["array = np.ones(5) # Cria um array com 5 elementos, todos iguais a 1\n","\n","print(array, type(array))"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"hs7EogXM4OaM","executionInfo":{"status":"ok","timestamp":1692298971669,"user_tz":180,"elapsed":244,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"ab74ca13-8082-42d5-a721-6d9bad58fd35"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[1. 1. 1. 1. 1.] \n"]}]},{"cell_type":"markdown","source":["* 7 - Usando a Função numpy.eye():"],"metadata":{"id":"tB4Qb6yv5KYm"}},{"cell_type":"code","source":["array = np.eye(3) # Cria uma matriz identidade 3x3\n","\n","\n","print(array)\n","print(type(array), array.shape, array.dtype)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"8SNU9j095LiK","executionInfo":{"status":"ok","timestamp":1692299253921,"user_tz":180,"elapsed":307,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"8613cd31-3b14-417b-aa22-6f5959c882a2"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[[1. 0. 0.]\n"," [0. 1. 0.]\n"," [0. 0. 1.]]\n"," (3, 3) float64\n"]}]},{"cell_type":"markdown","source":["* 8 - Usando a Função numpy.random.rand()"],"metadata":{"id":"kBE2zP4F5qvb"}},{"cell_type":"code","source":["array = np.random.rand(5) # Cria um array com 5 números aleatórios entre 0 e 1\n","\n","print(array)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"zEcdipxE5reg","executionInfo":{"status":"ok","timestamp":1692299503618,"user_tz":180,"elapsed":249,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"c6694295-ea87-49a9-e617-022ee15d2db9"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[0.40700543 0.93275918 0.00383884 0.07621278 0.14420141]\n"]}]},{"cell_type":"markdown","source":["* 9 - Usando a Função numpy.random.randint()"],"metadata":{"id":"SVNj5-796VyD"}},{"cell_type":"code","source":["array = np.random.randint(1, 100, size=50) # Cria um array com 50 números inteiros aleatórios entre 1 e 99\n","\n","print(array)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"8wlYsNki6WEM","executionInfo":{"status":"ok","timestamp":1692299569638,"user_tz":180,"elapsed":260,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"1d1a9da7-b307-419a-917b-96bd8403172b"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[41 16 99 32 50 77 17 24 38 43 29 67 32 94 73 84 32 70 60 24 86 9 90 30\n"," 33 74 41 24 2 72 4 47 79 47 89 12 86 63 32 87 55 35 63 82 96 52 99 9\n"," 48 18]\n"]}]},{"cell_type":"markdown","source":["* 10 - Por fim, criando um Array Vazio:"],"metadata":{"id":"Oupg-XrM6kVp"}},{"cell_type":"code","source":["array = np.empty(5) # Cria um array vazio com 5 elementos (valores não inicializados)\n","\n","print(array)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"UehfCmA76oS8","executionInfo":{"status":"ok","timestamp":1692299607760,"user_tz":180,"elapsed":245,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"76bc139a-2a9f-4329-b07f-70b83aeb9487"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[3.5e-323 9.9e-324 4.0e-323 2.5e-323 4.4e-323]\n"]}]},{"cell_type":"markdown","source":["Essas são apenas algumas das maneiras de criar arrays NumPy. Dependendo da situação, você pode escolher a abordagem mais adequada às suas necessidades."],"metadata":{"id":"HhMdjsS36oqZ"}},{"cell_type":"markdown","source":["#### Tipos de dados e Numpy"],"metadata":{"id":"xp2iHrX-7Nkd"}},{"cell_type":"markdown","source":["NumPy oferece suporte a uma ampla variedade de tipos de dados que podem ser usados em arrays e matrizes multidimensionais. Os tipos de dados em NumPy são mais eficientes em termos de uso de memória e desempenho do que os tipos de dados padrão do Python. Além dos tipos numéricos como inteiros e ponto flutuante, NumPy inclui tipos complexos, booleanos e tipos especiais para lidar com datas e horas. Essa diversidade de tipos de dados permite a manipulação eficiente e precisa de dados em aplicações científicas, matemáticas e de análise de dados, garantindo que os cálculos sejam executados de maneira otimizada e precisa.\n","\n","De forma geral os principais tipos de dados ainda são os básicos do python: int, float, e string. Não é necessário se preocupar agora com os outros tipos apresentados na tabela 4-2 de Mckinney (2022, p.89), como o int8, int32, etc. Como dito pelo autor, isso só deve gerar preocupações \"when you need more control over how data is stored in memory and on disk, especially large datasets\"."],"metadata":{"id":"sjPffsC87PBB"}},{"cell_type":"markdown","source":["Para verificar o tipo de dado presente em um array, pode se utilizar o dtype:"],"metadata":{"id":"c_8SJucw75JE"}},{"cell_type":"code","source":["# Int\n","\n","array = np.array([1, 2, 3, 4, 5])\n","\n","print(array.dtype)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"8rQSjoS-8Qie","executionInfo":{"status":"ok","timestamp":1692300040423,"user_tz":180,"elapsed":294,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"723b398e-e38a-4285-8610-b64d5a80da75"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["int64\n"]}]},{"cell_type":"code","source":["# Float\n","\n","array = np.array([1.53213,7.4312423,6.412312,5.213123,2.3254325234])\n","\n","\n","print(array.dtype)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"kyy35zWk8YKJ","executionInfo":{"status":"ok","timestamp":1692300076729,"user_tz":180,"elapsed":2,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"2d133f7d-e175-48be-9715-6a8796faf033"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["float64\n"]}]},{"cell_type":"markdown","source":["Para converter um array de um tipo para outro, pode se usar o astype"],"metadata":{"id":"ShJrMG4l8ihL"}},{"cell_type":"code","source":["# Float para int\n","\n","array = np.array([1.53213,7.4312423,6.412312,5.213123,2.3254325234])\n","\n","array_int = array.astype(np.int64)\n","\n","print(array_int)\n","print(array_int.dtype)\n"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"lWUSdnxo8uqK","executionInfo":{"status":"ok","timestamp":1692300257257,"user_tz":180,"elapsed":240,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"04fe1a41-ae76-4011-85d7-591b693cca93"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[1 7 6 5 2]\n","int64\n"]}]},{"cell_type":"code","source":["# Int para float\n","\n","array = np.array([1, 2, 3, 4, 5])\n","\n","array_float = array.astype(np.float64)\n","\n","print(array_float)\n","print(array_float.dtype)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"cIUB-ajN9NNH","executionInfo":{"status":"ok","timestamp":1692300291046,"user_tz":180,"elapsed":381,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"a4f21834-16a3-4ff1-9d5c-3a4564309138"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[1. 2. 3. 4. 5.]\n","float64\n"]}]},{"cell_type":"code","source":["# str para float\n","\n","array = np.array(['5.0', '7.5', '8.5', '9.0'])\n","\n","array_float = array.astype(np.float64)\n","\n","print(array_float)\n","print(array_float.dtype)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"iuVhCUO39lOU","executionInfo":{"status":"ok","timestamp":1692300422263,"user_tz":180,"elapsed":242,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"f5cb9c1d-69c1-4407-bea8-73c8f2fa5fca"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[5. 7.5 8.5 9. ]\n","float64\n"]}]},{"cell_type":"markdown","source":["#### Operações Aritméticas com Arrays"],"metadata":{"id":"rOJa6HRm-Atd"}},{"cell_type":"markdown","source":["Operações aritméticas com arrays são uma parte essencial do NumPy, permitindo realizar cálculos elementares de forma eficiente em arrays multidimensionais. NumPy facilita a execução de operações entre arrays de diferentes formas e tamanhos, usando o conceito de broadcasting para alinhar automaticamente as dimensões dos arrays quando necessário. Aqui estão as principais operações aritméticas suportadas pelo NumPy:"],"metadata":{"id":"YxvvMXhr-DvU"}},{"cell_type":"markdown","source":["* 1 - Adição"],"metadata":{"id":"kbS-2Dlo-HqF"}},{"cell_type":"code","source":["array1 = np.array([1, 2, 3])\n","array2 = np.array([4, 5, 6])\n","resultado = array1 + array2\n","\n","print(resultado)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"SlZcmAZ3-C50","executionInfo":{"status":"ok","timestamp":1692300523800,"user_tz":180,"elapsed":277,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"9d83c6f4-5d2f-476c-a890-047d80e66ca8"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[5 7 9]\n"]}]},{"cell_type":"markdown","source":["Veja que o numpy facilita a operação, somando cada elemento do array1 com seu correspondente de índice no array 2."],"metadata":{"id":"NVd5rRCJ-gCA"}},{"cell_type":"markdown","source":["* 2 - Subtração:"],"metadata":{"id":"qTOinDbl-nUP"}},{"cell_type":"code","source":["resultado = array1 - array2\n","\n","print(resultado)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"xduyZ3R--pgi","executionInfo":{"status":"ok","timestamp":1692300657006,"user_tz":180,"elapsed":282,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"3c1cf47d-b0e7-4ebf-8b48-2a3c49793b7c"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[-3 -3 -3]\n"]}]},{"cell_type":"markdown","source":["* 3 - Multiplicação:\n","\n","Assim como em matrizes, pode se multiplicar um array por um escalar ou por outro array:"],"metadata":{"id":"Qpwct8Vk-yEL"}},{"cell_type":"code","source":["# Escalar\n","\n","resultado = array1 * 10\n","\n","print(resultado)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"ivEwXIn6-3Tq","executionInfo":{"status":"ok","timestamp":1692300720186,"user_tz":180,"elapsed":2,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"2fe0d477-c665-4d51-eb77-b485d2ba0adf"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[10 20 30]\n"]}]},{"cell_type":"code","source":["# Array com array\n","\n","resultado = array1 * array2\n","\n","print(resultado)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"oldIZCvZ-8kE","executionInfo":{"status":"ok","timestamp":1692300742410,"user_tz":180,"elapsed":2,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"b77e98d4-46e6-4518-8450-434931241394"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[ 4 10 18]\n"]}]},{"cell_type":"markdown","source":["Não se pode multiplicar arrays com dimensões diferentes"],"metadata":{"id":"9wWIdvos_C7w"}},{"cell_type":"code","source":["array3 = np.array([1,2])\n","\n","resultado = array1 * array3\n","\n"],"metadata":{"colab":{"base_uri":"https://localhost:8080/","height":227},"id":"3VxYwQUO_G5E","executionInfo":{"status":"error","timestamp":1692300788532,"user_tz":180,"elapsed":379,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"a9b9161a-7c1c-47b6-8f3c-0820d906a457"},"execution_count":null,"outputs":[{"output_type":"error","ename":"ValueError","evalue":"ignored","traceback":["\u001b[0;31m---------------------------------------------------------------------------\u001b[0m","\u001b[0;31mValueError\u001b[0m Traceback (most recent call last)","\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m()\u001b[0m\n\u001b[1;32m 1\u001b[0m \u001b[0marray3\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mnp\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0marray\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;36m2\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m 2\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m----> 3\u001b[0;31m \u001b[0mresultado\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0marray1\u001b[0m \u001b[0;34m*\u001b[0m \u001b[0marray3\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m 4\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n","\u001b[0;31mValueError\u001b[0m: operands could not be broadcast together with shapes (3,) (2,) "]}]},{"cell_type":"markdown","source":["* 4 - Divisão\n","\n","Realiza divisão elemento a elemento ou divisão por um escalar."],"metadata":{"id":"V119fOJa_NDr"}},{"cell_type":"code","source":["resultado = array1 / array2\n","resultado_div_escalar = array1 / 2\n","\n","print(resultado)\n","print(resultado_div_escalar)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"Ut0yGO9Q_QqI","executionInfo":{"status":"ok","timestamp":1692300826664,"user_tz":180,"elapsed":248,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"896a3911-49bb-436b-c514-05c435f762d6"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[0.25 0.4 0.5 ]\n","[0.5 1. 1.5]\n"]}]},{"cell_type":"markdown","source":["Também não se pode dividir arrays com dimensões diferentes"],"metadata":{"id":"rGz0LDGj_WNG"}},{"cell_type":"code","source":["resultado = array1 / array3"],"metadata":{"colab":{"base_uri":"https://localhost:8080/","height":175},"id":"ZI4oiTlY_YgJ","executionInfo":{"status":"error","timestamp":1692300844841,"user_tz":180,"elapsed":245,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"a93d8d48-d59b-4c5f-a930-0930467230b4"},"execution_count":null,"outputs":[{"output_type":"error","ename":"ValueError","evalue":"ignored","traceback":["\u001b[0;31m---------------------------------------------------------------------------\u001b[0m","\u001b[0;31mValueError\u001b[0m Traceback (most recent call last)","\u001b[0;32m\u001b[0m in \u001b[0;36m\u001b[0;34m()\u001b[0m\n\u001b[0;32m----> 1\u001b[0;31m \u001b[0mresultado\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0marray1\u001b[0m \u001b[0;34m/\u001b[0m \u001b[0marray3\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m","\u001b[0;31mValueError\u001b[0m: operands could not be broadcast together with shapes (3,) (2,) "]}]},{"cell_type":"markdown","source":["* 5 - Potenciação:\n","\n","Eleva cada elemento do array à potência indicada."],"metadata":{"id":"_XB5Kezi_dKS"}},{"cell_type":"code","source":["resultado_potencia = array1 ** 2\n","\n","print(resultado_potencia)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"vD8Ak7AR_eyF","executionInfo":{"status":"ok","timestamp":1692300884633,"user_tz":180,"elapsed":240,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"155e8afc-085e-4308-fc04-6185aa038f7c"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[1 4 9]\n"]}]},{"cell_type":"markdown","source":["* 6 - Operações Matriciais"],"metadata":{"id":"nbwQkxCuBWl4"}},{"cell_type":"markdown","source":["NumPy também suporta operações matriciais, como multiplicação de matrizes e produtos internos, usando funções como np.dot() e o operador @."],"metadata":{"id":"Ajwv4nZTBZMv"}},{"cell_type":"code","source":["matriz1 = np.array([[1, 2], [3, 4]])\n","matriz2 = np.array([[5, 6], [7, 8]])\n","produto_matricial = np.dot(matriz1, matriz2)\n","\n","print(produto_matricial)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"4cvmFPGTBY16","executionInfo":{"status":"ok","timestamp":1692301389893,"user_tz":180,"elapsed":240,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"15a9f392-3b2c-4eee-cb34-83422a40986a"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[[19 22]\n"," [43 50]]\n"]}]},{"cell_type":"markdown","source":["#### Testes lógicos e operações booleanas\n"],"metadata":{"id":"FTgwwOFVBxlX"}},{"cell_type":"markdown","source":["O NumPy oferece várias funcionalidades para realizar testes lógicos e operações booleanas em arrays, permitindo filtrar dados com base em condições e realizar operações que dependem de valores booleanos. Isso é especialmente útil para análise de dados e tomada de decisões com base em critérios específicos. Aqui estão algumas das principais funcionalidades relacionadas a testes lógicos e booleanos em NumPy:"],"metadata":{"id":"0horCQjXCDEs"}},{"cell_type":"markdown","source":["* 1 - Operações lógicas elementares\n","\n","NumPy fornece operadores lógicos elementares, como >, <, >=, <=, ==, !=, para realizar comparações elemento a elemento entre arrays."],"metadata":{"id":"RBRw7_nNCFXg"}},{"cell_type":"code","source":["array = np.array([1, 2, 3, 4, 5])\n","maior_que_2 = array > 2\n","\n","print(maior_que_2)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"h5lDBfeUD__q","executionInfo":{"status":"ok","timestamp":1692302162992,"user_tz":180,"elapsed":339,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"1aaa4028-01ae-4832-93de-4cd563de5e84"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[False False True True True]\n"]}]},{"cell_type":"code","source":["igual_a_3 = array == 3\n","\n","print(igual_a_3)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"QurWiwbHEcg6","executionInfo":{"status":"ok","timestamp":1692302176743,"user_tz":180,"elapsed":256,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"9b7629d0-a050-42e9-f68b-fd1d33da5481"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[False False True False False]\n"]}]},{"cell_type":"markdown","source":["* 2 - Combinação de Condições"],"metadata":{"id":"MWF8MaL2EuYz"}},{"cell_type":"markdown","source":["Você pode usar operadores lógicos & (AND) e | (OR) para combinar condições booleanas em arrays."],"metadata":{"id":"M5FD11D3ExbC"}},{"cell_type":"code","source":["condicao1 = array > 2\n","condicao2 = array < 5\n","combinacao = condicao1 & condicao2\n","\n","print(combinacao)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"2k-sGfPFEwEz","executionInfo":{"status":"ok","timestamp":1692302268309,"user_tz":180,"elapsed":3,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"56a957b5-7257-4e1e-8c3b-ac8ae79d45bd"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[False False True True False]\n"]}]},{"cell_type":"markdown","source":["* 3 - Filtragem de Dados"],"metadata":{"id":"4FJ63dIYE_tN"}},{"cell_type":"markdown","source":["Usando arrays booleanos, você pode filtrar os elementos que atendem a determinadas condições."],"metadata":{"id":"VdfRTznyFBPz"}},{"cell_type":"code","source":["elementos_filtrados = array[combinacao]\n","\n","print(elementos_filtrados)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"QRIw_DpiFA2v","executionInfo":{"status":"ok","timestamp":1692302330967,"user_tz":180,"elapsed":343,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"3c3e498b-c57e-4ba7-9667-d56b4ee2aa05"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[3 4]\n"]}]},{"cell_type":"markdown","source":["* 4 - Funções de Agregação Booleanas"],"metadata":{"id":"Ciz61qZeFG0r"}},{"cell_type":"markdown","source":["NumPy oferece funções como np.all() e np.any() para verificar se todos os elementos de um array são True ou se pelo menos um elemento é True."],"metadata":{"id":"3fXoR7ECFJuN"}},{"cell_type":"code","source":["todos_maior_que_2 = np.all(array > 2)\n","algum_igual_a_3 = np.any(array == 3)\n","\n","print(todos_maior_que_2)\n","print(algum_igual_a_3)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"2gu6_XxBFIih","executionInfo":{"status":"ok","timestamp":1692302375197,"user_tz":180,"elapsed":246,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"3bd0145a-2279-4141-dabb-e89d324bc492"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["False\n","True\n"]}]},{"cell_type":"markdown","source":["#### Indexação e Fatiamento de arrays"],"metadata":{"id":"ths-iCCIHpF5"}},{"cell_type":"markdown","source":["A indexação e o fatiamento (slicing) de arrays são operações fundamentais em NumPy que permitem acessar elementos individuais ou subconjuntos de elementos em um array multidimensional. Isso é útil para recuperar informações específicas ou para manipular dados de maneira eficiente. Aqui está uma visão geral dessas operações:\n","\n","A indexação em NumPy é baseada em zero, o que significa que o primeiro elemento de um array tem índice 0, o segundo índice 1 e assim por diante. A indexação pode ser feita de forma direta para arrays unidimensionais ou usando tuplas para arrays multidimensionais."],"metadata":{"id":"ZJX7X5m8Hrig"}},{"cell_type":"code","source":["array = np.array([10, 20, 30, 40, 50])\n","\n","elemento = array[0] # Acessa o primeiro elemento (índice 0)\n","ultimo_elemento = array[-1] # Acessa o último elemento usando índice negativo\n","\n","print(elemento)\n","print(ultimo_elemento)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"t_EL4IiOHyBG","executionInfo":{"status":"ok","timestamp":1692303053310,"user_tz":180,"elapsed":254,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"2d57c92c-d475-44dc-d08f-ee8d430a418b"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["10\n","50\n"]}]},{"cell_type":"markdown","source":["O fatiamento permite selecionar subconjuntos de elementos de um array. Ele é realizado usando a notação [start:stop:step], onde start é o índice de início (incluído), stop é o índice de parada (excluído) e step é o intervalo entre elementos."],"metadata":{"id":"sstCb1HSH53N"}},{"cell_type":"code","source":["sub_array = array[1:4] # Seleciona elementos do índice 1 ao 3 (índice 4 é excluído)\n","passo2 = array[::2] # Seleciona elementos em intervalos de 2\n","\n","print(sub_array)\n","print(passo2)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"CgXJAb25H8bL","executionInfo":{"status":"ok","timestamp":1692303105626,"user_tz":180,"elapsed":259,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"c0c307f8-71f5-4b3a-c454-2be23128c24d"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[20 30 40]\n","[10 30 50]\n"]}]},{"cell_type":"markdown","source":["Para arrays multidimensionais, você pode usar indexação e fatiamento em cada dimensão separadamente, separados por vírgulas."],"metadata":{"id":"GLy7srK4ID_3"}},{"cell_type":"code","source":["matriz = np.array([[1, 2, 3],\n"," [4, 5, 6],\n"," [7, 8, 9]])\n","\n","primeira_linha = matriz[0] # Acessa a primeira linha\n","\n","segunda_coluna = matriz[:, 1] # Acessa a segunda coluna\n","submatriz = matriz[1:3, 0:2] # Seleciona uma submatriz\n","\n","print(primeira_linha)\n","print('==============')\n","print(segunda_coluna)\n","print('==============')\n","print(submatriz)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"XTlgk1fvIFFC","executionInfo":{"status":"ok","timestamp":1692303199138,"user_tz":180,"elapsed":239,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"d83a9b1e-a5f6-4706-db4a-d18b93d01a29"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[1 2 3]\n","==============\n","[2 5 8]\n","==============\n","[[4 5]\n"," [7 8]]\n"]}]},{"cell_type":"markdown","source":["A figura 4-1 de Mckinney (2022) permite entender melhor a indexação de arrays."],"metadata":{"id":"YVvtwYmKIpRb"}},{"cell_type":"markdown","source":["![image.png]()"],"metadata":{"id":"WFGlf-obIdby"}},{"cell_type":"markdown","source":["### Exercícios"],"metadata":{"id":"pB76DHQgnI5g"}},{"cell_type":"markdown","source":["Antes de ir aos exercícios, explore a documentação própria do Numpy ([Link](https://numpy.org/doc/stable/reference/routines.html))"],"metadata":{"id":"np3urlXCTVgw"}},{"cell_type":"markdown","source":["1 - Crie um array NumPy que contenha os primeiros 10 números pares. Imprima o array"],"metadata":{"id":"leaLDwwHp1lA"}},{"cell_type":"code","source":["numeros_pares = np.arange(0, 20, 2)\n","print(numeros_pares)"],"metadata":{"id":"zRAbyoOmp1T8"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":["2 - Crie uma matriz identidade 4x4 usando NumPy. Imprima o array"],"metadata":{"id":"n8RrP0ZVp16G"}},{"cell_type":"code","source":["matriz_identidade = np.eye(4)\n","print(matriz_identidade)"],"metadata":{"id":"Z8IT-c9jp2T3"},"execution_count":null,"outputs":[]},{"cell_type":"markdown","source":["3 - Utilizando um for loop, multiplique os valores da primeira lista pela segunda lista. Imprima o resultado final. Dica: Você pode precisar da função range() e len() vistas na aula anterior."],"metadata":{"id":"E7ZLVfdZrKyj"}},{"cell_type":"code","source":["lista1 = [7,6,1,2,54,25]\n","lista2 = [1,2,3,4,5,6]\n","\n","resultado = []\n","\n","for x in range(0, len(lista1)):\n"," valor = lista1[x] * lista2[x]\n"," resultado.append(valor)\n","\n","\n","print(resultado)\n","\n"],"metadata":{"id":"FJegLxCbp2qc","colab":{"base_uri":"https://localhost:8080/"},"executionInfo":{"status":"ok","timestamp":1692303965630,"user_tz":180,"elapsed":252,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"b175e10a-a45c-4f90-dc2f-7ee44ed33274"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[7, 12, 3, 8, 270, 150]\n"]}]},{"cell_type":"markdown","source":["4 - Transforme as listas 1 e 2 em arrays e multiplique seus valores"],"metadata":{"id":"fIqHOXYMtEP9"}},{"cell_type":"code","source":["print(np.array(lista1) * np.array(lista2))\n","\n"],"metadata":{"id":"F_SABdJEp2hC","colab":{"base_uri":"https://localhost:8080/"},"executionInfo":{"status":"ok","timestamp":1692304048282,"user_tz":180,"elapsed":257,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"932d5fec-05e1-411a-c8a2-b902d0e67eb6"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[ 7 12 3 8 270 150]\n"]}]},{"cell_type":"markdown","source":["5 - Pegue apenas os valores pares da seguinte lista utilizando um for loop"],"metadata":{"id":"ptnGI1LCtKTM"}},{"cell_type":"code","source":["\n","lista = list(range(0,100))\n","\n","pares = []\n","\n","for i in lista:\n"," if i % 2 == 0:\n"," pares.append(i)\n"," else:\n"," pass\n","\n","print(pares)\n","\n"],"metadata":{"id":"4lwY3XEtp3DI","colab":{"base_uri":"https://localhost:8080/"},"executionInfo":{"status":"ok","timestamp":1692646604755,"user_tz":180,"elapsed":315,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"5777ff04-5667-4c9f-b99c-666f7edf9274"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98]\n"]}]},{"cell_type":"markdown","source":["6 - Transforme a lista do exercício 5 em um array e também só pegue os números pares."],"metadata":{"id":"PlCYl4Y3MkJf"}},{"cell_type":"code","source":["array = np.array(lista)\n","\n","pares = array[array % 2 == 0]\n","\n","print(pares)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"u1EjEbjwMqdb","executionInfo":{"status":"ok","timestamp":1692304364442,"user_tz":180,"elapsed":2,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"5bbac795-8524-44a5-9960-d0e3537e7723"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[ 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46\n"," 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94\n"," 96 98]\n"]}]},{"cell_type":"markdown","source":["7 - Abaixo estão duas listas: uma com o nome de candidatos (inventados) e outra com valores *dummy* (ou binários) que informam se o candidato possui ou não twitter. Usando numpy arrays, filtre os candidatos que *possuem* twitter."],"metadata":{"id":"xlHdQzLnM7tL"}},{"cell_type":"code","source":["import random\n","\n","nomes = [\"Alice\", \"Bob\", \"Carlos\", \"David\", \"Emily\", \"Fernanda\", \"Gabriel\", \"Hannah\", \"Isaac\", \"Julia\",\n"," \"Kevin\", \"Larissa\", \"Mateus\", \"Natalia\", \"Oliver\", \"Paula\", \"Quincy\", \"Renata\", \"Samuel\", \"Tatiana\"]\n","\n","twitter = [random.choice([0, 1]) for _ in range(20)]\n","\n","\n","nomes_array = np.array(nomes)\n","twitter_array = np.array(twitter)\n","\n","\n","candidatos_twitter = nomes_array[twitter_array == 1]\n","\n","print(candidatos_twitter)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"xRinnIJENSzr","executionInfo":{"status":"ok","timestamp":1692304871416,"user_tz":180,"elapsed":268,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"5dd7e5fd-4ff7-48f2-e841-81d5df553445"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["['Bob' 'Emily' 'Fernanda' 'Gabriel' 'Kevin' 'Larissa' 'Natalia' 'Paula'\n"," 'Samuel' 'Tatiana']\n"]}]},{"cell_type":"markdown","source":["8 - Escreva um programa NumPy para criar uma matriz 5x5 com valores aleatórios e calcule o exponencial de cada elemento. [Dica](https://numpy.org/doc/stable/reference/routines.math.html#mathematical-functions)"],"metadata":{"id":"E9pYhIcHQhOJ"}},{"cell_type":"code","source":["nums = np.random.rand(5, 5)\n","print(\"Array original:\")\n","print(nums)\n","exp_arr = np.exp(nums)\n","print(\"Exponencial do Array:\")\n","print(exp_arr)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"vMFWbiqnQicD","executionInfo":{"status":"ok","timestamp":1692305640530,"user_tz":180,"elapsed":922,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"68494ee1-5e8b-4601-a89d-02f014f13a3b"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["Array original:\n","[[0.43599782 0.69890041 0.83101454 0.9320552 0.24958755]\n"," [0.00395804 0.43723751 0.84946878 0.40464531 0.24594518]\n"," [0.46150315 0.04044142 0.27562886 0.10907478 0.39639848]\n"," [0.63925224 0.6660276 0.72738481 0.45879473 0.3891829 ]\n"," [0.0180678 0.71424388 0.05872258 0.14679153 0.75860369]]\n","Exponencial do Array:\n","[[1.54650543 2.01153962 2.29564658 2.53972345 1.28349592]\n"," [1.00396588 1.54842379 2.33840432 1.49877081 1.27882947]\n"," [1.58645688 1.04127031 1.31735885 1.11524574 1.48646152]\n"," [1.8950633 1.9464897 2.06966097 1.58216589 1.47577444]\n"," [1.01823201 2.04264161 1.060481 1.15811251 2.13529261]]\n"]}]},{"cell_type":"markdown","source":["9 - Crie uma matriz (array) 3x2 e outra 2x3, sem utilizar o random, e multiplique-as. Dica: Não dá para usar o operador \"*\""],"metadata":{"id":"oM4jlef0Rt4q"}},{"cell_type":"code","source":["matriz1 = np.array([[1, 2],\n"," [3, 4],\n"," [5, 6]])\n","\n","matriz2 = np.array([[1,2,3],\n"," [3,2,1]])\n","\n","print(np.matmul(matriz1,matriz2))"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"9S5Qoz3kR6gK","executionInfo":{"status":"ok","timestamp":1692305938812,"user_tz":180,"elapsed":263,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"669f857f-f1ec-497a-d3d8-8a963034d1d3"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[[ 7 6 5]\n"," [15 14 13]\n"," [23 22 21]]\n"]}]},{"cell_type":"markdown","source":["10 - Transponha a matriz2 e refaça a operação"],"metadata":{"id":"McY-qLTdTJ-V"}},{"cell_type":"code","source":["matriz2_T = np.transpose(matriz2)\n","\n","print(matriz2_T)\n","\n","print(\"Resultado: \")\n","print(matriz1 * matriz2_T)\n"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"GvDigZ_tTNR9","executionInfo":{"status":"ok","timestamp":1692306215282,"user_tz":180,"elapsed":2,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"d345ad2d-d4f7-4344-8e7a-e9e1444edf45"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[[1 3]\n"," [2 2]\n"," [3 1]]\n","Resultado: \n","[[ 1 6]\n"," [ 6 8]\n"," [15 6]]\n"]}]},{"cell_type":"markdown","source":["11 - Imprima o número 50 do seguinte array"],"metadata":{"id":"KY4glxO8Ua8P"}},{"cell_type":"code","source":["arr = np.array([[10, 20, 30, 40], [50, 60, 70, 80]])\n","\n","print(arr[1, 0])"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"mjMI7vx0Uc3I","executionInfo":{"status":"ok","timestamp":1692306375464,"user_tz":180,"elapsed":230,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"e456e19a-f9de-4857-a330-4c00f6661c5e"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["50\n"]}]},{"cell_type":"markdown","source":["12 - Crie uma matriz 3x3 de números e acesse o elemento da segunda linha e terceira coluna."],"metadata":{"id":"K2p5687bU32n"}},{"cell_type":"code","source":["matriz = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])\n","elemento = matriz[1, 2]\n","print(elemento)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"b6C07nkoU5K0","executionInfo":{"status":"ok","timestamp":1692306479725,"user_tz":180,"elapsed":256,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"777f0628-f759-41df-d225-d6095475bfb5"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["6\n"]}]},{"cell_type":"markdown","source":["13 - Crie uma matriz 4x4 de números e use fatiamento para obter uma submatriz 2x2 da parte superior esquerda."],"metadata":{"id":"XgIcm4deVecc"}},{"cell_type":"code","source":["matriz = np.array([[1, 2, 3, 4],\n"," [5, 6, 7, 8],\n"," [9, 10, 11, 12],\n"," [13, 14, 15, 16]])\n","\n","submatriz = matriz[:2, :2]\n","print(submatriz)"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"m4sHEx-FVhU1","executionInfo":{"status":"ok","timestamp":1692309801879,"user_tz":180,"elapsed":259,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"0c6dd83a-3cb7-48d8-cb1d-6ea249f5714d"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["[[1 2]\n"," [5 6]]\n"]}]},{"cell_type":"markdown","source":["14 - Crie uma função que recebe um array de strings que contém os usuários de twitter de deputados, remova o prefixo \"@\" e deixe tudo minúsculo. Depois, a aplique na lista_twitters. [Dica](https://numpy.org/doc/stable/reference/routines.char.html)"],"metadata":{"id":"oOD-V93QjVTE"}},{"cell_type":"code","source":["\n","\n","# Lista de nomes de usuário no twitter\n","lista_twitters = nomes_com_arroba = [\"@Ana\", \"@Pedro\", \"@Isabel\", \"@João\",\n"," \"@Mariana\", \"@Rafael\", \"@Beatriz\", \"@Lucas\",\n"," \"@Carolina\", \"@Gustavo\", \"@Lívia\", \"@André\",\n"," \"@Júlia\", \"@Matheus\", \"@Laura\", \"@Gabriel\",\n"," \"@Amanda\", \"@Daniel\", \"@Clara\", \"@Felipe\"]\n","\n","array_twitters = lista_twitters\n","\n","def limpa_twitters(array):\n","\n"," array = np.char.replace(array, '@', '')\n"," array = np.char.lower(array)\n"," return array\n","\n","\n","\n","resultado = limpa_twitters(array_twitters)\n","\n","print(resultado)\n"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"WxXw3wI6jZXs","executionInfo":{"status":"ok","timestamp":1692310713206,"user_tz":180,"elapsed":3,"user":{"displayName":"Pedro Henrique de Santana Schmalz","userId":"15443225301388878262"}},"outputId":"34b78253-21ac-42db-9139-1749b9b3ec45"},"execution_count":null,"outputs":[{"output_type":"stream","name":"stdout","text":["['ana' 'pedro' 'isabel' 'joão' 'mariana' 'rafael' 'beatriz' 'lucas'\n"," 'carolina' 'gustavo' 'lívia' 'andré' 'júlia' 'matheus' 'laura' 'gabriel'\n"," 'amanda' 'daniel' 'clara' 'felipe']\n"]}]},{"cell_type":"markdown","source":["## Desafio - Aprimore suas Técnicas de Seleção"],"metadata":{"id":"_r3WbMPaRuXt"}},{"cell_type":"markdown","source":["

Agora que você já colocou em prática sua criatividade e está familiarizado com as etapas de seleção do corpus utilizado na pesquisa que orienta a nossa disciplina, vamos aprimorar o código desenvolvido no desafio do Tutorial 02 e avançar na discussão acerca das dificuldades inerentes a construção de um corpus de uma pesquisa em PLN."],"metadata":{"id":"poYWOkuF7s9I"}},{"cell_type":"markdown","source":["#### Recapitulando"],"metadata":{"id":"Eg9BxC2d7uJC"}},{"cell_type":"markdown","source":["

No desafio anterior, solicitamos que você construísse uma estrutura de classificação destinada a determinar quais tweets seriam incluídos ou excluídos do corpus da pesquisa. Isso deveria ser feito com base nas informações fornecidas pelo Vaccine Codebook of Political Elites 2023. O objetivo principal era que você identificasse com precisão as várias etapas do processo de seleção dos tweets destinados a compor o corpus, começando pela análise da lista de candidatos à prefeito nas capitais brasileiras e seguindo até a escolha dos tweets que, conforme os critérios definidos no documento, seriam submetidos à codificação humana.\n","\n","

Tratava-se de um exercício fundamentalmente criativo, o que lhe conferia uma dose de liberdade para agir. Desde que o seu código conseguisse diferenciar de forma nítida quais candidatos ou tweets seriam descartados ou aceitos a cada etapa do processo, não havia margem para erro. Era viável presumir a existência de uma base de dados consolidada contendo essas informações. Você também tinha a liberdade para criar uma base de dados fictícia para trabalhar e até mesmo supor a existência de variáveis que, pelo menos na atual conjuntura, não são levadas em consideração pelos órgãos que divulgam essas informações, como o TSE e até mesmo o próprio Twitter.\n","\n","\n","

Poréeeem, como tudo o que é bom tem seu fim, chegou a hora de trazer um pouco de realidade para a equação."],"metadata":{"id":"YXPky1dy762z"}},{"cell_type":"markdown","source":["#### Uma Dose de Realidade"],"metadata":{"id":"9gip9Y7n8Afo"}},{"cell_type":"markdown","source":["

Não pretendo te desanimar, contudo, acredito que seja essencial trazer à discussão um ponto relevante. Essa base de dados excepcional, contendo todas as informações necessárias, simplesmente NÃO existe e é improvável que venha a existir. Sempre haverá a necessidade de realizar ajustes, organizar ou fazer modificações mínimas. Mesmo quando parece estar em condições ideais (o que RARAMENTE ocorre), ainda assim, será necessário investir tempo para adaptar os dados às exigências tanto suas quanto da pesquisa em si.\n","\n","

No contexto de nossa pesquisa, precisamos recorrer a três fontes de informação distintas: o TSE, o Google e o Twitter. Permita-me explicar.\n","\n","

Recorremos ao TSE, por razões óbvias, para cruzar as informações demográficas dos candidatos à prefeito com os votos que obtiveram em seus respectivos distritos eleitorais. Uma vez concluído esse processo, selecionamos apenas aqueles cujas candidaturas foram aprovadas pelo TSE e que competiram em uma das capitais. Somente então prosseguimos para identificar aqueles que possuíam uma conta no Twitter. Sim, essa informação não está disponível nas bases de dados do TSE. Pelo menos não de forma consistente. Observem que somente recentemente essa informação passou a ser coletada e divulgada pelos diretórios partidários. Além disso, não é obrigatório que os candidatos tenham e façam uso das redes sociais nas campanhas eleitorais, o que torna esse dado pouco confiável e de difícil utilização, pelo menos no momento atual.\n","\n","

Em razão disso, tornou-se necessário investigar individualmente os 300 candidatos cujas candidaturas foram aprovadas, utilizando o Google para verificar se possuíam contas no Twitter ou não. Após a conclusão desse processo e com os perfis de usuário dos candidatos em nossa posse, avançamos para a coleta de todos os tweets publicados em 2020 pelos candidatos à prefeito que possuíam contas ativas na plataforma Twitter.\n","\n","

Uma vez concluída essa etapa, procedemos então à filtragem dos 231.770 tweets coletados, selecionando exclusivamente aqueles que faziam menção a um ou mais dos termos e palavras-chave previamente estabelecidos por nossa equipe.\n","\n","

Ufa, acabou! Finalmente temos um corpus pronto para ser utilizado."],"metadata":{"id":"AuQdlq1S8E5U"}},{"cell_type":"markdown","source":["#### A Tarefa"],"metadata":{"id":"RGctPXNq8XeK"}},{"cell_type":"markdown","source":["

Com base no conteúdo abordado nas seções anteriores, especialmente na consideração dos desafios envolvidos na construção de um corpus robusto e coerente, e aproveitando os conhecimentos em Python que você acumulou até agora, chegou o momento de elevar a qualidade e aplicabilidade do seu classificador.\n","\n","

Dessa vez, iremos avaliar a eficácia do seu código em dados reais. Para isso, selecione 10 candidatos da amostra fornecida no Vaccine Codebook of Political Elites 2023. Assegure-se de escolher candidatos provenientes de diferentes capitais, e garanta que nem todos possuam uma conta no Twitter. Após essa seleção, crie mais 10 candidatos entre prefeitos e vereadores, de cidades que não foram abordadas na pesquisa. Podem ser candidatos reais ou fictícios, você escolhe.\n","\n","

Por último, examine a relação de termos e palavras-chave estabelecida pela equipe e associe \"tweets\" aos candidatos que possuem perfil no Twitter, levando em consideração a presença ou ausência desses termos. Dado que ainda não abordamos o uso de data frames, vamos proceder como se estivéssemos analisando apenas os tweets do dia 27/09/2020, data a partir da qual foi permitida a propaganda eleitoral nas eleições daquele ano.\n","\n","

Com base nessas diretrizes, você deverá criar nove listas, seguindo a estrutura abaixo, e então consolidá-las em um dicionário utilizando a função que você desenvolveu no exercício 05.\n","\n","nome_candidato = ['Joana', 'José']
\n","sigla_partido =['PT', 'PSDB']\n","sigla_uf = ['AC', 'SP']
\n","nome_municipio = ['Rio Branco', 'São Paulo']
\n","cargo = ['Prefeito', 'Vereador']
\n","situacao_candidatura = ['Deferido', 'Indeferido']
\n","conta_twitter = [1, 1]
\n","publicou_2020 = [1, 1]
\n","tweet_27092020 = ['blablavacinablabla', 'blablablabla']
\n","\n","

Com o dicionário pronto, elabore uma função para o classificador concebido no Tutorial 02 e empregue o dicionário a fim de verificar sua eficácia. Essa função deve incorporar ao dicionário criado uma lista de dummies denominada 'termo_vacina', indicando se o tweet incluía ou não um dos termos designados pela equipe. Ao final, a função deve imprimir apenas as informações dos candidatos escolhidos para integrar o corpus. Não se esqueça de ordenar a lista de candidatos.\n","\n","[**Link do Codebook**](https://github.com/PedroSchmalz/covid19-tweets-brazilian-mayoral-candidates/blob/main/Codebook.pdf)"],"metadata":{"id":"WDo6E7B88ZUk"}},{"cell_type":"code","source":["### INFORMAÇÕES DOS CANDIDATOS\n","\n","## Nome dos candidatos\n","\n","nome_candidato = ['Joana', 'José']\n","\n","## Sigla do partido\n","\n","sigla_partido =['PT', 'PSDB']\n","\n","## UF\n","\n","sigla_uf = ['AC', 'SP']\n","\n","## Distrito eleitoral\n","\n","nome_municipio = ['Rio Branco', 'São Paulo']\n","\n","## Cargo\n","\n","cargo = ['Prefeito', 'Vereador']\n","\n","## Situação da candidatura\n","\n","situacao_candidatura = ['Deferido', 'Indeferido']\n","\n","## Dummy que indica se o candidato possui conta no Twitter\n","\n","conta_twitter = [1, 1]\n","\n","## Dummy que indica se o candidato publicou no Twitter em 2020\n","\n","publicou_2020 = [1, 1]\n","\n","## Tweets publicados no dia 27/09/2020\n","\n","tweet_27092020 = list(map(lambda x: x.lower(), ['blablaVacinablabla', 'blablablablaOI']))\n","\n","## Lista vazia onde a informação se o tweet integrará o corpus será salva\n","\n","termo_vacina = [\"NA\", \"NA\"]\n","\n","## Total de candidatos\n","\n","tot_candidatos = len(nome_candidato)\n","\n","candidatos = nome_candidato\n","\n","### DICIONÁRIO\n","\n","## Cria uma lista vazia onde o dicionário será armazenado\n","\n","dicionario = {}\n","\n","## Adicionando as informações criadas em um dicionário\n","\n","for nome_candidato, sigla_partido, sigla_uf, nome_municipio, cargo, situacao_candidatura, conta_twitter, publicou_2020, tweet_27092020, termo_vacina in zip(nome_candidato, sigla_partido, sigla_uf, nome_municipio, cargo, situacao_candidatura, conta_twitter, publicou_2020, tweet_27092020, termo_vacina):\n"," dicionario[nome_candidato] = {\"sigla_partido\": sigla_partido, \"sigla_uf\": sigla_uf, \"nome_municipio\": nome_municipio, \"cargo\": cargo, \"situacao_candidatura\": situacao_candidatura, \"conta_twitter\": conta_twitter, \"publicou_2020\": publicou_2020, \"tweet_27092020\": tweet_27092020, \"termo_vacina\": termo_vacina}\n","\n","## Imprimindo o dicionário atual\n","\n","for nome_candidato, info in dicionario.items():\n"," print(f\"Nome do candidato: {nome_candidato}, Sigla do partido: {info['sigla_partido']}, UF: {info['sigla_uf']}, Município: {info['nome_municipio']}, Cargo: {info['cargo']}, Situação da candidatura: {info['situacao_candidatura']}, Twitter: {info['conta_twitter']}, Publicou em 2020: {info['publicou_2020']}, Tweet: {info['tweet_27092020']}, Corpus: {info['termo_vacina']}\")\n","\n"],"metadata":{"id":"4ZMOX3vm8dYr","executionInfo":{"status":"ok","timestamp":1693342136275,"user_tz":180,"elapsed":356,"user":{"displayName":"Rebeca Carvalho","userId":"01975075342439777451"}}},"execution_count":82,"outputs":[]},{"cell_type":"code","source":["## Lista das capitais brasileiras\n","\n","capitais_brasileiras = [\n"," \"Rio Branco\", \"Maceió\", \"Macapá\", \"Manaus\", \"Salvador\",\n"," \"Fortaleza\", \"Brasília\", \"Vitória\", \"Goiânia\", \"São Luís\",\n"," \"Cuiabá\", \"Campo Grande\", \"Belo Horizonte\", \"Belém\",\n"," \"João Pessoa\", \"Curitiba\", \"Recife\", \"Teresina\", \"Rio de Janeiro\",\n"," \"Natal\", \"Porto Alegre\", \"Porto Velho\", \"Boa Vista\", \"Florianópolis\",\n"," \"São Paulo\", \"Aracaju\", \"Palmas\"]\n","\n","## Lista dos termos de interesse\n","\n","termos = list(map(lambda x: x.lower(), [\"vacina\", \"Vacinacao\", \"Butantan\"]))\n","\n","## Estrutura de classificação que avalia quais\n","## candidatos e tweets participarão do corpus\n","\n","for candidato in range(0, tot_candidatos):\n","\n"," print(\"\\n\\nLendo\", candidatos[candidato], \"(\", dicionario[candidatos[candidato]][\"sigla_partido\"],\n"," \"-\", dicionario[candidatos[candidato]][\"nome_municipio\"], \")\", \"\\n\")\n","\n"," ## Verifica se o candidato concorreu à prefeito em uma das capitais brasileiras\n","\n"," if dicionario[candidatos[candidato]][\"cargo\"] == \"Prefeito\" and dicionario[candidatos[candidato]][\"nome_municipio\"] in capitais_brasileiras:\n","\n"," print(\"\\nO candidato\", candidatos[candidato], \"concorreu à prefeitura do município de\", dicionario[candidatos[candidato]][\"nome_municipio\"],\n"," \"-\", dicionario[candidatos[candidato]][\"sigla_uf\"], end =\".\")\n","\n"," ## Avalia se a candidatura foi deferida pelo TSE\n","\n"," if dicionario[candidatos[candidato]][\"situacao_candidatura\"] == \"Deferido\":\n","\n"," print('\\n\\nO candidato', candidatos[candidato], '(', dicionario[candidatos[candidato]][\"sigla_partido\"], '-',\n"," dicionario[candidatos[candidato]][\"nome_municipio\"], ') foi deferido pelo TSE.')\n","\n"," ## Avalia se o candidato possui conta no Twitter\n","\n"," if dicionario[candidatos[candidato]][\"conta_twitter\"] == 1:\n","\n"," print(\"\\nO candidato\", candidatos[candidato], '(', dicionario[candidatos[candidato]][\"sigla_partido\"], '-',\n"," dicionario[candidatos[candidato]][\"nome_municipio\"], \") possui conta no Twitter.\")\n","\n"," ## Avalia se o candidato publicou no Twitter entre 01/01/2020 e 31/12/2020\n","\n"," if dicionario[candidatos[candidato]][\"publicou_2020\"] == 1:\n","\n"," print(\"\\nO candidato\", candidatos[candidato], '(', dicionario[candidatos[candidato]][\"sigla_partido\"], '-',\n"," dicionario[candidatos[candidato]][\"nome_municipio\"], \") publicou no Twitter em 2020.\")\n","\n"," ## Cria uma string com NA que é atualizada assim que um termo relacionado à vacina é encontrado no tweet\n","\n"," relacionado_vacina = \"NA\"\n","\n"," ## Cria um contador\n","\n"," contador = 0\n","\n"," ## Verifica se o tweet possui um dos termos especificados\n","\n"," while contador < len(termos) or relacionado_vacina == \"NA\":\n","\n"," if termos[contador] in dicionario[candidatos[candidato]][\"tweet_27092020\"]:\n","\n"," relacionado_vacina = 1\n","\n"," contador = contador + 1\n","\n"," if relacionado_vacina == 1:\n","\n"," ## Alterando os valores da variável 'termo_vacina'\n","\n"," dicionario[candidatos[candidato]][\"termo_vacina\"] = 1\n","\n"," print(\"\\nO tweet do candidato\", candidatos[candidato], '(', dicionario[candidatos[candidato]][\"sigla_partido\"], '-',\n"," dicionario[candidatos[candidato]][\"nome_municipio\"], \") será incluído no corpus de análise.\")\n","\n"," else:\n","\n"," ## Alterando os valores da variável 'termo_vacina'\n","\n"," dicionario[candidatos[candidato]][\"termo_vacina\"] = 0\n","\n"," print(\"\\nO tweet do candidato\", candidatos[candidato], '(', dicionario[candidatos[candidato]][\"sigla_partido\"], '-',\n"," dicionario[candidatos[candidato]][\"nome_municipio\"], \") não será incluído no corpus de análise.\")\n","\n"," else:\n","\n"," print(\"\\nO candidato\", candidatos[candidato], '(', dicionario[candidatos[candidato]][\"sigla_partido\"], '-',\n"," dicionario[candidatos[candidato]][\"nome_municipio\"], \") não publicou no Twitter em 2020.\")\n","\n"," else:\n","\n"," print(\"\\nO candidato\", candidatos[candidato], '(', dicionario[candidatos[candidato]][\"sigla_partido\"], '-',\n"," dicionario[candidatos[candidato]][\"nome_municipio\"], \") não possui conta no Twitter.\")\n","\n"," else:\n","\n"," print('\\nO candidato', candidatos[candidato], '(', dicionario[candidatos[candidato]][\"sigla_partido\"],\n"," '-', dicionario[candidatos[candidato]][\"nome_municipio\"], ') não foi deferido pelo TSE')\n","\n"," else:\n","\n"," print(\"\\nO candidato\", candidatos[candidato], \"não foi candidato à prefeito ou não concorreu em uma das capitais brasileiras.\\n\\n\")\n"],"metadata":{"id":"DgWWUdm-oq8t"},"execution_count":null,"outputs":[]},{"cell_type":"code","source":["## Imprimindo as informações dos candidatos que integrarão o corpus\n","\n","for candidato in range(0, tot_candidatos):\n","\n"," if dicionario[candidatos[candidato]][\"termo_vacina\"] == 1:\n","\n"," print(\"Nome do candidato:\", candidatos[candidato], \"\\nSigla do partido:\", dicionario[candidatos[candidato]][\"sigla_partido\"],\n"," \"\\nUF:\", dicionario[candidatos[candidato]][\"sigla_uf\"], \"\\nMunicípio:\", dicionario[candidatos[candidato]][\"nome_municipio\"],\n"," \"\\nCargo:\", dicionario[candidatos[candidato]][\"cargo\"], \"\\nSituação da candidatura:\", dicionario[candidatos[candidato]]['situacao_candidatura'],\n"," \"\\nTwitter:\", dicionario[candidatos[candidato]]['conta_twitter'], \"\\nPublicou em 2020:\", dicionario[candidatos[candidato]]['publicou_2020'],\n"," \"\\nTweet:\", dicionario[candidatos[candidato]][\"tweet_27092020\"], \"\\nCorpus:\", dicionario[candidatos[candidato]]['termo_vacina'])\n"],"metadata":{"colab":{"base_uri":"https://localhost:8080/"},"id":"ffl32LDKE7FV","executionInfo":{"status":"ok","timestamp":1693343966022,"user_tz":180,"elapsed":342,"user":{"displayName":"Rebeca Carvalho","userId":"01975075342439777451"}},"outputId":"e2a7383a-e70b-4a38-a5c2-c18ae2be3590"},"execution_count":107,"outputs":[{"output_type":"stream","name":"stdout","text":["Nome do candidato: Joana \n","Sigla do partido: PT \n","UF: AC \n","Município: Rio Branco \n","Cargo: Prefeito \n","Situação da candidatura: Deferido \n","Twitter: 1 \n","Publicou em 2020: 1 \n","Tweet: blablavacinablabla \n","Corpus: 1\n"]}]}]}