Topic outline
-
Aula 11
Exercícios de regressão linear múltipla
-
Agenda
- Síntese: Até agora lidamos com relações entre variáveis que ao explorá-las num gráfico estudávamos a hipótese de uma ser preditiva da outra. Na aula passada, por exemplo, estudamos a relação entre emissões globais de CO2 e aquecimento do planeta. Nesta aula veremos que, usando praticamente os mesmo conhecimentos adquiridos até agora, podemos testar a hipótese de uma variável estar linearmente relacionada com duas ou mais. Isto é, da estimação de uma variável ser dependente de duas ou mais variáveis. A esse estudo denominamos Regressão Linear Múltipla.
- Dinâmica: Primeiro vamos explorar graficamente a relação entre PIB per capta e área do país. Em seguida, veremos se a entrada da variável área com floresta melhora a capacidade preditiva da área do país explicar PIB per capta. Retomaremos os dados usados no ED6 que mostravam o consumo de um insumo usado no tratamento das águas de esgoto coletadas por duas ETE's. Veremos que os dados originalmente usados no ED6 foram reorganizados em uma nova planilha. O desafio será aplicar um modelo de regressão múltipla para testar a hipótese de que a predição do consumo de hidróxido de cálcio pode ser melhorada se acrescentarmos no modelo uma variável "auxiliar" que captura o efeito devido à estação de tratamento.
-
O consumo energético em diferentes países em função do tamanho da população e PIB per capta
Dados de 2014 extraídos do banco de dados do Banco Mundial foram reorganizados em uma planilha Excel, e expressam para diversos países o consumo energético, o PIB, a área, o tamanho da população etc. (clique para fazer o download da planilha com dados de 2014 ou 2021). Vamos propor um modelo regressão linear múltipla usando esses dados. Acompanhe as explicações e participe tirando as suas dúvidas.
-
Nova análise do tratamento de água em duas ETE's (Estações de Tratamento de Esgoto)
O Estudo Dirigido 9 (ED9) disponibilizou os dados que são reapresentados no gráfico abaixo.
Os mesmos valores usados para gerar esse gráfico foram reorganizados em uma nova planilha Excel (clique AQUI para fazer o download dessa planilha). Vamos ver como a reorganização dos dados das ETE's e a Análise de Regressão Linear Múltipla pode ajudar a testar a hipótese de que é significativo o efeito "estação de tratamento". Ou seja, a precipitação pode estimar o consumo de Hidróxido de Cálcio, mas a estimativa pode melhorar se for incluída no modelo uma variável que expressa o efeito da estação. Como fazer isso? Depois de debatido o problema, recorreremos à ferramenta "Análise de Dados (Regressão) do Excel para desenvolver a análise e preparar as suas conclusões para o debate final na sala de aula.
-