• Aula 8

    Coeficiente de correlação e de determinação


    • Agenda

      • Objetivos desta aula: muitas vezes duas variáveis têm comportamento sincronizado.  Por exemplo, o peso de um caminhão tanque e os litros de combustível sendo transportados pelo caminhão estão positivamente correlacionados. Às vezes o comportamento é sincronizado, mas em direções opostas, como no caso preço de um determinado produto e quantidade consumida. São muitos os casos em que, por relações de causa e efeito nem sempre aparentes ou conhecidas,  duas variáveis se mostram correlacionadas.  Por exemplo, taxa de letalidade de um vírus e idade do paciente.  Para todos esses casos é possível usar a regressão linear simples para buscar evidências de que a relação realmente existe, e de medir a significância estatística dessa regressão. Nesta aula vamos revisar os princípios da regressão linear simples, que serve para casos em que duas variáveis parecem se correlacionar linearmente. Em termos matemáticos, isso significa dizer que o valor de uma variável Y varia sempre da mesma forma conforme variamos o valor de X. Mais formalmente, e de forma genérica, podemos dizer para esses casos que Y = a + b X + erro; onde a é observado quando X é zero; b é a constante variação em Y quando aumentamos X em uma unidade; e erro corresponde àquela parte da relação que não é explicada pela variação em X.
      • Dinâmica
        • Primeiro bloco: vamos retomar o roteiro e a planilha citados no final da aula passada para, com o apoio da planilha, entender e reproduzir os passos do roteiro (siga as explicações apresentadas em sala de aula).
        • Segundo bloco: vamos conhecer uma ferramenta disponível no Excel (Análise de Dados/Regressão) para confirmar os resultados encontrados no primeiro bloco e, em seguida vamos trabalhar em grupos para resolver o ED09. Esse estudo dirigido envolve o uso dessa mesma ferramenta do Excel (Análise de Dados/Regressão) na análise de um problema envolvendo duas estações de tratamento de esgotos.


    • Estudo Dirigido


      Trabalhe em grupo.  Discuta as suas dúvidas e as das demais pessoas dentro do seu grupo. Discuta como os dados disponibilizados por duas Estações de Tratamento de Esgotos podem ser analisados com o apoio da Análise de Regressão Linear Simples. Concentrem-se, nesta primeira etapa, na hipótese de que a quantidade média de chuva nos locais de onde se origina o esgoto está linearmente correlacionada com a quantidade de hidróxido de cálcio (H, em tons) usada nas estações de tratamento durante o processo de coagulação das partículas de sujeira. Depois de debatido o problema e de discutidas as formas de desenvolvimento da análise, cada um terá que submeter os seus resultados individualmente.

      Análise do tratamento de água em duas ETE's (Estações de Tratamento de Esgoto)

      Nas duas estações que estaremos analisando, a água passa por seis etapas regulares de tratamento:

      1. Captação, coleta inicial da água e passagem por um sistema de grades para retenção de detritos maiores. 
      2. Coagulação, adição de cal hidratada (hidróxido de cálcio) e sulfato de alumínio, para agregar as partículas de sujeira (coagulação).
      3. Floculação, promoção da união das partículas de sujeira (flocos) em solução alcalina. Nessa etapa, o sulfato de alumínio reage com íons hidroxila para formação de polieletrólitos de alumínio (união eletrostática com partículas de argila formando elementos com microestrutura porosa - floculo).
      4. Decantação, a água não é mais agitada e os flocos vão se depositando no fundo, separando-se da água. O material decantado, denominado lodo, é transferido para tanques de depuração e eventual transformação em adubo em biodigestores.
      5. Filtração. A água já decantada passa por um filtro de cascalho/areia/antracito (carvão mineral) para completa retenção dos flocos que não foram decantados na fase anterior e de alguns microrganismos.
      6. Cloração. Etapa final do tratamento à base de compostos clorados para eliminação de microrganismos patogênicos e como oxidante de compostos orgânicos e inorgânicos que ainda possam estar presentes.

      Médias dos apontamentos feitos pelo gestor dessas ETE's nos últimos 10 anos apresentadas no gráfico abaixo mostram que existe uma relação entre as quantidades consumidas de hidróxido de cálcio (H, em tons) e a precipitação média (P, em mm), na região de coleta do esgoto, nos 45 dias anteriores ao monitoramento químico do processo de coagulação.


      1. Os dados usados para gerar o gráfico estão organizados em uma planilha Excel (clique AQUI para fazer o download dessa planilha). Como você comprovaria a hipótese de que P (precipitação em mm) está linearmente correlacionada com H (consumo de hidróxido de cálcio em ton)?
      2. Observando atentamente o gráfico, o gestor levantou a suspeita de que, por ser mais moderna e ter tanques e equipamentos novos, a relação entre P e H na estação 2 seja diferente da relação na estação 1. Você percebe essa diferença? Como você a comprovaria?
      3. Como a regressão estatística te ajudou a responder essas duas questões

      Responda perguntas em grupo, mas apresente as suas respostas individualmente em um PDF de no máximo duas páginas.

      Nomeie o documento PDF da seguinte forma: ED09_<NoUSP>.pdf (use o seu número USP para identificar a sua tarefa). Faça o upload desse PDF usando o link desta tarefa.