Programação
-
-
Abre: terça, 07 nov 2023, 21:00Fecha: terça, 21 nov 2023, 23:59
Apenas uma tentativa. Certifique-se de enviar o questionário ao finalizar.
Atenção: Para a última questão, é permitido fazer em dupla, preferencialmente de alunos de cursos diferentes. Indicar o nome, número USP e curso no notebook. -
Considere o arquivo de dados amostra_banco_distrito.csv disponível em https://github.com/cibelerusso/Datasets/blob/main/amostra_banco_distrito.csv
Você deve desenvolver uma análise de correspondência múltipla, com pelo menos três variáveis, buscando maximizar a inércia total das duas coordenadas principais, $\frac{\sum_{i=1}^{2}\lambda_i}{\sum_{i=1}^{k}\lambda_i^2,$
em que k é o número total de variáveis adicionadas na análise.
Considere, por exemplo, métodos alternativos para categorizar as variáveis contínuas existentes na base de dados, como técnicas baseadas em análise de agrupamentos. Se achar necessário, pode criar novas variáveis.
Apresente os resultados de suas análises em um arquivo R, Markdown ou notebook Python.
Teste pelo menos três combinações de variáveis na análise e destaque a de maior inércia das duas primeiras coordenadas principais.
-
-
-