Tarefa 3 - Classificação de sementes de trigo.
Condições de conclusão
Aberto: segunda-feira, 30 set. 2019, 00:00
Vencimento: terça-feira, 15 out. 2019, 00:00
O objetivo dessa tarefa é aprender aplicar vários métodos de classificação sobre os dados de Íris, usando o pacote scikit-learn.
1. Obtenha os dados de propriedades de sementes de três variedades diferentes de trigo do site OpenML. Os dados possuem 210 instâncias com 8 atributos cada. Analise os argumentos fornecidos, os tipos deles e classes definidas.
2. Pré-processamento de dados:
- Verifique se todas as instâncias possuem valores, e se for o caso remove instâncias com valores ausentes.
- Realize a normalização de atributos para o mesmo intervalo [0.0, 1.0].
3. Separe 200 instâncias aleatoriamente como os dados de treino, e últimas 10 como dados de teste.
4. Usando o conjunto de dados de treino, realize aprendizagem para três tipos de classificação: o método de árvore de decisão, o método bayesiano, e o método de vetores SVM.
5. Usando os três métodos, realize classificação de conjunto de 10 instâncias de teste.
6. Verifique a acurácia de classificação para os três métodos usando as classes fornecidas junto com os dados medida como o número de instâncias com classes corretas dividido por o número de instâncias de teste.
1. Obtenha os dados de propriedades de sementes de três variedades diferentes de trigo do site OpenML. Os dados possuem 210 instâncias com 8 atributos cada. Analise os argumentos fornecidos, os tipos deles e classes definidas.
2. Pré-processamento de dados:
- Verifique se todas as instâncias possuem valores, e se for o caso remove instâncias com valores ausentes.
- Realize a normalização de atributos para o mesmo intervalo [0.0, 1.0].
3. Separe 200 instâncias aleatoriamente como os dados de treino, e últimas 10 como dados de teste.
4. Usando o conjunto de dados de treino, realize aprendizagem para três tipos de classificação: o método de árvore de decisão, o método bayesiano, e o método de vetores SVM.
5. Usando os três métodos, realize classificação de conjunto de 10 instâncias de teste.
6. Verifique a acurácia de classificação para os três métodos usando as classes fornecidas junto com os dados medida como o número de instâncias com classes corretas dividido por o número de instâncias de teste.
O aluno deve submeter o código que realiza todos os passos acima. O código deve imprimir todos os passos realizados terminando com a descrição e a acurácia/precisão de cada classificação realizada.
Obs. Veja o tutorial do Randal S. Olson para algumas dicas.
- 30 setembro 2019, 13:43 PM