Tarefa 3 - Classificação de sementes de trigo.
Aggregazione dei criteri
Aperto: lunedì, 30 settembre 2019, 00:00
Data limite: martedì, 15 ottobre 2019, 00:00
O objetivo dessa tarefa é aprender aplicar vários métodos de classificação sobre os dados de Íris, usando o pacote scikit-learn.
1. Obtenha os dados de propriedades de sementes de três variedades diferentes de trigo do site OpenML. Os dados possuem 210 instâncias com 8 atributos cada. Analise os argumentos fornecidos, os tipos deles e classes definidas.
2. Pré-processamento de dados:
- Verifique se todas as instâncias possuem valores, e se for o caso remove instâncias com valores ausentes.
- Realize a normalização de atributos para o mesmo intervalo [0.0, 1.0].
3. Separe 200 instâncias aleatoriamente como os dados de treino, e últimas 10 como dados de teste.
4. Usando o conjunto de dados de treino, realize aprendizagem para três tipos de classificação: o método de árvore de decisão, o método bayesiano, e o método de vetores SVM.
5. Usando os três métodos, realize classificação de conjunto de 10 instâncias de teste.
6. Verifique a acurácia de classificação para os três métodos usando as classes fornecidas junto com os dados medida como o número de instâncias com classes corretas dividido por o número de instâncias de teste.
1. Obtenha os dados de propriedades de sementes de três variedades diferentes de trigo do site OpenML. Os dados possuem 210 instâncias com 8 atributos cada. Analise os argumentos fornecidos, os tipos deles e classes definidas.
2. Pré-processamento de dados:
- Verifique se todas as instâncias possuem valores, e se for o caso remove instâncias com valores ausentes.
- Realize a normalização de atributos para o mesmo intervalo [0.0, 1.0].
3. Separe 200 instâncias aleatoriamente como os dados de treino, e últimas 10 como dados de teste.
4. Usando o conjunto de dados de treino, realize aprendizagem para três tipos de classificação: o método de árvore de decisão, o método bayesiano, e o método de vetores SVM.
5. Usando os três métodos, realize classificação de conjunto de 10 instâncias de teste.
6. Verifique a acurácia de classificação para os três métodos usando as classes fornecidas junto com os dados medida como o número de instâncias com classes corretas dividido por o número de instâncias de teste.
O aluno deve submeter o código que realiza todos os passos acima. O código deve imprimir todos os passos realizados terminando com a descrição e a acurácia/precisão de cada classificação realizada.
Obs. Veja o tutorial do Randal S. Olson para algumas dicas.
- 30 settembre 2019, 13:43