Tarefa 3 - Classificação de sementes de trigo.

O objetivo dessa tarefa é aprender aplicar vários métodos de classificação sobre os dados de Íris, usando o pacote scikit-learn.

1. Obtenha os dados de propriedades de sementes de três variedades diferentes de trigo do site OpenML. Os dados possuem 210 instâncias com 8 atributos cada. Analise os argumentos fornecidos, os tipos deles e classes definidas.

2. Pré-processamento de dados:
  - Verifique se todas as instâncias possuem valores, e se for o caso remove instâncias com valores ausentes.
  - Realize a normalização de atributos para o mesmo intervalo [0.0, 1.0].

3. Separe 200 instâncias aleatoriamente como os dados de treino, e últimas 10 como dados de teste.

4. Usando o conjunto de dados de treino, realize aprendizagem para três tipos de classificação: o método de árvore de decisão, o método bayesiano, e o método de vetores SVM.

5. Usando os três métodos, realize classificação de conjunto de 10 instâncias de teste.

6. Verifique a acurácia de classificação para os três métodos usando as classes fornecidas junto com os dados medida como o número de instâncias com classes corretas dividido por o número de instâncias de teste.

O aluno deve submeter o código que realiza todos os passos acima. O código deve imprimir todos os passos realizados terminando com a descrição e a acurácia/precisão de cada classificação realizada.

Obs. Veja o tutorial do Randal S. Olson para algumas dicas.

e-Disciplinas - Ambiente de apoio às disciplinas da USP