Tarefa 3
Conditions d’achèvement
Ouvert le : mardi 29 septembre 2020, 16:00
À remettre : dimanche 11 octobre 2020, 23:55
Exercício: Análise de texto em NewsGroups
Base de dados: 20NewsGroup-Train
Selecione os grupos:
talk.politics.guns
comp.sys.ibm.pc.hardware
sci.space
rec.motorcycles
Utilize os widgets que forem necessários para filtrar, pré-processar e demais tarefas
Utilize o modelo de representação de documentos que desejar (Embeddings ou Bag-of-Words)
Encontre clusters de documentos (p. e. K-Means)
Faça uma projeção dos clusters encontrados (p. e. t-SNE)
Faça uma análise dos dados a partir da visualização e modifique seu pipeline se necessário
Entrega
Tarefa individual.
Arquivo ZIP contendo:
Arquivo OWS de workflow do Orange com o pipeline criado
Arquivo PDF com a descrição das técnicas e etapas no pipeline (relatório)
Deadline: 11/10/2020 às 23:55