Tarefa 3
Condições de conclusão
Aberto: terça-feira, 29 set. 2020, 16:00
Vencimento: domingo, 11 out. 2020, 23:55
Exercício: Análise de texto em NewsGroups
Base de dados: 20NewsGroup-Train
Selecione os grupos:
talk.politics.guns
comp.sys.ibm.pc.hardware
sci.space
rec.motorcycles
Utilize os widgets que forem necessários para filtrar, pré-processar e demais tarefas
Utilize o modelo de representação de documentos que desejar (Embeddings ou Bag-of-Words)
Encontre clusters de documentos (p. e. K-Means)
Faça uma projeção dos clusters encontrados (p. e. t-SNE)
Faça uma análise dos dados a partir da visualização e modifique seu pipeline se necessário
Entrega
Tarefa individual.
Arquivo ZIP contendo:
Arquivo OWS de workflow do Orange com o pipeline criado
Arquivo PDF com a descrição das técnicas e etapas no pipeline (relatório)
Deadline: 11/10/2020 às 23:55