Programação

  • PSI5123 - Aprendizagem de Máquina de Sinais de Áudio e Voz

    Caros alunos,

    As aulas da disciplina ocorrerão às terças-feiras das 17h00 às 20h00.

    Para acessar o link do Google Meet.

    • Link para as aulas URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Conceito - Alunos

    • Conceito Tarefa
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Apresentação dos Projetos - Cronograma e Organização

    A duração das apresentações é de 10 minutos com 5 minutos de perguntas. A apresentação deve ser feita em slides. Adicionalmente, se quiser, apresente códigos, scripts ou demonstre seus resultados.

    14 de Setembro, 2021 - Lista de Alunos (em construção)
    Andre Lucas de Oliveira Duarte
    João Pedro de Omena Simas
    Caique Bueno Passolongo
    Guilherme Apolinario Silva Novaes
    Alessandra Carolina Botto
    Andre Luis Ferreira Marques
    Bruno Elton da Luz
    Gabriel Durante
    Gabriel de Souza Lima
    Vinicius da Silva Borges
    Rodrigo Anjos de Souza
    Lucas Giannella de Oliveira Apresentação

    21 de Setembro, 2021 - Lista de Alunos (em construção)
    Felipe Meneguitti Dias
    João Pedro de Omena Simas
    Mauro Chiozzotto
    Tiago Gaspar da Rosa
    Bruno Elton da Luz
    Adriano Tito da Silva
    Marcelo Monari Baccaro
    Thiago Yuji Aoyagi
    Andre Amaro Bueno
    Fernando dos Santos Gil
    Pedro Henrique Pereira
    Fabiano Valente Nunes
    Yuri Perim
    Nilo Henrique Garcia Behaker

  • Programação de Aulas

    Caros alunos,

    Segue calendário preliminar da disciplina. O calendário será atualizado semanalmente, com detalhamento do planejamento das aulas. Desta forma, é importante que os alunos acessem continuamente a plataforma.

    Datas importantes

    24/08: Avaliação
    14/09 e 21/09: Apresentações Finais.

    • Ementa Final - 11/08/2021 Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Projeto da Disciplina

    • Vídeo - Instruções para o Projeto Final URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Projeto Final e Questões de Pesquisa Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Proposta de Projeto

    Caros alunos,

    A proposta de projeto consiste em um documento de 1 ou 2 páginas que descreve o tema de pesquisa, os principais objetivos, os materiais e métodos, os resultados esperados e as referências encontradas.
    Utilizem o modelo fornecido pelo International Conference on Acoustics, Speech, & Signal Processing (​ICASSP) 2021 tanto para a proposta de projeto como para o artigo final.
    Modelos em Latex e Word podem ser baixados em https://2021.ieeeicassp.org/Papers/PaperKit.asp.

    Prazo para entrega da proposta: 13/07/2021 (23h59)
    Atenciosamente,
    • Template - ICASSP 2021 - Word Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Template - ICASSP 2021 - Latex Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Projeto - Arquivos Finais

    Caros alunos,

    O relatório final deve ser organizado na forma de artigo de pesquisa. Ele poderá ser feito de preferencia em Inglês, mas também aceitaremos artigos em Português.

    Utilizem o modelo fornecido pelo International Conference on Acoustics, Speech, & Signal Processing (​ICASSP) 2021 tanto para a proposta de projeto como para o artigo final.
    Modelos em Latex e Word podem ser baixados em https://2021.ieeeicassp.org/Papers/PaperKit.asp.

    Por favor, façam upload de todos os arquivos, referentes à apresentação, notebooks, códigos fonte, entre outros.

    Prazo para entrega: 05/09/2021 14/09/2021 (23h59)
    Atenciosamente,

  • Lista de Exercícios 1 - Entrega 08/08/2021

    • Lista de Exercício 1 Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Entrega da Lista de Exercícios 1 Tarefa
      Restrito Disponível se: Você faz parte de qualquer grupo
  • Lista de Exercícios 2 - Entrega 22/08/2021

    Fiquem atentos para a data de entrega: 22/08/2021.

  • Aula 1 - Apresentação da disciplina. Processamento de Sinais de Voz: Representações e Modelos

    • 1ª Aula - Vídeo URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Apresentação da Disciplina Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Processamento e Aprendizagem de Voz - Representações e Modelos Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 2 - DTFT, DFT, STFT e Aplicações em Python

    • 2ª Aula - Vídeo URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Aula 2 - Slides Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 3 - STFT - Análise e Síntese. Processamento de Sinais de Voz: Representações e Modelos

    • 3ª Aula - Vídeo URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Python/Librosa - Jupyter Notebook - PDF Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • DFT - Jupyter Notebook - PDF Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • STFT - Análise - Jupyter Notebook - PDF Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • STFT - Análise/Síntese - Jupyter Notebook - PDF Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Arquivos Python - Librosa - DFT - STFT
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 4 - Sinais de Voz e Percepção Auditiva

    • 4ª Aula - Vídeo URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Speech - Slides Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Auditory Perception - Slides Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 5 - MFCC, Método da Máxima Verossimilhança e Divergência de Kullback-Leibler ou Entropia Relativa

    • 5ª Aula - Vídeo URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Arquivos Python - MFCC
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • MFCC - Jupyter Notebook - PDF Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 6 - Divergência de Kullback-Leibler, Redes Neurais: Gradientes e Retropropagação

    • 6ª Aula - Vídeo URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Método da máxima verossimilhança e Divergência de Kullback-Leibler com Desigualdade de Jensen Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Redes Neurais: Gradientes e Retropropagação Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 7 - Redes Neurais: Gradientes e Retropropagação. Deep Learning e Pytorch

    • 7ª Aula - Vídeo URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Machine_Learning Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Pytorch Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 8 - Pytorch, MLP, Deep Learning, RNN e BPTT

    • 8ª Aula - Vídeo URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Redes Neurais Recorrentes: Estados, Gradientes e Retropropagação através do Tempo (RNN: BPTT) Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Pytorch_AutoGrad_GPU Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Pytorch_MLP_UniversalFunctionAproximator Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 9 - RNN - GRU, LSTM. CNN, Pytorch

    • 9ª Aula - Vídeo URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • MFCC_MLP_Pytorch Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • MiniBatch Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Aprendizagem de sequências Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 10 - K-Means. Gaussian Mixture Models

    • 10ª Aula - Vídeo URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • CNN_Audio_Application Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Notebook - CNN Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Notebook - K-Means Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
    • Modelos de misturas de gaussianas (GMMs) Arquivo
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 11 - Avaliação

  • Aula 12 - Apresentações 14/09/2021

    • Vídeo 12ª Aula - Apresentações URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1
  • Aula 13 - Apresentações 21/09/2021

    • Vídeo 13ª Aula - Apresentações URL
      Restrito Disponível se: Você faz parte de T-PSI5123-1