Topic outline

  • PSI5123 - Aprendizagem de Máquina de Sinais de Áudio e Voz

    Caros alunos,

    As aulas da disciplina ocorrerão às terças-feiras das 17h00 às 20h00.

    Para acessar o link do Google Meet.

    • URL icon
      Link para as aulas URL
      Not available unless: You belong to T-PSI5123-1
  • Conceito - Alunos

    • Assignment icon
      Conceito Assignment
      Not available unless: You belong to T-PSI5123-1
  • Apresentação dos Projetos - Cronograma e Organização

    A duração das apresentações é de 10 minutos com 5 minutos de perguntas. A apresentação deve ser feita em slides. Adicionalmente, se quiser, apresente códigos, scripts ou demonstre seus resultados.

    14 de Setembro, 2021 - Lista de Alunos (em construção)
    Andre Lucas de Oliveira Duarte
    João Pedro de Omena Simas
    Caique Bueno Passolongo
    Guilherme Apolinario Silva Novaes
    Alessandra Carolina Botto
    Andre Luis Ferreira Marques
    Bruno Elton da Luz
    Gabriel Durante
    Gabriel de Souza Lima
    Vinicius da Silva Borges
    Rodrigo Anjos de Souza
    Lucas Giannella de Oliveira Apresentação

    21 de Setembro, 2021 - Lista de Alunos (em construção)
    Felipe Meneguitti Dias
    João Pedro de Omena Simas
    Mauro Chiozzotto
    Tiago Gaspar da Rosa
    Bruno Elton da Luz
    Adriano Tito da Silva
    Marcelo Monari Baccaro
    Thiago Yuji Aoyagi
    Andre Amaro Bueno
    Fernando dos Santos Gil
    Pedro Henrique Pereira
    Fabiano Valente Nunes
    Yuri Perim
    Nilo Henrique Garcia Behaker

  • Programação de Aulas

    Caros alunos,

    Segue calendário preliminar da disciplina. O calendário será atualizado semanalmente, com detalhamento do planejamento das aulas. Desta forma, é importante que os alunos acessem continuamente a plataforma.

    Datas importantes

    24/08: Avaliação
    14/09 e 21/09: Apresentações Finais.

    • File icon
      Ementa Final - 11/08/2021 File
      Not available unless: You belong to T-PSI5123-1
  • Projeto da Disciplina

    • URL icon
      Vídeo - Instruções para o Projeto Final URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Projeto Final e Questões de Pesquisa File
      Not available unless: You belong to T-PSI5123-1
  • Proposta de Projeto

    Caros alunos,

    A proposta de projeto consiste em um documento de 1 ou 2 páginas que descreve o tema de pesquisa, os principais objetivos, os materiais e métodos, os resultados esperados e as referências encontradas.
    Utilizem o modelo fornecido pelo International Conference on Acoustics, Speech, & Signal Processing (​ICASSP) 2021 tanto para a proposta de projeto como para o artigo final.
    Modelos em Latex e Word podem ser baixados em https://2021.ieeeicassp.org/Papers/PaperKit.asp.

    Prazo para entrega da proposta: 13/07/2021 (23h59)
    Atenciosamente,
  • Projeto - Arquivos Finais

    Caros alunos,

    O relatório final deve ser organizado na forma de artigo de pesquisa. Ele poderá ser feito de preferencia em Inglês, mas também aceitaremos artigos em Português.

    Utilizem o modelo fornecido pelo International Conference on Acoustics, Speech, & Signal Processing (​ICASSP) 2021 tanto para a proposta de projeto como para o artigo final.
    Modelos em Latex e Word podem ser baixados em https://2021.ieeeicassp.org/Papers/PaperKit.asp.

    Por favor, façam upload de todos os arquivos, referentes à apresentação, notebooks, códigos fonte, entre outros.

    Prazo para entrega: 05/09/2021 14/09/2021 (23h59)
    Atenciosamente,

  • Lista de Exercícios 1 - Entrega 08/08/2021

    • File icon
      Lista de Exercício 1 File
      Not available unless: You belong to T-PSI5123-1
    • Assignment icon
      Entrega da Lista de Exercícios 1 Assignment
      Not available unless: You belong to any group
  • Lista de Exercícios 2 - Entrega 22/08/2021

    Fiquem atentos para a data de entrega: 22/08/2021.

  • Aula 1 - Apresentação da disciplina. Processamento de Sinais de Voz: Representações e Modelos

    • URL icon
      1ª Aula - Vídeo URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Apresentação da Disciplina File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Processamento e Aprendizagem de Voz - Representações e Modelos File
      Not available unless: You belong to T-PSI5123-1
  • Aula 2 - DTFT, DFT, STFT e Aplicações em Python

    • URL icon
      2ª Aula - Vídeo URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Aula 2 - Slides File
      Not available unless: You belong to T-PSI5123-1
  • Aula 3 - STFT - Análise e Síntese. Processamento de Sinais de Voz: Representações e Modelos

    • URL icon
      3ª Aula - Vídeo URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Python/Librosa - Jupyter Notebook - PDF File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      DFT - Jupyter Notebook - PDF File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      STFT - Análise - Jupyter Notebook - PDF File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      STFT - Análise/Síntese - Jupyter Notebook - PDF File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Arquivos Python - Librosa - DFT - STFT File
      Not available unless: You belong to T-PSI5123-1
  • Aula 4 - Sinais de Voz e Percepção Auditiva

    • URL icon
      4ª Aula - Vídeo URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Speech - Slides File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Auditory Perception - Slides File
      Not available unless: You belong to T-PSI5123-1
  • Aula 5 - MFCC, Método da Máxima Verossimilhança e Divergência de Kullback-Leibler ou Entropia Relativa

    • URL icon
      5ª Aula - Vídeo URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Arquivos Python - MFCC File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      MFCC - Jupyter Notebook - PDF File
      Not available unless: You belong to T-PSI5123-1
  • Aula 6 - Divergência de Kullback-Leibler, Redes Neurais: Gradientes e Retropropagação

    • URL icon
      6ª Aula - Vídeo URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Método da máxima verossimilhança e Divergência de Kullback-Leibler com Desigualdade de Jensen File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Redes Neurais: Gradientes e Retropropagação File
      Not available unless: You belong to T-PSI5123-1
  • Aula 7 - Redes Neurais: Gradientes e Retropropagação. Deep Learning e Pytorch

    • URL icon
      7ª Aula - Vídeo URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Machine_Learning File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Pytorch File
      Not available unless: You belong to T-PSI5123-1
  • Aula 8 - Pytorch, MLP, Deep Learning, RNN e BPTT

    • URL icon
      8ª Aula - Vídeo URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Redes Neurais Recorrentes: Estados, Gradientes e Retropropagação através do Tempo (RNN: BPTT) File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Pytorch_AutoGrad_GPU File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Pytorch_MLP_UniversalFunctionAproximator File
      Not available unless: You belong to T-PSI5123-1
  • Aula 9 - RNN - GRU, LSTM. CNN, Pytorch

    • URL icon
      9ª Aula - Vídeo URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      MFCC_MLP_Pytorch File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      MiniBatch File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Aprendizagem de sequências File
      Not available unless: You belong to T-PSI5123-1
  • Aula 10 - K-Means. Gaussian Mixture Models

    • URL icon
      10ª Aula - Vídeo URL
      Not available unless: You belong to T-PSI5123-1
    • File icon
      CNN_Audio_Application File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Notebook - CNN File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Notebook - K-Means File
      Not available unless: You belong to T-PSI5123-1
    • File icon
      Modelos de misturas de gaussianas (GMMs) File
      Not available unless: You belong to T-PSI5123-1
  • Aula 11 - Avaliação

  • Aula 12 - Apresentações 14/09/2021

    • URL icon
      Vídeo 12ª Aula - Apresentações URL
      Not available unless: You belong to T-PSI5123-1
  • Aula 13 - Apresentações 21/09/2021

    • URL icon
      Vídeo 13ª Aula - Apresentações URL
      Not available unless: You belong to T-PSI5123-1