Diagrama de temas

  • PSI5123 - Aprendizagem de Máquina de Sinais de Áudio e Voz

    Caros alunos,

    As aulas da disciplina ocorrerão às terças-feiras das 17h00 às 20h00.

    Para acessar o link do Google Meet.

    • Icono URL
      Link para as aulas URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Conceito - Alunos

    • Icono Tarea
      Conceito Tarea
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Apresentação dos Projetos - Cronograma e Organização

    A duração das apresentações é de 10 minutos com 5 minutos de perguntas. A apresentação deve ser feita em slides. Adicionalmente, se quiser, apresente códigos, scripts ou demonstre seus resultados.

    14 de Setembro, 2021 - Lista de Alunos (em construção)
    Andre Lucas de Oliveira Duarte
    João Pedro de Omena Simas
    Caique Bueno Passolongo
    Guilherme Apolinario Silva Novaes
    Alessandra Carolina Botto
    Andre Luis Ferreira Marques
    Bruno Elton da Luz
    Gabriel Durante
    Gabriel de Souza Lima
    Vinicius da Silva Borges
    Rodrigo Anjos de Souza
    Lucas Giannella de Oliveira Apresentação

    21 de Setembro, 2021 - Lista de Alunos (em construção)
    Felipe Meneguitti Dias
    João Pedro de Omena Simas
    Mauro Chiozzotto
    Tiago Gaspar da Rosa
    Bruno Elton da Luz
    Adriano Tito da Silva
    Marcelo Monari Baccaro
    Thiago Yuji Aoyagi
    Andre Amaro Bueno
    Fernando dos Santos Gil
    Pedro Henrique Pereira
    Fabiano Valente Nunes
    Yuri Perim
    Nilo Henrique Garcia Behaker

  • Programação de Aulas

    Caros alunos,

    Segue calendário preliminar da disciplina. O calendário será atualizado semanalmente, com detalhamento do planejamento das aulas. Desta forma, é importante que os alunos acessem continuamente a plataforma.

    Datas importantes

    24/08: Avaliação
    14/09 e 21/09: Apresentações Finais.

    • Icono Recurso
      Ementa Final - 11/08/2021 Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Projeto da Disciplina

    • Icono URL
      Vídeo - Instruções para o Projeto Final URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Projeto Final e Questões de Pesquisa Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Proposta de Projeto

    Caros alunos,

    A proposta de projeto consiste em um documento de 1 ou 2 páginas que descreve o tema de pesquisa, os principais objetivos, os materiais e métodos, os resultados esperados e as referências encontradas.
    Utilizem o modelo fornecido pelo International Conference on Acoustics, Speech, & Signal Processing (​ICASSP) 2021 tanto para a proposta de projeto como para o artigo final.
    Modelos em Latex e Word podem ser baixados em https://2021.ieeeicassp.org/Papers/PaperKit.asp.

    Prazo para entrega da proposta: 13/07/2021 (23h59)
    Atenciosamente,
    • Icono Recurso
      Template - ICASSP 2021 - Word Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Template - ICASSP 2021 - Latex Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Projeto - Arquivos Finais

    Caros alunos,

    O relatório final deve ser organizado na forma de artigo de pesquisa. Ele poderá ser feito de preferencia em Inglês, mas também aceitaremos artigos em Português.

    Utilizem o modelo fornecido pelo International Conference on Acoustics, Speech, & Signal Processing (​ICASSP) 2021 tanto para a proposta de projeto como para o artigo final.
    Modelos em Latex e Word podem ser baixados em https://2021.ieeeicassp.org/Papers/PaperKit.asp.

    Por favor, façam upload de todos os arquivos, referentes à apresentação, notebooks, códigos fonte, entre outros.

    Prazo para entrega: 05/09/2021 14/09/2021 (23h59)
    Atenciosamente,

  • Lista de Exercícios 1 - Entrega 08/08/2021

    • Icono Recurso
      Lista de Exercício 1 Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Tarea
      Entrega da Lista de Exercícios 1 Tarea
      No disponible hasta que: se pertenezca a cualquier grupo
  • Lista de Exercícios 2 - Entrega 22/08/2021

    Fiquem atentos para a data de entrega: 22/08/2021.

  • Aula 1 - Apresentação da disciplina. Processamento de Sinais de Voz: Representações e Modelos

    • Icono URL
      1ª Aula - Vídeo URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Apresentação da Disciplina Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Processamento e Aprendizagem de Voz - Representações e Modelos Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 2 - DTFT, DFT, STFT e Aplicações em Python

    • Icono URL
      2ª Aula - Vídeo URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Aula 2 - Slides Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 3 - STFT - Análise e Síntese. Processamento de Sinais de Voz: Representações e Modelos

    • Icono URL
      3ª Aula - Vídeo URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Python/Librosa - Jupyter Notebook - PDF Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      DFT - Jupyter Notebook - PDF Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      STFT - Análise - Jupyter Notebook - PDF Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      STFT - Análise/Síntese - Jupyter Notebook - PDF Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Arquivos Python - Librosa - DFT - STFT Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 4 - Sinais de Voz e Percepção Auditiva

    • Icono URL
      4ª Aula - Vídeo URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Speech - Slides Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Auditory Perception - Slides Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 5 - MFCC, Método da Máxima Verossimilhança e Divergência de Kullback-Leibler ou Entropia Relativa

    • Icono URL
      5ª Aula - Vídeo URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Arquivos Python - MFCC Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      MFCC - Jupyter Notebook - PDF Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 6 - Divergência de Kullback-Leibler, Redes Neurais: Gradientes e Retropropagação

    • Icono URL
      6ª Aula - Vídeo URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Método da máxima verossimilhança e Divergência de Kullback-Leibler com Desigualdade de Jensen Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Redes Neurais: Gradientes e Retropropagação Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 7 - Redes Neurais: Gradientes e Retropropagação. Deep Learning e Pytorch

    • Icono URL
      7ª Aula - Vídeo URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Machine_Learning Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Pytorch Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 8 - Pytorch, MLP, Deep Learning, RNN e BPTT

    • Icono URL
      8ª Aula - Vídeo URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Redes Neurais Recorrentes: Estados, Gradientes e Retropropagação através do Tempo (RNN: BPTT) Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Pytorch_AutoGrad_GPU Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Pytorch_MLP_UniversalFunctionAproximator Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 9 - RNN - GRU, LSTM. CNN, Pytorch

    • Icono URL
      9ª Aula - Vídeo URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      MFCC_MLP_Pytorch Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      MiniBatch Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Aprendizagem de sequências Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 10 - K-Means. Gaussian Mixture Models

    • Icono URL
      10ª Aula - Vídeo URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      CNN_Audio_Application Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Notebook - CNN Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Notebook - K-Means Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
    • Icono Recurso
      Modelos de misturas de gaussianas (GMMs) Archivo
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 11 - Avaliação

  • Aula 12 - Apresentações 14/09/2021

    • Icono URL
      Vídeo 12ª Aula - Apresentações URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1
  • Aula 13 - Apresentações 21/09/2021

    • Icono URL
      Vídeo 13ª Aula - Apresentações URL
      No disponible hasta que: se pertenezca al grupo T-PSI5123-1