Programação

  • PSI5123 - Aprendizagem de Máquina de Sinais de Áudio e Voz

    Caros alunos,

    As aulas da disciplina ocorrerão às terças-feiras das 17h00 às 20h00.

    Para acessar o link do Google Meet.

    • URL ícone
      Link para as aulas URL
      Disponível se: Você faz parte de T-PSI5123-1
  • Conceito - Alunos

    • Tarefa ícone
      Conceito Tarefa
      Disponível se: Você faz parte de T-PSI5123-1
  • Apresentação dos Projetos - Cronograma e Organização

    A duração das apresentações é de 10 minutos com 5 minutos de perguntas. A apresentação deve ser feita em slides. Adicionalmente, se quiser, apresente códigos, scripts ou demonstre seus resultados.

    14 de Setembro, 2021 - Lista de Alunos (em construção)
    Andre Lucas de Oliveira Duarte
    João Pedro de Omena Simas
    Caique Bueno Passolongo
    Guilherme Apolinario Silva Novaes
    Alessandra Carolina Botto
    Andre Luis Ferreira Marques
    Bruno Elton da Luz
    Gabriel Durante
    Gabriel de Souza Lima
    Vinicius da Silva Borges
    Rodrigo Anjos de Souza
    Lucas Giannella de Oliveira Apresentação

    21 de Setembro, 2021 - Lista de Alunos (em construção)
    Felipe Meneguitti Dias
    João Pedro de Omena Simas
    Mauro Chiozzotto
    Tiago Gaspar da Rosa
    Bruno Elton da Luz
    Adriano Tito da Silva
    Marcelo Monari Baccaro
    Thiago Yuji Aoyagi
    Andre Amaro Bueno
    Fernando dos Santos Gil
    Pedro Henrique Pereira
    Fabiano Valente Nunes
    Yuri Perim
    Nilo Henrique Garcia Behaker

  • Programação de Aulas

    Caros alunos,

    Segue calendário preliminar da disciplina. O calendário será atualizado semanalmente, com detalhamento do planejamento das aulas. Desta forma, é importante que os alunos acessem continuamente a plataforma.

    Datas importantes

    24/08: Avaliação
    14/09 e 21/09: Apresentações Finais.

    • Arquivo ícone
      Ementa Final - 11/08/2021 Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Projeto da Disciplina

    • URL ícone
      Vídeo - Instruções para o Projeto Final URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Projeto Final e Questões de Pesquisa Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Proposta de Projeto

    Caros alunos,

    A proposta de projeto consiste em um documento de 1 ou 2 páginas que descreve o tema de pesquisa, os principais objetivos, os materiais e métodos, os resultados esperados e as referências encontradas.
    Utilizem o modelo fornecido pelo International Conference on Acoustics, Speech, & Signal Processing (​ICASSP) 2021 tanto para a proposta de projeto como para o artigo final.
    Modelos em Latex e Word podem ser baixados em https://2021.ieeeicassp.org/Papers/PaperKit.asp.

    Prazo para entrega da proposta: 13/07/2021 (23h59)
    Atenciosamente,
    • Arquivo ícone
      Template - ICASSP 2021 - Word Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Template - ICASSP 2021 - Latex Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Projeto - Arquivos Finais

    Caros alunos,

    O relatório final deve ser organizado na forma de artigo de pesquisa. Ele poderá ser feito de preferencia em Inglês, mas também aceitaremos artigos em Português.

    Utilizem o modelo fornecido pelo International Conference on Acoustics, Speech, & Signal Processing (​ICASSP) 2021 tanto para a proposta de projeto como para o artigo final.
    Modelos em Latex e Word podem ser baixados em https://2021.ieeeicassp.org/Papers/PaperKit.asp.

    Por favor, façam upload de todos os arquivos, referentes à apresentação, notebooks, códigos fonte, entre outros.

    Prazo para entrega: 05/09/2021 14/09/2021 (23h59)
    Atenciosamente,

  • Lista de Exercícios 1 - Entrega 08/08/2021

    • Arquivo ícone
      Lista de Exercício 1 Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Tarefa ícone
      Entrega da Lista de Exercícios 1 Tarefa
      Disponível se: Você faz parte de qualquer grupo
  • Lista de Exercícios 2 - Entrega 22/08/2021

    Fiquem atentos para a data de entrega: 22/08/2021.

  • Aula 1 - Apresentação da disciplina. Processamento de Sinais de Voz: Representações e Modelos

    • URL ícone
      1ª Aula - Vídeo URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Apresentação da Disciplina Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Processamento e Aprendizagem de Voz - Representações e Modelos Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 2 - DTFT, DFT, STFT e Aplicações em Python

    • URL ícone
      2ª Aula - Vídeo URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Aula 2 - Slides Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 3 - STFT - Análise e Síntese. Processamento de Sinais de Voz: Representações e Modelos

    • URL ícone
      3ª Aula - Vídeo URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Python/Librosa - Jupyter Notebook - PDF Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      DFT - Jupyter Notebook - PDF Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      STFT - Análise - Jupyter Notebook - PDF Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      STFT - Análise/Síntese - Jupyter Notebook - PDF Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Arquivos Python - Librosa - DFT - STFT
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 4 - Sinais de Voz e Percepção Auditiva

    • URL ícone
      4ª Aula - Vídeo URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Speech - Slides Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Auditory Perception - Slides Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 5 - MFCC, Método da Máxima Verossimilhança e Divergência de Kullback-Leibler ou Entropia Relativa

    • URL ícone
      5ª Aula - Vídeo URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Arquivos Python - MFCC
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      MFCC - Jupyter Notebook - PDF Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 6 - Divergência de Kullback-Leibler, Redes Neurais: Gradientes e Retropropagação

    • URL ícone
      6ª Aula - Vídeo URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Método da máxima verossimilhança e Divergência de Kullback-Leibler com Desigualdade de Jensen Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Redes Neurais: Gradientes e Retropropagação Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 7 - Redes Neurais: Gradientes e Retropropagação. Deep Learning e Pytorch

    • URL ícone
      7ª Aula - Vídeo URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Machine_Learning Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Pytorch Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 8 - Pytorch, MLP, Deep Learning, RNN e BPTT

    • URL ícone
      8ª Aula - Vídeo URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Redes Neurais Recorrentes: Estados, Gradientes e Retropropagação através do Tempo (RNN: BPTT) Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Pytorch_AutoGrad_GPU Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Pytorch_MLP_UniversalFunctionAproximator Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 9 - RNN - GRU, LSTM. CNN, Pytorch

    • URL ícone
      9ª Aula - Vídeo URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      MFCC_MLP_Pytorch Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      MiniBatch Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Aprendizagem de sequências Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 10 - K-Means. Gaussian Mixture Models

    • URL ícone
      10ª Aula - Vídeo URL
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      CNN_Audio_Application Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Notebook - CNN Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Notebook - K-Means Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
    • Arquivo ícone
      Modelos de misturas de gaussianas (GMMs) Arquivo
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 11 - Avaliação

  • Aula 12 - Apresentações 14/09/2021

    • URL ícone
      Vídeo 12ª Aula - Apresentações URL
      Disponível se: Você faz parte de T-PSI5123-1
  • Aula 13 - Apresentações 21/09/2021

    • URL ícone
      Vídeo 13ª Aula - Apresentações URL
      Disponível se: Você faz parte de T-PSI5123-1