Indice degli argomenti

  • PSI5123 - Aprendizagem de Máquina de Sinais de Áudio e Voz

    Caros alunos,

    As aulas da disciplina ocorrerão às terças-feiras das 17h00 às 20h00.

    Para acessar o link do Google Meet.

    • Icona URL
      Link para as aulas URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Conceito - Alunos

    • Icona Compito
      Conceito Compito
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Apresentação dos Projetos - Cronograma e Organização

    A duração das apresentações é de 10 minutos com 5 minutos de perguntas. A apresentação deve ser feita em slides. Adicionalmente, se quiser, apresente códigos, scripts ou demonstre seus resultados.

    14 de Setembro, 2021 - Lista de Alunos (em construção)
    Andre Lucas de Oliveira Duarte
    João Pedro de Omena Simas
    Caique Bueno Passolongo
    Guilherme Apolinario Silva Novaes
    Alessandra Carolina Botto
    Andre Luis Ferreira Marques
    Bruno Elton da Luz
    Gabriel Durante
    Gabriel de Souza Lima
    Vinicius da Silva Borges
    Rodrigo Anjos de Souza
    Lucas Giannella de Oliveira Apresentação

    21 de Setembro, 2021 - Lista de Alunos (em construção)
    Felipe Meneguitti Dias
    João Pedro de Omena Simas
    Mauro Chiozzotto
    Tiago Gaspar da Rosa
    Bruno Elton da Luz
    Adriano Tito da Silva
    Marcelo Monari Baccaro
    Thiago Yuji Aoyagi
    Andre Amaro Bueno
    Fernando dos Santos Gil
    Pedro Henrique Pereira
    Fabiano Valente Nunes
    Yuri Perim
    Nilo Henrique Garcia Behaker

  • Programação de Aulas

    Caros alunos,

    Segue calendário preliminar da disciplina. O calendário será atualizado semanalmente, com detalhamento do planejamento das aulas. Desta forma, é importante que os alunos acessem continuamente a plataforma.

    Datas importantes

    24/08: Avaliação
    14/09 e 21/09: Apresentações Finais.

    • Icona Risorsa
      Ementa Final - 11/08/2021 File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Projeto da Disciplina

    • Icona URL
      Vídeo - Instruções para o Projeto Final URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Projeto Final e Questões de Pesquisa File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Proposta de Projeto

    Caros alunos,

    A proposta de projeto consiste em um documento de 1 ou 2 páginas que descreve o tema de pesquisa, os principais objetivos, os materiais e métodos, os resultados esperados e as referências encontradas.
    Utilizem o modelo fornecido pelo International Conference on Acoustics, Speech, & Signal Processing (​ICASSP) 2021 tanto para a proposta de projeto como para o artigo final.
    Modelos em Latex e Word podem ser baixados em https://2021.ieeeicassp.org/Papers/PaperKit.asp.

    Prazo para entrega da proposta: 13/07/2021 (23h59)
    Atenciosamente,
    • Icona Risorsa
      Template - ICASSP 2021 - Word File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Template - ICASSP 2021 - Latex File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Projeto - Arquivos Finais

    Caros alunos,

    O relatório final deve ser organizado na forma de artigo de pesquisa. Ele poderá ser feito de preferencia em Inglês, mas também aceitaremos artigos em Português.

    Utilizem o modelo fornecido pelo International Conference on Acoustics, Speech, & Signal Processing (​ICASSP) 2021 tanto para a proposta de projeto como para o artigo final.
    Modelos em Latex e Word podem ser baixados em https://2021.ieeeicassp.org/Papers/PaperKit.asp.

    Por favor, façam upload de todos os arquivos, referentes à apresentação, notebooks, códigos fonte, entre outros.

    Prazo para entrega: 05/09/2021 14/09/2021 (23h59)
    Atenciosamente,

  • Lista de Exercícios 1 - Entrega 08/08/2021

    • Icona Risorsa
      Lista de Exercício 1 File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Compito
      Entrega da Lista de Exercícios 1 Compito
      Condizioni per l'accesso: Appartenere a qualsiasi gruppo
  • Lista de Exercícios 2 - Entrega 22/08/2021

    Fiquem atentos para a data de entrega: 22/08/2021.

  • Aula 1 - Apresentação da disciplina. Processamento de Sinais de Voz: Representações e Modelos

    • Icona URL
      1ª Aula - Vídeo URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Apresentação da Disciplina File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Processamento e Aprendizagem de Voz - Representações e Modelos File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 2 - DTFT, DFT, STFT e Aplicações em Python

    • Icona URL
      2ª Aula - Vídeo URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Aula 2 - Slides File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 3 - STFT - Análise e Síntese. Processamento de Sinais de Voz: Representações e Modelos

    • Icona URL
      3ª Aula - Vídeo URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Python/Librosa - Jupyter Notebook - PDF File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      DFT - Jupyter Notebook - PDF File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      STFT - Análise - Jupyter Notebook - PDF File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      STFT - Análise/Síntese - Jupyter Notebook - PDF File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Arquivos Python - Librosa - DFT - STFT File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 4 - Sinais de Voz e Percepção Auditiva

    • Icona URL
      4ª Aula - Vídeo URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Speech - Slides File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Auditory Perception - Slides File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 5 - MFCC, Método da Máxima Verossimilhança e Divergência de Kullback-Leibler ou Entropia Relativa

    • Icona URL
      5ª Aula - Vídeo URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Arquivos Python - MFCC File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      MFCC - Jupyter Notebook - PDF File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 6 - Divergência de Kullback-Leibler, Redes Neurais: Gradientes e Retropropagação

    • Icona URL
      6ª Aula - Vídeo URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Método da máxima verossimilhança e Divergência de Kullback-Leibler com Desigualdade de Jensen File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Redes Neurais: Gradientes e Retropropagação File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 7 - Redes Neurais: Gradientes e Retropropagação. Deep Learning e Pytorch

    • Icona URL
      7ª Aula - Vídeo URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Machine_Learning File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Pytorch File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 8 - Pytorch, MLP, Deep Learning, RNN e BPTT

    • Icona URL
      8ª Aula - Vídeo URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Redes Neurais Recorrentes: Estados, Gradientes e Retropropagação através do Tempo (RNN: BPTT) File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Pytorch_AutoGrad_GPU File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Pytorch_MLP_UniversalFunctionAproximator File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 9 - RNN - GRU, LSTM. CNN, Pytorch

    • Icona URL
      9ª Aula - Vídeo URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      MFCC_MLP_Pytorch File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      MiniBatch File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Aprendizagem de sequências File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 10 - K-Means. Gaussian Mixture Models

    • Icona URL
      10ª Aula - Vídeo URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      CNN_Audio_Application File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Notebook - CNN File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Notebook - K-Means File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
    • Icona Risorsa
      Modelos de misturas de gaussianas (GMMs) File
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 11 - Avaliação

  • Aula 12 - Apresentações 14/09/2021

    • Icona URL
      Vídeo 12ª Aula - Apresentações URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1
  • Aula 13 - Apresentações 21/09/2021

    • Icona URL
      Vídeo 13ª Aula - Apresentações URL
      Condizioni per l'accesso: Appartenere al gruppo T-PSI5123-1