Curso: SSC5883 - Computação Reconfigurável (2025)

Contorno da seção

Selecionar seção Geral

Geral

Contrair tudo Expandir tudo
Sigla: SSC5883 - 5

Nome: Computação Reconfigurável
Carga horária:

Total: 90 h
Teórica: 3 h
Prática: 3 h
Estudo: 9 h

Créditos: 6
Duração: 6 Semana
H: 09:00hs – 12:00hs (Presencial)
Sala: 3.102
- Selecionar atividade Avisos
  
  Avisos Fórum
- Selecionar atividade Ementa
  
  Ementa URL
- Selecionar atividade Material de treinamento da INTEL
  
  Material de treinamento da INTEL URL
- Selecionar atividade Material de treinamento da AMD
  
  Material de treinamento da AMD URL
- Selecionar atividade Conteúdo do seminário com duração prevista de 50 m...
  
  Conteúdo do seminário com duração prevista de 50 min:
  - evolução histórica do tema e seu estado da arte;
  - principais resultados alcançados e os desafios atuais;
  - dependências do mundo externo (padrões de desenvolvimento, complexidade dos problemas, tempo de resposta, custo de desenvolvimento e manutenção, avanço da tecnologia, exigências do mercado e etc..)
  - apresentação de técnicas/algoritmos mais relevantes e, sempre que possível, realização de experimentos reais;
  - apresentação de questões e posicionamento do grupo que motivem a discussão da classe;
- Selecionar atividade Descrição do trabalho práticoExecutar em um proces...
  
  Descrição do trabalho prático
  Executar em um processador softcore em FPGA (exemplo de softcore: NIOS V da Altera, MicroBlaze da Xilinx ou algum RISC-V) uma rede neural CNN para a classificação de dígitos decimais escritos a mão conforme a base de dados MNIST. O projeto deverá explorar variações de configuração do processador softcore, como a adição de instruções customizadas, a adoção ou não de FPU, tamanho, níveis e modo de operação da memória cache, uso ou não de SO, e etc.. Aplicar também formas de otimização no código fonte. Assim, encontrar um conjunto de soluções que visem maximizar throughput, latência e acurácia das inferências da rede neural. Note que esses objetivos são conflitante, o que acarreta na formação de uma fronteira de Pareto. A rede pode ser treinada offline e a adoção de runtime é opcional (ONNX Runtime Micro ou TensorFlow Lite for Microcontrollers (TFLM)). Alternativamente, o grupo pode propor a aplicação da CNN em outro problema.
  
  O trabalho pode ser desenvolvido em trio, dupla ou individualmente.
Selecionar seção Aula 1 (08/05)

Aula 1 (08/05)
Apresentação do Curso
Cronograma
Definição de trabalhos práticos e sorteio dos seminários
Introdução à Computação Reconfigurável (RC)
- Selecionar atividade Modelos de computação
  
  Modelos de computação URL
- Selecionar atividade Introdução à computação reconfigurável
  
  Introdução à computação reconfigurável URL
Selecionar seção Aula 2 e 3 (15 e 22/05)

Aula 2 e 3 (15 e 22/05)
Linguagens, ferramentas de programação/simulação e arquiteturas avançadas

Grupos apresentam proposta de cronograma do trabalho prático (fase 1 e fase 2)
- Selecionar atividade HLS: Tutorial FCCM2021
  
  HLS: Tutorial FCCM2021 Arquivo
- Selecionar atividade Métricas de desempenho em hardware
  
  Métricas de desempenho em hardware Arquivo
  
  Estudo de caso para avaliar as métricas Throughput, Latency e Timing.
Selecionar seção Aula 4 (29/05)

Aula 4 (29/05)
Seminário 1:
[50 min] O uso do FPGA como acelerador de processamento de grafos e dataflow [Eduardo Sperle Honorato]
[50 min] O papel dos FPGAs em deep learning [Leonardo Zaniboni Silva]
Acompanhamento do trabalho prático
Selecionar seção Aula 5 (05/06)

Aula 5 (05/06)
Seminário 2:
[50 min] Ferramentas HLS (High Level Synthesis): objetivo, princípio de funcionamento e exemplos de aplicação [Gabriel Pinho Nogueira]
[50 min] Arquiteturas avançadas de FPGA [Bruno Pereira de Oliveira]
Acompanhamento do trabalho prático
Selecionar seção Aula 6 (26/06)

Aula 6 (26/06)
Seminário 3:
[50 min] Processadores de redes neurais, incluindo softcores em FPGA [Melissa Motoki Nogueira]
Fechamento do curso com a apresentação dos trabalhos práticos
- Selecionar atividade Link para upload do relatorio do projeto
  
  Link para upload do relatorio do projeto Tarefa
  
  Favor incluir um arquivo pdf com o nome e numero USP dos participantes e uma breve descrição do que foi desenvolvido e os resultados obtidos. Incluir nesse pdf um link para o git com os fontes e lá no git incluir as instruções descrevendo o projeto e as instruções para uso do mesmo.
Selecionar seção Softcores

Softcores
- Selecionar atividade MicroBlaze Soft Processor Core
  
  MicroBlaze Soft Processor Core URL
- Selecionar atividade -------------------------NIOS V
  
  -------------------------
  NIOS V
- Selecionar atividade Nios V handbook
  
  Nios V handbook URL
- Selecionar atividade AN 980: Nios® V Processor Quartus® Prime Software Support
  
  AN 980: Nios® V Processor Quartus® Prime Software Support URL
- Selecionar atividade AN 985: Nios® V Processor Tutorial
  
  AN 985: Nios® V Processor Tutorial URL
- Selecionar atividade [YouTube] Hello NIOS II tutorial
  
  [YouTube] Hello NIOS II tutorial URL
- Selecionar atividade -------------------------Open source RISC-V
  
  -------------------------
  Open source RISC-V
- Selecionar atividade Material sobre o processador RISC-V - NEORV32 The ...
  
  Material sobre o processador RISC-V - NEORV32
  The NEORV32 RISC-V Processor - User Guide: https://stnolting.github.io/neorv32/ug/
  NEORV32 Source Code: https://github.com/stnolting/neorv32
  Para sintetizar o processador instalar a ferramenta Quartus Prime Lite (link a seguir):
  https://www.intel.com/content/www/us/en/collections/products/fpga/software/downloads.html
Selecionar seção Aceleradores em hardware

Aceleradores em hardware
- Selecionar atividade ---------------------------Deep NN acceleration
  
  ---------------------------
  Deep NN acceleration
- Selecionar atividade Projeto base para DPU (https://www.xilinx.com/bin/...
  
  Projeto base para DPU (https://www.xilinx.com/bin/public/openDownload?filename=DPUCZDX8G_VAI_v3.0.tar.gz) que está nesta página oficial da Xilinx https://xilinx.github.io/Vitis-AI/3.5/html/docs/workflow-system-integration
  
  Esse projeto usa essa DPUCZDX8G é dedicada para o FPGA Zynq UltraScale+ MPSoC e ele vem com 3 DPUs instanciadas. O projeto por default é para a placa ZCU102, mas daí você consegue mudar para a placa ZCU104 que nao precisa de licença e temos em nosso laboratório de computação reconfigurável (LCR) do ICMC. Porém para caber na ZCU104 sem alterar a configuracao default da DPU tem que reduzir para 1 DPU. Fiz isso e deu certo a Synthesis e a Implementation (como esperado gerou o bitstream sem precisar da licença).
  Comentando sobre licenças. Para o FPGA da placa ZCU104 nao precisa de licença! Mas para a ZCU102 sim.
  Para sintetizar o projeto instalar Vivado ML Edition 2023.2 que vc encontra no link seguinte:
  https://www.xilinx.com/products/design-tools/vivado/vivado-buy.html#architecture
- Selecionar atividade FINN: machine learning framework
  
  FINN: machine learning framework URL
  
  FINN generates dataflow architectures as a physical representation of the implemented custom network in space
- Selecionar atividade Introduction to VHDL
  
  Introduction to VHDL Arquivo