Curso: MAE5911 - Fundamentos da Estatística Clássica e do Aprendizado de Máquinas (2023)

Geral

Contrair tudo Expandir tudo

Avisos Fórum

Material suplementar

Seguem alguns materiais suplementares

Algoritmos Página

Prezados,
Seguem os três algoritmos discutidos em sala:
https://www.ime.usp.br/~patriota/MAE5911/1-Regressao.R
https://www.ime.usp.br/~patriota/MAE5911/2-Bernoulli.R
https://www.ime.usp.br/~patriota/MAE5911/3-Multinomial.R
O código com a parte de redes neurais que discuti em sala fica como exercício. Abaixo disponibilizo uma implementação em Torch que fiz em sala de aula com o Pedro e Andrey. Favor, verificar, pois não conferi.
Variância assintótica (Torch)
A simulação de dados para estudar o valor-p feita em sala está descrita no arquivo abaixo. Na parte não-linear, que estava dando problemas em sala, todas as contas estavam corretas, o problema era falta de identificabilidade (muitos parâmetros no modelo)
Simulação de dados para estudar o valor-p (R-base)
Atenciosamente
Estatística Quiquadrado Arquivo

Prezados,
O Andrey desenvolveu os argumentos para justificar a estatística que apresentei em sala para testar a média de uma normal.
Na próxima aula eu vou apresentar mais exemplos de valores-p, inclusive exemplos que ilustram a sua falta de monotonicidade.
Att
Resultados Normal/Qui-quadrado Arquivo

Para quem tiver interesse nas contas para demonstrar as propriedades da distribuição normal, vejam o arquivo anexado.
Att
Crise de reprodutibilidade na ciência Página
Prezados,
Como discuti em sala, o valor-p é um índice que mensura de certa forma a discrepância entre a hipótese nula e os dados observados: quanto menor o seu valor, mais evidências de que a hipótese nula é falsa. Como vocês viram, a definição do valor-p não exige uma hipótese alternativa. Veremos na semana que vem que essa hipótese auxiliar foi definida por Neyman-Person no paper "On the problem of the most efficient Tests os statistical hypotheses" publicado em 1933.
Comentei em sala sobre algumas limitações do valor-p uma das quais é a falta de monotonicidade. Não se pode utilizar o valor-p calculada para um hipótese para decidir sobre outra.

A ciência evolui com o tempo e nenhum artigo detém a verdade sobre qualquer afirmação científica. Afirmações científicas válidas são obtidas quando existe repetição dos estudos em diferentes domínios por diferentes grupos. Sem repetição, temos uma crise de reprodutibilidade na ciência e nenhuma medida estatística consegue resolver esse problema.

Alguns estudos/manifestos sobre a crise de reprodutibilidade na ciência (vejam as referências de cada item abaixo):

A manifesto for reproducible science (https://www.nature.com/articles/s41562-016-0021)
1,500 scientists lift the lid on reproducibility (https://www.nature.com/articles/533452a)
Reproducibility crisis by Dorothy Bishop, Professor for Psychology at the University of Oxford ( )
Is there a reproducibility crisis in science? - Matt Anticole (https://ed.ted.com/lessons/is-there-a-reproducibility-crisis-in-science-matt-anticole)
Aula sobre Medida de possibilidade URL
Aula sobre GPT URL

GPT no R eu disponibilizei os códigos no meu GITHUB:
Nano-GPT: https://github.com/AGPatriota/GPT4R
GPT-2: https://github.com/AGPatriota/GPT-2-for-R

Assista aos vídeos do Andrej Karpathy:

INTRO: https://www.youtube.com/watch?v=zjkBMFhNj_g
Building a GPT from scratch: https://www.youtube.com/watch?v=kCc8FmEb1nY

Listas de exercicios

Lista 1 Tarefa

Escrever os algoritmos em torch (R ou Python) para estimar via função de estimação (em especial via máxima verossimilhança) os parâmetros de modelos de regressão considerando:
1. Y|X=x ~ N( mu(x,theta), sigma² )
2. Y|X=x ~ Ber( p(x,theta) )
3. Y|X=x ~ Multinomial_k(1, p(x,theta) )

considere x uma variável quantitativa (se for qualitativa, basta utilizar uma matriz de variáveis dummies indicando cada categoria).
Atenção: Utilize uma rede neural apropriada para modelar as esperanças condicionais: mu(x,theta) e p(x,theta). Ou seja, a função deve satisfazer as propriedades vistas em sala sob cada modelo.

Envie por email um arquivo zipado até o dia 10/11 com
a) documento em pdf descrevendo apropriadamente cada modelo, as variáveis aleatórias envolvidas e as funções de verossimilhanças (ou funções de estimações utilizadas). Apresente também as variâncias assintóticas dos estimadores (usando os resultados dados em sala). Utilize um conjunto de dados gerados artificialmente, como fizemos em sala, para testar o seu algoritmo e comente brevemente os resultados e dificuldades encontradas. Apresente os resultados em formato de tabela e gráficos.
b) o código integral em três arquivos, um para cada modelo de regressão. Cada arquivo deve ser independente dos outros e deve computar todos os resultados apresentados no arquivo pdf.

O trabalho é individual, mas é permitido trocar ideias de implementação.

Provas

Prova 1 Tarefa
Prezados,
Os dois itens abaixo fazem parte da Prova 1. Cada aluno deverá elaborar a sua prova individualmente. A entrega deve ocorrer por email até o dia 17/11/2023 (adiada para o dia 24/11/2023). Haverá exposição oral em hora marcada após a entrega.
1. [5 pontos] Faça um resumo sobre o conteúdo da matéria contendo os seguintes tópicos:
Modelos estatísticos clássicos,
Estimadores, estimativas e Estatísticas,
Teoria de Função de Estimação com exemplos ,
Redes neurais,
Intervalos de confiança,
Valor-p.
Apresente exemplos e discuta brevemente cada tópico.

2. [5 pontos] Considere um modelo de regressão em que Y|X=x ~Pois( mu(x, theta) ). Modele a função mu(x,theta) por meio de uma rede neural pequena com menos de 10 (e mais de 4) parâmetros.
Especifique a rede neural,
Proponha um algoritmo em R ou Python que calcule as estimativas de máxima verossimilhança.
Proponha intervalos de confiança assintóticos em R ou Python para cada parâmetro da rede neural.
Proponha valores-p assintóticos em R ou Python para cada hipótese H_{0i}: theta_i = theta_{0i}, em que theta_i o i-ésimo parâmetro da rede neural e theta_{0i} é um valor conhecido e especificado na hipótese nula (por exemplo, theta_{i0} = 0).
Aplique os resultados acima em um conjunto de dados real, faça uma simulação em R ou Python e comente os resultados.

Não há limite de páginas. A nota será definida a partir da clareza e profundidade da sua exposição que será feita.

Objetivo: mensurar a sua proficiência teórica e aplicada dos conceitos abordados em sala.
Prova 2 Tarefa

Escreva um ensaio de até 5 páginas sobre as diferenças entre o Modelo Bayesiano e o Modelo Clássico. Apresente as potencialidades e limitações de cada abordagem.
Neste ensaio, proponha um assunto de pesquisa que poderia ser desenvolvido por um aluno de graduação em uma iniciação científica.
Entrega: dia 24/11 (adiada para o dia 29/11/2023).

MAE5911 - Fundamentos da Estatística Clássica e do Aprendizado de Máquinas (2023)

Programação

Geral

Material suplementar

Listas de exercicios

Provas

Tópico 4

Tópico 5

Tópico 6

Tópico 7

Tópico 8

Tópico 9

Navegação