{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Uma Simulação Simples e o Problema de Monty Hall\n", "### Nelson Kuhl - IME/USP" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import numpy as np, matplotlib.pyplot as plt # o mínimo\n", "import scipy.stats as st # Há várias ferramentas estatísticas no Python. O módulo stats do scipy integra bem com o\n", " # numpy" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Exemplo de Simulação com Inteiros\n", "O objeto *randint* do módulo scipy.stats é usado para a distribuição uniforme discreta. Aqui usaremos apenas o *método* rvs, que sorteia valores identicamente distribuidos entre um conjunto discreto de pontos: dados naturais $i$ e $j$ com $i < j-1$ e um inteiro positivo $n$, o comando
\n", "$$\n", "scipy.stats.randint.rvs(i, j, size=n)\n", "$$
\n", "gera $n$ números distribuidos uniformemente no conjunto $\\{i, i+1,\\dots,j-1\\}$. Faremos um teste simples para verificar a distribuição uniforme." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[0.321 0.336 0.343]\n" ] } ], "source": [ "n = 1000 # Tamanho da amostra\n", "rs = st.randint.rvs(1, 4, size=n) # n sorteios de números uniformemente distribuidos no conjunto {1, 2, 3}\n", "y = np.array([sum(rs==1), sum(rs==2), sum(rs==3)])/n # array contendo a frequência dos resultados de cada valor\n", "print(y)" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "# Gráfico\n", "\n", "x = np.array([1, 2, 3]) # abscissas. As ordenadas estão em y\n", "plt.plot(x, y, 'ro', label=\"frequências\")\n", "plt.vlines(x, 0, y, color='r', linestyles='-')\n", "plt.ylim(0,1)\n", "xx = np.arange(0, 4, 0.01); yy = np.ones(np.size(xx))/3 # Para a ver a linha 1/3 na figura.\n", "plt.plot(xx, yy, '--k', label=\"1/3\") # Deve haver maneira melhor\n", "plt.legend();" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## O Problema de Monty Hall\n", "Vamos relembrar o enunciado. Em um programa de auditório, há três portas fechadas, sendo que uma delas contém um prêmio e nas outras duas há duas cabras. O apresentador pede para o participante escolher uma porta. Após a escolha, o apresentador abre uma porta contendo uma cabra e pergunta ao participante se ele quer trocar de porta.\n", "\n", "Simularemos aqui a situação na qual o participante sempre troca de porta para estimar a probabilidade de ganhar o prêmio. A ideia é ignorar solução discutida em aula e resolver o problema usando força bruta. Não é elegante, mas funciona.\n", "\n", "Note que se o participante escolher a porta que tem o prêmio, o apresentador pode abrir qualquer uma das outras portas e, ao mudar de porta, o participante obterá uma cabra. Caso a escolha inicial tenha sido uma porta contendo uma cabra, só há uma escolha para o apresentador abrir e, ao mudar a porta, o participante ganha o prêmio.\n", "\n", "As portas serão numeradas por 1, 2 e 3. Para a simulação, usaremos um vetor $p$ no qual a componente a componente $p_i$ armazena o número da porta contendo o prêmio no $i$-ésimo desafio, e um vetor $x$ cuja componente $x_i$ contém a escolha do participante no $i$-ésimo desafio. O prêmio é ganho de $x_i \\ne p_i$. Os valores de $x$ serão sorteados entre os números 1, 2 e 3 com mesma probabilidade. Os valores de $p$ podem ser atribuídos arbitrariamente. Usaremos também a distribuição uniforme entre os valores 1, 2 e 3, mas você pode testar outras maneiras." ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "A probabilidade de ganhar o prêmio é estimada por 0.66539\n" ] } ], "source": [ "n = 100000 # número de sorteios (modifique se quiser)\n", "p = st.randint.rvs(1, 4, size=n) # sorteio da porta que contém o prêmio\n", "x = st.randint.rvs(1, 4, size=n) # escolha inicial do participante\n", "ganhou = x != p # vetor Booleano armazenando o resultado do desafio\n", "prob_ganhar = sum(ganhou)/n # frequência de ganho\n", "print(\"A probabilidade de ganhar o prêmio é estimada por %.5f\" % prob_ganhar)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Observações\n", "\n", "- Se executarmos a célula acima várias vêzes com o mesmo valor de $n$, obteremos resultados diferentes, mas próximos. Há uma **margem de erro** para o resultado, e veremos adiante como estimá-la.\n", "- A simulação acima parece fácil e é. Podemos aproximar a solução do problema sem pensar muito, deixando o trabalho braçal para o computador. Porém as hipóteses ficam mascaradas" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.9" } }, "nbformat": 4, "nbformat_minor": 2 }