{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Análise Multivariada e Aprendizado Não-Supervisionado\n", "\n", "por Cibele Russo.\n", "\n", "ICMC USP São Carlos.\n", "\n", "## Aula 8b: Análise Fatorial - Aplicação em Python" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Exemplo: percepções de cereais prontos para comer** \n", "(Lattin, James; Carroll, J. Douglas; Green, Paul E. Análise de dados multivariados. São Paulo: Cengage Learning, v. 455, 2011, capítulo 5, página 119, exemplo 5.3.1)\n", " \n", "Como parte de um estudo das impressões do consumidor sobre cereais prontos para comer, patrocinado pela Kellogg da Austrália, Roberts e Lattin (1991) pesquisaram a percepção desses consumidores em relação às suas marcas favoritas de cereais. Solicitou-se a cada respondente que avaliasse suas três marcas preferidas tendo em mente cada um dos 25 atributos. Uma escala de cinco pontos foi utilizada para indicar a extensão de cada atributo em relação a cada marca.\n", "\n", "São apresentados os dados de 12 marcas, com respostas de 116 pessoas em 235 observações.\n", "\n", "**Cereais:**\n", "1. All Bran\n", "2. Cerola Muesli\n", "3. Just right\n", "4. Kellogg's Corn Flakes\n", "5. Komplete\n", "6. NutriGrain\n", "7. Purina Muesli\n", "8. Rice Bubbles\n", "9. Special K\n", "10. Sustain\n", "11. Vitabrit\n", "12. Weetbrix\n", "\n", "**Atributos:**\n", "- Satisfaz\n", "- Natural\n", "- Fibra\n", "- Doce\n", "- Fácil\n", "- Sal\n", "- Gratificante\n", "- Energia\n", "- Divertido\n", "- Crianças\n", "- Encharcado\n", "- Econômico\n", "- Saúde\n", "- Família\n", "- Calorias\n", "- Simples\n", "- Crocante\n", "- Regular\n", "- Açúcar\n", "- Fruta\n", "- Processo\n", "- Qualidade\n", "- Prazer\n", "- Chato\n", "- Nutritivo" ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "import numpy as np\n", "import matplotlib.pyplot as plt\n", "%matplotlib inline\n", "\n", "from sklearn.datasets import load_digits\n", "from sklearn.decomposition import FactorAnalysis\n", "\n", "\n" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "#! pip install factor_analyzer==0.3.2\n", "\n", "# Fonte: https://pypi.org/project/factor-analyzer/\n", "# Ver https://www.datacamp.com/community/tutorials/introduction-factor-analysis\n", "\n", "from factor_analyzer import FactorAnalyzer\n" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Name: factor-analyzer\r\n", "Version: 0.3.2\r\n", "Summary: A Factor Analysis class\r\n", "Home-page: https://github.com/EducationalTestingService/factor_analyzer\r\n", "Author: Jeremy Biggs\r\n", "Author-email: jbiggs@ets.org\r\n", "License: UNKNOWN\r\n", "Location: /home/cibele/anaconda3/lib/python3.7/site-packages\r\n", "Requires: scipy, numpy, scikit-learn, pandas\r\n", "Required-by: \r\n" ] } ], "source": [ "!pip show factor_analyzer" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Col1Col2Col3Col4Col5Col6Col7Col8Col9Col10...Col18Col19Col20Col21Col22Col23Col24Col25Col26Col27
01012555512154...3141135115
11012112215251...5512152113
21032154555355...1543125415
3103355535255...1142525515
41041445325254...1531135514
\n", "

5 rows × 27 columns

\n", "
" ], "text/plain": [ " Col1 Col2 Col3 Col4 Col5 Col6 Col7 Col8 Col9 Col10 ... Col18 \\\n", "0 101 25 5 5 5 1 2 1 5 4 ... 3 \n", "1 101 21 1 2 2 1 5 2 5 1 ... 5 \n", "2 103 21 5 4 5 5 5 3 5 5 ... 1 \n", "3 103 3 5 5 5 3 5 2 5 5 ... 1 \n", "4 104 14 4 5 3 2 5 2 5 4 ... 1 \n", "\n", " Col19 Col20 Col21 Col22 Col23 Col24 Col25 Col26 Col27 \n", "0 1 4 1 1 3 5 1 1 5 \n", "1 5 1 2 1 5 2 1 1 3 \n", "2 5 4 3 1 2 5 4 1 5 \n", "3 1 4 2 5 2 5 5 1 5 \n", "4 5 3 1 1 3 5 5 1 4 \n", "\n", "[5 rows x 27 columns]" ] }, "execution_count": 4, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df = pd.read_csv(\"/home/cibele/CibelePython/AMANS/Aula 8/rte_cereal.csv\")\n", "df.head()" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [], "source": [ "df = df.rename(columns={ 'Col1':'Voluntário', 'Col2': 'Cereal'})" ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
VoluntárioCerealCol3Col4Col5Col6Col7Col8Col9Col10...Col18Col19Col20Col21Col22Col23Col24Col25Col26Col27
01012555512154...3141135115
11012112215251...5512152113
21032154555355...1543125415
3103355535255...1142525515
41041445325254...1531135514
\n", "

5 rows × 27 columns

\n", "
" ], "text/plain": [ " Voluntário Cereal Col3 Col4 Col5 Col6 Col7 Col8 Col9 Col10 ... \\\n", "0 101 25 5 5 5 1 2 1 5 4 ... \n", "1 101 21 1 2 2 1 5 2 5 1 ... \n", "2 103 21 5 4 5 5 5 3 5 5 ... \n", "3 103 3 5 5 5 3 5 2 5 5 ... \n", "4 104 14 4 5 3 2 5 2 5 4 ... \n", "\n", " Col18 Col19 Col20 Col21 Col22 Col23 Col24 Col25 Col26 Col27 \n", "0 3 1 4 1 1 3 5 1 1 5 \n", "1 5 5 1 2 1 5 2 1 1 3 \n", "2 1 5 4 3 1 2 5 4 1 5 \n", "3 1 1 4 2 5 2 5 5 1 5 \n", "4 1 5 3 1 1 3 5 5 1 4 \n", "\n", "[5 rows x 27 columns]" ] }, "execution_count": 6, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.head()" ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [], "source": [ "df['Cereal'] = pd.Categorical(df['Cereal']) \n", "df['Voluntário'] = pd.Categorical(df['Voluntário']) " ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
col_0count
Cereal
115
313
1316
1427
1514
1624
1718
1921
2123
2312
2425
2527
\n", "
" ], "text/plain": [ "col_0 count\n", "Cereal \n", "1 15\n", "3 13\n", "13 16\n", "14 27\n", "15 14\n", "16 24\n", "17 18\n", "19 21\n", "21 23\n", "23 12\n", "24 25\n", "25 27" ] }, "execution_count": 8, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pd.crosstab(index=df['Cereal'], columns='count') " ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
col_0count
Voluntário
1012
1032
1043
1053
1062
......
6352
6363
6372
6382
6392
\n", "

116 rows × 1 columns

\n", "
" ], "text/plain": [ "col_0 count\n", "Voluntário \n", "101 2\n", "103 2\n", "104 3\n", "105 3\n", "106 2\n", "... ...\n", "635 2\n", "636 3\n", "637 2\n", "638 2\n", "639 2\n", "\n", "[116 rows x 1 columns]" ] }, "execution_count": 9, "metadata": {}, "output_type": "execute_result" } ], "source": [ "pd.crosstab(index=df['Voluntário'], columns='count') " ] }, { "cell_type": "code", "execution_count": 10, "metadata": {}, "outputs": [], "source": [ "df = df.rename(columns={\n", "'Col3': 'Satisfaz',\n", "'Col4': 'Natural',\n", "'Col5': 'Fibra',\n", "'Col6': 'Doce',\n", "'Col7': 'Fácil',\n", "'Col8': 'Sal',\n", "'Col9': 'Gratificante',\n", "'Col10': 'Energia',\n", "'Col11': 'Divertido',\n", "'Col12': 'Crianças',\n", "'Col13': 'Encharcado',\n", "'Col14': 'Econômico',\n", "'Col15': 'Saúde',\n", "'Col16': 'Família',\n", "'Col17': 'Calorias',\n", "'Col18': 'Simples',\n", "'Col19': 'Crocante',\n", "'Col20': 'Regular',\n", "'Col21': 'Açúcar',\n", "'Col22': 'Fruta',\n", "'Col23': 'Processo',\n", "'Col24': 'Qualidade',\n", "'Col25': 'Prazer',\n", "'Col26': 'Chato',\n", "'Col27': 'Nutritivo'})" ] }, { "cell_type": "code", "execution_count": 11, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
VoluntárioCerealSatisfazNaturalFibraDoceFácilSalGratificanteEnergia...SimplesCrocanteRegularAçúcarFrutaProcessoQualidadePrazerChatoNutritivo
01012555512154...3141135115
11012112215251...5512152113
21032154555355...1543125415
3103355535255...1142525515
41041445325254...1531135514
\n", "

5 rows × 27 columns

\n", "
" ], "text/plain": [ " Voluntário Cereal Satisfaz Natural Fibra Doce Fácil Sal Gratificante \\\n", "0 101 25 5 5 5 1 2 1 5 \n", "1 101 21 1 2 2 1 5 2 5 \n", "2 103 21 5 4 5 5 5 3 5 \n", "3 103 3 5 5 5 3 5 2 5 \n", "4 104 14 4 5 3 2 5 2 5 \n", "\n", " Energia ... Simples Crocante Regular Açúcar Fruta Processo \\\n", "0 4 ... 3 1 4 1 1 3 \n", "1 1 ... 5 5 1 2 1 5 \n", "2 5 ... 1 5 4 3 1 2 \n", "3 5 ... 1 1 4 2 5 2 \n", "4 4 ... 1 5 3 1 1 3 \n", "\n", " Qualidade Prazer Chato Nutritivo \n", "0 5 1 1 5 \n", "1 2 1 1 3 \n", "2 5 4 1 5 \n", "3 5 5 1 5 \n", "4 5 5 1 4 \n", "\n", "[5 rows x 27 columns]" ] }, "execution_count": 11, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.head()" ] }, { "cell_type": "code", "execution_count": 12, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
SatisfazNaturalFibraDoceFácilSalGratificanteEnergiaDivertidoCrianças...SimplesCrocanteRegularAçúcarFrutaProcessoQualidadePrazerChatoNutritivo
05551215414...3141135115
11221525115...5512152113
25455535555...1543125415
35553525555...1142525515
44532525455...1531135514
..................................................................
2303441423324...4341134224
2315443434444...1443424414
2324441414434...3341123324
2333333423323...3232133223
2344441414324...2241124234
\n", "

235 rows × 25 columns

\n", "
" ], "text/plain": [ " Satisfaz Natural Fibra Doce Fácil Sal Gratificante Energia \\\n", "0 5 5 5 1 2 1 5 4 \n", "1 1 2 2 1 5 2 5 1 \n", "2 5 4 5 5 5 3 5 5 \n", "3 5 5 5 3 5 2 5 5 \n", "4 4 5 3 2 5 2 5 4 \n", ".. ... ... ... ... ... ... ... ... \n", "230 3 4 4 1 4 2 3 3 \n", "231 5 4 4 3 4 3 4 4 \n", "232 4 4 4 1 4 1 4 4 \n", "233 3 3 3 3 4 2 3 3 \n", "234 4 4 4 1 4 1 4 3 \n", "\n", " Divertido Crianças ... Simples Crocante Regular Açúcar Fruta \\\n", "0 1 4 ... 3 1 4 1 1 \n", "1 1 5 ... 5 5 1 2 1 \n", "2 5 5 ... 1 5 4 3 1 \n", "3 5 5 ... 1 1 4 2 5 \n", "4 5 5 ... 1 5 3 1 1 \n", ".. ... ... ... ... ... ... ... ... \n", "230 2 4 ... 4 3 4 1 1 \n", "231 4 4 ... 1 4 4 3 4 \n", "232 3 4 ... 3 3 4 1 1 \n", "233 2 3 ... 3 2 3 2 1 \n", "234 2 4 ... 2 2 4 1 1 \n", "\n", " Processo Qualidade Prazer Chato Nutritivo \n", "0 3 5 1 1 5 \n", "1 5 2 1 1 3 \n", "2 2 5 4 1 5 \n", "3 2 5 5 1 5 \n", "4 3 5 5 1 4 \n", ".. ... ... ... ... ... \n", "230 3 4 2 2 4 \n", "231 2 4 4 1 4 \n", "232 2 3 3 2 4 \n", "233 3 3 2 2 3 \n", "234 2 4 2 3 4 \n", "\n", "[235 rows x 25 columns]" ] }, "execution_count": 12, "metadata": {}, "output_type": "execute_result" } ], "source": [ "X = df.iloc[:, 2:27]\n", "X" ] }, { "cell_type": "code", "execution_count": 13, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([6.5044682 , 3.8210452 , 2.50199528, 1.68399409, 1.08535397,\n", " 0.93300686, 0.8516405 , 0.78683657, 0.73171687, 0.69585069,\n", " 0.6468294 , 0.54795846, 0.52915688, 0.48962363, 0.41774279,\n", " 0.38707401, 0.362461 , 0.35882947, 0.30475407, 0.27419206,\n", " 0.26244808, 0.24227943, 0.2179754 , 0.19853087, 0.16423623])" ] }, "execution_count": 13, "metadata": {}, "output_type": "execute_result" } ], "source": [ "# Create factor analysis object and perform factor analysis\n", "\n", "fa = FactorAnalyzer(n_factors=25, rotation='varimax')\n", "fa.fit(X)\n", "\n", "# Check Eigenvalues\n", "ev, v = fa.get_eigenvalues()\n", "ev" ] }, { "cell_type": "code", "execution_count": 14, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": { "needs_background": "light" }, "output_type": "display_data" } ], "source": [ "# Create scree plot using matplotlib\n", "\n", "plt.figure(figsize=(20,10))\n", "plt.scatter(range(1,X.shape[1]+1),ev)\n", "plt.plot(range(1,X.shape[1]+1),ev)\n", "plt.title('Scree Plot')\n", "plt.xlabel('Factors')\n", "plt.ylabel('Eigenvalue')\n", "\n", "plt.grid()\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Vamos considerar 4 fatores para a Análise Fatorial!" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Análise Fatorial com fatores não rotacionados**" ] }, { "cell_type": "code", "execution_count": 15, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "FactorAnalyzer(n_factors=4, rotation=None, rotation_kwargs={})" ] }, "execution_count": 15, "metadata": {}, "output_type": "execute_result" } ], "source": [ "fa = FactorAnalyzer(n_factors=4, rotation=None)\n", "fa.fit(X)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Matriz L de cargas fatoriais estimada**" ] }, { "cell_type": "code", "execution_count": 16, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[ 0.72, 0.1 , -0.07, 0.18],\n", " [ 0.73, -0.24, -0.11, 0.11],\n", " [ 0.72, -0.24, -0.31, 0.17],\n", " [ 0.08, 0.74, -0.21, 0.15],\n", " [ 0.32, 0.14, 0.2 , 0.11],\n", " [-0.21, 0.51, -0.14, 0.41],\n", " [ 0.72, 0.18, 0.16, 0.17],\n", " [ 0.7 , 0.13, -0.07, 0.12],\n", " [ 0.39, 0.49, 0.21, -0.16],\n", " [ 0.22, 0.28, 0.76, 0.12],\n", " [-0.1 , -0.23, 0.15, 0.4 ],\n", " [ 0.15, -0.23, 0.47, 0.1 ],\n", " [ 0.81, -0.31, -0.11, 0.08],\n", " [ 0.31, 0.22, 0.67, 0.03],\n", " [-0.16, 0.57, -0.17, 0.21],\n", " [-0.31, -0.36, 0.22, 0.43],\n", " [ 0.29, 0.45, 0.21, -0.18],\n", " [ 0.58, -0.13, -0.18, 0.07],\n", " [-0.25, 0.74, -0.25, 0.25],\n", " [ 0.37, 0.25, -0.47, -0.15],\n", " [-0.3 , 0.27, 0. , 0.23],\n", " [ 0.73, -0.14, 0.05, -0.03],\n", " [ 0.47, 0.57, 0.07, -0.21],\n", " [-0.38, -0.26, -0.1 , 0.34],\n", " [ 0.8 , -0.22, -0.15, 0.13]])" ] }, "execution_count": 16, "metadata": {}, "output_type": "execute_result" } ], "source": [ "L = fa.loadings_\n", "np.round(L,2)" ] }, { "cell_type": "code", "execution_count": 17, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(array([6.08645101, 3.36420207, 2.05504928, 1.11555393]),\n", " array([0.24345804, 0.13456808, 0.08220197, 0.04462216]),\n", " array([0.24345804, 0.37802612, 0.46022809, 0.50485025]))" ] }, "execution_count": 17, "metadata": {}, "output_type": "execute_result" } ], "source": [ "fa.get_factor_variance()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Análise Fatorial com fatores rotacionados (varimax, testar outras)**" ] }, { "cell_type": "code", "execution_count": 18, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "FactorAnalyzer(n_factors=4, rotation='varimax', rotation_kwargs={})" ] }, "execution_count": 18, "metadata": {}, "output_type": "execute_result" } ], "source": [ "fa = FactorAnalyzer(n_factors=4, rotation='varimax')\n", "fa.fit(X)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Matriz L de cargas fatoriais estimada**" ] }, { "cell_type": "code", "execution_count": 19, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
FA1FA2FA3FA4
Satisfaz0.7059260.0881670.1982220.152237
Natural0.752800-0.2089110.0547400.036777
Fibra0.821203-0.116397-0.1208590.020583
Doce0.0689460.7017900.0719680.347628
Fácil0.2385640.0635760.3245550.065804
Sal-0.0918260.6856170.015718-0.083106
Gratificante0.6258960.0769870.4224150.172316
Energia0.6596840.0782100.1912430.210825
Divertido0.1634790.1765780.4150160.480073
Crianças-0.0243220.0350500.8507810.013842
Encharcado0.0331800.0146510.096186-0.480159
Econômico0.068874-0.2802650.416057-0.227187
Saúde0.828531-0.2882740.0511200.046116
Família0.062455-0.0545320.7606290.093225
Calorias-0.1136440.626649-0.0083720.120616
Simples-0.146444-0.0616500.071122-0.656386
Crocante0.0739320.1459850.3709880.437885
Regular0.613091-0.100074-0.0279490.088827
Açúcar-0.1838490.816649-0.0537630.165341
Fruta0.3761500.186503-0.2693750.441862
Processo-0.2360000.3739600.026508-0.125563
Qualidade0.646587-0.2447150.2036170.171207
Prazer0.2448840.2333650.3336320.603503
Chato-0.1647590.066893-0.223157-0.505794
Nutritivo0.831418-0.1769570.0507010.056027
\n", "
" ], "text/plain": [ " FA1 FA2 FA3 FA4\n", "Satisfaz 0.705926 0.088167 0.198222 0.152237\n", "Natural 0.752800 -0.208911 0.054740 0.036777\n", "Fibra 0.821203 -0.116397 -0.120859 0.020583\n", "Doce 0.068946 0.701790 0.071968 0.347628\n", "Fácil 0.238564 0.063576 0.324555 0.065804\n", "Sal -0.091826 0.685617 0.015718 -0.083106\n", "Gratificante 0.625896 0.076987 0.422415 0.172316\n", "Energia 0.659684 0.078210 0.191243 0.210825\n", "Divertido 0.163479 0.176578 0.415016 0.480073\n", "Crianças -0.024322 0.035050 0.850781 0.013842\n", "Encharcado 0.033180 0.014651 0.096186 -0.480159\n", "Econômico 0.068874 -0.280265 0.416057 -0.227187\n", "Saúde 0.828531 -0.288274 0.051120 0.046116\n", "Família 0.062455 -0.054532 0.760629 0.093225\n", "Calorias -0.113644 0.626649 -0.008372 0.120616\n", "Simples -0.146444 -0.061650 0.071122 -0.656386\n", "Crocante 0.073932 0.145985 0.370988 0.437885\n", "Regular 0.613091 -0.100074 -0.027949 0.088827\n", "Açúcar -0.183849 0.816649 -0.053763 0.165341\n", "Fruta 0.376150 0.186503 -0.269375 0.441862\n", "Processo -0.236000 0.373960 0.026508 -0.125563\n", "Qualidade 0.646587 -0.244715 0.203617 0.171207\n", "Prazer 0.244884 0.233365 0.333632 0.603503\n", "Chato -0.164759 0.066893 -0.223157 -0.505794\n", "Nutritivo 0.831418 -0.176957 0.050701 0.056027" ] }, "execution_count": 19, "metadata": {}, "output_type": "execute_result" } ], "source": [ "L = pd.DataFrame(fa.loadings_)\n", "np.round(L,2)\n", "L.index = X.columns\n", "L.columns = ['FA1','FA2','FA3','FA4']\n", "L\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Maiores cargas nos primeiros dois fatores:**\n" ] }, { "cell_type": "code", "execution_count": 20, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
FA1FA2FA3FA4
Nutritivo0.831418-0.1769570.0507010.056027
Saúde0.828531-0.2882740.0511200.046116
Fibra0.821203-0.116397-0.1208590.020583
Natural0.752800-0.2089110.0547400.036777
Satisfaz0.7059260.0881670.1982220.152237
Energia0.6596840.0782100.1912430.210825
Qualidade0.646587-0.2447150.2036170.171207
Gratificante0.6258960.0769870.4224150.172316
Regular0.613091-0.100074-0.0279490.088827
Fruta0.3761500.186503-0.2693750.441862
\n", "
" ], "text/plain": [ " FA1 FA2 FA3 FA4\n", "Nutritivo 0.831418 -0.176957 0.050701 0.056027\n", "Saúde 0.828531 -0.288274 0.051120 0.046116\n", "Fibra 0.821203 -0.116397 -0.120859 0.020583\n", "Natural 0.752800 -0.208911 0.054740 0.036777\n", "Satisfaz 0.705926 0.088167 0.198222 0.152237\n", "Energia 0.659684 0.078210 0.191243 0.210825\n", "Qualidade 0.646587 -0.244715 0.203617 0.171207\n", "Gratificante 0.625896 0.076987 0.422415 0.172316\n", "Regular 0.613091 -0.100074 -0.027949 0.088827\n", "Fruta 0.376150 0.186503 -0.269375 0.441862" ] }, "execution_count": 20, "metadata": {}, "output_type": "execute_result" } ], "source": [ "L.sort_values(by='FA1',ascending=False).head(10)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "np.round(fa.get_communalities(),2)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Sugestão de denominação do primeiro fator: **Saudável**" ] }, { "cell_type": "code", "execution_count": 21, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
FA1FA2FA3FA4
Açúcar-0.1838490.816649-0.0537630.165341
Doce0.0689460.7017900.0719680.347628
Sal-0.0918260.6856170.015718-0.083106
Calorias-0.1136440.626649-0.0083720.120616
Processo-0.2360000.3739600.026508-0.125563
Prazer0.2448840.2333650.3336320.603503
Fruta0.3761500.186503-0.2693750.441862
Divertido0.1634790.1765780.4150160.480073
Crocante0.0739320.1459850.3709880.437885
Satisfaz0.7059260.0881670.1982220.152237
\n", "
" ], "text/plain": [ " FA1 FA2 FA3 FA4\n", "Açúcar -0.183849 0.816649 -0.053763 0.165341\n", "Doce 0.068946 0.701790 0.071968 0.347628\n", "Sal -0.091826 0.685617 0.015718 -0.083106\n", "Calorias -0.113644 0.626649 -0.008372 0.120616\n", "Processo -0.236000 0.373960 0.026508 -0.125563\n", "Prazer 0.244884 0.233365 0.333632 0.603503\n", "Fruta 0.376150 0.186503 -0.269375 0.441862\n", "Divertido 0.163479 0.176578 0.415016 0.480073\n", "Crocante 0.073932 0.145985 0.370988 0.437885\n", "Satisfaz 0.705926 0.088167 0.198222 0.152237" ] }, "execution_count": 21, "metadata": {}, "output_type": "execute_result" } ], "source": [ "L.sort_values(by='FA2',ascending=False).head(10)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Sugestões de denominação do segundo fator: **Artificial** ou **Não-saudável**" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Exercício: Analise o terceiro e quarto fator e sugira nomes a eles**" ] }, { "cell_type": "code", "execution_count": 22, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
FA1FA2FA3FA4
Crianças-0.0243220.0350500.8507810.013842
Família0.062455-0.0545320.7606290.093225
Gratificante0.6258960.0769870.4224150.172316
Econômico0.068874-0.2802650.416057-0.227187
Divertido0.1634790.1765780.4150160.480073
Crocante0.0739320.1459850.3709880.437885
Prazer0.2448840.2333650.3336320.603503
Fácil0.2385640.0635760.3245550.065804
Qualidade0.646587-0.2447150.2036170.171207
Satisfaz0.7059260.0881670.1982220.152237
\n", "
" ], "text/plain": [ " FA1 FA2 FA3 FA4\n", "Crianças -0.024322 0.035050 0.850781 0.013842\n", "Família 0.062455 -0.054532 0.760629 0.093225\n", "Gratificante 0.625896 0.076987 0.422415 0.172316\n", "Econômico 0.068874 -0.280265 0.416057 -0.227187\n", "Divertido 0.163479 0.176578 0.415016 0.480073\n", "Crocante 0.073932 0.145985 0.370988 0.437885\n", "Prazer 0.244884 0.233365 0.333632 0.603503\n", "Fácil 0.238564 0.063576 0.324555 0.065804\n", "Qualidade 0.646587 -0.244715 0.203617 0.171207\n", "Satisfaz 0.705926 0.088167 0.198222 0.152237" ] }, "execution_count": 22, "metadata": {}, "output_type": "execute_result" } ], "source": [ "L.sort_values(by='FA3',ascending=False).head(10)" ] }, { "cell_type": "code", "execution_count": 23, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
FA1FA2FA3FA4
Prazer0.2448840.2333650.3336320.603503
Divertido0.1634790.1765780.4150160.480073
Fruta0.3761500.186503-0.2693750.441862
Crocante0.0739320.1459850.3709880.437885
Doce0.0689460.7017900.0719680.347628
Energia0.6596840.0782100.1912430.210825
Gratificante0.6258960.0769870.4224150.172316
Qualidade0.646587-0.2447150.2036170.171207
Açúcar-0.1838490.816649-0.0537630.165341
Satisfaz0.7059260.0881670.1982220.152237
\n", "
" ], "text/plain": [ " FA1 FA2 FA3 FA4\n", "Prazer 0.244884 0.233365 0.333632 0.603503\n", "Divertido 0.163479 0.176578 0.415016 0.480073\n", "Fruta 0.376150 0.186503 -0.269375 0.441862\n", "Crocante 0.073932 0.145985 0.370988 0.437885\n", "Doce 0.068946 0.701790 0.071968 0.347628\n", "Energia 0.659684 0.078210 0.191243 0.210825\n", "Gratificante 0.625896 0.076987 0.422415 0.172316\n", "Qualidade 0.646587 -0.244715 0.203617 0.171207\n", "Açúcar -0.183849 0.816649 -0.053763 0.165341\n", "Satisfaz 0.705926 0.088167 0.198222 0.152237" ] }, "execution_count": 23, "metadata": {}, "output_type": "execute_result" } ], "source": [ "L.sort_values(by='FA4',ascending=False).head(10)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Variância explicada por cada fator**" ] }, { "cell_type": "code", "execution_count": 24, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "(array([5.20310472, 2.66037191, 2.46709534, 2.29068431]),\n", " array([0.20812419, 0.10641488, 0.09868381, 0.09162737]),\n", " array([0.20812419, 0.31453907, 0.41322288, 0.50485025]))" ] }, "execution_count": 24, "metadata": {}, "output_type": "execute_result" } ], "source": [ "fa.get_factor_variance()" ] }, { "cell_type": "code", "execution_count": 25, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "14.566842922737894" ] }, "execution_count": 25, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.sum(fa.get_factor_variance())" ] }, { "cell_type": "code", "execution_count": 26, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0.35718822, 0.18263202, 0.16936376, 0.15725331],\n", " [0.01428753, 0.00730528, 0.00677455, 0.00629013],\n", " [0.01428753, 0.02159281, 0.02836736, 0.03465749]])" ] }, "execution_count": 26, "metadata": {}, "output_type": "execute_result" } ], "source": [ "fa.get_factor_variance()/np.sum(fa.get_factor_variance())" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "**Variância percentual explicada por cada fator**" ] }, { "cell_type": "code", "execution_count": 27, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "array([[0.36, 0.18, 0.17, 0.16],\n", " [0.01, 0.01, 0.01, 0.01],\n", " [0.01, 0.02, 0.03, 0.03]])" ] }, "execution_count": 27, "metadata": {}, "output_type": "execute_result" } ], "source": [ "np.round(fa.get_factor_variance()/np.sum(fa.get_factor_variance()),2)" ] }, { "cell_type": "code", "execution_count": 28, "metadata": {}, "outputs": [], "source": [ "df[['Fator1','Fator2','Fator3','Fator4']] = np.array(fa.fit_transform(X))[:, 0:4]" ] }, { "cell_type": "code", "execution_count": 29, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
VoluntárioCerealSatisfazNaturalFibraDoceFácilSalGratificanteEnergia...FrutaProcessoQualidadePrazerChatoNutritivoFator1Fator2Fator3Fator4
01012555512154...1351151.511203-1.2278160.205665-1.623202
11012112215251...152113-2.071909-0.5884711.374526-1.162636
21032154555355...1254151.4730210.8127841.0887640.696806
3103355535255...5255151.647908-0.0570110.5036271.035769
41041445325254...1355140.414373-0.7980181.1620821.180994
..................................................................
2306372534414233...134224-0.049875-0.8520490.007291-1.038142
2316381754434344...4244140.5429710.801985-0.1845931.278528
2326382544414144...1233240.187454-0.898705-0.030857-0.212396
2336392133334233...133223-0.619609-0.234930-0.743400-0.332749
2346392544414143...1242340.165715-1.207375-0.043000-0.644129
\n", "

235 rows × 31 columns

\n", "
" ], "text/plain": [ " Voluntário Cereal Satisfaz Natural Fibra Doce Fácil Sal \\\n", "0 101 25 5 5 5 1 2 1 \n", "1 101 21 1 2 2 1 5 2 \n", "2 103 21 5 4 5 5 5 3 \n", "3 103 3 5 5 5 3 5 2 \n", "4 104 14 4 5 3 2 5 2 \n", ".. ... ... ... ... ... ... ... ... \n", "230 637 25 3 4 4 1 4 2 \n", "231 638 17 5 4 4 3 4 3 \n", "232 638 25 4 4 4 1 4 1 \n", "233 639 21 3 3 3 3 4 2 \n", "234 639 25 4 4 4 1 4 1 \n", "\n", " Gratificante Energia ... Fruta Processo Qualidade Prazer Chato \\\n", "0 5 4 ... 1 3 5 1 1 \n", "1 5 1 ... 1 5 2 1 1 \n", "2 5 5 ... 1 2 5 4 1 \n", "3 5 5 ... 5 2 5 5 1 \n", "4 5 4 ... 1 3 5 5 1 \n", ".. ... ... ... ... ... ... ... ... \n", "230 3 3 ... 1 3 4 2 2 \n", "231 4 4 ... 4 2 4 4 1 \n", "232 4 4 ... 1 2 3 3 2 \n", "233 3 3 ... 1 3 3 2 2 \n", "234 4 3 ... 1 2 4 2 3 \n", "\n", " Nutritivo Fator1 Fator2 Fator3 Fator4 \n", "0 5 1.511203 -1.227816 0.205665 -1.623202 \n", "1 3 -2.071909 -0.588471 1.374526 -1.162636 \n", "2 5 1.473021 0.812784 1.088764 0.696806 \n", "3 5 1.647908 -0.057011 0.503627 1.035769 \n", "4 4 0.414373 -0.798018 1.162082 1.180994 \n", ".. ... ... ... ... ... \n", "230 4 -0.049875 -0.852049 0.007291 -1.038142 \n", "231 4 0.542971 0.801985 -0.184593 1.278528 \n", "232 4 0.187454 -0.898705 -0.030857 -0.212396 \n", "233 3 -0.619609 -0.234930 -0.743400 -0.332749 \n", "234 4 0.165715 -1.207375 -0.043000 -0.644129 \n", "\n", "[235 rows x 31 columns]" ] }, "execution_count": 29, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df" ] }, { "cell_type": "code", "execution_count": 41, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
VoluntárioCerealSatisfazNaturalFibraDoceFácilSalGratificanteEnergia...FrutaProcessoQualidadePrazerChatoNutritivoFator1Fator2Fator3Fator4
401212355555355...4445151.8007091.7729160.5948750.946000
1585092455545455...1331151.7856280.970817-0.017714-1.697611
31116154515255...1352451.701156-0.150973-1.156637-0.790033
782142455524155...1553351.667463-0.2668920.957614-1.141936
3103355535255...5255151.647908-0.0570110.5036271.035769
\n", "

5 rows × 31 columns

\n", "
" ], "text/plain": [ " Voluntário Cereal Satisfaz Natural Fibra Doce Fácil Sal \\\n", "40 121 23 5 5 5 5 5 3 \n", "158 509 24 5 5 5 4 5 4 \n", "31 116 1 5 4 5 1 5 2 \n", "78 214 24 5 5 5 2 4 1 \n", "3 103 3 5 5 5 3 5 2 \n", "\n", " Gratificante Energia ... Fruta Processo Qualidade Prazer Chato \\\n", "40 5 5 ... 4 4 4 5 1 \n", "158 5 5 ... 1 3 3 1 1 \n", "31 5 5 ... 1 3 5 2 4 \n", "78 5 5 ... 1 5 5 3 3 \n", "3 5 5 ... 5 2 5 5 1 \n", "\n", " Nutritivo Fator1 Fator2 Fator3 Fator4 \n", "40 5 1.800709 1.772916 0.594875 0.946000 \n", "158 5 1.785628 0.970817 -0.017714 -1.697611 \n", "31 5 1.701156 -0.150973 -1.156637 -0.790033 \n", "78 5 1.667463 -0.266892 0.957614 -1.141936 \n", "3 5 1.647908 -0.057011 0.503627 1.035769 \n", "\n", "[5 rows x 31 columns]" ] }, "execution_count": 41, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.sort_values(by='Fator1',ascending=False).head()" ] }, { "cell_type": "code", "execution_count": 42, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
VoluntárioCerealSatisfazNaturalFibraDoceFácilSalGratificanteEnergia...FrutaProcessoQualidadePrazerChatoNutritivoFator1Fator2Fator3Fator4
842161631253434...151151-2.0047803.232060-1.070181-1.209752
191101734345453...3543130.1064732.658713-1.6628840.032212
12107344455444...3323230.0147552.311869-0.1175370.073186
2026231642254243...152421-1.8081492.1306140.9546890.653752
131071744455344...332323-0.0994132.0654210.2479170.163003
\n", "

5 rows × 31 columns

\n", "
" ], "text/plain": [ " Voluntário Cereal Satisfaz Natural Fibra Doce Fácil Sal \\\n", "84 216 16 3 1 2 5 3 4 \n", "19 110 17 3 4 3 4 5 4 \n", "12 107 3 4 4 4 5 5 4 \n", "202 623 16 4 2 2 5 4 2 \n", "13 107 17 4 4 4 5 5 3 \n", "\n", " Gratificante Energia ... Fruta Processo Qualidade Prazer Chato \\\n", "84 3 4 ... 1 5 1 1 5 \n", "19 5 3 ... 3 5 4 3 1 \n", "12 4 4 ... 3 3 2 3 2 \n", "202 4 3 ... 1 5 2 4 2 \n", "13 4 4 ... 3 3 2 3 2 \n", "\n", " Nutritivo Fator1 Fator2 Fator3 Fator4 \n", "84 1 -2.004780 3.232060 -1.070181 -1.209752 \n", "19 3 0.106473 2.658713 -1.662884 0.032212 \n", "12 3 0.014755 2.311869 -0.117537 0.073186 \n", "202 1 -1.808149 2.130614 0.954689 0.653752 \n", "13 3 -0.099413 2.065421 0.247917 0.163003 \n", "\n", "[5 rows x 31 columns]" ] }, "execution_count": 42, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.sort_values(by='Fator2',ascending=False).head()" ] }, { "cell_type": "code", "execution_count": 36, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
VoluntárioCerealSatisfazNaturalFibraDoceFácilSalGratificanteEnergia...FrutaProcessoQualidadePrazerChatoNutritivoFator1Fator2Fator3Fator4
141081444346464...2656240.4573862.0338672.3958620.620719
672081653335155...1355150.224355-0.9718511.6039501.525069
862171654345355...1455140.1420011.1391361.5723001.188624
61042144325155...1355140.343484-0.6135761.5686271.362000
161091932135242...114411-2.247778-0.4295221.5286480.937863
1646011453455354...1255140.4742181.1607961.5199260.706265
321161454325255...1455130.0914260.4286341.5186921.290257
51041944425254...1355140.232809-0.2980891.4293011.187791
11012112215251...152113-2.071909-0.5884711.374526-1.162636
1545071654415355...1435140.4426960.4333201.3465960.288051
391211445235253...133313-0.0543820.6959681.272317-1.409241
71052143325154...124213-0.377005-1.0607111.2461730.384114
91051443325154...124213-0.377005-1.0607111.2461730.384114
81051943325154...124213-0.377005-1.0607111.2461730.384114
1505051943335244...134414-0.4506160.4604111.2394920.627744
\n", "

15 rows × 31 columns

\n", "
" ], "text/plain": [ " Voluntário Cereal Satisfaz Natural Fibra Doce Fácil Sal \\\n", "14 108 14 4 4 3 4 6 4 \n", "67 208 16 5 3 3 3 5 1 \n", "86 217 16 5 4 3 4 5 3 \n", "6 104 21 4 4 3 2 5 1 \n", "16 109 19 3 2 1 3 5 2 \n", "164 601 14 5 3 4 5 5 3 \n", "32 116 14 5 4 3 2 5 2 \n", "5 104 19 4 4 4 2 5 2 \n", "1 101 21 1 2 2 1 5 2 \n", "154 507 16 5 4 4 1 5 3 \n", "39 121 14 4 5 2 3 5 2 \n", "7 105 21 4 3 3 2 5 1 \n", "9 105 14 4 3 3 2 5 1 \n", "8 105 19 4 3 3 2 5 1 \n", "150 505 19 4 3 3 3 5 2 \n", "\n", " Gratificante Energia ... Fruta Processo Qualidade Prazer Chato \\\n", "14 6 4 ... 2 6 5 6 2 \n", "67 5 5 ... 1 3 5 5 1 \n", "86 5 5 ... 1 4 5 5 1 \n", "6 5 5 ... 1 3 5 5 1 \n", "16 4 2 ... 1 1 4 4 1 \n", "164 5 4 ... 1 2 5 5 1 \n", "32 5 5 ... 1 4 5 5 1 \n", "5 5 4 ... 1 3 5 5 1 \n", "1 5 1 ... 1 5 2 1 1 \n", "154 5 5 ... 1 4 3 5 1 \n", "39 5 3 ... 1 3 3 3 1 \n", "7 5 4 ... 1 2 4 2 1 \n", "9 5 4 ... 1 2 4 2 1 \n", "8 5 4 ... 1 2 4 2 1 \n", "150 4 4 ... 1 3 4 4 1 \n", "\n", " Nutritivo Fator1 Fator2 Fator3 Fator4 \n", "14 4 0.457386 2.033867 2.395862 0.620719 \n", "67 5 0.224355 -0.971851 1.603950 1.525069 \n", "86 4 0.142001 1.139136 1.572300 1.188624 \n", "6 4 0.343484 -0.613576 1.568627 1.362000 \n", "16 1 -2.247778 -0.429522 1.528648 0.937863 \n", "164 4 0.474218 1.160796 1.519926 0.706265 \n", "32 3 0.091426 0.428634 1.518692 1.290257 \n", "5 4 0.232809 -0.298089 1.429301 1.187791 \n", "1 3 -2.071909 -0.588471 1.374526 -1.162636 \n", "154 4 0.442696 0.433320 1.346596 0.288051 \n", "39 3 -0.054382 0.695968 1.272317 -1.409241 \n", "7 3 -0.377005 -1.060711 1.246173 0.384114 \n", "9 3 -0.377005 -1.060711 1.246173 0.384114 \n", "8 3 -0.377005 -1.060711 1.246173 0.384114 \n", "150 4 -0.450616 0.460411 1.239492 0.627744 \n", "\n", "[15 rows x 31 columns]" ] }, "execution_count": 36, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df.sort_values(by='Fator3',ascending=False).head(15)" ] }, { "cell_type": "code", "execution_count": 43, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
SatisfazNaturalFibraDoceFácilSalGratificanteEnergiaDivertidoCrianças...FrutaProcessoQualidadePrazerChatoNutritivoFator1Fator2Fator3Fator4
count12.00000012.00000012.00000012.012.00000012.00000012.00000012.00000012.00000012.000000...12.00000012.00000012.00000012.00000012.00000012.00000012.00000012.00000012.00000012.000000
mean4.2500004.1666674.1666672.54.7500001.7500004.4166674.3333333.2500003.333333...3.4166672.5833334.0000003.2500001.3333334.1666670.677950-0.304194-0.3285010.856943
std0.7537780.7177410.5773501.00.6215820.7537780.5149290.4923661.3568011.302678...0.6685580.7929610.6030231.2154310.6513390.3892490.5764990.9186730.8760710.468176
min3.0000003.0000003.0000001.03.0000001.0000004.0000004.0000001.0000001.000000...2.0000001.0000003.0000001.0000001.0000004.000000-0.271603-1.175071-1.690997-0.183898
25%4.0000004.0000004.0000002.05.0000001.0000004.0000004.0000002.0000002.750000...3.0000002.0000004.0000002.7500001.0000004.0000000.379106-0.987525-0.8389360.617901
50%4.0000004.0000004.0000002.05.0000002.0000004.0000004.0000003.0000003.000000...3.5000003.0000004.0000003.0000001.0000004.0000000.563984-0.534336-0.3648810.868307
75%5.0000005.0000004.2500003.05.0000002.0000005.0000005.0000004.2500004.250000...4.0000003.0000004.0000004.0000001.2500004.0000000.967569-0.0335620.2447181.201676
max5.0000005.0000005.0000005.05.0000003.0000005.0000005.0000005.0000005.000000...4.0000004.0000005.0000005.0000003.0000005.0000001.8007091.7729161.1947991.513775
\n", "

8 rows × 29 columns

\n", "
" ], "text/plain": [ " Satisfaz Natural Fibra Doce Fácil Sal \\\n", "count 12.000000 12.000000 12.000000 12.0 12.000000 12.000000 \n", "mean 4.250000 4.166667 4.166667 2.5 4.750000 1.750000 \n", "std 0.753778 0.717741 0.577350 1.0 0.621582 0.753778 \n", "min 3.000000 3.000000 3.000000 1.0 3.000000 1.000000 \n", "25% 4.000000 4.000000 4.000000 2.0 5.000000 1.000000 \n", "50% 4.000000 4.000000 4.000000 2.0 5.000000 2.000000 \n", "75% 5.000000 5.000000 4.250000 3.0 5.000000 2.000000 \n", "max 5.000000 5.000000 5.000000 5.0 5.000000 3.000000 \n", "\n", " Gratificante Energia Divertido Crianças ... Fruta \\\n", "count 12.000000 12.000000 12.000000 12.000000 ... 12.000000 \n", "mean 4.416667 4.333333 3.250000 3.333333 ... 3.416667 \n", "std 0.514929 0.492366 1.356801 1.302678 ... 0.668558 \n", "min 4.000000 4.000000 1.000000 1.000000 ... 2.000000 \n", "25% 4.000000 4.000000 2.000000 2.750000 ... 3.000000 \n", "50% 4.000000 4.000000 3.000000 3.000000 ... 3.500000 \n", "75% 5.000000 5.000000 4.250000 4.250000 ... 4.000000 \n", "max 5.000000 5.000000 5.000000 5.000000 ... 4.000000 \n", "\n", " Processo Qualidade Prazer Chato Nutritivo Fator1 \\\n", "count 12.000000 12.000000 12.000000 12.000000 12.000000 12.000000 \n", "mean 2.583333 4.000000 3.250000 1.333333 4.166667 0.677950 \n", "std 0.792961 0.603023 1.215431 0.651339 0.389249 0.576499 \n", "min 1.000000 3.000000 1.000000 1.000000 4.000000 -0.271603 \n", "25% 2.000000 4.000000 2.750000 1.000000 4.000000 0.379106 \n", "50% 3.000000 4.000000 3.000000 1.000000 4.000000 0.563984 \n", "75% 3.000000 4.000000 4.000000 1.250000 4.000000 0.967569 \n", "max 4.000000 5.000000 5.000000 3.000000 5.000000 1.800709 \n", "\n", " Fator2 Fator3 Fator4 \n", "count 12.000000 12.000000 12.000000 \n", "mean -0.304194 -0.328501 0.856943 \n", "std 0.918673 0.876071 0.468176 \n", "min -1.175071 -1.690997 -0.183898 \n", "25% -0.987525 -0.838936 0.617901 \n", "50% -0.534336 -0.364881 0.868307 \n", "75% -0.033562 0.244718 1.201676 \n", "max 1.772916 1.194799 1.513775 \n", "\n", "[8 rows x 29 columns]" ] }, "execution_count": 43, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df[df['Cereal']==23].describe()" ] }, { "cell_type": "code", "execution_count": 44, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
SatisfazNaturalFibraDoceFácilSalGratificanteEnergiaDivertidoCrianças...FrutaProcessoQualidadePrazerChatoNutritivoFator1Fator2Fator3Fator4
count24.00000024.00000024.00000024.00000024.0000024.00000024.00000024.00000024.00000024.000000...24.00000024.00000024.00000024.00000024.00000024.00000024.00000024.00000024.00000024.000000
mean4.0000003.1666673.0416673.2916674.500002.4166674.0000003.8333333.3750004.583333...1.0833333.3333333.2500003.3333331.7916673.333333-0.4252680.8112220.5478250.288638
std0.8340581.0495001.0417031.1220780.659380.9286110.8846520.9168311.2091140.829702...0.2823301.2394481.2247451.1293191.2150921.1293191.0109200.9581730.7702700.850119
min2.0000001.0000001.0000001.0000003.000001.0000002.0000002.0000001.0000002.000000...1.0000001.0000001.0000001.0000001.0000001.000000-2.255889-0.971851-1.574086-1.339032
25%4.0000002.7500002.0000002.0000004.000002.0000004.0000003.7500003.0000004.750000...1.0000002.0000003.0000003.0000001.0000003.000000-0.9295060.1795580.419480-0.251599
50%4.0000003.0000003.0000003.5000005.000002.0000004.0000004.0000003.0000005.000000...1.0000004.0000003.0000003.5000001.0000003.500000-0.3932240.9718150.7308210.489832
75%4.2500004.0000004.0000004.0000005.000003.0000005.0000004.0000004.0000005.000000...1.0000004.0000004.0000004.0000002.2500004.0000000.3161871.3502220.9558640.965475
max5.0000005.0000005.0000005.0000005.000004.0000005.0000005.0000005.0000005.000000...2.0000005.0000005.0000005.0000005.0000005.0000001.3286983.2320601.6039501.525069
\n", "

8 rows × 29 columns

\n", "
" ], "text/plain": [ " Satisfaz Natural Fibra Doce Fácil Sal \\\n", "count 24.000000 24.000000 24.000000 24.000000 24.00000 24.000000 \n", "mean 4.000000 3.166667 3.041667 3.291667 4.50000 2.416667 \n", "std 0.834058 1.049500 1.041703 1.122078 0.65938 0.928611 \n", "min 2.000000 1.000000 1.000000 1.000000 3.00000 1.000000 \n", "25% 4.000000 2.750000 2.000000 2.000000 4.00000 2.000000 \n", "50% 4.000000 3.000000 3.000000 3.500000 5.00000 2.000000 \n", "75% 4.250000 4.000000 4.000000 4.000000 5.00000 3.000000 \n", "max 5.000000 5.000000 5.000000 5.000000 5.00000 4.000000 \n", "\n", " Gratificante Energia Divertido Crianças ... Fruta \\\n", "count 24.000000 24.000000 24.000000 24.000000 ... 24.000000 \n", "mean 4.000000 3.833333 3.375000 4.583333 ... 1.083333 \n", "std 0.884652 0.916831 1.209114 0.829702 ... 0.282330 \n", "min 2.000000 2.000000 1.000000 2.000000 ... 1.000000 \n", "25% 4.000000 3.750000 3.000000 4.750000 ... 1.000000 \n", "50% 4.000000 4.000000 3.000000 5.000000 ... 1.000000 \n", "75% 5.000000 4.000000 4.000000 5.000000 ... 1.000000 \n", "max 5.000000 5.000000 5.000000 5.000000 ... 2.000000 \n", "\n", " Processo Qualidade Prazer Chato Nutritivo Fator1 \\\n", "count 24.000000 24.000000 24.000000 24.000000 24.000000 24.000000 \n", "mean 3.333333 3.250000 3.333333 1.791667 3.333333 -0.425268 \n", "std 1.239448 1.224745 1.129319 1.215092 1.129319 1.010920 \n", "min 1.000000 1.000000 1.000000 1.000000 1.000000 -2.255889 \n", "25% 2.000000 3.000000 3.000000 1.000000 3.000000 -0.929506 \n", "50% 4.000000 3.000000 3.500000 1.000000 3.500000 -0.393224 \n", "75% 4.000000 4.000000 4.000000 2.250000 4.000000 0.316187 \n", "max 5.000000 5.000000 5.000000 5.000000 5.000000 1.328698 \n", "\n", " Fator2 Fator3 Fator4 \n", "count 24.000000 24.000000 24.000000 \n", "mean 0.811222 0.547825 0.288638 \n", "std 0.958173 0.770270 0.850119 \n", "min -0.971851 -1.574086 -1.339032 \n", "25% 0.179558 0.419480 -0.251599 \n", "50% 0.971815 0.730821 0.489832 \n", "75% 1.350222 0.955864 0.965475 \n", "max 3.232060 1.603950 1.525069 \n", "\n", "[8 rows x 29 columns]" ] }, "execution_count": 44, "metadata": {}, "output_type": "execute_result" } ], "source": [ "df[df['Cereal']==16].describe()" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.7.6" } }, "nbformat": 4, "nbformat_minor": 4 }