set memory 10m // libera 10mb de memoria para stata log using lab4may11.txt, text replace // crea una "bitacora" en texto plano ** MCA 2011 / Javier Aparicio ** Laboratorio 4 mayo 2011 ** ** Exploración de datos de encuestas ** Comandos: generate, recode, label var, tabulate ** Creación y recodificación de variables ** Prueba Chi-cuadrada para tablas de contingencia ** /* Instrucciones: 1. Abran una bitácora y la base MéxicoyelMundo2010público 2. Ejecuten los comandos exploratorios de la sección A de este dofile 3. Reproduzcan los resultados del reporte de la sección B 4. Al final del lab, cierren la bitácora y envíenla por email al profesor como anexo (No importa que tenga errores o que no hayas terminado: es para monitorear hasta donde avanzaste) */ use D:\1MisDOCS\MyM2010publico.dta, clear ** SECCION A** ************** ** Explorando la base: summ desc order pS1 - pS19_2 edad Region // coloca estas variables hasta "arriba" de la lista desc pS1 - Region ** Explorando los aspectos sociodemográficos, una variable a la vez tab pS1 // tabulando una sola variable tab pS4 tab pS3 tab pS5 tab1 pS1 - pS5 // tabulando una serie de vars (por separado) tab p1_1 tab p1_1, nolabel // sin etiquetas de valor tab p1_1, missing // incluyendo la no respuesta (missing values) ** Tablas cruzadas (crosstabs) tab pS4 pS1 // tabla cruzada género vs. partyID tab pS4 pS1, row chi // tabla cruzada con porcentajes de "fila" y prueba chi-cuadrada ** Limpiando y recodificando variables ** La variable de género es (1, 2), hay que hacerla dummy (0, 1) * Con comando generate gen mujer1 = pS1 == 2 // genera 1s cuando pS1 == 2 es verdadero, y 0 cuando falso tab mujer1 ** pero la nueva variable no tiene etiquetas de valores! * Usando comando recode es más fácil: recode pS1 (1 = 0 Hombre) (2 = 1 Mujer), gen(mujer) tab mujer * verificamos que la recodificación fue correcta: tab pS1 mujer ** La variable edad tiene muchos valores: tab pS2 tab edad // edad recodificada "por grupos" ** La variable "años de educación" tiene muchas categorías: summ pS2 * Podemos recodificarla en 4 grupos (y asignar value labels de inmediato): help recode recode pS3 (0/6 = 1 "hasta primaria") (7 8 9 = 2 "algo secundaria") (10/12 = 3 "algo prepa") (13/20 = 4 "algo de uni o mas") (98 99 = .), gen(educ) label var educ "Nivel educación (recode pS3)" tab educ *verificamos que la recodificación fue correcta: tab pS3 educ tab pS3 educ, nolab * Recodificación alternativa: "máximo grado de estudios" recode pS3 (0/5 = 1 "menos de primaria") (6 7 8 = 2 "primaria") (9/11 = 3 "secundaria") (12/14 = 4 "prepa") (15/20 = 5 "univ o más" ) (98 99 = .) , gen(educ2) label var educ2 "Nivel máximo de educación (recode pS3)" tab educ2 tab pS3 educ2 ** SECCION B ** Análisis descriptivo *********************** * Reproducir los resultados para 2010 de la Gráfica 1.7 (pág. 37 del reporte, variable p22) * Reproducir los resultados para 2010 de la Gráfica 1.9 (pág. 41, var p37) * Reproducir los resultados para 2010 de la Gráfica 1.10 (pág. 42, var p39_1 - p39_5) * Al final de tu trabajo en el lab., cierra la bitácora y envíala por email al profesor como anexo * No importa que tenga errores o que no hayas terminado: es para monitorear hasta donde avanzaste log close