Temas Selectos en Métodos Cuantitativos
Primavera 2005

Francisco Javier Aparicio y Guillermo Trejo

Ésta página: http://www.cide.edu/investigadores/aparicio/metodos.html        E-mail:  javier.aparicio@cide.edu / guillermo.trejo@cide.edu

Ésta es la página del curso de métodos cuantitativos en ciencia política,
impartido por Javier Aparicio y Guillermo Trejo en el CIDE.

Aquí encontrarán información relevante sobre el curso, el calendario de lecturas asignadas,
así como comentarios sobre los temas cubiertos en clase y avisos importantes.

Temario / Bibliografía Notas de clase  Datos y Bitácoras Lecturas Asignadas

Temario

Objetivo y motivación

El objetivo de este curso es continuar y profundizar los temas vistos en la materia Métodos Cuantitativos impartida en el sexto semestre de la licenciatura en CP y RI. En particular, nuestro propósito es ampliar tu conocimiento de técnicas para el análisis de variables continuas y categóricas. Lo enteramente nuevo del curso, sin embargo, es que introducimos la dimensión temporal para el análisis estadístico y añadimos el análisis de eventos. El análisis empírico en la ciencia política ha sido tradicionalmente de tipo transversal, es decir, estático; en este curso queremos revisar las técnicas estadísticas que se han desarrollado en los últimos años para analizar la variación de fenómenos políticos en  espacio y tiempo.

El curso inicia con un breve repaso del manejo de bases de datos y del modelo de regresión lineal. La idea no es cubrir aspectos previamente vistos de OLS, sino profundizar en el diagnóstico de los modelos y en la corrección de problemas. Tras afianzar nuestro uso de OLS para datos transversales, el curso introduce la dimensión temporal a través de OLS para panel. Una vez cubiertos los modelos lineales, entraremos más formalmente al modelo de máxima verosimilitud y sus distintas aplicaciones para el análisis de datos panel para variables categóricas (logit y probit) y de eventos (Poisson y binomail negativa). Por último, tocaremos temas básicos de modelos de duración, series de tiempo y extensiones a modelos panel dinámicos. El curso concluye con charlas de profesores del CIDE sobre tópicos avanzados, incluyendo modelos espaciales y bayesianos.

Metodología y evaluación

Tendremos una clase por semana, los jueves de 5 a 8 pm. Por lo general cada modelo se discutirá en dos sesiones. En la primera sesión se introduce teóricamente el modelo y se presentan los comandos básicos de programación del do-file en  Stata 8. En la segunda sesión se analizan 2 artículos previamente seleccionados que ilustren el uso del modelo. La mayor carga del curso recaerá en cada uno de ustedes y el éxito del curso depende del tiempo que dediquen a prácticas de laboratorio y a leer la literatura relevante. 

El software que utilizaremos en el curso es Stata 8.  Durante el semestre resolverán diversos ejercicios, criticarán la literatura existente y desarrollarán un proyecto de investigación aplicando las herramientas del curso.  El desarrollo del curso estará apoyado por una página web en la siguiente dirección: 
http://www.cide.edu/investigadores/aparicio/metodos.html

Temario tentativo

Esta lista es tentativa y podrá crecer o disminuir dependiendo de los intereses particulares del grupo y del ritmo con que avancemos:

  1. Manejo y exploración de bases de datos (repaso)
  1. Regresión lineal
  1. Variables Continuas
  2. Introducción al Método de Máxima Verosimilitud
  1. Variables Categóricas
  1. Eventos
  1. Introducción a Series de Tiempo
  1. Tópicos Avanzados (pláticas con profesores invitados)

Bibliografía

Esta es una bibliografía preliminar.  Algunas lecturas y artículos adicionales serán proporcionados a lo largo del curso.

El tratamiento teórico de métodos de máxima verosimilitud seguirá a Long (1997), y las aplicaciones con stata seguirán a Long & Freese (2001).  El análisis de datos panel será al nivel de los capítulos 13 y 14 de Wooldridge1, y algunos temas avanzados provendrán de Wooldridge2. Wooldridge1 es una muy buena introducción a métodos de regresión en general.

Calendario y lecturas tentativas

3 de febrero. Introducción del curso

10 de febrero. Repaso regresión lineal (OLS). Problemas de especificación, diagnóstico de residuales y correción de modelos (autocorrelación y heteroscedasticidad).

17 de febrero. Regresión lineal para datos panel.

24 de febrero. Aplicaciones de panel regresión lineal:

Lectura 1: Torben Iversen y Thomas Cusak, “The Causes of Welfare State Expansion: Deindustralization or Globalization,” World Politics, abril 2000.
Lectura 2: Timothy Frye, “The Perils of Polarization: Economic Performance in the Postcommunist World,” World Politics, abril 2002.

3 de marzo. Introducción al Método de Máxima Verosimilitud. Logit y probit para datos panel.

10 de marzo. Aplicaciones de logit y probit para datos panel. Lecturas:

Lectura 1: Matías Iaryczower, et.al. “Judicial Independence in Unstable Environments, Argentina 1935-1998,” American Journal of Political Science, octubre 2002.
Lectura 2
: Nicholas Sambanis, “Partition as a Solution to Ethnic War: An Empirical Critique of the Theoretical Literature,” World Politics, julio 2000.

17 de marzo. Modelos de eventos: Poisson y binomial negativa. Extensión a datos panel de modelos de eventos.

31 de marzo. Aplicaciones de Poisson y binomial negativa para datos panel. Lecturas:

Lectura 1:  Doug McAdam y Yan Su, “The War at Home: Antiwar Protest and Congressional Voting, 1965 to 1973,” American Sociological Review, agosto 2004.
Lectura 2: Mark Beissinger, Nationalist Mobilization and the Collapse of the Soviet State, Cambridge: Cambridge University Press, 2001. (selección de capítulos por determinar)

7 de abril. Modelos de duración (Weilbull, etc.) (Cecilia Martínez-Gallardo*)

14 de abril. Aplicaciones de modelos de duración. Lecturas:

Lectura 1: Bruce Bueno de Mesquita, et.al. “War and the Survival of Political Leaders: A Comparative Study of Regime Types and Political Accountability,” American Political Science Review, diciembre 1995.
Lectura 2: Por designar.

21 de abril. Introducción a series de tiempo.

28 de abril. Aplicaciones de series de tiempo (ARIMA). Lecturas:

Lectura 1: Sean O’Brien, “Foreign Policy Crises and the Resort to Terrorism: A Time-Series Analysis of Conflict Linkages,” Journal of Conflict Resolution, junio 1996.
Lectura 2: Por designar.

Primer semana de mayo (2, 3 o 4 de mayo). Introducción a panel dinámico.

12 de mayo. Aplicaciones de panel dinámico. Lecturas:

Lectura 1: Jonathan Rodden, “The Dilemas of Fiscal Federalism: Grants and Fiscal Performance Around the World,” American Journal of Political Science, julio 2002.
Lectura 2: Carles Boix y Susan Stokes, “Endogenous Democratization,” World Politics, julio 2003.

19 de mayo. Tópicos Avanzados (pláticas con profesores invitados):

Econometría espacial (Matthew Kocher*).
Modelos Bayesianos (Covadonga Meseguer*).

 

Subir
 
 

Lecturas asignadas

Feb 10 Caps. 3 y 4, Wooldridge 1. Estos capítulos son básicos y parte del repaso (pueden ignorar las demostraciones).
Caps. 6, 7, 8 y 9, Wooldridge 1.  Estos capítulos tratan temas adicionales de OLS y sólo cubriremos algunas secciones.
Feb 17 Caps. 6, 7, 8 y 9, Wooldridge 1 (conclusión).
Caps. 13 y 14, Wooldridge 1. Introducción a modelos panel para variables continuas.
   
Abril 28 Levitt, Steven D, 1997. "Using Electoral Cycles in Police Hiring to Estimate the Effect of Police on Crime," American Economic Review, American Economic Association, vol. 87(3), pages 270-90.
   
   
   
   
   
   
   
   
 
 
Notas de clase

Jeffrey M. Wooldridge tiene una serie de presentaciones powerpoint para cada capítulo de su libro Introductory EconometricsDe nada. 

Tarea 1.  Aquí está la tarea 1, a entregarse el jueves 17 de febrero.  La base de datos referida está aquí.

Jueves 3 de Marzo.  Hoy discutimos los modelos panel con efectos fijos o aleatorios.  La bitácora de stata (lab3mar05_xtreg.txt) está en la página de datos del curso. En internet hay muchas notas adicionales sobre fixed vs. random effects, por ejemplo (con el debido crédito a sus respectivos autores):

Introduction to Pooled Data/Random and Fixed Effects Models (por David Leblang)

Junsoo Lee tiene muchísimas y muy claras notas en internet:

STATA COMMANDS (basic, panel, MLE)

Jueves 7  de Abril.  Hoy hicimos un repaso sobre métodos de máxima verosimilitud (maximum likelihood methods, MLE) y sobre el caso particular de logit y probit.  Durante la sesión con stata, revisamos los siguientes comandos:

Para un repaso sobre MLE, consulten Long (1997) y Long & Freese (2001).  He aquí algunas notas adicionales de Junsoo Lee:

Un tratamiento avanzado pero sustancial de modelos con efectos fijos está aquí: Estimating Nonlinear Models with Panel Data (William Greene)

Las bitácoras recientes ya están en la página de datos del curso.  (Advertencia:  no están muy depuradas que digamos).

Tarea 2.  A entregarse el jueves 14 de abril.

Usando la misma base de datos de la Tarea 1, respondan lo siguiente, esta vez usando el nivel de impuestos per cápita como variable dependiente (tax):

  1. Responde a la pregunta 4 usando métodos panel.
  2. ¿Cómo cambian tus resultados si eliminas los datos de 1950 a 1959?
  3. ¿Cuál es el modelo más adecuado para explicar el nivel de impuestos per cápita, efectos fijos vs. efectos aleatorios? ¿Por qué?
  4. ¿Cuál es el impacto de introducir efectos temporales y efectos estatales?
  5. ¿Qué efectos producen mayor sesgo, los efectos estatales o los efectos temporales?
  6. De acuerdo a lo anterior, y usando tu modelo "preferido", responde a las preguntas 5 a la 12, y 16 de la tarea 1.

Jueves 14 de Abril.  Hoy discutimos temas misceláneos:

Jueves 21 de Abril.  Hoy discutimos el problema de endogeneidad y la posible solución de las variables instrumentales (2SLS).

Un tema que olvidé mencionar en clase es el siguiente:

Los problemas de endogeneidad surgen por tres posibles razones:

  1. Una de las variables explicativas (digamos X2) tiene error de medición, y este error contamina los residuales del modelo estructural...y por ello genera cov(x2, u) <> 0.
  2. Hay una variable omitida relevante (observable o no observable) que está correlacionada con X2.  Su omisión contamina otra vez los residuales del modelo estructural...y por ello genera cov(x2, u) <> 0.
  3. Existe simultaneidad o causalidad invertida (reverse causation): X2 determina a Y, pero Y también determina a X2.  Otra forma de decirlo lo mismo es que tanto X2 como Y son determinadas "simultáneamente" por variables omitidas (léase algún mecanismo desconocido o no observable).

Ejemplo:  La democracia causa crecimiento económico... y viceversa.  ¿Qué pasa? A lo mejor lo que importa es que si fuiste colonia inglesa o vives muy lejos del ecuador, tienes más probabilidad de crecer y desarrollar una democracia.  (A lo mejor lo que importa es dónde decidieron aterrizar los extraterrestres, si en Grecia o en Teotihuacan).

Sea como fuere, una posible solución es buscar una (o varias) variable instrumental que esté correlacionada con X2 pero que sea independiente (así sea sólo en teoría) de Y.

Una de las lecturas asignadas para la siguiente clase es:

Levitt, Steven D, 1997. "Using Electoral Cycles in Police Hiring to Estimate the Effect of Police on Crime," American Economic Review, American Economic Association, vol. 87(3), pages 270-90.

Jueves 28 de Abril.  

Hoy discutimos la tarea 2 (ver soluciones en página de datos): tarea2do.txt    tarea2log.txt    tarea2output.txt     tarea2table.xls    

Después discutimos diversos papers que usaban variables instrumentales y Levitt (1997).

Jueves 12 de Mayo.

Series de Tiempo

La semana entrante veremos algunos otros temas de TSA, la aplicación a datos panel--y dedicaremos el resto de la (¡ultima!) clase a introducir los modelos Tobit y  "Heckman".

Jueves 19 de Mayo

Hoy platicamos de muchos temas importantes.  Concluimos nuestra discusión de series de tiempo: ARIMA, análisis de intervención, choques temporales vs. choques permanentes, causalidad de Granger, y modelos VAR.  Nadie les creerá que "vimos" esto en 30 minutos.

Después concretamos algunos cabos sueltos sobre las medidas de bondad de ajuste y pruebas de hipótesis de modelos de máxima verosimilitud (ver Wooldridge 17.1):

En la segunda parte de la clase hablamos de variables latentes y dos de sus variantes: censored data y sample selection models.

Con esto terminamos el curso.  Espero les haya sido de utilidad.

 

Subir

Regresar a homepage

 

Última revisión: Mayo 19, 2005.