W-NOMINATE vs Optimal Classification I

November 22, 2011
By

This post was kindly contributed by Ciencia Política Computacional - go there to comment and to read the full post.

NOMINATE y OC son métodos de escalamiento multidimensional desarrollados por Keith Poole y Howard Rosenthal. El primero cuenta ya con algunas décadas de vida y se ha convertido en el estándard académico a la hora de analizar las VN.

Ambos métodos son muy similares. La gran diferencia es que NOMINATE asigna una distribución de probabilidad a los errores (votaciones mal clasificadas), y en base a eso calcula las coordenadas para cada legislador.  En cambio OC no asigna un elemento probabilístico, sino que maximiza la clasificación correcta de las votaciones. Una votación mal clasificada es aquella que, por ejemplo, habiendo un legislador votado de manera "afirmativa" queda del lado "negativo" de la línea de corte.

Para los interesados, recomiendo darse una vuelta por Voteview, el sitio web de Keith Poole que tiene toda la información sobre estos métodos (papers, datos, paquetes R, etc).

Bueno, la idea es entonces ver cuál de estas 2 técnicas es "mejor" para analizar la Cámara de Diputados Argentina. El período para este análisis es el 127 (2009-2010), y las votaciones fueron extraidas del sitio web de la HCDN. Los datos están codificados de manera binaria, siendo 1 = afirmativo, 0 = negativo (los ausentes fueron codificados como negativos y las abstenciones como datos faltantes).

Empezamos con OC, utilizando el paquete correspondiete de R, obtenemos los siguientes resultados:


SUMMARY OF OPTIMAL CLASSIFICATION OBJECT
----------------------------

Number of Legislators: 256 (9 legislators deleted)
Number of Votes: 118 (1 votes deleted)
Number of Dimensions: 2
Predicted Yeas: 14895 of 16562 (89.9%) predictions correct
Predicted Nays: 10772 of 12861 (83.8%) predictions correct

The first 10 legislator estimates are:
coord1D coord2D
AGOSTO, Walter Alfredo -0.456 0.310
ALBRISI, Cesar Alfredo -0.484 -0.033
BARRIOS, Miguel Angel -0.171 -0.337
BARTOLUCCI, Gilda Liliana -0.468 -0.017
BIANCHI, Ivana Maria -0.345 0.028
CREMER de BUSTI, Maria Cristina -0.509 0.154
GALVALISI, Luis Alberto -0.530 -0.576
GEREZ, Elda Ramona -0.678 -0.168
IGLESIAS, Fernando Adolfo -0.356 -0.086
LUSQUINOS, Luis Bernardo -0.522 0.580
Observamos un alto nivel de predicciones correctas (89.9 y 83.8). Además, revisado las medidas de ajuste, vemos que el porcentaje total de clasificación correcta es de 87%, y el APRE de casi 70%. El Agregated Proportion Reductions in Error (APRE) es la medida de ajuste que nos dice si nuestro modelo espacial sirve para clasificar las votaciones. El APRE varía entre 1 (el modelo se ajusta de forma perfecta) y 0 (el modelo no explica nada).

> result$fits
[1] 0.8723448 0.6964358

Graficamos los resultados de las coordenadas de 4 bloques.

También graficamos los vectores propios. Podemos observar que la 1er dimensión explica la mayor parte de los resultados, pero el "codo" de la curva deja ver la existencia de una 2da dimensión y posiblemente más.


Por ahora lo dejo acá, mañana sigo con W-NOMINATE. También prometo ir subiendo los datos y el código de R.

Tags: ,

Comments are closed.