NOVEDADES DE STATA 15
Elaborado por: David Leonardo Guio Rodríguez
Stata es un software estadístico que brinda las herramientas necesarias para el análisis y la gestión de datos. Con el fin de mantenerse como uno de los software más empleados en el mercado, Stata está en constante modificación e innovación para responder a los requerimientos de los usuarios. Con cada nueva versión lanzada al mercado, Stata ofrece una serie de mejoras que permiten ampliar la gama de funciones a disposición del usuario y mejorar las ya disponibles en versiones anteriores, por tal razón, el presente documento pretende ilustrar algunas de las novedades presentadas por Stata en su versión 15.
Contenido:
- Modelos de regresión extendida
- Modelos de equilibrio general dinámico estocástico (DSGE)
- Regresión segmentada
- Pruebas de cointegración para datos panel
- Regresión lineal heterocedástica
- Análisis de potencia estadística para regresión lineal
- Pruebas para múltiples puntos de quiebre en series de tiempo
- Otras novedades
1. Regresión extendida: Endogeneidad + selección + tratamiento
La serie de comandos articulados con los modelos de regresión extendida presentados como una actualización para Stata 15, pretenden resolver algunos de los problemas presentes en el modelo de regresión. Los nuevos comandos permiten ajustar los modelos de regresión lineal, regresión con intervalos, probit y probit ordenado, con el fin de corregir los problemas de variables regresoras endógenas, selección endógena de la muestra, y asignación del tratamiento no aleatorio.
Las versiones anteriores de Stata incluyen algunos comandos que permiten resolver los problemas mencionados sin embargo, no existen en esas versiones comandos que permitan ajustar los modelos cuando los problemas anteriores ocurren simultáneamente. Incluso, cuando solo se presente un problema, los comandos de ERM resultan ser preferidos dada su simple estructura.
Estructura de los modelos de regresión extendida:
La estructura de los comandos de los modelos de regresión extendida es:
comandoERM depvar indepvars, options
donde comandoERM hace referencia a alguno de los nuevos comandos presentados bajo la novedad de modelos de regresión extendida (eregress, eintreg, eprobit, eoprobit), depvar es la variable dependiente en un modelo de regresión, indepvars el conjunto de variables independientes, y options, la opción a especificar de acuerdo con el problema a solucionar.
El conjunto de opciones disponibles para estos comandos se presentan en la siguiente tabla,
| Opciones | Función |
| endogenous | Especifica variables independientes endógenas |
| select | Especifica selección endógena de la muestra |
| tobitselect | Especifica selección endógena de la muestra usando Tobit |
| extreat | Especifica asignación de trratamiento exógeno |
| entreat | Especifica asignación de tratamiento endógeno |
Los videos presentados a continuacion pretenden ilustrar la foma cómo funciona esta nueva serie de comandos
2. Modelos de equilibrio general dinámico estocástico (DSGE)
Los modelos de equilibrio general dinámico estocástico son empleados para describir la estructura de la economía, permiten a nivel macroeconómico analizar el impacto de las políticas sobre las variables macroeconómicas, así como realizar pronóstico sobre su comportamiento.
Estos modelos se caracterizan por ser sistemas de ecuaciones derivados de la teoría económica por lo que la interpretación de sus parámetros dependerá de la teoría detrás del modelo, y por permitir que el valor actual de la variable de interés este en función de su valor esperado futuro.
El nuevo comando dsge permitirá al usuario estimar los parámetros de modelos DSGE, lineales en las variables pero potencialmente no lineales en los parámetros.
A continuación se estimará un modelo DSGE con el fin de ilustrar el funcionamiento de los elementos de este nuevo comando. Para estimar el modelo se emplea información del comportamiento histórico de la inflación y la tasa de interés en Estados Unidos.
El modelo anterior consta de 5 ecuaciones, las 3 primeras corresponden a la brecha del producto "x", la tasa de inflación "p", y la tasa de interés "r" respectivamente; las últimas dos son variables de estado, "z" se puede interpretar como la tasa natural de interés y "u" como la postura adoptada en la política monetaria:
- En la primera ecuación la brecha del producto depende de su valor futuro, la tasa de interés , y el valor futuro de la inflación.
- En la segunda ecuación, la inflación depende de su valor futuro y la brecha del producto.
- En la tercera ecuación, la tasa de interés depende de la tasa de inflación.
En las ecuaciones se observa interdependencia entre las variables, dependencia de los valores esperados de cada variable, y de las 2 variables inobservadas de estado "z" y "u".
A partir del comando dsge se pueden estimar los parámetros del modelo tal como se observa en la siguiente imagen
El parámetro Kappa puede ser interpretado como la pendiente de la curva de phillips, algunas teorías predicen un valor de 0, otras un valor positivo como el del modelo estimado.
El parámetro beta permite obtener el valor de 1/beta, este valor aparece en la ecuación de la tasa de interés y se interpreta como el grado de respuesta del banco central a movimientos en la inflación. Para hallar el valor 1/beta el usuario puede usar el comando nlcom como se ve en la siguiente imagen:
Una vez se estiman los parámetros del modelo, el comando dsge permite acceder a algunos elementos post-estimación. El primero de ellos se conoce como “policy matrix” y describe cómo las variables estado afectan las variables control, es decir, estima el efecto de un shock unitario en alguna de las variables estado sobre las variables control.
Los resultados son presentados para cada ecuación, la segunda fila de la tabla presenta la ecuación de política para la brecha del producto, es decir, se estima que un shock unitario sobre la variable de estado "u" reduce la brecha del producto 1.58.
Otro elemento post-estimación es la matriz de transición que permite identificar procesos dinámicos para las variables de estado, relaciona el valor futuro de las variables de estado con su valor presente.
Los parámetros obtenidos en la figura se pueden interpretar como el efecto de un shock unitario en las variables de estado sobre la media del valor de la variable de estado un periodo adelante.
Si se desea graficar el comportamiento adoptado por una variable control o de estado en respuesta a un choque sobre una variable de estado, el comando irf, permite acceder a este tercer elemento postimacion. Para emplear este comando se debe crear un archivo .irf que permita almacenar el resultado de la estimación,
Una vez creado el archivo, se emplea el comando irf create para estimar el conjunto de respuestas de las variables de estado y control ante los impulsos generados sobre las variables de estado, basado en el modelo DSGE estimado.
Una vez se estiman las respuestas se emplea el comando que permite imprimirlas gráficamente
-
Regresión segmentada
El nuevo comando threshold permite estimar modelos de regresión segmentada. En ocasiones, cuando se desea estimar un modelo de regresión es posible que dependiendo del estado de una variable los coeficientes varíen, el nuevo comando no solo permite calcular los diferentes conjuntos de coeficientes, sino además determinar en caso de que no se conozca, el número óptimo de límites en los que cambian los coeficientes, basado en los criterios de información AIC, BIC, y HQIC.
La regresión segmentada es comúnmente empleada cuando se trabaja con series de tiempo, por ejemplo, suponga que usted está interesado en el comportamiento histórico de las estrategias de inversión, observando el comportamiento gráfico de su variable de interés, nota que a partir de una fecha en la que tuvo lugar una política, el comportamiento de la serie cambió significativamente, el nuevo comando threshold, le permitirá obtener los coeficientes antes y después de la fecha, si usted desconociera la fecha de quiebre, el comando también le permitirá estimar esa fecha.
A continuación se muestra un ejemplo donde se emplea el comando threshold:
-
Pruebas de cointegración para datos panel
El nuevo comando xtcointtest permite ejecutar los test de cointegración Kao, Pedroni y Westerlund en una estructura de datos panel. Los tests de cointegración permiten determinar si procesos no estacionarios presentan una relación estable a largo plazo entre series. Las tres pruebas presentan como hipótesis nula no cointegración, la hipótesis alternativa del test de Kao y Pedroni es que las variables están cointegradas en todos los paneles, y la prueba de Westerlund presenta dos casos de hipótesis alternativa, en uno de ellos las variables están cointegradas en algunos paneles, y en el otro, las variables están cointegradas en todos los paneles.
La estructura para ejecutar las pruebas es la siguiente:
- Si se desea ejecutar el test de Kao
xtcointest kao depvar varlist [if] [in] [, kao_options]
- Si se desea ejecutar el test de Pedroni
xtcointtest pedroni depvar varlist [if] [in] [, pedroni_options]
- Si se desea ejecutar el test de Westerlund
xtcointtest westerlund depvar varlist [if] [in] [, westerlund_options]
los elementos entre [] son opcionales.
A continuación se presenta un ejemplo de la aplicación de este nuevo comando
-
Regresión lineal heterocedástica
En un modelo de regresión lineal, no garantizar el supuesto de homocedasticidad según el cual la varianza de los errores condicionada por el conjunto de variables explicativas permanece constante, implica algunas complicaciones en los estimadores por MCO. Cuando en el modelo de regresión lineal se viola el supuesto de homocedasticidad, los estimadores por MCO ya no resultan ser los mejores estimadores lineales insesgados, y los estadísticos de prueba ya no son válidos.
El comando hetregress, presentado como novedad en esta nueva versión de Stata, permite ajustar un modelo de regresión lineal cuando la varianza es una función exponencial de las variables explicativas especificadas en el modelo, es decir, en presencia de heterocedasticidad.
El comando hetregress ajusta el modelo de regresión empleando estimadores de máxima verosimilitud o mínimos cuadrados generalizados, la elección está a disposición del usuario, siendo los estimadores de máxima verosimilitud los predeterminados con el comando. Si la función de la media y la varianza están correctamente especificadas y los errores presentan una distribución normal, los estimadores de máxima verosimilitud resultan ser más eficientes que los obtenidos por mínimos cuadrados generalizados, si alguna de estas condiciones no se cumple los estimadores de mínimos cuadrados generalizados son más robustos que los estimadores de ML.
La estructura para emplear este comando es la siguiente:
- Si se emplean estimadores de máxima verosimilitud
- Si se emplean mínimos cuadrados generalizados en dos etapas
Veamos a continuación cómo funciona este nuevo comando
-
Análisis de potencia estadística para regresión lineal
El comando power de Stata presenta tres nuevos métodos de análisis de potencia estadística y tamaño de la muestra para modelos de regresión lineal.
El comando power oneslope permite calcular el tamaño de la muestra, la potencia o el coeficiente b1 objetivo para una prueba de b1 en una regresión lineal simple. Por defecto, este comando calcula el tamaño de la muestra dados los valores de la potencia estadística y el coeficiente b1. Sin embargo, empleando algunas de las opciones asociadas a este comando, se puede calcular la potencia dado el tamaño de la muestra y el coeficiente b1, o el coeficiente dados los otros dos valores.
El comando power rsquared ejecuta un análisis de potencia estadística y tamaño de la muestra para un R2 test en un modelo de regresión lineal. Un R2 test permite evaluar la significancia de los coeficientes estimados, o de un subconjunto de estos. En ambos casos, el comando permitirá determinar el tamaño de la muestra, la potencia, o el R2 objetivo dado el valor de los otros dos y algunos otros parámetros.
El comando power pcorr ejecuta un análisis de potencia estadística y tamaño de la muestra para un test de correlación parcial en un modelo de regresión múltiple. El comando permitirá determinar el tamaño de la muestra, la potencia, o el coeficiente de correlación parcial al cuadrado objetivo dado el valor de los otros dos y algunos otros parámetros.
-
Pruebas para múltiples puntos de quiebre en series de tiempo
El nuevo comando estat sbcusum permite testear la estabilidad de los parámetros para los coeficientes de regresión lineal. Cuando se trabaja con series de tiempo uno de los supuestos adoptados es que los coeficientes son estables en el tiempo, con este nuevo comando se tendrá la posibilidad de verificar este supuesto, es decir, probar si hay cambios estructurales en los residuos.
El comando emplea la suma acumulada de residuos recursivos o residuos por MCO para testear si hay cambios estructurales. La hipótesis nula es que los parámetros son estables o constantes en el tiempo, esta será rechazada si el estadístico es mayor a los valores críticos, o si el gráfico resultado del comando se encuentra por fuera de las bandas de confianza.
Veamos cómo funciona este nuevo comando,
Vamos a emplear una base de datos que contiene información trimestral del índice de precios al por mayor de la economía de Estados Unidos desde el primer trimestre de 1960 hasta el último trimestre de 1990. Dado que estamos interesados en observar la evolución de la tasa de crecimiento del índice aplicaremos primera diferencia al logaritmo del índice, graficando esta nueva variable se obtiene:
La gráfica refleja un cambio en la tasa de crecimiento del índice a partir de la mitad de la muestra, con el fin de validar ese posible cambio emplearemos el nuevo comando de Stata,
La interpretación de la prueba requiere la comparación entre el estadístico y los valores críticos, dado que el estadístico es mayor al valor crítico 1%, rechazamos la hipótesis nula de estabilidad de los parámetros al 1% de significancia.
Recurriendo a la salida gráfica de la prueba observamos que parte del gráfico se encuentra por fuera de los intervalos de confianza, lo que indica rechazo de la hipótesis nula.
8. Otras novedades
Otras de las novedades que ofrece esta nueva versión de Stata 15 son: Análisis de clase latente, bayes, creación de documentos dinámicos, finite mixture models, modelos espacial autorregresivo, Importación de datos económicos de la Reserva Federal, Regresión Tobit multinivel para respuestas censuradas, Modelos de ecuaciones estructurales generalizados de grupo múltiple, entre otros.
BIBLIOGRAFÍA
StataCorp. 2017. Stata: Release 15. Statistical Software. College Station, TX: StataCorp LLC.




