Diseño de discontinuidad de regresión, Ejemplo, Metodología, Estimación paramétrica, Supuestos requeridos, Ventajas, Desventajas, Extensiones

En estadística, econometría, la ciencia política, la epidemiología y disciplinas relacionadas, un diseño de regresión discontinua es un diseño cuasi-experimental pretest-postest que provoca los efectos causales de las intervenciones mediante la asignación de un límite o umbral por encima o por debajo de la cual la intervención se le asigna. Mediante la comparación de las observaciones se extiende estrechamente a ambos lados del umbral, es posible estimar el efecto del tratamiento promedio local en entornos en los que la aleatorización era inviable. En primer lugar aplicada por Donald Thistlewaite y Donald Campbell a la evaluación de los programas de becas, la RDD se ha convertido cada vez más popular en los últimos años.

Ejemplo

La intuición detrás de la RDD se ilustra muy bien con la evaluación de las becas basadas en el mérito. El principal problema de estimar el efecto causal de este tipo de intervención es la endogeneidad de la asignación al tratamiento: Ya que los estudiantes de alto rendimiento tienen más probabilidades de obtener la beca de mérito y siguen funcionando bien, al mismo tiempo, la comparación de los resultados de ganadores y no -receptores darían lugar a un sesgo al alza de las estimaciones. Incluso si la beca no mejoró las calificaciones en absoluto, premiados habrían obtenido mejores resultados que los no beneficiarios, simplemente porque las becas se otorgan a estudiantes que estaban funcionando bien ex ante.

A pesar de la ausencia de un diseño experimental, un RDD puede explotar características exógenas de la intervención para provocar efectos causales. Si todos los estudiantes por encima de un determinado grado - por ejemplo, el 80% - se dan la beca, es posible obtener el efecto del tratamiento local mediante la comparación de los estudiantes alrededor del 80% de corte: La intuición es que un estudiante anotar 79% es probable a ser muy similar a un estudiante anotar 81% - dado el umbral predefinido de 80%, sin embargo, un estudiante recibirá la beca mientras que el otro no lo hará. Comparando los resultados de la adjudicatario para el resultado de contraste de la no-receptor será por lo tanto conseguir el efecto de tratamiento local.

Metodología

Los dos métodos más comunes para la estimación utilizando un RDD son paramétricos y paramétricos.

Estimación no paramétrica

El método no paramétrico más común utilizado en el contexto RDD es una regresión lineal local. Esto es de la forma: donde Dónde está el tratamiento de corte, es una variable binaria igual a uno si, y es el ancho de banda de los datos utilizados. Diferentes pendientes e intersecciones ajuste de los datos a cada lado de el punto de corte. Típicamente se utilizan ya sea un núcleo rectangular o un núcleo triangular. Investigación favorece el núcleo triangular, pero el núcleo rectangular tiene una interpretación más sencilla.

El mayor beneficio de la utilización de métodos no paramétricos en un RDD es que proporcionan estimaciones basadas en los datos más cerca de la línea de corte, que es intuitivamente atractivo. Esto reduce algunos sesgo que puede resultar del uso de datos más lejos del punto de corte para estimar la discontinuidad en el punto de corte. Más formalmente, se prefieren las regresiones lineales locales, ya que tienen mejores propiedades de polarización y tienen mejor convergencia. Sin embargo, el uso de ambos tipos de estimación, si es posible, es una forma útil para argumentar que los resultados estimados no confían demasiado en el enfoque particular que ha tomado.

Estimación paramétrica

Otros ejemplos

  • Educación para el desarrollo en la educación superior, cuando la remediación está determinada por una prueba de nivel
  • Las políticas en el que el tratamiento está determinado por un criterio de elegibilidad de edad.
  • Elecciones en el que un político gana por una mayoría marginal.

Supuestos requeridos

Diseño de discontinuidad de regresión requiere que la asignación del tratamiento es "tan bueno como al azar" en el umbral de tratamiento. Si esto se mantiene, entonces se garantiza que aquellos que apenas recibieron tratamiento son comparables a los que apenas no recibió tratamiento, como el estado de tratamiento es eficaz al azar.

La asignación del tratamiento en el umbral puede ser "tan bueno como al azar" si hay aleatoriedad en la variable de asignación y los agentes considerados no pueden manipular perfectamente su estado de tratamiento. Por ejemplo, si el tratamiento está pasando un examen, donde se requiere un grado de 50%, a continuación, este ejemplo es un diseño de regresión discontinua válida siempre que los grados son algo aleatorio, ya sea debido a la aleatoriedad de la clasificación o aleatoriedad de rendimiento de los estudiantes.

Los estudiantes no deben también ser capaces de manipular perfectamente su calificación con el fin de determinar su estado perfectamente tratamiento. Dos ejemplos son los estudiantes sean capaces de convencer a los profesores a "merced pasar", o los estudiantes que se les permita volver a tomar el examen hasta que pase. En el primer caso, los estudiantes que apenas fallan, pero son capaces de asegurar un "pase de la misericordia" pueden diferir de los que apenas fallan, pero no puede asegurar un "pase misericordia". Esto lleva a un sesgo de selección, ya que los grupos de tratamiento y de control difieren ahora. En este último caso, algunos estudiantes pueden optar por tomar el examen, parando una vez que pasan. Esto también conduce a un sesgo de selección, ya que sólo algunos estudiantes deciden tomar el examen.

Prueba de la validez de los supuestos

Es imposible para probar definitivamente si los agentes son capaces de determinar perfectamente su estado de tratamiento. Sin embargo, hay algunas pruebas de que pueden proporcionar evidencia de que apoya o descarta la validez del diseño de regresión discontinua.

Prueba de Densidad

McCrary sugirió examinar la densidad de observaciones de la variable de asignación. Si hay una discontinuidad en la densidad de la variable de asignación en el umbral para el tratamiento, a continuación, esto puede sugerir que algunos agentes fueron capaces de manipular perfectamente su estado de tratamiento.

Por ejemplo, si varios estudiantes son capaces de obtener un "pase de la misericordia", entonces no habrá más estudiantes que apenas aprobaron el examen de que apenas ha fallado. Del mismo modo, si los alumnos se les permite repetir el examen hasta que pase, entonces no habrá un resultado similar. En ambos casos, es probable que aparezca cuando se examina la densidad de las calificaciones del examen.

Continuidad de variables observables

Dado que la validez del diseño de regresión discontinua se basa en los que apenas se trata de ser los mismos que los que fueron apenas no se trata, tiene sentido examinar si estos grupos son similares en función de variables observables. Para el ejemplo anterior, se podría comprobar si los que apenas pasaba tienen características diferentes a los que apenas fallaron. Aunque algunas variables pueden ser diferentes para los dos grupos basado en el azar, la mayoría de estas variables deben ser el mismo.

Falsificación prueba variables predeterminadas

Similar a la continuidad de las variables observables, sería de esperar que haya continuidad en variables predeterminadas en el tratamiento de corte. Dado que estas variables se determinaron antes de la decisión de tratamiento, estado de tratamiento no debe tener ningún efecto sobre ellos. Consideremos el ejemplo de becas basado en el mérito antes. Si el resultado de interés es grados futuro, entonces no esperamos una beca para afectar los grados anteriores. Si una discontinuidad en variables predeterminadas está presente en el tratamiento de corte, a continuación, esto pone la validez del diseño de discontinuidad de regresión en tela de juicio.

Otras discontinuidades

Si discontinuidades están presentes en otros puntos de la variable de asignación, siempre que éstas no se espera que, a continuación, esto puede hacer que el diseño de regresión discontinuidad sospechoso. Consideremos el ejemplo de Carpenter y Dobkin que estudió el efecto del acceso legal al alcohol en los Estados Unidos. Dado que el acceso a los aumentos de alcohol a los 21 años, esto conduce a cambios en los diferentes resultados, tales como las tasas de mortalidad y morbilidad. Si las tasas de mortalidad y morbilidad aumentan también de forma discontinua en otras edades, entonces lanza la interpretación de la discontinuidad de los 21 años en tela de juicio.

Inclusión y exclusión de covariables

Si las estimaciones de los parámetros son sensibles a la eliminación o adición de covariables al modelo, entonces esto puede poner en duda la validez del diseño de regresión discontinua. Un cambio significativo puede sugerir que los que apenas se diferencian en el tratamiento de estas covariables de los que apenas no se recibe tratamiento. Covariables incluyendo eliminarían algunos de este sesgo. Si una gran cantidad de sesgo está presente, y las covariables explicar una cantidad significativa de este, a continuación, su inclusión o exclusión cambiarían significativamente la estimación del parámetro.

Ventajas

  • Cuando se implementa correctamente y se analiza, el RDD se obtiene una estimación sesgada del efecto del tratamiento local. El RDD puede ser casi tan bueno como un experimento aleatorio en la medición de un efecto del tratamiento.
  • RDD, como un cuasi-experimento, no requiere la asignación al azar ex ante y evita las cuestiones éticas de la asignación aleatoria.

Desventajas

  • El poder estadístico es considerablemente más baja que un experimento aleatorio del mismo tamaño de la muestra, aumentando el riesgo de erróneamente despedir efectos significativos del tratamiento
  • Los efectos estimados son sólo imparcial si la forma funcional de la relación entre el tratamiento y el resultado se modela correctamente. Las advertencias más populares son las relaciones no lineales que se confunden como una discontinuidad.
  • La contaminación por otros tratamientos. Si otro tratamiento se produce al mismo valor de corte de la misma variable de asignación, a continuación, la discontinuidad medido en la variable de resultado puede atribuirse en parte a este otro tratamiento. Por ejemplo, supongamos que un investigador desea estudiar el impacto del acceso legal al alcohol en la salud mental mediante un diseño de discontinuidad de la regresión a la edad mínima legal para consumir alcohol. El impacto se mide se puede confundir con el acceso legal a los juegos de azar, que puede ocurrir a la misma edad.

Extensiones

RDD Fuzzy

La identificación de los efectos causales bisagras en el supuesto fundamental de que en efecto, hay un corte brusco, alrededor de la cual hay una discontinuidad en la probabilidad de asignación de 0 a 1 - En realidad, sin embargo, puntos de corte a menudo no se aplica estrictamente y serán por tanto un sesgo de las estimaciones.

En contraste con el diseño de regresión discontinua agudo, un diseño de discontinuidad de regresión difusa no requiere una fuerte discontinuidad en la probabilidad de asignación sino que es aplicable siempre que la probabilidad de asignación es diferente. La intuición detrás de esto está relacionado con la estrategia de variable instrumental y la intención de tratar.

Regresión diseño torcedura

Cuando la variable de asignación es continua y depende de esperar en otra variable observada, se pueden identificar los efectos del tratamiento con los cambios bruscos en la pendiente de la función de tratamiento. Esta técnica fue acuñado diseño torcedura de regresión por Turner Nielsen, Srensen y Tabe, aunque citan análisis anteriores similares. Ellos escriben: "Este enfoque se asemeja a la idea de discontinuidad de la regresión. En lugar de una discontinuidad en el nivel de la función estipendio de ingresos, tenemos una discontinuidad en la pendiente de la función." Fundamentos teóricos rigurosos fueron proporcionados por Card et al.

Tenga en cuenta que torceduras de regresión también puede significar un tipo de regresión segmentada, que es un tipo diferente de análisis.