Margen de error, Explicación, Concepto, Comparando los porcentajes

El margen de error es una estadística que expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta. Cuanto mayor sea el margen de error, menos confianza que uno debe tener que los resultados reportados de la encuesta se encuentran cerca de las cifras "reales", es decir, las cifras para el conjunto de la población. Margen de error se produce cada vez que una población se muestrea incompleta.

Explicación

El margen de error se define generalmente como el "radio" de un intervalo de confianza para una estadística particular, a partir de una encuesta. Un ejemplo es el porcentaje de personas que prefieren productos A versus producto B. Cuando se informa de un solo, el margen global de error de la encuesta, se refiere a que el margen máximo de error para todos los porcentajes reportados utilizando toda la muestra de la encuesta. Si la estadística es un porcentaje, este margen de error máximo se puede calcular como el radio del intervalo de confianza para un porcentaje reportado de 50%.

El margen de error ha sido descrita como una cantidad "absoluta", igual a un radio de intervalo de confianza para la estadística. Por ejemplo, si el valor real es de 50 puntos porcentuales, y la estadística tiene un radio intervalo de confianza de 5 puntos porcentuales, entonces se dice que el margen de error es de 5 puntos porcentuales. Como otro ejemplo, si el valor real es de 50 personas, y la estadística tiene un radio intervalo de confianza de 5 personas, entonces podríamos decir que el margen de error es de 5 personas.

En algunos casos, el margen de error no se expresa como una cantidad "absoluta", sino que se expresa como una cantidad "relativo". Por ejemplo, supongamos que el valor real es de 50 personas, y la estadística tiene un radio intervalo de confianza de 5 personas. Si utilizamos la definición "absoluta", el margen de error sería de 5 personas. Si utilizamos la definición de "relativa", a continuación expresamos este margen de error absoluto como un porcentaje del valor real. Así pues, en este caso, el margen absoluto de error es de 5 personas, pero el "porcentaje relativo" margen de error es de 10%. A menudo, sin embargo, no se hace explícita la distinción, sin embargo, por lo general se desprende del contexto.

Al igual que los intervalos de confianza, el margen de error se puede definir para cualquier nivel de confianza deseado, pero por lo general un nivel de 90%, 95% o 99% se elige. Este nivel es la probabilidad de que un margen de error en torno al porcentaje reportado incluiría el "verdadero" porcentaje. Junto con el nivel de confianza, el diseño de la muestra para una encuesta, y en particular el tamaño de la muestra, determina la magnitud del margen de error. Un tamaño de muestra más grande produce un menor margen de error, todo lo demás permanece igual.

Si se utilizan los intervalos de confianza exactos, entonces el margen de error tiene en cuenta tanto el error de muestreo y errores ajenos al muestreo. Si se utiliza un intervalo de confianza aproximado, a continuación, el margen de error sólo puede tener error de muestreo al azar en cuenta. No representa otras posibles fuentes de error o sesgo, como una muestra de diseño de no representativa, preguntas mal redactadas, las personas que mienten o se niega a responder, la exclusión de las personas que no pudieron ser contactados o miscounts y errores de cálculo.

Concepto

Un ejemplo de la campaña presidencial de EE.UU. 2004 se utilizará para ilustrar conceptos en este artículo. De acuerdo con un 2 de octubre de 2004 por la encuesta de Newsweek, el 47% de los votantes registrados votaría a favor de John Kerry/John Edwards si las elecciones se llevaron a cabo en ese día, el 45% votaría a favor de George W. Bush/Dick Cheney, y el 2% lo haría votar por Ralph Nader/Peter Camejo. El tamaño de la muestra fue de 1,013. A menos que se indique lo contrario, el resto de este artículo utiliza un 95% de confianza.

Concepto básico

Las encuestas típicamente implican tomar una muestra de una población determinada. En el caso de la encuesta de Newsweek, la población de interés es la población de personas que van a votar. Debido a que es poco práctico para todos encuesta que votarán, los encuestadores toman muestras más pequeñas que están destinados a ser representativa, es decir, una muestra aleatoria de la población. Es posible que los encuestadores de muestra 1.013 votantes que suceden a votar por Bush cuando en realidad la población se divide en partes iguales entre Bush y Kerry, pero esto es muy poco probable teniendo en cuenta que la muestra es aleatoria.

La teoría del muestreo proporciona métodos para calcular la probabilidad de que los resultados de la encuesta difieren de la realidad en más de una cierta cantidad, simplemente debido al azar, por ejemplo, que la encuesta reporta 47% para Kerry, pero su apoyo es en realidad tan alto como 50%, o es realmente un precio tan bajo como 44%. Esta teoría y algunas hipótesis bayesiano sugieren que el "verdadero" porcentaje será probablemente bastante cerca de 47%. Cuantas más personas que se toman muestras, los encuestadores más confianza puede ser que el "verdadero" porcentaje es cercano al porcentaje observado. El margen de error es una medida de lo cerca que es probable que sean los resultados.

Sin embargo, el margen de error sólo representa el error de muestreo al azar, por lo que es ciego a los errores sistemáticos que pueden ser introducidos por la falta de respuesta o por las interacciones entre el estudio y los sujetos de memoria, la motivación, la comunicación y el conocimiento.

Los cálculos suponiendo muestreo aleatorio

En esta sección se discutirá brevemente el error estándar de un porcentaje, el intervalo de confianza correspondiente y conectar estos dos conceptos al margen de error. Para simplificar los cálculos aquí asumen la encuesta se basó en una muestra aleatoria simple de una población grande.

El error estándar de una proporción o porcentaje reportado p mide su exactitud, y es la desviación estándar estimada de ese porcentaje. Se puede estimarse a partir de sólo p y el tamaño de la muestra, n, si n es pequeño en relación al tamaño de la población, utilizando la siguiente fórmula:

Cuando la muestra no es una muestra aleatoria simple de una población grande, el error estándar y el intervalo de confianza se deben estimar mediante cálculos más avanzados. Linealización y el nuevo muestreo se utilizan ampliamente las técnicas de datos de diseños de muestras complejas.

Tenga en cuenta que no existe necesariamente una relación estricta entre el intervalo de confianza verdadera y el verdadero error estándar. El intervalo de confianza del p verdadero es el intervalo que contiene p por ciento de la distribución, y donde/2 por ciento de la distribución se encuentra por debajo de un, y/2 por ciento de la distribución se encuentra por encima de b. El verdadero error estándar de la estadística es la raíz cuadrada de la varianza verdadera muestra de la estadística. Estos dos no pueden estar directamente relacionados, aunque, en general, para grandes distribuciones que se parecen a las curvas normales, existe una relación directa.

En la encuesta de Newsweek, el nivel de apoyo de Kerry p = 0,47 y n = 1013 - El error estándar ayuda a dar una idea de la precisión del porcentaje estimado de Kerry. Una interpretación bayesiana del error estándar es que, aunque no sabemos el "verdadero" porcentaje, es muy probable que se encuentra dentro de los dos errores estándar del porcentaje estimado. El error estándar se puede utilizar para crear un intervalo de confianza dentro de la cual el "verdadero" porcentaje debe ser a un cierto nivel de confianza.

El porcentaje estimado de más o menos su margen de error es de un intervalo de confianza para el porcentaje. En otras palabras, el margen de error es la mitad de la anchura del intervalo de confianza. Se puede calcular como un múltiplo del error estándar, con el factor dependiendo del nivel de confianza deseado; un margen de un error estándar da un intervalo de confianza del 68%, mientras que la estimación de más o menos 1,96 errores estándar es una confianza del 95% intervalo, y un intervalo de confianza del 99% se ejecuta 2,58 errores estándar a cada lado de la estimación.

Definición

El margen de error para una estadística particular de interés se define generalmente como el radio del intervalo de confianza para esa estadística. El término también se puede utilizar en el sentido de error de muestreo en general. En los informes de los medios de comunicación de resultados de la encuesta, el término se refiere a la margen máximo de error para cualquier porcentaje de esa encuesta.

Diferentes niveles de confianza

Para obtener una muestra aleatoria simple de una población grande, el margen máximo de error es una simple re-expresión del tamaño de la muestra n. Los numeradores de estas ecuaciones se han redondeado a dos decimales.

 Margen de error en 99% Margen de error de confianza a 95% Margen de error de confianza a 90% de confianza

Si un artículo acerca de una encuesta no indica el margen de error, pero que no se utilizó una muestra aleatoria simple de un cierto tamaño del Estado, el margen de error puede ser calculado para un grado de confianza deseado usando una de las fórmulas anteriores. Además, si se da el margen de error de 95%, uno puede encontrar el margen de error de 99% mediante el aumento del margen comunicado de error del 30% aproximadamente.

Como un ejemplo de lo anterior, una muestra aleatoria de tamaño 400 dará un margen de error, a un nivel de confianza del 95%, de 0.049 0.98/20 o - un poco menos de 5%. Una muestra aleatoria de tamaño 1600 dará un margen de error de 0.98/40, o 0.0245 - poco menos de 2.5%. Una muestra aleatoria de tamaño 10 000 dará un margen de error en el nivel de confianza del 95% de 0.98/100, o 0.0098 - poco menos de 1%.

Márgenes máximos y específicos del error

Mientras que el margen de error normalmente se informó en los medios de comunicación es una encuesta en toda la cifra que refleja la variación de muestreo máxima de cualquier porcentaje sobre la base de todos los encuestados de que la encuesta, el término margen de error también se refiere a la radio del intervalo de confianza para un particular, estadística.

El margen de error de un porcentaje determinado individuo suele ser menor que el margen de error máximo citado para la encuesta. Este máximo sólo se aplica cuando el porcentaje observado es 50%, y el margen de error se reduce como el porcentaje se aproxima a los extremos de 0% o 100%.

En otras palabras, el margen de error máximo es el radio de un intervalo de confianza del 95% para un porcentaje reportado de 50%. Si p se aleja del 50%, el intervalo de confianza para p será más corto. Por lo tanto, el margen máximo de error representa un límite superior a la incertidumbre; uno es al menos el 95% seguro de que el "verdadero" porcentaje está dentro del margen de error máximo de un porcentaje reportado para cualquier porcentaje reportado.

Efecto del tamaño de la población

Las fórmulas anteriormente para el margen de error suponer que hay una población infinitamente grande y por lo tanto no depende del tamaño de la población de interés. De acuerdo con la teoría de muestreo, esta suposición es razonable cuando la fracción de muestreo es pequeño. El margen de error para un método de muestreo particular, es esencialmente el mismo independientemente de si la población de interés es el tamaño de una escuela, ciudad, estado, país o, siempre y cuando la fracción de muestreo es menor que 5%.

En los casos en que la fracción de muestreo sea superior a 5%, los analistas pueden ajustar el margen de error utilizando una "corrección de la población finita", para tener en cuenta la precisión adicional que se logra mediante el muestreo de cerca de un porcentaje mayor de la población. FPC se puede calcular utilizando la fórmula:

Para el ajuste de una fracción de muestreo grande, la FPC en cuenta en el cálculo del margen de error, el cual tiene el efecto de reducir el margen de error. Se sostiene que el FPC se aproxima a cero a medida que el tamaño de la muestra se acerca al tamaño de la población, que tiene el efecto de eliminar el margen de error del todo. Esto tiene sentido intuitivo porque cuando N = n, la muestra se convierte en un censo y error de muestreo se convierte en irrelevante.

Los analistas deben ser conscientes de que las muestras siguen siendo verdaderamente aleatoria como la fracción de muestreo crece, para que no se introduzca sesgo de muestreo.

Otras estadísticas

Los intervalos de confianza se pueden calcular, y tú también los márgenes de error, por una serie de estadísticas, incluyendo porcentajes específicos, las diferencias entre los porcentajes, medias, medianas y totales.

El margen de error para la diferencia entre dos porcentajes es mayor que los márgenes de error para cada uno de estos porcentajes, y puede ser incluso más grande que el margen de error máximo para cualquier porcentaje individual de la encuesta.

Comparando los porcentajes

En un sistema de votación de la pluralidad, donde el ganador es el candidato que obtenga más votos, es importante saber quién está por delante. Los términos "empate técnico" y "empate técnico" se utilizan a veces para describir porcentajes reportados que difieren en menos de un margen de error, pero estos términos pueden ser engañosos. Por un lado, el margen de error como se calcula generalmente es aplicable a un porcentaje individual y no la diferencia entre los porcentajes, por lo que la diferencia entre dos estimaciones porcentuales puede no ser estadísticamente significativa incluso cuando difieren por más que el margen de error informado. Los resultados de la encuesta también a menudo proporcionan información fuerte, incluso cuando no hay una diferencia estadísticamente significativa.

Al comparar los porcentajes, que en consecuencia puede ser útil tener en cuenta la probabilidad de que un porcentaje es más alta que otra. En situaciones sencillas, esta probabilidad se puede derivar con 1) el cálculo del error estándar introdujo anteriormente, 2) la fórmula para la varianza de la diferencia de dos variables aleatorias, y 3) la suposición de que si alguien no elige Kerry van a elegir Bush , y viceversa, sino que están perfectamente correlacionados negativamente. Esto puede no ser una suposición defendible cuando hay más de dos posibles respuestas de los sondeos. Para diseños de encuestas más complejas, se deben utilizar diferentes fórmulas para calcular el error estándar de la diferencia.

El error estándar de la diferencia de porcentajes de p y q Kerry a Bush, en el supuesto de que están perfectamente correlacionados negativamente, a continuación:

Dada la diferencia de porcentaje observado p - q y el error estándar de la diferencia calculada anteriormente, cualquier calculadora estadística se puede utilizar para calcular la probabilidad de que una muestra de una distribución normal con media y desviación estándar 0,02 0,03 es mayor que 0.

 

  • ^ "Newsweek ENCUESTA: primer debate presidencial". Newsweek. 02 de octubre 2004. Consultado el 2006-05-31.
  •  

  • ^ Wonnacott y Wonnacott, pp 4-8.
  •  

  • ^ Sudman, S.L. y Bradburn N.M. hacer preguntas. Jossey-Bass: 17-19
  •  

  • ^ tamaños de muestra, margen de error, el análisis cuantitativo
  •  

  • ^ Lohr, Sharon L.. Muestreo: Diseño y análisis. Pacific Grove, California: Duxbury Press. p. 49 - ISBN 0-534-35361-4. "El margen de error de la estimación es la mitad de la anchura del intervalo de confianza ..."
  •  

  • ^ Stokes, Lynne, Tom Belin. "¿Qué es el margen de error?". ¿Qué es una encuesta?. Encuesta sobre Métodos de Investigación Sección de la Asociación Americana de Estadística. p. 64. Consultado el 2006-05-31.
  •  

  • ^ Isserlis, L.. "Por el valor de una media calculada a partir de una muestra". Journal of the Royal Statistical Society 81: 75-81 - doi: 10.2307/2340569. JSTOR 2340569.
  •  

  • ^ renta - ingreso familiar promedio en los últimos 12 meses por Tamaño de la Familia, Oficina del Censo de EE.UU.. Consultado el 15 de febrero de 2007.
  •  

  • ^ Braiker, Brian. "La carrera ha comenzado: con los votantes ampliamente visualización Kerry como el ganador debates, Bushs llevan en la encuesta de Newsweek se ha evaporado". MSNBC, 2 de octubre de 2004 - Consultado el 2 de febrero de 2007.
  •  

  • ^ Rogosa, D. R.. Un estudio de caso de responsabilidad de la escuela: premios API de California y el condado de Orange Register margen de la locura error. En R. P. Phelps, Defender pruebas estandarizadas. Mahwah, NJ: Lawrence Erlbaum Associates.
  •  

  • ^ Drum, Kevin. Animal Político, Washington Monthly, 19 de agosto de 2004 - Consultado el 15 de febrero de 2007.