t-estadística, Definición, Utilizar, Historia, Conceptos relacionados



En estadística, la estadística t es una relación de la salida de un parámetro estimado de su valor nominal y su error estándar. Se utiliza en las pruebas de hipótesis, por ejemplo, en los estudiantes t-test, en la prueba de Dickey-Fuller aumentada, y bootstrapping.

Definición

Dejar ser un estimador del parámetro de algún modelo estadístico. A continuación, un t-estadístico de este parámetro es cualquier cantidad de la forma

donde 0 es un no aleatoria, constante y conocido, y es el error estándar del estimador. De forma predeterminada, los paquetes estadísticos informan estadístico t con 0 = 0. Sin embargo, cuando se necesita t-estadística para probar la hipótesis de la forma H0: = 0, a continuación, se puede utilizar un no-cero 0.

Si es un estimador de mínimos cuadrados ordinarios en el modelo clásico de regresión lineal, y si el verdadero valor del parámetro es igual a 0, entonces la distribución muestral del estadístico t es la t de Student de distribución con grados de libertad, donde n es el número de observaciones, y k es el número de regresores.

En la mayoría de los modelos es el estimador consistente para y distribuido asintóticamente normalmente. Si el verdadero valor del parámetro es igual a 0 y la cantidad estima correctamente la varianza asintótica de este estimador, el estadístico t tendrá forma asintótica de la distribución normal estándar.

En algunos modelos la distribución de la t-estadística es diferente de lo normal, incluso asintóticamente. Por ejemplo, cuando una serie de tiempo con la raíz de la unidad de una regresión en la prueba de Dickey-Fuller aumentada, la prueba estadística t será asintóticamente tiene una de las distribuciones de Dickey-Fuller.

Utilizar

Con mayor frecuencia, los estadísticos t se utilizan en la t de Student pruebas, una forma de pruebas de hipótesis estadísticas, como en el cálculo de ciertos intervalos de confianza.

La propiedad clave de la t-estadística es que es una cantidad pivote - mientras que se define en términos de la media de la muestra, su distribución de muestreo no depende de los parámetros de la muestra, y por lo tanto se puede utilizar independientemente de lo que estos pueden ser.

También se puede dividir un residual por la desviación estándar de la muestra:

para calcular una estimación del número de desviaciones estándar de una muestra dada es de la media, como una versión de muestra de un z-score, el z-score requieren los parámetros de la población.

Predicción

 Para más detalles sobre este tema, consulte intervalo de predicción.

Dada una distribución normal con media y varianza desconocida, el estadístico t de una observación futura después de que uno ha realizado n observaciones, es un dato auxiliar - una cantidad fundamental que es una estadística. Esto le permite a uno para calcular un intervalo de predicción frecuencial, a través de la siguiente distribución t:

Resolviendo para la distribución de los rendimientos de la predicción

de la cual uno puede calcular los intervalos de predicción de confianza - dada una probabilidad p, uno puede calcular los intervalos tales que 100p% de las veces, la siguiente observación caerá en ese intervalo.

Historia

 Para más detalles sobre este tema, consulte la prueba t de Student.

El término "estadístico t" se abrevia a "estadístico de la prueba", mientras que "estudiante" era el seudónimo de William Sealy Gosset, que introdujo el estadístico t y t-test en 1908, mientras trabajaba para la fábrica de cerveza Guinness en Dublín, Irlanda.

Conceptos relacionados

 z-score Si se conocen los parámetros de la población, entonces en vez de calcular el estadístico t, se puede calcular el z-score, análogamente, en lugar de usar un t-test, se utiliza una prueba z. Esto es poco frecuente fuera de las pruebas estandarizadas. Studentizados residual en el análisis de regresión, los errores estándar de los estimadores en diferentes puntos de datos varían, y por lo tanto uno debe dividir los diferentes residuos por diferentes estimaciones para el error, produciendo lo que se denomina residuos studentizados.