Distribución marginal, Caso de dos variables, Ejemplo del mundo real, Las variables continuas

En teoría de la probabilidad y la estadística, la distribución marginal de un subconjunto de un conjunto de variables aleatorias es la distribución de probabilidad de las variables contenidas en el subconjunto. Se da las probabilidades de los diversos valores de las variables en el subconjunto sin hacer referencia a los valores de las otras variables. Esto contrasta con una distribución condicional, que da las probabilidades supeditadas a los valores de las otras variables.

La variable marginal término se utiliza para referirse a aquellas variables en el subconjunto de variables que están siendo retenidas. Estos términos se doblan "marginal" porque solían ser encontrada sumando los valores en una tabla a lo largo de filas o columnas, y escribir la suma de los márgenes de la tabla. La distribución de las variables marginales se obtiene mediante la marginación de la distribución de las variables están descartados, y las variables desechados se dice que han sido marginados a cabo.

El contexto aquí es que los estudios teóricos están llevando a cabo, o el análisis de los datos se está realizando, consiste en un conjunto más amplio de variables aleatorias, pero que la atención se está limitado a un número reducido de esas variables. En muchas aplicaciones de un análisis puede comenzar con una colección dada de variables aleatorias, a continuación, primero ampliar el conjunto mediante la definición de los nuevos y, finalmente, reducir el número mediante la colocación de interés en la distribución marginal de un subconjunto. Varios análisis diferentes se pueden hacer, cada tratamiento de un subconjunto diferente de variables como las variables marginales.

Caso de dos variables

Teniendo en cuenta dos variables aleatorias X e Y cuya distribución conjunta se conoce, la distribución marginal de X es simplemente la distribución de probabilidad de X promedio de más información sobre Y. Es la distribución de probabilidad de X cuando no se conoce el valor de Y. Este cálculo se realiza normalmente mediante la suma o integración de la distribución de probabilidad conjunta sobre Y.

Para las variables aleatorias discretas, la función de masa de probabilidad marginal se puede escribir como Pr. Es

donde Pr es la distribución conjunta de X e Y, mientras que Pr es la distribución condicional de X dado Y. En este caso, la variable Y ha sido marginada a cabo.

Probabilidades marginales y conjuntas bivariado de las variables aleatorias discretas menudo se muestran como tablas de doble entrada.

Del mismo modo para las variables aleatorias continuas, la función de densidad de probabilidad marginal puede ser escrito como pX. Es

donde Px, y da la distribución conjunta de X e Y, mientras que pX | Y da la distribución condicional de X dado Y. De nuevo, la variable Y ha sido marginada a cabo.

Tenga en cuenta que una probabilidad marginal siempre se puede escribir como un valor esperado:

Intuitivamente, la probabilidad marginal de X se calcula mediante el examen de la probabilidad condicional de X dado un valor particular de Y, y luego promediando esta probabilidad condicional sobre la distribución de todos los valores de Y.

Esto se deduce de la definición de valor esperado, es decir, en general,

Ejemplo del mundo real

Supongamos que la probabilidad de que un peatón se atropellado por un coche mientras cruzaba la calle en un paso de peatones sin prestar atención a la luz del semáforo se va a calcular. Sea H una variable aleatoria discreta teniendo un valor de {Hit, Hit No}. Sea L una variable aleatoria discreta teniendo un valor de {Rojo, Amarillo, Verde}.

Siendo realistas, H dependerá de L. Es decir, P y P tomará valores distintos dependiendo de si L es de color rojo, amarillo o verde. Una persona que es, por ejemplo, mucho más propensos a ser golpeado por un coche cuando intentaba cruzar mientras que las luces de tráfico que cruza son de color verde, que si fueren rojos. En otras palabras, para cualquier posible par de valores de H y L dado, uno debe considerar la distribución de probabilidad conjunta de H y L para encontrar la probabilidad de que el par de eventos que ocurren juntos si el peatón ignora el estado de la luz.

Sin embargo, al tratar de calcular la probabilidad P marginal, lo que estamos pidiendo es la probabilidad de que H = Golpe en la situación en la que en realidad no sabemos el valor particular de L y en el que el peatón pasa por alto el estado de la luz . En general, un peatón puede ser golpeado si las luces son de color rojo o si las luces son de color amarillo o si las luces son de color verde. Así pues, en este caso la respuesta para la probabilidad marginal se puede encontrar mediante la suma de P para todos los valores posibles de L, con cada valor de L ponderada por su probabilidad de ocurrencia.

Aquí es una tabla que muestra las probabilidades condicionales de ser golpeado, dependiendo del estado de las luces.

Para conocer la distribución de probabilidad conjunta, necesitamos más datos. Digamos que P = 0,2, p = 0,1, y P = 0,7 - Multiplicando cada columna en la distribución condicional de la probabilidad de que la columna se producen, nos encontramos con la distribución de probabilidad conjunta de H y L, dado en el 23 bloque central de entradas . .

La probabilidad P marginal es la suma a lo largo del H = Hit fila de este cuadro de distribución conjunta, ya que es la probabilidad de ser golpeado cuando las luces son de color rojo, amarillo o verde. Del mismo modo, la probabilidad marginal que P es la suma de la H = No Hit fila.

Las variables continuas

Para las distribuciones multivariadas, fórmulas similares a las anteriormente se aplican con los símbolos X y/o Y se interpreta como vectores. En particular, cada suma o integración se acabarían todas las variables, salvo las contenidas en X.