Probabilidad condicionada

Hasta ahora hemos trabajado con sucesos independientes. Por ejemplo, al lanzar un dado la probabilidad de sacar un 5 es $1/6$, independientemente de cuál haya sido el resultado del anterior lanzamiento. El resultado de cada lanzamiento no depende de los demás.

Sin embargo, muchas veces las probabilidades que asignemos pueden variar según la información que tengamos. Por ejemplo, imagina que dos equipos van a jugar un partido de baloncesto. Si no tenemos ninguna información sobre ellos, la probabilidad de que uno de los equipos gane el partido será de un $50\%$. Pero si nos dicen que uno de los equipos va primero en la liga, le asignaremos una probabalidad de victoria mayor. De igual forma, la probabilidad se verá afectada por otros muchos factores: quién juega de local, si hay algún jugador lesionado, la racha de los últimos partidos…

Vamos a verlo con un ejemplo.


Estoy jugando a lanzar un dado en mi habitación y ver si el resultado es un número par o no. Aficiones que tiene uno, ¿qué pasa? Mi hermano, cansado de que haga ruido con el dichoso dado, aprovecha que lo acabo de lanzar para taparlo de forma que yo no pueda ver el resultado. ¿Cuál es la probabilidad de que haya salido un número par en el dado?

Como no tengo ninguna información sobre el resultado del lanzamiento, la probabilidad será la misma que antes de lanzarlo. Podemos calcularla fácilmente con la regla de Laplace.

3 resultados favorables (pares) de 6 posibles (todos)

Hay 3 casos favorable (que salga un 2, un 4 o un 6) de 6 casos posibles, por lo que la probabilidad de que sea un número par es:

$$P(\textrm{par}) = 3/6 = 0,5 = 50\%$$

Le pido a mi hermano que me deje ver el dado. «No te lo voy a enseñar, pero te puedo decir que el resultado es un número primo». Sí, mi hermano también es un poco friki. Si sé que el resultado es un número primo, ¿cambiará la probabilidad de que el resultado sea par?

Bueno, lo primero es tener claro cuáles son los números primos posibles. Recuerda que el número 1 no es primo, por lo que podemos descartar tanto el 1, como el 4 y el 6.

1 resultado favorable (par y primo) de 3 posibles (primos)

Por lo tanto, si sabemos que el resultado es un número primo, solo hay 3 posibilidades: que sea un 2, un 3 o un 5. De esas posibilidades, solo uno de los resultados es un número par: el 2 (el único número que es par y primo). Por lo tanto, la probalidad de que sea un número par será:

$$1/3 = 0,333 = 33,3\%$$

Esta probabilidad no es $P(par)$, «la probabilidad de que el resultado sea par», que hemos visto antes que valía $0,5$. Sino que es «la probabilidad de que el resultado sea par sabiendo que el resultado es un número primo». La información que sabemos que es cierta al 100% la ponemos a la derecha de una barra vertical. En nuestro caso quedaría así:

$$P(\textrm{par} \ \vert \ \textrm{primo})$$

Para calcular esa probabilidad hemos dividido el número de casos favorables entre el número de casos totales. El número de casos totales es 3, que corresponde con el número de resultados que son primos (estamos seguros de que el resultado de la tirada es un 2, un 3 o un 5). El número de casos favorables es 1, ya que solo hay un resultado que sea par y primo a la vez (que salga un 2).

$$P(\textrm{par} \ \vert \ \textrm{primo}) = \dfrac{\textrm{Número de casos pares y primos a la vez}}{\textrm{Número de casos primos}}$$

Si dividimos el numerador y el denominador entre 6 (el número de resultados de un dado), pasamos de «número de casos» a «probabilidad».

$$P(\textrm{par} \ \vert \ \textrm{primo}) = \dfrac{P(\textrm{par} \cap \textrm{primo})}{P(\textrm{primo})} = \dfrac{1/6}{3/6} = \dfrac{1}{3}$$

De forma general, la probabilidad condicionada se puede calcular con la siguiente fórmula:

$$P(A \ \vert \ B) = \dfrac{P(A \cap B)}{P(B)}$$


Propiedades de la probabilidad condicionada

Las propiedades de la probabilidad condicionada son básicamente las mismas que habíamos visto anteriormente, pero manteniendo la información que sabemos cierta (lo que hay a la derecha de la barra vertical). Por ejemplo, se sigue cumpliendo la regla del suceso contrario:

Suceso contrario: $P(A) = 1 – P(\overline{A})$

Suceso contrario (condicionado): $P(A \ \vert \ B) = 1 – P(\overline{A} \ \vert \ B)$

De igual forma, se cumple la regla de la probabilidad de la unión, manteniendo la información conocida:

Unión: $P(A \cup B) = P(A) + P(B) – P(A \cap B)$

Unión (condicionada): $P(A \cup B \ \vert \ C) = P(A \ \vert \ C) + P(B \ \vert \ C) – P(A \cap B \ \vert \ C)$

Si dos sucesos son independientes, que uno se cumpla no influye en el otro. Por ejemplo, si quiero sacar un 5 en el lanzamiento de un dado la probabilidad será $1/6$ independientemente de si hoy ha llovido o no:

$$P(5 \ \vert \ \textrm{lluvia}) = \dfrac{P(5 \cap \textrm{lluvia})}{P(\textrm{lluvia})} = \dfrac{P(5) \cdot P(\textrm{lluvia})}{P(\textrm{lluvia})} = P(5) = \dfrac{1}{6}$$

$$\textrm{Si A y B son independientes} \implies P(A \ \vert \ B) = P(A)$$

Lo que sí que debemos tener claro es que no es lo mismo $P(A \ \vert \ B)$ que $P(B \ \vert \ A)$, ya que lo que está a la derecha de la barra vertical es lo que sabemos que es cierto.

$$P(A \ \vert \ B) = \dfrac{P(A \cap B)}{P(B)}$$

$$P(B \ \vert \ A) = \dfrac{P(A \cap B)}{P(A)}$$

Un error común es confundir la probabilidad condicionada con la probabilidad de la intersección. En la intersección ($P(A \cap B)$) no damos ninguna información como cierta y calculamos la probabilidad de que se den A y B a la vez. En la condicionada ($P(A \ \vert \ B)$) hay un dato ($B$) que damos por cierto y se suele expresar con «sabiendo que…», «de aquellos que…», «si se cumple…» o similar.


Ejercicios de la probabilidad condicionada

Veamos algún ejemplo:

Ejercicio

En una empresa hay 1000 trabajadores, el 30% son hombres. En el departamento de Informática hay 50 trabajadores, de los cuales 20 son mujeres. Si elegimos una persona al azar, calcula la probabilidad de que sea:

  • Si sabemos que es un hombre, la probabilidad de que sea del departamento de Informática.
  • Si sabemos que es una mujer, la probabilidad de que sea del departamento de Informática.
  • Si sabemos que es del departamento de informática, la probabilidad de que sea una mujer.
  • Si sabemos que es del departamento de informática, la probabilidad de que sea un hombre.

Solución

Lo primero que tenemos que hacer es asignar nombres a los sucesos:

  • $\textrm{Hom}$: que sea un hombre.
  • $\textrm{Muj}$: que sea una mujer.
  • $\textrm{Inf}$: que sea del departamento de Informática.

Antes de calcular nada, tenemos que traducir la información del enunciado a lenguaje matemático:

  • «El 30% son hombres»: la probabilidad de ser un hombre es $P(\textrm{Hom}) = 0,3$. Además, podemos deducir que la probabilidad de ser mujer es $P(\textrm{Muj}) = 0,7$.
  • «En el departamento de Informática hay 50 trabajadores, de los cuales 20 son mujeres»: la probabilidad de ser del departamento de Informática es $P(\textrm{Inf}) = 50/1000 = 0,05$. La probabilidad de ser mujer y del departamento de Informática es $P(\textrm{Muj} \cap \textrm{Inf}) = 20/1000 = 0,02$. Además, podemos deducir que habrá 30 hombres en el departamento de Informática: $P(\textrm{Hom} \cap \textrm{Inf}) = 30/1000 = 0,03$.

También tenemos que traducir a lenguaje matemático las preguntas del problema para poder resolverlas:

  • Si sabemos que es un hombre, la probabilidad de que sea del departamento de Informática: $P(\textrm{Inf} \ \vert \ \textrm{Hom})$
  • Si sabemos que es una mujer, la probabilidad de que sea del departamento de Informática: $P(\textrm{Inf} \ \vert \ \textrm{Muj})$
  • Si sabemos que es del departamento de informática, la probabilidad de que sea una mujer: $P(\textrm{Muj} \ \vert \ \textrm{Inf})$
  • Si sabemos que es del departamento de informática, la probabilidad de que sea un hombre: $P(\textrm{Hom} \ \vert \ \textrm{Inf})$

Como podemos ver, una parte importante a la hora de resolver un problema es ser capaz de traducir el enunciado a lenguaje matemático. Una vez hecho, ya podemos resolverlo.

$$P(\textrm{Inf} \ \vert \ \textrm{Hom}) = \dfrac{P(\textrm{Inf} \cap \textrm{Hom})}{P(\textrm{Hom})} = \dfrac{0,03}{0,3} = 0,1$$

Si sabemos que es un hombre, la probabilidad de que sea del departamento de Informática es $0,1$ ($10\%$). Podemos comprobarlo viendo que hay 30 hombres en el departamento de Informática de 300 hombres en total que ha en la empresa: $30/300 = 0,1$.

$$P(\textrm{Inf} \ \vert \ \textrm{Muj}) = \dfrac{P(\textrm{Inf} \cap \textrm{Muj})}{P(\textrm{Muj})} = \dfrac{0,02}{0,7} = 0,029$$

Si sabemos que es una mujer, la probabilidad de que sea del departamento de Informática es $0,029$ ($2,9\%$). En efecto, hay 20 mujeres en el departamento de Informática de un total de 700 mujeres que hay en la empresa: $20/700 = 0,029$.

$$P(\textrm{Muj} \ \vert \ \textrm{Inf}) = \dfrac{P(\textrm{Muj} \cap \textrm{Inf})}{P(\textrm{Inf})} = \dfrac{0,02}{0,05} = 0,4$$

Si sabemos que es del departamento de informática, la probabilidad de que sea una mujer es $0,4$ ($40\%$). También lo podíamos haber calculado sin fórmulas sabiendo que en el departamento de Informática hay 50 personas, de las cuales 20 son mujeres: $20/50 = 0,4$.

Para calcular la última probabilidad podemos utilizar la fórmula de la probabilidad condicionada o utilizar el suceso contrario:

$$P(\textrm{Hom} \ \vert \ \textrm{Inf}) = 1 – P(\textrm{Muj} \ \vert \ \textrm{Inf}) = 1 – 0,4 = 0,6$$

Si en el departamento de Informática el 40% de los trabajadores son mujeres, el 60% serán hombres. Efectivamente, en el departamento de Informática hay 50 trabajadores, de los cuales 30 son hombres: $30/50 = 0,6$.


Las probabilidades en el mundo real no suelen ser algo fijo, sino que van variando en función de la información que tenemos. Hemos visto anteriormente cómo calcular la probabilidad de la intersección de sucesos independientes. Es turno ahora de calcular la probabilidad de la intersección de sucesos dependientes.