Imagina que tenemos una tienda y queremos estudiar cuántos clientes entran cada hora. Tomamos datos durante unos días y observamos que entran, de media, unos 3 clientes cada hora. Sí, parece que no tiene mucho éxito la tienda.
¿Cómo podríamos calcular la probabilidad de que entre un único cliente durante la próxima hora? Con la distribución de Poisson. Utilizaremos la letra griega $\lambda$ (lambda) para el valor de la media (también hay quien utiliza la letra $\mu$). Podemos calcular la probabilidad de que un evento ocurra $k$ veces con la siguiente fórmula:
$$P(X=k) = \dfrac{e^{-\lambda} \cdot \lambda^k}{k!}$$
Recuerda:
$e=2,7182…$
$7! = 7 \cdot 6 \cdot 5 \cdot \ldots \cdot 2 \cdot 1$
$0! = 1$
Con las siguientes propiedades:
- Esperanza: $\lambda$
- Varianza: $\lambda$
- Desviación típica: $\sqrt{\lambda}$
En nuestra tienda cada hora entran 3 clientes de media, por lo que $\lambda = 3$. Queríamos calcular la probabilidad de que entrase un único cliente durante la próxima hora, por lo que $k = 1$. De esta forma:
$$P(X=1) = \dfrac{e^{-3} \cdot 3^1}{1!} = 0,149$$
Cambiar la unidad de tiempo
Quedan 4 horas para que cierre la tienda. Vamos a calcular la probabilidad de que vengan 4 clientes antes de que cierre.
En la distribución de Poisson la media siempre está ligada a una unidad de tiempo. Si cambiamos la unidad de tiempo, también cambiará la media de forma proporcional.
Tenemos que calcular la media de clientes que entrarán en la tienda en 4 horas. Como la unidad de tiempo se ha multiplicado por 4, también lo hará por la misma cantidad el número de clientes:
$$\lambda = 3 \quad (\textrm{1 hora}) \implies \lambda = 3 \cdot 4 = 12 \quad (\textrm{4 horas})$$
Una vez ajustada la unidad de tiempo a 4 horas, podemos calcular la probabilidad de que vengan 4 clientes en ese tiempo:
$$P(X=4) = \dfrac{e^{-12} \cdot 12^4}{4!} = 0,005$$
Es importante no cometer el error de creer que «que vengan 4 clientes en 4 horas» es lo mismo a que venga un cliente cada hora. Estaríamos ignorando muchos casos, como que vengan 2 clientes en la primera hora, uno en la segunda, ninguno en la tercera y uno en la cuarta. Entre muchos otros casos.
Error común con Poisson
Es importante no confundir los casos «tres clientes cada hora» con «un cliente cada 3 horas».
- «Tres clientes cada hora»: $\lambda = 3$ (unidad de tiempo: 1 hora).
- «Un cliente cada 3 horas»: $\lambda = 1$ (unidad de tiempo: 3 horas) o, lo que es lo mismo, $\lambda = \dfrac{1}{3}$ (unidad de tiempo: 1 hora).
Si llega un cliente cada 3 horas, es como decir que cada hora llega, de media, un tercio de cliente.
Binomial vs. Poisson
Las distribuciones binomial y Poisson son las más utilizadas en probabilidad discreta. En ocasiones puede ser difícil determinar cuándo usar una y cuándo la otra. Esto se debe a que tienen varias semejanzas:
- Ambas son distribuciones de probabilidad discreta. Por ejemplo, pueden entrar tres, cuatro o diecisiete personas en una tienda, pero nunca 2,56 personas.
- Ambas responden a la misma pregunta: la probabilidad de que un suceso ocurra un número determinado de veces. Por ejemplo, el número de días que ha llovido en una semana o el número de llamadas recibidas en una hora.
Eso sí, también hay diferencias entre ellas:
- Conocemos distinta información. Mientras que en la distribución de Poisson solo conocemos la media (asociada a una unidad de tiempo), en la distribución binomial conocemos el número de veces que se realiza un experimento y la probabilidad de cada experimento.
- La distribución binomial tiene un tope. Si lanzamos una moneda 10 veces, el número de caras es imposible que sea mayor que 10. Sin embargo, si sabemos que una tienda entran unas 10 personas al día, puede que hoy entren siete, cien o incluso mil personas (es poco probable, eso sí).
Esta segunda diferencia quizás sea la más útil para distinguir una distribución de otra.
Ejercicios de la distribución de Poisson
Ejercicio
Un servicio de atención telefónica recibe una media de 2 llamadas cada minuto.
Calcula la probabilidad de que reciba alguna llamada durante el próximo minuto.
Solución
Como siempre, lo primero que hacemos es sacar la información del enunciado:
- «Un servicio de atención telefónica recibe una media de 2 llamadas cada minuto»: $\lambda = 2$ (unidad de tiempo: 1 minuto).
- «Calcula la probabilidad de que reciba alguna llamada durante el próximo minuto»: $P(\textrm{llamadas} \ge 1)$
Como la pregunta hace referencia al número de llamadas en «un minuto» y este coincide con la unidad de tiempo, el valor de $\lambda$ ya está ajustado a la unidad de tiempo.
Si recibe «alguna llamada», hay muchos casos a considerar. Infinitos, de hecho. Puede recibir una llamada, dos, tres, cincuenta, cien… Por lo tanto, consideramos el caso contrario. Lo contrario de «recibir alguna llamada» es «no recibir ninguna».
$$P(\textrm{llamadas} \ge 1) = 1 – P(\textrm{llamadas} = 0)$$
La probabilidad de no recibir ninguna llamada es:
$$P(\textrm{llamadas}=0) = \dfrac{e^{-2} \cdot 2^0}{0!} = 0,1353$$
Por lo tanto, la probabilidad de recibir alguna llamada es:
$$P(\textrm{llamadas} \ge 1) = 1 – 0,1353 = 0,8647$$
Ejercicio
Un servicio de atención telefónica recibe una media de 2 llamadas cada minuto.
Calcula la probabilidad de que reciba menos de 3 llamadas durante los próximos 5 minutos.
Solución
Sacamos la información del enunciado:
- «Un servicio de atención telefónica recibe una media de 2 llamadas cada minuto»: $\lambda = 2$ (unidad de tiempo: 1 minuto).
- «Calcula la probabilidad de que reciba menos de 3 llamadas durante los próximos 5 minutos»: $P(\textrm{llamadas5min} < 3)$
La pregunta hace referencia al número de llamadas en «5 minutos», mientras que el valor de $\lambda$ tiene «1 minuto» de unidad de tiempo. Por lo tanto, tenemos que ajustarlo:
$$\lambda = 2 \quad (\textrm{1 minuto}) \implies \lambda = 2 \cdot 5 = 10 \quad (\textrm{5 minutos})$$
Utilizaremos el valor $\lambda = 10$ (unidad de tiempo: 5 minutos) para resolver el problema.
Si recibe «menos de 3 llamadas» puede recibir cero, una o dos llamadas. Ten en cuenta que «menos de 3 llamadas» no incluye la posibilidad de recibir exactamente 3 llamadas. Calculamos cada una de estas probabilidades:
$$P(\textrm{llamadas5min}=0) = \dfrac{e^{-10} \cdot 10^0}{0!} = 0,0000$$
$$P(\textrm{llamadas5min}=1) = \dfrac{e^{-10} \cdot 10^1}{1!} = 0,0005$$
$$P(\textrm{llamadas5min}=2) = \dfrac{e^{-10} \cdot 10^2}{2!} = 0,0023$$
Por lo tanto, la probabilidad de recibir menos de 3 llamadas en 5 minutos es:
$$P(\textrm{llamadas5min} < 3) = 0,0000 + 0,0005 + 0,0023 = 0,0028$$
Ejercicio
Una tienda recibe una media de un cliente cada 5 minutos.
Si la tienda abre a las 9 de la mañana. Calcula la probabilidad de que el primer cliente llegue pasadas las 9 horas y 8 minutos.
Solución
Sacamos la información del enunciado:
- «Una tienda recibe una media de un cliente cada 5 minutos»: $\lambda = 1$ (unidad de tiempo: 5 minutos) o, lo que es lo mismo, $\lambda = \dfrac{1}{5}$ (unidad de tiempo: 1 minuto).
- «Si la tienda abre a las 9 de la mañana. Calcula la probabilidad de que el primer cliente llegue pasadas las 9 horas y 8 minutos»: queremos calcular la probabilidad de que no llegue ningún cliente durante los primeros 8 minutos. Es decir, $P(\textrm{clientes8min} = 0)$
Antes de empezar a calcular las probabilidades tenemos que ajustar el valor de $\lambda$ a la unidad de tiempo de la pregunta (8 minutos):
$$\lambda = \dfrac{1}{5} \quad (\textrm{1 minuto}) \implies \lambda = \dfrac{1}{5} \cdot 8 = \dfrac{8}{5} \quad (\textrm{8 minutos})$$
Utilizaremos el valor $\lambda = \dfrac{8}{5}$ (unidad de tiempo: 8 minutos) para resolver el problema.
Calculamos la probabilidad de no recibir ningún cliente en 8 minutos.
$$P(\textrm{clientes8min}=0) = \dfrac{e^{\left(-\dfrac{8}{5}\right)} \cdot \left(\dfrac{8}{5}\right)^0}{0!} = 0,2019$$
