Imagina que tiramos un dado 20 veces y los resultados son los siguientes:
2, 3, 2, 5, 2, 4, 4, 1, 4, 5, 3, 5, 6, 4, 5, 3, 3, 3, 4, 1
¿Cómo calculamos la media de los valores obtenidos? Fácil. Sumamos todos los valores y los dividimos entre 20 (el número de datos).
$$\dfrac{2+3+…+4+1}{20} = \dfrac{69}{20} = 3.45$$
Fíjate que no cambiaría nada si primero ordenamos los resultados obtenidos y después calculamos su media:
1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6
$$\dfrac{(1+1)+(2+2+2)+…+(5+5+5+5)+(6)}{20} = \dfrac{69}{20} = 3,45$$
De igual forma, podemos agrupar los resultados que sean iguales. Es decir, que si el 5 ha salido cuatro veces, en vez de sumar $5+5+5+5$, calcularlo como $5 \cdot 4$.
$$\dfrac{1 \cdot 2 + 2 \cdot 3 + 3 \cdot 5 + 4 \cdot 5 + 5 \cdot 4 + 6 \cdot 1}{20} = \dfrac{69}{20} = 3,45$$
Este método nos va a permitir calcular la media cuando tenemos muchos datos. Imagina que tiramos el dado 1000 veces. En vez de realizar una lista con todos los resultados, realizamos una tabla con un recuento de los resultados.
| Resultado | Número de veces |
| 1 | 162 |
| 2 | 168 |
| 3 | 171 |
| 4 | 158 |
| 5 | 174 |
| 6 | 167 |
| 1000 |
Para calcular la media habrá que sumar 162 unos ($1 \cdot 162$) con 168 doses ($2 \cdot 168$) y así con el resto de resultados. Finalmente el resultado lo dividimos entre 1000 (el número de datos).
$$\dfrac{1 \cdot 162 + 2 \cdot 168 + 3 \cdot 171 + 4 \cdot 158 + 5 \cdot 174 + 6 \cdot 167}{1000} = \dfrac{3515}{1000} = 3,515$$
Vale. ¿Y qué tiene que ver todo esto de la media con la esperanza?
La esperanza es la media que esperamos obtener si realizamos el experimento un número elevado de veces. La designamos como $E[X]$.
Si tiro un dado 600 veces, esperamos que cada resultado salga en torno a 100 veces. Es decir, un sexto de las veces. Esa proporción esperada se corresponde con la probabilidad de cada resultado: $1/6$.
Para calcular la esperanza, creamos una tabla similar a la anterior pero con la probabilidad de cada resultado. Obviamente, la suma de todas las probabilidades será siempre 1, por lo que no será necesario dividir entre el total.
| Resultado ($x_i$) | Probabilidad ($P(x_i)$) |
| 1 | $1/6$ |
| 2 | $1/6$ |
| 3 | $1/6$ |
| 4 | $1/6$ |
| 5 | $1/6$ |
| 6 | $1/6$ |
| 1 |
$$1 \cdot \dfrac{1}{6} + 2 \cdot \dfrac{1}{6} + 3 \cdot \dfrac{1}{6} + 4 \cdot \dfrac{1}{6} + 5 \cdot \dfrac{1}{6} + 6 \cdot \dfrac{1}{6} = 3,5$$
De forma general, si llamamos $x_1$, $x_2$, $x_3$, … a los posibles resultados de una variable aleatoria discreta $X$, la esperanza se calcula multiplicando cada posible valor por su probabilidad de ocurrir:
$$\begin{array}{lll}E[X] & = & x_1 \cdot P(x_1) + x_2 \cdot P(x_2) + x_3 \cdot P(x_3) + … \\ & = & \displaystyle \sum_{i=1}^n x_i \cdot P(x_i) \end{array}$$
Varianza y desviación típica
La varianza y la desviación típica son medidas que tratan de cuantificar cómo de dispersos están los datos respecto a la media o esperanza. Si sus valores son bajos, la mayoría de los datos se agrupan en torno a ese valor.

Para calcular la varianza (escrita como $V[X]$ o $\sigma^2$), vemos a qué distancia está cada valor de la esperanza y la elevamos al cuadrado. Por ejemplo, en el caso del dado, el resultado 1 está a distancia $2.5$ de la esperanza ($1-3.5=-2.5$). Elevamos el resultado al cuadrado: $(-2.5)^2=6.25$.
Hacemos lo mismo para cada posible resultado del dado y realizamos lo mismo que para calcular la esperanza: multiplicamos cada valor por su probabilidad y los sumamos.
| Resultado ($x_i$) | $(x_i – E[X])^2$ | Probabilidad ($P(x_i)$) |
| 1 | $(1-3,5)^2=6,25$ | $1/6$ |
| 2 | $(2-3,5)^2=2,25$ | $1/6$ |
| 3 | $(3-3,5)^2=0,25$ | $1/6$ |
| 4 | $(4-3,5)^2=0,25$ | $1/6$ |
| 5 | $(5-3,5)^2=2,25$ | $1/6$ |
| 6 | $(6-3,5)^2=6,25$ | $1/6$ |
| 1 |
$$\sigma^2 = V[X] = 6,25 \cdot \dfrac{1}{6} + 2,25 \cdot \dfrac{1}{6} + 0,25 \cdot \dfrac{1}{6} + 0,25 \cdot \dfrac{1}{6} + 2,25 \cdot \dfrac{1}{6} + 6,25 \cdot \dfrac{1}{6} = 2,917$$
La varianza es, entonces, $2,917$. La desviación típica ($\sigma$) es simplemente la raíz cuadrado de este valor: $\sigma = \sqrt{2,917}=1,708$.
De forma general, tenemos:
$$\begin{array}{lll} \sigma^2 = V[X] & = & (x_1 – E[X])^2 \cdot P(x_1) + (x_2 – E[X])^2 \cdot P(x_2) + …\\ & = & \displaystyle \sum_{i=1}^n (x_i – E[X])^2 \cdot P(x_i) \end{array}$$
$$\sigma = \sqrt{V[X]}$$
También hay otra forma de calcular la varianza y la desviación típica:
$$\begin{array}{lll} \sigma^2 = V[X] & = & E[X^2] – (E[X])^2 \\ & = & (x_1)^2 \cdot P(x_1) + (x_2)^2 \cdot P(x_2) + … – (E[X])^2\\ & = & \left( \displaystyle \sum_{i=1}^n (x_i)^2 \cdot P(x_i) \right) – (E[X])^2 \end{array}$$
| Resultado ($x_i$) | $x_i^2$ | Probabilidad ($P(x_i)$) |
| 1 | $1^2=1$ | $1/6$ |
| 2 | $2^2=4$ | $1/6$ |
| 3 | $3^2=9$ | $1/6$ |
| 4 | $4^2=16$ | $1/6$ |
| 5 | $5^2=25$ | $1/6$ |
| 6 | $6^2=36$ | $1/6$ |
| 1 |
$$\sigma^2 = V[X] = 1 \cdot \dfrac{1}{6} + 4 \cdot \dfrac{1}{6} + 9 \cdot \dfrac{1}{6} + 16 \cdot \dfrac{1}{6} + 25 \cdot \dfrac{1}{6} + 36 \cdot \dfrac{1}{6} – 3,5^2= 15,167 – 12,250 = 2,917$$
Ejercicios de esperanza, varianza y desviación típica
Ejercicio
En la ruleta de un casino hay 37 casilla (del 0 al 36). Si apostamos 1 euro por un número y este sale elegido, nos darán 36 euros (el euro apostado y 35 de ganancia).
Si apostamos un euro, ¿cuánto dinero esperamos recuperar? ¿Qué dispersión tienen los resultados?
Solución
Cuando apostamos por un número de la ruleta puede que acertemos o puede que no. Como hay 37 casillas, la probabilidad de acertar es de $1/37$, por lo que la probabilidad de no hacerlo es de $36/37$. Además, en caso de acertar el dinero que nos darán será 36 euros, mientras que si no acertamos no nos darán nada.
| Dinero ($x_i$) | Probabilidad ($P(x_i)$) | |
| Acertar | 36 | $1/37$ |
| No acertar | 0 | $36/37$ |
| 1 |
Por lo tanto, podemos calcular cuánto dinero esperamos que nos devuelvan multiplicando cada posible valor por su probabilidad:
$$E[X] = 36 \cdot \dfrac{1}{37} + 0 \cdot \dfrac{36}{37} = \dfrac{36}{37} = 0,973$$
Recuperaremos unos 97 céntimos por cada euro apostado. Es decir, no sale rentable apostar. Si jugamos pocas veces, puede que tengamos suerte y ganemos algo de dinero. Pero si jugamos mucho, es casi seguro que poco a poco iremos quedándonos sin dinero.
Calculemos ahora la varianza y desviación típica de los resultados:
| Dinero ($x_i$) | $(x_i – E[X])^2$ | Probabilidad ($P(x_i)$) | |
| Acertar | 36 | $(36-\dfrac{36}{37})^2=1226,89$ | $1/37$ |
| No acertar | 0 | $(0-\dfrac{36}{37})^2=0,95$ | $36/37$ |
| 1 |
$$\sigma^2 = V[X] = 1226,89 \cdot \dfrac{1}{37} + 0,95 \cdot \dfrac{36}{37} = 34,08$$
Al realizar la raíz cuadrada de la varianza ($\sigma = \sqrt{34,08} = 5,84$) obtemos que la desviación típica es de $5,84$ euros.
Hemos visto varias propiedades de distribuciones discretas en general. Ahora vamos a centrarnos en unas detemindas distribuciones discretas que se suelen utilizar con bastante frecuencia: la distribución binomial.
