La probabilidad condicional es uno de los conceptos más importantes en estadística y ciencia de datos. Nos permite responder preguntas como:
¿Cuál es la probabilidad de que ocurra un evento A sabiendo que ya ocurrió un evento B?
En la vida real, casi ningún fenómeno ocurre de forma completamente independiente. Las variables se relacionan, se influyen y cambian entre sí. La probabilidad condicional nos da una forma matemática de actualizar nuestras expectativas cuando obtenemos nueva información.
Cuando los eventos no son independientes
Si dos eventos A y B son independientes, conocer que uno ocurrió no cambia la probabilidad del otro. Por ejemplo, lanzar una moneda y luego lanzar un dado son sucesos independientes.
Pero, ¿qué pasa si los eventos no son independientes? Entonces el hecho de que ocurra A modifica la probabilidad de que ocurra B. Esto es exactamente lo que estudia la probabilidad condicional.
Ejemplo: moneda y dado
Imaginemos un proceso aleatorio en dos pasos:
- Lanzamos una moneda.
- Probabilidad de cara = \( P(C) = P_c\)
- Probabilidad de escudo = \( P(E) = P_e = 1 – P_c\)
- Dependiendo del resultado, lanzamos un dado distinto:
- Si sale cara, lanzamos un dado de 6 caras.
- Si sale cruz, lanzamos un dado de 20 caras.
En este experimento, el tipo de dado que usamos depende del resultado de la moneda. Por tanto, el resultado del dado no es independiente del lanzamiento previo.
Calculando una probabilidad condicional
Queremos saber, por ejemplo: ¿Cuál es la probabilidad de obtener un 5 en el dado?
Existen dos formas de obtener un 5:
Caso 1: La moneda sale cara y el dado de 6 caras muestra un 5.
$$P(5 \text{ y cara}) = P(C) \times P(5|C)$$
Dado que el dado de 6 caras es justo:
$$P(5|C) = \frac{1}{6}$$
Entonces:
$$P(5 \text{ y cara}) = P_c \times \frac{1}{6}$$
Caso 2: La moneda sale cruz y el dado de 20 caras muestra un 5.
$$P(5 \text{ y cruz}) = P(E) \times P(5|E)$$
En este caso:
$$P(5|T) = \frac{1}{20}$$
Entonces:
$$P(5 \text{ y cruz}) = p_E \times \frac{1}{20}$$
La probabilidad total de obtener un 5 es la suma de ambos casos:
$$P(5) = p_H \times \frac{1}{6} + p_T \times \frac{1}{20}$$
Interpretación visual
Imagina el área total de posibles resultados del experimento como un rectángulo.
- Una parte representa los casos en que la moneda da cara y se lanza el dado de 6.
- La otra parte representa los casos con cruz y el dado de 20.
El área combinada de ambos representa la probabilidad total de obtener cualquier resultado posible. Dentro de cada zona, las franjas correspondientes al número “5” son pequeñas porciones de ese total, y su tamaño depende del tipo de dado y de la probabilidad de cada cara o cruz.
Definición formal
La probabilidad condicional de un evento A, dado que ocurrió B, se define como:
$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$
Es decir:
La probabilidad de que ocurra A dado que ocurrió B, es igual a la probabilidad de que ambos ocurran, dividida entre la probabilidad de B.
Ejemplo generalizado
Volviendo a nuestro experimento, podemos preguntar:
¿Cuál es la probabilidad de que el dado muestre 5 dado que salió cara?
Aplicamos la definición:
$$P(5|C) = \frac{P(5 \cap C)}{P(C)} = \frac{P_c \times \frac{1}{6}}{P_c } = \frac{1}{6}$$
Lo que confirma que, al saber que salió cara, solo nos interesa el dado de 6 caras, y cada resultado tiene probabilidad 1/6.
La regla del producto
De la definición anterior se deriva una relación muy útil:
$$P(A \cap B) = P(A|B) \times P(B)$$
Esta regla permite descomponer probabilidades conjuntas en términos condicionales y viceversa. También sirve para construir árboles de probabilidad, donde cada rama representa la probabilidad condicional de avanzar hacia un resultado dado.
El principio de no duplicar probabilidades
Un error común al calcular probabilidades es sumar eventos que no son independientes sin ajustar por su intersección.
Por ejemplo, si queremos la probabilidad de que ocurra A o B, debemos restar el solapamiento:
$$P(A \cup B) = P(A) + P(B) – P(A \cap B)$$
De lo contrario, estaríamos contando dos veces los casos en que A y B ocurren simultáneamente.
En Resumen
La probabilidad condicional nos enseña que la información cambia la probabilidad. Saber que algo ocurrió modifica lo que podemos esperar a continuación. Es la base de la estadística inferencial, la teoría bayesiana y gran parte del razonamiento probabilístico moderno.
Nos permite pasar de la incertidumbre total a una incertidumbre informada, paso esencial en cualquier proceso analítico.
