Error Cuadrático Medio (Mean Squared Error o MSE)

Cuando construimos un modelo de regresión, el objetivo principal es realizar predicciones lo más cercanas posible a los valores reales. Sin embargo, ningún modelo es perfecto. Siempre existirá cierta diferencia entre lo que el modelo predice y lo que realmente ocurre. Para medir esa diferencia utilizamos métricas de evaluación, siendo una de las más importantes el Error Cuadrático Medio (Mean Squared Error o MSE).

El MSE es una de las métricas más utilizadas en Machine Learning y estadística porque proporciona una medida clara de cuánto se equivocan, en promedio, las predicciones de un modelo.

¿Qué es el error cuadrático medio?

El error cuadrático medio mide el promedio de los errores al cuadrado entre los valores reales y los valores predichos por un modelo.

En términos simples:

Calculamos la diferencia entre el valor real y la predicción.
Elevamos esa diferencia al cuadrado.
Sumamos todos los errores cuadrados.
Dividimos entre el número total de observaciones.

La fórmula matemática es:

$$MSE=\frac{1}{n}\sum_{i=1}^{n}(y_i-\hat{y}_i)^2$$

Donde:

n = número de observaciones.
yᵢ = valor real.
ŷᵢ = valor predicho por el modelo.
(yᵢ − ŷᵢ)² = error cuadrado para cada observación.

¿Por qué se eleva el error al cuadrado?

Podríamos preguntarnos por qué no simplemente promediar los errores.

Supongamos estas diferencias:

Valor Real	Predicción	Error
100	90	10
50	60	-10

Si calculamos el promedio de los errores:

$$\frac{10 + (-10)}{2}=0$$

El resultado sería cero, sugiriendo incorrectamente que el modelo no se equivoca.

Al elevar cada error al cuadrado:

$$10^2 = 100$$
$$(-10)^2 = 100$$

Ambos errores contribuyen positivamente al resultado final, evitando cancelaciones. Además, el cuadrado penaliza más severamente los errores grandes, algo muy útil en muchos problemas de negocio.

Ejemplo de Cálculo Paso a Paso

Supongamos que tenemos un modelo que predice la recaudación de películas.

Película	Valor Real	Predicción
A	100	90
B	150	160
C	200	180

Paso 1: Calcular los errores

Película	Error
A	10
B	-10
C	20

Paso 2: Elevar al cuadrado

Película	Error²
A	100
B	100
C	400

Paso 3: Calcular la media

$$MSE = \frac{100 + 100 + 400}{3}$$
$$MSE = \frac{600}{3}$$
$$MSE = 200$$

El Error Cuadrático Medio del modelo es:

$$MSE = 200$$

Interpretación del MSE

La interpretación básica es sencilla:

MSE pequeño → El modelo realiza buenas predicciones.
MSE grande → El modelo comete errores importantes.

Sin embargo, existe un detalle importante. Debido a que los errores se elevan al cuadrado, las unidades también quedan elevadas al cuadrado. Esto hace que la interpretación directa del valor sea menos intuitiva.

Sensibilidad a los Valores Atípicos

Una de las principales características del MSE es que penaliza fuertemente los errores grandes. Veamos un ejemplo.

Modelo A

Errores:

$$2,3,4$$

MSE:

$$\frac{4+9+16}{3}=9.67$$

Modelo B

Errores:

$$1,1,10$$

MSE:

$$\frac{1+1+100}{3}=34$$

Aunque la mayoría de los errores del segundo modelo son pequeños, un único error grande provoca que el MSE aumente considerablemente. Por este motivo, el MSE es especialmente útil cuando queremos detectar y penalizar predicciones muy alejadas de la realidad.

Ventajas del MSE

Fácil de calcular: La fórmula es sencilla y eficiente incluso para grandes volúmenes de datos.
Penaliza errores grandes: Los errores importantes tienen un peso mucho mayor que los errores pequeños. Esto resulta útil en aplicaciones donde los fallos graves tienen un alto coste económico o operativo.
Compatible con muchos algoritmos: Numerosos algoritmos de Machine Learning utilizan el MSE como función objetivo durante el entrenamiento. Por ejemplo:
- Regresión Lineal.
- Redes Neuronales.
- Gradient Boosting.
- XGBoost.
- Random Forest Regressor.

Limitaciones del MSE

Sensibilidad a Outliers: Los valores atípicos pueden dominar completamente la métrica. Un único error extremo puede aumentar significativamente el MSE.
Interpretación menos intuitiva: Al estar expresado en unidades al cuadrado, resulta más difícil comprender su significado práctico. Por esta razón suele utilizarse junto con otras métricas.

Relación con el RMSE

Una métrica muy popular derivada del MSE es el Root Mean Squared Error (RMSE). Su fórmula es:

$$RMSE=\sqrt{MSE}$$

Por ejemplo:

Si:

$$MSE = 200$$

entonces:

$$RMSE = \sqrt{200}$$
$$RMSE \approx 14.14$$

La ventaja es que el RMSE vuelve a expresarse en las mismas unidades de la variable objetivo, facilitando la interpretación. Si estamos prediciendo ingresos en miles de euros, un RMSE de 14 indica que el modelo se equivoca aproximadamente en 14 mil euros por predicción.

MSE en Machine Learning

Durante el entrenamiento de muchos modelos de regresión, el algoritmo intenta minimizar el MSE. Esto significa que ajusta sus parámetros para que la suma de los errores cuadrados sea lo más pequeña posible. En una regresión lineal, por ejemplo, el proceso de aprendizaje consiste precisamente en encontrar los coeficientes de la recta que minimizan el Error Cuadrático Medio sobre los datos de entrenamiento. En otras palabras, el modelo aprende buscando la línea que produzca el menor MSE posible.

¿Cuándo utilizar el MSE?

El MSE es especialmente recomendable cuando:

Estamos trabajando con problemas de regresión.
Los errores grandes son especialmente costosos.
Queremos una métrica sensible a predicciones muy alejadas del valor real.
Necesitamos una función objetivo para optimizar modelos.

Por el contrario, si los datos contienen muchos valores atípicos o deseamos una métrica más robusta, puede ser conveniente complementar el análisis con métricas como el MAE (Mean Absolute Error).

MSE en Python

La biblioteca Scikit-Learn incluye la función mean_squared_error(), que permite calcular fácilmente el Error Cuadrático Medio de un modelo de regresión. Una vez generadas las predicciones, basta con comparar los valores reales con los valores estimados.

Supongamos que tenemos los siguientes valores reales y predicciones:

from sklearn.metrics import mean_squared_error

# Valores reales
y_true = [100, 150, 200]

# Predicciones
y_pred = [90, 160, 180]

# Calcular MSE
mse = mean_squared_error(y_true, y_pred)

print(f"MSE: {mse:.2f}")

from sklearn.metrics import mean_squared_error

# Valores reales
y_true = [100, 150, 200]

# Predicciones
y_pred = [90, 160, 180]

# Calcular MSE
mse = mean_squared_error(y_true, y_pred)

print(f"MSE: {mse:.2f}")

MSE: 200.00

MSE: 200.00

Este resultado coincide con el ejemplo calculado manualmente anteriormente.

Cálculo Tras Entrenar un Modelo

En un flujo de trabajo real, el MSE suele calcularse después de entrenar el modelo y generar predicciones sobre el conjunto de prueba.

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# División Train/Test
X_train, X_test, y_train, y_test = train_test_split(
    X,
    y,
    test_size=0.2,
    random_state=42
)

# Crear modelo
model = LinearRegression()

# Entrenar
model.fit(X_train, y_train)

# Predicciones
y_pred = model.predict(X_test)

# Calcular MSE
mse = mean_squared_error(y_test, y_pred)

print(f"MSE: {mse:.2f}")

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# División Train/Test
X_train, X_test, y_train, y_test = train_test_split(
    X,
    y,
    test_size=0.2,
    random_state=42
)

# Crear modelo
model = LinearRegression()

# Entrenar
model.fit(X_train, y_train)

# Predicciones
y_pred = model.predict(X_test)

# Calcular MSE
mse = mean_squared_error(y_test, y_pred)

print(f"MSE: {mse:.2f}")

Comparando Varios Modelos

Una práctica habitual consiste en entrenar varios algoritmos y comparar sus valores de MSE.

from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

models = {
    "Linear Regression": LinearRegression(),
    "Random Forest": RandomForestRegressor(random_state=42)
}

for name, model in models.items():

    model.fit(X_train, y_train)

    y_pred = model.predict(X_test)

    mse = mean_squared_error(y_test, y_pred)

    print(f"{name}: MSE = {mse:.2f}")

from sklearn.linear_model import LinearRegression
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

models = {
    "Linear Regression": LinearRegression(),
    "Random Forest": RandomForestRegressor(random_state=42)
}

for name, model in models.items():

    model.fit(X_train, y_train)

    y_pred = model.predict(X_test)

    mse = mean_squared_error(y_test, y_pred)

    print(f"{name}: MSE = {mse:.2f}")

En general:

Cuanto menor sea el MSE, mejor será el modelo.
Un MSE de cero indica predicciones perfectas.
Valores elevados indican errores importantes.

Relación con RMSE

A menudo se calcula también la raíz cuadrada del MSE para obtener una métrica más interpretable:

from sklearn.metrics import mean_squared_error
import numpy as np

mse = mean_squared_error(y_test, y_pred)

rmse = np.sqrt(mse)

print(f"MSE: {mse:.2f}")
print(f"RMSE: {rmse:.2f}")

from sklearn.metrics import mean_squared_error
import numpy as np

mse = mean_squared_error(y_test, y_pred)

rmse = np.sqrt(mse)

print(f"MSE: {mse:.2f}")
print(f"RMSE: {rmse:.2f}")

El RMSE se expresa en las mismas unidades que la variable objetivo, mientras que el MSE está expresado en unidades al cuadrado.

Utilizando NumPy

Aunque Scikit-Learn es la opción más habitual, también podemos calcular el MSE manualmente utilizando NumPy:

import numpy as np

y_true = np.array([100, 150, 200])
y_pred = np.array([90, 160, 180])

mse = np.mean((y_true - y_pred) ** 2)

print(f"MSE: {mse:.2f}")

import numpy as np

y_true = np.array([100, 150, 200])
y_pred = np.array([90, 160, 180])

mse = np.mean((y_true - y_pred) ** 2)

print(f"MSE: {mse:.2f}")

Este cálculo implementa directamente la fórmula matemática del Error Cuadrático Medio y produce exactamente el mismo resultado que mean_squared_error().

Conclusión

El Error Cuadrático Medio (MSE) es una de las métricas fundamentales para evaluar modelos de regresión. Su principal objetivo es medir cuánto se alejan las predicciones de los valores reales, penalizando especialmente los errores grandes. Esta característica lo convierte en una herramienta extremadamente útil tanto para evaluar modelos como para entrenarlos.

Aunque su interpretación puede resultar menos intuitiva debido a las unidades al cuadrado, su simplicidad matemática y su capacidad para detectar errores significativos explican por qué sigue siendo una de las métricas más utilizadas en Machine Learning, Estadística y Ciencia de Datos. Comprender cómo funciona el MSE es un paso esencial para analizar el rendimiento de cualquier modelo predictivo y tomar decisiones informadas durante el proceso de modelado.