Autor: Fernando
-
Probabilidad y Modelos Probabilísticos
La probabilidad es una herramienta matemática que nos permite cuantificar la incertidumbre asociada a fenómenos aleatorios. A través de ella, podemos estimar la posibilidad de que ocurran ciertos eventos y construir modelos que representen el comportamiento de sistemas inciertos: desde el lanzamiento de un dado hasta la predicción de enfermedades o el rendimiento de un…
-
Experimento Aleatorio, Espacio Muestral y Eventos
¿Qué es un Experimento Aleatorio? Se refiere a cualquier proceso o acción que se realiza bajo condiciones específicas y controladas, pero que, sin embargo, puede producir diferentes resultados en cada realización, sin que sea posible predecir con certeza cuál será el resultado específico en una instancia particular del experimento. La característica distintiva de un experimento aleatorio…
-
Conjuntos en Estadística: Fundamentos y Aplicación en Python
Los conjuntos son uno de los conceptos más básicos y a la vez más importantes en estadística y probabilidad. Toda la teoría de la probabilidad —y, por extensión, gran parte del análisis estadístico— se construye sobre la teoría de conjuntos, que nos permite describir y razonar sobre eventos, muestras y resultados posibles. ¿Qué es un…
-
Probabilidad vs Estadística: Mirar Hacia Adelante o Mirar Hacia Atrás
Cuando trabajamos con datos, es muy común escuchar los términos probabilidad y estadística. A menudo se usan de manera indistinta, pero en realidad representan dos enfoques complementarios dentro del análisis cuantitativo: uno mira hacia el futuro y el otro hacia el pasado. ¿Qué es la Probabilidad? La probabilidad es la rama de la matemática que…
-
Guía rápida de referencia: Expresiones Regulares en Python
Las expresiones regulares son una herramienta esencial en Python para buscar, validar y transformar texto. Se implementan a través del módulo estándar re, que proporciona funciones como search(), match(), findall(), split() o sub(). Puedes experimentar tus expresiones directamente en regex101.com seleccionando el motor Python. Clases de Caracteres Expresión Descripción [ABC] Coincide con cualquiera de los…
-
La Paradoja de Simpson: Cuando los Datos Cuentan Historias Contradictorias
En ciencia de datos y estadística, las decisiones que tomamos dependen directamente de cómo analizamos la información. A menudo confiamos en medidas estadísticas como medias, proporciones o correlaciones para sacar conclusiones. Sin embargo, a veces las tendencias cambian drásticamente cuando separamos los datos en grupos o los combinamos. A este fenómeno se le conoce como…
-
Correlación entre Variables Categóricas
En este articulo veremos cómo estudiar la asociación entre dos variables categóricas. Ejemplo: Inventario de Personalidad Narcisista (NPI-40) El Inventario de Personalidad Narcisista (NPI-40) es un cuestionario que evalúa rasgos narcisistas a través de 40 ítems con opciones A o B. Las respuestas se puntúan para determinar el nivel de narcisismo, que puede variar de…
-
Correlación entre Variables Cuantitativas y Categóricas
Cómo evaluar la asociación entre una variable cuantitativa (por ejemplo, una puntuación o precio) y una variable categórica (por ejemplo, tipo de escuela, zona, o profesión). Ejemplo: Datos de Estudiantes Supongamos que tenemos un conjunto de datos de estudiantes de dos escuelas portuguesas. Contiene la siguiente información: Queremos responder: ¿Las puntuaciones de matemáticas (G3) están…
-
Correlación: Cómo Entender la Relación entre Variables
En este articulo se explora la correlación entre diferentes factores y se estima hasta qué punto son confiables sus relaciones. Además, aborda sobre los diferentes tipos de análisis que podemos realizar para descubrir la relación entre los datos: análisis univariado, bivariado y multivariado. Cualquier conjunto de datos que queramos analizar tendrá diferentes campos (columnas) con…
-
EDA Avanzada: Exploración de Datos con Estadística Descriptiva y Visualización
¿Qué cubre el análisis de datos exploratorios avanzados? Varianza Calcular la media, mediana y moda es un buen comienzo para comprender la forma general de un conjunto de datos. Pero esas tres estadísticas solo cuentan parte de la historia. Considera los dos conjuntos siguientes: Ambos tienen la misma media y mediana (0), pero claramente no…
