Capítulo 4 Conclusiones

4.1 Hallazgos principales

A partir del análisis exploratorio de los datos de COVID-19 en el departamento del Atlántico, se pueden establecer las siguientes conclusiones:

Distribución demográfica:
La población entre 30 y 40 años fue la más afectada, lo cual es consistente con su mayor movilidad y exposición laboral. Se observó una ligera predominancia de casos en el género masculino.

Distribución geográfica:
Barranquilla concentró la gran mayoría de los casos positivos del departamento, seguida por Soledad y Malambo. Esta concentración es esperada dado el peso poblacional y económico de estas ciudades. Sin embargo, municipios como Tubará mostraron tasas de mortalidad comparativamente más altas, posiblemente asociadas a menor acceso a servicios de salud.

Evolución temporal:
Se identificó un pico pronunciado de casos en el primer semestre de 2021. A partir de 2022, los casos descendieron de manera sostenida, coincidiendo con la masificación del plan de vacunación nacional.

Tipo de contagio:
El contagio comunitario (68%) fue el predominante, lo que refleja la dificultad de rastrear la fuente de contagio durante los picos de la pandemia.

Mortalidad:
La tasa de mortalidad global fue del 2.5%. La mediana de días hasta fallecimiento fue de 19 días desde el inicio de síntomas, con alta variabilidad.

Tiempo de recuperación:
La distribución de días de recuperación es fuertemente asimétrica. La mediana (15 días) es más representativa que la media (23 días) dado el efecto de casos extremos. El 50% de los pacientes se recuperaron entre 14 y 21 días.

Correlaciones:
La matriz de Spearman no reveló correlaciones significativas entre edad, días de recuperación y días hasta fallecimiento. Esto sugiere que la edad por sí sola no es un predictor suficiente del tiempo de recuperación.


4.2 Propuesta de modelo predictivo

Con base en el EDA, se propone construir un modelo para estimar los días de recuperación (dias_recuperacion) a partir de las siguientes variables:

Variable Tipo Justificación
edad_anos Numérica Factor biológico de riesgo
sexo Categórica Diferencias en evolución clínica
tipo_de_contagio Categórica Posible relación con carga viral
nombre_municipio Categórica Variabilidad en acceso a salud

Se recomienda explorar modelos de regresión lineal múltiple como línea base, y comparar con modelos más flexibles (árboles de decisión, Random Forest) para capturar posibles no linealidades.