Este proyecto explora la predicción de cáncer de pulmón mediante técnicas de clasificación de Machine Learning, utilizando un conjunto de datos con variables clínicas relevantes. Se realizaron análisis exploratorios para identificar patrones, se entrenaron distintos modelos de clasificación y se evaluó su desempeño. Los resultados destacan la importancia de ciertas características en la detección temprana, proporcionando insights valiosos para posibles aplicaciones en el ámbito médico.
El objetivo principal de este análisis es segmentar a los clientes de tarjetas de crédito en grupos significativos con base en su comportamiento financiero, y describir cada grupo para facilitar la toma de decisiones estratégicas dentro del negocio. Para ello se utilizó herramientas de aprendizaje no supervisado como PCA para reducción de dimensionalidad K-Means, para lograr segmentar los clientes. Con estas herramientas fue posible segmentar a la clientes en cuatro grupos con características significativas.
En este proyecto se aplicaron técnicas de aprendizaje no supervisado (KMeans, DBSCAN) y supervisado (Regresión Logística, Random Forest) para analizar el comportamiento financiero de clientes que solicitan crédito bancario. El objetivo principal es clasificar a los solicitantes en buenos y malos pagadores minimizando el riesgo crediticio, considerando que aprobar un crédito a un mal cliente tiene un costo cinco veces mayor que rechazar incorrectamente a un buen cliente.
Este proyecto explora el uso de bicicletas compartidas de Cyclistic mediante el análisis de datos históricos. Se examinan variables como la duración de los viajes, las horas y días de mayor actividad, y las diferencias estacionales en el comportamiento de los usuarios. Con base en estos hallazgos, se proponen estrategias orientadas a incentivar la conversión de usuarios ocasionales en miembros anuales, incluyendo promociones, pruebas gratuitas y campañas digitales.
Este proyecto forma parte del programa Google Business Intelligence Certificate y está completamente desarrollado en inglés. Simula un proceso de entrevista para una posición de analista BI en el centro de atención de Google Fiber. El objetivo es analizar tendencias en llamadas repetidas de clientes mediante un dashboard interactivo creado en Tableau. A partir de los datos del primer trimestre de 2022, se busca identificar qué tipos de problemas generan más llamadas repetidas, en qué mercados ocurren con mayor frecuencia y cómo se distribuyen a lo largo de los días de la semana.
Este proyecto muestra la distribución del conteo de armas registradas en México durante el año 2024, segmentado por entidad federativa, tipo de arma y motivo de registro. A través de visualizaciones interactivas, se busca identificar los estados con mayor número de registros, el motivo de uso más frecuente y las tendencias por trimestre. Los datos provienen de registros públicos de la SEDENA y se limitan, por el momento, a los trimestres completos disponibles del año 2024. Este análisis busca apoyar la comprensión de los patrones geográficos y sociales relacionados con el registro de armas de fuego en el país.