Sesiones del taller
A continuación se presenta un resumen de los contenidos y foco de trabajo de cada una de las seis sesiones.
Sesión 1 — Introducción a Data Science y Python
- ¿Qué es Data Science y por qué es relevante?
- Rol del Data Scientist.
- Entornos de trabajo: Google Colab y CoCalc.
- Primeros pasos con
numpyypandas:- creación de arreglos
- carga y exploración básica de un
DataFrame.
Presentación:
01_Presentaciones/Sesion1_Introduccion_Python.pdf
Notebook sugerido:
03_Notebooks/01_Sesion_01.ipynb
Sesión 2 — Análisis Exploratorio de Datos (EDA)
- Concepto de EDA como etapa inicial del ciclo de Data Science.
- Limpieza de datos:
- valores faltantes (NaN)
- duplicados
- tipos erróneos.
- Estadísticos descriptivos: media, mediana, percentiles, dispersión.
- Visualización con
matplotlibyseaborn: histogramas, boxplots, scatterplots.
Presentación:
01_Presentaciones/Sesion2_EDA.pdf
Notebook sugerido:
03_Notebooks/02_Sesion_02.ipynb
Sesión 3 — Introducción a Machine Learning
- ¿Qué es Machine Learning?
- Tipos de aprendizaje: supervisado, no supervisado y una breve mención al aprendizaje por refuerzo.
- Diferencia entre regresión y clasificación.
- Ciclo de modelado: división train/test, entrenamiento, evaluación y ajuste.
- Primeros modelos con
scikit-learn:- regresión lineal
- modelos de clasificación simples.
Presentación:
01_Presentaciones/Sesion3_ML.pdf
Notebook sugerido:
03_Notebooks/03_Sesion_03.ipynb
Sesión 4 — Introducción al Deep Learning (MLP)
- Motivación para usar Deep Learning en problemas complejos.
- Neuronas artificiales: pesos, bias y función de activación.
- Estructura de una red neuronal: capa de entrada, capas ocultas, capa de salida.
- Perceptrón y red neuronal multicapa (MLP).
- Conceptos de entrenamiento: loss, backpropagation, epochs, learning rate.
Presentación:
01_Presentaciones/Sesion4_DL.pdf
Notebook sugerido:
03_Notebooks/04_Sesion_04.ipynb
Sesión 5 — CNN, Transfer Learning y Ética en IA
- Limitaciones del MLP para tareas de visión.
- Redes neuronales convolucionales (CNN):
- filtros y convolución
- mapas de características
- pooling.
- Transfer Learning con modelos preentrenados (ej. MobileNetV2).
- Discusión sobre sesgos, riesgos y uso responsable de la IA en educación.
Presentación:
01_Presentaciones/Sesion5_CNN.pdf
Notebook sugerido:
03_Notebooks/05_Sesion_05.ipynb
Sesión 6 — Proyecto Integrador
- Desarrollo de un proyecto completo de Ciencia de Datos aplicado a cursos STEM:
- preprocesamiento
- EDA
- visualización
- modelo de ML / MLP.
- Trabajo colaborativo en grupos.
- Presentación de resultados y discusión crítica.
- Reflexión sobre sesgos y uso de modelos predictivos en contextos educativos.
Presentación:
01_Presentaciones/Sesion6_Proyecto-Final.pdf
Material del proyecto:
06_Actividad_Final/Taller_Integrador_STEM_PLANTILLA.ipynb