Skip to the content.

I. Introducción a la Minería de Datos

Motivación (El Problema del Dato):

Definiciones y Conceptos Relacionados:

II. Tareas Principales de la Minería de Datos

Existen tres tareas principales de minería de datos:

  1. Tareas Descriptivas (Aprendizaje No Supervisado):
    • Implican la exploración de datos para comprenderlos y encontrar patrones o tendencias.
    • Ejemplos de métodos: Clustering (agrupación), Association Mining (minería de asociaciones), y estadística descriptiva.
    • Ejemplo: Encontrar qué productos se compran juntos en un supermercado (Association Mining).
  2. Tareas Predictivas (Aprendizaje Supervisado):
    • Implican una tarea clara: predecir valores desconocidos basándose en datos etiquetados del pasado.
    • Ejemplos de métodos: Classification (Clasificación), Regression (Regresión), y modelos generativos.
    • Ejemplo: Predecir si un nuevo cliente obtendrá un crédito (Clasificación, si la salida es Sí/No).

Ejemplos de Aplicación y Tareas Específicas:

III. Proceso de Descubrimiento de Conocimiento (KDD)

El proceso KDD (Knowledge Discovery in Databases) es el flujo completo desde los datos brutos hasta el conocimiento.

  1. Datos Brutos (Raw Data): Lo que se recolecta.
  2. Datos Dirigidos (Targeted Data): Selección de un subconjunto enfocado de los datos.
  3. Pre-procesamiento (Pre-processing): Limpieza de datos (eliminar ruido) y agregación de datos.
  4. Datos Transformados (Transformed Data): Organización de los datos en un formato regular.
  5. Minería de Datos (Data Mining): Extracción de patrones.
  6. Interpretación/Evaluación: La interpretación humana y la visualización de los resultados.

Un punto crucial es que el pre-procesamiento y la transformación de datos consumen aproximadamente el 80% del tiempo en entornos reales de minería de datos.