Descripción del Diplomado

¿Por qué es importante la Minería de Datos?

La Minería de Datos es un proceso que permite obtener conocimiento a partir de los datos almacenados, mediante un proceso no trivial de extracción de información implícita, previamente desconocida y potencialmente útil.

Descubrir conocimiento implica buscar patrones de comportamiento aún no conocidos en los datos. El conocimiento se puede manifestar como: patrones, reglas de conocimiento, asociaciones, grupos, restricciones, tendencias, etc. Los dominios de aplicación prácticamente abarcan cualquier campo y tipo de empresas (comercialización, producción, finanzas, energía, gobierno, tecnología, etc.).

Objetivos

Al finalizar el Diplomado, los participantes serán capaces de:

· Identificar las diferentes fases que requiere la consolidación de la información a través de la metodología CRISP-SEMMA

· Conocer y utilizar las técnicas existentes de minería de datos, estadísticas y de visualización de la información.

· Diseñar y desarrollar un sistema para el apoyo a la toma de decisiones, contemplando el proceso completo: recolección de datos, procesado y visualización.

TEMARIO

1. Calidad de Datos
1.1 Panorama general de los sistemas OLTP y OLAP
1.2 Análisis y reconciliación de los datos
1.3 Limpieza
1.4 Integración


2. Inteligencia de Negocios
2.1 Manipulación de datos con SAS Base y SQL
2.2 Introducción a los Almacenes de datos
2.3 Análisis OLAP
2.4 Reportes


3. Análisis Exploratorio
3.1 Estadística Descriptiva
3.1.1 Estadísticos Sumarizados (media, desviación estándar,
máximo, mínimo, varianza y error estándar)
3.1.2 Esquema de un Dataset
3.1.3 Análisis de Distribución
3.1.4 Frecuencias de Variables categóricas
3.1.5 Gráficos
3.2 Estadística No Paramétrica
3.2.1 ANOVA (Prueba t, Factor y Factor no paramétrico)
3.2.2 Regresión Lineal
3.2.3 Tablas de contingencia
3.2.4 Regresión no Lineal
3.2.5 Regresión Logística
3.3 Muestreo
3.3.1 Simple
3.3.2 Estratificado
3.3.3 Sistemático
3.4 Multivariado
3.4.1Análisis de Correlación
3.4.2 Análisis de componentes
3.4.3 Análisis discriminante


4. Introducción a la Minería de Datos
4.1 Introducción a la Minería de Datos
4.1.1 ¿Qué es minería de datos?
4.1.2 ¿Por qué minería de datos?
4.1.3 CRISP-SEMMA
4.1.4 Introducción a SAS Enterprise Miner
4.2 Datos de procesamiento
4.2.1 ¿Por qué procesar los datos?
4.2.2 Limpieza de datos
4.2.3 Manejo de datos missing
4.2.4 Identificación de errores de clasificación
4.2.5 Métodos gráficos y outliers
4.2.6 Transformación de datos
4.2.7 Métodos numéricos y outliers


5. Técnicas Minería de Datos y evaluación de modelos
5.1 Técnicas de Minería de Datos
5.1.1. Regresión Logística
5.1.2. Árboles de decisión (CART y C4.5)
5.1.3. Redes neuronales
5.1.4. Clúster
5.1.5. Reglas de Asociación
5.1.6. Algoritmo K-nearest neighbor
5.1.7. K means
5.1.8. Naïve Bayes
5.1.9. Support Vector Machines
5.2. Evaluación de modelos


6. Minería de Datos Aplicada
6.1. Casos de Estudio
6.2. Minería de Texto
6.2.1 Importación y preparación de textos
6.2.2 Filtrado de textos
6.2.3 Análisis de textos
6.2.4 Tema
6.2.5 Clusterización de Textos