(01 55) 5171-6286

(01 55) 5264-2911

Minería de datos con SAS

  • Inicio
  • Minería de datos con SAS
Awesome Image
Soy actuario

@soy_imam

¿Por qué es importante la Minería de Datos?

La Minería de Datos es un proceso no trivial que permite obtener conocimiento a partir de datos almacenados, a través de la extracción de información implícita, previamente desconocida y potencialmente útil.

Descubrir conocimiento implica buscar patrones de comportamiento aún no conocidos en los datos, a fin de generar conocimiento útil para las organizaciones. Este conocimiento se puede presentar por medio de: patrones, reglas de conocimiento, asociaciones, grupos, restricciones, tendencias, etc.

Los dominios de aplicación de la Minería de Datos abarcan prácticamente cualquier campo y tipo de organización: educación, comercialización, producción, finanzas, energía, gobierno, tecnología, entre otras.

Objetivos

Al finalizar el Diplomado, los participantes serán capaces de:

· Identificar las diferentes fases que requiere el proceso descubrimiento de conocimiento a través de la metodología SEMMA (Sample, Explore, Modify, Model, and Assess), diseñada por SAS.

· Conocer y utilizar las técnicas existentes de minería de datos, estadística y visualización de la información.

· Diseñar y desarrollar un sistema para el apoyo a la toma de decisiones, contemplando el proceso KDD (descubrimiento de conocimiento).

Awesome Image

Temario

1. Calidad de Datos
1.1 Panorama general de los sistemas OLTP y OLAP
1.2 Análisis y reconciliación de los datos
1.3 Limpieza
1.4 Integración


2. Inteligencia de Negocios
2.1 Manipulación de datos con SAS Base y SQL
2.2 Introducción a los Almacenes de datos
2.3 Análisis OLAP
2.4 Reportes


3. Análisis Exploratorio
3.1 Estadística Descriptiva
3.1.1 Estadísticos Sumarizados (media, desviación estándar,
máximo, mínimo, varianza y error estándar)
3.1.2 Esquema de un Dataset
3.1.3 Análisis de Distribución
3.1.4 Frecuencias de Variables categóricas
3.1.5 Gráficos
3.2 Estadística No Paramétrica
3.2.1 ANOVA (Prueba t, Factor y Factor no paramétrico)
3.2.2 Regresión Lineal
3.2.3 Tablas de contingencia
3.2.4 Regresión no Lineal
3.2.5 Regresión Logística
3.3 Muestreo
3.3.1 Simple
3.3.2 Estratificado
3.3.3 Sistemático
3.4 Multivariado
3.4.1Análisis de Correlación
3.4.2 Análisis de componentes
3.4.3 Análisis discriminante


4. Introducción a la Minería de Datos
4.1 Introducción a la Minería de Datos
4.1.1 ¿Qué es minería de datos?
4.1.2 ¿Por qué minería de datos?
4.1.3 CRISP-SEMMA
4.1.4 Introducción a SAS Enterprise Miner
4.2 Datos de procesamiento
4.2.1 ¿Por qué procesar los datos?
4.2.2 Limpieza de datos
4.2.3 Manejo de datos missing
4.2.4 Identificación de errores de clasificación
4.2.5 Métodos gráficos y outliers
4.2.6 Transformación de datos
4.2.7 Métodos numéricos y outliers


5. Técnicas Minería de Datos y evaluación de modelos
5.1 Técnicas de Minería de Datos
5.1.1. Regresión Logística
5.1.2. Árboles de decisión (CART y C4.5)
5.1.3. Redes neuronales
5.1.4. Clúster
5.1.5. Reglas de Asociación
5.1.6. Algoritmo K-nearest neighbor
5.1.7. K means
5.1.8. Naïve Bayes
5.1.9. Support Vector Machines
5.2. Evaluación de modelos


6. Minería de Datos Aplicada
6.1. Casos de Estudio
6.2. Minería de Texto
6.2.1 Importación y preparación de textos
6.2.2 Filtrado de textos
6.2.3 Análisis de textos
6.2.4 Tema
6.2.5 Clusterización de Textos


RVOE SEP-20192948