(01 55) 5171-6286

(01 55) 5264-2911

Ciencia de Datos con Python

  • Inicio
  • Ciencia de Datos con Python
Awesome Image
Soy actuario

@soy_imam

¿Por qué es importante Python?

Gracias a la colosal capacidad de cómputo con
la que contamos actualmente y la generación
industrial de datos diaria, tenemos ante nosotros la
oportunidad de obtener información sensible que
nos permita generar conocimiento que a su vez nos
ayude a identificar y explotar áreas de oportunidad
en la ciencia, tecnología y los negocios.

Para esto,
requerimos más que solo de grandes almacenes de
datos, sino de poderosos modelos matemáticos y
algoritmos que nos permitan destilar los datos.
Con este Diplomado serás capaz de desarrollar
sistemas que permitirán generar valor para las
instituciones utilizando las mejores herramientas y
técnicas de la Ciencia de Datos.

Objetivos

Al finalizar el Diplomado, los participantes serán capaces de:


· Comprender los fundamentos teóricos y conceptuales de la ciencia de
datos, como herramienta tecnológica para la gestión de conocimiento.
· Conocer métodos y modelos matemáticos y estadísticos fundamentales
para el desarrollo de soluciones en Ciencia de Datos.
· Emplear herramientas computacionales y de programación para Ciencia
de Datos.
· Reconocer los requerimientos tecnológicos y de visualización para
grandes volúmenes de datos.
· Aplicar herramientas técnicas y metodológicas para diseñar e
implementar técnicas de Ciencia de Datos en procesos de análisis y toma de
decisiones.
· Aprenderás las características e implementaciones de los algoritmos
más poderosos que subyacen tecnologías de frontera como los chatbots, la
detección de anomalías en tomografía vía procesamiento de imágenes,
traducción contextual de textos, robótica avanzada y más.

Awesome Image

Temario

Módulo 1. Introducción a la programación con Python

1. Monty Python y montando Python
* Instalación
* Introducción

2. Aspectos básicos de Python

* IDLE
* Sintaxis básica
* Aritmética
* Variables
* Comentarios

3. Tipos de datos básicos

* Numéricos
* Booleanos
* Cadenas
* I/O de datos en consola

4. Condicionales y control de flujo

* If, Else, Elseif
* Ciclo For
* Ciclo While

5. Listas y tuplas

* Métodos y operaciones
* Mutabilidad
* Iteradores y rango

6. Diccionarios y conjuntos

*  Métodos y operaciones
* Mutabilidad

7. Funciones

* Definición y diseño
* Excepciones
* Docstrings
* Módulos e imports

8. Entrada y salida (I/O) de datos

* Lectura/Escritura de archivos de texto
* Archivos binarios
* Pickle

9. Introducción a la programación orientada a objetos

* Módulos, clases y objetos
* Herencia
* Polimorfismo

10. Bonus: Un vistazo a Data Science en Python

* Jupyter
* NumPy
* Matplotlib

Módulo 2. Análisis y Manejo de Datos con Python

1. Python datero: Jupyter Notebook

* Fundamentos de Python en esteroides: listas, diccionarios y objetos * Números, números, números: Introducción  a NumPy

2. Formatos para almacenar datos

* Importar datos a Python desde un archivo
* Bases de datos relacionales

3. Filtrado de Datos

* Remover Duplicados
* Transformaciones de Datos con Funciones  Detección de Outliers
* Manejo de Missing Values

4. Introducción a Pandas

* Manipulación de DataFrames Ordenar, Filtrar y Combinar DataFrames

5. Introducción al Análisis de Datos en Python

* Estadística básica con Python
* Análisis Exploratorio de Datos con Gráficas
* Análisis Exploratorio de Datos con Estadística

6. Gráficas en MatPlotLib
Módulo 3. Matemáticas para Machine Learning con Python

1. Álgebra Lineal
* Matrices y sus propiedades
* Determinantes
* Espacios vectoriales
* Transformaciones lineales
* Producto interno y externo
* Eigenvalores y eigenvectores
* Descomposición de valor singular
* Descomposición de componente principal

2. Cálculo y Optimización

* Derivadas Parciales
* Extremos
* Gradientes
* El Jacobiano
* La matriz Hessiana
* Cálculo matricial
* Multiplicadores de Lagrange
* Probabilidad

3. Probabilidad condicional

* Teorema de Bayes
* Variables aleatorias
* Varianza y covarianza
* Estimación de parámetros
* Distribuciones de Probabilidad

4. Algoritmos y Estructura de Datos

* Arreglos
* Colas y Pilas
* Árboles
* Hashing
* Notación 'Big O' y Complejidad Computacional
* Grafos y redes

Módulo 4. Machine Learning con Python

1. Un poco de teoría
* ¿Qué es el Machine Learning?
* Diferencias entre Inteligencia Artificial, Machine Learning, Deep Learning y Ciencia de Datos
* Aprendizaje Supervisado y No Supervisado
* Instalación de Toolkit con Anaconda
* Repaso de Estadística

2. Preprocesamiento de los Datos

* Buscar e importar Datasets
* Datos Faltantes |Datos Categóricos
* Sets de Entrenamiento y Sets de Prueba

3. Regresión

* Regresión Lineal Simple
* Regresión Lineal Múltiple
* ¿Qué es un valor p?
* Regresión Polinomial
* Regresión de Vectores Soporte
* Regresión con Árboles de Decisión
* Regresión con Bosques
* Aleatorios
* Evaluación de la Efectividad de los Modelos de Regresión

4. Clasificación

* Regresión Logística
* Vecinos Cercanos K-N N
* Máquinas de Vectores de Soporte (SVM)
* Kernel SVM
* Bayesiano Ingenuo
* Clasificación con Árboles de Decisión
* Clasificación con Bosques Aleatorios
* Evaluación de la Efectividad de los Modelos de Clasificación.

5. Agrupamiento a.k.a. Clustering

* Agrupamiento K-Means
* Agrupamiento Jerárquico
* Aprendizaje Reforzado
* Límite Superior de Confianza (UCB)
* Muestreo de Thompson


6. Procesamiento Natural de Lenguaje

7. Aprendizaje Profundo
* Redes Neurales Artificiales
* Redes Neurales Convolucionales
* Propagación en Reversa

8. Reducción de Dimensionalidad

* Gradiente Descendente
* Análisis de Componentes Principales (PCA)
* Análisis de Discriminante
* Lineal (LDA)
* Kernel PCA
9. Selección de Modelos y Boosting

* Validación Cruzada k-Fold
* Búsqueda en Red
* XGBoost

RVOE SEP-20192948