PEC

Diplomado en Ciencia de Datos

Descripción del programa

Intensidad 144 horas

Descripción del programa

El análisis de datos se ha convertido en una de las habilidades obligatorias tanto en el entorno corporativo como académico. La organizaciones necesitan cada vez más personas que puedan realizar tareas de análisis de datos con el fin de avanzar en sus estrategias de transformación digital y crear procesos de inteligencia que conduzcan a ventajas competitivas duraderas. Estas mismas habilidades resultan contundentes en el desarrollo de un proyecto de investigación, a nivel de maestría o doctorado que, con cantidades de datos cada vez mayores, requieren abordajes metodológicos cada vez más complejos en torno al tratamiento de la información con el fin de generar conocimiento.

El programa ofrece un acercamiento muy completo al análisis de datos. Este conocimiento puede ser usado posteriormente a nivel corporativo (mercadeo, gestión, analítica) como en investigación académica (proyectos de investigación). Se trata de un programa flexible en el que el estudiante puede decidir el énfasis que quiere dar a su aprendizaje. El diseño iterativo del programa garantiza una constante renovación de los contenidos y actualización permanente. El aprendizaje inmersivo permite al estudiante obtener conocimientos aplicándolos en datos reales en el paradigma de “aprender haciendo”.

Objetivo

Transmitir a los estudiantes el control de las herramientas técnicas teóricas y prácticas para la transformación, procesamiento y análisis de datos.

Metodología

El diplomado consta de 4 cursos prácticos y 2 teóricos que deben ser vistos por el estudiante en su totalidad. Se desarrollan con clase magistral teórica y actividades de práctica en distintos softwares y entornos. Apoyo en la práctica de manera presencial y virtual por medio de una plataforma de aprendizaje.

Perfil del aspirante

Cargos operativos, técnicos y estratégicos de diversas organizaciones interesados en incrementar su desempeño frente a los problemas concernientes a grandes cantidades de datos. Así mismo estudiantes de posgrado, docentes e investigadores que requieran habilidades en procesamiento y análisis de información para sus proyectos de investigación.

Contenido Temático

Fundamento de Ciencia de Datos
  • Introducción, tipos de datos, datos cuantitativos – cualitativos – fechas – texto, estructurados – no estructurados, abiertos – cerrados, almacenamiento de datos, flujo de datos, selección de tecnologías.
  • Limpieza de datos, datos faltantes, datos atípicos, discretización de variables, trabajo con fechas y horas.
  • Transformación de tablas de datos, crear nuevas columnas, generar resúmenes, desplegar y colapsar tablas. Operaciones entre tablas de datos. Inner join, left join, right join, full join.
  • Datos univariados. Promedio, mediana, moda, varianza, cuartiles, rango intercuartílico.
  • Datos multivariados. Estadísticos de asociación: covarianza, correlación, información mutua, matriz de varianzas y covarainzas.
  • Descriptivos multivariados. Probabilidad condicional.
  • Descriptivos multivariados. Valor esperado condicional.
  • Visualización univariada. Gráfico de barras, de densidad, histograma, de caja. Visualización multivariada. Gráficos de dispersión, tablas highlight, combinaciones y redes.
R Básico
  • Introducción, qué es R, instalación, paquetes, informes automáticos, proyectos y documentación. Carga de datos.
  • Programación. Objetos y clases.
  • Programación. Operaciones y funciones.
  • Programación. Loops.
  • Limpieza de datos, datos faltantes, datos atípicos, discretización de variables, trabajo con fechas y horas.
  • Transformación de tablas de datos, crear nuevas columnas, generar resúmenes, desplegar y colapsar tablas. Operaciones entre tablas de datos. Inner join, left join, right join, full join.
  • Datos univariados. Promedio, mediana, moda, varianza, cuartiles, rango intercuartílico. Datos multivariados. covarianza, correlación, matriz de varianzas y covarianzas.
  • Valor esperado y probabilidad condicionales.
Python Básico
  • Introducción, instalación, paquetes, entorno, notebooks, Jupyter, carga y lectura de datos.
  • Programación. Clases, objetos y métodos.
  • Programación. Operaciones y funciones.
  • Programación. Loops.
  • Limpieza de datos, datos faltantes, datos atípicos, discretización de variables, trabajo con fechas y horas.
  • Transformación de tablas de datos, crear nuevas columnas, generar resúmenes, desplegar y colapsar tablas. Operaciones entre tablas de datos. Inner join, left join, right join, full join.
  • Datos univariados. Promedio, mediana, moda, varianza, cuartiles, rango intercuartílico.  Datos multivariados. covarianza, correlación, matriz de varianzas y covarainzas.
  • Valor esperado y probabilidad condicionales.
Minería de Datos
  • Introducción, definiciones. Problemas de minería de datos.
  • Distancias, definición, tipos, matrices de distancias.
  • Asociación, reglas de asociación, algoritmo a priori.
  • Asociación, reglas de asociación, soporte, confianza, lift.
  • Agrupación algoritmos generación de los clusters.
  • Agrupación algoritmos validación y caracterización.
  • Proyecto.
Aprendizaje Automático
  • Introducción, definiciones. Problemas de aprendizaje automático.
  • Redes neuronales. Desarrollo. Tipos de redes.
  • Redes neuronales: intuición matemática.
  • Redes neuronales: implementaciones.
  • Clasificación y predicción ajuste de modelos. Regresión lineal,  regresión logit, K vecinos más cercanos, árboles de regresión, bosques aleatorios.
  • Clasificación y predicción validación de modelos
  • Proyecto
Semántica de Datos y Visualización
  • Modelo – Contexto. Significado de los números. Interpretación estadística.
  • Significados asociados al paradigma población muestra. Significados de  estadísticos univariados. Significado de modelos de aprendizaje supervisado y no supervisado.
  • Data Storytelling. Construcción de narrativas. El viaje del héroe.
  • Elementos visuales. Posición, longitud, saturación, color, área, ángulo, profundidad y volumen. Geometrías. Tipos de variable. Dashboards, niveles de interactividad con las visualizaciones, buenas prácticas de visualización. Selección de las gráficas adecuadas según la información.
  • Visualización en Python
  • Visualización en R

Conferencistas

Julián Mauricio Cruz Pulido (Director)

Magister en Ciencias. Jefe de Ciencia de Datos en la División de Vigilancia, Inspección y control de MinTic. Director del Diplomado de Ciencia de Datos de la Universidad Nacional de Colombia. Docente en la Universidad Externado de Colombia. Más de 5 años de experiencia proponiendo, ejecutando, evaluando y retroalimentando proyectos de análisis de datos en diversos rubros. Dentro de sus habilidades destacan la conformación de equipos especializados, la comunicación efectiva y el compromiso con los detalles.

Leonardo Esteban

Economista de la Universidad Nacional de Colombia. Maestría en Administración de Empresas Universidad Nacional de Colombia. Actualmente ejerce como Docente Ocasional de la Facultad de Ciencias Económicas de la Universidad Nacional. Interesado en software aplicado a las ciencias económicas y/o administrativas; y su uso dentro de las organizaciones. Dominio de diversas herramientas informáticas, sistemas de información y simuladores de gestión empresarial.

Francisco Javier Ospina Salazar

Senior datascientist, con amplia experiencia en diferentes campos del aprendizaje estadístico (aprendizaje automático, aprendizaje profundo) matemáticas aplicadas y desarrollo de herramientas ETL. Cuenta con una trayectoria de más de 5 años apoyando procesos de ciencia de datos y de automatización por medio de inteligencia artificial en distintas startups. Su campo de acción comprende MongoDB, Python, R, Hadoop, TensorFlow, Keras y Spark entre otros. Apasionado por temas de inteligencia artificial y modelos de aprendizaje estadístico aplicado a grandes bases de datos.

Juliana Guerrero Velásquez

Maestría en Estadística, especializada en estadísticas sociales, de comportamiento y educación, Universidad Católica de Lovaina Bélgica. Estadística, Universidad Nacional de Colombia Consultora de Naciones Unidas en análisis cuantitativo de género y población, líder de proyectos de inteligencia artificial y machine learning en sector telecomunicaciones. Ha trabajado como consultora en estadística aplicada y ciencia de datos tanto en sector público y privado en diversos temas como transporte, educación, investigación social y de mercados.

Mónica Ramírez Bernal

Data Scientist, Metis Data Science Academy (New York). Computer Science, Escuela Colombiana de Ingeniería. Consultora Big Data, BI y de Data Warehouse certificada como Data Scientist, con experiencia en Machine Learning, Redes Neuronales, Inteligencia de Negocios y Bodegas de Datos en industrias de Retail, Telecomunicaciones, Aseguradoras y Financieras. Aptitudes en Modelamiento, Análisis y Perfilamiento de Datos, Conceptos y Técnicas de análisis en Big Data y Data Tradicional, conocimiento en funciones de Machine Learning, Redes Neuronales, SQL, Hadoop, R y Python. Habilidades de liderazgo, compromiso, aprendizaje y adaptación a diferentes roles. Experiencia liderando equipos de trabajo locales y remotos internacionales.

Felipe Calvo Cepeda

Ingeniero Industrial con Maestría en Estadística de la Universidad Nacional de Colombia, con experiencia en docencia e investigación. Cofundador de las Fundaciones Aspirantes.ORG y Lidera El Cambio. Entre sus áreas de estudio y trabajo se encuentran el control estadístico de procesos, formulación de proyectos, emprendimiento, psicometría y TIC.

Intensidad, fechas y horarios

Modalidad:
Videoconferencias en vivo
Intensidad:
144 horas
Fecha inicio:
27 de agosto de 2022
Fecha fin:
15 de diciembre de 2022
Horario:
Martes y jueves de 6 p.m. a 9 p.m. y Sábados de 9 a.m. a 12 m.

Valor Inscripción Videoconferencias

$ 3’312.000

Incluye materiales virtuales. En esta modalidad el participante autoriza el manejo de datos sensibles para establecer su asistencia y debe aportar un correo Gmail por medio del cual será entregado el material del curso.

Descuentos

Importante:

Es indispensable que quien se acoja a estos descuentos se encuentre a paz y salvo con el Fondo Especial y envíe como soporte la copia del o los certificados de los cursos anteriores.

Los descuentos aplican únicamente para pagos de contado y NO son acumulables. Los descuentos deben aplicarse en el momento de realizar el pago, luego no se realizarán
reintegros de dinero por mayor valor pagado.

Cuando la inscripción a un programa se realice con tarjeta de crédito, en la caja de la Facultad de Ciencias Económicas, los descuentos autorizados se aplicarán disminuyendo un 5%.

50%
A estudiantes de Pregrado de la Universidad Nacional de Colombia
30%
A estudiantes de posgrado de la UN
30%
Egresados de la Facultad de Ciencias Económicas de la Sede Bogotá de la Universidad Nacional de Colombia.
20%
A profesores, investigadores, funcionarios, pensionados, egresados y contratistas de la UN.
20%
A personas que paguen todo el diplomado de formación a escala con dos semanas de anticipación al inicio del mismo*
15%
A personas que realicen 3 o más cursos o diplomados al año en la UN.
15%
A personas, contratistas o empleados, de entidades con las que la Facultad de Ciencias Económicas, Sede Bogotá de la Universidad Nacional, tiene acuerdo de voluntades activo, con vigencia posterior por seis meses más a la finalización del mismo.
10%
A estudiantes de otras universidades
10%
A grupos de 4 o más personas para la misma actividad a través de un único comprobante de pago.
10%
Por pronto pago con un mes calendario de anticipación
10%
A hijos de pensionados, de docentes, de funcionarios, de contratistas y de estudiantes de la UN. A estudiantes del colegio IPARM y de la Escuela de la UN Sede Medellín.
10%
A adultos mayores, niños y adolescentes, personas de niveles 1 y 2 de sisben, población en situación de discapacidad y desplazados inscritos en el registro de población desplazada.
10%
A personas que tomen un 2° programa de formación dentro de los 6 meses posteriores a la finalización el programa anterior.
5%
Por pronto pago con tres semanas de anticipación
*Solo aplica para los diplomados de formación a escala

Proceso de inscripción

*En la parte inferior derecha de la página que se despliega, encontrará el botón de preinscripciones, por favor ingresar y diligenciar los datos solicitados.

Realice su pago en el catálogo de servicio de la sede Bogotá con el nombre del Programa. En la opción “Tipo de afiliación” encontrará las opciones descuento. 

Déjanos tus datos

¡Bienvenido al Programa de Educación Continua y Permanente de la Facultad de Ciencias Económicas de la Universidad Nacional de Colombia!

Déjanos tus datos de contacto e interés en nuestros programas y en las próximas horas un colaborador se comunicará para resolver cualquier duda, ampliar la información y acompañarte durante todo el proceso.

"UN" saludo del Equipo PEC