Big Data: principios y aplicaciones del análisis de datos masivos

Objetivo
Al término del curso, el participante será capaz de extender al entorno de los datos masivos (Big Data), los métodos de la minería de datos utilizados en los prototipos de aplicación, basándose en el material didáctico y la herramienta de software proporcionados por el facilitador.

Duración
16 o 20 horas (según la modalidad) repartidas en 4 sesiones (módulos).

Modalidades: presencial y a distancia
En la modalidad presencial (20 horas en 4 sesiones de 5 horas cada una) el curso se impartirá con el auspicio y el reconocimiento oficial (diploma) del Centro de Educación Continua, Unidad Morelos, del Instituto Politécnico Nacional, los días (sábados) 16, 23, 30 de noviembre y 7 de diciembre de 2019, en Primera Privada de la Luz No. 25, Fraccionamiento Villas Chapultepec, Col. Chapultepec, Cuernavaca, Morelos; CP 62405. Para mayores informes en esta modalidad (costo, horarios, cupo máximo etc.), favor de comunicarse a los teléfonos 777292-6547 y 777168-7370, con el Lic. Víctor Nava.

En la modalidad a distancia (16 horas en 4 sesiones de 4 horas cada una) el curso se imparte por Skype (en línea), de manera individual y con el reconocimiento (diploma) de la Fundación MicroMédix, en el horario y los días que el participante seleccione de común acuerdo con el facilitador.

Costo de la instrucción
Facilidades de pago para la modalidad a distancia: un abono de $2,600.00 MXN (pesos mexicanos) por cada sesión de 4 horas. Para obtener descuentos por pago único, ver la opción 3 en Formas y Opciones de Pago.

Formas y Opciones de Pago
En el caso de la modalidad a distancia (Fundación Micromédix):
Opción 1 (para los participantes que radican en la República Mexicana): abono en cualquier tienda Oxxo, a la tarjeta No. 5579 0700 4261 9489 de Santander, o depósito en cuenta bancaria No. 60-56534785-8 del mismo banco, con clave interbancaria (CLABE) 014540605653478587.
Opción 2 (México y resto del mundo): envío vía PayPal a la cuenta educatecnica@hotmail.com

Opción 3 (un pago único a través de los medios mencionados): aplicar 15% y 35% de descuento en caso de optar por una membresía de 4 y otra de 12 horas de instrucción respectivamente. El costo total del curso con esta tercera opción y en la modalidad a distancia es de: $7,280.00 MXN (pesos mexicanos).

Nivel: básico, introductorio

Dirigido a estudiantes y público en general, con deseos de conocer a nivel introductorio, las técnicas de la minería de datos, la inteligencia artificial, el aprendizaje de máquina y el Big Data.

Requisitos
Computación básica, destreza en el manejo de archivos y carpetas, conocimiento del sistema operativo Windows y del funcionamiento general de la Internet. Habilidad para instalar paquetería en una PC, así como conocimientos básicos de Excel. Equipo para la construcción de los prototipos: una laptop estándar con conexión a Internet, Windos 8.0 o superior, disco duro de al menos 1000 GB y memoria RAM de 4 GB o mayor.

Temario

Módulo 1: Una mirada global de la tecnología (4/5 horas)
1.1 Qué es y para qué sirve el Big Data
1.2 Mapa mental del Big Data
1.3 Volumen, velocidad, variedad y veracidad de los datos masivos
1.4 Sacándole provecho a la tecnología
1.5 Administración, organización y análisis de los datos masivos
1.6 Almacenamiento de grandes volúmenes de datos
1.7 Procesamiento rápido de corrientes de datos muy variopintos
1.8 Minería de datos y aprendizaje de máquina
1.9 Modelos predictivos y segmentación de los datos
1.10 Prototipo de aplicación No. 1: Minería de datos clínicos como apoyo en el diagnóstico médico

Módulo 2: Fuentes de datos masivos y áreas de aplicación del Big Data (4/5 horas)
2.1 Revisión del prototipo de aplicación No. 1
2.2 Fuentes de datos masivos
2.3 Comunicación entre usuarios (medios sociales)
2.4 Comunicación ser humano-máquina (acceso a la web)
2.5 Comunicación entre máquinas (RFIDs y sensores)
2.6 Aplicaciones del Big Data
2.7 Desarrollo de nuevos productos
2.8 Monitoreo de la calidad de la energía eléctrica (caso de estudio)
2.9 Prototipo de aplicación No. 2: modelo predictivo para la fidelización de clientes

Módulo 3: Arquitectura del Big Data (4/5 horas)
3.1 Revisión del prototipo de aplicación 2
3.2 Arquitectura del cuestionamiento en Google
3.3 Arquitectura estándard del Big Data
3.4 Ajemplos de arquitecturas: Netflix, Ticketmaster y PayPal
3.5 Procesamiento distribuido con Hadoop
3.6 La plataforma de Hadoop
3.7 Objetivos del diseño HDFS
3.8 Arquitectura maestro-esclavo
3.9 Sistema de almacenamiento en bloques
3.10 Escritura y lectura de archivos locales y streaming en HDFS
3.11 Archivos secuenciados
3.12 YARN (Yet Another Resource Negotiator)
3.13 Protoptipo de aplicación No. 3:
Inteligencia artificial como auxiliar en el tratamiento de enfermedades idiopáticas

Módulo 4: Otras tecnologías para la implementación del Big Data (4/5 horas)
4.1 Revisión del protoptipo de aplicación 3
4.2 Qué es y cómo trabaja el MapReduce de Google
4.3 La oleada de datos (streaming) de Hadoop
4.4 Los lenguajes Hive y Pig de Apache
4.5 Bases de datos NoSQL
4.6 Procesamiento de oleadas de datos con Spark
4.7 Sistemas de ingestión de datos
4.8 Sistemas de mensajería
4.9 Kafka
4.10 Computación en la nube (cloud computing) para Big Data
4.11 Resumen global y conclusiones


Clausura y entrega de diploma(s)

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s