Imparte:
Universidad Complutense de MadridLas empresas y organismos oficiales ya se están adaptando a los nuevos tiempos en los que, cuantías de información masiva, se procesan y analizan de tal forma que sean de gran utilidad en multitud de ámbitos diferentes. Lo que hace unos años comenzó siendo una ventaja competitiva de unos pocos, ahora está muy presente y, en breve, será imprescindible para no quedarse atrás.
Por poner unos pocos ejemplos, los macrodatos son una valiosa herramienta en la creación de informes estadísticos muy completos, la identificación de nuevas oportunidades de negocio de una empresa, modelos de predicción sobre los resultados publicitarios de una campaña futura o la evaluación de datos masivos para avanzar en investigaciones médicas que ayuden a erradicar enfermedades.
Así, como se puede ver, la información a gran escala no es un factor que afecte únicamente al campo matemático o estadístico, pues sus aplicaciones prácticas abarcan todo tipo de entornos reales en los que, la utilidad de los mismos, se torna fundamental para afrontar situaciones muy diversas a nivel empresarial, gubernamental, científico o social.
El postgrado de Big Data y Business Intelligence está orientado para todas las personas con interés en el análisis masivo de datos, los lenguajes de programación, el Machine Learning y Deep Learning, bases de datos SQL y NoSQL, etc.
Módulo I: GNU/Linux y Git
El entorno de trabajo con Linux y Git, conocimiento esencial para preparar a los estudiantes en el uso de herramientas fundamentales para la gestión de proyectos y el análisis de datos a gran escala.
Módulo II: Bases de Datos SQL
Diseño y modelización de base de datos y lenguaje de consulta estructurada, más conocido como SQL (Structured Query Language). El modelo entidad-relación, el modelo relacional, la implementación relacional con SQL.
Módulo III: Business Intelligence con Tableau
Introducir al concepto de Business Intelligence, diferenciando éste, del concepto de Machine Learning o de Data Science, su relación con los nuevos paradigmas de Big Data. Para pasar a un enfoque completamente práctico en el que el alumno aprenderá a utilizar Tableau.
Módulo IV: Programación Python
Características, tipos de datos, estructuras de control de flujo, funciones, parámetros, manipulación de cadenas, estructuras de datos…
Módulo V: Bases de datos NoSQL
Se aprenderá a utilizar y modelar los sistemas de gestión de bases de datos noSQL y sus principales operaciones. Introducción a MongoDB, operaciones CRUD, dominar el Find o proyectar los campos en resultados de búsqueda.
Módulo VI: Tecnologías del Big Data
Internet de las Cosas como servicio, conectividad con fuentes de datos heterogéneas a través de brokers de mensajes y hubs con dispositivos, Hadoop, Spark y diversas técnicas de visualización y análisis de información por parte de los usuarios finales.
Módulo VII: Hadoop y Spark
Tras describir el manejo de HDFS (Hadoop Distributed File System), el curso se centrará en Apache Spark, sin duda la tecnología más demandada para procesamiento de grandes volúmenes de datos. Se usará Dataproc de Google Cloud para desplegar un cluster de Spark.
Módulo VIII: Deep Learning
Deep Learning. Introducción y fundamentos de las redes neuronales. Procesamiento de imágenes con redes convolucionales (CNN). Predicción de series temporales con redes recurrentes (RNN). Introducción al procesamiento de lenguaje natural (NLP). Modelos generativos.
Módulo IX: Fundamentos de estadística
Consolidación de conocimientos de estadística necesarios para formar una base que ayudan a seguir el resto de bloques del máster. Entre los conceptos a tratar: estadística descriptiva, probabilidad e inferencia tendrán un destacado espacio.
Módulo X: Minería de datos y modelización predictiva
A lo largo de este bloque, los alumnos adquirirán los conceptos necesarios para el desarrollo de la modelización predictiva. Para ello, detectarán patrones basados en grandes volúmenes de datos, a través de diversas técnicas de Data Mining.
Módulo XI: Machine Learning con Python
Las diferentes técnicas y algoritmos utilizados, como la regresión lineal, la clasificación, el clustering y el aprendizaje profundo (Deep Learning). La evaluación y selección de modelos, el preprocesamiento de datos, la validación cruzada y el overfitting.
Módulo XII: Aplicaciones del Big Data en la Empresa
Este módulo tiene como objetivo que los alumnos asimilen los distintos sistemas de soportes a la toma de decisiones en un entorno corporativo. Se abarcará la gestión económica y financiera, operaciones, logística, marketing y ventas.
Módulo XIII: Visualización avanzada
Aprenderán acerca de las visualizaciones para comunicar y para confundir. Se explorarán herramientas para visualización de datos con librerías como matplotlib y seaborn, entre otras, y se discutirá la gramática de los gráficos, la cual es importante para la comprensión de cómo se construyen y comunican los gráficos.
Módulo XIV: Data science aplicada a la empresa
Visión integral de las empresas orientadas al dato, creación de equipos de científicos de datos y estructuración de un proyecto Data Science. Este módulo aborda igualmente aspectos de la comunicación personal con individuos, la pública ante grupos, y la mediática para audiencias.
Trabajo final Máster
Administrador de sistemas de macrodatos
Arquitecto de Inteligencia de Datos
Arquitecto de Business Intelligence
Auditor de sistemas de datos masivos
Chief Data Officer
Data Analyst
Data Consultant
Data Scientist
Digital Analyst
Desarrollador de sistemas de datos a gran escala
Gestor de infraestructuras para Big Data
Ingenieros de datos