Imparte:
Universidad Complutense de MadridCon el Máster de la Universidad Complutense de Madrid, podrás formarte cómodamente y a distancia en las últimas tecnologías del Big Data, Data Science. A la finalización del Máster Big Data Online, recibirás un título de máster de formación permanente otorgado por la UCM, universidad avalada por 7 Premios Nobel, 20 Príncipes de Asturias, 7 Premios Cervantes y Premios Nacionales de Investigación. Aprovecha esta oportunidad y fórmate en Big Data con una institución de prestigio.
El postgrado de Big Data y Business Intelligence está orientado para todas las personas con interés en el análisis masivo de datos, los lenguajes de programación, el Machine Learning y Deep Learning, bases de datos SQL y NoSQL, etc.
Módulo I: GNU/Linux y Git
El entorno de trabajo con Linux y Git, conocimiento esencial para preparar a los estudiantes en el uso de herramientas fundamentales para la gestión de proyectos y el análisis de datos a gran escala.
Módulo II: Bases de Datos SQL
Diseño y modelización de base de datos y lenguaje de consulta estructurada, más conocido como SQL (Structured Query Language). El modelo entidad-relación, el modelo relacional, la implementación relacional con SQL.
Módulo III: Business Intelligence con Tableau
Introducir al concepto de Business Intelligence, diferenciando éste, del concepto de Machine Learning o de Data Science, su relación con los nuevos paradigmas de Big Data. Para pasar a un enfoque completamente práctico en el que el alumno aprenderá a utilizar Tableau.
Módulo IV: Programación Python
Características, tipos de datos, estructuras de control de flujo, funciones, parámetros, manipulación de cadenas, estructuras de datos…
Módulo V: Bases de datos NoSQL
Se aprenderá a utilizar y modelar los sistemas de gestión de bases de datos noSQL y sus principales operaciones. Introducción a MongoDB, operaciones CRUD, dominar el Find o proyectar los campos en resultados de búsqueda.
Módulo VI: Tecnologías del Big Data
Internet de las Cosas como servicio, conectividad con fuentes de datos heterogéneas a través de brokers de mensajes y hubs con dispositivos, Hadoop, Spark y diversas técnicas de visualización y análisis de información por parte de los usuarios finales.
Módulo VII: Hadoop y Spark
Tras describir el manejo de HDFS (Hadoop Distributed File System), el curso se centrará en Apache Spark, sin duda la tecnología más demandada para procesamiento de grandes volúmenes de datos. Se usará Dataproc de Google Cloud para desplegar un cluster de Spark.
Módulo VIII: Deep Learning
Deep Learning. Introducción y fundamentos de las redes neuronales. Procesamiento de imágenes con redes convolucionales (CNN). Predicción de series temporales con redes recurrentes (RNN). Introducción al procesamiento de lenguaje natural (NLP). Modelos generativos.
Módulo IX: Fundamentos de estadística
Consolidación de conocimientos de estadística necesarios para formar una base que ayudan a seguir el resto de bloques del máster. Entre los conceptos a tratar: estadística descriptiva, probabilidad e inferencia tendrán un destacado espacio.
Módulo X: Minería de datos y modelización predictiva
A lo largo de este bloque, los alumnos adquirirán los conceptos necesarios para el desarrollo de la modelización predictiva. Para ello, detectarán patrones basados en grandes volúmenes de datos, a través de diversas técnicas de Data Mining.
Módulo XI: Machine Learning con Python
Las diferentes técnicas y algoritmos utilizados, como la regresión lineal, la clasificación, el clustering y el aprendizaje profundo (Deep Learning). La evaluación y selección de modelos, el preprocesamiento de datos, la validación cruzada y el overfitting.
Módulo XII: Aplicaciones del Big Data en la Empresa
Este módulo tiene como objetivo que los alumnos asimilen los distintos sistemas de soportes a la toma de decisiones en un entorno corporativo. Se abarcará la gestión económica y financiera, operaciones, logística, marketing y ventas.
Módulo XIII: Visualización avanzada
Aprenderán acerca de las visualizaciones para comunicar y para confundir. Se explorarán herramientas para visualización de datos con librerías como matplotlib y seaborn, entre otras, y se discutirá la gramática de los gráficos, la cual es importante para la comprensión de cómo se construyen y comunican los gráficos.
Módulo XIV: Data science aplicada a la empresa
Visión integral de las empresas orientadas al dato, creación de equipos de científicos de datos y estructuración de un proyecto Data Science. Este módulo aborda igualmente aspectos de la comunicación personal con individuos, la pública ante grupos, y la mediática para audiencias.
Trabajo final Máster
Data Analyst, Data Scientist, Ingeniero de Datos, Data Consultant, Chief Data Officer, Arquitecto/a de Business Intelligence, etc.