About this Course
5.0
1 ratings
100% online

100% online

Start instantly and learn at your own schedule.
Flexible deadlines

Flexible deadlines

Reset deadlines in accordance to your schedule.
Intermediate Level

Intermediate Level

Hours to complete

Approx. 16 hours to complete

Suggested: Se estima una dedicación de 6 a 8 horas por semana....
Available languages

Spanish

Subtitles: Spanish...
100% online

100% online

Start instantly and learn at your own schedule.
Flexible deadlines

Flexible deadlines

Reset deadlines in accordance to your schedule.
Intermediate Level

Intermediate Level

Hours to complete

Approx. 16 hours to complete

Suggested: Se estima una dedicación de 6 a 8 horas por semana....
Available languages

Spanish

Subtitles: Spanish...

Syllabus - What you will learn from this course

Week
1
Hours to complete
1 hour to complete

INTRODUCCIÓN

...
Reading
2 videos (Total 10 min), 8 readings
Video2 videos
Presentación del curso6m
Reading8 readings
Bienvenida1m
Contenidos del curso (Temario)1m
Organización del curso y evaluación5m
Sobre el certificado2m
FAQs - Generales10m
FAQs - Cuestionarios y ejercicios2m
FAQs - Certificado10m
Enlaces relacionados1m
Hours to complete
1 hour to complete

LA MÁQUINA VIRTUAL

<b>ATENCIÓN: Si ya te instalaste la máquina virtual en el curso anterior de la Especialización no es necesario que vuelvas a hacerlo. En caso contrario, sigue leyendo.</b><br><br>Los ejercicios y sesiones prácticas pretenden mostrar un caso práctico de procesamiento y análisis de datos en el contexto de Big Data. En este sentido, será necesario trabajar con una máquina virtual que ya trae configuradas e instaladas una serie de componentes habituales al manejar Big Data. En este apartado te explicamos cómo descargar e instalar la máquina virtual Cloudera en tu ordenador. La MV-Cloudera requiere disponer de un equipo con las siguientes características: (1) máquina de 64 bits, (2) mínimo 6G de memoria (recomendable 8G), y (3) 20G disponibles en disco.<br><br> <i><b>Ten en cuenta que bajar e instalar la máquina virtual te llevará tiempo dado el tamaño y complejidad de la misma</i></b>...
Reading
4 videos (Total 16 min), 4 readings
Video4 videos
Instalación de la máquina virtual - Import start4m
Instalación de la máquina virtual - Tips3m
Instalación de la máquina virtual - Pyspark setup4m
Reading4 readings
Link para la descarga de la MV_Cloudera10m
Instalación de la MV - Import start10m
Instalación de la MV - Tips10m
Instalación de la MV - Pyspark setup10m
Hours to complete
2 minutes to complete

MATERIAL DE PRÁCTICAS Y FICHEROS DE TRABAJO

Para poder seguir la parte aplicada del curso, responder a los cuestionarios y trabajar con las herramientas que te explicamos, necesitarás acceder a una serie de ficheros de código, así como las bases de datos de trabajo, que hemos recopilado y comprimido. Verás que algunos vídeos llevan un código entre paréntesis que coincide con el nombre de alguno de estos ficheros. Esto significa que en el vídeo correspondiente se trabaja con dicho fichero. <br><br>A continuación te explicamos como incorporarlos en la máquina virtual....
Reading
2 readings
Reading2 readings
FICHEROS DE TRABAJO Y PAQUETES - IMPORTANTE1m
INICIO DE LA SESIÓN - IMPORTANTE1m
Hours to complete
2 hours to complete

MÓDULO 1 - Análisis Exploratorio de Datos

Durante la primera semana del curso se introducen el curso y las herramientas que se emplearán. Además también se presentan las tareas relacionadas con el Análisis Exploratorio de Datos. Cada pocos temas tratados en los vídeos encontrarás un pequeño custionario de 5 preguntas. <br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 videos (Total 84 min), 6 quizzes
Video10 videos
Datos - Fuentes de información4m
Distintos problemas y técnicas8m
Caso de estudio y herramientas4m
Introducción a Jupyter Notebook y Pyspark (S1E4.ipynb)5m
Exploración de la estructura de datos (S1E5.ipynb)14m
Primera etapa del análisis exploratorio (S1E6.ipynb)11m
Preproceso de datos (I) - (S1E7.ipynb)11m
Preproceso de datos (II) - (S1E8.ipynb)6m
Segunda etapa del análisis exploratorio (S1E9.ipynb)14m
Quiz6 practice exercises
Cuestionario 110m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Week
2
Hours to complete
3 hours to complete

MÓDULO 2 - MODELOS DE REGRESIÓN

En el módulo 2 del curso se introducen conceptos de modelización generales (calibración y validación) y en particular los modelos de regresión lineal y regresión logística. Desde la perspectiva de Big Data, se incluyen aspectos relacionados con la regularización de los modelos para su simplificación. <br><br><i>Como en el módulo anterior, visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 videos (Total 89 min), 7 quizzes
Video10 videos
Objetivo de la Modelización8m
Calibración del modelo10m
Resultado de la Modelización11m
Regresión Simple (S2E4.ipynb)11m
Nuevas variables (S2E5.ipynb)8m
Regresión Múltiple (I) (S2E6.ipynb)7m
Regresión Múltiple (II) (S2E7.ipynb)11m
Regresión Logística (I) (S2E8.ipynb)8m
Regresión Logística (II) (S2E9.ipynb)10m
Quiz7 practice exercises
Cuestionario 110m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Cuestionario 710m
Week
3
Hours to complete
3 hours to complete

MÓDULO 3 - ÁRBOLES DE REGRESIÓN Y CLASIFICACIÓN

En el módulo 3 del curso se introduce la família de modelos basada en árboles (clasificación, regresión, bosques) y aspectos generales sobre la incertidumbre y el sobreajuste. Después de cada tema, o de unos pocos temas, encontrarás un cuestionario para comprobar tu nivel de comprensión de los mismos.<br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 videos (Total 89 min), 7 quizzes
Video10 videos
Introducción a la Modelización5m
Medir la Incertidumbre10m
Concepto de Árbol8m
Árboles de Regresión11m
Modelización con Árboles de Regresión (S3E5.ipynb)9m
Árboles de Clasificación9m
Modelización con Árboles de Clasificación (S3E7.ipynb)9m
Bosques Aleatorios14m
Modelización con Bosques Aleatorios (S3E9.ipynb)9m
Quiz7 practice exercises
Cuestionario 18m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Cuestionario 710m
Week
4
Hours to complete
3 hours to complete

MÓDULO 4 - REDES NEURONALES Y TÉCNICAS NO SUPERVISADAS

En el módulo 4 del curso se introduce la família de modelos basada en redes neuronales así como se introducen las técnicas básicas no supervisadas, tanto de clasificación automática como de reducción de la dimensionalidad. En este módulo, además de los cuestionarios convencionales, tendrás que realizar un trabajo práctico en el que trabajarás las técnicas aprendidas hasta el momento.<br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, realiza el ejercicios práctico, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 videos (Total 75 min), 1 reading, 7 quizzes
Video10 videos
Redes Neuronales12m
Modelización con redes neuronales (S4E2.ipynb)6m
Introducción al reconocimiento de patrones5m
Reducción dimensión11m
Análisis de componentes principales (S4E6.ipynb)10m
Clasificación automática8m
Análisis de clústers (S4E8.ipynb)7m
Revisión de la ciencia de datos (I)5m
Revisión de la ciencia de datos (II)6m
Reading1 reading
TRABAJO PRÁCTICO - Enunciado30m
Quiz7 practice exercises
Cuestionario 110m
Cuestionario 210m
Cuestionario 310m
Cuestionario 410m
Cuestionario 510m
Cuestionario 610m
Cuestionario del Ejercicio Práctico30m

Instructors

Avatar

Llorenç Badiella

Director Servei d'Estadística Aplicada UAB
Universitat Autònoma de Barcelona
Avatar

Isabel Serra

Doctora
Centre de Recerca Matemàtica

About Universitat Autònoma de Barcelona

The Universitat Autònoma de Barcelona (UAB) is a public university located in the metropolitan area of Barcelona. International in its outlook, it is fully consolidated within its local surroundings, and offers quality education in close association with research activity, the transfer of scientific, technological, cultural and educational knowledge, the promotion of its human potential and the responsible management of available resources. The UAB currently offers 81 degrees, 130 official Master Programmes and 183 UAB-specific Masters Degrees. In addition, it offers 174 lifelong learning programmes and 65 PhD Programmes, 27 of which have been distinguished through Quality Awards. The UAB has a total of over 3,500 teaching and research staff, over 2,000 administrative staff and over 40,000 students....

About the Big Data – Introducción al uso práctico de datos masivos Specialization

Este programa, de 4 cursos más un proyecto final, está pensado como una entrada al mundo de los datos masivos y su tratamiento. El primer curso tiene como objetivo mostrar al estudiante el impacto del Big Data en la sociedad actual, tanto en el mundo de los negocios como en el de la política y administraciones públicas, los medios de comunicación, y/o la investigación científica. A lo largo de los cursos 2, 3 y 4 se estudian la identificación, captura, pre-procesamiento, análisis y visualización de datos, desde un punto de vista “usuario”, y con una orientación práctica. Finalmente, el Capstone Project permite al estudiante utilizar en conjunto las herramientas y conceptos vistos en los cursos precedentes en un campo donde el concepto “Big Data” es innegable: el estudio de las galaxias. Al finalizar los cursos de esta especialización el estudiante será capaz de: 1. Entender el impacto del tratamiento de datos masivos en la sociedad actual 2. Entender y explicar la procedencia y características de los datos masivos. 3. Adquirir, preparar, almacenar, analizar, visualizar y manejar grandes conjuntos de datos 4. Extraer información de los datos 5. Trabajar dentro del ecosistema Hadoop 6. Contestar a una pregunta bien formulada en función de la información disponible (capstone project) Contamos con un conjunto maravilloso de profesores, con una gran experiencia en el tema, provenientes tanto de la universidad como de la empresa....
Big Data – Introducción al uso práctico de datos masivos

Frequently Asked Questions

  • Once you enroll for a Certificate, you’ll have access to all videos, quizzes, and programming assignments (if applicable). Peer review assignments can only be submitted and reviewed once your session has begun. If you choose to explore the course without purchasing, you may not be able to access certain assignments.

  • When you enroll in the course, you get access to all of the courses in the Specialization, and you earn a certificate when you complete the work. Your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile. If you only want to read and view the course content, you can audit the course for free.

More questions? Visit the Learner Help Center.