Mejores prácticas para el procesamiento de datos en Big Data

4.9
stars
36 ratings
Offered By
Coursera Project Network
In this Guided Project, you will:

Utilizar las librerías adecuadas en un contexto de Big Data

Crear clúster para procesamiento masivo

Crear funciones de usuario para optimizar el análisis

Clock60 minutos
IntermediateIntermediate
CloudNo download needed
VideoSplit-screen video
Comment DotsSpanish
LaptopDesktop only

En este proyecto de 1 hora, aprenderás a aplicar buenas prácticas bajo el contexto de procesamiento Big Data, utilizando una de las plataformas más importantes en la actualidad, Databricks. Además, podrás analizar las mejores opciones y librerías para la manipulación de datos sobre dataframes de Spark.

Skills you will develop

Big DataPySparkDatabricks

Learn step-by-step

In a video that plays in a split-screen with your work area, your instructor will walk you through these steps:

  1. Creación de clústers

  2. Uso de Dataframes, SQL y Hive

  3. Crear funciones definidas por usuario (UDF)

  4. Uso de librería Koalas

  5. Streaming de datos y joins

How Guided Projects work

Your workspace is a cloud desktop right in your browser, no download required

In a split-screen video, your instructor guides you step-by-step

Reviews

TOP REVIEWS FROM MEJORES PRÁCTICAS PARA EL PROCESAMIENTO DE DATOS EN BIG DATA

View all reviews

Frequently asked questions

Frequently Asked Questions

More questions? Visit the Learner Help Center.