Os pipelines de dados geralmente se encaixam em um desses três paradigmas: extração e carregamento (EL), extração, carregamento e transformação (ELT) ou extração, transformação e carregamento (ETL). Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.



Building Batch Data Pipelines on GCP em Português Brasileiro
This course is part of Data Engineer, Big Data and ML on Google Cloud em Português Specialization

Instructor: Google Cloud Training
Access provided by Assiut university
(16 reviews)
What you'll learn
Analisar diferentes métodos de carregamento de dados: EL, ELT e ETL e quando usar cada um deles.
Executar o Hadoop no Dataproc, usar o Cloud Storage e otimizar os jobs do Dataproc.
Usar o Dataflow para criar pipelines de processamento de dados.
Gerenciar pipelines de dados com o Data Fusion e o Cloud Composer.
Skills you'll gain
Details to know

Add to your LinkedIn profile
4 assignments
See how employees at top companies are mastering in-demand skills

Build your subject-matter expertise
- Learn new concepts from industry experts
- Gain a foundational understanding of a subject or tool
- Develop job-relevant skills with hands-on projects
- Earn a shareable career certificate

There are 6 modules in this course
Neste módulo, vamos apresentar o curso e a programação.
What's included
1 video
Este módulo analisa diferentes métodos de carregamento de dados: EL, ELT e ETL e quando usar cada um deles.
What's included
6 videos1 assignment
Este módulo mostra como executar o Hadoop no Dataproc, como usar o Cloud Storage e como otimizar os jobs do Dataproc.
What's included
11 videos1 assignment1 app item
Este módulo aborda o uso do Dataflow para criar pipelines de processamento de dados.
What's included
13 videos1 assignment6 app items
Este módulo mostra como gerenciar pipelines de dados com o Cloud Data Fusion e o Cloud Composer.
What's included
13 videos1 assignment2 app items
Resumo do curso
What's included
1 video
Earn a career certificate
Add this credential to your LinkedIn profile, resume, or CV. Share it on social media and in your performance review.
Instructor

Offered by
Why people choose Coursera for their career




Explore more from Information Technology
Google Cloud
Google Cloud

Open new doors with Coursera Plus
Unlimited access to 10,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription
Advance your career with an online degree
Earn a degree from world-class universities - 100% online
Join over 3,400 global companies that choose Coursera for Business
Upskill your employees to excel in the digital economy