Os pipelines de dados geralmente se encaixam em um dos três paradigmas: extração-carregamento, extração-carregamento-transformação ou extração-transformação-carregamento. Este curso descreve qual paradigma deve ser usado em determinadas situações e quando isso ocorre com dados em lote. Além disso, vamos falar sobre várias tecnologias no Google Cloud para transformação de dados, incluindo o BigQuery, a execução do Spark no Dataproc, gráficos de pipeline no Cloud Data Fusion e processamento de dados sem servidor com o Dataflow. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados no Google Cloud usando o Qwiklabs.
This course is part of the Data Engineer, Big Data and ML on Google Cloud em Português Specialization
Offered By
About this Course
What you will learn
Analisar diferentes métodos de carregamento de dados: EL, ELT e ETL (e quando cada um deve ser usado)
Executar o Hadoop no Dataproc, usar o Cloud Storage e otimizar os jobs do Dataproc
Usar o Dataflow para criar pipelines de processamento de dados
Gerenciar pipelines de dados com o Data Fusion e o Cloud Composer
Offered by
Syllabus - What you will learn from this course
Introdução
Introdução à criação de pipelines de dados em lote
Como executar o Spark no Dataproc
Processamento de dados sem servidor com o Dataflow
Reviews
- 5 stars78.57%
- 4 stars14.28%
- 3 stars7.14%
TOP REVIEWS FROM BUILDING BATCH DATA PIPELINES ON GCP EM PORTUGUÊS BRASILEIRO
Apresentação fantastica sobre as principais ferramentas para criação e gerenciamento de pipelines.
About the Data Engineer, Big Data and ML on Google Cloud em Português Specialization

Frequently Asked Questions
Can I preview a course before enrolling?
When will I have access to the lectures and assignments?
What will I get when I enroll?
When will I receive my Course Certificate?
Why can’t I audit this course?
What is the refund policy?
Is financial aid available?
More questions? Visit the Learner Help Center.