e.g. This is primarily aimed at first- and second-year undergraduates interested in engineering or science, along with high school students and professionals with an interest in programmingGain the skills for building efficient and scalable data pipelines. Explore essential data engineering platforms (Hadoop, Spark, and Snowflake) as well as learn how to optimize and manage them. Delve into Databricks, a powerful platform for executing data analytics and machine learning tasks, while honing your Python data science skills with PySpark. Finally, discover the key concepts of MLflow, an open-source platform for managing the end-to-end machine learning lifecycle, and learn how to integrate it with Databricks.

Spark, Hadoop, and Snowflake for Data Engineering
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Spark, Hadoop, and Snowflake for Data Engineering
Ce cours fait partie de Spécialisation "Applied Python Data Engineering"



Instructeurs : Noah Gift
14 632 déjà inscrits
Inclus avec
Demander à Coursera
71 avis
Expérience recommandée
Ce que vous apprendrez
Create scalable data pipelines (Hadoop, Spark, Snowflake, Databricks) for efficient data handling.
Optimize data engineering with clustering and scaling to boost performance and resource use.
Build ML solutions (PySpark, MLFlow) on Databricks for seamless model development and deployment.
Implement DataOps and DevOps practices for continuous integration and deployment (CI/CD) of data-driven applications, including automating processes.
Compétences que vous acquerrez
- Catégorie : SQL
- Catégorie : Data Integration
- Catégorie : Data Warehousing
- Catégorie : Distributed Computing
- Catégorie : MLOps (Machine Learning Operations)
- Catégorie : Big Data
- Catégorie : Data Pipelines
- Catégorie : Snowflake Schema
- Catégorie : Data Quality
- Catégorie : Data Transformation
- Catégorie : Data Architecture
- Catégorie : Model Training
- Catégorie : Data Processing
- Catégorie : DevOps
Outils que vous découvrirez
- Catégorie : Databricks
- Catégorie : Model Deployment
- Catégorie : Python Programming
- Catégorie : Apache Spark
- Catégorie : Apache Hadoop
- Catégorie : PySpark
Détails à connaître

Ajouter à votre profil LinkedIn
21 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 4 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs

Offert par
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
52,11 %
- 4 stars
19,71 %
- 3 stars
8,45 %
- 2 stars
8,45 %
- 1 star
11,26 %
Affichage de 3 sur 71
Révisé le 15 janv. 2024
A course that cover all aspects basic of data engineer, i love it
Révisé le 6 août 2024
Great course, detailed steps by step walkthrough that really simplifies understanding
Foire Aux Questions
Plus de questions
Aide financière disponible,




