par exemple. Ceci est principalement destiné aux étudiants de première et deuxième année de premier cycle intéressés par l'ingénierie ou la science, ainsi qu'aux étudiants du secondaire et aux professionnels intéressés par la programmationApprenez les compétences nécessaires pour construire des pipelines de données efficaces et évolutifs. Explorez les plateformes essentielles d'ingénierie des données (Hadoop, Spark et Snowflake), ainsi que l'optimisation et la gestion de ces plateformes. Plongez dans Databricks, une plateforme puissante pour l'exécution de tâches d'analyse des données et d'apprentissage automatique, tout en perfectionnant vos compétences en science des données Python avec PySpark. Enfin, découvrez les concepts clés de MLflow, une plateforme open-source pour gérer le cycle de vie de l'apprentissage automatique de bout en bout, et apprenez à l'intégrer à Databricks. Ce cours est conçu pour les apprenants qui souhaitent poursuivre ou faire progresser leur carrière dans la science des données ou l'ingénierie des données, ou pour les développeurs de logiciels ou les ingénieurs qui souhaitent développer leur ensemble de compétences en matière de gestion des données. En plus des technologies que vous apprendrez, vous obtiendrez également des méthodologies pour vous aider à affiner vos compétences en matière de gestion de projet et de flux de travail pour l'ingénierie des données, y compris l'application des méthodologies et des meilleures pratiques Kaizen, DevOps et Data Ops. Avec des quiz pour tester vos connaissances tout au long, ce cours complet aidera à guider votre voyage d'apprentissage pour devenir un ingénieur de données compétent, prêt à relever les défis du monde d'aujourd'hui axé sur les données.

Spark, Hadoop et Snowflake pour l'ingénierie des données
Saisissez l'occasion de faire des économies ! Bénéficiez de 40 % de réduction sur 3 mois de Coursera Plus et d'un accès complet à des milliers de cours.

Spark, Hadoop et Snowflake pour l'ingénierie des données
Ce cours fait partie de Spécialisation "Ingénierie des données appliquée à Python"



Instructeurs : Noah Gift
13 955 déjà inscrits
Inclus avec
64 avis
Expérience recommandée
Ce que vous apprendrez
Créer des pipelines de données évolutifs (Hadoop, Spark, Snowflake, Databricks) pour un traitement efficace des données.
Optimisez l'ingénierie des données avec le clustering et la mise à l'échelle pour stimuler les performances et l'utilisation des ressources.
Construire des solutions ML (PySpark, MLFlow) sur Databricks pour un développement et un déploiement de modèles en toute transparence.
Mettre en œuvre les pratiques DataOps et DevOps pour l'intégration et le déploiement continus (CI/CD) d'applications axées sur les données, y compris l'automatisation des processus.
Compétences que vous acquerrez
- Catégorie : Database Architecture and Administration
- Catégorie : DevOps
- Catégorie : Data Processing
- Catégorie : Data Quality
- Catégorie : Data Integration
- Catégorie : MLOps (Machine Learning Operations)
- Catégorie : Distributed Computing
- Catégorie : SQL
- Catégorie : Big Data
- Catégorie : Data Transformation
- Catégorie : Data Pipelines
- Catégorie : Data Warehousing
Outils que vous découvrirez
- Catégorie : Apache Spark
- Catégorie : PySpark
- Catégorie : Python Programming
- Catégorie : Apache Hadoop
- Catégorie : Databricks
Détails à connaître

Ajouter à votre profil LinkedIn
21 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 4 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs

Offert par
En savoir plus sur Apprentissage automatique
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuitDuke University
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
53,12 %
- 4 stars
17,18 %
- 3 stars
9,37 %
- 2 stars
9,37 %
- 1 star
10,93 %
Affichage de 3 sur 64
Révisé le 15 janv. 2024
A course that cover all aspects basic of data engineer, i love it
Révisé le 6 août 2024
Great course, detailed steps by step walkthrough that really simplifies understanding

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Plus de questions
Aide financière disponible,

