Coursera

Streamer et unifier les schémas de données avec CDC

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Coursera

Streamer et unifier les schémas de données avec CDC

Starweaver
Luca Berton

Instructeurs : Starweaver

Inclus avec Coursera Plus

Demander à Coursera

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

5 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

5 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Expliquez les principes fondamentaux du CDC (binlog/WAL) et les stratégies d'évolution des schémas.

  • Configurer localement un pipeline de registre de schémas à l'aide de Debezium et de Kafka.

  • Utilisez le SQL en streaming (Flink/ksqlDB) pour mapper, convertir et fusionner des schémas divergents en un modèle canonique.

Compétences que vous acquerrez

  • Catégorie : Diagrammes schématiques
  • Catégorie : Intégrité des données
  • Catégorie : Déploiement dans le nuage
  • Catégorie : Intégration continue
  • Catégorie : Pipelines de données
  • Catégorie : Cartographie des données
  • Catégorie : SQL
  • Catégorie : Modélisation des données
  • Catégorie : Contrôle continu
  • Catégorie : Technologies de stockage des données
  • Catégorie : Transformation des données
  • Catégorie : Validation des données
  • Catégorie : Magasin de données
  • Catégorie : Données en temps réel
  • Catégorie : Capture des données

Outils que vous découvrirez

  • Catégorie : Apache Kafka
  • Catégorie : PostgreSQL

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

janvier 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "Real-Time, Real Fast : Kafka & Spark pour les ingénieurs de données"
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 3 modules dans ce cours

Déployez une pile locale composée de Debezium, Kafka, Schema Registry et Flink/ksqlDB afin d’observer en temps réel les modifications au niveau des lignes. Modifiez délibérément le schéma source, puis utilisez le SQL en streaming pour mapper, convertir et fusionner les champs dans une table canonique. Effectuez des opérations « upsert » à l’aide de clés stables et vérifiez que les données sont correctement stockées dans Iceberg. À l’issue de cet exercice, vous aurez mis en place une boucle CDC opérationnelle ainsi qu’un ensemble de données unifié et interrogeable.

Inclus

4 vidéos2 lectures1 devoir

Apprenez à prévenir les perturbations pour les utilisateurs en garantissant la compatibilité tant au niveau des entités qu’au niveau global. Nous allons délibérément déployer un schéma incompatible, observer l'échec, puis poursuivre en toute sécurité en utilisant les valeurs par défaut et les modes transitifs. Mettez en place des mesures de protection concrètes telles que des vérifications de schéma en CI, des DLQ, des alertes et des sondes de décalage afin de garantir que les problèmes soient rapidement identifiés et maîtrisés. L'accent est mis sur une reprise reproductible, et non sur des actions héroïques.

Inclus

3 vidéos1 lecture1 devoir

Développer un modèle canonique robuste englobant les conventions de nommage, les types de données et les unités, la possibilité de valeurs nulles et les mécanismes de suppression temporaire, puis le stocker dans Iceberg sur MinIO à l’aide d’upserts en streaming. Effectuez des requêtes en temps réel avec Trino et utilisez les fonctionnalités de « voyage dans le temps » pour la validation ou le débogage des régressions. Le projet consiste à construire une vue dénormalisée « dernière mise à jour par client » à des fins d’analyse, ainsi qu’à aborder les stratégies de partitionnement, les suppressions par égalité et la compaction des données. Les participants acquerront des modèles évolutifs adaptés à un déploiement allant des ordinateurs portables aux environnements cloud.

Inclus

4 vidéos1 lecture3 devoirs

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Starweaver
Coursera
570 Cours1 150 477 apprenants

Offert par

Coursera

En savoir plus sur Développement de logiciels

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.