Streamer et unifier les schémas de données avec CDC

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Streamer et unifier les schémas de données avec CDC

Ce cours fait partie de Spécialisation "Real-Time, Real Fast : Kafka & Spark pour les ingénieurs de données"

Instructeurs : Starweaver

Inclus avec

Demander à Coursera

3 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Intermédiaire

Expérience recommandée

5 heures à compléter

Planning flexible

Apprenez à votre propre rythme

3 modules

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.

niveau Intermédiaire

Expérience recommandée

5 heures à compléter

Planning flexible

Apprenez à votre propre rythme

Ce que vous apprendrez

Expliquez les principes fondamentaux du CDC (binlog/WAL) et les stratégies d'évolution des schémas.
Configurer localement un pipeline de registre de schémas à l'aide de Debezium et de Kafka.
Utilisez le SQL en streaming (Flink/ksqlDB) pour mapper, convertir et fusionner des schémas divergents en un modèle canonique.

Compétences que vous acquerrez

Catégorie : Diagrammes schématiques
Catégorie : Intégrité des données
Catégorie : Déploiement dans le nuage
Catégorie : Intégration continue
Catégorie : Pipelines de données
Catégorie : Cartographie des données
Catégorie : SQL
Catégorie : Modélisation des données
Catégorie : Contrôle continu
Catégorie : Technologies de stockage des données
Catégorie : Transformation des données
Catégorie : Validation des données
Catégorie : Magasin de données
Catégorie : Données en temps réel
Catégorie : Capture des données

Outils que vous découvrirez

Catégorie : Apache Kafka
Catégorie : PostgreSQL

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

janvier 2026

Évaluations

5 affectations¹

Noté par l'IA voir l'avis de non-responsabilité

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "Real-Time, Real Fast : Kafka & Spark pour les ingénieurs de données"

Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.

Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable

Il y a 3 modules dans ce cours

Imaginez que vous puissiez déployer des modifications de schéma en toute confiance, en sachant que votre pipeline les gérera sans heurts, que vos consommateurs fonctionneront correctement et que vos données resteront cohérentes. C’est là toute la différence entre espérer que votre pipeline CDC fonctionne et savoir qu’il fonctionnera. Dans cette formation, vous apprendrez à créer un pipeline CDC opérationnel et indépendant des éditeurs, ainsi qu’une table unique et unifiée à partir de schémas sources en constante évolution. En partant de Debezium, qui diffuse les modifications de Postgres/MySQL vers Kafka, vous utiliserez Schema Registry pour garantir la compatibilité, puis vous appliquerez le streaming SQL dans Flink (ou ksqlDB) pour mapper, convertir et fusionner les champs divergents en un modèle canonique. Enfin, vous enregistrerez les résultats dans une table Apache Iceberg et les interrogez instantanément avec Trino. Au fil de la formation, vous apprendrez des stratégies pratiques pour gérer la dérive des schémas, choisir les modes de compatibilité (rétroactive/complète) et éviter de perturber les consommateurs en aval. Tout s’exécute localement avec Docker, ce qui vous permet de reproduire ces opérations n’importe où et de transposer ultérieurement ces mêmes modèles dans votre infrastructure cloud.

Cette formation s’adresse aux ingénieurs travaillant avec Kafka, Debezium et le SQL en streaming qui ont besoin de compétences fiables en matière d’évolution des schémas et de modélisation canonique. Les participants doivent maîtriser les bases du SQL et de Docker, et avoir une bonne connaissance de Kafka ou des concepts liés au streaming. À l’issue de cette formation, vous serez en mesure de mettre en œuvre un petit pipeline CDC de bout en bout qui récupère les données en continu depuis une base de données source et unifie les schémas évolutifs en une seule table interrogeable.

Déployez une pile locale composée de Debezium, Kafka, Schema Registry et Flink/ksqlDB afin d’observer en temps réel les modifications au niveau des lignes. Modifiez délibérément le schéma source, puis utilisez le SQL en streaming pour mapper, convertir et fusionner les champs dans une table canonique. Effectuez des opérations « upsert » à l’aide de clés stables et vérifiez que les données sont correctement stockées dans Iceberg. À l’issue de cet exercice, vous aurez mis en place une boucle CDC opérationnelle ainsi qu’un ensemble de données unifié et interrogeable.

Inclus

4 vidéos2 lectures1 devoir

4 vidéosTotal 37 minutes

Introduction et bienvenue4 minutes
Du CDC à l'analyse : aperçu complet de l'architecture11 minutes
Analyse approfondie des flux de données : de la source au « lakehouse »12 minutes
Live Build : unification des schémas grâce au SQL en continu10 minutes

2 lecturesTotal 10 minutes

Bienvenue au cours : Aperçu du cours5 minutes
Ressources supplémentaires sur l'évolution des schémas5 minutes

1 devoirTotal 30 minutes

Apprentissage pratique (HOL) : Notions de base sur le CDC et évolution sécurisée des schémas30 minutes

Apprenez à prévenir les perturbations pour les utilisateurs en garantissant la compatibilité tant au niveau des entités qu’au niveau global. Nous allons délibérément déployer un schéma incompatible, observer l'échec, puis poursuivre en toute sécurité en utilisant les valeurs par défaut et les modes transitifs. Mettez en place des mesures de protection concrètes telles que des vérifications de schéma en CI, des DLQ, des alertes et des sondes de décalage afin de garantir que les problèmes soient rapidement identifiés et maîtrisés. L'accent est mis sur une reprise reproductible, et non sur des actions héroïques.

Inclus

3 vidéos1 lecture1 devoir

3 vidéosTotal 30 minutes

De Debezium à Kafka : Câbler CDC avec Schema Registry11 minutes
Enfreindre un schéma de manière délibérée : puis le corriger9 minutes
Observabilité et garde-fous10 minutes

1 lectureTotal 5 minutes

Les modes de compatibilité en pratique5 minutes

1 devoirTotal 30 minutes

Apprentissage pratique (HOL) : corriger une modification entraînant une rupture de compatibilité30 minutes

Développer un modèle canonique robuste englobant les conventions de nommage, les types de données et les unités, la possibilité de valeurs nulles et les mécanismes de suppression temporaire, puis le stocker dans Iceberg sur MinIO à l’aide d’upserts en streaming. Effectuez des requêtes en temps réel avec Trino et utilisez les fonctionnalités de « voyage dans le temps » pour la validation ou le débogage des régressions. Le projet consiste à construire une vue dénormalisée « dernière mise à jour par client » à des fins d’analyse, ainsi qu’à aborder les stratégies de partitionnement, les suppressions par égalité et la compaction des données. Les participants acquerront des modèles évolutifs adaptés à un déploiement allant des ordinateurs portables aux environnements cloud.

Inclus

4 vidéos1 lecture3 devoirs

4 vidéosTotal 36 minutes

Notions de base sur les schémas canoniques7 minutes
Modèles SQL en streaming : conversions de type, Coalesce, Upserts, jointures13 minutes
Stockage et interrogation avec Iceberg + Trino12 minutes
Récapitulatif + Prochaines étapes3 minutes

1 lectureTotal 5 minutes

Les indispensables Iceberg pour les éviers à écoulement direct5 minutes

3 devoirsTotal 120 minutes

Streamer et unifier les schémas de données avec CDC30 minutes
Apprentissage pratique (HOL) : Traitement des dernières commandes clients30 minutes
Projet : Des flux du CDC aux commandes clients fiables 60 minutes

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Starweaver

Coursera

570 Cours1 150 477 apprenants

Offert par

Coursera

En savoir plus sur Développement de logiciels

Statut : Essai gratuit
Coursera
Manage Schema Evolution in Real‑Time Data
Cours
Packt
Kafka for Developers - Data Contracts Using Schema Registry
Cours
Statut : Essai gratuit
Coursera
Unify Diverse Data Sources
Cours
Statut : Essai gratuit
Coursera
Ensure Consistency in Streaming Pipelines
Cours

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.

Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.

Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.

Plus de questions

Visitez le Centre d'Aide pour les Étudiants

Aide financière disponible,

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.