Coursera

Pipelines de données et SQL pour l'analyse des produits

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Coursera

Pipelines de données et SQL pour l'analyse des produits

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

9 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire

Expérience recommandée

9 heures à compléter
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Créez des pipelines de données évolutifs à l'aide de SQL et de Pandas afin de transformer plus de 10 millions de lignes de données brutes d'événements en ensembles de données analytiques structurés.

  • Concevoir et optimiser des schémas en étoile avec des dimensions à évolution lente de type 2 afin de suivre l'évolution historique des données d'analyse des produits.

  • Comparer et mettre en œuvre des fonctions de fenêtre SQL avancées dans différents dialectes, tels que Presto et Spark, afin d'assurer la compatibilité multiplateforme.

  • Évaluer les schémas existants de l'entrepôt de données et proposer des améliorations en termes de performances à l'aide de techniques d'agrégation et de stratégies d'indexation.

Compétences que vous acquerrez

  • Catégorie : Entreposage de données
  • Catégorie : Manipulation de données
  • Catégorie : Analyse des performances
  • Catégorie : Conception de la base de données
  • Catégorie : SQL
  • Catégorie : Qualité des données
  • Catégorie : Données en temps réel
  • Catégorie : Vérification et validation
  • Catégorie : Pipelines de données
  • Catégorie : Transformation des données
  • Catégorie : Extraire, transformer, charger
  • Catégorie : Big Data
  • Catégorie : Optimisation des performances
  • Catégorie : Schéma en étoile
  • Catégorie : Validation des données

Outils que vous découvrirez

  • Catégorie : Pandas (paquetage Python)
  • Catégorie : Langages de requête
  • Catégorie : Flux d'air Apache
  • Catégorie : JSON

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Récemment mis à jour !

mars 2026

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "Product Analytics Unlocked : Des métriques à la connaissance du produit"
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 11 modules dans ce cours

Dans ce module, vous configurerez des pipelines ETL automatisés à l'aide d'Apache Airflow pour ingérer de manière transparente des flux d'événements en temps réel à partir de sources telles que Mixpanel dans des entrepôts de données tels que Snowflake.

Inclus

2 vidéos1 lecture1 devoir1 laboratoire non noté

Dans ce module, vous mettrez en œuvre des processus de validation systématiques pour évaluer les implémentations d'événements mobiles par rapport à des spécifications de suivi prédéfinies, identifier les lacunes de conformité et créer des flux de travail de remédiation exploitables.

Inclus

1 vidéo2 lectures2 devoirs

Vous apprendrez à construire des pipelines de transformation de données évolutifs et faciles à maintenir grâce à des techniques de script SQL paramétrées.

Inclus

3 vidéos1 lecture2 devoirs

Vous apprendrez des techniques d'analyse systématique des performances pour identifier et résoudre les goulets d'étranglement des bases de données qui ont un impact sur les flux de travail analytiques.

Inclus

2 vidéos2 lectures3 devoirs

Vous apprendrez des approches systématiques pour transformer des structures JSON imbriquées complexes en pandas DataFrames, permettant un prétraitement fiable des données pour les pipelines d'analyse.

Inclus

3 vidéos1 lecture1 devoir

Vous développerez des approches systématiques pour identifier, diagnostiquer et corriger les problèmes de qualité des données liés au fuseau horaire qui fragmentent les sessions des utilisateurs et compromettent l'analyse temporelle.

Inclus

2 vidéos1 lecture3 devoirs1 laboratoire non noté

Vous apprendrez les variations syntaxiques critiques entre les dialectes SQL qui peuvent faire ou défaire les requêtes analytiques dans les environnements de données d'entreprise.

Inclus

2 vidéos2 lectures1 devoir

Vous apprendrez des techniques avancées pour transformer des flux d'événements bruts en ensembles de données analytiques structurés en utilisant les méthodes d'agrégation SQL et Pandas.

Inclus

2 vidéos1 lecture3 devoirs1 laboratoire non noté

Vous apprendrez les concepts fondamentaux et la mise en œuvre pratique des dimensions à évolution lente de type 2 pour préserver des enregistrements de données historiques complets dans les modèles dimensionnels.

Inclus

2 vidéos2 lectures1 devoir

Vous apprendrez des techniques d'évaluation systématique pour évaluer l'efficacité des schémas en étoile et développer des stratégies d'affinement complètes qui équilibrent les performances des requêtes, l'efficacité du stockage et les capacités d'analyse.

Inclus

2 vidéos2 lectures3 devoirs

Vous construirez un système complet de pipeline de données qui automatise l'ingestion de données d'événements, transforme des structures de données complexes et crée des ensembles de données analytiques optimisés. Ce projet intègre des compétences en matière d'ingestion automatisée de données, d'optimisation SQL, de transformation JSON, de correction des données temporelles, de techniques d'agrégation avancées et de modélisation dimensionnelle afin de créer une infrastructure analytique prête à la production.

Inclus

4 lectures1 devoir

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

Professionals from the Industry
483 Cours110 472 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions

¹ Certains travaux de ce cours sont notés par l'IA. Pour ces travaux, vos Données internes seront utilisées conformément à Notification de confidentialité de Coursera.