Ce cours couvrira divers sujets de l'ingénierie des données à l'appui des systèmes d'aide à la décision, de l'analytique des données, de l'exploration des données, de l'apprentissage automatique et de l'intelligence artificielle. Vous étudierez l'architecture des entrepôts de données sur site, la modélisation dimensionnelle des entrepôts de données, l'intégration Extract-Transform-Load (ETL) des systèmes sources à l'entrepôt de données, les systèmes de traitement analytique en ligne (OLAP) et le monde en évolution de la qualité et de la gouvernance des données. Il vous offre la possibilité de concevoir, développer et maintenir des pipelines de données basés sur le cloud. Les plateformes sur site et basées sur le cloud seront utilisées pour illustrer et mettre en œuvre des techniques d'ingénierie des données à l'aide d'entrepôts de données opérationnels et analytiques.
Ce module présente l'Entreposage de données et l'Informatique décisionnelle, en mettant l'accent sur leur rôle dans l'amélioration de la prise de décision au sein de l'organisation. Les entrepôts de données transforment les données brutes en informations exploitables à l'aide de processus tels que l'ETL (Extraction, Transformation et Chargement), soutenus par des outils tels que l'OLAP pour l'interrogation et l'exploration des données. Alors que les bases de données opérationnelles (OLTP) sont adaptées aux transactions quotidiennes, les bases de données OLAP sont optimisées pour les analyses complexes.
Inclus
3 vidéos6 lectures1 devoir
Afficher les informations sur le contenu du module
Bienvenue à l'Entreposage de données et à l'Intégration des données Partie 1•2 minutes
Syllabus - Entrepôt de données & Intégrité des données Partie 1•10 minutes
Intégrité académique•1 minute
Module 1 : Vue d'ensemble•5 minutes
Introduction aux entrepôts de données•5 minutes
Conception d'une base de données•155 minutes
1 devoir•Total 15 minutes
Évaluez votre apprentissage : Modélisation conceptuelle des bases de données•15 minutes
Concepts de base de données 2
Module 2•6 heures à terminer
Détails du module
Ce module s'appuie sur les bases de la conception de bases de données du module précédent, en se concentrant sur la modélisation des bases de données relationnelles, la normalisation et le langage SQL. Les lectures vous guideront dans la traduction d'un diagramme conceptuel EER en un modèle relationnel, en assurant l'adhésion aux principes de normalisation et en visant la Troisième Forme Normale (3NF). Nous mettrons également l'accent sur la compréhension des clés primaires et des clés étrangères pour maintenir l'intégrité des données et établir les relations entre les tables. Vous aurez également l'occasion de créer et de critiquer des modèles relationnels. Nous explorerons ensuite les bases du langage SQL, couvrant la syntaxe (SELECT, INSERT, UPDATE, DELETE), les techniques d'interrogation (WHERE, ORDER BY, JOIN), et les opérations impliquant des fonctions et des agrégats (COUNT, SUM, AVG, MIN, MAX), qui sont fondamentales dans l'interrogation et la gestion des bases de données.
Inclus
3 lectures2 devoirs1 élément d'application
Afficher les informations sur le contenu du module
3 lectures•Total 339 minutes
Vue d'ensemble du module 2•5 minutes
Conception logique de la base de données•165 minutes
SQL•169 minutes
2 devoirs•Total 40 minutes
Évaluez votre apprentissage : Conception logique d'une base de données•20 minutes
Évaluez votre apprentissage : SQL•20 minutes
1 élément d'application•Total 10 minutes
Normalisation•10 minutes
Concepts de l'Entrepôt de données
Module 3•3 heures à terminer
Détails du module
Ce module propose une introduction aux concepts d'entrepôt de données. Les entrepôts de données sont basés sur un modèle multidimensionnel. Nous examinerons de près le modèle multidimensionnel et sa représentation sous forme de cubes de données (également connus sous le nom d'hypercubes). Nous examinerons comment les différents aspects des données sont classés en faits, mesures et dimensions. Les dimensions telles que le produit, le temps et le client sont organisées de manière hiérarchique au sein d'un cube, ce qui permet d'analyser les données à différents niveaux de détail. Les mesures telles que la quantité et le montant des ventes sont stockées dans ces cubes, et les analystes peuvent naviguer à travers différents niveaux de détail en utilisant les techniques de "rolling up" et de "drilling down". Nous explorerons également des concepts clés tels que la granularité, le schéma de dimension et les hiérarchies de membres, qui sont essentiels pour comprendre comment les données sont structurées et analysées dans les modèles multidimensionnels. Enfin, nous apprendrons à utiliser des techniques telles que la disjonction, l'exhaustivité et l'exactitude pour garantir l'exactitude et l'intégrité des données lors de l'agrégation des données dans les cubes de données, ce que l'on appelle collectivement la résumabilité.
Dans ce module, nous allons explorer la modélisation conceptuelle avec des modèles multidimensionnels, visualisés à l'aide de MultiDim. Cette approche nous aide à organiser les données en faits et dimensions et à comprendre les relations entre eux, ce qui est essentiel pour concevoir des entrepôts de données. Nous explorerons plus en détail des sujets tels que les dimensions (par exemple, la date, le client) et les mesures (par exemple, la quantité, les ventes totales). Nous étudierons également la différence entre les événements primaires et les événements secondaires et apprendrons comment ils sont utilisés. Enfin, nous examinerons une autre catégorisation des mesures en flux : les mesures de niveau et les mesures unitaires.
Inclus
2 vidéos4 lectures3 devoirs
Afficher les informations sur le contenu du module
2 vidéos•Total 9 minutes
Événements primaires et secondaires•4 minutes
Additivité des mesures•5 minutes
4 lectures•Total 56 minutes
Vue d'ensemble du module 4•5 minutes
Conception de modèles conceptuels multidimensionnels•36 minutes
Évaluez votre apprentissage : Événements primaires et secondaires•8 minutes
Évaluez votre apprentissage : Additivité des mesures•8 minutes
Conception 2
Module 5•3 heures à terminer
Détails du module
Dans ce module, nous allons nous plonger dans la modélisation conceptuelle des hiérarchies au sein des entrepôts de données, en explorant leurs définitions, leurs caractéristiques et leur importance. Les hiérarchies équilibrées ont une structure uniforme où chaque enfant a un parent et où toutes les branches ont la même longueur, ce qui rend l'analyse des données cohérente et efficace. En revanche, les hiérarchies déséquilibrées présentent des longueurs de branches variables et des niveaux d'agrégation manquants, ce qui permet de modéliser avec souplesse des scénarios réels tels que les catégories de produits et les hiérarchies géographiques. Vous découvrirez également les hiérarchies généralisées, qui impliquent des relations "is-a" entre les super-types et les sous-types, permettant une représentation détaillée des données mais exigeant une gestion minutieuse de l'agrégation et de la spécialisation. Nous explorerons également des hiérarchies alternatives, présentant différentes façons d'organiser la même dimension, telles que les vues calendaires et fiscales du temps. Enfin, nous étudierons les hiérarchies parallèles, indépendantes et dépendantes, en tant qu'outils d'analyse des données à partir de perspectives multiples, représentant des structures organisationnelles complexes. La compréhension de ces types de hiérarchie est cruciale pour une gestion et une analyse efficaces des données dans l'Entrepôt de données.
Inclus
4 vidéos3 lectures2 devoirs
Afficher les informations sur le contenu du module
4 vidéos•Total 14 minutes
Hiérarchies équilibrées et déséquilibrées•5 minutes
Hiérarchies généralisées•4 minutes
Hiérarchies alternatives•3 minutes
Hiérarchies parallèles•2 minutes
3 lectures•Total 140 minutes
Vue d'ensemble du module 5•5 minutes
Hiérarchies équilibrées et déséquilibrées•60 minutes
Concepts avancés de modélisation•75 minutes
2 devoirs•Total 23 minutes
Évaluez votre apprentissage : Modélisation conceptuelle des hiérarchies•15 minutes
Évaluez votre apprentissage : Concepts de modélisation avancés•8 minutes
Modélisation logique
Module 6•3 heures à terminer
Détails du module
Dans ce module, vous explorerez la modélisation logique dans l'Entrepôt de données, qui est le processus de conception d'une représentation structurée et abstraite des données à stocker, en mettant l'accent sur la façon dont les données sont organisées, liées et optimisées pour une interrogation et une analyse efficaces. En vous appuyant sur ce que vous avez appris dans les modules précédents, vous passerez à l'étape suivante de la conception d'un entrepôt de données : la traduction d'un modèle conceptuel en un modèle logique à mettre en œuvre. Le module se concentrera sur la représentation relationnelle des entrepôts de données, y compris l'étude de diverses implémentations de schémas : étoile, flocon de neige, flocon étoilé et constellation. Vous examinerez également les règles de mise en correspondance d'un modèle conceptuel multidimensionnel avec un modèle relationnel, en soulignant le rôle et l'importance des différents types de clés dans ce processus. Nous aborderons également les stratégies de maintien de la cohérence dans un entrepôt de données. Enfin, vous découvrirez comment pré-remplir certaines dimensions, comme le temps, afin de rationaliser les opérations et d'améliorer les performances des requêtes.
Évaluez votre apprentissage : Les clés, la cohérence et les dimensions de pré-remplissage•15 minutes
1 élément d'application•Total 20 minutes
Types de schémas ROLAP•20 minutes
Des dimensions qui changent lentement
Module 7•3 heures à terminer
Détails du module
La modélisation d'un entrepôt de données est un processus complexe qui nécessite de passer de modèles conceptuels de haut niveau à des modèles logiques détaillés. Cette transition est essentielle car elle permet de combler le fossé entre la compréhension des besoins de l'entreprise et leur traduction dans un cadre technique qui prend efficacement en charge ces besoins. Dans ce module, vous développerez le processus de modélisation logique abordé dans le module précédent, en vous concentrant plus particulièrement sur la conception de modèles dimensionnels et sur les subtilités de la modélisation hiérarchique. Au fur et à mesure que vous approfondirez vos connaissances, vous découvrirez la modélisation logique pour des concepts avancés tels que les dimensions de plusieurs à plusieurs, les liens entre les faits et les faits à granularités multiples. Nous explorerons également le concept des dimensions à changement lent (SCD), qui sont essentielles pour la gestion des données historiques dans votre entrepôt. Vous apprendrez à mettre en œuvre différents types de SCD pour suivre et gérer avec précision les changements dans les données de dimension au fil du temps. Enfin, nous aborderons SQL pour OLAP, en nous concentrant sur des concepts avancés tels que l'agrégation et les fonctions de fenêtre, et vous apprendrez à utiliser SQL pour interroger et analyser les entrepôts de données.
Inclus
5 vidéos11 lectures1 devoir
Afficher les informations sur le contenu du module
5 vidéos•Total 13 minutes
Modélisation de différents types de hiérarchies•5 minutes
Meilleures pratiques en matière de DSC•2 minutes
Traduire entre les DSC•3 minutes
Exemples de conversion entre types de DSC•2 minutes
Conclusion•1 minute
11 lectures•Total 137 minutes
Vue d'ensemble du module 7•5 minutes
Introduction aux modèles conceptuels et logiques•15 minutes
Processus de cartographie•10 minutes
Conclusion•1 minute
Concepts avancés de modélisation•36 minutes
Comprendre les dimensions qui changent lentement•5 minutes
Types de dimensions à évolution lente•10 minutes
Avantages de la gestion du changement de dimensions•5 minutes
Étapes de conversion entre les types de DSC•10 minutes
Exécution de requêtes OLAP avec SQL•38 minutes
Félicitations !•2 minutes
1 devoir•Total 25 minutes
Évaluez votre apprentissage : Représentation logique des hiérarchies et concepts avancés•25 minutes
Fondée en 1898, Northeastern est une université de recherche internationale qui se distingue par une approche de l'éducation et de la découverte axée sur l'expérience. L'université est un leader en matière d'apprentissage par l'expérience, grâce au programme d'éducation coopérative le plus étendu au monde. L'esprit de collaboration guide une entreprise de recherche inspirée par l'utilisation et axée sur la résolution des défis mondiaux en matière de santé, de sécurité et de durabilité.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Que recevrai-je si j'achète le certificat ?
Lorsque vous achetez un certificat, vous avez accès à tous les supports de cours, y compris les devoirs notés. Une fois le cours terminé, votre certificat électronique sera ajouté à votre page de réalisations. Vous pourrez alors l'imprimer ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.