Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a 6 modules dans ce cours
Une fois que vous avez identifié un problème de Big Data à analyser, comment collecter, stocker et organiser vos données à l'aide de solutions Big Data ? Dans ce cours, vous ferez l'expérience de différents genres de données et d'outils de gestion adaptés à chacun d'entre eux. Vous serez en mesure de décrire les raisons de l'évolution de la pléthore de nouvelles plateformes de big data du point de vue des systèmes de gestion des big data et des outils analytiques. Grâce à des tutoriels pratiques guidés, vous vous familiariserez avec les techniques en utilisant des exemples de données en temps réel et semi-structurées. Les systèmes et les outils abordés sont les suivants : AsterixDB, HP Vertica, Impala, Neo4j, Redis, SparkSQL. Ce cours fournit des techniques pour extraire la valeur des sources de données existantes inexploitées et découvrir de nouvelles sources de données.
A la fin de ce cours, vous serez capable de : * Reconnaître les différents éléments de données dans votre propre travail et dans les problèmes de la vie quotidienne * Expliquer pourquoi votre équipe a besoin de concevoir un plan d'infrastructure Big Data et la conception du système d'information * Identifier les opérations de données fréquentes nécessaires pour différents types de données * Sélectionner un modèle de données pour répondre aux caractéristiques de vos données * Appliquer des techniques pour gérer les données en streaming * Différencier entre un système de gestion de base de données traditionnel et un système de gestion Big Data * Apprécier pourquoi il y a tant de systèmes de gestion de données * Concevoir un système d'information Big Data pour une société de jeux en ligne Ce cours est destiné à ceux qui sont nouveaux dans la science des données. Il est recommandé d'avoir suivi le cours Intro to Big Data. Aucune expérience préalable en programmation n'est nécessaire, bien que la capacité d'installer des applications et d'utiliser une machine virtuelle soit nécessaire pour réaliser les travaux pratiques. Reportez-vous aux exigences techniques de la spécialisation pour connaître les spécifications matérielles et logicielles complètes. Exigences matérielles :
(A) Processeur Quad Core (support VT-x ou AMD-V recommandé), 64-bit ; (B) 8 GB RAM ; (C) 20 GB de disque libre. Comment trouver les informations sur votre matériel : (Windows) : Ouvrez Système en cliquant sur le bouton Démarrer, en faisant un clic droit sur Ordinateur, puis en cliquant sur Propriétés ; (Mac) : Ouvrez Vue d'ensemble en cliquant sur le menu Pomme et en cliquant sur "À propos de ce Mac" La plupart des ordinateurs dotés de 8 Go de mémoire vive et achetés au cours des trois dernières années répondent aux exigences minimales. Vous aurez besoin d'une connexion internet à haut débit car vous téléchargerez des fichiers dont la taille peut atteindre 4 Go.
Logiciels requis :
Ce cours s'appuie sur plusieurs outils logiciels libres, dont Apache Hadoop. Tous les logiciels requis peuvent être téléchargés et installés gratuitement (à l'exception des frais de transmission de données de votre fournisseur d'accès à Internet). Les logiciels requis sont les suivants : Windows 7+, Mac OS X 10.10+, Ubuntu 14.04+ ou CentOS 6+ VirtualBox 5+.
Bienvenue dans ce cours sur la modélisation et la gestion des big data. La modélisation et la gestion des données sont au cœur de tous les projets big data. Dans ces leçons, nous vous présentons les concepts qui sous-tendent la modélisation et la gestion des big data et nous préparons le terrain pour le reste du cours.
Inclus
14 vidéos8 lectures3 sujets de discussion
Afficher les informations sur le contenu du module
14 vidéos•Total 63 minutes
Bienvenue à la modélisation et à la gestion des Big Data•3 minutes
Pourquoi s'agit-il d'un nouveau cours dans la spécialisation Big Data ?•1 minute
Résumé de l'introduction aux Big Data (Partie 1)•6 minutes
Résumé de l'introduction aux Big Data (partie 2)•5 minutes
Résumé de l'introduction aux Big Data (partie 3)•6 minutes
Les questions incontournables de la gestion du Big Data•1 minute
Ingestion de données•5 minutes
Stockage des données•3 minutes
Qualité des données•2 minutes
Opérations sur les données•3 minutes
Évolutivité et sécurité des données•3 minutes
Les défis de la gestion des données énergétiques chez ConEd•5 minutes
Gestion des données de l'industrie du jeu : Questions et réponses avec Mark Caldwell, directeur technique d'Apmetrix•7 minutes
La gestion des données de vol chez FlightStats : Une conférence de Chad Berkley, directeur technique•13 minutes
8 lectures•Total 80 minutes
Diapositives : Résumé de l'introduction aux Big Data•10 minutes
Diapositives : Gestion des Big Data•10 minutes
Lecture sur les systèmes de stockage•10 minutes
Diapositives : Défis de la gestion des données énergétiques chez ConEd•10 minutes
Diapositives : Gestion des données de vol chez FlightStats•10 minutes
Téléchargement et installation de Docker Desktop Instructions•10 minutes
Instructions pour le téléchargement d'ensembles de données pratiques•10 minutes
Commandes de base de l'interpréteur de commandes•10 minutes
3 sujets de discussion•Total 30 minutes
Apprenez à vous connaître : Parlez-nous de vous et de la raison pour laquelle vous suivez ce cours•10 minutes
Discutons-en : Quel est le domaine de la gestion des big data qui vous intéresse le plus ?•10 minutes
Discutons-en : Quels sont les critères de conception des applications big data dont vous avez entendu parler ?•10 minutes
Modélisation des Big Data
Module 2•4 heures à terminer
Détails du module
La modélisation des big data dépend de nombreux facteurs, notamment la structure des données, les opérations qui peuvent être effectuées sur les données et les contraintes imposées aux modèles. Dans ces leçons, vous apprendrez les détails de la modélisation des big data et vous acquerrez les compétences pratiques dont vous aurez besoin pour modéliser vos propres projets de big data.
Inclus
11 vidéos12 lectures1 devoir2 sujets de discussion
Afficher les informations sur le contenu du module
11 vidéos•Total 47 minutes
Introduction aux modèles de données•2 minutes
Structures du modèle de données•3 minutes
Opérations sur le modèle de données•4 minutes
Contraintes du modèle de données•5 minutes
Introduction aux données CSV•3 minutes
Qu'est-ce qu'un modèle de données relationnel ?•11 minutes
Qu'est-ce qu'un modèle de données semi-structurées ?•6 minutes
Explorer le modèle de données relationnel des fichiers CSV•4 minutes
Explorer le modèle de données semi-structurées des données JSON•3 minutes
Explorer le modèle de données du tableau d'une image•3 minutes
Explorer les données des capteurs•4 minutes
12 lectures•Total 120 minutes
Diapositives : Qu'est-ce qu'un modèle de données ?•10 minutes
Introduction aux données CSV (OpenOffice)•10 minutes
Introduction aux données CSV (Microsoft Excel)•10 minutes
Diapositives : Qu'est-ce qu'un modèle de données relationnel ?•10 minutes
Diapositives : Qu'est-ce qu'un modèle de données semi-structurées ?•10 minutes
Exploration du modèle de données relationnelles des valeurs séparées par des virgules (OpenOffice)•10 minutes
Exploration du modèle de données relationnel des valeurs séparées par des virgules (Excel)•10 minutes
Installation de Python•10 minutes
Créer un environnement virtuel Python•10 minutes
Explorer le modèle de données semi-structurées des données JSON•10 minutes
Explorer le modèle de données du tableau d'une image•10 minutes
Explorer les données des capteurs•10 minutes
1 devoir•Total 30 minutes
Quiz pratique pour les conférences pratiques de la semaine 2•30 minutes
2 sujets de discussion•Total 20 minutes
Discutons-en : La modélisation des données dans votre vie quotidienne•10 minutes
Discutons-en : Utilisation de XML ou JSON sur l'internet•10 minutes
Modélisation des Big Data (Partie 2)
Module 3•2 heures à terminer
Détails du module
Ces leçons continuent de mettre en lumière la modélisation des big data avec des approches spécifiques comprenant des modèles d'espace vectoriel, des modèles de données graphiques, et plus encore.
Inclus
5 vidéos5 lectures1 devoir
Afficher les informations sur le contenu du module
5 vidéos•Total 30 minutes
Modèle de l'espace vectoriel•11 minutes
Modèle de données graphiques•7 minutes
Autres modèles de données•4 minutes
Explorer le modèle de données vectorielles du moteur de recherche Lucene•4 minutes
Explorer les modèles de données graphiques avec Gephi•3 minutes
Diapositives : Modèle de données graphiques•10 minutes
Diapositives : Autres modèles de données•10 minutes
Explorer les modèles de données vectorielles avec Lucene•10 minutes
Explorer les modèles de données graphiques avec Gephi•10 minutes
1 devoir•Total 30 minutes
Quiz sur les modèles de données•30 minutes
Travailler avec des modèles de données
Module 4•2 heures à terminer
Détails du module
Les modèles de données traitent de nombreux types de formats de données différents. Les données en continu deviennent omniprésentes et leur traitement nécessite une approche différente de celle des données statiques. Dans ces leçons, vous acquerrez une expérience pratique en travaillant avec différentes formes de données en continu, y compris les données météorologiques et les flux Twitter.
Inclus
5 vidéos5 lectures1 devoir1 sujet de discussion
Afficher les informations sur le contenu du module
5 vidéos•Total 24 minutes
Modèle de données et format de données•2 minutes
Qu'est-ce qu'un flux de données ?•6 minutes
Pourquoi les données en continu sont-elles différentes ?•7 minutes
Comprendre les lacs de données•6 minutes
Exploration des données de capteurs en continu•3 minutes
5 lectures•Total 50 minutes
Diapositives : Modèle de données et format de données•10 minutes
Diapositives : Qu'est-ce qu'un flux de données ?•10 minutes
Diapositives : Pourquoi les données en continu sont-elles différentes ?•10 minutes
Diapositives : Comprendre les lacs de données•10 minutes
Exploration des données de capteurs en continu•10 minutes
1 devoir•Total 30 minutes
Formats de données et flux de données Quiz•30 minutes
1 sujet de discussion•Total 10 minutes
Discutons-en : Applications de données en continu•10 minutes
Gestion des Big Data : Le "M" du SGBD
Module 5•2 heures à terminer
Détails du module
La gestion des big data nécessite une approche différente des systèmes de gestion de base de données en raison de la grande variation de la structure des données qui ne se prête pas aux SGBD traditionnels. De nombreuses applications sont disponibles pour faciliter la gestion des big data. Dans ces leçons, nous vous présentons certaines de ces applications et nous vous expliquons comment et quand elles peuvent être adaptées à vos propres défis en matière de gestion des big data.
Inclus
7 vidéos2 lectures1 devoir
Afficher les informations sur le contenu du module
7 vidéos•Total 71 minutes
Approches du Big Data basées sur les SGBD et non basées sur les SGBD•16 minutes
Du SGBD au BDMS•10 minutes
Redis : Un magasin clé-valeur amélioré•8 minutes
Aerospike : un magasin KV de nouvelle génération•9 minutes
Données semi-structurées - AsterixDB•8 minutes
Solr : Gestion du texte•10 minutes
Données relationnelles - Vertica•10 minutes
2 lectures•Total 20 minutes
Diapositives : Approches du Big Data basées sur les SGBD et non basées sur les SGBD•10 minutes
Diapositives : Du SGBD au BDMS•10 minutes
1 devoir•Total 30 minutes
Quiz BDMS•30 minutes
Conception d'un système de gestion des Big Data pour un jeu en ligne
Module 6•2 heures à terminer
Détails du module
Dans ces leçons, nous vous donnons l'occasion de vous familiariser avec la modélisation et la gestion des big data à l'aide d'un jeu en ligne fictif appelé "Attrapez le flamant rose".
Inclus
1 lecture1 évaluation par les pairs2 sujets de discussion
Afficher les informations sur le contenu du module
1 lecture•Total 10 minutes
Un jeu d'Eglence Inc : Attrapez le flamant rose•10 minutes
1 évaluation par les pairs•Total 120 minutes
Conception d'un modèle de données pour "Attraper le flamant rose" (Catch the Pink Flamingo)•120 minutes
2 sujets de discussion•Total 10 minutes
Discutons-en : Tâches analytiques pour améliorer Catch the Pink Flamingo•5 minutes
Discutons-en : Utiliser le modèle de données pour Attraper le flamant rose•5 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Instructeurs
Évaluations de l’enseignant
Évaluations de l’enseignant
Nous avons demandé à tous les étudiants de fournir des commentaires sur nos enseignants au sujet de la qualité de leur pédagogie.
L'université de San Diego est un centre universitaire et un moteur économique, reconnu comme l'une des 10 meilleures universités publiques par U.S. News and World Report. L'innovation est au cœur de ce que nous sommes et de ce que nous faisons. Ici, les étudiants apprennent que le savoir ne s'acquiert pas seulement en classe - la vie est leur laboratoire.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Avis des étudiants
4.4
3 026 avis
5 stars
58,53 %
4 stars
27,94 %
3 stars
9,05 %
2 stars
2,54 %
1 star
1,91 %
Affichage de 3 sur 3026
R
RM
4·
Révisé le 16 oct. 2016
Interesting. Sometimes a little bit overwhelmed by a lot of information within a single video but it gives you an overview of what is big data modeling and management systems.
B
BR
4·
Révisé le 10 oct. 2018
It was a difficult module, although trainer tried to convey but seems it is more complex it took time for me to understand the concept and apply the same while doing my assignment.
D
DN
4·
Révisé le 22 nov. 2016
Pretty good overall, although some exercises are a bit difficult to understand from the descriptions and instructions given, some graphs and initial reference documentation for exercises might help
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je souscris à cette Specializations ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.