À l'issue de cette formation, les apprenants seront capables de concevoir des bases de données Hive, de gérer des tables complexes, de traiter des données XML avec Pig, d'exécuter des tâches MapReduce et d'analyser des ensembles de données à grande échelle issus des réseaux sociaux afin d'en extraire des informations pertinentes. Le cours commence par les concepts fondamentaux de Hive, notamment les bases de données, les partitions et le bucketing, puis aborde l’optimisation des tables et les contraintes liées à la conception de schémas. Les apprenants acquerront une expérience pratique de l’ingestion de données avec Sqoop, de leur traitement à l’aide de MapReduce et de l’application d’analyses basées sur la localisation et l’auteur à des ensembles de données réels. Enfin, la formation explore la création de scripts Pig pour le traitement XML ainsi que les types de données complexes de Hive pour une analyse avancée des ensembles de données.

Analytique des données avec Hive, Pig et MapReduce
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

Analytique des données avec Hive, Pig et MapReduce
Ce cours fait partie de Spécialisation "Maîtrise des projets et de l'analytique des données Big data Hadoop"

Instructeur : EDUCBA
Inclus avec
Demander à Coursera
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Ce que vous apprendrez
Concevoir et optimiser des bases de données Hive pour des ensembles de données volumineux.
Traiter des données XML et exécuter des scripts MapReduce et Pig.
Appliquer l'analyse de données aux données réelles issues des télécommunications et des réseaux sociaux.
Compétences que vous acquerrez
- Catégorie : Analyse des médias sociaux
- Catégorie : Gestion des données
- Catégorie : Intégration des données
- Catégorie : Traitement des données
- Catégorie : Gestion des bases de données
- Catégorie : Conception de la base de données
- Catégorie : Importation/exportation de données
- Catégorie : Analyse des données
- Catégorie : Langages extensibles et XML
- Catégorie : Big Data
- Catégorie : Analyse
Outils que vous découvrirez
- Catégorie : Apache Hive
- Catégorie : Systèmes de gestion de bases de données
- Catégorie : Apache Hadoop
- Catégorie : Langage de balisage extensible (XML)
Détails à connaître

Certificat partageable
Ajouter à votre profil LinkedIn
Évaluations
15 devoirs
Enseigné en Anglais
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
Ce cours fait partie de la Spécialisation "Maîtrise des projets et de l'analytique des données Big data Hadoop"
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

En savoir plus sur Analyse des données
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Foire Aux Questions
Plus de questions
Aide financière disponible,




