EDUCBA

Projets Hadoop : Analyser et optimiser les Big data

Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

EDUCBA

Projets Hadoop : Analyser et optimiser les Big data

EDUCBA

Instructeur : EDUCBA

Inclus avec Coursera Plus

Demander à Coursera

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Traiter et optimiser de grands ensembles de données à l'aide des outils Hadoop.

  • Utiliser MapReduce, Pig et Hive dans le cadre de projets concrets traitant des données.

  • Mettre en place des flux de données évolutifs pour l'analyse et le reporting.

Compétences que vous acquerrez

  • Catégorie : Traitement des données
  • Catégorie : Nettoyage des données
  • Catégorie : Informatique distribuée
  • Catégorie : Rapports ad hoc
  • Catégorie : Analyse
  • Catégorie : Analyse des données
  • Catégorie : Évolutivité
  • Catégorie : Conception de la base de données
  • Catégorie : Pipelines de données
  • Catégorie : Transformation des données
  • Catégorie : Gestion des données
  • Catégorie : Prétraitement des données
  • Catégorie : Big Data

Outils que vous découvrirez

  • Catégorie : Langages de requête
  • Catégorie : Apache Hive
  • Catégorie : Apache Hadoop

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

16 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation "Maîtrise des projets et de l'analytique des données Big data Hadoop"
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable

Il y a 4 modules dans ce cours

Ce module initie les apprenants aux principes CORE du traitement des données basé sur Hadoop à travers des projets portant sur des fichiers journaux et des données de vente. Les apprenants découvriront comment nettoyer, traiter et analyser des fichiers de journaux en continu à l'aide de MapReduce, Pig et Hive. Ce module permet d'acquérir les bases techniques indispensables à la gestion distribuée des fichiers et aux workflows pratiques de gestion des données, préparant ainsi le terrain pour des applications Hadoop avancées.

Inclus

13 vidéos4 devoirs

Ce module permet aux apprenants de développer leurs compétences en analyse et en résolution de problèmes grâce à des projets concrets d'études de marché dans les domaines de la vente et du tourisme. En tirant parti de l'écosystème distribué de Hadoop, les apprenants acquerront une expérience pratique de l'utilisation de MapReduce, Hive et Pig pour agréger, joindre et filtrer des ensembles de données provenant de sources multiples, afin d'obtenir des informations stratégiques et des analyses démographiques.

Inclus

10 vidéos4 devoirs

Ce module est consacré aux projets de gestion des données pédagogiques et universitaires utilisant les outils de stockage et de traitement distribués de Hadoop. Les apprenants maîtriseront la conception de schémas, la transformation des données et l'optimisation dans Hive et Pig, tout en améliorant l'efficacité de la gestion des bases de données grâce à des modifications structurelles et à l'automatisation.

Inclus

7 vidéos4 devoirs

Le dernier module aborde des cas d'utilisation concrets de Hadoop dans le domaine du commerce électronique et de l'analyse des salaires des employés. Les apprenants mettront en pratique des techniques de requête, de filtrage et d'agrégation distribuées afin d'extraire des informations exploitables à partir de diverses sources de données. Ce module met l'accent sur l'analyse et le reporting de bout en bout au sein de l'architecture évolutive de Hadoop.

Inclus

10 vidéos4 devoirs

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeur

EDUCBA
EDUCBA
1 598 Cours332 384 apprenants

Offert par

EDUCBA

En savoir plus sur Analyse des données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions