Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4.7
12 avis
niveau Intermédiaire
Expérience recommandée
Expérience recommandée
Niveau intermédiaire
Connaissances de base en Python et SQL, et compréhension des bases de données relationnelles ; aucune expérience Hadoop n'est nécessaire, mais un intérêt pour le big data est bénéfique.
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4.7
12 avis
niveau Intermédiaire
Expérience recommandée
Expérience recommandée
Niveau intermédiaire
Connaissances de base en Python et SQL, et compréhension des bases de données relationnelles ; aucune expérience Hadoop n'est nécessaire, mais un intérêt pour le big data est bénéfique.
Analyser l'architecture et les composants des pipelines de données pour comprendre leur impact sur le flux de données et l'efficacité du traitement.
Mettre en œuvre des processus ETL robustes, pour assurer l'évolutivité et la maintenabilité.
Analyser les défis du big data et présenter les outils de l'écosystème Hadoop (HDFS, MapReduce, Hive, Pig et Spark) pour les tâches de traitement des données.
Compétences que vous acquerrez
Catégorie : Évolutivité
Évolutivité
Catégorie : Architecture des données
Architecture des données
Catégorie : Collecte de données
Collecte de données
Catégorie : Extraire, transformer, charger
Extraire, transformer, charger
Catégorie : Importation/exportation de données
Importation/exportation de données
Catégorie : Capture des données
Capture des données
Catégorie : Traitement des données
Traitement des données
Catégorie : Transformation des données
Transformation des données
Catégorie : Stratégie en matière de données
Stratégie en matière de données
Catégorie : Prise de décision fondée sur des données
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
Apprenez de nouveaux concepts auprès d'experts du secteur
Acquérez une compréhension de base d'un sujet ou d'un outil
Développez des compétences professionnelles avec des projets pratiques
Obtenez un certificat professionnel partageable
Il y a un module dans ce cours
Ce cours fournit un guide complet pour maîtriser l'ingénierie des données, où vous apprendrez à construire des pipelines de données robustes, à plonger dans les processus ETL (Extraction, Transformation, Chargement) et à gérer de grands ensembles de données à l'aide d'Hadoop. Vous acquerrez une expertise dans l'extraction de données à partir de diverses sources, leur transformation dans un format utilisable et leur chargement dans des entrepôts de données ou des plateformes big data. Grâce à une expérience pratique de Hadoop, le framework standard de l'industrie pour le traitement des ensembles de données massives, vous apprendrez à gérer et à traiter efficacement les ensembles de données massives. Que vous soyez un débutant ou un professionnel expérimenté, ce cours vous dote des compétences nécessaires pour concevoir, mettre en œuvre et gérer les pipelines de données, ce qui fait de vous un atout précieux dans toute organisation axée sur les données. Ce cours est idéal pour les ingénieurs de données en herbe, les développeurs de logiciels intéressés par le traitement des données et les professionnels de l'informatique qui cherchent à étendre leur expertise à l'ingénierie des données. Il convient également aux analystes commerciaux et autres professionnels qui cherchent une compréhension fondamentale des technologies de traitement des données pour améliorer les capacités de prise de décision et améliorer leurs rôles dans les environnements axés sur les données. Que vous commenciez votre voyage dans l'ingénierie des données ou que vous cherchiez à renforcer vos compétences existantes, ce cours vous fournira les connaissances et les outils dont vous avez besoin pour réussir. Pour tirer le meilleur parti de ce cours, vous devez avoir une compréhension de base des concepts de programmation et une certaine familiarité avec les systèmes de base de données. Une connaissance de base de la programmation Python et de SQL sera utile, ainsi qu'une compréhension des systèmes de bases de données relationnelles. Aucune expérience préalable avec Hadoop n'est requise, mais un vif intérêt pour le big data et l'analytique des données améliorera grandement votre expérience d'apprentissage. À la fin de ce cours, vous serez en mesure d'analyser l'architecture et les composants des pipelines de données et de comprendre leur impact sur le flux de données et l'efficacité du traitement. Vous apprendrez à mettre en œuvre des processus ETL robustes, évolutifs et faciles à maintenir, et vous serez équipé pour relever les défis du Big data en utilisant les outils de l'écosystème Hadoop, tels que HDFS, MapReduce, Hive, Pig et Spark. Ce cours vous préparera à concevoir, mettre en œuvre et gérer des solutions de données qui peuvent générer des idées significatives et soutenir la prise de décision stratégique dans n'importe quelle organisation.
Ce cours fournit un guide complet pour maîtriser l'ingénierie des données, où vous apprendrez à construire des pipelines de données robustes, à plonger dans les processus ETL (Extraction, Transformation, Chargement) et à gérer de grands ensembles de données à l'aide d'Hadoop. Vous acquerrez une expertise dans l'extraction de données à partir de diverses sources, leur transformation dans un format utilisable et leur chargement dans des entrepôts de données ou des plates-formes de big data.
Inclus
12 vidéos4 lectures4 devoirs1 sujet de discussion
Afficher les informations sur le contenu du module
12 vidéos•Total 71 minutes
Introduction et bienvenue•3 minutes
Explication du rôle de l'Ingénieur de données•5 minutes
Analyse des pipelines de données•7 minutes
Identifier les outils et les technologies pour les pipelines de données•5 minutes
Examen des processus ETL•8 minutes
Analyser les défis et les solutions en matière de Big data•5 minutes
Décoder l'écosystème Hadoop•6 minutes
Appliquer Hadoop pour le traitement des données Traiter les données avec Hadoop•8 minutes
Design de données Projet de solution•6 minutes
Exécution des processus ETL•9 minutes
Analyse des données•6 minutes
Félicitations et parcours d'apprentissage continu•3 minutes
4 lectures•Total 20 minutes
Bienvenue au cours : Aperçu du cours•5 minutes
Renforcer les organisations : Le rôle crucial des ingénieurs de données dans la gestion et l'analyse des données•5 minutes
Les bases de l'ETL et de l'Entrepôt de données•5 minutes
Rationalisation des solutions commerciales : Le rôle de l'analyse des données et des outils de visualisation•5 minutes
4 devoirs•Total 110 minutes
Ingénierie des données : Pipelines, ETL, Hadoop•20 minutes
Principes fondamentaux de l'ingénierie des données et des pipelines•30 minutes
Mise en œuvre de l'ETL et principes fondamentaux du Big data•30 minutes
Mise en œuvre avancée de Hadoop et Éthique des données•30 minutes
1 sujet de discussion•Total 5 minutes
L'équilibre de l'éthique dans l'Ingénieur de données : Vie privée, sécurité, équité•5 minutes
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Coursera rassemble un réseau diversifié d'experts en la matière qui ont démontré leur expertise grâce à leur expérience professionnelle dans l'industrie ou à leur solide formation universitaire. Ces instructeurs conçoivent et enseignent des cours qui permettent aux apprenants du monde entier d'acquérir des compétences pratiques et utiles à leur carrière.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Pour accéder aux supports de cours, aux devoirs et pour obtenir un certificat, vous devez acheter l'expérience de certificat lorsque vous vous inscrivez à un cours. Vous pouvez essayer un essai gratuit ou demander une aide financière. Le cours peut proposer l'option "Cours complet, pas de certificat". Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Qu'est-ce que je recevrai si je souscris à cette Specializations ?
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la spécialisation et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page Réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn.
Une aide financière est-elle disponible ?
Oui, pour certains programmes de formation, vous pouvez demander une aide financière ou une bourse si vous n'avez pas les moyens de payer les frais d'inscription. Si une aide financière ou une bourse est disponible pour votre programme de formation, vous trouverez un lien pour postuler sur la page de description.