Bienvenue à l'Introduction à PySpark, un cours de courte durée stratégiquement conçu pour vous donner les compétences nécessaires pour évaluer les concepts de la Gestion des données à grande échelle et effectuer efficacement l'analyse des données en cours d'utilisation. Tout au long de ce cours, vous allez acquérir l'expertise nécessaire pour effectuer le traitement des données avec PySpark, ce qui vous permettra de traiter efficacement des ensembles de données à grande échelle, de mener des analyses avancées et de tirer des informations précieuses de diverses sources de données. Au cours de ce cours, vous explorerez les applications spécifiques à l'industrie de PySpark. A la fin de ce cours, vous serez capable de : 1. Obtenir une compréhension de base de l'introduction du Big data, y compris ses caractéristiques, ses défis et son importance dans les environnements modernes axés sur les données. 2. Se familiariser avec l'architecture Spark et ses composants, tels que Spark Core et Spark SQL. 3. Se familiariser avec les concepts de l'informatique distribuée et la façon dont ils s'appliquent au modèle de traitement parallèle de Spark. 4. Explorer PySpark et les concepts de Big data pour résoudre les défis liés aux données. 5. Écrire du code PySpark pour résoudre des tâches d'analyse et de traitement de données du monde réel. Ce cours de courte durée est conçu pour les analystes de données, les ingénieurs de données, les scientifiques de données et les développeurs de Big data qui cherchent à améliorer leurs compétences dans l'utilisation de PySpark pour le traitement et l'analyse des données. Une expérience préalable avec Python et Hadoop est bénéfique, mais pas obligatoire pour ce cours.

Introduction à PySpark

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
50 avis
niveau Débutant
Expérience recommandée
4 heures à compléter
Planning flexible
Apprenez à votre propre rythme
Ce que vous apprendrez
Comprendre les fondamentaux de PySpark pour traiter efficacement les Big data en cours d'utilisation des API Python.
Appliquer des techniques de traitement des données en temps réel pour obtenir des informations exploitables.
Explorer l'architecture de Spark pour le calcul distribué et l'évolutivité.
Construire des compétences pratiques avec PySpark à travers des travaux pratiques.
Compétences que vous acquerrez
- Catégorie : Analyse des données
- Catégorie : Analyse exploratoire des données
- Catégorie : Informatique distribuée
- Catégorie : Gestion des données
- Catégorie : Manipulation de données
- Catégorie : Traitement des données
Outils que vous découvrirez
- Catégorie : Apache Hadoop
- Catégorie : PySpark
- Catégorie : Apache Spark
- Catégorie : Programmation Python
Détails à connaître

Certificat partageable
Ajouter à votre profil LinkedIn
Évaluations
5 devoirs
Enseigné en Anglais
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Développement de logiciels
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Foire Aux Questions
Plus de questions
Aide financière disponible,





