Ce cours dote les apprenants des compétences nécessaires pour appliquer et analyser des techniques avancées de traitement des données à l'aide de PySpark, l'API Python pour Apache Spark. Conçu pour les professionnels des données ayant des connaissances fondamentales de Python et de PySpark, le cours explore des cas d'utilisation du monde réel, notamment la segmentation de la clientèle, l'exploration de texte et la modélisation stochastique. Les apprenants commenceront par appliquer l'analyse RFM (Recency, Frequency, Monetary) et le regroupement K-Means pour segmenter les clients sur la base de modèles comportementaux. Le cours passe ensuite à l'extraction de données textuelles à partir d'images et de PDF en cours d'utilisation de la Reconnaissance Optique de Caractères (OCR) et des opérations DataFrame de PySpark. Enfin, les apprenants construiront et interpréteront des simulations Monte-Carlo pour modéliser la probabilité et l'incertitude dans des scénarios basés sur des données. Tout au long du cours, les étudiants participeront à des exercices pratiques, à des démonstrations en temps réel et à des quiz pratiques qui renforcent à la fois la compréhension conceptuelle et la compétence technique. À la fin de ce cours, les apprenants seront en mesure de développer des flux de données évolutifs et efficaces en utilisant PySpark pour l'informatique décisionnelle, l'analytique et la modélisation de simulations.

PySpark : Appliquer et analyser des traitements de données avancés

PySpark : Appliquer et analyser des traitements de données avancés
Ce cours fait partie de Spécialisation "Spark et Python pour le Big data avec PySpark"

Instructeur : EDUCBA
Inclus avec
14 avis
Ce que vous apprendrez
Appliquer l'analyse RFM et le regroupement K-moyennes pour la segmentation de la clientèle.
Extraire et analyser des données textuelles en cours d'utilisation d'OCR avec PySpark DataFrames.
Construire et interpréter des simulations de Monte-Carlo pour la modélisation de l'incertitude.
Compétences que vous acquerrez
- Catégorie : Customer Insights
- Catégorie : Simulation and Simulation Software
- Catégorie : Customer Analysis
- Catégorie : Risk Modeling
- Catégorie : Unstructured Data
- Catégorie : Advanced Analytics
- Catégorie : Text Mining
- Catégorie : Image Analysis
- Catégorie : Statistical Modeling
- Catégorie : Data Manipulation
- Catégorie : Data Transformation
- Catégorie : Big Data
- Catégorie : Data Processing
Outils que vous découvrirez
- Catégorie : PySpark
Détails à connaître

Ajouter à votre profil LinkedIn
4 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a un module dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
En savoir plus sur Analyse des Données
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
64,28 %
- 4 stars
35,71 %
- 3 stars
0 %
- 2 stars
0 %
- 1 star
0 %
Affichage de 3 sur 14
Révisé le 14 févr. 2026
Very informative and applicable. The instructor’s approach to explaining distributed processing concepts was clear and approachable.
Révisé le 10 févr. 2026
A decent and well-presented course that strengthens PySpark knowledge and prepares learners to work with advanced data processing tasks in a professional environment.
Révisé le 10 mars 2026
I appreciated how the course demonstrates real data processing workflows, which helps learners understand how PySpark is used in big data projects.

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Plus de questions
Aide financière disponible,





