This intermediate-level course empowers learners to apply, analyze, and evaluate machine learning models using Apache PySpark’s distributed computing framework. Designed for data professionals familiar with Python and basic ML concepts, the course explores real-world implementation of both regression and classification techniques, along with unsupervised clustering.

PySpark: Apply & Evaluate Predictive ML Models
Obtenez l'une de nos meilleures offres avec Coursera Plus pour 199 $ (habituellement 399 $). Économisez maintenant.

PySpark: Apply & Evaluate Predictive ML Models
Ce cours fait partie de Spécialisation "Spark and Python for Big Data with PySpark"

Instructeur : EDUCBA
Inclus avec
12 avis
Ce que vous apprendrez
Build and evaluate regression models in PySpark using linear, GLM, and ensemble methods.
Apply logistic regression, decision trees, and Random Forests for classification.
Implement K-Means clustering and assess scalable ML workflows with PySpark.
Compétences que vous acquerrez
- Catégorie : Decision Tree Learning
- Catégorie : Logistic Regression
- Catégorie : Random Forest Algorithm
- Catégorie : Machine Learning Algorithms
- Catégorie : Model Training
- Catégorie : Predictive Modeling
- Catégorie : Model Evaluation
- Catégorie : Predictive Analytics
- Catégorie : Data Pipelines
- Catégorie : Applied Machine Learning
- Catégorie : Advanced Analytics
- Catégorie : Regression Analysis
- Catégorie : Unsupervised Learning
- Catégorie : Machine Learning Methods
Outils que vous découvrirez
- Catégorie : Classification Algorithms
- Catégorie : PySpark
- Catégorie : Apache Spark
Détails à connaître

Ajouter à votre profil LinkedIn
7 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

En savoir plus sur Data Analysis
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuitEdureka
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Avis des étudiants
- 5 stars
100 %
- 4 stars
0 %
- 3 stars
0 %
- 2 stars
0 %
- 1 star
0 %
Affichage de 3 sur 12
Révisé le 12 avr. 2026
From data preparation to model evaluation, every lesson is gold. The unique focus on Spark's scalability makes this a standout machine learning course for professionals.
Révisé le 11 avr. 2026
Best PySpark ML course out there. Balanced theory with coding—highly recommend for data engineers.
Révisé le 30 mars 2026
The best resource for understanding cross-validation and hyperparameter tuning in PySpark. My models are now more robust and reliably evaluated.
Foire Aux Questions
Plus de questions
Aide financière disponible,




