Coursera

Spécialisation "Performance Engineering for Data Systems"

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "Performance Engineering for Data Systems"

Optimize SQL, Spark, and Data Warehouses. Learn to diagnose bottlenecks and optimize performance in databases, warehouses, and Spark systems.

Hurix Digital
Merna Elzahaby

Instructeurs : Hurix Digital

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Analyze SQL execution plans and Spark UI metrics to diagnose performance bottlenecks and implement targeted optimizations.

  • Design scalable database schemas, partitioning strategies, and storage architectures that balance performance with cost.

  • Engineer resilient cloud data infrastructure using IaC, disaster recovery planning, and systematic resource management.

Compétences que vous acquerrez

  • Catégorie : Scalability
  • Catégorie : Distributed Computing
  • Catégorie : SQL
  • Catégorie : Database Management
  • Catégorie : Data Warehousing
  • Catégorie : Resource Management
  • Catégorie : Database Design
  • Catégorie : Cloud Computing Architecture
  • Catégorie : Performance Tuning
  • Catégorie : Data Pipelines
  • Catégorie : Infrastructure as Code (IaC)
  • Catégorie : Cost Management
  • Catégorie : Performance Analysis
  • Catégorie : Root Cause Analysis
  • Catégorie : Data Transformation
  • Catégorie : Disaster Recovery
  • Catégorie : Data Architecture

Outils que vous découvrirez

  • Catégorie : Apache Spark
  • Catégorie : Query Languages
  • Catégorie : PySpark

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

février 2026

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 7 cours

Ce que vous apprendrez

  • Performance optimization requires methodical analysis of execution plans to identify root causes, not just symptoms.

  • Query restructuring with CTEs, optimized joins, and window functions can dramatically improve execution efficiency.

  • Index design needs ongoing analysis of query patterns and data access requirements for sustainable performance.

  • Scalable systems depend on proactive monitoring and optimization cycles that prevent production bottlenecks.

Ce que vous apprendrez

  • Proactive resource management prevents performance degradation and ensures consistent query execution across diverse workloads and user groups.

  • Security through least-privilege access requires continuous monitoring and systematic auditing of permissions against actual business requirements.

  • Effective incident response depends on blameless post-mortem processes that focus on systemic improvements rather than individual accountability.

  • Operational excellence in data infrastructure requires balancing performance, security, and reliability engineering principles.

Compétences que vous acquerrez

Catégorie : Role-Based Access Control (RBAC)
Catégorie : Resource Management
Catégorie : Identity and Access Management
Catégorie : Data Security
Catégorie : Problem Management
Catégorie : Site Reliability Engineering
Catégorie : Compliance Auditing
Catégorie : Root Cause Analysis
Catégorie : Capacity Management

Ce que vous apprendrez

  • Denormalization boosts query speed but demands careful analysis of consistency risks and maintenance costs.

  • Partitioning and clustering strategies must align with actual query patterns and access methods to deliver meaningful performance gains.

  • ER diagrams serve as documentation and validation tools, enabling better communication and system understanding.

  • Schema optimization balances query performance, data integrity, storage efficiency, and maintenance complexity.

Compétences que vous acquerrez

Catégorie : Database Design
Catégorie : Star Schema
Catégorie : SQL
Catégorie : Snowflake Schema
Catégorie : Database Architecture and Administration
Catégorie : Database Development
Catégorie : Technical Documentation
Catégorie : Data Modeling

Ce que vous apprendrez

  • Infrastructure as Code automates data platform deployments, replacing manual processes with version-controlled, repeatable systems.

  • Cost optimization uses performance benchmarking and data analysis to identify efficient compute/storage configs for specific workloads.

  • Business continuity requires proactive disaster recovery with automated failover and continuous replication for strict recovery goals.

  • Successful cloud data engineering balances performance, cost, and reliability through strategic design and continuous monitoring.

Compétences que vous acquerrez

Catégorie : AWS CloudFormation
Catégorie : Business Continuity
Catégorie : Cost Management
Catégorie : Terraform
Catégorie : Business Continuity Planning
Catégorie : Data Architecture
Catégorie : Data Infrastructure
Catégorie : Data Warehousing
Catégorie : Benchmarking
Catégorie : Disaster Recovery
Catégorie : Performance Analysis
Catégorie : Capacity Planning
Catégorie : Cloud Computing Architecture
Catégorie : Infrastructure as Code (IaC)
Catégorie : IT Infrastructure

Ce que vous apprendrez

  • Performance optimization is a systematic process requiring analysis of data access patterns, not random configuration changes.

  • Strategic partitioning minimizes expensive network shuffles and is the foundation of scalable Spark applications.

  • Intelligent caching of reusable intermediate datasets can dramatically reduce computation costs and improve job reliability.

  • The Spark UI provides actionable insights that guide optimization decisions and enable data-driven performance improvements.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : Apache Spark
Catégorie : Data Processing
Catégorie : Data Pipelines
Catégorie : PySpark
Catégorie : Systems Analysis

Ce que vous apprendrez

  • Performance bottlenecks in distributed systems often stem from uneven data distribution rather than insufficient computational resources.

  • Visual execution plan analysis is essential for identifying specific stages where data processing imbalances occur.

  • Proactive partition strategy selection prevents performance degradation more effectively than reactive optimization

  • Spark's shuffle.partitions configuration and broadcast join patterns are fundamental tools for sustainable pipeline optimization.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : Performance Analysis
Catégorie : Scalability
Catégorie : Apache Spark
Catégorie : Distributed Computing
Catégorie : PySpark
Catégorie : Data Processing
Catégorie : Data Pipelines
Catégorie : Debugging

Ce que vous apprendrez

  • Inspect Spark UI and metrics (task duration, shuffle I/O, executor CPU/mem) to find bottlenecks and recommend actionable optimizations.

  • Apply partitioning and skew mitigation (salting/custom partitioner) & reduce shuffle (broadcast joins, avoid groupByKey, AQE) to improve parallelism.

  • Configure executors, cores, memory, dynamic allocation and parallelism/caching settings to maximize throughput while meeting defined SLA targets.

Compétences que vous acquerrez

Catégorie : Apache Spark
Catégorie : Performance Tuning
Catégorie : Scalability
Catégorie : Performance Analysis
Catégorie : System Configuration
Catégorie : Job Analysis
Catégorie : Process Optimization
Catégorie : Resource Allocation
Catégorie : Database Management
Catégorie : PySpark
Catégorie : Debugging

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Hurix Digital
Coursera
272 Cours 17 181 apprenants
Merna Elzahaby
Coursera
1 Cours 17 apprenants

Offert par

Coursera

Vous aimerez peut-être aussi

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions