Coursera

Spécialisation "Performance Engineering for Data Systems"

Développez vos compétences avec Coursera Plus pour 239 $/an (habituellement 399 $). Économisez maintenant.

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "Performance Engineering for Data Systems"

Optimize SQL, Spark, and Data Warehouses.

Learn to diagnose bottlenecks and optimize performance in databases, warehouses, and Spark systems.

Hurix Digital
Merna Elzahaby

Instructeurs : Hurix Digital

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet
niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Analyze SQL execution plans and Spark UI metrics to diagnose performance bottlenecks and implement targeted optimizations.

  • Design scalable database schemas, partitioning strategies, and storage architectures that balance performance with cost.

  • Engineer resilient cloud data infrastructure using IaC, disaster recovery planning, and systematic resource management.

Compétences que vous acquerrez

  • Catégorie : Cloud Computing Architecture
  • Catégorie : Cost Management
  • Catégorie : Data Architecture
  • Catégorie : Data Pipelines
  • Catégorie : Data Transformation
  • Catégorie : Data Warehousing
  • Catégorie : Database Design
  • Catégorie : Database Management
  • Catégorie : Disaster Recovery
  • Catégorie : Distributed Computing
  • Catégorie : Infrastructure as Code (IaC)
  • Catégorie : Performance Analysis
  • Catégorie : Performance Tuning
  • Catégorie : Resource Management
  • Catégorie : Root Cause Analysis
  • Catégorie : Scalability
  • Catégorie : SQL

Outils que vous découvrirez

  • Catégorie : Apache Spark
  • Catégorie : PySpark
  • Catégorie : Query Languages

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

février 2026

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 11 cours

Ce que vous apprendrez

  • Performance optimization requires methodical analysis of execution plans to identify root causes, not just symptoms.

  • Query restructuring with CTEs, optimized joins, and window functions can dramatically improve execution efficiency.

  • Index design needs ongoing analysis of query patterns and data access requirements for sustainable performance.

  • Scalable systems depend on proactive monitoring and optimization cycles that prevent production bottlenecks.

SQL Infrastructure: Secure and Optimize

SQL Infrastructure: Secure and Optimize

COURS 2, 3 heures

Ce que vous apprendrez

  • Proactive resource management prevents performance degradation and ensures consistent query execution across diverse workloads and user groups.

  • Security through least-privilege access requires continuous monitoring and systematic auditing of permissions against actual business requirements.

  • Effective incident response depends on blameless post-mortem processes that focus on systemic improvements rather than individual accountability.

  • Operational excellence in data infrastructure requires balancing performance, security, and reliability engineering principles.

Compétences que vous acquerrez

Catégorie : Systems Analysis
Catégorie : Role-Based Access Control (RBAC)
Catégorie : Data Security
Catégorie : Problem Management
Catégorie : Capacity Management
Catégorie : Site Reliability Engineering
Catégorie : Compliance Auditing
Catégorie : Resource Management
Catégorie : Root Cause Analysis
Catégorie : Identity and Access Management
Design & Optimize SQL Database Schemas

Design & Optimize SQL Database Schemas

COURS 3, 3 heures

Ce que vous apprendrez

  • Denormalization boosts query speed but demands careful analysis of consistency risks and maintenance costs.

  • Partitioning and clustering strategies must align with actual query patterns and access methods to deliver meaningful performance gains.

  • ER diagrams serve as documentation and validation tools, enabling better communication and system understanding.

  • Schema optimization balances query performance, data integrity, storage efficiency, and maintenance complexity.

Compétences que vous acquerrez

Catégorie : Database Design
Catégorie : Database Architecture and Administration
Catégorie : Technical Documentation
Catégorie : Data Modeling
Catégorie : Database Development
Catégorie : Database Management
Catégorie : SQL
Transform, Analyze, and Optimize Your Data

Transform, Analyze, and Optimize Your Data

COURS 4, 3 heures

Ce que vous apprendrez

  • Batch data transformation converts raw semi-structured data into analysis-ready formats that support enterprise decisions.

  • Workload analysis guides database design by linking access patterns and query frequency to performance and cost gains.

  • Migration choices must rely on performance testing and quantitative analysis to ensure ROI-driven transformations.

  • System performance depends on storage, queries, and hardware, requiring holistic technical and business evaluation.

Compétences que vous acquerrez

Catégorie : Data Transformation
Catégorie : Data Architecture
Catégorie : Amazon Redshift
Catégorie : Database Management
Catégorie : Database Design
Catégorie : Apache Hive
Catégorie : Operational Databases
Catégorie : Data Wrangling
Catégorie : Azure Synapse Analytics
Catégorie : Apache Cassandra
Scale Data Warehouses Cost-Effectively

Scale Data Warehouses Cost-Effectively

COURS 5, 2 heures

Ce que vous apprendrez

  • Slowly Changing Dimensions maintain historical data integrity and enable accurate, time-based enterprise analysis.

  • Analyzing data lifecycles balances storage costs with business value, guiding efficient archiving and retention.

  • Multi-cluster architectures isolate workloads, prevent contention, and enable cost control and performance optimization.

  • Sustainable scaling requires governance, automated resource management, and continuous monitoring of performance and cost.

Compétences que vous acquerrez

Catégorie : Data Manipulation
Catégorie : Descriptive Analytics
Catégorie : Cost Management
Catégorie : Cost Reduction
Catégorie : Cloud Computing Architecture
Catégorie : Expense Management
Catégorie : Extract, Transform, Load
Catégorie : Data Architecture
Catégorie : Cost Control
Catégorie : Data Analysis
Catégorie : Data Storage
Engineer Cloud Data for Resiliency & ROI

Engineer Cloud Data for Resiliency & ROI

COURS 6, 2 heures

Ce que vous apprendrez

  • Infrastructure as Code automates data platform deployments, replacing manual processes with version-controlled, repeatable systems.

  • Cost optimization uses performance benchmarking and data analysis to identify efficient compute/storage configs for specific workloads.

  • Business continuity requires proactive disaster recovery with automated failover and continuous replication for strict recovery goals.

  • Successful cloud data engineering balances performance, cost, and reliability through strategic design and continuous monitoring.

Compétences que vous acquerrez

Catégorie : Disaster Recovery
Catégorie : Business Continuity
Catégorie : Terraform
Catégorie : Data Infrastructure
Catégorie : IT Infrastructure
Catégorie : Benchmarking
Catégorie : Cloud Deployment
Catégorie : Capacity Management
Catégorie : AWS CloudFormation
Catégorie : Business Continuity Planning
Catégorie : Data Architecture
Catégorie : Performance Analysis
Catégorie : Automation
Catégorie : Cost Management
Catégorie : Infrastructure as Code (IaC)
Catégorie : Cloud Computing Architecture
Catégorie : Data Warehousing
Optimize Spark Performance: Analyze & Accelerate

Optimize Spark Performance: Analyze & Accelerate

COURS 7, 1 heure

Ce que vous apprendrez

  • Performance optimization is a systematic process requiring analysis of data access patterns, not random configuration changes.

  • Strategic partitioning minimizes expensive network shuffles and is the foundation of scalable Spark applications.

  • Intelligent caching of reusable intermediate datasets can dramatically reduce computation costs and improve job reliability.

  • The Spark UI provides actionable insights that guide optimization decisions and enable data-driven performance improvements.

Compétences que vous acquerrez

Catégorie : Apache Spark
Catégorie : Performance Tuning
Catégorie : Systems Analysis
Catégorie : Data Pipelines
Catégorie : PySpark
Catégorie : Data Processing
Fix Data Bottlenecks: Optimize Spark Performance

Fix Data Bottlenecks: Optimize Spark Performance

COURS 8, 2 heures

Ce que vous apprendrez

  • Performance bottlenecks in distributed systems often stem from uneven data distribution rather than insufficient computational resources.

  • Visual execution plan analysis is essential for identifying specific stages where data processing imbalances occur.

  • Proactive partition strategy selection prevents performance degradation more effectively than reactive optimization

  • Spark's shuffle.partitions configuration and broadcast join patterns are fundamental tools for sustainable pipeline optimization.

Compétences que vous acquerrez

Catégorie : Performance Tuning
Catégorie : Apache Spark
Catégorie : Data Processing
Catégorie : Data Pipelines
Catégorie : Scalability
Catégorie : PySpark
Catégorie : Performance Analysis
Catégorie : Distributed Computing
Catégorie : Debugging
Evaluate Storage for Data Warehousing Success

Evaluate Storage for Data Warehousing Success

COURS 9, 2 heures

Ce que vous apprendrez

  • Storage format choice strongly affects query performance and should match workload needs, not general assumptions.

  • Column storage suits read-heavy analytics, while row storage performs better for transactional and write-focused workloads.

  • Benchmarking with real datasets and queries offers the best basis for sound storage architecture decisions.

  • Compression and ingestion speed must be balanced carefully to align performance with business priorities.

Compétences que vous acquerrez

Catégorie : Data-Driven Decision-Making
Catégorie : Apache Hive
Catégorie : Technical Communication
Catégorie : Data Processing
Catégorie : Star Schema
Catégorie : Amazon Redshift
Catégorie : Query Languages
Catégorie : Data Warehousing
Catégorie : Scalability
Catégorie : Performance Testing
Catégorie : Data Storage
Catégorie : Data Architecture
Catégorie : Snowflake Schema
Catégorie : Analysis
Catégorie : Data Storage Technologies
Optimize Query Performance for Data Success

Optimize Query Performance for Data Success

COURS 10, 2 heures

Ce que vous apprendrez

  • Proactive performance monitoring prevents system failures and ensures consistent user experience across production environments.

  • Systematic diagnosis of query bottlenecks requires understanding both query logic efficiency and underlying resource limitations.

  • Strategic resource allocation combines technical optimization with business requirements to maintain service level agreements.

  • Continuous performance analysis creates a feedback loop that improves system reliability over time.

Compétences que vous acquerrez

Catégorie : Service Level
Catégorie : Application Performance Management
Catégorie : Query Languages
Catégorie : System Monitoring
Catégorie : Capacity Management
Catégorie : Performance Testing
Catégorie : Operational Databases
Catégorie : Continuous Monitoring
Catégorie : Performance Tuning
Catégorie : Database Management
Optimize Spark Performance & Throughput

Optimize Spark Performance & Throughput

COURS 11, 4 heures

Ce que vous apprendrez

  • Inspect Spark UI and metrics (task duration, shuffle I/O, executor CPU/mem) to find bottlenecks and recommend actionable optimizations.

  • Apply partitioning and skew mitigation (salting/custom partitioner) & reduce shuffle (broadcast joins, avoid groupByKey, AQE) to improve parallelism.

  • Configure executors, cores, memory, dynamic allocation and parallelism/caching settings to maximize throughput while meeting defined SLA targets.

Compétences que vous acquerrez

Catégorie : Apache Spark
Catégorie : Performance Tuning
Catégorie : System Configuration
Catégorie : Job Analysis
Catégorie : Debugging
Catégorie : Scalability
Catégorie : Process Optimization
Catégorie : Performance Analysis
Catégorie : PySpark
Catégorie : Database Management
Catégorie : Resource Allocation

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Hurix Digital
Coursera
443 Cours38 602 apprenants
Merna Elzahaby
Coursera
1 Cours64 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions