Pragmatic AI Labs

Spécialisation "Enterprise AI and Data Engineering with Databricks"

Économisez sur les compétences qui vous font briller avec 40 % de réduction sur 3 mois de Coursera Plus. Économisez maintenant

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Pragmatic AI Labs

Spécialisation "Enterprise AI and Data Engineering with Databricks"

Build Production Data and AI on Databricks.

Master lakehouse architecture, Delta Live Tables, ML, GenAI, and MLOps in five hands-on courses.

Noah Gift
Alfredo Deza

Instructeurs : Noah Gift

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet

des 5 examens de cours de ce programme

niveau Débutant

Expérience recommandée

4 semaines à compléter
à 5 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet

des 5 examens de cours de ce programme

niveau Débutant

Expérience recommandée

4 semaines à compléter
à 5 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Architect and build medallion data pipelines (bronze, silver, gold) using Apache Spark, Delta Lake, and Databricks Workflows

  • Implement declarative ETL with Delta Live Tables including data quality expectations, streaming ingestion via Auto Loader, and Change Data Capture

  • Train, track, and register machine learning models using MLflow on Databricks with hyperparameter tuning and the Model Registry

  • Build generative AI applications with LLM fine-tuning, Vector Search, and retrieval-augmented generation on the Databricks platform

Compétences que vous acquerrez

  • Catégorie : AI Enablement
  • Catégorie : Data Architecture
  • Catégorie : Data Governance
  • Catégorie : Data Literacy
  • Catégorie : Data Management
  • Catégorie : Data Modeling
  • Catégorie : Data Pipelines
  • Catégorie : Data Processing
  • Catégorie : Data Quality
  • Catégorie : Data Strategy
  • Catégorie : Generative AI Agents
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : SQL
  • Catégorie : Data Visualization

Outils que vous découvrirez

  • Catégorie : Data Lakes
  • Catégorie : Databricks
  • Catégorie : Generative AI
  • Catégorie : Prompt Engineering
  • Catégorie : Python Programming
  • Catégorie : Rust (Programming Language)
  • Catégorie : Scala Programming

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

mars 2026

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Pragmatic AI Labs

Spécialisation - série de 5 cours

Databricks Lakehouse Fundamentals

Databricks Lakehouse Fundamentals

COURS 1, 2 heures

Ce que vous apprendrez

  • Write PySpark and SparkSQL queries using lazy evaluation, the Catalyst optimizer, and broadcast join optimization

  • Schedule end-to-end data pipelines as multi-task Databricks Jobs with dashboards and alerting

  • Build and query Delta Lake tables with ACID transactions, schema enforcement, time travel, and MERGE-based incremental ETL

Compétences que vous acquerrez

Catégorie : Databricks
Catégorie : Data Lakes
Catégorie : Data Pipelines
Catégorie : Data Science
Catégorie : Apache Spark
Catégorie : Data Modeling
Catégorie : Data Entry
Catégorie : Data Architecture
Catégorie : Data Storage
Catégorie : Data Mining
Catégorie : Data Integrity
Catégorie : Data Wrangling
Catégorie : Data Warehousing
Catégorie : Data Synthesis
Catégorie : Data Processing
Catégorie : Data Presentation
Catégorie : Python Programming
Catégorie : Data Management
Catégorie : SQL
Catégorie : Data Access
Data Engineering with Delta Lake on Databricks

Data Engineering with Delta Lake on Databricks

COURS 2, 3 heures

Ce que vous apprendrez

  • Build declarative ETL pipelines with Delta Live Tables using both SQL and Python, including streaming ingestion with Auto Loader and schema evolution

  • Implement the Medallion Architecture (bronze, silver, gold) with expectations-based data quality enforcement at each layer

  • Design production pipelines with Change Data Capture, incremental processing, and performance optimization using Z-ordering and partitioning

Compétences que vous acquerrez

Catégorie : Data Pipelines
Catégorie : Data Architecture
Catégorie : Data Integrity
Catégorie : Data Mining
Catégorie : Data Management
Catégorie : SQL
Catégorie : Data Governance
Catégorie : Apache
Catégorie : Extract, Transform, Load
Catégorie : Data Science
Catégorie : Data Processing
Catégorie : Data Security
Catégorie : Data Strategy
Catégorie : Live Streaming
Catégorie : Data Lakes
Catégorie : Data Presentation
Catégorie : Data Wrangling
Catégorie : Data Storage
Catégorie : Databricks
Catégorie : Data Ethics
Machine Learning with Databricks and MLflow

Machine Learning with Databricks and MLflow

COURS 3, 2 heures

Ce que vous apprendrez

Compétences que vous acquerrez

Catégorie : Databricks
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Data Science
Catégorie : Scala Programming
Catégorie : Hugging Face
Catégorie : LLM Application
Catégorie : Functional Testing
Catégorie : Exploratory Data Analysis
Catégorie : Recurrent Neural Networks (RNNs)
Catégorie : Data Mining
Catégorie : Mathematical Modeling
Catégorie : Artificial Intelligence
Catégorie : Rust (Programming Language)
Catégorie : Model Evaluation
Catégorie : Programming Principles
Catégorie : Apache Spark
Catégorie : Continuous Monitoring
Catégorie : Data Architecture
Catégorie : Lean Six Sigma
Catégorie : Statistical Inference
Generative AI and LLMs on Databricks

Generative AI and LLMs on Databricks

COURS 4, 2 heures

Ce que vous apprendrez

  • Apply prompt engineering patterns (CoT, ReAct, few-shot) and sampling parameters to control LLM output for production systems

  • Design and evaluate hybrid RAG pipelines using embeddings, BM25, and Reciprocal Rank Fusion with six standard retrieval metrics

  • Implement model security through cryptographic chain-of-trust signing, AI Gateway governance, and Unity Catalog model registry workflows

Compétences que vous acquerrez

Catégorie : Retrieval-Augmented Generation
Catégorie : Rust (Programming Language)
Catégorie : Vector Databases
Catégorie : Governance
Catégorie : MLOps (Machine Learning Operations)
Catégorie : OpenAI
Catégorie : LLM Application
Catégorie : Python Programming
Catégorie : DevOps
Catégorie : Prompt Engineering Tools
Catégorie : Software Architecture
Catégorie : Scala Programming
Catégorie : Data Architecture
Catégorie : Claude Code
Catégorie : Generative AI Agents
Catégorie : Embeddings
Catégorie : Prompt Engineering
Catégorie : Databricks
Catégorie : Anthropic Claude
Catégorie : Generative AI
Production Governance and MLOps on Databricks

Production Governance and MLOps on Databricks

COURS 5, 4 heures

Ce que vous apprendrez

  • Navigate and manage the Unity Catalog hierarchy (metastores, catalogs, schemas, tables) using the SDK, CLI, and VS Code

  • Implement access control by creating service principals and writing GRANT/REVOKE statements in SQL

  • Implement access control by creating service principals and writing GRANT/REVOKE statements in SQL

Compétences que vous acquerrez

Catégorie : MLOps (Machine Learning Operations)
Catégorie : Databricks
Catégorie : Data Quality
Catégorie : Data Engineering
Catégorie : Model Deployment
Catégorie : Authentications
Catégorie : Generative AI
Catégorie : Test Tools
Catégorie : Event Monitoring
Catégorie : Authorization (Computing)
Catégorie : CI/CD
Catégorie : Identity and Access Management
Catégorie : Python Programming
Catégorie : Data Governance
Catégorie : Role-Based Access Control (RBAC)
Catégorie : Anomaly Detection
Catégorie : Metadata Management
Catégorie : GitHub
Catégorie : Data Access
Catégorie : Data Lakes

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Noah Gift
Pragmatic AI Labs
47 Cours3 264 apprenants
Alfredo Deza
Pragmatic AI Labs
33 Cours1 572 apprenants

Offert par

Pragmatic AI Labs

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions