Coursera

Spécialisation "Microservices Architecture for AI Systems"

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "Microservices Architecture for AI Systems"

Build Scalable, Production-Ready AI Systems.

Design, deploy, and scale resilient LLM-powered microservices for enterprise AI applications.

Starweaver
 Ashraf S. A. AlMadhoun
LearningMate

Instructeurs : Starweaver

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet

des 5 examens de cours de ce programme

niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet

des 5 examens de cours de ce programme

niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Design and deploy scalable, resilient microservice architectures for LLM-powered enterprise applications.

  • Apply RAG techniques, prompt engineering, and TDD practices to build production-quality AI systems.

  • Implement Kubernetes deployments, autoscaling, and monitoring for reliable AI service operations.

Compétences que vous acquerrez

  • Catégorie : API Design
  • Catégorie : Cloud Computing Architecture
  • Catégorie : Cloud Deployment
  • Catégorie : Containerization
  • Catégorie : Infrastructure as Code (IaC)
  • Catégorie : Large Language Modeling
  • Catégorie : LLM Application
  • Catégorie : Microservices
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : Performance Analysis
  • Catégorie : Retrieval-Augmented Generation
  • Catégorie : Scalability
  • Catégorie : Site Reliability Engineering
  • Catégorie : Software Architecture
  • Catégorie : Test Driven Development (TDD)

Outils que vous découvrirez

  • Catégorie : Kubernetes
  • Catégorie : LangChain
  • Catégorie : Model Deployment
  • Catégorie : Prompt Engineering
  • Catégorie : Python Programming

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

janvier 2026

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 7 cours

LLM Engineering with RAG: Optimizing AI Solutions

LLM Engineering with RAG: Optimizing AI Solutions

COURS 1, 3 heures

Ce que vous apprendrez

  • Integrate LLMs with enterprise data Applications.

  • Evaluate RAG techniques to improve the accuracy and efficiency of AI retrieval and generation processes.

  • Refine prompts to optimize the quality and relevance of AI-generated responses.

  • Deploy scalable LLM-powered solutions to address complex real-world enterprise challenges.

Compétences que vous acquerrez

Catégorie : Prompt Engineering
Catégorie : Retrieval-Augmented Generation
Catégorie : Vector Databases
Catégorie : Embeddings
Catégorie : LangChain
Catégorie : AI Integrations
Catégorie : Generative AI
Catégorie : Data Science
Catégorie : LLM Application
Catégorie : Application Deployment
Catégorie : Hugging Face
Catégorie : Large Language Modeling
Catégorie : Scalability
Catégorie : Data Integration
Catégorie : OpenAI
Catégorie : Model Deployment
Catégorie : Machine Learning
Catégorie : OpenAI API
Design, Compare and Analyze LLM Architectures

Design, Compare and Analyze LLM Architectures

COURS 2, 2 heures

Ce que vous apprendrez

  • Design and justify LLM architectures by modeling system flows and analyzing self-hosting vs. managed API trade-offs.

Compétences que vous acquerrez

Catégorie : Analysis
Catégorie : Diagram Design
Catégorie : Cloud API
Catégorie : Cost Management
Catégorie : Model Deployment
Catégorie : Feature Engineering
Catégorie : Data Pipelines
Catégorie : Business Risk Management
Catégorie : Cloud Deployment
Catégorie : AI Product Strategy
Catégorie : Unified Modeling Language
Catégorie : Information Privacy
Catégorie : Performance Analysis
Catégorie : Application Programming Interface (API)
Catégorie : MLOps (Machine Learning Operations)
Architect Resilient LLM Microservices for Scale

Architect Resilient LLM Microservices for Scale

COURS 3, 2 heures

Ce que vous apprendrez

  • Design and implement scalable, resilient microservice architectures for LLM apps using the 12-factor app methodology for fault tolerance in the cloud

Compétences que vous acquerrez

Catégorie : Microservices
Catégorie : Scalability
Catégorie : Software Architecture
Catégorie : Data Persistence
Catégorie : Software Design
Catégorie : Cloud-Native Computing
Catégorie : Systems Architecture
Catégorie : Cloud Deployment
Catégorie : Software Documentation
Catégorie : Reliability
Catégorie : Service Recovery
Catégorie : Application Deployment
Catégorie : LLM Application
Catégorie : Cloud Computing Architecture
Catégorie : Solution Architecture
Catégorie : Dependency Analysis
Catégorie : Software Technical Review
Catégorie : Configuration Management
Catégorie : Failure Analysis
Catégorie : Site Reliability Engineering
Refactor and Test LLM Microservices

Refactor and Test LLM Microservices

COURS 4, 3 heures

Ce que vous apprendrez

  • Apply TDD and systematic refactoring to build and maintain robust, production-quality LLM-powered microservices.

Compétences que vous acquerrez

Catégorie : Maintainability
Catégorie : Microservices
Catégorie : Unit Testing
Catégorie : API Testing
Catégorie : Quality Assessment
Catégorie : Test Driven Development (TDD)
Catégorie : Engineering Software
Catégorie : Software Engineering
Catégorie : LLM Application
Catégorie : Code Reusability
Catégorie : API Design
Catégorie : Code Review
Catégorie : Software Technical Review
Catégorie : Test Script Development
Catégorie : Peer Review
Catégorie : Integrated Development Environments
Catégorie : Microsoft Visual Studio
Analyze & Deploy Scalable LLM Architectures

Analyze & Deploy Scalable LLM Architectures

COURS 5, 2 heures

Ce que vous apprendrez

Compétences que vous acquerrez

Catégorie : Containerization
Catégorie : Application Performance Management
Catégorie : Kubernetes
Catégorie : Performance Analysis
Catégorie : Large Language Modeling
Catégorie : Application Deployment
Catégorie : LLM Application
Catégorie : Configuration Management
Catégorie : Cloud-Native Computing
Catégorie : Model Deployment
Catégorie : Release Management
Catégorie : Performance Tuning
Catégorie : Scalability
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Data-Driven Decision-Making
Catégorie : Systems Analysis
Catégorie : Analysis
Catégorie : Continuous Delivery
Catégorie : Retrieval-Augmented Generation
Design Scalable AI Systems and Components

Design Scalable AI Systems and Components

COURS 6, 2 heures

Ce que vous apprendrez

  • Design end-to-end AI system architectures that meet throughput, latency, and fault-tolerance goals using industry-standard ML patterns.

  • Produce complete architecture documents with component diagrams and interface specifications that engineering teams can implement directly.

Compétences que vous acquerrez

Catégorie : Systems Design
Catégorie : Design Specifications
Catégorie : Solution Architecture
Catégorie : Dataflow
Catégorie : Diagram Design
Catégorie : Data Pipelines
Catégorie : Functional Specification
Catégorie : Architectural Drawing
Catégorie : Data Store
Catégorie : Artificial Intelligence and Machine Learning (AI/ML)
Catégorie : Software Design
Integrate and Optimize AI Services Seamlessly

Integrate and Optimize AI Services Seamlessly

COURS 7, 2 heures

Ce que vous apprendrez

  • Integrate AI prediction services using gRPC and protobuf to improve consistency, performance, and cross-language compatibility in production.

  • Interpret Prometheus metrics and canary release signals to make safe rollback or stabilization decisions for live AI services.

Compétences que vous acquerrez

Catégorie : Restful API
Catégorie : AI Integrations
Catégorie : Continuous Deployment
Catégorie : Middleware
Catégorie : System Monitoring
Catégorie : API Testing
Catégorie : Site Reliability Engineering
Catégorie : Machine Learning

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Starweaver
Coursera
561 Cours1 118 027 apprenants
 Ashraf S. A. AlMadhoun
Coursera
9 Cours4 607 apprenants
LearningMate
275 Cours28 105 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions