Coursera

Spécialisation "Microservices Architecture for AI Systems"

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "Microservices Architecture for AI Systems"

Build Scalable, Production-Ready AI Systems.

Design, deploy, and scale resilient LLM-powered microservices for enterprise AI applications.

Starweaver
 Ashraf S. A. AlMadhoun
LearningMate

Instructeurs : Starweaver

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet

des 5 examens de cours de ce programme

niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet

des 5 examens de cours de ce programme

niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Design and deploy scalable, resilient microservice architectures for LLM-powered enterprise applications.

  • Apply RAG techniques, prompt engineering, and TDD practices to build production-quality AI systems.

  • Implement Kubernetes deployments, autoscaling, and monitoring for reliable AI service operations.

Compétences que vous acquerrez

  • Catégorie : API Design
  • Catégorie : Cloud Computing Architecture
  • Catégorie : Cloud Deployment
  • Catégorie : Containerization
  • Catégorie : Infrastructure as Code (IaC)
  • Catégorie : Large Language Modeling
  • Catégorie : LLM Application
  • Catégorie : Microservices
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : Performance Analysis
  • Catégorie : Retrieval-Augmented Generation
  • Catégorie : Scalability
  • Catégorie : Site Reliability Engineering
  • Catégorie : Software Architecture
  • Catégorie : Test Driven Development (TDD)

Outils que vous découvrirez

  • Catégorie : Kubernetes
  • Catégorie : LangChain
  • Catégorie : Model Deployment
  • Catégorie : Prompt Engineering
  • Catégorie : Python Programming

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

janvier 2026

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 7 cours

LLM Engineering with RAG: Optimizing AI Solutions

LLM Engineering with RAG: Optimizing AI Solutions

COURS 1, 3 heures

Ce que vous apprendrez

  • Integrate LLMs with enterprise data Applications.

  • Evaluate RAG techniques to improve the accuracy and efficiency of AI retrieval and generation processes.

  • Refine prompts to optimize the quality and relevance of AI-generated responses.

  • Deploy scalable LLM-powered solutions to address complex real-world enterprise challenges.

Compétences que vous acquerrez

Catégorie : Prompt Engineering
Catégorie : Retrieval-Augmented Generation
Catégorie : Vector Databases
Catégorie : OpenAI API
Catégorie : Generative AI
Catégorie : Embeddings
Catégorie : Large Language Modeling
Catégorie : Model Deployment
Catégorie : Application Deployment
Catégorie : Data Science
Catégorie : LLM Application
Catégorie : LangChain
Catégorie : OpenAI
Catégorie : Hugging Face
Catégorie : Data Integration
Catégorie : AI Integrations
Catégorie : Machine Learning
Catégorie : Scalability
Design, Compare and Analyze LLM Architectures

Design, Compare and Analyze LLM Architectures

COURS 2, 2 heures

Ce que vous apprendrez

  • Design and justify LLM architectures by modeling system flows and analyzing self-hosting vs. managed API trade-offs.

Compétences que vous acquerrez

Catégorie : Diagram Design
Catégorie : Analysis
Catégorie : Information Privacy
Catégorie : Unified Modeling Language
Catégorie : Application Programming Interface (API)
Catégorie : Business Risk Management
Catégorie : Cloud Deployment
Catégorie : Cloud API
Catégorie : Model Deployment
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Cost Management
Catégorie : Performance Analysis
Catégorie : Data Pipelines
Catégorie : Feature Engineering
Catégorie : AI Product Strategy
Architect Resilient LLM Microservices for Scale

Architect Resilient LLM Microservices for Scale

COURS 3, 2 heures

Ce que vous apprendrez

  • Design and implement scalable, resilient microservice architectures for LLM apps using the 12-factor app methodology for fault tolerance in the cloud

Compétences que vous acquerrez

Catégorie : Microservices
Catégorie : Scalability
Catégorie : Software Documentation
Catégorie : Service Recovery
Catégorie : Site Reliability Engineering
Catégorie : Solution Architecture
Catégorie : Application Deployment
Catégorie : Reliability
Catégorie : Failure Analysis
Catégorie : Software Architecture
Catégorie : Cloud Deployment
Catégorie : Data Persistence
Catégorie : Cloud Computing Architecture
Catégorie : Configuration Management
Catégorie : Software Technical Review
Catégorie : LLM Application
Catégorie : Cloud-Native Computing
Catégorie : Software Design
Catégorie : Systems Architecture
Catégorie : Dependency Analysis
Refactor and Test LLM Microservices

Refactor and Test LLM Microservices

COURS 4, 3 heures

Ce que vous apprendrez

  • Apply TDD and systematic refactoring to build and maintain robust, production-quality LLM-powered microservices.

Compétences que vous acquerrez

Catégorie : Maintainability
Catégorie : Microservices
Catégorie : Peer Review
Catégorie : Code Reusability
Catégorie : Test Driven Development (TDD)
Catégorie : API Design
Catégorie : API Testing
Catégorie : Microsoft Visual Studio
Catégorie : Software Engineering
Catégorie : LLM Application
Catégorie : Code Review
Catégorie : Engineering Software
Catégorie : Integrated Development Environments
Catégorie : Test Script Development
Catégorie : Quality Assessment
Catégorie : Unit Testing
Catégorie : Software Technical Review
Analyze & Deploy Scalable LLM Architectures

Analyze & Deploy Scalable LLM Architectures

COURS 5, 2 heures

Ce que vous apprendrez

Compétences que vous acquerrez

Catégorie : Containerization
Catégorie : Kubernetes
Catégorie : Application Performance Management
Catégorie : Data-Driven Decision-Making
Catégorie : Scalability
Catégorie : Systems Analysis
Catégorie : Application Deployment
Catégorie : Continuous Delivery
Catégorie : LLM Application
Catégorie : Configuration Management
Catégorie : Large Language Modeling
Catégorie : Release Management
Catégorie : Retrieval-Augmented Generation
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Performance Tuning
Catégorie : Cloud-Native Computing
Catégorie : Model Deployment
Catégorie : Performance Analysis
Catégorie : Analysis
Design Scalable AI Systems and Components

Design Scalable AI Systems and Components

COURS 6, 2 heures

Ce que vous apprendrez

  • Design end-to-end AI system architectures that meet throughput, latency, and fault-tolerance goals using industry-standard ML patterns.

  • Produce complete architecture documents with component diagrams and interface specifications that engineering teams can implement directly.

Compétences que vous acquerrez

Catégorie : Systems Design
Catégorie : Design Specifications
Catégorie : Artificial Intelligence and Machine Learning (AI/ML)
Catégorie : Architectural Drawing
Catégorie : Diagram Design
Catégorie : Software Design
Catégorie : Dataflow
Catégorie : Data Pipelines
Catégorie : Solution Architecture
Catégorie : Data Store
Catégorie : Functional Specification
Integrate and Optimize AI Services Seamlessly

Integrate and Optimize AI Services Seamlessly

COURS 7, 2 heures

Ce que vous apprendrez

  • Integrate AI prediction services using gRPC and protobuf to improve consistency, performance, and cross-language compatibility in production.

  • Interpret Prometheus metrics and canary release signals to make safe rollback or stabilization decisions for live AI services.

Compétences que vous acquerrez

Catégorie : AI Integrations
Catégorie : Distributed Computing
Catégorie : System Monitoring
Catégorie : Machine Learning
Catégorie : Middleware
Catégorie : Restful API
Catégorie : API Testing
Catégorie : Site Reliability Engineering
Catégorie : Continuous Deployment

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Starweaver
Coursera
560 Cours1 107 625 apprenants
 Ashraf S. A. AlMadhoun
Coursera
9 Cours4 508 apprenants
LearningMate
275 Cours26 338 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions