Coursera

Spécialisation "Microservices Architecture for AI Systems"

Ce spécialisation n'est pas disponible en Français (France)

Nous sommes actuellement en train de le traduire dans plus de langues.
Coursera

Spécialisation "Microservices Architecture for AI Systems"

Build Scalable, Production-Ready AI Systems.

Design, deploy, and scale resilient LLM-powered microservices for enterprise AI applications.

Starweaver
 Ashraf S. A. AlMadhoun
LearningMate

Instructeurs : Starweaver

Inclus avec Coursera Plus

Approfondissez votre connaissance d’un sujet

des 5 examens de cours de ce programme

niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Approfondissez votre connaissance d’un sujet

des 5 examens de cours de ce programme

niveau Intermédiaire

Expérience recommandée

4 semaines à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Design and deploy scalable, resilient microservice architectures for LLM-powered enterprise applications.

  • Apply RAG techniques, prompt engineering, and TDD practices to build production-quality AI systems.

  • Implement Kubernetes deployments, autoscaling, and monitoring for reliable AI service operations.

Compétences que vous acquerrez

  • Catégorie : API Design
  • Catégorie : Cloud Computing Architecture
  • Catégorie : Cloud Deployment
  • Catégorie : Containerization
  • Catégorie : Infrastructure as Code (IaC)
  • Catégorie : Large Language Modeling
  • Catégorie : LLM Application
  • Catégorie : Microservices
  • Catégorie : MLOps (Machine Learning Operations)
  • Catégorie : Performance Analysis
  • Catégorie : Retrieval-Augmented Generation
  • Catégorie : Scalability
  • Catégorie : Site Reliability Engineering
  • Catégorie : Software Architecture
  • Catégorie : Test Driven Development (TDD)

Outils que vous découvrirez

  • Catégorie : Kubernetes
  • Catégorie : LangChain
  • Catégorie : Model Deployment
  • Catégorie : Prompt Engineering
  • Catégorie : Python Programming

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Anglais
Récemment mis à jour !

janvier 2026

91%

of learners achieved a positive career outcome

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Améliorez votre expertise en la matière

  • Acquérez des compétences recherchées auprès d’universités et d’experts du secteur
  • Maîtrisez un sujet ou un outil avec des projets pratiques
  • Développez une compréhension approfondie de concepts clés
  • Obtenez un certificat professionnel auprès de Coursera

Spécialisation - série de 7 cours

LLM Engineering with RAG: Optimizing AI Solutions

LLM Engineering with RAG: Optimizing AI Solutions

COURS 1, 3 heures

Ce que vous apprendrez

  • Integrate LLMs with enterprise data Applications.

  • Evaluate RAG techniques to improve the accuracy and efficiency of AI retrieval and generation processes.

  • Refine prompts to optimize the quality and relevance of AI-generated responses.

  • Deploy scalable LLM-powered solutions to address complex real-world enterprise challenges.

Compétences que vous acquerrez

Catégorie : Retrieval-Augmented Generation
Catégorie : Prompt Engineering
Catégorie : Vector Databases
Catégorie : LLM Application
Catégorie : Large Language Modeling
Catégorie : LangChain
Catégorie : Data Integration
Catégorie : Scalability
Catégorie : Model Deployment
Catégorie : OpenAI
Catégorie : Data Science
Catégorie : OpenAI API
Catégorie : Application Deployment
Catégorie : Machine Learning
Catégorie : Generative AI
Catégorie : AI Integrations
Catégorie : Embeddings
Catégorie : Hugging Face
Design, Compare and Analyze LLM Architectures

Design, Compare and Analyze LLM Architectures

COURS 2, 2 heures

Ce que vous apprendrez

  • Design and justify LLM architectures by modeling system flows and analyzing self-hosting vs. managed API trade-offs.

Compétences que vous acquerrez

Catégorie : Diagram Design
Catégorie : Analysis
Catégorie : Data Pipelines
Catégorie : Cloud Deployment
Catégorie : Information Privacy
Catégorie : Performance Analysis
Catégorie : Business Risk Management
Catégorie : Application Programming Interface (API)
Catégorie : AI Product Strategy
Catégorie : Cost Management
Catégorie : Feature Engineering
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Cloud API
Catégorie : Model Deployment
Catégorie : Unified Modeling Language
Architect Resilient LLM Microservices for Scale

Architect Resilient LLM Microservices for Scale

COURS 3, 2 heures

Ce que vous apprendrez

  • Design and implement scalable, resilient microservice architectures for LLM apps using the 12-factor app methodology for fault tolerance in the cloud

Compétences que vous acquerrez

Catégorie : Scalability
Catégorie : Microservices
Catégorie : Data Persistence
Catégorie : LLM Application
Catégorie : Cloud Deployment
Catégorie : Software Architecture
Catégorie : Solution Architecture
Catégorie : Site Reliability Engineering
Catégorie : Cloud-Native Computing
Catégorie : Configuration Management
Catégorie : Systems Architecture
Catégorie : Failure Analysis
Catégorie : Application Deployment
Catégorie : Reliability
Catégorie : Software Technical Review
Catégorie : Dependency Analysis
Catégorie : Service Recovery
Catégorie : Software Documentation
Catégorie : Software Design
Catégorie : Cloud Computing Architecture
Refactor and Test LLM Microservices

Refactor and Test LLM Microservices

COURS 4, 3 heures

Ce que vous apprendrez

  • Apply TDD and systematic refactoring to build and maintain robust, production-quality LLM-powered microservices.

Compétences que vous acquerrez

Catégorie : Maintainability
Catégorie : Microservices
Catégorie : API Design
Catégorie : Engineering Software
Catégorie : Software Technical Review
Catégorie : LLM Application
Catégorie : Code Review
Catégorie : API Testing
Catégorie : Peer Review
Catégorie : Test Driven Development (TDD)
Catégorie : Quality Assessment
Catégorie : Software Engineering
Catégorie : Code Reusability
Catégorie : Microsoft Visual Studio
Catégorie : Test Script Development
Catégorie : Unit Testing
Catégorie : Integrated Development Environments
Analyze & Deploy Scalable LLM Architectures

Analyze & Deploy Scalable LLM Architectures

COURS 5, 2 heures

Ce que vous apprendrez

Compétences que vous acquerrez

Catégorie : Application Performance Management
Catégorie : Kubernetes
Catégorie : Containerization
Catégorie : Systems Analysis
Catégorie : Performance Tuning
Catégorie : Retrieval-Augmented Generation
Catégorie : MLOps (Machine Learning Operations)
Catégorie : Model Deployment
Catégorie : Scalability
Catégorie : Large Language Modeling
Catégorie : Configuration Management
Catégorie : Continuous Delivery
Catégorie : Performance Analysis
Catégorie : Application Deployment
Catégorie : Release Management
Catégorie : LLM Application
Catégorie : Cloud-Native Computing
Catégorie : Analysis
Catégorie : Data-Driven Decision-Making
Design Scalable AI Systems and Components

Design Scalable AI Systems and Components

COURS 6, 2 heures

Ce que vous apprendrez

  • Design end-to-end AI system architectures that meet throughput, latency, and fault-tolerance goals using industry-standard ML patterns.

  • Produce complete architecture documents with component diagrams and interface specifications that engineering teams can implement directly.

Compétences que vous acquerrez

Catégorie : Systems Design
Catégorie : Data Store
Catégorie : Architectural Drawing
Catégorie : Design Specifications
Catégorie : Software Design
Catégorie : Functional Specification
Catégorie : Diagram Design
Catégorie : Data Pipelines
Catégorie : Solution Architecture
Catégorie : Dataflow
Catégorie : Artificial Intelligence and Machine Learning (AI/ML)
Integrate and Optimize AI Services Seamlessly

Integrate and Optimize AI Services Seamlessly

COURS 7, 2 heures

Ce que vous apprendrez

  • Integrate AI prediction services using gRPC and protobuf to improve consistency, performance, and cross-language compatibility in production.

  • Interpret Prometheus metrics and canary release signals to make safe rollback or stabilization decisions for live AI services.

Compétences que vous acquerrez

Catégorie : AI Integrations
Catégorie : Restful API
Catégorie : API Testing
Catégorie : Middleware
Catégorie : System Monitoring
Catégorie : Site Reliability Engineering
Catégorie : Machine Learning
Catégorie : Continuous Deployment

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Instructeurs

Starweaver
Coursera
561 Cours1 115 551 apprenants
 Ashraf S. A. AlMadhoun
Coursera
9 Cours4 586 apprenants
LearningMate
275 Cours27 678 apprenants

Offert par

Coursera

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Foire Aux Questions