Learn to orchestrate AI systems across local and cloud environments through hands-on infrastructure setup, model deployment, and workflow integration. You will build a prompt engineering pyramid from basic prompts to chain-of-thought reasoning implemented in Rust, then evaluate six decision factors for choosing between local and cloud models including latency, throughput, cost, and privacy. The course covers local AI infrastructure in depth: running Ollama with custom Modelfiles for task-specific assistants, deploying llamafile for zero-dependency portable inference, compiling Rust Candle with CUDA for GPU-accelerated local inference, and optimizing local RAG with caching strategies. You will configure a complete AI workstation with tmux for session management, nvidia-smi and Zenith for GPU monitoring, and NVIDIA GPU optimization. The final module covers cloud workflows including AWS Spot instances for cost-effective GPU compute, Hugging Face model discovery and download, and GitHub AI models integration. By completing this course, you will be able to set up local AI infrastructure, deploy models across local and cloud environments, and design orchestration workflows that balance cost, privacy, and performance.

AI Orchestration: From local models to cloud
Économisez sur les compétences qui vous font briller avec 40 % de réduction sur 3 mois de Coursera Plus. Économisez maintenant

AI Orchestration: From local models to cloud
Ce cours fait partie de Spécialisation "AI Tooling"


Instructeurs : Alfredo Deza
Inclus avec
Expérience recommandée
Ce que vous apprendrez
Build a prompt engineering pyramid from basic prompts to chain-of-thought reasoning in Rust, and evaluate decision factors for local vs cloud
Set up local AI infrastructure with Ollama, llamafile, aprender and Rust Candle GPU compilation, plus caching and RAG optimization strategies
Configure a production AI workstation with tmux, nvidia-smi, and Zenith, and integrate cloud workflows with AWS Spot, Hugging Face, and GitHub AI
Compétences que vous acquerrez
- Catégorie : Prompt Patterns
- Catégorie : Computer Graphics
- Catégorie : Model Optimization
- Catégorie : System Monitoring
- Catégorie : Cloud Infrastructure
- Catégorie : LLM Application
- Catégorie : Retrieval-Augmented Generation
- Catégorie : Analysis
- Catégorie : Cloud Deployment
- Catégorie : Cloud Technologies
- Catégorie : Large Language Modeling
- Catégorie : Cloud Computing Architecture
- Catégorie : AI Integrations
Outils que vous découvrirez
- Catégorie : Model Deployment
- Catégorie : AI Workflows
- Catégorie : Rust (Programming Language)
- Catégorie : AWS SageMaker
- Catégorie : Prompt Engineering
- Catégorie : Hugging Face
- Catégorie : AI Orchestration
Détails à connaître

Ajouter à votre profil LinkedIn
avril 2026
4 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 4 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Offert par
En savoir plus sur Software Development
Statut : Essai gratuit
Statut : Essai gratuitPragmatic AI Labs

Duke University
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.
Foire Aux Questions
Plus de questions
Aide financière disponible,




