Learn to build production-grade LLM systems using AWS Bedrock, local inference toolchains, and systematic quality evaluation. You will explore retrieval-augmented generation (RAG) on AWS, configuring Bedrock knowledge bases with S3 data sources for document-grounded responses, and building Rust applications that interact with Bedrock model APIs. The course covers tokenization fundamentals, multi-model architectures for routing requests to appropriate foundation models, and the Bedrock knowledge agent workflow from data ingestion to response generation. You will compile llama.cpp with hardware-specific optimization flags, work with the GGUF file format for quantized model distribution, and deploy Qwen 2.5 Coder as a local coding assistant on AWS GPU instances. The local LLM toolchain module demonstrates Amdahl's law applied to parallel compilation, Bedrock provisioned throughput for dedicated model capacity, and prompt evaluation in the Bedrock console. You will use the UV package manager for Python dependency management in LLM projects and explore Amazon Q Developer for AI-assisted code generation and documentation. The course also covers SageMaker Canvas for no-code ML development, including dataset preparation and AutoML training. By completing this course, you will be able to design RAG pipelines on AWS, run optimized local LLM inference with llama.cpp, and evaluate LLM quality metrics for production deployments.

Deterministic LLM programming

Deterministic LLM programming
Ce cours fait partie de Spécialisation "AI Tooling"


Instructeurs : Alfredo Deza
Inclus avec
Expérience recommandée
Ce que vous apprendrez
Implement RAG pipelines on AWS using Bedrock knowledge bases, S3 data sources, and Rust SDK integration for document-grounded LLM responses
Evaluate LLM quality through Bedrock prompt evaluation, provisioned throughput configuration, and SageMaker Canvas no-code ML workflows
Compétences que vous acquerrez
- Catégorie : Package and Software Management
- Catégorie : LLM Application
- Catégorie : Model Training
- Catégorie : Large Language Modeling
- Catégorie : Model Optimization
- Catégorie : Token Optimization
- Catégorie : Retrieval-Augmented Generation
- Catégorie : Data Wrangling
- Catégorie : Performance Tuning
- Catégorie : Generative AI Agents
Outils que vous découvrirez
- Catégorie : No-Code Development
- Catégorie : Amazon Bedrock
- Catégorie : AI Orchestration
- Catégorie : AWS SageMaker
- Catégorie : Prompt Engineering
- Catégorie : Amazon Web Services
- Catégorie : Model Deployment
- Catégorie : Rust (Programming Language)
- Catégorie : Generative AI
Détails à connaître

Ajouter à votre profil LinkedIn
avril 2026
3 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 4 modules dans ce cours
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
Offert par
En savoir plus sur Software Development
Statut : Essai gratuit
Statut : Essai gratuit
Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Jennifer J.

Larry W.

Chaitanya A.

Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Plus de questions
Aide financière disponible,


