Coursera

Spezialisierung „LLM Optimization & Evaluation“

spezialisierung ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Coursera

Spezialisierung „LLM Optimization & Evaluation“

Optimize & Deploy Production-Ready LLM Systems.

Build expertise in LLM evaluation, optimization, and deployment through hands-on MLOps projects.

John Whitworth
LearningMate

Dozenten: John Whitworth

Bei Coursera Plus enthalten

Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Evaluate and optimize LLM performance using statistical testing, MLOps tools, and production monitoring systems.

  • Build automated pipelines for feature engineering, experiment tracking, and data processing with industry-standard tools.

  • Diagnose LLM errors, implement safety frameworks, and reduce operational costs through systematic analysis.

Kompetenzen, die Sie erwerben

  • Kategorie: AI Security
  • Kategorie: Data Pipelines
  • Kategorie: Data Presentation
  • Kategorie: Extract, Transform, Load
  • Kategorie: Fine-tuning
  • Kategorie: Large Language Modeling
  • Kategorie: LLM Application
  • Kategorie: MLOps (Machine Learning Operations)
  • Kategorie: Model Optimization
  • Kategorie: Performance Tuning
  • Kategorie: Prompt Patterns
  • Kategorie: Root Cause Analysis
  • Kategorie: Scripting
  • Kategorie: SQL
  • Kategorie: Statistical Analysis
  • Kategorie: Technical Communication
  • Kategorie: Technical Documentation
  • Kategorie: User Acceptance Testing (UAT)
  • Kategorie: Version Control

Werkzeuge, die Sie lernen werden

  • Kategorie: Apache Airflow
  • Kategorie: Python Programming

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Englisch
Kürzlich aktualisiert!

Dezember 2025

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse.

  • Erlernen Sie gefragte Kompetenzen von Universitäten und Branchenexperten.
  • Erlernen Sie ein Thema oder ein Tool mit echten Projekten.
  • Entwickeln Sie ein fundiertes Verständnisse der Kernkonzepte.
  • Erwerben Sie ein Karrierezertifikat von Coursera.

Spezialisierung - 13 Kursreihen

Engineer Features and Evaluate Models for Production

Engineer Features and Evaluate Models for Production

KURS 1, 3 Stunden

Was Sie lernen werden

  • Build feature engineering pipelines and evaluate ML experiments using MLOps tools to select and deploy production-ready models.

Kompetenzen, die Sie erwerben

Kategorie: Analysis
Kategorie: Model Evaluation
Kategorie: Technical Writing
Kategorie: Feature Engineering
Kategorie: Machine Learning Methods
Kategorie: Model Optimization
Kategorie: Data Preprocessing
Kategorie: Data Pipelines
Kategorie: Model Deployment
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Performance Analysis
Kategorie: Model Training
Kategorie: Data Transformation
Optimize Deep Learning: Tune PyTorch Models

Optimize Deep Learning: Tune PyTorch Models

KURS 2, 4 Stunden

Was Sie lernen werden

  • Use PyTorch Lightning to implement callbacks, diagnose instabilities, and optimize model performance.

Kompetenzen, die Sie erwerben

Kategorie: Model Training
Kategorie: Fine-tuning
Kategorie: Debugging
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Model Optimization
Kategorie: PyTorch (Machine Learning Library)
Kategorie: Performance Tuning
Kategorie: Transfer Learning
Kategorie: Deep Learning
Kategorie: Scalability
Kategorie: Model Deployment
Kategorie: Artificial Neural Networks
Evaluate & Optimize LLM Performance

Evaluate & Optimize LLM Performance

KURS 3, 4 Stunden

Was Sie lernen werden

  • Evaluate LLMs using metrics like BLEU & ROUGE run A/B tests for statistical significance, and optimize model performance with data-driven strategies.

Kompetenzen, die Sie erwerben

Kategorie: Statistical Analysis
Kategorie: Model Evaluation
Kategorie: Test Script Development
Kategorie: Statistical Inference
Kategorie: Statistical Methods
Kategorie: Probability & Statistics
Kategorie: Large Language Modeling
Kategorie: Model Optimization
Kategorie: Scripting
Kategorie: LLM Application
Kategorie: Performance Metric
Kategorie: Prompt Engineering
Kategorie: Statistical Hypothesis Testing
Kategorie: Embeddings
Kategorie: Data-Driven Decision-Making
Kategorie: Natural Language Processing
Analyze Logs: Fix LLM Hallucinations

Analyze Logs: Fix LLM Hallucinations

KURS 4, 4 Stunden

Was Sie lernen werden

  • Use data analysis to diagnose LLM hallucinations by correlating user behavior and system errors, and document findings to guide engineering fixes.

Kompetenzen, die Sie erwerben

Kategorie: Analysis
Kategorie: Large Language Modeling
Kategorie: Debugging
Kategorie: Pandas (Python Package)
Kategorie: Correlation Analysis
Kategorie: Business Metrics
Kategorie: Technical Communication
Kategorie: Artificial Intelligence
Kategorie: LLM Application
Kategorie: Root Cause Analysis
Kategorie: Generative AI
Kategorie: Retrieval-Augmented Generation
Kategorie: Data Analysis
Kategorie: Data Manipulation
Evaluate LLMs: Test and Prove Significance

Evaluate LLMs: Test and Prove Significance

KURS 5, 3 Stunden

Was Sie lernen werden

  • Rigorously evaluate LLM performance using statistical tests and confidence intervals to make data-driven deployment decisions.

Kompetenzen, die Sie erwerben

Kategorie: Model Evaluation
Kategorie: Data-Driven Decision-Making
Kategorie: Statistical Hypothesis Testing
Kategorie: Large Language Modeling
Kategorie: Statistics
Kategorie: Statistical Visualization
Kategorie: Matplotlib
Kategorie: Statistical Programming
Kategorie: Statistical Analysis
Kategorie: Model Deployment
Kategorie: Data Presentation
Kategorie: Statistical Software
Kategorie: Data Storytelling
Kategorie: Statistical Inference
Kategorie: Experimentation
Kategorie: Performance Metric
Kategorie: Statistical Methods
Kategorie: Scientific Visualization
Optimize SQL: Build Fast Data Pipelines

Optimize SQL: Build Fast Data Pipelines

KURS 6, 3 Stunden

Was Sie lernen werden

  • Parameterized SQL with CTEs and window functions builds scalable, maintainable pipelines that adapt as business needs change.

  • Query optimization is systematic: analyze execution plans, find costly steps, then resolve them with indexing or rewrites.

  • Materialized summary tables and well-timed processing, like morning refreshes, support reliable analytics infrastructure.

  • Understanding execution internals helps analysts build self-sufficient workflows without recurring engineering delays.

Kompetenzen, die Sie erwerben

Kategorie: Performance Tuning
Kategorie: SQL
Kategorie: Data Transformation
Kategorie: Data Manipulation
Kategorie: Data Pipelines
Kategorie: Extract, Transform, Load
Kategorie: Scripting
Kategorie: Database Management
Kategorie: Query Languages
Safeguard LLM Outputs: Test and Evaluate

Safeguard LLM Outputs: Test and Evaluate

KURS 7, 3 Stunden

Was Sie lernen werden

  • Build and validate a robust safety testing framework for LLMs. Create behavioral test suites and use mutation testing to ensure their effectiveness.

Kompetenzen, die Sie erwerben

Kategorie: Security Testing
Kategorie: Responsible AI
Kategorie: Unit Testing
Kategorie: AI Security
Kategorie: Prompt Patterns
Kategorie: Test Script Development
Kategorie: LLM Application
Kategorie: Software Testing
Kategorie: Quality Assessment
Kategorie: Code Coverage
Kategorie: Software Technical Review
Kategorie: Prompt Engineering
Kategorie: Maintainability
Kategorie: Verification And Validation
Kategorie: Test Tools
Kategorie: Testability
Kategorie: Test Case
Kategorie: Threat Modeling
Kategorie: Model Evaluation
Kategorie: Large Language Modeling
Track and Evaluate ML Model Experiments

Track and Evaluate ML Model Experiments

KURS 8, 3 Stunden

Was Sie lernen werden

  • Track, version, and evaluate ML experiments using DVC and W&B to reliably select and prepare models for production deployment.

Kompetenzen, die Sie erwerben

Kategorie: Version Control
Kategorie: Model Evaluation
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Data Management
Kategorie: Predictive Modeling
Kategorie: Performance Analysis
Kategorie: Interactive Data Visualization
Kategorie: Dashboard
Kategorie: Model Deployment
Kategorie: Record Keeping
Kategorie: Large Language Modeling
Kategorie: Machine Learning
Kategorie: Model Training
Automate Cloud Workflows with Python Scripting

Automate Cloud Workflows with Python Scripting

KURS 9, 1 Stunde

Was Sie lernen werden

  • Create automated Python scripts to manage multi-step cloud workflows, from provisioning resources to persisting data.

Kompetenzen, die Sie erwerben

Kategorie: Scripting
Kategorie: AI Workflows
Kategorie: Data Pipelines
Kategorie: Virtual Machines
Kategorie: Python Programming
Kategorie: Infrastructure as Code (IaC)
Kategorie: Command-Line Interface
Kategorie: Data Persistence
Automate Data Pipelines: Schema Evolution

Automate Data Pipelines: Schema Evolution

KURS 10, 2 Stunden

Was Sie lernen werden

  • Build automated data pipelines with Apache Airflow, manage schema evolution to prevent failures, and implement monitoring for data integrity.

Kompetenzen, die Sie erwerben

Kategorie: Data Pipelines
Kategorie: Data Integrity
Kategorie: Apache Airflow
Kategorie: Data Transformation
Kategorie: System Monitoring
Kategorie: Data Validation
Kategorie: Data Modeling
Kategorie: Extract, Transform, Load
Kategorie: Continuous Monitoring
Kategorie: Data Quality
Develop and Evaluate LLM Features Effectively

Develop and Evaluate LLM Features Effectively

KURS 11, 3 Stunden

Was Sie lernen werden

  • Translate an LLM product concept into a detailed PRD and create a UAT plan to validate that the delivered feature meets user requirements.

Kompetenzen, die Sie erwerben

Kategorie: User Acceptance Testing (UAT)
Kategorie: User Story
Kategorie: Test Planning
Kategorie: AI Product Strategy
Kategorie: Requirements Analysis
Kategorie: Prioritization
Kategorie: Verification And Validation
Kategorie: Large Language Modeling
Kategorie: User Requirements Documents
Kategorie: Functional Testing
Kategorie: Product Requirements
Kategorie: Business Requirements
Kategorie: Acceptance Testing
Kategorie: LLM Application
Kategorie: Functional Requirement
Kategorie: Key Performance Indicators (KPIs)
Document and Evaluate LLM Prompting Success

Document and Evaluate LLM Prompting Success

KURS 12, 2 Stunden

Was Sie lernen werden

  • Create operational run-books for LLM systems and evaluate prompt patterns to improve performance and reduce operational costs.

Kompetenzen, die Sie erwerben

Kategorie: Prompt Engineering
Kategorie: Prompt Patterns
Kategorie: Large Language Modeling
Kategorie: Technical Documentation
Kategorie: Configuration Management
Kategorie: Benchmarking
Kategorie: Retrieval-Augmented Generation
Kategorie: Performance Testing
Kategorie: Technical Writing
Kategorie: Token Optimization
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Model Optimization
Kategorie: Performance Tuning
Kategorie: LLM Application
Kategorie: Data Maintenance
Kategorie: Requirements Analysis
Optimize LLM Costs & Streamline Processes

Optimize LLM Costs & Streamline Processes

KURS 13, 2 Stunden

Was Sie lernen werden

  • Optimize LLM costs by analyzing spend reports and streamline ML pipelines using value-stream mapping to boost efficiency and reduce cycle times.

Kompetenzen, die Sie erwerben

Kategorie: Model Optimization
Kategorie: Process Improvement and Optimization
Kategorie: Cost Management
Kategorie: Waste Minimization
Kategorie: Process Analysis
Kategorie: Productivity Software
Kategorie: Collaborative Software
Kategorie: Process Modeling
Kategorie: AI Workflows
Kategorie: Proposal Development
Kategorie: LLM Application
Kategorie: Business Workflow Analysis
Kategorie: Miro AI
Kategorie: Operating Cost
Kategorie: Data-Driven Decision-Making
Kategorie: Lean Manufacturing
Kategorie: Process Optimization

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

John Whitworth
30 Kurse3.057 Lernende
LearningMate
275 Kurse29.630 Lernende

von

Coursera

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Häufig gestellte Fragen