Coursera

Spezialisierung „LLM Optimization & Evaluation“

spezialisierung ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Coursera

Spezialisierung „LLM Optimization & Evaluation“

Optimize & Deploy Production-Ready LLM Systems.

Build expertise in LLM evaluation, optimization, and deployment through hands-on MLOps projects.

John Whitworth
LearningMate

Dozenten: John Whitworth

Bei Coursera Plus enthalten

Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Evaluate and optimize LLM performance using statistical testing, MLOps tools, and production monitoring systems.

  • Build automated pipelines for feature engineering, experiment tracking, and data processing with industry-standard tools.

  • Diagnose LLM errors, implement safety frameworks, and reduce operational costs through systematic analysis.

Kompetenzen, die Sie erwerben

  • Kategorie: AI Security
  • Kategorie: Data Pipelines
  • Kategorie: Data Presentation
  • Kategorie: Extract, Transform, Load
  • Kategorie: Fine-tuning
  • Kategorie: Large Language Modeling
  • Kategorie: LLM Application
  • Kategorie: MLOps (Machine Learning Operations)
  • Kategorie: Model Optimization
  • Kategorie: Performance Tuning
  • Kategorie: Prompt Patterns
  • Kategorie: Root Cause Analysis
  • Kategorie: Scripting
  • Kategorie: SQL
  • Kategorie: Statistical Analysis
  • Kategorie: Technical Communication
  • Kategorie: Technical Documentation
  • Kategorie: User Acceptance Testing (UAT)
  • Kategorie: Version Control

Werkzeuge, die Sie lernen werden

  • Kategorie: Apache Airflow
  • Kategorie: Python Programming

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Englisch
Kürzlich aktualisiert!

Dezember 2025

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse.

  • Erlernen Sie gefragte Kompetenzen von Universitäten und Branchenexperten.
  • Erlernen Sie ein Thema oder ein Tool mit echten Projekten.
  • Entwickeln Sie ein fundiertes Verständnisse der Kernkonzepte.
  • Erwerben Sie ein Karrierezertifikat von Coursera.

Spezialisierung - 13 Kursreihen

Engineer Features and Evaluate Models for Production

Engineer Features and Evaluate Models for Production

KURS 1, 3 Stunden

Was Sie lernen werden

  • Build feature engineering pipelines and evaluate ML experiments using MLOps tools to select and deploy production-ready models.

Kompetenzen, die Sie erwerben

Kategorie: Feature Engineering
Kategorie: Technical Writing
Kategorie: Analysis
Kategorie: Model Evaluation
Kategorie: Machine Learning Methods
Kategorie: Model Deployment
Kategorie: Data Pipelines
Kategorie: Model Training
Kategorie: Performance Analysis
Kategorie: Data Preprocessing
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Model Optimization
Kategorie: Data Transformation
Optimize Deep Learning: Tune PyTorch Models

Optimize Deep Learning: Tune PyTorch Models

KURS 2, 4 Stunden

Was Sie lernen werden

  • Use PyTorch Lightning to implement callbacks, diagnose instabilities, and optimize model performance.

Kompetenzen, die Sie erwerben

Kategorie: Fine-tuning
Kategorie: Debugging
Kategorie: Model Training
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Model Optimization
Kategorie: Scalability
Kategorie: Model Deployment
Kategorie: Deep Learning
Kategorie: PyTorch (Machine Learning Library)
Kategorie: Performance Tuning
Kategorie: Artificial Neural Networks
Kategorie: Transfer Learning
Evaluate & Optimize LLM Performance

Evaluate & Optimize LLM Performance

KURS 3, 4 Stunden

Was Sie lernen werden

  • Evaluate LLMs using metrics like BLEU & ROUGE run A/B tests for statistical significance, and optimize model performance with data-driven strategies.

Kompetenzen, die Sie erwerben

Kategorie: Statistical Methods
Kategorie: Test Script Development
Kategorie: Statistical Analysis
Kategorie: Statistical Inference
Kategorie: Model Evaluation
Kategorie: Scripting
Kategorie: Data-Driven Decision-Making
Kategorie: Performance Metric
Kategorie: Probability & Statistics
Kategorie: Embeddings
Kategorie: Statistical Hypothesis Testing
Kategorie: Natural Language Processing
Kategorie: Model Optimization
Kategorie: Large Language Modeling
Kategorie: LLM Application
Kategorie: Prompt Engineering
Analyze Logs: Fix LLM Hallucinations

Analyze Logs: Fix LLM Hallucinations

KURS 4, 4 Stunden

Was Sie lernen werden

  • Use data analysis to diagnose LLM hallucinations by correlating user behavior and system errors, and document findings to guide engineering fixes.

Kompetenzen, die Sie erwerben

Kategorie: Analysis
Kategorie: Large Language Modeling
Kategorie: LLM Application
Kategorie: Root Cause Analysis
Kategorie: Technical Communication
Kategorie: Artificial Intelligence
Kategorie: Correlation Analysis
Kategorie: Data Analysis
Kategorie: Pandas (Python Package)
Kategorie: Generative AI
Kategorie: Retrieval-Augmented Generation
Kategorie: Debugging
Kategorie: Data Manipulation
Kategorie: Business Metrics
Evaluate LLMs: Test and Prove Significance

Evaluate LLMs: Test and Prove Significance

KURS 5, 3 Stunden

Was Sie lernen werden

  • Rigorously evaluate LLM performance using statistical tests and confidence intervals to make data-driven deployment decisions.

Kompetenzen, die Sie erwerben

Kategorie: Model Evaluation
Kategorie: Statistical Visualization
Kategorie: Large Language Modeling
Kategorie: Statistical Software
Kategorie: Performance Metric
Kategorie: Statistical Methods
Kategorie: Data-Driven Decision-Making
Kategorie: Statistical Programming
Kategorie: Statistical Analysis
Kategorie: Matplotlib
Kategorie: Data Presentation
Kategorie: Scientific Visualization
Kategorie: Model Deployment
Kategorie: Statistical Inference
Kategorie: Statistical Hypothesis Testing
Kategorie: Statistics
Kategorie: Data Storytelling
Kategorie: Experimentation
Optimize SQL: Build Fast Data Pipelines

Optimize SQL: Build Fast Data Pipelines

KURS 6, 3 Stunden

Was Sie lernen werden

  • Parameterized SQL with CTEs and window functions builds scalable, maintainable pipelines that adapt as business needs change.

  • Query optimization is systematic: analyze execution plans, find costly steps, then resolve them with indexing or rewrites.

  • Materialized summary tables and well-timed processing, like morning refreshes, support reliable analytics infrastructure.

  • Understanding execution internals helps analysts build self-sufficient workflows without recurring engineering delays.

Kompetenzen, die Sie erwerben

Kategorie: Performance Tuning
Kategorie: SQL
Kategorie: Scripting
Kategorie: Database Management
Kategorie: Extract, Transform, Load
Kategorie: Query Languages
Kategorie: Data Transformation
Kategorie: Data Manipulation
Kategorie: Data Pipelines
Safeguard LLM Outputs: Test and Evaluate

Safeguard LLM Outputs: Test and Evaluate

KURS 7, 3 Stunden

Was Sie lernen werden

  • Build and validate a robust safety testing framework for LLMs. Create behavioral test suites and use mutation testing to ensure their effectiveness.

Kompetenzen, die Sie erwerben

Kategorie: Security Testing
Kategorie: Software Testing
Kategorie: Test Case
Kategorie: AI Security
Kategorie: Unit Testing
Kategorie: Test Script Development
Kategorie: Prompt Patterns
Kategorie: Model Evaluation
Kategorie: Responsible AI
Kategorie: Prompt Engineering
Kategorie: Code Coverage
Kategorie: Large Language Modeling
Kategorie: LLM Application
Kategorie: Verification And Validation
Kategorie: Threat Modeling
Kategorie: Test Tools
Kategorie: Maintainability
Kategorie: Quality Assessment
Kategorie: Testability
Kategorie: Software Technical Review
Track and Evaluate ML Model Experiments

Track and Evaluate ML Model Experiments

KURS 8, 3 Stunden

Was Sie lernen werden

  • Track, version, and evaluate ML experiments using DVC and W&B to reliably select and prepare models for production deployment.

Kompetenzen, die Sie erwerben

Kategorie: Model Evaluation
Kategorie: Version Control
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Model Deployment
Kategorie: Data Management
Kategorie: Large Language Modeling
Kategorie: Record Keeping
Kategorie: Machine Learning
Kategorie: Dashboard
Kategorie: Performance Analysis
Kategorie: Interactive Data Visualization
Kategorie: Predictive Modeling
Kategorie: Model Training
Automate Cloud Workflows with Python Scripting

Automate Cloud Workflows with Python Scripting

KURS 9, 1 Stunde

Was Sie lernen werden

  • Create automated Python scripts to manage multi-step cloud workflows, from provisioning resources to persisting data.

Kompetenzen, die Sie erwerben

Kategorie: Scripting
Kategorie: Python Programming
Kategorie: AI Workflows
Kategorie: Data Pipelines
Kategorie: Data Persistence
Kategorie: Command-Line Interface
Kategorie: Infrastructure as Code (IaC)
Kategorie: Virtual Machines
Automate Data Pipelines: Schema Evolution

Automate Data Pipelines: Schema Evolution

KURS 10, 2 Stunden

Was Sie lernen werden

  • Build automated data pipelines with Apache Airflow, manage schema evolution to prevent failures, and implement monitoring for data integrity.

Kompetenzen, die Sie erwerben

Kategorie: Data Pipelines
Kategorie: Data Integrity
Kategorie: Apache Airflow
Kategorie: Data Validation
Kategorie: Continuous Monitoring
Kategorie: System Monitoring
Kategorie: Data Modeling
Kategorie: Extract, Transform, Load
Kategorie: Data Quality
Kategorie: Data Transformation
Develop and Evaluate LLM Features Effectively

Develop and Evaluate LLM Features Effectively

KURS 11, 3 Stunden

Was Sie lernen werden

  • Translate an LLM product concept into a detailed PRD and create a UAT plan to validate that the delivered feature meets user requirements.

Kompetenzen, die Sie erwerben

Kategorie: User Acceptance Testing (UAT)
Kategorie: Test Planning
Kategorie: User Story
Kategorie: Product Requirements
Kategorie: Acceptance Testing
Kategorie: User Requirements Documents
Kategorie: Business Requirements
Kategorie: Prioritization
Kategorie: Verification And Validation
Kategorie: Functional Testing
Kategorie: Functional Requirement
Kategorie: Requirements Analysis
Kategorie: Key Performance Indicators (KPIs)
Kategorie: LLM Application
Kategorie: Large Language Modeling
Kategorie: AI Product Strategy
Document and Evaluate LLM Prompting Success

Document and Evaluate LLM Prompting Success

KURS 12, 2 Stunden

Was Sie lernen werden

  • Create operational run-books for LLM systems and evaluate prompt patterns to improve performance and reduce operational costs.

Kompetenzen, die Sie erwerben

Kategorie: Prompt Patterns
Kategorie: Prompt Engineering
Kategorie: Technical Documentation
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Benchmarking
Kategorie: LLM Application
Kategorie: Technical Writing
Kategorie: Large Language Modeling
Kategorie: Performance Tuning
Kategorie: Performance Testing
Kategorie: Data Maintenance
Kategorie: Model Optimization
Kategorie: Configuration Management
Kategorie: Requirements Analysis
Kategorie: Token Optimization
Kategorie: Retrieval-Augmented Generation
Optimize LLM Costs & Streamline Processes

Optimize LLM Costs & Streamline Processes

KURS 13, 2 Stunden

Was Sie lernen werden

  • Optimize LLM costs by analyzing spend reports and streamline ML pipelines using value-stream mapping to boost efficiency and reduce cycle times.

Kompetenzen, die Sie erwerben

Kategorie: Process Improvement and Optimization
Kategorie: Model Optimization
Kategorie: Collaborative Software
Kategorie: Productivity Software
Kategorie: Proposal Development
Kategorie: Operating Cost
Kategorie: Waste Minimization
Kategorie: Business Workflow Analysis
Kategorie: Miro AI
Kategorie: Cost Management
Kategorie: Process Modeling
Kategorie: AI Workflows
Kategorie: Lean Manufacturing
Kategorie: Data-Driven Decision-Making
Kategorie: Process Optimization
Kategorie: LLM Application
Kategorie: Process Analysis

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

John Whitworth
29 Kurse2.529 Lernende
LearningMate
275 Kurse23.250 Lernende

von

Coursera

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Coursera Plus

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen