Coursera

Spezialisierung „LLM Optimization & Evaluation“

spezialisierung ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
Coursera

Spezialisierung „LLM Optimization & Evaluation“

Optimize & Deploy Production-Ready LLM Systems.

Build expertise in LLM evaluation, optimization, and deployment through hands-on MLOps projects.

John Whitworth
LearningMate

Dozenten: John Whitworth

Bei Coursera Plus enthalten

Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Befassen Sie sich eingehend mit einem Thema
Stufe Mittel

Empfohlene Erfahrung

4 Wochen zu vervollständigen
unter 10 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Evaluate and optimize LLM performance using statistical testing, MLOps tools, and production monitoring systems.

  • Build automated pipelines for feature engineering, experiment tracking, and data processing with industry-standard tools.

  • Diagnose LLM errors, implement safety frameworks, and reduce operational costs through systematic analysis.

Kompetenzen, die Sie erwerben

  • Kategorie: AI Security
  • Kategorie: Data Pipelines
  • Kategorie: Data Presentation
  • Kategorie: Extract, Transform, Load
  • Kategorie: Fine-tuning
  • Kategorie: Large Language Modeling
  • Kategorie: LLM Application
  • Kategorie: MLOps (Machine Learning Operations)
  • Kategorie: Model Optimization
  • Kategorie: Performance Tuning
  • Kategorie: Prompt Patterns
  • Kategorie: Root Cause Analysis
  • Kategorie: Scripting
  • Kategorie: SQL
  • Kategorie: Statistical Analysis
  • Kategorie: Technical Communication
  • Kategorie: Technical Documentation
  • Kategorie: User Acceptance Testing (UAT)
  • Kategorie: Version Control

Werkzeuge, die Sie lernen werden

  • Kategorie: Apache Airflow
  • Kategorie: Python Programming

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Englisch
Kürzlich aktualisiert!

Dezember 2025

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

Erweitern Sie Ihre Fachkenntnisse.

  • Erlernen Sie gefragte Kompetenzen von Universitäten und Branchenexperten.
  • Erlernen Sie ein Thema oder ein Tool mit echten Projekten.
  • Entwickeln Sie ein fundiertes Verständnisse der Kernkonzepte.
  • Erwerben Sie ein Karrierezertifikat von Coursera.

Spezialisierung - 13 Kursreihen

Engineer Features and Evaluate Models for Production

Engineer Features and Evaluate Models for Production

KURS 1, 3 Stunden

Was Sie lernen werden

  • Build feature engineering pipelines and evaluate ML experiments using MLOps tools to select and deploy production-ready models.

Kompetenzen, die Sie erwerben

Kategorie: Analysis
Kategorie: Model Evaluation
Kategorie: Feature Engineering
Kategorie: Technical Writing
Kategorie: Model Optimization
Kategorie: Data Transformation
Kategorie: Model Training
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Performance Analysis
Kategorie: Machine Learning Methods
Kategorie: Data Pipelines
Kategorie: Data Preprocessing
Kategorie: Model Deployment
Optimize Deep Learning: Tune PyTorch Models

Optimize Deep Learning: Tune PyTorch Models

KURS 2, 4 Stunden

Was Sie lernen werden

  • Use PyTorch Lightning to implement callbacks, diagnose instabilities, and optimize model performance.

Kompetenzen, die Sie erwerben

Kategorie: Model Training
Kategorie: Fine-tuning
Kategorie: Debugging
Kategorie: Scalability
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Model Optimization
Kategorie: Artificial Neural Networks
Kategorie: Transfer Learning
Kategorie: Deep Learning
Kategorie: Performance Tuning
Kategorie: PyTorch (Machine Learning Library)
Kategorie: Model Deployment
Evaluate & Optimize LLM Performance

Evaluate & Optimize LLM Performance

KURS 3, 4 Stunden

Was Sie lernen werden

  • Evaluate LLMs using metrics like BLEU & ROUGE run A/B tests for statistical significance, and optimize model performance with data-driven strategies.

Kompetenzen, die Sie erwerben

Kategorie: Statistical Methods
Kategorie: Statistical Inference
Kategorie: Statistical Analysis
Kategorie: Test Script Development
Kategorie: Model Evaluation
Kategorie: Data-Driven Decision-Making
Kategorie: Large Language Modeling
Kategorie: Performance Metric
Kategorie: Scripting
Kategorie: Probability & Statistics
Kategorie: Model Optimization
Kategorie: Embeddings
Kategorie: LLM Application
Kategorie: Statistical Hypothesis Testing
Kategorie: Natural Language Processing
Kategorie: Prompt Engineering
Analyze Logs: Fix LLM Hallucinations

Analyze Logs: Fix LLM Hallucinations

KURS 4, 4 Stunden

Was Sie lernen werden

  • Use data analysis to diagnose LLM hallucinations by correlating user behavior and system errors, and document findings to guide engineering fixes.

Kompetenzen, die Sie erwerben

Kategorie: Analysis
Kategorie: Data Analysis
Kategorie: Technical Communication
Kategorie: LLM Application
Kategorie: Business Metrics
Kategorie: Correlation Analysis
Kategorie: Pandas (Python Package)
Kategorie: Large Language Modeling
Kategorie: Retrieval-Augmented Generation
Kategorie: Generative AI
Kategorie: Artificial Intelligence
Kategorie: Data Manipulation
Kategorie: Root Cause Analysis
Kategorie: Debugging
Evaluate LLMs: Test and Prove Significance

Evaluate LLMs: Test and Prove Significance

KURS 5, 3 Stunden

Was Sie lernen werden

  • Rigorously evaluate LLM performance using statistical tests and confidence intervals to make data-driven deployment decisions.

Kompetenzen, die Sie erwerben

Kategorie: Model Evaluation
Kategorie: Data-Driven Decision-Making
Kategorie: Statistical Visualization
Kategorie: Matplotlib
Kategorie: Experimentation
Kategorie: Statistical Software
Kategorie: Performance Metric
Kategorie: Statistical Methods
Kategorie: Data Presentation
Kategorie: Statistical Hypothesis Testing
Kategorie: Statistical Programming
Kategorie: Statistics
Kategorie: Statistical Inference
Kategorie: Scientific Visualization
Kategorie: Data Storytelling
Kategorie: Model Deployment
Kategorie: Statistical Analysis
Kategorie: Large Language Modeling
Optimize SQL: Build Fast Data Pipelines

Optimize SQL: Build Fast Data Pipelines

KURS 6, 3 Stunden

Was Sie lernen werden

  • Parameterized SQL with CTEs and window functions builds scalable, maintainable pipelines that adapt as business needs change.

  • Query optimization is systematic: analyze execution plans, find costly steps, then resolve them with indexing or rewrites.

  • Materialized summary tables and well-timed processing, like morning refreshes, support reliable analytics infrastructure.

  • Understanding execution internals helps analysts build self-sufficient workflows without recurring engineering delays.

Kompetenzen, die Sie erwerben

Kategorie: Performance Tuning
Kategorie: SQL
Kategorie: Data Transformation
Kategorie: Database Management
Kategorie: Query Languages
Kategorie: Data Manipulation
Kategorie: Scripting
Kategorie: Data Pipelines
Kategorie: Extract, Transform, Load
Safeguard LLM Outputs: Test and Evaluate

Safeguard LLM Outputs: Test and Evaluate

KURS 7, 3 Stunden

Was Sie lernen werden

  • Build and validate a robust safety testing framework for LLMs. Create behavioral test suites and use mutation testing to ensure their effectiveness.

Kompetenzen, die Sie erwerben

Kategorie: Security Testing
Kategorie: Prompt Engineering
Kategorie: Large Language Modeling
Kategorie: Model Evaluation
Kategorie: Quality Assessment
Kategorie: Test Script Development
Kategorie: Test Case
Kategorie: LLM Application
Kategorie: Verification And Validation
Kategorie: Test Tools
Kategorie: Software Technical Review
Kategorie: Software Testing
Kategorie: Responsible AI
Kategorie: Threat Modeling
Kategorie: AI Security
Kategorie: Testability
Kategorie: Code Coverage
Kategorie: Maintainability
Kategorie: Prompt Patterns
Kategorie: Unit Testing
Track and Evaluate ML Model Experiments

Track and Evaluate ML Model Experiments

KURS 8, 3 Stunden

Was Sie lernen werden

  • Track, version, and evaluate ML experiments using DVC and W&B to reliably select and prepare models for production deployment.

Kompetenzen, die Sie erwerben

Kategorie: MLOps (Machine Learning Operations)
Kategorie: Version Control
Kategorie: Model Evaluation
Kategorie: Predictive Modeling
Kategorie: Performance Analysis
Kategorie: Large Language Modeling
Kategorie: Data Management
Kategorie: Interactive Data Visualization
Kategorie: Machine Learning
Kategorie: Record Keeping
Kategorie: Dashboard
Kategorie: Model Deployment
Kategorie: Model Training
Automate Cloud Workflows with Python Scripting

Automate Cloud Workflows with Python Scripting

KURS 9, 1 Stunde

Was Sie lernen werden

  • Create automated Python scripts to manage multi-step cloud workflows, from provisioning resources to persisting data.

Kompetenzen, die Sie erwerben

Kategorie: Scripting
Kategorie: Infrastructure as Code (IaC)
Kategorie: Data Persistence
Kategorie: AI Workflows
Kategorie: Python Programming
Kategorie: Virtual Machines
Kategorie: Command-Line Interface
Kategorie: Data Pipelines
Automate Data Pipelines: Schema Evolution

Automate Data Pipelines: Schema Evolution

KURS 10, 2 Stunden

Was Sie lernen werden

  • Build automated data pipelines with Apache Airflow, manage schema evolution to prevent failures, and implement monitoring for data integrity.

Kompetenzen, die Sie erwerben

Kategorie: Data Pipelines
Kategorie: Data Integrity
Kategorie: Apache Airflow
Kategorie: Data Transformation
Kategorie: Data Modeling
Kategorie: Continuous Monitoring
Kategorie: Data Validation
Kategorie: System Monitoring
Kategorie: Data Quality
Kategorie: Extract, Transform, Load
Develop and Evaluate LLM Features Effectively

Develop and Evaluate LLM Features Effectively

KURS 11, 3 Stunden

Was Sie lernen werden

  • Translate an LLM product concept into a detailed PRD and create a UAT plan to validate that the delivered feature meets user requirements.

Kompetenzen, die Sie erwerben

Kategorie: User Acceptance Testing (UAT)
Kategorie: User Requirements Documents
Kategorie: Prioritization
Kategorie: AI Product Strategy
Kategorie: Acceptance Testing
Kategorie: Product Requirements
Kategorie: Test Planning
Kategorie: LLM Application
Kategorie: Requirements Analysis
Kategorie: Business Requirements
Kategorie: Key Performance Indicators (KPIs)
Kategorie: Functional Requirement
Kategorie: Functional Testing
Kategorie: User Story
Kategorie: Large Language Modeling
Kategorie: Verification And Validation
Document and Evaluate LLM Prompting Success

Document and Evaluate LLM Prompting Success

KURS 12, 2 Stunden

Was Sie lernen werden

  • Create operational run-books for LLM systems and evaluate prompt patterns to improve performance and reduce operational costs.

Kompetenzen, die Sie erwerben

Kategorie: Prompt Patterns
Kategorie: Prompt Engineering
Kategorie: Data Maintenance
Kategorie: MLOps (Machine Learning Operations)
Kategorie: Benchmarking
Kategorie: Technical Writing
Kategorie: Requirements Analysis
Kategorie: Retrieval-Augmented Generation
Kategorie: Large Language Modeling
Kategorie: Token Optimization
Kategorie: LLM Application
Kategorie: Performance Testing
Kategorie: Model Optimization
Kategorie: Performance Tuning
Kategorie: Configuration Management
Kategorie: Technical Documentation
Optimize LLM Costs & Streamline Processes

Optimize LLM Costs & Streamline Processes

KURS 13, 2 Stunden

Was Sie lernen werden

  • Optimize LLM costs by analyzing spend reports and streamline ML pipelines using value-stream mapping to boost efficiency and reduce cycle times.

Kompetenzen, die Sie erwerben

Kategorie: Model Optimization
Kategorie: Process Improvement and Optimization
Kategorie: Process Analysis
Kategorie: Process Modeling
Kategorie: Collaborative Software
Kategorie: Lean Manufacturing
Kategorie: Waste Minimization
Kategorie: Operating Cost
Kategorie: Cost Management
Kategorie: LLM Application
Kategorie: Process Optimization
Kategorie: Business Workflow Analysis
Kategorie: AI Workflows
Kategorie: Productivity Software
Kategorie: Miro AI
Kategorie: Data-Driven Decision-Making
Kategorie: Proposal Development

Erwerben Sie ein Karrierezertifikat.

Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.

Dozenten

John Whitworth
29 Kurse2.529 Lernende
LearningMate
275 Kurse23.250 Lernende

von

Coursera

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Coursera Plus

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen