28DIGITAL

Problem-Dependent Resampling Techniques

kurs ist nicht verfügbar in Deutsch (Deutschland)

Wir übersetzen es in weitere Sprachen.
28DIGITAL

Problem-Dependent Resampling Techniques

Jonne Pohjankukka
Asja Kamenica

Dozenten: Jonne Pohjankukka

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

6 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Stufe Mittel

Empfohlene Erfahrung

6 Stunden zu vervollständigen
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Apply spatial cross-validation to account for spatial autocorrelation

  • Adapt performance evaluation methods for structured data relationships

  • Use statistical tests such as Wilcoxon and permutation tests to assess significance

  • Critically evaluate reported machine learning performance results

Kompetenzen, die Sie erwerben

  • Kategorie: Spatial Analysis
  • Kategorie: Sampling (Statistics)
  • Kategorie: Data Synthesis
  • Kategorie: Machine Learning Algorithms
  • Kategorie: Statistical Methods
  • Kategorie: Spatial Data Analysis
  • Kategorie: Analytical Skills
  • Kategorie: Statistical Hypothesis Testing
  • Kategorie: Machine Learning
  • Kategorie: Applied Machine Learning
  • Kategorie: Analysis
  • Kategorie: Feature Engineering
  • Kategorie: Analytics
  • Kategorie: Model Evaluation
  • Kategorie: Sample Size Determination
  • Kategorie: Drug Interaction
  • Kategorie: Correlation Analysis
  • Kategorie: Data Processing
  • Kategorie: Dependency Analysis

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Kürzlich aktualisiert!

April 2026

Bewertungen

4 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

 Logos von Petrobras, TATA, Danone, Capgemini, P&G und L'Oreal

In diesem Kurs gibt es 3 Module

In the first module, we describe how cross-validation based model performance estimation can produce optimistic results with spatial data sets. We discuss how the inherent property called spatial autocorrelation in geographical data sets causes an optimistic bias in the cross-validation procedure, and how should this problem be tackled. To take into account the effects of spatial autocorrelation, we discuss the modified version of cross-validation, the spatial cross-validation designed for evaluating model prediction performance with spatial data sets. Furthermore, we present the motivation behind spatial cross-validation from industry perspective, and how the method can be utilized in data sampling.

Das ist alles enthalten

6 Videos1 Lektüre2 Aufgaben1 Diskussionsthema

Pair-input data are encountered in many applications and have unique properties that need to be taken into account. In this module, we first discuss what pair-input data are and what key characteristics they have, introducing drug-target interactions as an example. We then examine how dependencies emerge between pair-input observations and discuss how those dependencies can be used to characterize pair-input observations. Building on this categorization, we finally explore how to modify performance evaluation methods to obtain reliable estimates of out-of-sample prediction performance for pair-input data. The modifications to the selection of training observations are mathematically formulated.

Das ist alles enthalten

5 Videos1 Aufgabe1 Diskussionsthema

In this module, we will learn how to determine suitable statistical tests for given machine learning tasks. As an example, we will go through the well-known Wilcoxon test for classifier evaluation. We will also learn about some of the common pitfalls we can fall into if we are not careful in model performance estimation. We see how it is possible to get a very good model performance estimations even though there is no existing pattern in the data. In addition, we will learn how careless feature selection can cause optimistically biased performance estimation in cross-validation. Lastly, we go through the permutation test which allows us to measure the statistical significance of our model performance estimate.

Das ist alles enthalten

5 Videos1 Aufgabe1 Diskussionsthema

Dozenten

Jonne Pohjankukka
28DIGITAL
3 Kurse8 Lernende

von

28DIGITAL

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.

Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“

Jennifer J.

Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“

Larry W.

Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“

Chaitanya A.

„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Coursera Plus

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen