Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage
In diesem Kurs gibt es 6 Module
Dieser Kurs stellt eine leistungsstarke Reihe von Data Science Tools vor, die als Tidyverse bekannt sind. Tidyverse hat die Art und Weise revolutioniert, in der Datenwissenschaftler fast jeden Aspekt ihrer Arbeit erledigen. Wir werden die einfache Idee der "aufgeräumten Daten" behandeln und wie diese Idee dazu dient, Daten für die Analyse und Modellierung zu organisieren. Außerdem werden wir uns damit befassen, wie nicht aufgeräumte Daten in aufgeräumte Daten umgewandelt werden können, mit dem Lebenszyklus von Data Science-Projekten und dem Ökosystem der Tidyverse R-Pakete, die zur Durchführung eines Data Science-Projekts verwendet werden können.
Wenn Sie neu in der Datenwissenschaft sind, ist das Tidyverse-Ökosystem von R-Paketen eine hervorragende Möglichkeit, die verschiedenen Aspekte der Data Science-Pipeline kennenzulernen, vom Importieren der Daten über das Aufräumen der Daten in ein Format, mit dem man leicht arbeiten kann, bis hin zum Erforschen und Visualisieren der Daten und dem Anpassen von Machine Learning-Modellen. Wenn Sie bereits Erfahrung mit Data Science haben, bietet Ihnen Tidyverse ein leistungsstarkes System, mit dem Sie Ihre Arbeitsabläufe auf kohärente Weise rationalisieren können und das sich problemlos mit anderen Data Science-Tools verbinden lässt.
Für diesen Kurs ist es wichtig, dass Sie mit der Programmiersprache R vertraut sind. Wenn Sie noch nicht mit R vertraut sind, empfehlen wir Ihnen, zunächst R-Programmierung zu absolvieren, bevor Sie diesen Kurs besuchen.
Bevor wir all die Möglichkeiten erörtern können, mit denen R die Arbeit mit aufgeräumten Daten erleichtert, müssen wir zunächst wissen, was aufgeräumte Daten sind. Aufgeräumte Datensätze sind einfacher zu bearbeiten, zu modellieren und zu visualisieren, da die Grundsätze für aufgeräumte Daten, die wir in diesem Kurs besprechen werden, den Daten einen allgemeinen Rahmen und eine Reihe von konsistenten Regeln auferlegen. Ein bekanntes Zitat von Hadley Wickham lautet: "Aufgeräumte Datensätze sind alle gleich, aber jeder unordentliche Datensatz ist auf seine eigene Weise unordentlich." Die Verwendung eines konsistenten, aufgeräumten Datenformats ermöglicht die Entwicklung von Tools, die innerhalb dieses Rahmens gut funktionieren und letztlich die Datenverarbeitung, Visualisierung und Analyse vereinfachen. Wenn Sie mit Daten beginnen, die bereits in einem aufgeräumten Format vorliegen, oder wenn Sie sich zu Beginn eines Projekts die Zeit nehmen, die Daten in ein aufgeräumtes Format zu bringen, werden die verbleibenden Schritte Ihres Data Science-Projekts einfacher sein.
Das ist alles enthalten
6 Lektüren2 Aufgaben
Infos zu Modulinhalt anzeigen
6 Lektüren•Insgesamt 53 Minuten
Über diesen Kurs•3 Minuten
Daten Terminologie•10 Minuten
Grundsätze für aufgeräumte Daten•10 Minuten
Aufgeräumte Daten sind rechtwinklig•10 Minuten
Vorteile von Tidy Data•10 Minuten
Regeln für die Speicherung ordentlicher Daten•10 Minuten
2 Aufgaben•Insgesamt 60 Minuten
Quiz zu den Grundsätzen der Datenaufbereitung•30 Minuten
Quiz über die Regeln für aufgeräumte Daten•30 Minuten
Von Unaufgeräumt -> Aufgeräumt
Modul 2•1 Stunde abzuschließen
Moduldetails
Der Grund, warum es wichtig ist, darüber zu sprechen, was ordentliche Daten sind und wie sie aussehen, ist, dass die meisten Daten in der Welt da draußen unordentlich sind. Wenn Sie nicht derjenige sind, der die Daten eingibt, sondern wenn Sie die Daten von jemand anderem für ein Projekt erhalten, sind diese Daten in den meisten Fällen unordentlich. Unordentliche Daten werden oft einfach als unordentliche Daten bezeichnet. Um mit diesen Daten problemlos arbeiten zu können, müssen Sie sie in ein ordentliches Datenformat bringen. Das bedeutet, dass Sie unordentliche Daten genau erkennen und wissen müssen, wie Sie sie in ein ordentliches Format bringen können. Die folgenden häufigen Probleme, die in unordentlichen Datensätzen auftreten, stammen wiederum aus Hadley Wickhams Aufsatz über ordentliche Daten (http://vita.had.co.nz/papers/tidy-data.pdf). Nach einer kurzen Erläuterung der einzelnen Probleme werden wir uns einige unordentliche Datensätze ansehen. Schließlich werden wir uns mit den Konzepten für die Bereinigung unordentlicher Daten befassen, aber wir werden noch keine praktischen Übungen machen. Das kommt bald!
Das ist alles enthalten
3 Lektüren1 Aufgabe
Infos zu Modulinhalt anzeigen
3 Lektüren•Insgesamt 30 Minuten
Häufige Probleme mit unübersichtlichen Datensätzen•10 Minuten
Beispiele für unaufgeräumte Daten•10 Minuten
Unordentliche Daten aufräumen•10 Minuten
1 Aufgabe•Insgesamt 30 Minuten
Unordentliches Daten-Quiz•30 Minuten
Der Lebenszyklus der Datenwissenschaft & das Tidyverse Ökosystem
Modul 3•1 Stunde abzuschließen
Moduldetails
Mit einem soliden Verständnis von aufgeräumten Daten und wie aufgeräumte Daten in den Lebenszyklus der Datenwissenschaft passen, werden wir uns ein wenig Zeit nehmen, um Ihnen die tidyverse und tidyverse-verwandten Pakete vorzustellen, die wir in dieser Spezialisierung lehren und verwenden werden. Zusammen bilden diese Pakete das tidyverse-Ökosystem, wie wir es nennen. Im weiteren Verlauf dieses Kurses geht es nicht darum, dass Sie verstehen, wie jedes dieser Pakete zu verwenden ist (das kommt noch!), sondern vielmehr darum, dass Sie sich damit vertraut machen, welche Pakete in welchen Teil des Lebenszyklus der Datenwissenschaft passen. Beachten Sie, dass die offiziellen tidyverse-Pakete unten fett gedruckt sind. Alle anderen Pakete sind tidyverse-adjacent, d.h. sie folgen denselben Konventionen wie die offiziellen tidyverse-Pakete und funktionieren gut innerhalb des tidy-Rahmens und der Struktur der Datenanalyse.
Das ist alles enthalten
5 Lektüren
Infos zu Modulinhalt anzeigen
5 Lektüren•Insgesamt 50 Minuten
Der Lebenszyklus der Datenwissenschaft•10 Minuten
Daten in R einlesen•10 Minuten
Daten aufräumen•10 Minuten
Datenvisualisierung•10 Minuten
Datenmodellierung•10 Minuten
Organisation und Arbeitsabläufe von Data Science-Projekten
Modul 4•2 Stunden abzuschließen
Moduldetails
Data-Science-Projekte sind sehr unterschiedlich, so dass es schwierig sein kann, allgemeingültige Regeln für ihre Organisation aufzustellen. Es gibt jedoch einige Möglichkeiten, Projekte zu organisieren, die im Allgemeinen nützlich sind. Insbesondere haben fast alle Projekte mit verschiedenen Arten von Dateien zu tun - Datendateien, Codedateien, Ausgabedateien usw. In diesem Abschnitt erfahren Sie, wie Dateien funktionieren und wie Projekte organisiert und angepasst werden können.
Das ist alles enthalten
6 Lektüren2 Aufgaben
Infos zu Modulinhalt anzeigen
6 Lektüren•Insgesamt 70 Minuten
RStudio Projekte•10 Minuten
Dateipfade•10 Minuten
Das Paket hier•10 Minuten
Dateibenennung•20 Minuten
Projektvorlage: Alles an seinem Platz•10 Minuten
Datenwissenschaftliche Arbeitsabläufe•10 Minuten
2 Aufgaben•Insgesamt 60 Minuten
Dateibenennung und hier Paket-Quiz•30 Minuten
Quiz zur Projektorganisation•30 Minuten
Fallstudien
Modul 5•1 Stunde abzuschließen
Moduldetails
In dieser Specialization werden wir eine Reihe von Fallstudien aus Open Case Studies verwenden, um die im Kurs vorgestellten Konzepte zu demonstrieren. Im Allgemeinen werden wir während der gesamten Spezialisierung dieselben Fallstudien verwenden, um Kontinuität zu gewährleisten, damit Sie sich auf die Konzepte und Fähigkeiten konzentrieren können, die gelehrt werden (und nicht auf den Kontext), während Sie mit interessanten Daten arbeiten. Diese Fallstudien befassen sich mit einer Frage des öffentlichen Gesundheitswesens und verwenden allesamt echte Daten.
Das ist alles enthalten
2 Lektüren2 Unbewertete Labore
Infos zu Modulinhalt anzeigen
2 Lektüren•Insgesamt 20 Minuten
Fallstudie 1: Gesundheitsausgaben•10 Minuten
Fallstudie #2: Schusswaffen•10 Minuten
2 Unbewertete Labore•Insgesamt 20 Minuten
Gesundheitsausgaben RStudio Lab•10 Minuten
Schusswaffen Fallstudie RStudio Lab•10 Minuten
Projekt: Organisation eines neuen Data Science-Projekts
Modul 6•1 Stunde abzuschließen
Moduldetails
Dieses Projekt ermöglicht es Ihnen, ein neues Projekt zu erstellen und die Dateien zu organisieren, die für eine zukünftige Datenanalyse benötigt werden
Das ist alles enthalten
1 peer review
Infos zu Modulinhalt anzeigen
1 peer review•Insgesamt 60 Minuten
Einführung in das Tidyverse-Kursprojekt•60 Minuten
Erwerben Sie ein Karrierezertifikat.
Fügen Sie dieses Zeugnis Ihrem LinkedIn-Profil, Lebenslauf oder CV hinzu. Teilen Sie sie in Social Media und in Ihrer Leistungsbeurteilung.
Dozenten
Lehrkraftbewertungen
Lehrkraftbewertungen
Wir haben alle Lernenden um Feedback zu unseren Dozenten gebeten, ausgehend von der Qualität ihres Unterrichtsstils.
Die Aufgabe der Johns Hopkins University ist es, ihre Studenten auszubilden und ihre Fähigkeit zum lebenslangen Lernen zu fördern, unabhängige und originelle Forschung zu betreiben und der Welt den Nutzen von Entdeckungen zu bringen.
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Bewertungen von Lernenden
4.4
54 Bewertungen
5 stars
74,07 %
4 stars
12,96 %
3 stars
3,70 %
2 stars
1,85 %
1 star
7,40 %
Zeigt 3 von 54 an
D
DI
5·
Geprüft am 17. Apr. 2024
The course is a breeze to follow because it aligns seamlessly with the book. As such, rather than watching videos, you get to read the book; it's really a convenient approach.
Bravo!
D
DM
5·
Geprüft am 30. Okt. 2022
Covers really important concepts and procedures for managing data science projects. Very helpful.
Wann werde ich Zugang zu den Vorlesungen und Aufgaben haben?
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Was bekomme ich, wenn ich mich für diese Specialization einschreibe?
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Spezialisierung, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder Ihrem LinkedIn-Profil hinzufügen.
Ist finanzielle Hilfe verfügbar?
Ja. Für ausgewählte Lernprogramme können Sie finanzielle Unterstützung oder ein Stipendium beantragen, wenn Sie die Einschreibegebühr nicht aufbringen können. Wenn für das von Ihnen gewählte Lernprogramm eine finanzielle Unterstützung oder ein Stipendium verfügbar ist, finden Sie auf der Beschreibungsseite einen Link zur Beantragung.
Finanzielle Unterstützung verfügbar, weitere Informationen
¹ Einige Aufgaben in diesem Kurs werden mit AI bewertet. Für diese Aufgaben werden Ihre Daten in Übereinstimmung mit Datenschutzhinweis von Courseraverwendet.