Schreiben Sie ein Web-Scraping-Programm, um mit Hilfe von HTTP-Anfragen Daten aus einer HTML-Datei zu extrahieren und die Daten in einen Datenrahmen zu konvertieren.
Bereiten Sie Daten für die Modellierung vor, indem Sie fehlende Werte behandeln, Daten formatieren und normalisieren, binning und kategorische Werte in numerische Werte umwandeln.
Interpretieren Sie Daten mit explorativen Datenanalysetechniken, indem Sie deskriptive Statistiken berechnen, Daten grafisch darstellen und Korrelationsstatistiken erstellen.
Entwickeln Sie eine Shiny-App mit einer Leaflet-Karte und einem interaktiven Dashboard und erstellen Sie eine Präsentation über das Projekt, die Sie mit Ihren Kollegen teilen können.
Wenn Sie sich für diesen Kurs anmelden, müssen Sie auch ein bestimmtes Programm auswählen.
Lernen Sie neue Konzepte von Branchenexperten
Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
Erwerben Sie ein Berufszertifikat zur Vorlage
In diesem Kurs gibt es 6 Module
In diesem Capstone-Kurs wenden Sie verschiedene Data Science-Fähigkeiten und -Techniken an, die Sie im Rahmen der vorangegangenen Kurse der IBM Data Science with R Specialization oder des IBM Data Analytics with Excel and R Professional Certificate erlernt haben. Für dieses Projekt übernehmen Sie die Rolle eines Data Scientist, der vor kurzem in ein Unternehmen eingetreten ist und mit einer Aufgabe konfrontiert wird, die Datenerfassung, Analyse, grundlegende Hypothesentests, Visualisierung und Modellierung von realen Datensätzen erfordert. Sie werden Daten aus verschiedenen Quellen sammeln und verstehen, Daten mit Tidyverse aufbereiten, eine explorative Datenanalyse mit SQL, Tidyverse und ggplot2 durchführen, Daten mit linearer Regression modellieren, Diagramme und Plots zur Visualisierung der Daten erstellen und ein interaktives Dashboard aufbauen. Das Projekt wird mit einer Präsentation Ihres Datenanalyseberichts mit einer Zusammenfassung für die verschiedenen Interessengruppen im Unternehmen abgeschlossen.
In diesem Modul werden Sie mit dem Szenario des Abschlussprojekts und dem realen Problem, das Sie im Laufe des Kurses lösen werden, vertraut gemacht. Sie werden damit beginnen, die in früheren Kursen erlernten Datenerfassungstechniken anzuwenden, um Projektdaten aus verschiedenen Quellen zu sammeln. Sie werden Daten mithilfe von Web-Scraping-Methoden sammeln, um Informationen aus HTML-Seiten zu extrahieren, und API-Anfragen verwenden, um externe Daten wie Wetterinformationen abzurufen. Die gesammelten Datensätze werden in strukturierten Formaten organisiert, um sie für die weitere Analyse in den nachfolgenden Phasen des Projekts vorzubereiten.
Einführung in die Datenwissenschaft mit R Capstone Project•2 Minuten
Wetter und Bike-Sharing-Nachfrage Datenerhebung•2 Minuten
1 Lektüre•Insgesamt 2 Minuten
Überblick über den Kurs•2 Minuten
1 Aufgabe•Insgesamt 6 Minuten
Kontrollpunkte•6 Minuten
3 App-Elemente•Insgesamt 180 Minuten
(Optional) Beziehen Sie einen IBM Cloud Merkmal Code•60 Minuten
Praktisches Labor: Vervollständigen Sie die Datenerfassung mit Web Scraping Notebook•60 Minuten
Praktisches Labor: Vervollständigen Sie die Datensammlung mit OpenWeather API Notebook•60 Minuten
5 Plug-ins•Insgesamt 75 Minuten
Capstone Übersicht•15 Minuten
(Optional) Praktische Übung: Erstellen eines IBM Cloud-Kontos•15 Minuten
Übersicht über die Datenerfassung•15 Minuten
(Optional) Praktische Übung: Vervollständigen Sie die Datenerfassung mit Web Scraping Notebook•15 Minuten
(Optional) Praktische Übung: Vervollständigen Sie die Datensammlung mit OpenWeather API Notebook•15 Minuten
Modul 2 - Datenmanipulation
Modul 2•4 Stunden abzuschließen
Moduldetails
In diesem Modul wenden Sie die in den vorherigen Kursen erlernten Techniken zur Datenverarbeitung an, um die gesammelten Datensätze zu bereinigen und für die Analyse vorzubereiten. Anhand der in Modul 1 gesammelten Daten werden Sie Rohdaten in ein strukturiertes und analysefähiges Format umwandeln. Sie werden Textdaten bereinigen, Variablen standardisieren, fehlende Werte behandeln und Datentransformationen wie Kodierung und Normalisierung durchführen. Am Ende dieses Moduls werden Sie einen zuverlässigen Datensatz vorbereitet haben, der eine sinnvolle Erforschung und Modellierung in späteren Phasen des Projekts unterstützt.
Das ist alles enthalten
1 Video1 Aufgabe2 App-Elemente3 Plug-ins
Infos zu Modulinhalt anzeigen
1 Video•Insgesamt 3 Minuten
Datenwrangling•3 Minuten
1 Aufgabe•Insgesamt 12 Minuten
Kontrollpunkte•12 Minuten
2 App-Elemente•Insgesamt 120 Minuten
Praktisches Labor: Vollständige Datenverarbeitung mit regulären Ausdrücken Notebook•60 Minuten
Praktische Übung: Vollständige Datenverarbeitung mit dplyr Notebook•60 Minuten
3 Plug-ins•Insgesamt 125 Minuten
Überblick über Data Wrangling•5 Minuten
(Optional) Praktische Übung: Vollständiges Data Wrangling mit Regulären Ausdrücken Notebook•60 Minuten
(Optional) Praktische Übung: Vollständiges Data Wrangling mit dplyr Notebook•60 Minuten
Modul 3: Durchführen einer explorativen Datenanalyse mit SQL, Tidyverse & ggplot2
Modul 3•4 Stunden abzuschließen
Moduldetails
In dieser Phase des Abschlussprojekts werden Sie die in den vorangegangenen Modulen erworbenen Fähigkeiten zur Datenerfassung und Datenverarbeitung zusammen mit Ihren früheren Erfahrungen in SQL-Abfragen und Datenvisualisierung anwenden. Dieses Modul konzentriert sich auf die Durchführung der explorativen Datenanalyse (EDA), um die Muster, Beziehungen und Trends in den vorbereiteten Datensätzen besser zu verstehen. Sie werden mit den in früheren Modulen erstellten Datensätzen arbeiten, um Schlüsselvariablen zu untersuchen, aussagekräftige Erkenntnisse zu ermitteln und die Daten für die prädiktive Modellierung vorzubereiten. Wenn Sie in früheren Schritten auf Herausforderungen gestoßen sind, stehen Ihnen vorbereitete Datensätze zur Verfügung, die Ihnen helfen, das Projekt weiter voranzutreiben. In diesem Modul werden Sie eine Reihe von praktischen Übungen durchführen, die Sie durch die wesentlichen Phasen der explorativen Analyse führen.
Das ist alles enthalten
1 Video1 Aufgabe3 App-Elemente3 Plug-ins
Infos zu Modulinhalt anzeigen
1 Video•Insgesamt 2 Minuten
Explorative Datenanalyse•2 Minuten
1 Aufgabe•Insgesamt 12 Minuten
Kontrollpunkte•12 Minuten
3 App-Elemente•Insgesamt 180 Minuten
Praktische Übung: Absolvieren Sie die Übung Explorative Datenanalyse (EDA) mit SQL unter Verwendung von RSQLite•60 Minuten
(Optional) Praktische Übung: Absolvieren Sie die Übung Explorative Datenanalyse (EDA) mit SQL unter Verwendung von RODBC mit IBM DB2•60 Minuten
Praktisches Labor: Vervollständigen Sie das EDA-Labor mit Datenvisualisierung•60 Minuten
3 Plug-ins•Insgesamt 45 Minuten
(Optional) Praktische Übung: Daten in Db2 auf IBM Cloud laden•15 Minuten
(Optional) Praktische Übung: Führen Sie die Explorative Datenanalyse (EDA) mit SQL auf IBM Watson Studio durch•15 Minuten
(Optional) Praktisches Labor: Schließen Sie das Labor Explorative Datenanalyse (EDA) mit Datenvisualisierung ab•15 Minuten
Modul 4: Prädiktive Analyse
Modul 4•4 Stunden abzuschließen
Moduldetails
In diesem Modul wenden Sie Regressionsmodellierungstechniken an, um anhand des vorbereiteten Datensatzes Vorhersagemodelle für die Bike-Sharing-Nachfrage zu erstellen. Auf der Grundlage der zuvor erlernten Modellierungskonzepte werden Sie multiple Regressionsmodelle konstruieren und verfeinern, um die Vorhersagegenauigkeit zu verbessern. Sie bewerten die Leistung des Modells mit Hilfe geeigneter statistischer Metriken und interpretieren den Beitrag der verschiedenen Vorhersagevariablen. Diese Phase stellt den Übergang von der Datenexploration zur prädiktiven Analyse im Rahmen Ihres Capstone-Workflows dar.
Das ist alles enthalten
1 Video1 Aufgabe2 App-Elemente2 Plug-ins
Infos zu Modulinhalt anzeigen
1 Video•Insgesamt 2 Minuten
Regressionsmodelle•2 Minuten
1 Aufgabe•Insgesamt 12 Minuten
Kontrollpunkte•12 Minuten
2 App-Elemente•Insgesamt 120 Minuten
Praktisches Labor: Führen Sie das Labor zur Erstellung eines Basis-Regressionsmodells durch•60 Minuten
Praktisches Labor: Führen Sie das Labor "Verbesserung des linearen Modells" durch•60 Minuten
2 Plug-ins•Insgesamt 135 Minuten
Lesen: Vorhersage der Bike-Sharing-Nachfrage mit Regressionsmodellen•15 Minuten
(Optional) Praktisches Labor: Führen Sie das Labor "Verbesserung des linearen Modells" durch•120 Minuten
Modul 5 - Erstellen einer R Shiny Dashboard App
Modul 5•4 Stunden abzuschließen
Moduldetails
In diesem Modul wenden Sie Ihre Fähigkeiten in der Datenvisualisierung und Anwendungsentwicklung an, um ein interaktives Dashboard zu erstellen, das die Ergebnisse Ihrer vorausschauenden Analyse präsentiert. Mithilfe von R Shiny und Visualisierungstools werden Sie ein Dashboard entwerfen, das es den Nutzern ermöglicht, die prognostizierte Bike-Sharing-Nachfrage an verschiedenen Standorten zu untersuchen. Dieses Modul konzentriert sich auf die Umwandlung von Analyseergebnissen in interaktive visuelle Tools, die datengesteuerte Entscheidungsfindung unterstützen.
Das ist alles enthalten
1 Video1 Aufgabe1 Unbewertetes Labor3 Plug-ins
Infos zu Modulinhalt anzeigen
1 Video•Insgesamt 2 Minuten
Erstellen eines Dashboards mit R Shiny•2 Minuten
1 Aufgabe•Insgesamt 10 Minuten
Kontrollpunkte•10 Minuten
1 Unbewertetes Labor•Insgesamt 60 Minuten
Praktisches Labor: Erstellen einer App zur Vorhersage der Bike-Sharing-Nachfrage (mit Coursera Labs)•60 Minuten
3 Plug-ins•Insgesamt 195 Minuten
(Optional) Übung: Erste Schritte mit Posit Cloud•15 Minuten
(Optional) Praktische Übung (Teil A): Erstellen einer App zur Vorhersage der Bike-Sharing-Nachfrage mit R Shiny und Leaflet (mit Posit Cloud)•90 Minuten
(Optional) Praktische Übung (Teil B): Erweitern Sie die App zur Vorhersage der Bike-Sharing-Nachfrage mit Plots von Städtedetails (mit Posit Cloud)•90 Minuten
Modul 6 - Präsentieren Sie Ihre datengestützten Einblicke
Modul 6•3 Stunden abzuschließen
Moduldetails
In diesem abschließenden Modul werden Sie die Ergebnisse Ihres Abschlussprojekts in einer professionellen Präsentation zusammenfassen, die Ihre Arbeitsabläufe, Analysen, Erkenntnisse und vorausschauenden Ergebnisse vermittelt. Sie werden eine strukturierte Präsentation vorbereiten, die das Projektproblem, die Methodik, die wichtigsten Ergebnisse und die Schlussfolgerungen hervorhebt. Dieses Modul stellt den Höhepunkt Ihrer Lernreise dar, bei der Sie Ihre Fähigkeit unter Beweis stellen, datenwissenschaftliche Kenntnisse zur Lösung eines realen Problems anzuwenden und Ihre Ergebnisse effektiv zu kommunizieren.
Wir bei IBM wissen, wie schnell sich die Technologie entwickelt, und sind uns bewusst, wie wichtig es für Unternehmen und Fachkräfte ist, schnell einsatzbereite, praxisnahe Fähigkeiten zu erwerben. Als marktführender Tech-Innovator setzen wir uns dafür ein, dass Sie in diesem dynamischen Umfeld erfolgreich sind. Über das IBM Skills Network bieten unsere von Experten entwickelten Schulungsprogramme in den Bereichen künstliche Intelligenz, Softwareentwicklung, Cybersicherheit, Datenwissenschaft, Unternehmensführung und mehr die grundlegenden Fähigkeiten, die Sie benötigen, um sich Ihren ersten Job zu sichern, Ihre Karriere voranzutreiben oder Ihren geschäftlichen Erfolg zu steigern. Ganz gleich, ob Sie sich selbst oder Ihr Team weiterbilden möchten, unsere Kurse, Spezialisierungen und professionellen Zertifikate vermitteln Ihnen das technische Fachwissen, das Sie und Ihr Unternehmen in einer wettbewerbsorientierten Welt auszeichnet.
Welche spezifischen R-Pakete und Ökosysteme werden in diesem Capstone verwendet?
Dieses Projekt erfordert die Beherrschung der wichtigsten Bibliotheken für Datenmanipulation und -visualisierung in der Programmiersprache R. Sie werden das Tidyverse-Ökosystem ausgiebig für programmatische Datenmanipulation, Datentransformation und Textbereinigung nutzen. Für die statistische Untersuchung und Datenvisualisierung werden Sie ggplot2 nutzen, um benutzerdefinierte Diagramme und Kurven zu erstellen, sowie SQL , um Ihre strukturierten Datensätze abzufragen und aufzuschlitzen, bevor Sie sie in Ihre Vorhersagemodelle einspeisen.
Wie geht dieses Projekt mit komplexen räumlichen und umweltbezogenen Variablen für die Vorhersagemodellierung um?
Das Hauptziel dieser Abschlussarbeit ist die Erstellung eines fortschrittlichen Vorhersagemodells für die Bike-Sharing-Nachfrage. Sie werden programmatisch Daten aus verschiedenen Quellen sammeln und zusammenführen,
sie nutzen Web-Scraping für die HTML-Extraktion und führen REST-API-Anfragen aus, um aktuelle Umgebungsvariablen wie Wetterbedingungen einzubeziehen. Anschließend wenden Sie Feature-Engineering wie Normalisierung, Binning und kategoriale Codierung an, um ein lineares Regressionsmodell zu erstellen und zu verfeinern, das Nachfragetrends mit hoher statistischer Genauigkeit vorhersagen kann.
Welche Art von interaktivem Dashboard soll ich erstellen, um meine Analysen anzuzeigen?
Sie werden Ihre statistischen Backend-Modelle in eine voll funktionsfähige Webanwendung umwandeln, indem Sie ein interaktives R Shiny Dashboard erstellen. Um die ortsbezogene Nachfrage dynamisch zu visualisieren, werden Sie eine Leaflet-Kartenebene in Ihre Anwendung integrieren, die es den Benutzern ermöglicht, reale räumliche Datenplots in Echtzeit zu erkunden. Das Projekt gipfelt in der Erstellung eines Datenanalyseberichts auf Führungsebene, mit dem Sie den Interessengruppen Ihres Unternehmens beweisen, dass Sie komplexe R-Skripte in produktionsreife Business Intelligence-Tools umsetzen können.
Wann werde ich Zugang zu den Vorlesungen und Aufgaben haben?
Um Zugang zu den Kursmaterialien und Aufgaben zu erhalten und um ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung erwerben, wenn Sie sich für einen Kurs anmelden. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen. Der Kurs kann stattdessen die Option "Vollständiger Kurs, kein Zertifikat" anbieten. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Was bekomme ich, wenn ich dieses Zertifikat abonniere?
Wenn Sie sich für den Kurs anmelden, erhalten Sie Zugang zu allen Kursen des Zertifikats, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird zu Ihrer Seite "Leistungen" hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen.
Finanzielle Unterstützung verfügbar, weitere Informationen
¹ Einige Aufgaben in diesem Kurs werden mit AI bewertet. Für diese Aufgaben werden Ihre Daten in Übereinstimmung mit Datenschutzhinweis von Courseraverwendet.