Was sind R Data Types?

Geschrieben von Coursera Staff • Aktualisiert am

In diesem Leitfaden erfahren Sie mehr über die verschiedenen R Data Types, die möglichen Verwendungszwecke der einzelnen Typen, welche Fachleute sie verwenden, hilfreiche Tipps zur Verwendung von R und wie Sie Ihre Reise mit R beginnen können.

[Hauptbild] Ein Programmierer schaut auf seinen Laptop, während er eine Tasse Kaffee hält, und erkundet verschiedene R-Datentypen.

Read in English (Auf Englisch lessen)

Die Programmiersprache R ist eine domänenspezifische Sprache (DSL), die für statistische Analysen, die Erstellung von Visualisierungen, maschinelles Lernen, künstliche Intelligenz (KI) und vieles mehr verwendet wird. R wurde 1993 entwickelt und ist nach wie vor eine der am häufigsten verwendeten und beliebtesten Programmiersprachen für Fachleute und bietet gute Gehaltsmöglichkeiten, wenn man weiß, wie man sie einsetzt. Universitäten, Organisationen und Fachleute auf der ganzen Welt setzen R auch heute noch für Data Science, statistische Analysen, Forschung und andere komplexe Analysen ein. 

R bietet die Möglichkeit, eine Vielzahl von Datentypen zu verarbeiten, die durch die Art der in einer Variablen enthaltenen Informationen definiert sind. Wenn Sie wissen, was die einzelnen Datentypen sind und wofür sie verwendet werden können, können Sie effektiv in R arbeiten und Daten manipulieren. Es kann Ihnen auch helfen, die Arten von Berufen kennenzulernen, die R Data Types verwenden, hilfreiche Tipps, die mit ihnen verbunden sind, und die Schritte, die Sie unternehmen können, um mehr über R Data Types zu lernen und Ihre Fähigkeiten zu erweitern. 

Arten von R Data Types

R verfügt über eine Reihe grundlegender Datentypen, die die Grundlage für den Aufbau von Datenstrukturen oder Objekten bilden. Wenn Sie die einzelnen Datentypen und die Unterschiede zwischen ihnen verstehen, können Sie effektiv mit ihnen arbeiten und R effizient nutzen. Zu den gängigen R Data Types gehören:

  • Zeichen: Der Datentyp „Zeichen” umfasst Text. Buchstaben- oder Zahlenkombinationen können zum Zeichendatentyp werden, wenn die Textzeichenfolge in Anführungszeichen gesetzt wird. 

  • Numerisch: Als Standarddatentyp in R liegen numerische Daten in dezimaler Form vor. Zum Beispiel speichert R die Zahl 13,2 als numerisch.

  • Ganzzahl: Alle Ganzzahlen stellen Zahlen dar, die mit der Integer-Funktion in R erstellt wurden, und enthalten keine Dezimalstellen. Sie müssen die spezielle Ganzzahlfunktion as.integer verwenden, um eine Ganzzahl zu erzeugen. Eine Eingabe von as.integer(13.2) gibt beispielsweise nur 13 zurück, wenn sie gedruckt wird. 

  • Logisch: Der logische Datentyp erscheint, wenn Sie einen Vergleich zwischen mehreren Variablen durchführen. Die Variable, die in diesen Fällen zurückgegeben wird, ist entweder True oder False. Wenn Sie 2 > 3 schreiben, gibt R False zurück. Diese Antwort von R ist boolesch und stellt den logischen Datentyp dar. 

  • Komplex: Der komplexe Datentyp kombiniert reale und imaginäre Teile. Man kann sich dies leicht als eine mathematische Gleichung mit einer undefinierten Variablen vorstellen. R verwendet i, um den imaginären oder undefinierten Teil darzustellen. Wenn Sie a = 12 - 4i eingegeben haben, ist der zurückgegebene Datentyp komplex. 

Zusätzlich zu diesen fünf gängigen R Data Types gibt es noch einige andere, die bei der Verwendung von R häufig vorkommen, wie z. B. factor. Der Faktor-Datentyp kommt bei der statistischen Modellierung ins Spiel und zeigt qualitative Beziehungen auf. Ein Beispiel hierfür ist die Zuweisung einer Bewertung zu einem Thema, z. B. zu den von Ihnen gesehenen Fernsehsendungen. In diesem Fall sind die Faktoren überdurchschnittlich, durchschnittlich und unterdurchschnittlich. 

Wofür werden die R Data Types verwendet?

In der Programmiersprache R sind die von Ihnen erstellten Variablen Objekte, und diese Objekte haben Datentypen, die dann einen Baustein für Datenstrukturen darstellen, auf denen man aufbauen kann. Andere Programmiersprachen wie C++ und Java handhaben Variablen anders, indem sie sie direkt als Datentypen und nicht als Objekte bezeichnen. Datenstrukturen weisen je nach Struktur entweder einen Datentyp oder eine Kombination von Datentypen als Teil ihres Aufbaus auf. Da Sie bei der Verwendung von R häufig Datenstrukturen erstellen und bearbeiten, ist es wichtig, ihre Feinheiten und die für sie geltenden Datentypen zu verstehen. Zu den in R enthaltenen Datenstrukturen und ihrer Beziehung zu den besprochenen Datentypen gehören Vektoren, Listen, Matrizen und Datenrahmen.

Vektoren

Die Vektor-Datenstruktur ermöglicht es Ihnen, mehrere Werte oder Objekte in eine Zeile oder Spalte aufzunehmen. Jeder Wert innerhalb des Vektors muss denselben Datentyp haben, d. h., Sie können z. B. nicht die Datentypen numerisch und zeichenhaft innerhalb desselben Vektors kombinieren. Der logische Datentyp ist der Standarddatentyp in R für Vektoren. Sie können den Datentyp jedoch leicht in einen numerischen, einen Zeichentyp oder einen beliebigen anderen Datentyp ändern. Ein gutes Beispiel für die Verwendung von Vektoren ist die Speicherung der einzelnen Noten aller Schüler auf einer Skala von 100. Jede Note kann als Teil des Vektors unter einer Variablen gespeichert werden, anstatt für jeden Schüler eine neue Variable zu erstellen. 

Listen

Die Listendatenstruktur ähnelt den Vektoren, ermöglicht aber die gleichzeitige Speicherung von Informationen mit unterschiedlichen Datentypen. Listen bieten den Vorteil, dass Sie mehrere nicht miteinander verbundene Werte in einer Variablen speichern können, indem Sie eine kombinierte Liste erstellen. Sie haben sogar die Möglichkeit, andere Listen, Vektoren oder Matrizen in eine Liste aufzunehmen. Wenn Sie z. B. eine Liste mit allen Noten Ihrer Schüler erstellen müssen, aber einige von ihnen numerische Noten und andere Zeichen haben, können Sie eine Liste verwenden. 

Matrizen

Matrizen müssen ebenfalls Daten desselben Typs enthalten, aber sie bauen auf Vektoren auf, indem sie mehrdimensionale Daten zulassen. Da sie zwei Dimensionen haben, können Sie Tabellen mit Zeilen und Spalten erstellen. Ein einfaches Beispiel ist die Erstellung einer Matrix mit den Namen aller deutschen Bundesländer in einer Spalte und den Namen der bevölkerungsreichsten Städte in jedem Bundesland in der zweiten Spalte. 

Datenrahmen

Datenrahmen werden als die wichtigste Datenstruktur in R bezeichnet, insbesondere für tabellarische Daten, und sind eine Kombination aus eindeutigen Listen mit gleicher Länge. Die Struktur der Daten in einem Datenrahmen sieht wie eine Tabelle aus, mit Zeilen, Spalten und Überschriften. Im Gegensatz zu Matrizen können Datenrahmen verschiedene Datentypen gleichzeitig enthalten. So kann beispielsweise die erste Spalte ein Zeichen sein und die nächsten beiden Spalten sind Ganzzahlen. 

Wer verwendet R Data Types?

Aufgrund der Beliebtheit der Programmiersprache R in verschiedenen Branchen und Disziplinen können Sie R und seine Datentypen in vielen Berufen verwenden, um Ihre Aufgaben zu erfüllen. Wie bereits erwähnt, kommen R und seine Datentypen in Berufen zum Einsatz, die sich mit statistischen Analysen, der Erstellung von Visualisierungen oder Grafiken aus Daten, dem maschinellen Lernen und der Computermodellierung befassen. 

Der Erwerb von Erfahrungen und Fähigkeiten in R ist auch heute noch sehr gefragt. Zu den Berufen, bei denen R zum Einsatz kommt, gehören:

  • Datenwissenschaft: Datenwissenschaftler verwenden R, um Visualisierungen zu erstellen und tiefgreifende Analysen durch die Erstellung statistischer Modelle und Data-Mining-Techniken durchzuführen.

  • Machine Learning: R ermöglicht die Verwendung von Vorhersagemodellen und anderen Algorithmen, die üblicherweise in auf Machine Learning basierenden Positionen verwendet werden.

  • Finanzwesen: Jobs im Finanzwesen nutzen R, um leistungsstarke Visualisierungen für Risiko- und Leistungsmodelle zu erstellen.

  • Forschung: Universitäten und andere Einrichtungen führen statistische Analysen in R durch, um ihre akademische Forschung in vielen verschiedenen Disziplinen zu unterstützen.

  • Soziale Medien: Viele Stellen in den sozialen Medien nutzen R und seine Datentypen, um Analysen in Bezug auf ihre Kunden und Werbekampagnen durch Stimmungsanalysen zu verfolgen.

  • Fertigung: Ähnlich wie in den sozialen Medien werden auch in der Fertigung Stimmungsanalysen durchgeführt und Kundendaten mit R erfasst.

Wichtige Tipps zur Verwendung von R Data Types

Wenn Sie sich zum ersten Mal mit den R Data Types vertraut machen, werden Sie sich vielleicht in einigen Szenarien wiederfinden, in denen Sie Ihre Datentypen überprüfen oder ändern möchten. Um Sie beim Erlernen von R und der effizienten Nutzung seiner Datentypen zu unterstützen, können Sie diese hilfreichen Tipps nutzen, wenn Sie nicht weiterkommen. 

  • Wie bereits erwähnt, kann es vorkommen, dass Sie den Datentyp Ihrer Variablen überprüfen müssen. Glücklicherweise verfügt R über zwei allgemeine Funktionen zur Überprüfung eines Datentyps: class() und typeof(). Wenn Sie zum Beispiel a = 12 - 4i schreiben und dann class(a), gibt R complex zurück, um Ihnen mitzuteilen, dass es sich um den komplexen Datentyp handelt. 

  • Ähnlich wie bei der Überprüfung von Datentypen im Allgemeinen können Sie R mit is.numeric() und is.character() auch fragen, ob Ihr Datentyp speziell eine Zahl oder ein Zeichen ist. Die Antwort von R ist entweder True oder False, je nachdem, welche Daten Sie prüfen. Wenn Sie a als a = 3.2 definieren und dann R is.numeric(a) fragen, erscheint die Ausgabe True, da 3.2 der numerische Datentyp ist. 

  • Durch die Verwendung von as.-Funktionen können Sie den Datentyp eines Objekts oder einer Variablen ändern. Sie können diese Option verwenden, wenn R einen Zahlenvektor standardmäßig mit dem Datentyp Zeichen versieht. Wenn Sie z. B. den Datentyp Ihres Vektors a mit class(a) überprüfen, gibt R möglicherweise character zurück. Um dies zu beheben und Berechnungen mit Ihrem Vektor durchführen zu können, schreiben Sie as.numeric(a), um den Datentyp zu ändern. 

  • Der letzte hilfreiche Tipp ist, dass R zwischen Groß- und Kleinschreibung unterscheidet. Wenn Sie sich auf eine von Ihnen erstellte Variable beziehen, achten Sie darauf, dass Sie entweder die Groß- oder Kleinschreibung beibehalten, je nachdem, wie Sie die Variable ursprünglich definiert haben. In Anlehnung an das Beispiel für komplexe Datentypen könnten Sie a = 12 - 4i definieren und dann den Datentyp von a durch class(A) überprüfen. In diesem Fall gibt R eine Fehlermeldung aus, weil Sie Ihre Variable als a und nicht als A definiert haben.

Verwandte Begriffe

  • Zugangskontrolle

  • UX-Designer

  • GUI

  • IT-Projektleiter

  • Betriebssystem

  • Fehlersuche

Erste Schritte mit R Data Types auf Coursera

Um mehr über R Data Types und andere Themen der Programmiersprache R im Allgemeinen zu erfahren, ist der Abschluss eines Kurses oder die Erlangung eines entsprechenden Zertifikats ein guter Anfang. Auf Coursera können Sie sich in einige der weltweit besten Kurse einschreiben. 

Sehen Sie sich Datenanalyse mit R-Programmierung von Google an. Dieser Kurs für Anfänger bietet eine Einführung in die Programmiersprache R und ihre Programmierumgebung. Außerdem lernen Sie die grundlegenden Konzepte von R kennen, wie Funktionen, Variablen, Datentypen, Pipes und Vektoren, und erstellen Ihre ersten Visualisierungen. 

Ein weiterer relevanter Kurs, den Sie sich ansehen sollten, wenn Sie Inhalte auf mittlerem Niveau lernen möchten, ist R-Programmierung von der Johns Hopkins University. In diesem Kurs werden wichtige Konzepte der Programmiersprache R vertieft, darunter die Verwendung von R-Profilern, Schleifenfunktionen, Debugging-Tools und statistischer Programmiersoftware. 

Weiterlesen

Aktualisiert am
Geschrieben von:

Redaktion

Das Redaktionsteam von Coursera besteht aus äußerst erfahrenen professionellen Redakteuren, Autoren ...

Diese Inhalte dienen nur zu Informationszwecken. Den Lernenden wird empfohlen, eingehender zu recherchieren, ob Kurse und andere angestrebte Qualifikationen wirklich ihren persönlichen, beruflichen und finanziellen Vorstellungen entsprechen.