Skip to content

R Studio

mreiner1 edited this page Dec 9, 2023 · 1 revision

R-Studio




Einführung:

R Studio ist eine leistungsstarke integrierte Entwicklungsumgebung (IDE) für die Programmiersprache R, die Datenanalyse, statistische Berechnungen und Visualisierungen unterstützt. Diese benutzerfreundliche Plattform bietet eine interaktive Umgebung für Datenwissenschaftler und Forscher, um Daten zu importieren, zu analysieren und zu visualisieren. Mit Funktionen wie dem R-Code-Editor, integrierten Paketen und Grafikfunktionen ermöglicht R Studio effizientes Arbeiten und die Erstellung aussagekräftiger Grafiken sowie die Durchführung komplexer statistischer Analysen. Es ist eine bevorzugte Wahl für Profis und Anfänger, die in der Datenanalyse und Forschung tätig sind.

Datentypen und Variablen

Vektoren:

  • Erstellung: vector_name <- c(value1, value2, ...)
  • Beispiel: numbers <- c(1, 2, 3, 4, 5)

Listen:

  • Erstellung: list_name <- list(item1, item2, ...)
  • Beispiel: details <- list(name="John", age=30, city="New York")

Data Frames:

  • Erstellung: dataframe_name <- data.frame(column1, column2, ...)
  • Beispiel: df <- data.frame(name=c("Alice", "Bob"), age=c(25, 30))

Variablenzuweisung:

  • variable <- value
  • Beispiel: x <- 10

Datenmanipulation

Zugriff auf Elemente:

  • Elemente in Vektoren/Listen: vector_name[index]
  • Beispiel: numbers[3] (gibt das dritte Element des Vektors zurück)

Filtern und Auswählen:

  • Daten filtern: subset(dataframe, condition)
  • Beispiel: subset(df, age > 25) (gibt Zeilen zurück, in denen das Alter größer als 25 ist)

Aggregation und Gruppierung:

  • Gruppierung: aggregate(values ~ group, data=df, FUN)
  • Beispiel: aggregate(Sales ~ Region, data=sales_data, mean) (berechnet den Durchschnittsumsatz pro Region)

Statistische Berechnungen

Summary Statistik:

  • Zusammenfassende Statistik: summary(dataframe)
  • Beispiel: summary(df) (gibt eine Zusammenfassung der Variablen im Data Frame zurück)

Hypothesentests:

  • t-Test: t.test(variable1, variable2)
  • Beispiel: t.test(df$age, mu=30) (führt einen t-Test auf dem Alter durch, um zu prüfen, ob der Durchschnitt 30 ist)

Datenvisualisierung

Plotting:

  • Streudiagramme: plot(x, y)
  • Beispiel: plot(df$age, df$salary) (erstellt ein Streudiagramm von Alter gegen Gehalt)

Histogramme:

  • Erstellen: hist(dataframe$variable)
  • Beispiel: hist(df$age) (erstellt ein Histogramm des Alters)

Boxplots:

  • Erstellen: boxplot(variable ~ group, data=dataframe)
  • Beispiel: boxplot(salary ~ gender, data=employee_data) (erstellt Boxplots des Gehalts nach Geschlecht)