Skip to content

randomForest

Michael Brüggemann edited this page Dec 27, 2023 · 3 revisions

Random Forest (rF)

  • Der Namensteil "Forest" stammt daher, das der Algorithmus viele Entschediungsbäume für die Klassifikation baut.
  • eine klassischer Machine Learning (ML) Algorithmus, welche besonders gut auf Remote Sensing Daten zu LULC performt.
  • nutzt mehrere "Classifier" und verbindet diese zu vielen Entscheidungsbäumen
    • ein "Classifier" ist eine Instanz, die eine Entscheidung über eine Klassifikation abgibt.
  • Ein Entscheidungsbaum endet dabei immer damit, dass eine Entscheidung für eine Klasse abgegeben wird. Am Ende wird das Mittel aus allen Klassifikationen genommen

nimmt man nominale Klassen, so wird sich am Ende für die Klasse entschieden, die am häufigsten durch einen Baum gewählt wurde.

?? Wie funktioniert ein "Entscheidungsbaum" im Random Forest

Nutzbarkeit in R

  • in R existiert einerseits das package randomForest als auch das Package caret. randomForest umfasst dabei alle Funktionen um einen rF-ML-Algorithmus aufzusetzen.

  • caretumfasst grundlegende Funktionalität für ML Algorithmen

    • Training/Test Splits erstellen
    • Parameter des Modells einstellen
    • Hyperparameter Tuning
    • Modell Optimierung und Auswahl

Warnings von randomForest

  • "Warnung in randomForest.default(x, y, mtry = param$mtry, ...) invalid mtry: reset to within valid range"
    • diese Warnung kommt immer dann, wenn "mtry" größer als die Anzahl der Predictor varaibles ist. Hier könnte man in Zukunft eine Methode nutzen, die mtry auf die Menge der nutzbaren Features reduziert. Dies macht caret aber sowieso (daher die Warnung), deshalb könnte man das warning auch einfach lassen

nützliche Links

Clone this wiki locally