Eigenschaften von Random Forest Variable Importance Maßen

Kontaktperson

Prof. Dr. Carolin Strobl
c.strobl@psychologie.uzh.ch

Beschreibung

Random Forests sind ein sog. Ensemble Verfahren, bei dem mehrere hundert Klassifikations- und Regressionsbäume aggregiert werden. Die Prognose des Ensembles wird dadurch stabiler als die eines einzelnen Baumes, die Ergebnisse sind jedoch inhaltlich nicht mehr interpretierbar. Zur Beurteilung der Relevanz der Einflussgrößen müssen daher zusätzlich sog. Variable Importance Maße berechnet werden. Diese Maße werden bereits häufig zur Auswahl und Beurteilung von Einflussgrößen eingesetzt; ihre statistischen Eigenschaften sind allerdings noch nicht gut erforscht. Das Ziel von Arbeiten in diesem Themenbereich ist es deshalb, mithilfe von systematischen Simulationsstudien in R herauszufinden, welche inhaltlichen Aussagen durch Random Forest Variable Importance Maße gerechtfertigt sind.