Seite 1 von 1

Ausreißer - Logistische Regression

Verfasst: Mo Jan 22, 2018 10:37 pm
von juanita_125
Hallo,
ich möchte bei einer logistischen Regression die Ausreißer entfernen, damit das Modell robuster wird.
Dazu habe ich die Residuen ausgeben lassen (residualPlots), allerdings fällt mir die Interpretation schwer.
Gibt es einen Wertebereich, innerhalb dessen sie 'tolerierbar' sind?
Und wie kann ich sie herausfiltern?
Erstelle ich dazu einen solchen neuen Datensatz?

mydata_new <- mydata %>% filter(v1 < , v2 > ...)

Schonmal vielen Dank und beste Grüße!
Joan

Re: Ausreißer - Logistische Regression

Verfasst: Mo Jan 22, 2018 11:20 pm
von EDi
ich möchte bei einer logistischen Regression die Ausreißer entfernen, damit das Modell robuster wird.
Das halte ich für einen nicht korrekten Schluss. Es wird in diesem Fall eher sensitiver...
Dazu habe ich die Residuen ausgeben lassen
Welche Art von Residuen? Die meisten sind schwer zu interpretieren. Ich würde scaled residuals nehmen (DHarma Paket), weil die recht gut zu interpretieren sind.

Ich würde Außreißer ohne guten Grund (z. B. Gerätefehler, späte Keimung, Messung zu anderenBedingungen) und mit kleiner Datenbasis nicht entfernen.

dplyr braucht man dafür nicht, die "[" Funktion ist ausreichend (und wird im Gegensatz zu dplyr auch noch in 10Jahren genauso funktionieren).