Hallo zusammen,
ich möchte eine lineare Regression in R-Studio berechnen, mit folgendem Befehl:
mod1 <- lm(alkohol ~ rating + isolation, data = df)
summary(mod1)
Datensatz:
Kriterium: alkohol
Prädiktoren: rating, isolation, social status
Ich habe allerdings einige fehlende Werte (NA) auf der "rating"-Variable. Hierzu meine Frage: Was ist denn die default-Einstellung in R-Studio beim lm-Befehl, wie mit fehlenden Werten umgegangen wird?
Erfolgt ein paarweiser Fallausschluss (Entfernung aller Fälle, die fehlende Werte auf rating oder isolation haben, also den beiden im linearen Modell eingeschlossenen Prädiktoren) oder werden alle Fälle entfernt, die fehlende Werte auf irgendeinem Prädiktor im Datensatz haben?
Würde mich über eine Antwort freuen!
Missing Data bei linearer Regression
Moderator: EDi
Re: Missing Data bei linearer Regression
Aus ?lm:
Kann aber auch unterschiedlich sein (z.b. durch eine .Rprofile Datei beim R Startup geändert).
Bei mir ist dasna.action
a function which indicates what should happen when the data contain NAs. The default is set by the na.action setting of options, and is na.fail if that is unset. The ‘factory-fresh’ default is na.omit. Another possible value is NULL, no action. Value na.exclude can be useful.
Code: Alles auswählen
R> options('na.action')
$na.action
[1] "na.omit"
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Re: Missing Data bei linearer Regression
Vielen Dank für die schnelle und hilfreiche Antwort!
Bei mir wird dasselbe angezeigt.
Könnten Sie mir übersetzen, was das bedeutet? Also wie geht R-Studio mit fehlenden Werten um?
Bei mir wird dasselbe angezeigt.
Könnten Sie mir übersetzen, was das bedeutet? Also wie geht R-Studio mit fehlenden Werten um?
Re: Missing Data bei linearer Regression
Hallo Klee,
willkommen im Forum!
Die Meldung lautet bei lm() : ... Beobachtungen entfernt wegen NA (oder so ähnlich)
... die Meldung gibt es erst beim summary()
(1 observation deleted due to missingness)
Gruß, Jörg
willkommen im Forum!
es werden für die Regression alle Beobachtungen entfernt, bei denen eine der beteiligten Variablen NA ist.Klee77 hat geschrieben: ↑Di Jun 04, 2019 5:09 pm ich möchte eine lineare Regression in R-Studio berechnen, mit folgendem Befehl:Datensatz:Code: Alles auswählen
mod1 <- lm(alkohol ~ rating + isolation, data = df) summary(mod1)
Kriterium: alkohol
Prädiktoren: rating, isolation, social status
Ich habe allerdings einige fehlende Werte (NA) auf der "rating"-Variable. Hierzu meine Frage: Was ist denn die default-Einstellung in R-Studio beim lm-Befehl, wie mit fehlenden Werten umgegangen wird?
Erfolgt ein paarweiser Fallausschluss (Entfernung aller Fälle, die fehlende Werte auf rating oder isolation haben, also den beiden im linearen Modell eingeschlossenen Prädiktoren) oder werden alle Fälle entfernt, die fehlende Werte auf irgendeinem Prädiktor im Datensatz haben?
Die Meldung lautet bei lm() : ... Beobachtungen entfernt wegen NA (oder so ähnlich)
Code: Alles auswählen
B <- BOD
lm(demand ~ Time, data=B)
B$demand[3] <- NA
B
lm(demand ~ Time, data=B)
summary(lm(demand ~ Time, data=B))
(1 observation deleted due to missingness)
Gruß, Jörg
Re: Missing Data bei linearer Regression
Auch hierfür gibt's die passende Hilfe und erläuterung (auch die Examples sind nützlich mal auszuführen und zu verstehen)
Code: Alles auswählen
?na.omit
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Re: Missing Data bei linearer Regression
Vielen Dank für die hilfreichen und schnellen Antworten!
Sie haben mir sehr weiter geholfen!!!
Sie haben mir sehr weiter geholfen!!!