Seite 1 von 1

Fälle aus Datensatz entfernen

Verfasst: Fr Apr 19, 2024 11:34 am
von Max M
Hallo zusammen,

ich habe in meinem Datensatz vier Personen/Fälle, die ich gerne entfernen möchte.
Zwei der Personen haben in der Variable "Geschlecht" divers angekreutzt -> ich möchte die Option "divers" komplett aus der Variable entfernen.
Die zwei anderen Personen sind Ausreißer in der Variable "Bildungsgrad" <8Jahre, die ich gerne entfernen möchte.

Gibt es eine Möglichkeit alle vier Personen einfach aus dem Datensatz zu streichen oder muss ich die Variablen irgendwie umkodieren? Und wenn ja, wie?

Vielen lieben Dank und Grüße
Max

Re: Fälle aus Datensatz entfernen

Verfasst: Fr Apr 19, 2024 1:57 pm
von bigben
Hallo Max,

fertige Dir eine Kopie Deiner Daten ohne die "divers"-Zeilen an. Dann kannst Du immer noch entscheiden, wann Du mit den Originaldaten und wann Du mit der Kopie arbeiten willst. Das Zauberkommando heißt "subset":

Code: Alles auswählen

test <- data.frame(id = 11:17, gender = c("m", "d", "m", "d", "f", "f", "m"))
print(test)

test.o.d <- subset(test, gender != "d")
print(test.o.d)
LG,
Bernhard

Re: Fälle aus Datensatz entfernen

Verfasst: Fr Jul 19, 2024 2:02 pm
von sebakra
Im Grunde hat bigben deine Frage schon beantwortet. Ich stand anfangs auch vor solchen Problemen und der subset-Command ist in solchen Fällen immer der einfachste Weg (ich habe quasi auf SPSS gelernt und musste mich auf R einstellen). Man versucht also nicht, den ursprünglichen Datensatz zu verändern, sondern erstellt daraus einen Teildatensatz und filtert die ungewünschten Fälle raus. Inzwischen wirst du dein Problem wohl gelöst haben, aber ich hab hier noch Infos gefunden, falls andere R-Dummies vor dem gleichen Problem stehen: https://www.acad-write.com/ratgeber/sta ... n-rstudio/