Seite 1 von 1

Beobachtungen der gleichen Person soll nur einfach zählen

Verfasst: Mo Jun 08, 2020 6:17 pm
von JonasBodmer
Liebe Mitglieder des R-Forums

Ich bin gerade an der Auswertung meiner Masterarbeit (Psychologie). Ich bin dabei auf folgendes Problem gestossen, das ich bisher leider nicht alleine lösen konnte.
Insgesamt liegen von 101 Personen Daten vor. Es gibt jedoch den Fall, dass gewisse Personen bei unterschiedliche Bedingungen zweimal geantwortet haben. Ich habe die Daten im Long-Format angelegt, sodass ich nun 144 Beobachtungen in den Zeilen habe. So weit so gut!
Wenn ich nun aber mit den Variablen aus der Spalte rechnen möchte, dann werden ja immer alle 144 Beobachtungen mit einbezogen. Kann mir jemand weiterhelfen, wie ich es hinkriege, dass die Werte der gleichen Person nicht doppelt, sondern nur einmal gezählt werden, sodass ich schliesslich für jede Variable mit den 101 Werten rechnen kann.

Herzlichen Dank schon im Voraus!

Jonas Bodmer

Re: Beobachtungen der gleichen Person soll nur einfach zählen

Verfasst: Mo Jun 08, 2020 6:46 pm
von bigben
Welche der Mehrfachäußerungen soll denn zählen? Die erste? Die letzte? Der Durchschnitt? Der Median?

https://databraineo.com/ki-training-res ... er-gruppe/

Re: Beobachtungen der gleichen Person soll nur einfach zählen

Verfasst: Mo Jun 08, 2020 7:30 pm
von JonasBodmer
Vielen Dank für die schnelle Antwort.
Bei gewissen Variablen wie z.B. condition_scenario (kategoriale Variable) und severity_av (intervallskalierte Variable) sollen alle Werte zählen.
Bei sex und age hingegen sollen diejenige Werte, die der gleichen Person (vpn_id) angehören, nur einmal zählen, wenn man die Deskriptivstatistiken berechnet, z.B. den mean von age.

Ich hoffe, ich habe mich klar ausgedrückt :D

Re: Beobachtungen der gleichen Person soll nur einfach zählen

Verfasst: Mo Jun 08, 2020 9:25 pm
von jogo
Hallo Jonas,

ich empfehle eine Trennung der Daten:
ein Dataframe mit den Daten, die sich auf die Person Ansicht beziehen (pro vpn_id je eine Zeile),
der andere Dataframe für die Beobachtungen (ggf. pro vpn_id mehrere).

Code: Alles auswählen

df1 <- unique(Daten[1:3])
df2 <- Daten[-(2:3)]
Dann sollte Ordnung im Laden sein; nochmal kontrollieren, ob in df1 jede vpn_id nur einmal vorkommt:

Code: Alles auswählen

nrow(df1)
length(unique(df1$vpn_id))
beide Zahlen sollten gleich sein.

Gruß, Jörg

Re: Beobachtungen der gleichen Person soll nur einfach zählen

Verfasst: Mi Jun 10, 2020 12:05 pm
von JonasBodmer
Hat funktioniert!

Herzlichen Dank! :D