Von lang nach breit, Ausprägungen einer Charactervariablen gruppiert zusammenfassen
Verfasst: Di Aug 25, 2020 3:53 pm
Hallo Zusammen,
ich habe einen Datensatz, in dem jede Person eine ID hat und jede Person wiederum mehrere Beobachtungen (Anzahl der Beobachtungen variiert über die Person) einer Variablen V aufweist.
Das ganze sieht vereinfacht so aus:
Nun möchte ich vom einem langen in ein breites Datenformat wecheln. Pro Person (ID) soll es nur noch eine Beobachtung geben, alle Ausprägungen dieser Person sollen in einer(!) neuen Variablen V2 zusammengefasst werden, wobei die einzelnen Ausprägungen durch einen "_" verbunden sein sollen.
Die Zieltabelle im Beispiel sähe so aus:
Über spread() sollte es einfach gehen, aber ich komme nicht darauf, wie.
Herzlichen Dank für Eure Hilfe.
Jörg
ich habe einen Datensatz, in dem jede Person eine ID hat und jede Person wiederum mehrere Beobachtungen (Anzahl der Beobachtungen variiert über die Person) einer Variablen V aufweist.
Das ganze sieht vereinfacht so aus:
Code: Alles auswählen
ID<-c(1,1,1,2,2,3)
V<-c("a","a","b","a","c","d")
df1<-tibble(ID,V)
Die Zieltabelle im Beispiel sähe so aus:
Code: Alles auswählen
ID2<-c(1,2,3)
V2<-c("a_a_b","a_c","d")
df2<-tibble(ID2,V2)
Herzlichen Dank für Eure Hilfe.
Jörg