ich bin neu hier und habe gerade ein kleines Problem mit den o.g. Stichpunkten. Ich habe mehrere (4) data.frame mit 12-15 cols und 500 rows und möchte jeweils 1-2 Tabellen mit den statistischen "Grunddaten" (n, mean, sd, var, q0,025, q0,05 q1, median ...) erstellen. Die cols sind unterschiedlich lange Messreihen. Leider kann ich innerhalb der von mir geschriebenen Funktion die length nicht ohne NAs auslesen. Wo habe ich was übersehen, bin falsch abgebogen, ...?
VG juergen
Code: Alles auswählen
##### Fehler bei dplyr, function, length, rm.na####
#### Erzeugen Vectoren und DF
a<- rpois(n=10, lambda=8.5) #Vector erzeugen
b<- rpois(n=10, lambda=10.5) #Vector erzeugen
b[6]<-NA # Werte durch NAs ersetzen
b[8:10]<-NA # Werte durch NAs ersetzen
#### data.frame erzeugen
DF.zu <- data.frame(a, b )
###Test
length(b) # 10 "falsch"
length(b[!is.na(b)]) # 6 gewünschter Wert
#### Auswertung
library(dplyr)
FUNC.summarystats <- function(DF.zu){
DF.SUMMERY <-data.frame(
n = sapply(DF.zu, length), # hier funktioniert na.rm =TRUE nicht
mean = sapply(DF.zu, mean, na.rm =TRUE )
#sd , var, median, ...
)
return(DF.SUMMERY)
}
### Ansicht
FUNC.summarystats(DF.zu) # n=10 fuer b ist ja falsch