Seite 3 von 3

Re: ganz freundliche Bitte um Hilfe - Datensatz

Verfasst: Mo Dez 07, 2020 12:16 am
von Claire
Lieber Bernhard,

ich hoffe, dass du einen wunderbaren zweiten Advent hattest und es Dir gut geht.

Die letzte Woche habe ich die Korrelationen fertig gestellt und hauptsächlich mit den „Veränderungen“ gearbeitet. Das klappt bisher ganz gut. Trotzdem bin ich mit den Ergebnissen noch nicht zufrieden.

Jetzt möchte ich doch gerne noch einmal die nominal und ordinalskalierten Variablen ins Spiel bringen um zu schauen, ob die „Veränderungen“ vielleicht doch noch etwas mit anderen Einflussfaktoren zu tun haben.

In diesem Fall sind das die Variablen „likes_vergeben_pro_tag“, „kommentare_vergeben_pro_tag“ und zeit_pro_tag. Ich möchte die Variablen gerne noch einmal untersuchen und gucken, ob es nicht vielleicht doch einen Zusammenhang zu den Veränderungen gibt:

(Social_Media <- Social_Media %>% mutate(relveränderung = (Social_Media$follower_donnerstag_19.11.2020 - Social_Media$follower_donnerstag_05.11.2020)/Social_Media$follower_donnerstag_05.11.2020).

Ich habe mir hierzu die folgenden Testmöglichkeiten rausgesucht und wollte dich hierzu mal Deiner Meinung fragen, ob und welche Testverfahren du wählen würdest und wenn ja mit welchen „Variablen-Kombinationen“


1) Chi2 für nominale und ordinale Skalen

xchisq.test(zeit_pro_tag~kommentare_vergeben_pro_tag, data = Social_Media)
• xchisq.test(veraenderung ~ zeit_pro_tag, data = Social_Media)
• xchisq.test(kommentare_vergeben_pro_tag~ zeit_pro_tag, data = Social_Media)


Was macht da für Dich am meisten Sinn? Kann ich hier überhaupt die Variable „Veränderung“ nehmen, weil mal bei Chi2 ja mit nominalen Daten arbeitet?

2) Permutationstest mit den folgenden Befehlen:

• set.seed
• diffmean
• histogram

• t-test

Wie würdest du hier vorgehen?

Dann habe ich noch eine ganz blöde Frage zu dem ggplot:


ggplot(Social_Media) +
+ geom_boxplot(aes(x=posts_total, y =veraenderung), color = "grey") +
+ geom_jitter(aes(x=posts_total, y =veraenderung), width = .1) +
+ ylab("Veränderung von follower_donnerstag_05.11.2020 zu follower_donnerstag_19.11.2020")


Hier wird mir immer die folgende Warnmeldung angezeigt:

Warnmeldung:
Continuous x aesthetic -- did you forget aes(group=...)?

Weißt du woran das liegen kann?

Ich habe jetzt noch ein paar Tage um das Projekt fertigzustellen und hoffe so sehr, dass ich hier auf ein rundes Ergebnis komme.

Ich wünsche Dir einen guten Start in die Woche!

Herzliche Grüße
Claire

Re: ganz freundliche Bitte um Hilfe - Datensatz

Verfasst: Mo Dez 07, 2020 10:23 pm
von bigben
Hallo Claire,
Claire hat geschrieben: Mo Dez 07, 2020 12:16 amIn diesem Fall sind das die Variablen „likes_vergeben_pro_tag“, 1) Chi2 für nominale und ordinale Skalen

xchisq.test(zeit_pro_tag~kommentare_vergeben_pro_tag, data = Social_Media)
Ich habe mir ergooglet, dass es eine Funktion xchisq.test im package mosaic gibt. Erfahrung habe ich damit keine. Du schreibst selbst zurecht, dass die verschiedenen Chiquadrattests sich mit den Häufigkeitsverteilungen nominaler Daten befassen. Was ist den an zeit-pro-tag nominal? Wie man Ordinalskaliertheit von Daten mit Chiquadrattests berücksichtigen kann wüsste ich nicht. Kurzum, ich glaube, ich verstehe weder den Statistikgedanken noch den Funktionaufruf wirklich.


2) Permutationstest mit den folgenden Befehlen:

• set.seed
• diffmean
• histogram

• t-test

Wie würdest du hier vorgehen?
Ich frage mich, wo Du das her hast. Es geht hier wieder um das gleiche Prinzip: Erst mal klar kriegen, was man statistisch machen will, dann in R übersetzen. Man kommt doch nicht von selbst darauf, dass man einen Permutationstest mit bestimmten Kommandos programmieren will. Frag mal den Menschen, der das in den Raum geworfen hat, wie er das genau meint.

Code: Alles auswählen

ggplot(Social_Media) +
+     geom_boxplot(aes(x=posts_total, y =veraenderung), color = "grey") +
+     geom_jitter(aes(x=posts_total, y =veraenderung), width = .1) + 
+     ylab("Veränderung von follower_donnerstag_05.11.2020 zu follower_donnerstag_19.11.2020")
Hier wird mir immer die folgende Warnmeldung angezeigt:

Warnmeldung:
Continuous x aesthetic -- did you forget aes(group=...)?

Weißt du woran das liegen kann?
Ja, es geht um Skalenniveaus. Boxplots sind dazu da, metrisch Werte in Gruppen zu vergleichen. R fragt sich, ob "post_total" eine Gruppierung darstellt oder ob "veraenderung" eine Gruppierung darstellt und erkennt beides nicht als Gruppenbezeichner. Wenn Du metrisches auf der x-Achse gegen metrisches auf der y-Achse darstellen willst ist ein Boxplot einfach die falsche Darstellungsform.

Auch hier wieder: Erst mit Bleistift und Papier klar kriegen, was Du statistisch und grafisch machen willst, dann erst in R umsetzen.

LG,
Bernhard