Robustes Verfahren für Messwiederholung mit 2 Kontrollvariablen

Varianzanalyse, Diskriminanzanalyse, Kontingenzanalyse, Faktorenanalyse, Clusteranalyse, MDS, ....

Moderator: EDi

Antworten
Madamadam
Beiträge: 3
Registriert: So Feb 16, 2020 11:28 am

Robustes Verfahren für Messwiederholung mit 2 Kontrollvariablen

Beitrag von Madamadam »

Liebe Forumsmitglieder,

ich suche eine robuste Variante für einen Unterschiedstest im Rahmen einer Messwiederholung.
Beim zugrundeliegenden Experiment wurden alle Teilnehmenden in 2 Kontexten auf ein Merkmal Y getestet. Nun soll – unter Kontrolle von 2 Störvariablen – ermittelt werden, ob es einen signifikanten Unterschied in Y zwischen den Kontexten gibt.

Das Problem ist die sehr verzerrte rechtsschiefe Verteilung mit etlichen (gültigen) Extremwerten.
Mir wurde u.a. wegen verletzer Homoskedastizitätsannahmen und der Outlier die Verwendung eines einfachen LMM der Form Y ~ c1 + c2 + (1|id) empfohlen, bei dem ich mich einfach nicht um die random effects kümmere. Das habe ich mit lmer und der robusten Variante rlmer auch gerechnet.
Die robuste Variante scheint eigentlich eine gute Wahl zu sein, aber ich suche noch nach einem möglichst robusten Verfahren, das einer einfacheren Messwiederholungsanalyse entspricht, da ein LMM zu komplex ist und ich z.B. keine einfach Poweranalyse machen kann.
Könnt Ihr mir Hinweise geben, mit welchem Verfahren und welchem Package ich das umsetzen könnte?
bigben
Beiträge: 2788
Registriert: Mi Okt 12, 2016 9:09 am

Re: Robustes Verfahren für Messwiederholung mit 2 Kontrollvariablen

Beitrag von bigben »

Hallo Madamadam,
Madamadam hat geschrieben: Di Mai 07, 2024 11:15 pmDas Problem ist die sehr verzerrte rechtsschiefe Verteilung mit etlichen (gültigen) Extremwerten.
Ich grüble noch, was genau Du damit meinst, dass die Verteilung stark rechtsschief ist oder dass sie sehr verzerrt ist. Ich verstehe Dich so, dass die Outlier alles echte Werte sind. Wieso sind sie dann verzerrend? Das mag besserwisserisch klingen, ist aber so nicht gemeint. Es gibt ja robuste Regressionsverfahren, bei denen beispielsweise extreme Werte weniger gewichtet werden, aber wenn das alle valide Werte sind, dann will man sie ja vielleicht gar nicht geringer gewichten sondern ihre Information voll nutzen. Geht es Dir also darum, den Einfluss extremer Werte zu vermindern oder geht es Dir nur um valide Signifikanztestung und Standardabweichungen oder hast Du Angst vor einem linearen Modell, wenn der eigentliche Zusammenhang vielleicht gar nicht über einen so weiten Zusammenhang linear ist?

Ich bin sicher kein Spezialist, aber die unterschiedlichen Situationen würde ich unterschiedlich angehen.

Das simpelste, banalste und nicht sehr fortgeschrittene wäre der Versuch, die extrem rechtsschiefe Verteilung zu logarithmieren. Vielleicht reicht das schon und du kannst all die anderen Dinge, wie eine Poweranalyse (wozu??) ganz normal rechnen.
Eine Ausweichmöglichkeit für einfache Verfahren die nicht so unter Heteroskedastizität, Varianzungleichheit etc. leidet wäre der Versuch, Standardabweichungen nicht-parametrisch, also mittels Bootstrapping (oder Permutationstest) zu analysieren.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Madamadam
Beiträge: 3
Registriert: So Feb 16, 2020 11:28 am

Re: Robustes Verfahren für Messwiederholung mit 2 Kontrollvariablen

Beitrag von Madamadam »

Lieber Bernhard,

danke für Deine präzisen Nachfragen — ich war wirklich sehr ungenau. Also die Schiefe ist nicht das Heikle, die bekäme ich über Logarithmierung hin. Es geht mir konkret darum, den Einfluss extremer Werte zu vermindern und suche daher nach einem Messwiederholverfahren, das in diesem Sinne robust ist und 2 Störvariablen berücksichtigen kann.


Vielleicht kurz zum Kontext: im Experiment werden Äusserungen (Wortgruppen, die inhaltlich und zeitlich unterschieden werden können) innerhalb einer 2-Personen-Interaktion erhoben, die auf innere Zustände des Gegenübers referieren. Diese Häufigkeiten werden an der Anzahl aller Äußerungen (ob auf innere Zustände bezogen oder nicht) relativiert. Die Äußerungen der meisten Personen bestehen nur zu einem 1% aus diesen Äußerungen (oft nur 1-2 Stück), dann gibt es aber einen Teil in der Gruppe, der deutlich mehr äußert, so 8-12%. Solange ich keine Störvariablen einbezogen habe, konnte ich einfach Differenzwerte zwischen den Bedingungen bilden, die dann annähernd normalverteilt waren (zur Relativierung der wenigen verbleibenden Extremwerte hatte ich dann eine leichte 95%-ige Winsorisierung gemacht) und habe diese Differenzwerte dann in einem einfachen t-Test gegen 0 geprüft. Jetzt, wo ich aber Störvariablen berücksichtigen möchte, geht es leider, leider nicht mehr mit den Differenzwerten …
(Auch Bootstrapping kommt mit den Extremwerten nicht gut klar, die bekommen immer noch viel zu viel Gewicht. Aber diese Fälle ganz rauszunehmen ist eben auch keine Option.)
bigben
Beiträge: 2788
Registriert: Mi Okt 12, 2016 9:09 am

Re: Robustes Verfahren für Messwiederholung mit 2 Kontrollvariablen

Beitrag von bigben »

Wie gesagt, sicher kein Spezialist -- aber das Paket robust liefert robuste lineare Regression und GLM die, so denke ich, genau das leisten sollten.

LG, Bernhard

PS Sind die extremen Werte denn nach der Logaritmischen Transformation noch so extrem? Oder wären sie auch in einem beispielsweise binomialen Modell noch extrem? Oder machen Dir extreme Prädiktoren Sorgen?
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten