Seite 1 von 1

Homoskedastizität bptest / gqtest

Verfasst: So Dez 22, 2019 2:16 pm
von Ries
Hallo zusammen,
ich habe einen Stichprobenumfang von ca. 250.000 Datensätzen und möchte nun auf Homoskedastizität prüfen. Der gqtest wirft mir einen p-wert von 0,319 aus also die Bestätigung der Homoskedastizität. Beim bptest erhalte ich allerdings einen p-wert < 2.2e-16 und somit würde Heteroskedastizität vorliegen.

Der Plot sieht wie folgt aus:

Bild

Was ist denn nun richtig, um die Nullhypothese von Homoskedastizität zu bestätigen?

Re: Homoskedastizität bptest / gqtest

Verfasst: So Dez 22, 2019 8:49 pm
von EDi
Da sind schon (kleinere) Muster zu erkennen:

* wellenmuster maximum residuen - hast du irgendwelche hypothesen dafür (z.b. jahreszeit, Nutzergruppen, etc) und lohnt es sich diese ins model zu nehmen?
* "Fahnenmuster" links unten - das kommt machmal wenn es eine untere Grenze gibt unter welche die Daten nicht gehen können (z.b. kann eine Konzentration nicht negativ werden) - hast die irgendwelche hypothesen dafür und lohnt es sich diese ins model zu nehmen?
* Es scheint auch eine nicht-linearität drinzu sein - Mittelwert der residuen geht nach unten?

Wie gesagt, alles kleinere/minimale Muster. Kommt drauf an was du mit dem Modell anstellen willst obes gut genug für dich ist...
Bei der Datenmenge würde ich gar keine tests / p-werte anschauen, sonder grafisch bzw. mit hold-outs arbeiten...

Re: Homoskedastizität bptest / gqtest

Verfasst: Mo Dez 23, 2019 5:52 pm
von student
Hallo Ries,

beide Tests haben einen funktional unterschiedlichen Ansatz, siehe hier für bptest und für gqtest. Wenn Du eine Regression schätzen möchtest und über die "Form" der Heteroskedastizität (ich breche mir immer die Finger ab ;) )nichts bekannt ist, hilft vielleicht die Funktion hccm() des car-Paketes weiter.

@Edi, ich bin begeistert, was Du alles siehst! ;)

Re: Homoskedastizität bptest / gqtest

Verfasst: Mo Dez 23, 2019 7:42 pm
von EDi
@Edi, ich bin begeistert, was Du alles siehst! ;)
Ich bin immer auch der Suche nach dem allerbesten Model :lol:

Die Muster sind minimal (relativ zum Datenumfang), und vermutlich nicht von Belange für die Fragestellung - aber ich weiß ja nicht was der Fragensteller vorhat...

Man kann die Muster aber erkennen (es ist kein "Sternenhimmel") und wenn man die Daten kennt kann man vermutlich Schlüsse daraus ziehen. Residuen sind sehr informativ! [Viel informativer als ein blöder p-Wert]

Re: Homoskedastizität bptest / gqtest

Verfasst: Sa Dez 28, 2019 2:27 pm
von Ries
EDi hat geschrieben: So Dez 22, 2019 8:49 pm Da sind schon (kleinere) Muster zu erkennen:

* wellenmuster maximum residuen - hast du irgendwelche hypothesen dafür (z.b. jahreszeit, Nutzergruppen, etc) und lohnt es sich diese ins model zu nehmen?
* "Fahnenmuster" links unten - das kommt machmal wenn es eine untere Grenze gibt unter welche die Daten nicht gehen können (z.b. kann eine Konzentration nicht negativ werden) - hast die irgendwelche hypothesen dafür und lohnt es sich diese ins model zu nehmen?
* Es scheint auch eine nicht-linearität drinzu sein - Mittelwert der residuen geht nach unten?

Wie gesagt, alles kleinere/minimale Muster. Kommt drauf an was du mit dem Modell anstellen willst obes gut genug für dich ist...
Bei der Datenmenge würde ich gar keine tests / p-werte anschauen, sonder grafisch bzw. mit hold-outs arbeiten...
Hallo EDi, danke für die Rückmeldung.
Der RESET-Test führt auch zu dem Ergebnis, dass keine Linearität vorliegt. Ich glaube, ich nehme nur einen Auszug von 500 Datensätzen aus dem gesamten Sample. Damit würde ich alle Tests bestehen und meine Regressionsgleichung wäre gültig... Das Regressionsmodell ist auch nicht kriegsentscheidend. Das ganze dient nur als Nachweis, dass man praktisch mit R arbeiten kann.

Re: Homoskedastizität bptest / gqtest

Verfasst: Mo Dez 30, 2019 8:00 pm
von EDi
Das ganze dient nur als Nachweis, dass man praktisch mit R arbeiten kann.
Das hätte ich dir auch schon vorher sagen können, dass R für praktische Arbeiten geeignet ist :lol: :lol: :lol: