Seite 1 von 1

Jahresdurchschnitt - Verwirrung

Verfasst: Fr Jan 15, 2021 9:45 pm
von Anfaenger123
Hallo zusammen,

Ich stehe gerade auf dem Schlauch und hoffe ihr könnt mir weiterhelfen.
In meinen Datensatz habe ich Artikel und welche Medien diese zitieren + das Jahr.

Nun möchte ich den Durschnitt (mean) errechnen, und zwar pro Jahr pro Artikel. Also, wie viele Medien zitiert jeder Artikel pro Jahr und im Anschluss zusammenfassend zu einem Wert pro Jahr: was ist der durchnittliche Jahreswert (der Nenner soll die gesamte Menge aller Artikel sein).

Und genau hier stehe ich, wie gesagt, gewaltig auf dem Schlauch. Für den Jahresdurchschnitt, benutze ich nun die mean() Funktion, nehme also den Mean aller „Teildurchschnitte“ oder summiere ich die zahl der zitierten Artikel auf und teile es durch die Menge aller Artikel?

Beides gibt unterschiedliche Ergebnisse, aber ich verstehe gerade einfach nicht a) warum und b) was die richtige Vorgehensweise ist.

Danke vorba fuer eure Hilfe.

Re: Jahresdurchschnitt - Verwirrung

Verfasst: Sa Jan 16, 2021 6:37 am
von EDi
Verstehe ich nicht :? Bitte ein reproduzierbares Beispiel posten.

Re: Jahresdurchschnitt - Verwirrung

Verfasst: Sa Jan 16, 2021 10:24 am
von Anfaenger123
EDi hat geschrieben: Sa Jan 16, 2021 6:37 am Verstehe ich nicht :? Bitte ein reproduzierbares Beispiel posten.
Entschuldige falls es nicht klar war und danke für deine Antwort.
Es geht genau genommen um dieses Problem:
https://stats.stackexchange.com/questio ... d-from-the
(englisch)

Also, ich weiß dass es einen Unterschied macht ob ich die mean() aller Elemente in der Gruppe nehme und daraus dann den gesamten Durschnitt bilde oder ob ich die Gruppe aufsummiere und daraus den Durschnitt bilde. WIe in folgendem Codeschnipzel zu sehen ist:

Code: Alles auswählen

group1 = c(1,2,3)
group2 = c(4,5,6,7,8,9)
mean(group1)
#  2
mean(group2)
#  6.5
mean(c(group1, group2))
#  5
mean(c(mean(group1), mean(group2)))
#  4.25
Meine Frage ist: Ja es gibt einen Unterschied, aber warum? Bzw. wie lassen sich die beiden Ergebnisse unterschiedlich interpretieren?

Re: Jahresdurchschnitt - Verwirrung

Verfasst: Sa Jan 16, 2021 12:39 pm
von Athomas
Lilli, das einzige Mädchen der Klasse, wiegt 45kg.
Ihre 19 Klassenkameraden sind alle ziemliche (natürlich männliche) Honks und wiegen im Durchschnitt 85kg.

Würdest Du jetzt sagen, das durchschnittliche Gewicht der Klasse ist (45 + 85)/2, also 65kg?
Wenn nein, wie würdest Du denn diesen Durchschnitt nennen?

Re: Jahresdurchschnitt - Verwirrung

Verfasst: Sa Jan 16, 2021 12:40 pm
von jogo
Um aus den arithmetischen Mitteln von zwei Gruppen sachlogisch richtig den Gesamtdurchschnitt zu berechnen, musst Du die beiden Mittelwerte mit der Anzahl der Elemente der Gruppe wichten. Das ist die Aggregationseigenschaft des arithmetischen Mittels.

Code: Alles auswählen

(n1*mean1 + n2*mean2)/(n1 + n2)
Für Dich also:

Code: Alles auswählen

group1 <- c(1,2,3)
group2 <- c(4,5,6,7,8,9)
m <- c(mean(group1), mean(group2))
weighted.mean(m, lengths(list(group1, group2)))
mean(c(group1, group2))
Gruß, Jörg

Re: Jahresdurchschnitt - Verwirrung

Verfasst: Mo Jan 18, 2021 9:04 am
von Anfaenger123
Vielen Dank euch beiden für die Veranschaulichung und die hilfe.
V.a. der Hinweis mit der Gewichtung hat mir sehr geholfen.