Asymmetrischer kernel für Kerndichteschätzer?
Verfasst: Do Mai 06, 2021 4:49 pm
Hallo Leute,
gegeben sei ein (nicht ganz hypothetischer) Fall eines Menschen mit einer chronischen Krankheit, die über Jahre mal aktiver und mal weniger aktiv ist und wenn das irgendwann aus dem Ruder läuft, wird man das Therapieregime ändern müssen. Ich entnehme meinem Krankenhausinformationssystem alle die Termine, an denen sie im Krankenhaus war und deute das als Hinweis auf Krankheitsaktivität. Mit fast realen Daten sieht das vielleicht so aus: (ggplot2, geom_rug und geom_density) Das linke (alte) Ende der Kurve ist mir egal. Die beginnt 2005 weil da ein neues Computersystem eingeführt wurde und ältere Informationen aufwändiger zu beschaffen wären. Wenn man die Ereignisse auf der x-Achse in neuester Zeit betrachtet, dann hat die Aktivität eher zugenommen, die Dichteschätzung durch geom_density() fällt aber ab. Bestimmt fällt die Dichte ab, weil die Daten zensiert sind bzw. es in der Zukunft (noch) keine Ereignisse gibt. Um eine Kurve zu zeichnen, die bei konstanter Vorstellungsfrequenz am rechten Ende nicht abnimmt müsste man wahrscheinlich eine Art unsymmetrischen kernel haben, der nur in die Vergangenheit, nicht aber in die Zukunft schaut. Diese hier sind aber alle symmetrisch.
Muss ich mir da selbst was programmieren oder kennt jemand eine benutzerfreundliche Implementation, die schon fertig auf CRAN rumliegt? Es erscheint mir so naheliegend, sowas für Zeitreihen zu haben, dass ich mir nicht vorstellen kann, der erste mit der Idee zu sein. Oder ist die Idee einfach schlecht?
LG,
Bernhard
gegeben sei ein (nicht ganz hypothetischer) Fall eines Menschen mit einer chronischen Krankheit, die über Jahre mal aktiver und mal weniger aktiv ist und wenn das irgendwann aus dem Ruder läuft, wird man das Therapieregime ändern müssen. Ich entnehme meinem Krankenhausinformationssystem alle die Termine, an denen sie im Krankenhaus war und deute das als Hinweis auf Krankheitsaktivität. Mit fast realen Daten sieht das vielleicht so aus: (ggplot2, geom_rug und geom_density) Das linke (alte) Ende der Kurve ist mir egal. Die beginnt 2005 weil da ein neues Computersystem eingeführt wurde und ältere Informationen aufwändiger zu beschaffen wären. Wenn man die Ereignisse auf der x-Achse in neuester Zeit betrachtet, dann hat die Aktivität eher zugenommen, die Dichteschätzung durch geom_density() fällt aber ab. Bestimmt fällt die Dichte ab, weil die Daten zensiert sind bzw. es in der Zukunft (noch) keine Ereignisse gibt. Um eine Kurve zu zeichnen, die bei konstanter Vorstellungsfrequenz am rechten Ende nicht abnimmt müsste man wahrscheinlich eine Art unsymmetrischen kernel haben, der nur in die Vergangenheit, nicht aber in die Zukunft schaut. Diese hier sind aber alle symmetrisch.
Muss ich mir da selbst was programmieren oder kennt jemand eine benutzerfreundliche Implementation, die schon fertig auf CRAN rumliegt? Es erscheint mir so naheliegend, sowas für Zeitreihen zu haben, dass ich mir nicht vorstellen kann, der erste mit der Idee zu sein. Oder ist die Idee einfach schlecht?
LG,
Bernhard