Erledigt
Verfasst: Sa Dez 02, 2017 9:33 pm
Kann gelöscht werden.
Deutschsprachiges Forum zur Statistikumgebung R
http://www.forum.r-statistik.de/
Keine Ahnung. Vielleicht 20 Stunden?Kriegt das hier jemand hin? Falls ja, wie viel Aufwand wäre das?
Das lässt sehr viel Spielraum und scheinbare Freiheiten. Warum scheinbare Freiheiten? Weil einem korrigierenden Lehrer durchaus schon klar ist, wie er das in Vorlesung und Übung gemacht hat und was er sich unter "sorgfältig", oder "geeignet" vorstellt und welche diagnostischen Graphiken er empfohlen hat, mit welchem Paket er die Kreuzvalidierung gemacht hat.Bei der Modellschätzung ist insbesondere eine sorgfältige Variablenselektion und eine geeignete Modellauswahl vorzunehmen. Als Hilfsmittel sind Kreuzvalidierung, ROC Kurve, Diagnostische Graphiken etc. einzusetzen.
Ich glaube, es handelt sich hier eher um Datenprogrammierzwangsarbeit eines Doktoranden, keine Seminar-/ Hausarbeit Aufgabe.bigben hat geschrieben: So Dez 03, 2017 8:51 pm Wenn Du dem hier zu beauftragenden dahingehend keine Vorgaben machen kannst, wäre im Grundsatz rasch zu erkennen, wo eventuell ein Täuschungsversuch unternommen wird.
Sollte das der Fall sein, würde ich es ohnehin selbst versuchen (müssen). Es gab für die Aufgabe etwa 3 Stunden Einführung in R und ich habe vorher noch nie programmiert. Die Gewichtung der Aufgabe beträgt "nur" 1/4 des gesamten Kurses. Glaube, so könnt ihr besser nachvollziehen, warum ich nach einer Option suche.
Zusammen mitDie metrische Zielvariable ist somit das Merkmal "shares" bzw. die binäre Variable "popul", die den Wert 1 hat, falls die Anzahl der "shares" über einen bestimmte Wert liegt.
Passt doch irgendwie nicht?! Wenn man popul aus shares berechnen kann, dann reicht es doch wenn ich ein Model für shares habe (popul ergibt sich dann je nach Threshold).Die beiden unterschiedlichen Skalierungen erfordern unterschiedliche Modelle (Regression, binäre Klassifikation bzw logistische Regression).
Ich würde einfach einen beliebigen Machine Learning Algorithmus drauf werfen (random forest funktioniert oft sehr gut) und die predictions abgeben...Bei der Modellschätzung ist insbesondere eine sorgfältige Variablenselektion und eine geeignete Modellauswahl vorzunehmen. Als Hilfsmittel sind Kreuzvalidierung, ROC Kurve, Diagnostische Graphiken etc. einzusetzen.
Zusammen mitDie metrische Zielvariable ist somit das Merkmal "shares" bzw. die binäre Variable "popul", die den Wert 1 hat, falls die Anzahl der "shares" über einen bestimmte Wert liegt.
Passt doch irgendwie nicht?! Wenn man popul aus shares berechnen kann, dann reicht es doch wenn ich ein Model für shares habe (popul ergibt sich dann je nach Threshold).Die beiden unterschiedlichen Skalierungen erfordern unterschiedliche Modelle (Regression, binäre Klassifikation bzw logistische Regression).
Ich würde einfach einen beliebigen Machine Learning Algorithmus drauf werfen (random forest funktioniert oft sehr gut) und die predictions abgeben...Bei der Modellschätzung ist insbesondere eine sorgfältige Variablenselektion und eine geeignete Modellauswahl vorzunehmen. Als Hilfsmittel sind Kreuzvalidierung, ROC Kurve, Diagnostische Graphiken etc. einzusetzen.
Falls du dir professionelle Hilfe einkaufen willst, könntest Du es auch noch bei den einschlägigen Freelancer Portalen versuchenEDi hat geschrieben: Mo Dez 04, 2017 11:27 pm Falls du dir professionelle Hilfe einkaufen willst:
Den Forenbetreiber (student), berät in statistischen Fragen: http://www.r-statistik.de/Beratung/beratung.html
Oder auch Eoda (https://www.eoda.de/en/) welche z.B. auf R-Konferenz vertreten waren .
Das andere Forum (http://www.r-forum.de/) hat eine Statistik-Beratung dahinter, da kannst du auch Anfragen.