Daten aus einer apriori Analyse wieder zusammenbringen
Verfasst: Di Mai 19, 2020 2:31 pm
Hallo zusammen,
also ich habe keinerlei Ahnung von R oder Statistik, bin da aber über ein interessantes Thema gestoßen das mich jetzt seit Tagen beschäftigt. Leider geht es gerade nicht so richtig weiter und ich finde auch keine ähnlichen Problemstellungen.
Auf Basis einer Datei namens Transaktionen.csv in der in ersten Spalte Auftragsnummern stehen und in einer zweiten Spalte die im Rahmen der Aufträge verkauften Artikel, habe ich jetzt mittels einer apriori Analyse diese Daten auf Regeln untersucht und bekomme diese jetzt auch in eine csv-Datei.Letztlich geht es mir hierbei nicht was apriori macht, sondern ich suche in den Daten einfach nur Häufigkeiten. Also gibt es Artikel die immer wieder in Aufträgen zusammen vorkommen. Sowas in der Richtugn macht apriori ja auch...
Die Regeln (in Summe rund 340.000) sehen dabei jetzt grob so aus, wobei X8, X9, X13 beispielhaft Artikelnummern sind:
1 "{X8,X9,X13} => {X88}" 0.0103954702291427 0.955284552845528 18.7133124797452 235
2 "{X8,X9,X36} => {X88}" 0.0103954702291427 0.955284552845528 25.3762192733561 235
Jetzt muss ich im nächsten Schritt allerdings zu diesen Regeln wieder die entsprechenden Aufträge aus meinen Basisdaten finden, auf die die Regel zutreffend ist.
Eigentlich interessiert mich nämlich nicht das Ergebnis der apriori Analyse, sondern nur der kleine Bereich {X8,X9,X13}, bzw. die tausend anderen Kombinationen.
Gibt es hier jetzt eine Möglichkeit diese Regeln wieder mit meinen Ursprungdaten zu verknüpfen. Ziel ist es also pro Regel, alle entsprechenden Fertigungsartäge zu finden, in denen die Regel 1 und alle anderen zutrifft? Also z.B. eine Ausgabe wie folgt:
1: {Auftrag 23, Auftrag 45,Auftrag 77}
1: {Auftrag 23, Auftrag 45,Auftrag 180}
Ich hoffe ich habe das ein wenig verständlich ausgedrückt. Wenn ihr euch fragt, warum ich die Daten so brauche, es geht darum, dass ich die Daten in meinen Datenbanken noch auf andere Themen analysieren möchte.
Ansonsten schon einmal vielen Dank im Voraus und viele Grüße in das Forum
also ich habe keinerlei Ahnung von R oder Statistik, bin da aber über ein interessantes Thema gestoßen das mich jetzt seit Tagen beschäftigt. Leider geht es gerade nicht so richtig weiter und ich finde auch keine ähnlichen Problemstellungen.
Auf Basis einer Datei namens Transaktionen.csv in der in ersten Spalte Auftragsnummern stehen und in einer zweiten Spalte die im Rahmen der Aufträge verkauften Artikel, habe ich jetzt mittels einer apriori Analyse diese Daten auf Regeln untersucht und bekomme diese jetzt auch in eine csv-Datei.Letztlich geht es mir hierbei nicht was apriori macht, sondern ich suche in den Daten einfach nur Häufigkeiten. Also gibt es Artikel die immer wieder in Aufträgen zusammen vorkommen. Sowas in der Richtugn macht apriori ja auch...
Die Regeln (in Summe rund 340.000) sehen dabei jetzt grob so aus, wobei X8, X9, X13 beispielhaft Artikelnummern sind:
1 "{X8,X9,X13} => {X88}" 0.0103954702291427 0.955284552845528 18.7133124797452 235
2 "{X8,X9,X36} => {X88}" 0.0103954702291427 0.955284552845528 25.3762192733561 235
Jetzt muss ich im nächsten Schritt allerdings zu diesen Regeln wieder die entsprechenden Aufträge aus meinen Basisdaten finden, auf die die Regel zutreffend ist.
Eigentlich interessiert mich nämlich nicht das Ergebnis der apriori Analyse, sondern nur der kleine Bereich {X8,X9,X13}, bzw. die tausend anderen Kombinationen.
Gibt es hier jetzt eine Möglichkeit diese Regeln wieder mit meinen Ursprungdaten zu verknüpfen. Ziel ist es also pro Regel, alle entsprechenden Fertigungsartäge zu finden, in denen die Regel 1 und alle anderen zutrifft? Also z.B. eine Ausgabe wie folgt:
1: {Auftrag 23, Auftrag 45,Auftrag 77}
1: {Auftrag 23, Auftrag 45,Auftrag 180}
Ich hoffe ich habe das ein wenig verständlich ausgedrückt. Wenn ihr euch fragt, warum ich die Daten so brauche, es geht darum, dass ich die Daten in meinen Datenbanken noch auf andere Themen analysieren möchte.
Ansonsten schon einmal vielen Dank im Voraus und viele Grüße in das Forum