Spalten aus unterschiedlichen dataframes abgleichen und dummy einfügen
Verfasst: Do Okt 01, 2020 7:24 pm
Hallo Leute,
ich habe nun bereits einige Zeit im Internet recherchiert, bin aber zu keiner Lösung meines Problems gekommen.
Vielleicht kann mir hier ja jemand helfen.
Also, ich habe zwei dataframes:
dfA: Beinhaltet u.a. eine Spalte mit URLs in diesem Format:" https://www.xyz.com/...".
dfB: Beinhaltet ca. 280 URLs, nach denen ich in dfA Ausschau halten möchte in diesem Format: "xyz.com"
Nun würde ich gerne diese beiden Spalten aus den beiden dataframes abgleichen und eine dummy Variable in dfA einfügen.
Diese Dummy Variable soll eine 1 in der Zeile eintragen, wenn in dfA in der entsprechenden Zeile in der URL-Spalte ein Link vorkommt, der auch in dfB vorkommt.
Wenn in der entsprechenden Zeile bei dfA kein Link vorhanden ist, der auch in dfB vorkommt, soll natürlich eine 0 eingetragen werden. So in etwa:
dfA:
<urls>
https://www.xyz.com/xy
https://www.abc.com/xy
https://www.ghi.com/xy
dfB:
<urls>
123.com
xyz.com
def.com
dfA (Ziel):
<urls> <dummy>
https://www.xyz.com/xy 1
https://www.abc.com/xy 0
https://www.ghi.com/xy 0
Leider weiß ich nicht so Recht, wie ich hier Beispiele einfügen kann, bin noch ganz neu hier.
Ich hoffe, ich habe mich trotzdem verständlich ausgedrückt und hier kann mir jemand helfen.
Viele Grüße,
Nala
ich habe nun bereits einige Zeit im Internet recherchiert, bin aber zu keiner Lösung meines Problems gekommen.
Vielleicht kann mir hier ja jemand helfen.
Also, ich habe zwei dataframes:
dfA: Beinhaltet u.a. eine Spalte mit URLs in diesem Format:" https://www.xyz.com/...".
dfB: Beinhaltet ca. 280 URLs, nach denen ich in dfA Ausschau halten möchte in diesem Format: "xyz.com"
Nun würde ich gerne diese beiden Spalten aus den beiden dataframes abgleichen und eine dummy Variable in dfA einfügen.
Diese Dummy Variable soll eine 1 in der Zeile eintragen, wenn in dfA in der entsprechenden Zeile in der URL-Spalte ein Link vorkommt, der auch in dfB vorkommt.
Wenn in der entsprechenden Zeile bei dfA kein Link vorhanden ist, der auch in dfB vorkommt, soll natürlich eine 0 eingetragen werden. So in etwa:
dfA:
<urls>
https://www.xyz.com/xy
https://www.abc.com/xy
https://www.ghi.com/xy
dfB:
<urls>
123.com
xyz.com
def.com
dfA (Ziel):
<urls> <dummy>
https://www.xyz.com/xy 1
https://www.abc.com/xy 0
https://www.ghi.com/xy 0
Leider weiß ich nicht so Recht, wie ich hier Beispiele einfügen kann, bin noch ganz neu hier.

Ich hoffe, ich habe mich trotzdem verständlich ausgedrückt und hier kann mir jemand helfen.
Viele Grüße,
Nala