Seite 1 von 1

Spalten aus unterschiedlichen dataframes abgleichen und dummy einfügen

Verfasst: Do Okt 01, 2020 7:24 pm
von nala
Hallo Leute,

ich habe nun bereits einige Zeit im Internet recherchiert, bin aber zu keiner Lösung meines Problems gekommen.
Vielleicht kann mir hier ja jemand helfen.

Also, ich habe zwei dataframes:
dfA: Beinhaltet u.a. eine Spalte mit URLs in diesem Format:" https://www.xyz.com/...".
dfB: Beinhaltet ca. 280 URLs, nach denen ich in dfA Ausschau halten möchte in diesem Format: "xyz.com"

Nun würde ich gerne diese beiden Spalten aus den beiden dataframes abgleichen und eine dummy Variable in dfA einfügen.
Diese Dummy Variable soll eine 1 in der Zeile eintragen, wenn in dfA in der entsprechenden Zeile in der URL-Spalte ein Link vorkommt, der auch in dfB vorkommt.
Wenn in der entsprechenden Zeile bei dfA kein Link vorhanden ist, der auch in dfB vorkommt, soll natürlich eine 0 eingetragen werden. So in etwa:

dfA:
<urls>
https://www.xyz.com/xy
https://www.abc.com/xy
https://www.ghi.com/xy

dfB:
<urls>
123.com
xyz.com
def.com

dfA (Ziel):
<urls> <dummy>
https://www.xyz.com/xy 1
https://www.abc.com/xy 0
https://www.ghi.com/xy 0


Leider weiß ich nicht so Recht, wie ich hier Beispiele einfügen kann, bin noch ganz neu hier. :oops:
Ich hoffe, ich habe mich trotzdem verständlich ausgedrückt und hier kann mir jemand helfen.

Viele Grüße,
Nala

Re: Spalten aus unterschiedlichen dataframes abgleichen und dummy einfügen

Verfasst: Do Okt 01, 2020 11:33 pm
von EDi
?merge


Zusammen mit ?paste für https anzuhängen und ?gsub für die root domain zu isolieren.

Für alles andere bitte ein reproduzierbares Beispiel anfügen.