Spalten aus unterschiedlichen dataframes abgleichen und dummy einfügen

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

Antworten
nala
Beiträge: 3
Registriert: Do Okt 01, 2020 6:40 pm

Spalten aus unterschiedlichen dataframes abgleichen und dummy einfügen

Beitrag von nala »

Hallo Leute,

ich habe nun bereits einige Zeit im Internet recherchiert, bin aber zu keiner Lösung meines Problems gekommen.
Vielleicht kann mir hier ja jemand helfen.

Also, ich habe zwei dataframes:
dfA: Beinhaltet u.a. eine Spalte mit URLs in diesem Format:" https://www.xyz.com/...".
dfB: Beinhaltet ca. 280 URLs, nach denen ich in dfA Ausschau halten möchte in diesem Format: "xyz.com"

Nun würde ich gerne diese beiden Spalten aus den beiden dataframes abgleichen und eine dummy Variable in dfA einfügen.
Diese Dummy Variable soll eine 1 in der Zeile eintragen, wenn in dfA in der entsprechenden Zeile in der URL-Spalte ein Link vorkommt, der auch in dfB vorkommt.
Wenn in der entsprechenden Zeile bei dfA kein Link vorhanden ist, der auch in dfB vorkommt, soll natürlich eine 0 eingetragen werden. So in etwa:

dfA:
<urls>
https://www.xyz.com/xy
https://www.abc.com/xy
https://www.ghi.com/xy

dfB:
<urls>
123.com
xyz.com
def.com

dfA (Ziel):
<urls> <dummy>
https://www.xyz.com/xy 1
https://www.abc.com/xy 0
https://www.ghi.com/xy 0


Leider weiß ich nicht so Recht, wie ich hier Beispiele einfügen kann, bin noch ganz neu hier. :oops:
Ich hoffe, ich habe mich trotzdem verständlich ausgedrückt und hier kann mir jemand helfen.

Viele Grüße,
Nala
Benutzeravatar
EDi
Beiträge: 1605
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Spalten aus unterschiedlichen dataframes abgleichen und dummy einfügen

Beitrag von EDi »

?merge


Zusammen mit ?paste für https anzuhängen und ?gsub für die root domain zu isolieren.

Für alles andere bitte ein reproduzierbares Beispiel anfügen.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten