Re: Vergleich von Spalten aus zwei Dataframes
Verfasst: Fr Okt 09, 2020 1:20 pm
Hallo Simon,
mit dem Ergebnis
... kurz: ich kann Dein Ergebnis nicht reproduzieren.
Da die Anzahl der Elemente jeweils verschieden sein kann, ist eine tabellarische Darstellung nicht auf natürliche Weise gegeben.
Gruß,Jörg
bei mir sieht das so aus:Leuchte03 hat geschrieben: Fr Okt 09, 2020 11:45 am super erkannt dem Abgleich von unique IDs. Nur leider bin ich an dieser Stelle etwas mit meinen derzeitigen R-Kenntnissen überfragt. z.B. warum der Vector letztlich NULL ausgibt, siehe Consolen-Output unten.Code: Alles auswählen
> head(lU, 3) NULL > head(lObj, 3) NULL
Code: Alles auswählen
library("xlsx")
setwd("~/Desktop/R.Zeug/Leuchte")
GISDaten <- read.xlsx2("Vergleich.xlsx", 1, header=TRUE)
lU <- levels(GISDaten$UFL_ID)
lObj <- levels(GISDaten$Objektschluessel)
head(lU, 3)
head(lObj, 3)
Code: Alles auswählen
> head(lU, 3)
[1] "" "070090103102013001a01" "070090103102013001a02"
> head(lObj, 3)
[1] "" "070090103102013001A00" "070090103102013001a01"
also sowas wie:Ich stelle mir vor, dass diese unique IDs in zwei Spalten verglichen werden und am Ende ein Output herauskommt ähnlich merge(). Nach dem Motto links enhalten, rechts nicht enthalten und rechts enthalten, links nicht enthalten.
Code: Alles auswählen
list(gesamt=union(lU, lObj), gemeinsam=intersect(lU, lObj),
lU_nicht.in.lObj=setdiff(lU, lObj), lObj_nich.in.lU=setdiff(lObj, lU))
Gruß,Jörg