Hier werden die Konfigurationen zur Verknüpfung der swissbib Personendaten mit den DBPedia-Daten erstellt
Der Aufruf des Jar - Files:
java -jar $root_dir/genconfig-tool/genconfig-1.0-SNAPSHOT.jar
limes
/swissbib_index/linking/data/swissbib/swissbib_blocks
/swissbib_index/linking/data/dbpedia/dbpedia_blocks
/swissbib_index/linking/linking/templates/swissbib-dbpedia_birthDate.xml.template
/swissbib_index/linking/linking/configs
Das Programm prüft ob:
a) die Datendirectories vorhanden sind (swissbibblocks, dbpedia_blocks)
b) eine korrekte Verknüpfungsmethode angegeben wird (wir verwenden ausschliesslich limes, zu anfangs des Projekts haben wir noch mit silk gearbeitet)
c) anschliessend vergleicht es die in den Datendirectories vorhandenen Dateinen und erstellt zueinander passende "Paare"
wie das konkret aussieht zeigt die nächste Abbildung
d) Die files in den Daten-directories werden im Schritt preprocess_swissbib.sh generiert (s. dort)
e) Das Template des Konfigurationsfiles https://github.com/linked-swissbib/linking_enrichment_environment/blob/master/linking/templates/swissbib-dbpedia_birthDate.xml.template wird gelesen und mit den gesammelten, zueinander gehörenden Paaren ergänzt.
Für jedes Paar (bei Felix Blocking) wird ein einzelnes Konfigurationsfile erstellt.
Dieses sieht zum Beipiel wie folgt aus:
https://gist.github.com/guenterh/e29ae67169150c2fbdedc28feb4360f8