Jour fixe 2025-03-07: Unterschied zwischen den Versionen
(→Personen) |
(→Wikidata-Identifikatoren-Abgleich mit ZDB und GND) |
||
Zeile 18: | Zeile 18: | ||
Bei den 264 Fehlern handelt es sich um Personen, die irgendwann mal in der ZDB vorhanden gewesen sein müssen und deren Filmportal-UID noch in Wikidata existiert. Eine Tabelle dieser verloren gegangenen Mappings liegt hier: [http://filmstandards.org/uploads/Wikidata-zu-ZDB--Mapping-Fehler.ods] | Bei den 264 Fehlern handelt es sich um Personen, die irgendwann mal in der ZDB vorhanden gewesen sein müssen und deren Filmportal-UID noch in Wikidata existiert. Eine Tabelle dieser verloren gegangenen Mappings liegt hier: [http://filmstandards.org/uploads/Wikidata-zu-ZDB--Mapping-Fehler.ods] | ||
− | Eine weitere automatisierte Funktion sollte jetzt noch Personen-Datensätze mit GND-ID und ohne Wikidata-ID daraufhin prüfen, ob die GND-ID in Wikidata existiert, so dass auch in diesen Fällen noch ein Wikidata-ID ergänzt werden kann. | + | Es gibt jetzt 3.302 Personen-Datensätze ohne GND-ID, die aber einen Wikidata-ID haben. Etliche dieser Wikidata-Items dürften noch neue GND-IDNs zutage fürdern. Eine Liste dieser Fälle ist mit dieser ZDB-Abfrage zu erhalten: |
+ | |||
+ | <pre>select * from person where (ExtIDs LIKE "%wd:%") AND NOT (ExtIDs LIKE "%GND:__%")</pre> | ||
+ | |||
+ | Eine weitere automatisierte Funktion sollte jetzt noch die 92.259 Personen-Datensätze mit GND-ID und ohne Wikidata-ID daraufhin prüfen, ob die GND-ID in Wikidata existiert, so dass auch in diesen Fällen noch ein Wikidata-ID ergänzt werden kann. | ||
=== Fehlende GND-IDNs in DFF-Personendatensätzen === | === Fehlende GND-IDNs in DFF-Personendatensätzen === |
Version vom 7. März 2025, 09:13 Uhr
Inhaltsverzeichnis
Jour fixe, Freitag, 07. März 2025
Wikidata-Identifikatoren-Abgleich mit ZDB und GND
Personen
- Es gibt aktuell 2.036.286 Wikidata-Items mit GND-ID, davon sind 1.819.242 Personen.
- Von den Personen-Items in Wikidata haben 152.734 einen Filmportal-UID
- Von den Personen-Datensätzen in der ZDB haben 5.468 einen Wikidata-Identifikator
Eine Konkordanztabelle Filmportal-ID zu Wikidata-ID ist mit dieser SPAQL-Abfrage zu haben:
SELECT ?o ?s WHERE { ?s wdt:P2639 ?o ; wdt:P31 wd:Q5 }
Verarbeiten der Konkordanztabelle liefert dieses Ergebnis:
Wikidata-IDs ergänzt aus Mapping-Tabelle '20250305_Matching_Person_ZDB-Wikidata' Ende: Thu, 06 Mar 2025 19:39:05 +0000 Fehler: 264; Schon vorhanden: 5392; Hinzugefügt: 147076
Bei den 264 Fehlern handelt es sich um Personen, die irgendwann mal in der ZDB vorhanden gewesen sein müssen und deren Filmportal-UID noch in Wikidata existiert. Eine Tabelle dieser verloren gegangenen Mappings liegt hier: [1]
Es gibt jetzt 3.302 Personen-Datensätze ohne GND-ID, die aber einen Wikidata-ID haben. Etliche dieser Wikidata-Items dürften noch neue GND-IDNs zutage fürdern. Eine Liste dieser Fälle ist mit dieser ZDB-Abfrage zu erhalten:
select * from person where (ExtIDs LIKE "%wd:%") AND NOT (ExtIDs LIKE "%GND:__%")
Eine weitere automatisierte Funktion sollte jetzt noch die 92.259 Personen-Datensätze mit GND-ID und ohne Wikidata-ID daraufhin prüfen, ob die GND-ID in Wikidata existiert, so dass auch in diesen Fällen noch ein Wikidata-ID ergänzt werden kann.
Fehlende GND-IDNs in DFF-Personendatensätzen
Hiervon gibt es noch über 15.000. Dies sind teils
- Noch nicht bearbeitete Überbleibsel aus den DIF-GND-Matchings aus den Jahren 2012-2015, und
- Ergebnis der seit 2012 wiederholt aufgetretenen Übertragungsfehler bei SCUSI bzw. GND-PICA.
Eine automatisches Übertragen in die GND würde eine große Anzahl von Dubletten peroduzieren, weil
- etliche dieser Personen mittlerweile von anderen GND-Partnern in der GND angelegt wurden
- viele schon vorher in der GND existierten, aber wegen abgebrochener Datenübertragung nicht in die ZDB importiert werden konnten.
Außerdem wäre zu erörtern, ob ZDB-Personendatensätze ohne Chance auf Individualisierung überhaupt zu GND-Normdatensätzen werden (und damit in weitere Normdateien wandern) sollten. Dazu würden Peronen zählen, von denen bloß ein Vor- oder Nachname ohne weitere Merkmale bekannt ist, oder nicht weiter identifizierte Personen in der Funktion "Mitwirkung".