Jour fixe 2025-03-07: Unterschied zwischen den Versionen
(→Wikidata-Identifikatoren-Abgleich mit ZDB und GND) |
(→Fehlende GND-IDNs in DFF-Personendatensätzen) |
||
Zeile 22: | Zeile 22: | ||
* Noch nicht bearbeitete Überbleibsel aus den DIF-GND-Matchings aus den Jahren 2012-2015, und | * Noch nicht bearbeitete Überbleibsel aus den DIF-GND-Matchings aus den Jahren 2012-2015, und | ||
* Ergebnis der seit 2012 wiederholt aufgetretenen Übertragungsfehler bei SCUSI bzw. GND-PICA. | * Ergebnis der seit 2012 wiederholt aufgetretenen Übertragungsfehler bei SCUSI bzw. GND-PICA. | ||
+ | Eine automatisches Übertragen in die GND würde eine große Anzahl von Dubletten peroduzieren, weil | ||
+ | * etliche dieser Personen mittlerweile von anderen GND-Partnern in der GND angelegt wurden | ||
+ | * viele schon vorher in der GND existierten, aber wegen abgebrochener Datenübertragung nicht in die ZDB importiert werden konnten. | ||
+ | Außerdem wäre zu erörtern, ob ZDB-Personendatensätze ohne Chance auf Individualisierung überhaupt zu GND-Normdatensätzen werden (und damit in weitere Normdateien wandern) sollten. Dazu würden |
Version vom 6. März 2025, 20:25 Uhr
Inhaltsverzeichnis
Jour fixe, Freitag, 07. März 2025
Wikidata-Identifikatoren-Abgleich mit ZDB und GND
Personen
- Es gibt aktuell 2.036.286 Wikidata-Items mit GND-ID, davon sind 1.819.242 Personen.
- Von den Personen-Items in Wikidata haben 152.734 einen Filmportal-UID
- Von den Personen-Datensätzen in der ZDB haben 5.468 einen Wikidata-Identifikator
Eine Konkordanztabelle Filmportal-ID zu Wikidata-ID ist mit dieser SPAQL-Abfrage zu haben:
SELECT ?o ?s WHERE { ?s wdt:P2639 ?o ; wdt:P31 wd:Q5 }
Verarbeiten der Konkordanztabelle liefert dieses Ergebnis:
Wikidata-IDs ergänzt aus Mapping-Tabelle '20250305_Matching_Person_ZDB-Wikidata' Ende: Thu, 06 Mar 2025 19:39:05 +0000 Fehler: 264; Schon vorhanden: 5392; Hinzugefügt: 147076
Bei den 264 Fehlern handelt es sich um Personen, die irgendwann mal in der ZDB vorhanden gewesen sein müssen und deren Filmportal-UIDs noch in Wikidata existiert. Eine Tabelle dieser verloren gegangenen Mappings liegt hier: [1]
Fehlende GND-IDNs in DFF-Personendatensätzen
Hiervon gibt es noch über 15.000. Dies sind teils
- Noch nicht bearbeitete Überbleibsel aus den DIF-GND-Matchings aus den Jahren 2012-2015, und
- Ergebnis der seit 2012 wiederholt aufgetretenen Übertragungsfehler bei SCUSI bzw. GND-PICA.
Eine automatisches Übertragen in die GND würde eine große Anzahl von Dubletten peroduzieren, weil
- etliche dieser Personen mittlerweile von anderen GND-Partnern in der GND angelegt wurden
- viele schon vorher in der GND existierten, aber wegen abgebrochener Datenübertragung nicht in die ZDB importiert werden konnten.
Außerdem wäre zu erörtern, ob ZDB-Personendatensätze ohne Chance auf Individualisierung überhaupt zu GND-Normdatensätzen werden (und damit in weitere Normdateien wandern) sollten. Dazu würden