Jour fixe 2025-03-07: Unterschied zwischen den Versionen
(→Fehlende GND-IDNs in DFF-Personendatensätzen) |
(→Jour fixe, Freitag, 07. März 2025) |
||
Zeile 16: | Zeile 16: | ||
Fehler: 264; Schon vorhanden: 5392; Hinzugefügt: 147076</pre> | Fehler: 264; Schon vorhanden: 5392; Hinzugefügt: 147076</pre> | ||
− | Bei den 264 Fehlern handelt es sich um Personen, die irgendwann mal in der ZDB vorhanden gewesen sein müssen und deren Filmportal- | + | Bei den 264 Fehlern handelt es sich um Personen, die irgendwann mal in der ZDB vorhanden gewesen sein müssen und deren Filmportal-UID noch in Wikidata existiert. Eine Tabelle dieser verloren gegangenen Mappings liegt hier: [http://filmstandards.org/uploads/Wikidata-zu-ZDB--Mapping-Fehler.ods] |
=== Fehlende GND-IDNs in DFF-Personendatensätzen === | === Fehlende GND-IDNs in DFF-Personendatensätzen === |
Version vom 6. März 2025, 20:26 Uhr
Inhaltsverzeichnis
Jour fixe, Freitag, 07. März 2025
Wikidata-Identifikatoren-Abgleich mit ZDB und GND
Personen
- Es gibt aktuell 2.036.286 Wikidata-Items mit GND-ID, davon sind 1.819.242 Personen.
- Von den Personen-Items in Wikidata haben 152.734 einen Filmportal-UID
- Von den Personen-Datensätzen in der ZDB haben 5.468 einen Wikidata-Identifikator
Eine Konkordanztabelle Filmportal-ID zu Wikidata-ID ist mit dieser SPAQL-Abfrage zu haben:
SELECT ?o ?s WHERE { ?s wdt:P2639 ?o ; wdt:P31 wd:Q5 }
Verarbeiten der Konkordanztabelle liefert dieses Ergebnis:
Wikidata-IDs ergänzt aus Mapping-Tabelle '20250305_Matching_Person_ZDB-Wikidata' Ende: Thu, 06 Mar 2025 19:39:05 +0000 Fehler: 264; Schon vorhanden: 5392; Hinzugefügt: 147076
Bei den 264 Fehlern handelt es sich um Personen, die irgendwann mal in der ZDB vorhanden gewesen sein müssen und deren Filmportal-UID noch in Wikidata existiert. Eine Tabelle dieser verloren gegangenen Mappings liegt hier: [1]
Fehlende GND-IDNs in DFF-Personendatensätzen
Hiervon gibt es noch über 15.000. Dies sind teils
- Noch nicht bearbeitete Überbleibsel aus den DIF-GND-Matchings aus den Jahren 2012-2015, und
- Ergebnis der seit 2012 wiederholt aufgetretenen Übertragungsfehler bei SCUSI bzw. GND-PICA.
Eine automatisches Übertragen in die GND würde eine große Anzahl von Dubletten peroduzieren, weil
- etliche dieser Personen mittlerweile von anderen GND-Partnern in der GND angelegt wurden
- viele schon vorher in der GND existierten, aber wegen abgebrochener Datenübertragung nicht in die ZDB importiert werden konnten.
Außerdem wäre zu erörtern, ob ZDB-Personendatensätze ohne Chance auf Individualisierung überhaupt zu GND-Normdatensätzen werden (und damit in weitere Normdateien wandern) sollten. Dazu würden