Jour fixe 2025-04-04: Unterschied zwischen den Versionen

Aus DIF Filmographie Wiki
Wechseln zu: Navigation, Suche
(Die Seite wurde neu angelegt: „== Jour fixe, Freitag, 07. März 2025 == === Wikidata-Identifikatoren-Abgleich mit ZDB und GND === ==== Personen ==== Es gibt jetzt, nach automatischer Übern…“)
 
(Wikidata-Identifikatoren-Abgleich mit DFF-ZDB und GND)
 
(18 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
== Jour fixe, Freitag, 07. März 2025 ==
+
== Jour fixe, Freitag, 04. April 2025 ==
  
=== Wikidata-Identifikatoren-Abgleich mit ZDB und GND ===
+
=== Frage an Detlev ===
 +
Im Rahmen der Bearbeitung des Tätigkeitenvokabulars auf filmportal.de haben wir uns die Tabelle reldef näher angeschaut und haben eine kurze Rückfrage.
 +
Dort sind wir in der Spalte "Domain" auf die Abkürzung TD gestoßen: wir gehen davon aus, dass es Textdokument bedeutet, stimmt das? Analog dazu: MW = Musikwerk und WV = Werkvorlage, oder?
 +
 
 +
z.B.
 +
{| class="wikitable mw-datatable" style="background-color:#FFFFFF"
 +
|-
 +
! style="background-color:#669999" | Relator !! style="background-color:#669999" | Relator Gruppe !! style="background-color:#669999" | Notation !! style="background-color:#669999" | Domain !! style="background-color:#669999" | Range !! style="background-color:#669999" | Scope !! style="background-color:#669999" | Display Form !! style="background-color:#669999" |
 +
|-
 +
| Interviewpartner
 +
|
 +
|
 +
| TD
 +
| P
 +
|
 +
| Interviewpartner
 +
|}
 +
 
 +
Ja, das besagt, dass wir ein Textdokument haben, in dem die Person als Interviewpartner in Erscheinung tritt. Bisher ist das erst einmal angewandt wurden, bei Brigitte Helm:
 +
 
 +
<pre>select relation.Rel, person.uid as PersonUID, person.IDName from relation
 +
join person on person.uid=relation.ObjUID
 +
where (relation.SubjEnt="TD")
 +
</pre>
 +
 
 +
=== Wikidata-Identifikatoren-Abgleich mit DFF-ZDB und GND ===
 
==== Personen ====
 
==== Personen ====
Es gibt jetzt, nach automatischer Übernahme von Wikidata-IDs 3.298 Personen-Datensätze mit Wikidata-ID ohne GND-IDN. Ein großer Teil hiervon dürfte in der GND vorhanden sein und in diesen Fällen sollte die Wikidata-GND-Property ausgewertet werden um die GND-IDN in der ZDB nachzutragen.
+
Es gibt jetzt, nach automatischer Übernahme von Wikidata-IDs, 3.298 Personen-Datensätze mit Wikidata-ID ohne GND-IDN. Ein großer Teil hiervon dürfte in der GND vorhanden sein und in diesen Fällen sollte die Wikidata-GND-Property ausgewertet werden um die GND-IDN in der ZDB nachzutragen:
 +
 
 +
<pre>SELECT ExtIDs, IDName, uid FROM person WHERE
 +
  ((ExtIDs LIKE "%WD:%") AND NOT (ExtIDs LIKE "%GND:__%"))</pre>
 +
 
Dieser Vorgang lässt sich ZDB-seitig als Roboter-Skript ("Bot") realisieren. Anders als bei der ersten Wikidata-Personen-Auswertung sollte dieser Bot nicht als ungebremste Black Box arbeiten, sondern (1) überwacht und (2) gebremst, um die Nachrührung im Filmportal nicht zu überlasten.
 
Dieser Vorgang lässt sich ZDB-seitig als Roboter-Skript ("Bot") realisieren. Anders als bei der ersten Wikidata-Personen-Auswertung sollte dieser Bot nicht als ungebremste Black Box arbeiten, sondern (1) überwacht und (2) gebremst, um die Nachrührung im Filmportal nicht zu überlasten.
 +
 +
==== Übermitteln neuer Matches an Wikidata ====
 +
Mögliche Vorgehensweisen anhand von Kristinas Erkundigungen und den Beschreibungen [https://www.wikidata.org/wiki/Wikidata:Data_donation/de#Wie_man_Daten_zu_Wikidata_hinzuf%C3%BCgt] bei Wikidata.
 +
 +
=== Rückfrage zur Pflege der Wikidata-Zuordnungen (Bianca) ===
 +
Wir haben letzte Woche eine Dublette mit je einem Wikidata-Identfier zusammengelegt: Elvira Jende (GND:1061860523 WD:Q95672104) mit Ria Jende (Gewinner, GND:1061491439 WD:Q15842337)
 +
Wie ist hier in Zukunft zu verfahren? bei GND-Änderungen solcher Art melden wir das Herrn Senftleben. wenn ein GND-Identifier dabei ist, sollte sich das aktualisieren, sobald Senftleben die Dublette beseitigt, oder? Und was wenn es keine GND-Nummer gibt?
 +
 +
 +
=== Personen ===
 +
 +
==== SCUSI-Übertragungsfehler ====
 +
Beim Speichern geänderter Personendaten kommt es nach wie vor zu Fehlermeldungen seitens der GND. Nach bisheriger Untersuchung scheint dies immer dann der Fall zusein, wenn eine Angabe zur Person geändert wurde, für die schon eine entsprechende Aussage in der GND vorhanden ist. Das SCUSI-Protokoll definiert zwar eine "replace"-Anweisung, aber deren Ausführung führt anscheinend zu Konflikten, die im Update-Vorgang der GND nicht gelöst werden können.
 +
 +
Folge dieser Fehler scheint lediglich zu sein, dass vorhandene Aussagen in der GND so bleiben, wie sie sind. Hat die GND beispielsweise nur ein aufs Jahr genaues Geburtsdatum und das DFF möchte dies auf den Tag genau präzisieren, wird das als widersprechende Angabe interpretiert und abgelehnt. In der GND zuvor nicht vorhandene Angaben dagegen werden akzeptiert.
 +
 +
==== "Nicht-Normdaten" ====
 +
In der vorigen Besprechung wurde übereinstimmend festgestellt, dass bei Personen-Datensätzen eine Unterscheidung zwischen solchen mit und ohen Normdaten-Charakter sinnvoll ist. Als "Nicht-Normadaten" wären solche Datensätze zu betrachten, die nur zur Vervollständigung der Film-Credits aufgenommen wurden, aber außer einem (meist unvollständigen) Namen keine identifizierenden Daten enthalten.
 +
 +
Vorschlag: Diese Unterscheidung nicht nur für Personen, sondern auch für auch Körperschaften einführen.
 +
 +
=== Körperschaften ===
 +
Sind bisher nur mit geringer Priorität behandelt worden, können aber in einem LOD-Umfeld zu wichtigen Verknüpfungspunkten werden. Welche Herangehensweisen sind denkbar?
 +
 +
 +
==== Körperschaften ansetzen (bianca) ====
 +
- Sind immer an Orte gebunden - gibt es eine Möglichkeit, den Ort auszublenden? bei Gruppierungen (z.B. Bands oder Künstlerkollektive) ist u.U. kein Ort vorhanden, da diese global aktiv sind (oder sich keiner Nationalität zuordnen bzw. sich kein Land recherchieren lässt). Momentan manipuliere ich via SQL den ID Namen.
 +
 +
- Namensansetzung: Momentan legen wir bei jeder Änderung der Gesellschaftsform einer Körperschaft einen neuen Eintrag an. Gab es schon einmal Überlegungen dies analog zu Personeneinträgen zu lösen oder zumindest in einer Beziehung der KS-Einträge zueinander (Vorgänger - Nachfolger?). in der Ausgabe auf Filmportal wäre das auch ein wünschenswertes Feature, um die Entwicklung einer Firma abzubilden (aktuell ist das Beispiel beetz brothers - ehemals gebrueder beetz filmproduktion [[https://zdb.dff.film/zf/ui/disp_ks.php?key=ks&uid=E5F7224E21A646BE95E5876053A730E8&skip=40]] - die wir noch voneinander trennen müssen)
 +
 +
==== Rang bei Credits (bianca) ====
 +
absolutes Luxus-Thema, aber wäre es problematisch, wenn man beim Relationen setzen von FW zu PS bzw. KS auch gleich den Rang mit eingeben könnte? beim Ordnen von großen Cast ist das u.U. wirklich nervenaufreibend ;)

Aktuelle Version vom 4. April 2025, 12:04 Uhr

Jour fixe, Freitag, 04. April 2025

Frage an Detlev

Im Rahmen der Bearbeitung des Tätigkeitenvokabulars auf filmportal.de haben wir uns die Tabelle reldef näher angeschaut und haben eine kurze Rückfrage. Dort sind wir in der Spalte "Domain" auf die Abkürzung TD gestoßen: wir gehen davon aus, dass es Textdokument bedeutet, stimmt das? Analog dazu: MW = Musikwerk und WV = Werkvorlage, oder?

z.B.

Relator Relator Gruppe Notation Domain Range Scope Display Form
Interviewpartner TD P Interviewpartner

Ja, das besagt, dass wir ein Textdokument haben, in dem die Person als Interviewpartner in Erscheinung tritt. Bisher ist das erst einmal angewandt wurden, bei Brigitte Helm:

select relation.Rel, person.uid as PersonUID, person.IDName from relation 
join person on person.uid=relation.ObjUID
where (relation.SubjEnt="TD")

Wikidata-Identifikatoren-Abgleich mit DFF-ZDB und GND

Personen

Es gibt jetzt, nach automatischer Übernahme von Wikidata-IDs, 3.298 Personen-Datensätze mit Wikidata-ID ohne GND-IDN. Ein großer Teil hiervon dürfte in der GND vorhanden sein und in diesen Fällen sollte die Wikidata-GND-Property ausgewertet werden um die GND-IDN in der ZDB nachzutragen:

SELECT ExtIDs, IDName, uid FROM person WHERE 
  ((ExtIDs LIKE "%WD:%") AND NOT (ExtIDs LIKE "%GND:__%"))

Dieser Vorgang lässt sich ZDB-seitig als Roboter-Skript ("Bot") realisieren. Anders als bei der ersten Wikidata-Personen-Auswertung sollte dieser Bot nicht als ungebremste Black Box arbeiten, sondern (1) überwacht und (2) gebremst, um die Nachrührung im Filmportal nicht zu überlasten.

Übermitteln neuer Matches an Wikidata

Mögliche Vorgehensweisen anhand von Kristinas Erkundigungen und den Beschreibungen [1] bei Wikidata.

Rückfrage zur Pflege der Wikidata-Zuordnungen (Bianca)

Wir haben letzte Woche eine Dublette mit je einem Wikidata-Identfier zusammengelegt: Elvira Jende (GND:1061860523 WD:Q95672104) mit Ria Jende (Gewinner, GND:1061491439 WD:Q15842337) Wie ist hier in Zukunft zu verfahren? bei GND-Änderungen solcher Art melden wir das Herrn Senftleben. wenn ein GND-Identifier dabei ist, sollte sich das aktualisieren, sobald Senftleben die Dublette beseitigt, oder? Und was wenn es keine GND-Nummer gibt?


Personen

SCUSI-Übertragungsfehler

Beim Speichern geänderter Personendaten kommt es nach wie vor zu Fehlermeldungen seitens der GND. Nach bisheriger Untersuchung scheint dies immer dann der Fall zusein, wenn eine Angabe zur Person geändert wurde, für die schon eine entsprechende Aussage in der GND vorhanden ist. Das SCUSI-Protokoll definiert zwar eine "replace"-Anweisung, aber deren Ausführung führt anscheinend zu Konflikten, die im Update-Vorgang der GND nicht gelöst werden können.

Folge dieser Fehler scheint lediglich zu sein, dass vorhandene Aussagen in der GND so bleiben, wie sie sind. Hat die GND beispielsweise nur ein aufs Jahr genaues Geburtsdatum und das DFF möchte dies auf den Tag genau präzisieren, wird das als widersprechende Angabe interpretiert und abgelehnt. In der GND zuvor nicht vorhandene Angaben dagegen werden akzeptiert.

"Nicht-Normdaten"

In der vorigen Besprechung wurde übereinstimmend festgestellt, dass bei Personen-Datensätzen eine Unterscheidung zwischen solchen mit und ohen Normdaten-Charakter sinnvoll ist. Als "Nicht-Normadaten" wären solche Datensätze zu betrachten, die nur zur Vervollständigung der Film-Credits aufgenommen wurden, aber außer einem (meist unvollständigen) Namen keine identifizierenden Daten enthalten.

Vorschlag: Diese Unterscheidung nicht nur für Personen, sondern auch für auch Körperschaften einführen.

Körperschaften

Sind bisher nur mit geringer Priorität behandelt worden, können aber in einem LOD-Umfeld zu wichtigen Verknüpfungspunkten werden. Welche Herangehensweisen sind denkbar?


Körperschaften ansetzen (bianca)

- Sind immer an Orte gebunden - gibt es eine Möglichkeit, den Ort auszublenden? bei Gruppierungen (z.B. Bands oder Künstlerkollektive) ist u.U. kein Ort vorhanden, da diese global aktiv sind (oder sich keiner Nationalität zuordnen bzw. sich kein Land recherchieren lässt). Momentan manipuliere ich via SQL den ID Namen.

- Namensansetzung: Momentan legen wir bei jeder Änderung der Gesellschaftsform einer Körperschaft einen neuen Eintrag an. Gab es schon einmal Überlegungen dies analog zu Personeneinträgen zu lösen oder zumindest in einer Beziehung der KS-Einträge zueinander (Vorgänger - Nachfolger?). in der Ausgabe auf Filmportal wäre das auch ein wünschenswertes Feature, um die Entwicklung einer Firma abzubilden (aktuell ist das Beispiel beetz brothers - ehemals gebrueder beetz filmproduktion [[2]] - die wir noch voneinander trennen müssen)

Rang bei Credits (bianca)

absolutes Luxus-Thema, aber wäre es problematisch, wenn man beim Relationen setzen von FW zu PS bzw. KS auch gleich den Rang mit eingeben könnte? beim Ordnen von großen Cast ist das u.U. wirklich nervenaufreibend ;)