Anpassung des Datenschemas: Unterschied zwischen den Versionen

Aus DIF Filmographie Wiki
Wechseln zu: Navigation, Suche
(Foto)
(Zugelassene Relationen)
 
(6 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 11: Zeile 11:
 
  GROUP BY relation.SubjEnt, relation.ObjEnt
 
  GROUP BY relation.SubjEnt, relation.ObjEnt
  
Anzahl-Angaben sind vom 26. Mai 2023.
+
Anzahl-Angaben sind vom 26. Mai 2023. Eine aktuelle Übersicht findet sich hier: [https://zdb.dff.film/fdb/relationStatus.php]
  
 
{|
 
{|
Zeile 68: Zeile 68:
 
| MW||Musikwerk||P||Person||58|| ?
 
| MW||Musikwerk||P||Person||58|| ?
 
|-
 
|-
| P||Person||AZ||Auszeichnung||3|| ?
+
| P||Person||AZ||Auszeichnung||3||style="color:green"| behalten
 
|-
 
|-
 
| P||Person||KS||Koerperschaft||596||style="color:green"| behalten
 
| P||Person||KS||Koerperschaft||596||style="color:green"| behalten
Zeile 92: Zeile 92:
 
Metadaten zu Filmplakaten werden, anders als im ersten Schema-Entwurf angelegt, über das Filmportal-CMS verwaltet. Die zu Testzwecken angelegten Datensätze und Relationen, sowie der dafür eingerichtete Programmcode werden aus der ZDB entfernt.
 
Metadaten zu Filmplakaten werden, anders als im ersten Schema-Entwurf angelegt, über das Filmportal-CMS verwaltet. Die zu Testzwecken angelegten Datensätze und Relationen, sowie der dafür eingerichtete Programmcode werden aus der ZDB entfernt.
  
02-Jun-2023: Alle Instanzen von Entität PL (Plakat) und Relationen FM<->PL gelöscht (s.o.); Tabelle "plakat" und Programmcode zur Anzeige von Plakat-Metadaten aus ZDB entfernt.
+
* 02-Jun-2023: Alle Instanzen von Entität PL (Plakat) und Relationen FM<->PL gelöscht (s.o.); Tabelle "plakat" und Programmcode zur Anzeige von Plakat-Metadaten aus ZDB entfernt.
  
 
Plakat-Metadatensätze des DFF haben derzeit (noch) keine persistenten Identifikatoren. Eine verlässliche Verlinkung von der ZDB zur Darstellung in Filmportal oder DDB ist derzeit nicht möglich.
 
Plakat-Metadatensätze des DFF haben derzeit (noch) keine persistenten Identifikatoren. Eine verlässliche Verlinkung von der ZDB zur Darstellung in Filmportal oder DDB ist derzeit nicht möglich.
Zeile 99: Zeile 99:
 
Metadaten zu Fotos werden, anders als im ersten Schema-Entwurf definiert, über das Filmportal-CMS verwaltet. Die zu Testzwecken angelegten Datensätze und Relationen, sowie der dafür eingerichtete Programmcode werden aus der ZDB entfernt.
 
Metadaten zu Fotos werden, anders als im ersten Schema-Entwurf definiert, über das Filmportal-CMS verwaltet. Die zu Testzwecken angelegten Datensätze und Relationen, sowie der dafür eingerichtete Programmcode werden aus der ZDB entfernt.
  
03-Jun-2023: Alle Instanzen von Entität FO (Foto) und Relationen FO<->P sowie FW<->FO gelöscht (s.o.). Tabelle "plakat" entfernt.  
+
* 03-Jun-2023: Alle Instanzen von Entität FO (Foto) und Relationen FO<->P sowie FW<->FO gelöscht (s.o.). Tabelle "plakat" entfernt.  
 
+
* 06-Jun-2023: Programmcode mit Bezug zu Foto-Metadaten in ZDB entfernt.
06-Jun-2023: Programmcode mit Bezug zu Foto-Metadaten in ZDB entfernt.
 
  
 
===Genre===
 
===Genre===
 
Genre-Angaben zu Filmwerken sind im ersten Schema-Entwurf definiert, konnten aber mangels Datengrundlage nicht genutzt werden. Die zu Testzwecken angelegten Datensätze und Relationen, sowie der dafür eingerichtete Programmcode werden aus der ZDB entfernt.
 
Genre-Angaben zu Filmwerken sind im ersten Schema-Entwurf definiert, konnten aber mangels Datengrundlage nicht genutzt werden. Die zu Testzwecken angelegten Datensätze und Relationen, sowie der dafür eingerichtete Programmcode werden aus der ZDB entfernt.
  
03-Jun-2023: Alle Instanzen von Entität GE (Genre) und Relationen mit GE, sowie Tabelle "genre" entfernt.  
+
* 03-Jun-2023: Alle Instanzen von Entität GE (Genre) und Relationen mit GE, sowie Tabelle "genre" entfernt.  
 
+
* 06-Jun-2023: Programmcode mit Bezug zu Genre-Angaben in ZDB entfernt.
'''2do:''' Programmcode mit Bezug zu Genre-angaben in ZDB suchen und entfernen.
 
  
 
===Gruppe===
 
===Gruppe===
'''2do''': Alle Instanzen der Entität Gruppe sollen in Körperschaften gewandelt werden.
 
  
340 Gruppen-Datensätze sind nicht über Relationen verknüpft und können automatisiert gelöscht werden:
+
Die Entität "Gruppe" war aus der Vorgänger-Datenbank am DIF in die ZDB übernommen worden. Für filmportal.de war keine Entsprechung hierzu geplant. Daher werden seither alle neuen Personengruppen in der Entität "Körperschaft erfasst". Zur Bereinigung des ZDB-Datenbestandes werden die noch vorhandenen Daten aus der Entität "Gruppe" in "Körperschaft" überführt und die Entität wie auch der zugehörige Programmcode aus der ZDB entfernt.
  
select gruppe.uid, gruppe.IDName from gruppe
+
* 07-Jun-2023: 340 Gruppen-Datensätze waren nicht über Relationen verknüpft und wurden automatisiert gelöscht.
left outer join relation on relation.ObjUID=gruppe.uid
 
where (relation.RelUID is null)
 
  
Gruppen-Datensätze mit Relationen zu Personen sollen bei Umwandlung in Körperschaft erhalten bleiben. Derzeit gibt es 11 solche Relationen:
+
* 22-Mrz-2024: die verbliebenen ca. 300 Gruppen-Datensätze sind zu 2/3 in Körperschaften überführt.
  
select gruppe.uid, gruppe.IDName, relation.Rel, relation.ObjEnt from gruppe
+
'''2do''': Alle verbliebenen Instanzen der Entität Gruppe sollen in Körperschaften gewandelt werden.
join relation on relation.SubjUID=gruppe.uid
 

Aktuelle Version vom 22. März 2024, 19:11 Uhr

Seit der Definition des Datenbankschemas für die Zentrale Filmografie (ZDB) sind in der Praxis etliche der ursprünglichen Annahmen obsolet geworden.

Zugelassene Relationen

Als Ausgangspunkt erstellen wir eine Übersicht über die in der Tabelle "relation" vorhandenen Verknüpfungen:

SELECT relation.SubjEnt, ent1.Tabname, relation.ObjEnt, ent2.Tabname, COUNT(*) AS AnzRel 
FROM pdf.relation 
JOIN entities AS ent1 ON ent1.ID=relation.SubjEnt
JOIN entities AS ent2 ON ent2.ID=relation.ObjEnt
GROUP BY relation.SubjEnt, relation.ObjEnt

Anzahl-Angaben sind vom 26. Mai 2023. Eine aktuelle Übersicht findet sich hier: [1]

SubjEnt Tabname ObjEnt Tabname AnzRel was tun?
EFP Filmpruefung KS Koerperschaft 4 Relationen und RelDef entfernt 26-Mai-2023
EFP Filmpruefung TD Textdokument 2 TDs, Relationen, und RelDef entfernt 29-Mai-2023
FM FilmManifestation EAU Auffuehrung 80915 behalten
FM FilmManifestation EFP Filmpruefung 61854 behalten
FM FilmManifestation FK Filmkopie 1764 behalten
FM FilmManifestation FT Filmtitel 232789 behalten
FM FilmManifestation PL Plakat 15 PLs, Relationen, und RelDefs entfernt 01-Jun-2023
FO Foto P Person 6 Relationen und RelDef entfernt 03-Jun-2023
FT Filmtitel KS Koerperschaft 1 irrtümlich angelegt; entfernt 02-Jun-2023
FW Filmwerk AZ Auszeichnung 17613 behalten
FW Filmwerk EAU Auffuehrung 1 irrtümlich angelegt; entfernt 02-Jun-2023
FW Filmwerk EDR Dreharbeiten 16611 behalten
FW Filmwerk FO Foto 22 Relationen und RelDef entfernt 03-Jun-2023
FW Filmwerk FW Filmwerk 8 behalten
FW Filmwerk GE Genre 4 Relationen und RelDef entfernt 03-Jun-2023
FW Filmwerk GR Gruppe 559 mit Umwandlung GR->KS übernehmen
FW Filmwerk KS Koerperschaft 250363 behalten
FW Filmwerk MW Musikwerk 27 ?
FW Filmwerk P Person 1200286 behalten
FW Filmwerk PR Praedikat 1040 ?
FW Filmwerk TD Textdokument 8 ?
FW Filmwerk WV Werkvorlage 29 ?
GR Gruppe P Person 11 mit Umwandlung GR->KS übernehmen
KS Koerperschaft KS Koerperschaft 2 ?
MW Musikwerk GR Gruppe 7 Relationen und RelDef entfernt 05-Jun-2023
MW Musikwerk P Person 58 ?
P Person AZ Auszeichnung 3 behalten
P Person KS Koerperschaft 596 behalten
P Person P Person 2433 behalten
PL Plakat KS Koerperschaft 18 Relationen und RelDef entfernt 03-Jun-2023
PL Plakat P Person 7 Relationen und RelDef entfernt 03-Jun-2023
TD Textdokument FW Filmwerk 993 behalten
TD Textdokument KS Koerperschaft 2 ?
TD Textdokument P Person 9 ?
WV Werkvorlage P Person 32 ?

Betroffene Entitäten

Plakat

Metadaten zu Filmplakaten werden, anders als im ersten Schema-Entwurf angelegt, über das Filmportal-CMS verwaltet. Die zu Testzwecken angelegten Datensätze und Relationen, sowie der dafür eingerichtete Programmcode werden aus der ZDB entfernt.

  • 02-Jun-2023: Alle Instanzen von Entität PL (Plakat) und Relationen FM<->PL gelöscht (s.o.); Tabelle "plakat" und Programmcode zur Anzeige von Plakat-Metadaten aus ZDB entfernt.

Plakat-Metadatensätze des DFF haben derzeit (noch) keine persistenten Identifikatoren. Eine verlässliche Verlinkung von der ZDB zur Darstellung in Filmportal oder DDB ist derzeit nicht möglich.

Foto

Metadaten zu Fotos werden, anders als im ersten Schema-Entwurf definiert, über das Filmportal-CMS verwaltet. Die zu Testzwecken angelegten Datensätze und Relationen, sowie der dafür eingerichtete Programmcode werden aus der ZDB entfernt.

  • 03-Jun-2023: Alle Instanzen von Entität FO (Foto) und Relationen FO<->P sowie FW<->FO gelöscht (s.o.). Tabelle "plakat" entfernt.
  • 06-Jun-2023: Programmcode mit Bezug zu Foto-Metadaten in ZDB entfernt.

Genre

Genre-Angaben zu Filmwerken sind im ersten Schema-Entwurf definiert, konnten aber mangels Datengrundlage nicht genutzt werden. Die zu Testzwecken angelegten Datensätze und Relationen, sowie der dafür eingerichtete Programmcode werden aus der ZDB entfernt.

  • 03-Jun-2023: Alle Instanzen von Entität GE (Genre) und Relationen mit GE, sowie Tabelle "genre" entfernt.
  • 06-Jun-2023: Programmcode mit Bezug zu Genre-Angaben in ZDB entfernt.

Gruppe

Die Entität "Gruppe" war aus der Vorgänger-Datenbank am DIF in die ZDB übernommen worden. Für filmportal.de war keine Entsprechung hierzu geplant. Daher werden seither alle neuen Personengruppen in der Entität "Körperschaft erfasst". Zur Bereinigung des ZDB-Datenbestandes werden die noch vorhandenen Daten aus der Entität "Gruppe" in "Körperschaft" überführt und die Entität wie auch der zugehörige Programmcode aus der ZDB entfernt.

  • 07-Jun-2023: 340 Gruppen-Datensätze waren nicht über Relationen verknüpft und wurden automatisiert gelöscht.
  • 22-Mrz-2024: die verbliebenen ca. 300 Gruppen-Datensätze sind zu 2/3 in Körperschaften überführt.

2do: Alle verbliebenen Instanzen der Entität Gruppe sollen in Körperschaften gewandelt werden.