IN2N-Leitfaden: Unterschied zwischen den Versionen

Aus DIF Filmographie Wiki
Wechseln zu: Navigation, Suche
(Seite erstellt)
 
K (Mapping-Struktur ergänzt)
Zeile 13: Zeile 13:
  
 
Als Begründung könnte genannt werden
 
Als Begründung könnte genannt werden
 +
* derzeitige Schnellebigkeit der Linked-Data-Entwicklung
 
* hervorragende Rollen spielen GND/RDF und SCUSI
 
* hervorragende Rollen spielen GND/RDF und SCUSI
* Vielfalt der Datenhaltungssysteme zeichnet sich bereits bei den Workshop-Teilnehmern ab: Auswertung der Fragebögen
+
* Vielfalt der Datenhaltungssysteme zeichnet sich bereits bei den Workshop-Teilnehmern ab: [https://wiki.dnb.de/display/IN2N/8.2.1+IN2N-Workshop#id-8.2.1IN2N-Workshop-AuswertungdesFragebogensderTeilnehmer Auswertung der Fragebögen]
 +
* Anpassungsmöglickeit an Weiterentwicklungen der GND und GND/RDF
  
 
Der Leitfaden könnte erweiterbar gestaltet werden, damit einerseits neue Austauschformate aufgenommen werden können und der Leitfaden andererseits dauerhaft aktuell gehalten werden kann. Aufgrund der Schnellebigkeit ist ein starres Format, wie pdf, nicht geeignet. Zudem sind lediglich Personendatensätze Gegenstand des Projekts, in einem erweiterbaren Leitfaden können weitere Entitäten nachgetragen werden.
 
Der Leitfaden könnte erweiterbar gestaltet werden, damit einerseits neue Austauschformate aufgenommen werden können und der Leitfaden andererseits dauerhaft aktuell gehalten werden kann. Aufgrund der Schnellebigkeit ist ein starres Format, wie pdf, nicht geeignet. Zudem sind lediglich Personendatensätze Gegenstand des Projekts, in einem erweiterbaren Leitfaden können weitere Entitäten nachgetragen werden.
Zeile 26: Zeile 28:
  
 
=== Grundlagen der Datensatzstruktur der Gemensamen Normdatei (GND) ===
 
=== Grundlagen der Datensatzstruktur der Gemensamen Normdatei (GND) ===
 +
Für eine erste Beschäftigung mit der GND-Struktur steht zunächst das [https://wiki.dnb.de/download/attachments/51283696/GND_Datenformat_V1.1.pdf?version=1&modificationDate=1361280106000 Feldverzeichnis] zur Verfügung. Dieses ist übersichtlich nach Datenelementen im Dezimalsystem der Felder des Bibliothekssystem Pica3 geordnet und umfaßt alle Entitäten der GND. Da die im Projekt entwickelte Kooperation ausschließlich für Partner entwickelt wurde, deren Datenbank keinem Bibliotheksverbund angehört und die Daten somit auch nicht im Pica3-Format vorliegen, wird für den Leitfaden eine allgemeinere Struktur bevorzugt.
 +
 +
(Hier Erläuterung der GND-Struktur in Bezug auf Personen oder überflüssig?)
 +
  
 
=== Analyse der Datensatzstruktur der eigenen Datenbank hinsichtlich austauschbarer Datensatzelemente ===
 
=== Analyse der Datensatzstruktur der eigenen Datenbank hinsichtlich austauschbarer Datensatzelemente ===
 +
(Kernelemente der Personendatensätze)
 +
 +
== Mapping ==
 +
=== Identifier ===
 +
Permanenter Identifier
 +
Umlenkungen
 +
Allgemeine Angaben zur erfassenden Instution
 +
 +
=== Namen ===
 +
Bevorzugte Namensform
 +
Alternative Namensformen
 +
 +
=== Lebensdaten ===
 +
Geburtsdatum
 +
Sterbedatum
 +
Wirkungsdaten
  
 +
=== Geografika ===
 +
Geburtsort
 +
Sterbeort
 +
Ländercodes
  
== Mapping ==
+
=== Attribute ===
 +
Geschlecht
 +
Sprachencode
 +
 
 +
=== Biografische Information und Quellen ===
 +
 
 +
=== Beziehungen ===
 +
Beziehungen zu anderen Personen
 +
Beziehungen zu weiteren Entitäten
 +
 
 +
(Erläuterung zur Satzart?)

Version vom 25. September 2014, 11:04 Uhr

Diese Seite kann nach Fertigstellung des Leitfadens gelöscht werden.

Aus dem Projektantrag

Arbeitspaket 8

Erstellung eines Leitfadens zur Überführung von EAC-CPF Daten nach RDF und Einführung in die Normdatenkooperation auf Linked-Open-Data-Basis

Die im Projekt gesammelten Erfahrungen und die eingeschlagenen Entscheidungspfade von der EAC-CPF Realisierung in RDF über die Einrichtung des filmportal Triple Stores und der entsprechenden Schnittstellen bis hin zum produktionsreifen Match-and-Merge werden vom DIF im Sinne eines „Best Practice” Ansatzes in einem Leitfaden zusammengestellt, der potenziellen zukünftigen GND-Kooperationspartnern zur Verfügung gestellt werden kann. Der Leitfaden kommt auf den o.g. Veranstaltungen zum Einsatz und soll auch über die Projektdauer hinaus online auf den Internetseiten der Kooperationspartner sowie, soweit möglich, in weiteren relevanten Foren verfügbar sein.


Alternativvorschlag

Da EAC-CPF im Projekt keine hervorragende Rolle mehr spielt, könnte der Leitfaden für künftige GND-Kooperationspartner allgemeiner gehalten werden. Hauptbestandteil könnte eine Mapping-Zusammenstellung möglichst vieler Formate sein, die der Vielfalt der Datenhaötungssysteme potentieller Kooperationspartner Rechnung trägt.

Als Begründung könnte genannt werden

  • derzeitige Schnellebigkeit der Linked-Data-Entwicklung
  • hervorragende Rollen spielen GND/RDF und SCUSI
  • Vielfalt der Datenhaltungssysteme zeichnet sich bereits bei den Workshop-Teilnehmern ab: Auswertung der Fragebögen
  • Anpassungsmöglickeit an Weiterentwicklungen der GND und GND/RDF

Der Leitfaden könnte erweiterbar gestaltet werden, damit einerseits neue Austauschformate aufgenommen werden können und der Leitfaden andererseits dauerhaft aktuell gehalten werden kann. Aufgrund der Schnellebigkeit ist ein starres Format, wie pdf, nicht geeignet. Zudem sind lediglich Personendatensätze Gegenstand des Projekts, in einem erweiterbaren Leitfaden können weitere Entitäten nachgetragen werden.


Leitfaden

Einführung

Arbeitsschritte eines Projektpartners vor Beginn der Kooperation

Technisch

Grundlagen der Datensatzstruktur der Gemensamen Normdatei (GND)

Für eine erste Beschäftigung mit der GND-Struktur steht zunächst das Feldverzeichnis zur Verfügung. Dieses ist übersichtlich nach Datenelementen im Dezimalsystem der Felder des Bibliothekssystem Pica3 geordnet und umfaßt alle Entitäten der GND. Da die im Projekt entwickelte Kooperation ausschließlich für Partner entwickelt wurde, deren Datenbank keinem Bibliotheksverbund angehört und die Daten somit auch nicht im Pica3-Format vorliegen, wird für den Leitfaden eine allgemeinere Struktur bevorzugt.

(Hier Erläuterung der GND-Struktur in Bezug auf Personen oder überflüssig?)


Analyse der Datensatzstruktur der eigenen Datenbank hinsichtlich austauschbarer Datensatzelemente

(Kernelemente der Personendatensätze)

Mapping

Identifier

Permanenter Identifier Umlenkungen Allgemeine Angaben zur erfassenden Instution

Namen

Bevorzugte Namensform Alternative Namensformen

Lebensdaten

Geburtsdatum Sterbedatum Wirkungsdaten

Geografika

Geburtsort Sterbeort Ländercodes

Attribute

Geschlecht Sprachencode

Biografische Information und Quellen

Beziehungen

Beziehungen zu anderen Personen Beziehungen zu weiteren Entitäten

(Erläuterung zur Satzart?)