ARD-Normdatenbank Nutzung und Pflege von Normdaten in der ARD

ARD-Normdatenbank – Nutzung und Pflege von Normdaten in der ARD IN2N-Workshop 30. September 2014, Frankfurt a.M. Andreas Dan, Stiftung Deutsches Rund...
Author: Damian Franke
67 downloads 6 Views 1MB Size
ARD-Normdatenbank – Nutzung und Pflege von Normdaten in der ARD IN2N-Workshop 30. September 2014, Frankfurt a.M.

Andreas Dan, Stiftung Deutsches Rundfunkarchiv

Kurzpräsentation DRA Deutsches Rundfunkarchiv Stiftung der ARD, gegründet 1952 Standorte in Frankfurt und Potsdam-Babelsberg

Workshop IN2N, 30.09.2014

Kurzpräsentation DRA Deutsches Rundfunkarchiv Aufgaben: • Sammlung kulturell bedeutender, audiovisueller Medien (Schwerpunkte Rundfunk vor 1945 und DDR-Fernsehen und Rundfunk) • Informationsvermittlung für ARD und Bereich KWÖ • Programm- und (Norm-)Datendienste für ARD • Rundfunkhistorische Dokumentation • Zentrale Schallplattenkatalogisierung

Workshop IN2N, 30.09.2014

Normdaten in der ARD Besonderheiten in der ARD Schwerpunkt auf Dokumentation von Fernseh- und Hörfunksendungen (Musik und Wort) sowie Presse Föderale Struktur der ARD führte dazu, dass sich verschiedene Mediendatenbankkooperationen entwickelten 11 Rundfunkanstalten

DAVID

FESAD classic

mit jeweils unterschiedlichen Datenbanken bzw. Datenbankkooperationen MUSAD

Workshop IN2N, 30.09.2014

WOSAD

ZUN

Normdaten in der ARD (Technische) Vereinheitlichung der Datenbanken eine der großen Herausforderungen in den letzten Jahrzehnten für die ARD-Archive

MUSAD

DAVID FESAD classic

Farao

FESAD

ZUN

WOSAD

HFDB

=> gemeinsame Fernseh- und Hörfunkdatenbank erleichtert heute die Recherche/Bestellung in Beständen anderer Häuser erheblich (Cross-Recherche) Workshop IN2N, 30.09.2014

Normdaten in der ARD Technische Vereinheitlichung bot Chance/Notwendigkeit gemeinsame medienübergreifende Metadaten- und Dokumentationsstandards zu etablieren => Beginn des Projekts einer gemeinsamen Hörfunkdatenbank in 2002 zugleich Startschuss für: ARD-weite AG zur Erarbeitung eines gemeinsamen Multimedialen Regelwerks (REM) Beginn der Entwicklung einer gemeinsamen ARD-Normdatenbank als „Gefäß“ und zur Pflege von Normdaten

Workshop IN2N, 30.09.2014

ARD-Normdatenbank Erschließung in Bestandsdatenbanken der ARD

MUSAD

DAVID FESAD classic

ZUN

Farao

FESAD Normdaten

Normdaten

NDB

WOSAD

HFDB

Normdaten

Integration von Normdaten im WWW (z.B. PND bzw. GND)

GND Workshop IN2N, 30.09.2014

ARD-Normdatenbank Ziele ARD-Normdatenbank: 1. Verwendung gemeinsamer Normdaten 2. Gemeinsame Pflege von Normdaten 3. Verbesserung (Cross-)Recherche, Metadatenaustausch und Vernetzung 4. Möglichkeit Normdaten ausführlicher zu beschreiben als dies in Mediendatenbanken möglich ist

Workshop IN2N, 30.09.2014

ARD-Normdatenbank Konzept der ARD-Normdatenbank, grafische Darstellung:

Archimed es

web frontend

Pflege der Normdaten über Web-Frontend

Workshop IN2N, 30.09.2014

NDB

FESAD

HFDB

NDBWS

Degeto

Archivsysteme: Nutzen Normdaten, können aber auch über schreibenden Zugriff Normdaten erzeugen

zeitlupe

DW-RMS

Weitere ARD-Systeme können Normdaten nutzen (z.B. Rechtemanagementsysteme)

Web frontend der ARD-Normdatenbank

Workshop IN2N, 30.09.2014

ARD-Normdatenbank Identifizierte Normobjekte  Marken/Label/Sendereihen -> ca. 80.000  Institutionen -> 185.000 Künstlergruppen, 225.000 „Sonstige Institutionen“  Personen (Namen, Personen/Individuen) -> 400.000 Personen/Individuen, 700.000 Namen  Vokabeln (u.a. Geographika, Klangkörper, Sachklassifiktion) -> 85.000  Ereignisse -> 150.000 Personenereignisse, 370.000 Ereignisse  Wertelisten  Werke (nach Feinanalyse im HFDB-Projekt verortet)

Workshop IN2N, 30.09.2014

ARD-Normdatenbank Beispiel 1: Normdatenbank als Verteiler GVL liefert mehrfach pro Monat aktuelle Labeldaten Automatischer Import in die ARD-Normdatenbank und Verteilung der Daten an verschiedenste ARD-Systeme

Archimed es

HFDB

NDB DW-RMS

Workshop IN2N, 30.09.2014

rbb GEMA

GVL

ARD-Normdatenbank Beispiel 2: Gemeinsame Nutzung und Pflege von Personen

HFDB

Fernseh-Dokumentar Neuanlage FESAD Person: „Edward Snowden“, Whistle-Blower

FESAD Normierte Person für tagesaktuelle Fernsehdokumentation web frontend

NDBWS

GND Munzinger

NDB Edward Snowden

verifiziert und ergänzt exakte Geburts- und Todesdaten, gibt Quellen an, verlinkt mit externen Quellen usw. Workshop IN2N, 30.09.2014

Wort-Dokumentar

zeitlupe zeitlupe-Dokumentar

Person „Alfred Johann Braun“ in ARD-Normdatenbank

Vortrag WDR, 19.09.2013

Seite 14

Person „Alfred Johann Braun“ in HFDB

Workshop IN2N, 30.09.2014

ARD-Normdatenbank Beispiel 3: Eindeutige Referenzierung von Personen möglich HFDB

HFDB

Titel: Westerwelle wird 50 ThemaPerson: Guido Westerwelle

Suche nach „Westerwelle“

Titel: FDP-Parteitag Redner: Guido Westerwelle

HFDB Titel: Bäckerbetriebe in Hessen O-Tongeber: M. Westerwelle (Bäcker)

Meinten Sie: Guido Westerwelle, Politiker Stefan Westerwelle, Regisseur

Guido Westerwelle Politiker 27.12.1961 NDB

HFDB Titel: Jugendfußball O-Tongeber: Guido Westerwelle (Trainer) Workshop IN2N, 30.09.2014

Stefan Westerwelle Regisseur 1980 -

HFDB Titel: Westerwelle und Detlef ThemaPerson: Stefan Westerwelle

ARD-Normdatenbank Beispiel 4: Strukturierte Daten ermöglichen flexible Nutzung Objekt Vokabular generalisiert, damit offen für jede Art von ARD-Vokabular HFDB nutzt gesamte ARD-Sachklassifikation zeitlupe nutzt nur TOP-Klassen der ARD-Sachklassifikation

HFDB

nutzt die gesamte ARDSachklassifikation

NDB

zeitlupe

Vokabulare ARDSachklassifikation Deskripto r

Workshop IN2N, 30.09.2014

Klassen

Sprachen

nutzt nur Klassen

3. Einsatzmöglichkeiten ARD-SK in zeitlupe

Workshop IN2N, 30.09.2014

ARD-SK in der HFDB

ARD-Normdatenbank Exkurs zur zeitlupe Ereignisse wurden als eigenes Normobjekt identifiziert, wobei bei der Modellierung berücksichtigt wurde, dass Geburts- und Sterbedaten von Personen u.ä. ebenfalls Ereignisse darstellen Ereignisse und ihre Jahrestage relevant für Programmplanung Entwicklung einer ARD-Ereignisdatenbank, die direkt von der gemeinsamen Normdatenpflege profitiert

Workshop IN2N, 30.09.2014

ARD-Normdatenbank Startseite zeitlupe

Workshop IN2N, 30.09.2014

ARD-Normdatenbank Exkurs zur zeitlupe Neuanlage Person: „Alfred Braun“, Rundfunkreporter, Geburtsjahr 03.05.1888

100. Geburtstag 03.05.1988

125. Geburtstag 03.05.2013

150. Geburtstag 03.05.2038

Workshop IN2N, 30.09.2014

Ereignis Geburtstag 03.05.1888

NDB

Dokumentar

PND-Links in zeitlupe

Workshop IN2N, 30.09.2014

ARD-Normdatenbank

Nutzung/Einbindung externer Linked Data-Quellen ndb_person: Madonna GND: 118829688 same as

dbpedia:Madonna (Künstlerin) GND: 118829688

Workshop IN2N, 30.09.2014

dbpedia-owl:abstract

Madonna [məˈdɑːnə] ist eine USamerikanische Sängerin, Songschreiberin, Schauspielerin….

ARD-Normdatenbank

Madonna [məˈdɑːnə] ist eine US-amerikanische Sängerin, Songschreiberin, Schauspielerin…. [lesen Sie mehr auf Wikipedia]

Workshop IN2N, 30.09.2014

ARD-Normdatenbank

Nutzung/Einbindung externer Linked Data-Quellen ndb_label: Warner Bros. Records

ndb_person: Madonna GND: 118829688

ndb_person:Björk same as

dbpedia:Madonna (Künstlerin) GND: 118829688

dbpedia-owl:recordLabel

dbpedia:Warner_Bros.Records

dbpedia-owl:recordLabel of

dbpedia:Björk

Workshop IN2N, 30.09.2014

ARD-Normdatenbank Pflegekonzept  Differenziertes Pflegekonzept: unterschieden nach Pflegezuständigkeit und Pflegegrad  Für Objekte mit hohem Normierungsgrad zentrale Pflege (z.B. ARDSachklassifikation), bei anderen Objekten hingegen Konzept der verteilten Pflege (z.B. Personen)  Ähnlichkeitsalgorithmus und Match-/Mergetool zur effizienten Duplikatpflege  8 Normierungsstatus (Name -> Person/Institution -> Individuum)  Für Personen/Institutionen kleine „Redaktion“ zur Sicherung der Datenqualität  Größtes Pflegedesiderat: „Sonstige Institutionen“

Workshop IN2N, 30.09.2014

ARD-Normdatenbank

ARD-Normdatenbank verbessert Normdatenpflege und damit crossmediale Suchen, Datenkonsistenz und Vernetzung Normdaten können flexibel von ARD-Systemen genutzt werden Nutzen steigt je mehr ARD-Systeme Normdatenbank verwenden (wichtig vor allem auch für Metadatenaustausch) Normdaten werden bereits jetzt von vielen Systemen genutzt

Workshop IN2N, 30.09.2014

ARD-Normdatenbank: Nutzende Systeme Bezieht Hörspiel-Daten aus HfDB

Hörspiel-DB (ard.de)

Degeto lesend und schreibend: Personen

FESAD

Archimedes lesend: Klangkörper, Labels, Personen (via Industrieinstanz)

diverse Rechtemanagement-Systeme

ARD-Chronik (ard.de)

Munzinger Dbpedia/Wikipedia GND

lesend: ARD-SK, Geo schreibend: Personen, Werte

PIANOfORTE

lesend: Personen, Institutionen, Vokabulare

HFDB

Werke-DB (HFDB)

lesend und schreibend: Personen, Klangkörper

NormDB

lesend und schreibend: Personen, Institutionen, Vokabulare, Marken, Werte

lesend: Label

zeitlupe generiert aus NormDB-Objekten automatisiert Jubiläen und nutzt Vokabulare

lesend: Label

Webmerlin

OpenMedia

HAMS

Bezieht Jubiläumsdaten aus zeitlupe

zeitlupe-Daten sollen ab 2014 OTöne aus HFDB sowie Videos aus FESAD verknüpfen können

zeitlupe

zeitlupe soll ab 2015 aus Uraufführungen automatisiert Jubiläen genereien

Bezieht ARD-Chronik-Daten aus zeitlupe

Anbindung von Munzinger-Biographien ab 2014 Anbindung von Wikipedia-Biographien

zeitlupe-Daten werden zur Illustration mit Bildern aus DRABild verknüpft

DRA-Bild

ab 2014: Abgleich NDB-/GND-Personen

Workshop IN2N, 30.09.2014 = Planungs-/Redaktionssysteme

= Archivsysteme

= Rechtemanagement-Systeme

= Online-Dienste

= Externe Datenquellen

Vielen Dank für Ihre Aufmerksamkeit!

Andreas Dan Stiftung Deutsches Rundfunkarchiv Bertramstraße 8 60320 Frankfurt am Main Telefon: 069-15687-213 E-Mail: [email protected]

Workshop IN2N, 30.09.2014