ARD-Normdatenbank – Nutzung und Pflege von Normdaten in der ARD IN2N-Workshop 30. September 2014, Frankfurt a.M.
Andreas Dan, Stiftung Deutsches Rundfunkarchiv
Kurzpräsentation DRA Deutsches Rundfunkarchiv Stiftung der ARD, gegründet 1952 Standorte in Frankfurt und Potsdam-Babelsberg
Workshop IN2N, 30.09.2014
Kurzpräsentation DRA Deutsches Rundfunkarchiv Aufgaben: • Sammlung kulturell bedeutender, audiovisueller Medien (Schwerpunkte Rundfunk vor 1945 und DDR-Fernsehen und Rundfunk) • Informationsvermittlung für ARD und Bereich KWÖ • Programm- und (Norm-)Datendienste für ARD • Rundfunkhistorische Dokumentation • Zentrale Schallplattenkatalogisierung
Workshop IN2N, 30.09.2014
Normdaten in der ARD Besonderheiten in der ARD Schwerpunkt auf Dokumentation von Fernseh- und Hörfunksendungen (Musik und Wort) sowie Presse Föderale Struktur der ARD führte dazu, dass sich verschiedene Mediendatenbankkooperationen entwickelten 11 Rundfunkanstalten
DAVID
FESAD classic
mit jeweils unterschiedlichen Datenbanken bzw. Datenbankkooperationen MUSAD
Workshop IN2N, 30.09.2014
WOSAD
ZUN
Normdaten in der ARD (Technische) Vereinheitlichung der Datenbanken eine der großen Herausforderungen in den letzten Jahrzehnten für die ARD-Archive
MUSAD
DAVID FESAD classic
Farao
FESAD
ZUN
WOSAD
HFDB
=> gemeinsame Fernseh- und Hörfunkdatenbank erleichtert heute die Recherche/Bestellung in Beständen anderer Häuser erheblich (Cross-Recherche) Workshop IN2N, 30.09.2014
Normdaten in der ARD Technische Vereinheitlichung bot Chance/Notwendigkeit gemeinsame medienübergreifende Metadaten- und Dokumentationsstandards zu etablieren => Beginn des Projekts einer gemeinsamen Hörfunkdatenbank in 2002 zugleich Startschuss für: ARD-weite AG zur Erarbeitung eines gemeinsamen Multimedialen Regelwerks (REM) Beginn der Entwicklung einer gemeinsamen ARD-Normdatenbank als „Gefäß“ und zur Pflege von Normdaten
Workshop IN2N, 30.09.2014
ARD-Normdatenbank Erschließung in Bestandsdatenbanken der ARD
MUSAD
DAVID FESAD classic
ZUN
Farao
FESAD Normdaten
Normdaten
NDB
WOSAD
HFDB
Normdaten
Integration von Normdaten im WWW (z.B. PND bzw. GND)
GND Workshop IN2N, 30.09.2014
ARD-Normdatenbank Ziele ARD-Normdatenbank: 1. Verwendung gemeinsamer Normdaten 2. Gemeinsame Pflege von Normdaten 3. Verbesserung (Cross-)Recherche, Metadatenaustausch und Vernetzung 4. Möglichkeit Normdaten ausführlicher zu beschreiben als dies in Mediendatenbanken möglich ist
Workshop IN2N, 30.09.2014
ARD-Normdatenbank Konzept der ARD-Normdatenbank, grafische Darstellung:
Archimed es
web frontend
Pflege der Normdaten über Web-Frontend
Workshop IN2N, 30.09.2014
NDB
FESAD
HFDB
NDBWS
Degeto
Archivsysteme: Nutzen Normdaten, können aber auch über schreibenden Zugriff Normdaten erzeugen
zeitlupe
DW-RMS
Weitere ARD-Systeme können Normdaten nutzen (z.B. Rechtemanagementsysteme)
Web frontend der ARD-Normdatenbank
Workshop IN2N, 30.09.2014
ARD-Normdatenbank Identifizierte Normobjekte Marken/Label/Sendereihen -> ca. 80.000 Institutionen -> 185.000 Künstlergruppen, 225.000 „Sonstige Institutionen“ Personen (Namen, Personen/Individuen) -> 400.000 Personen/Individuen, 700.000 Namen Vokabeln (u.a. Geographika, Klangkörper, Sachklassifiktion) -> 85.000 Ereignisse -> 150.000 Personenereignisse, 370.000 Ereignisse Wertelisten Werke (nach Feinanalyse im HFDB-Projekt verortet)
Workshop IN2N, 30.09.2014
ARD-Normdatenbank Beispiel 1: Normdatenbank als Verteiler GVL liefert mehrfach pro Monat aktuelle Labeldaten Automatischer Import in die ARD-Normdatenbank und Verteilung der Daten an verschiedenste ARD-Systeme
Archimed es
HFDB
NDB DW-RMS
Workshop IN2N, 30.09.2014
rbb GEMA
GVL
ARD-Normdatenbank Beispiel 2: Gemeinsame Nutzung und Pflege von Personen
HFDB
Fernseh-Dokumentar Neuanlage FESAD Person: „Edward Snowden“, Whistle-Blower
FESAD Normierte Person für tagesaktuelle Fernsehdokumentation web frontend
NDBWS
GND Munzinger
NDB Edward Snowden
verifiziert und ergänzt exakte Geburts- und Todesdaten, gibt Quellen an, verlinkt mit externen Quellen usw. Workshop IN2N, 30.09.2014
Wort-Dokumentar
zeitlupe zeitlupe-Dokumentar
Person „Alfred Johann Braun“ in ARD-Normdatenbank
Vortrag WDR, 19.09.2013
Seite 14
Person „Alfred Johann Braun“ in HFDB
Workshop IN2N, 30.09.2014
ARD-Normdatenbank Beispiel 3: Eindeutige Referenzierung von Personen möglich HFDB
HFDB
Titel: Westerwelle wird 50 ThemaPerson: Guido Westerwelle
Suche nach „Westerwelle“
Titel: FDP-Parteitag Redner: Guido Westerwelle
HFDB Titel: Bäckerbetriebe in Hessen O-Tongeber: M. Westerwelle (Bäcker)
Meinten Sie: Guido Westerwelle, Politiker Stefan Westerwelle, Regisseur
Guido Westerwelle Politiker 27.12.1961 NDB
HFDB Titel: Jugendfußball O-Tongeber: Guido Westerwelle (Trainer) Workshop IN2N, 30.09.2014
Stefan Westerwelle Regisseur 1980 -
HFDB Titel: Westerwelle und Detlef ThemaPerson: Stefan Westerwelle
ARD-Normdatenbank Beispiel 4: Strukturierte Daten ermöglichen flexible Nutzung Objekt Vokabular generalisiert, damit offen für jede Art von ARD-Vokabular HFDB nutzt gesamte ARD-Sachklassifikation zeitlupe nutzt nur TOP-Klassen der ARD-Sachklassifikation
HFDB
nutzt die gesamte ARDSachklassifikation
NDB
zeitlupe
Vokabulare ARDSachklassifikation Deskripto r
Workshop IN2N, 30.09.2014
Klassen
Sprachen
nutzt nur Klassen
3. Einsatzmöglichkeiten ARD-SK in zeitlupe
Workshop IN2N, 30.09.2014
ARD-SK in der HFDB
ARD-Normdatenbank Exkurs zur zeitlupe Ereignisse wurden als eigenes Normobjekt identifiziert, wobei bei der Modellierung berücksichtigt wurde, dass Geburts- und Sterbedaten von Personen u.ä. ebenfalls Ereignisse darstellen Ereignisse und ihre Jahrestage relevant für Programmplanung Entwicklung einer ARD-Ereignisdatenbank, die direkt von der gemeinsamen Normdatenpflege profitiert
Workshop IN2N, 30.09.2014
ARD-Normdatenbank Startseite zeitlupe
Workshop IN2N, 30.09.2014
ARD-Normdatenbank Exkurs zur zeitlupe Neuanlage Person: „Alfred Braun“, Rundfunkreporter, Geburtsjahr 03.05.1888
100. Geburtstag 03.05.1988
125. Geburtstag 03.05.2013
150. Geburtstag 03.05.2038
Workshop IN2N, 30.09.2014
Ereignis Geburtstag 03.05.1888
NDB
Dokumentar
PND-Links in zeitlupe
Workshop IN2N, 30.09.2014
ARD-Normdatenbank
Nutzung/Einbindung externer Linked Data-Quellen ndb_person: Madonna GND: 118829688 same as
dbpedia:Madonna (Künstlerin) GND: 118829688
Workshop IN2N, 30.09.2014
dbpedia-owl:abstract
Madonna [məˈdɑːnə] ist eine USamerikanische Sängerin, Songschreiberin, Schauspielerin….
ARD-Normdatenbank
Madonna [məˈdɑːnə] ist eine US-amerikanische Sängerin, Songschreiberin, Schauspielerin…. [lesen Sie mehr auf Wikipedia]
Workshop IN2N, 30.09.2014
ARD-Normdatenbank
Nutzung/Einbindung externer Linked Data-Quellen ndb_label: Warner Bros. Records
ndb_person: Madonna GND: 118829688
ndb_person:Björk same as
dbpedia:Madonna (Künstlerin) GND: 118829688
dbpedia-owl:recordLabel
dbpedia:Warner_Bros.Records
dbpedia-owl:recordLabel of
dbpedia:Björk
Workshop IN2N, 30.09.2014
ARD-Normdatenbank Pflegekonzept Differenziertes Pflegekonzept: unterschieden nach Pflegezuständigkeit und Pflegegrad Für Objekte mit hohem Normierungsgrad zentrale Pflege (z.B. ARDSachklassifikation), bei anderen Objekten hingegen Konzept der verteilten Pflege (z.B. Personen) Ähnlichkeitsalgorithmus und Match-/Mergetool zur effizienten Duplikatpflege 8 Normierungsstatus (Name -> Person/Institution -> Individuum) Für Personen/Institutionen kleine „Redaktion“ zur Sicherung der Datenqualität Größtes Pflegedesiderat: „Sonstige Institutionen“
Workshop IN2N, 30.09.2014
ARD-Normdatenbank
ARD-Normdatenbank verbessert Normdatenpflege und damit crossmediale Suchen, Datenkonsistenz und Vernetzung Normdaten können flexibel von ARD-Systemen genutzt werden Nutzen steigt je mehr ARD-Systeme Normdatenbank verwenden (wichtig vor allem auch für Metadatenaustausch) Normdaten werden bereits jetzt von vielen Systemen genutzt
Workshop IN2N, 30.09.2014
ARD-Normdatenbank: Nutzende Systeme Bezieht Hörspiel-Daten aus HfDB
Hörspiel-DB (ard.de)
Degeto lesend und schreibend: Personen
FESAD
Archimedes lesend: Klangkörper, Labels, Personen (via Industrieinstanz)
diverse Rechtemanagement-Systeme
ARD-Chronik (ard.de)
Munzinger Dbpedia/Wikipedia GND
lesend: ARD-SK, Geo schreibend: Personen, Werte
PIANOfORTE
lesend: Personen, Institutionen, Vokabulare
HFDB
Werke-DB (HFDB)
lesend und schreibend: Personen, Klangkörper
NormDB
lesend und schreibend: Personen, Institutionen, Vokabulare, Marken, Werte
lesend: Label
zeitlupe generiert aus NormDB-Objekten automatisiert Jubiläen und nutzt Vokabulare
lesend: Label
Webmerlin
OpenMedia
HAMS
Bezieht Jubiläumsdaten aus zeitlupe
zeitlupe-Daten sollen ab 2014 OTöne aus HFDB sowie Videos aus FESAD verknüpfen können
zeitlupe
zeitlupe soll ab 2015 aus Uraufführungen automatisiert Jubiläen genereien
Bezieht ARD-Chronik-Daten aus zeitlupe
Anbindung von Munzinger-Biographien ab 2014 Anbindung von Wikipedia-Biographien
zeitlupe-Daten werden zur Illustration mit Bildern aus DRABild verknüpft
DRA-Bild
ab 2014: Abgleich NDB-/GND-Personen
Workshop IN2N, 30.09.2014 = Planungs-/Redaktionssysteme
= Archivsysteme
= Rechtemanagement-Systeme
= Online-Dienste
= Externe Datenquellen
Vielen Dank für Ihre Aufmerksamkeit!
Andreas Dan Stiftung Deutsches Rundfunkarchiv Bertramstraße 8 60320 Frankfurt am Main Telefon: 069-15687-213 E-Mail:
[email protected]
Workshop IN2N, 30.09.2014