Auf dem Weg zu wissensbasierten Terminologien tekom Herbst-Tagung 11.-13. November 2014 in Stuttgart D.O.G. Dokumentation ohne Grenzen GmbH Dr. François Massion, Geschäftsführer
[email protected]
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
1
Historische Entwicklung
Karteikarten: ein- und mehrsprachig alphabetisch oder nach Begriffssystem(en)
Word- / Excel-Listen: alphabetisch oder begriffsorientiert evtl. mit Zusatzinformationen
tekom-Tagung
Aus: Eugen Wüster. Technische Sprachnormung – Aufgaben und Stand. Sprachforum 1 (1955), Nr. 1, p. 51-61 in: Heribert Picht, Klaus-Dirk Schmitz. Terminologie und Wissensordnung. Ausgewählte Schriften aus dem Gesamtwerk von Eugen Wüster. Termnet. Wien 2001. Hier: normierter Eintrag aus einer Terminologiekarte für sein Werkzeugmaschinenwörterbuch.
11.-13. November 2014 © D.O.G. GmbH
2
Stand der Technik
Begriffsorientierte Terminologieverwaltungssysteme (TVS)
Begriff fasst Benennungen mehrsprachig zusammen Mit weiteren Informationen (Status, Verwendung, Definitionen usw.)
Selbständig oder in Anwendungen integriert:
Translation Memory Systeme (TMS) Content Management Systeme (CMS) Qualitätssicherungssoftware Produktinformationsmanagement (PIM) usw.
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
3
Schwächen von TVS
Reine Sammlung einzelner Begriffe Beziehung zwischen Begriffen nicht vorhanden oder nur hierarchisch (Oberbegriff, Unterbegriff) Keine oder lückenhafte Entscheidungshilfe bei:
Fehlende Definitionen und Erläuterungen Benennungs- bzw. Begriffsalternativen ("Exit" = Ausgang oder Ausfahrt?) Fehlendem Kontext Fehlendem Wissen des Anwenders (implizites Wissen vorausgesetzt)
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
4
Warum bereiten Begriffe Kopfzerbrechen?
Am Anfang kommt die Realität Daraus entsteht ein Begriff:
Denkeinheit Gemeinsame relevante Merkmale Berücksichtigte Merkmale sind arbiträr
Definierter Begriff und Anwendungsfall stimmen nicht ganz überein:
{
Auswahl von Objekten
ABC BCD
BC D ABCD
Terminologe
Begriffsdefinition mit gemeinsamen Merkmalen BCD
Nutzer
Andere Einsatzbedingungen Realität ABD Weitere technologische Entwicklungen Hybridverfahren / Hybridsituationen Beispiel MÜ-Systeme: Statistisch, regelbasiert, hybrid. Wo liegen die Grenzen?
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
5
Beispiel: Welche Übersetzung für "Behälter"?
Vessel?
(Drei Textauszüge aus Dokumenten eines Anlagebauers)
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
6
Informationen im TVS hilfreich?
Im DIN-Terminologieportal: 45 Normen definieren “Behälter”
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
7
Wissenssysteme
Einsatzbereiche (Beispiele):
Benutzen Ontologien:
Produktionssteuerung (z. B. Internet der Dinge) Vertriebsunterstützung Technischer Support In der IT: Formale computerlesbare Darstellung eines Wissensbereichs auf der Basis von Begriffen und Relationen.
Meta-Ontologien = Ontologie von Ontologien
Beispiel: das Unified Medical Language System (UMLS):
tekom-Tagung
Mit Begriffen aus etwa 150 Ontologien und medizinischen Nomenklaturen in 15 Sprachen. Enthält 2,1 Mio. Begriffe und 9, 8 Mio. einmalige Begriffsbezeichnungen
11.-13. November 2014 © D.O.G. GmbH
8
Wissensmaterial
Klassen [=Begriffe] und Relationen zwischen ihnen. Ontologien können Instanzen von Klassen enthalten (z. B. "Einstein" Instanz von Klasse "Physiker"). Angelehnt an objektorientierter Programmierung (Klassen, Objekte, Eigenschaften). Logik-Regeln und Abfragesprachen wie SPARQL.
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
9
Schwächen von Wissenssystemen
Terminologisch mangelhaft aufbereitet
Problemfall Synonyme oder Fremdsprachen
Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse "Hotel" ) Probleme bei Begriffssuche oder Verknüpfung von Ontologien Nur manche Ontologien ordnen mehrere Benennungen Klassen (Begriffen) zu. Mit Relationen wie "SameAs" oder "EquivalentTo".
Aufbau von Ontologien ist komplex
Spezialwissen ist erforderlich. Einige wenige Fachleute bauen das Wissen mit auf.
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
10
TVS und Wissenssysteme
Unterschiedliche Ziele:
TVS: Sprachsteuerung (+ Wissen) Wissenssysteme: Einem Wissensziel untergeordnet (z. B. Vertriebsunterstützung)
Synergien nutzen:
TVS können das Sprachwissen und die Begriffsmodelle beisteuern Über TVS werden mehr Teilnehmer am Wissensaufbau beteiligt. Wissenssysteme können Methoden und Instrumente zur Wissensstrukturierung und -abfrage beisteuern
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
11
Synergien
Bn B2 B1 B4
Begriffe (=B) Sprache A - Benennung A - Benennung B Sprache B - Benennung A
B5
B3
Wissenssystem tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
12
Unsere Zielsetzung Vorhandene begriffsorientierte Terminologiebestände nehmen Diese mit Wissen anreichern Arbeit standardisieren und z. T. automatisieren
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
13
Wissen ist vorhanden
In TVS:
In Dokumentationen:
Definitionen und Beispiele Verweise Anleitungen, Web-Sites usw. Zeichnungen, Schemata
Wissen vorhanden aber nicht strukturiert Reine Texte und kein computerlesbares Wissen
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
14
Wie entsteht Wissen? Basismaterial = Begriffe Wissen muss "konstruiert" werden Wissen = Begriffe + Relationen Wissen austauschbar und maschinenlesbar machen
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
15
Relationsmuster
Tripel aufbauen:
Subjekt – Prädikat – Objekt
Subjekt = Begriff, von dem die Beziehung ausgeht. Prädikat = Beziehung Objekt = Begriff, der Ziel dieser Beziehung ist.
Beziehungsbeispiele: Subjekt
Prädikat
Objekt
Kohlebürste
ist Teil von
Lichtmaschine
Kohlebürste
bewirkt
elektrischen Kontakt Stan Zurek . Wikimedia. 2006. Kohlebürste eines Motors
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
16
Relationstypen
Äquivalenzrelationen (in TVS) Hierarchierelationen ( in TVS) Assoziationsrelationen ( in TVS):
Attribute und Bedingungen:
Ursache-Wirkung, Position … Abhängig vom Wissensgebiet und von den Wissenszielen Gilt nur, wenn Objektattribut ist: 'Material = Kunststoff'
Relationseigenschaften:
Unidirektional / Bidirektional Transitiv 1:1; 1:n; n:1
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
17
Relationen modellieren Beziehungstyp
Beispiele
KAUSALITÄT
• • • •
Bewirkt, Beeinflusst Verwendet, Benutzt Verändert Beendet, Startet
GANZ - TEIL
• •
Ist Teil von Beinhaltet, Umfasst
FUNKTION
•
Dient zu
ZEIT - ZEITFOLGE
•
Startet nach, vor
EIGENSCHAFT
• • •
Hat Zustand Hat Eigenschaft Besteht aus Material
POSITION - ORT
• •
Befindet sich Steht neben
Allgemeine Beziehungen
• •
Hat zu tun mit Ist ähnlich zu
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
18
Umsetzungsstrategie
Beschränkte Anzahl an Relationen definieren und dokumentieren Teil der Arbeit automatisieren Manuelle Arbeit in virtuellen Teams verteilen (Autoren, Entwickler, Übersetzer…)
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
19
Hierarchische Relationen festlegen
Manuell oder halbautomatisch:
Gemeinsames Grundwort suchen (z.B. "Ventil") Zeichnungen, Stücklisten (Teil - Ganzes - Relation) Oberflächenbeschreibungen, Maskennummer
Quelle: Kuntoff. Wikimedia. 09.09.2005
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
20
Assoziative Relationen festlegen
Manuell oder halbautomatisch:
Z. B. Begriffe aus Normen, aus Gefahrenhinweisen extrahieren Stichwörter (Marker) für best. Relationstypen in Listen pflegen:
tekom-Tagung
"Befindet sich" Positionsrelation "Verwenden", "dienen zu" Funktionsrelation "Enthalten", "besteht aus" Teil – Ganzes - Relation "Bewirkt", "verursacht", "löst aus" Ursache – Wirkungsrelation usw..
11.-13. November 2014 © D.O.G. GmbH
21
Umsetzungsbeispiel
Wie lässt sich unser Übersetzungsbeispiel modellieren? Verschiedene Anreicherungsschritte Schritt 1: Wort- und Begriffsliste sammeln
tekom-Tagung
Deutsch
Englisch
Behälter
bin
Druckbehälter
tank
Paketbehälter
vessel
Tank
container
11.-13. November 2014 © D.O.G. GmbH
22
Schritt 2: Taxonomie Begriffshierarchie ("Taxonomie") Aufbau klassischer TVS
Behälter
DE: Behälter DE: Paketbehälter EN: Bin
tekom-Tagung
DE: Behälter DE: Druckbehälter EN: Vessel
DE: Behälter DE: Tank EN: Tank
11.-13. November 2014 © D.O.G. GmbH
DE: Behälter DE: Auffangbehälter EN: Container
23
Schritt 3: Anreicherung Definitionen Bilder, Kommentare usw.
Behälter
DE: Behälter (verboten) DE: Paketbehälter (erlaubt) EN: Bin
Def.: Transport, stapelbar, z.B. für Briefe, Pakete
tekom-Tagung
DE: Behälter (verboten) DE: Druckbehälter (erlaubt) EN: Vessel
Def.: Druck, Vakuum, z.B. für Gas
Def.: etwas, was zum Aufbewahren und Transportieren beliebiger Gegenstände oder Flüssigkeiten (auch Gase) dient
DE: Behälter (verboten) DE: Tank (erlaubt) EN: Tank
Def.: offen oder geschlossen, rel. groß, z.B. für Wasser
11.-13. November 2014 © D.O.G. GmbH
DE: Behälter (verboten) DE: Auffangbehälter (erlaubt) EN: Container
Def.: für die Entsorgung von Stoffen, Flüssigkeiten, Chemikalien
24
Schritt 4: Relationen
Behälter
Vessel = Druckbehälter
Hierarchisch
Container = Auffangbehälter
Tank
Paket
tekom-Tagung
Transport
Druck
Gas
Versorgung
Flüssigkeit
11.-13. November 2014 © D.O.G. GmbH
Assoziativ
Enthält
Bin = Paketbehälter
Entsorgung
25
Von der Terminologie zur Wissenslösung
Quellen • Dokumente • Web • Datenbanken
tekom-Tagung
Extraktion • Einsprachig • Mehrsprachig • Erkennung von Synonymen und Homonymen • Erfassung
Anreicherung • Definitionen • Semantische Informationen • Attribute • Bild, Zeichnung
11.-13. November 2014 © D.O.G. GmbH
Organisation • Relationen • Evtl. Bedingungen
26
Einige XML-basierte Datenformate (1/2)
TBX (TermBase Exchange)
Austausch begriffsorientierter Terminologien
RDF (Resource Description Framework) und RDFS (RDF Schema)
Repräsentation von Wissen im Internet Aussagen über Ressourcen (Individuen) Einfache Relationen Benutzt Tripel Beispiele von RDF-Vokabulare:
tekom-Tagung
FOAF – Friend of a Friend (speziell für soziale Netzwerke) SKOS – Simple Knowledge Organisation System Beschreibt Taxononomien, Klassifikationen, Thesauri
Quelle: https://github.com/seebi/planet-fsw.lod2.eu/blob/master/test/desirejeanette.rdf Zugriff: 16.10.2014)
11.-13. November 2014 © D.O.G. GmbH
27
Einige XML-basierte Datenformate (2/2)
OWL (Web Ontology Language).
Varianten: OWL Lite, OWL DL, OWL Full Baut auf RDF Komplexere Relationen Klassen, Objekte, Eigenschaften, Logik
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
28
Wissensabfrage
Durch Relationen kann man Zusammenhänge abfragen. Beispiele: Welche Begriffe stehen mit dem Begriff Kohlebürste in Zusammenhang? Was sind es für Relationen? oder Welche Gefahren gehen vom Spritzgerät aus?
Abfrage unabhängig von:
Sprache ("Drehknopf", "Poti" oder "potentiomètre"). Verwendungsstatus: "erlaubt" oder "verboten"
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
29
Nutzungsszenarios
Entlang des Produktlebenszyklus viele potenzielle Nutzer:
Konstruktion Vertrieb Technischer Support Redaktion und Übersetzungen usw.
Beispiele:
Redakteur nutzt Firmenwissen zur Optimierung der Warnhinweise oder der Normenkonformität der Dokumentation. Übersetzer prüft Übersetzungskontext ("Behälter"). Technischer Support sucht Ursache-Wirkung-Relationen zur schnelleren Lösung von Problemen.
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
30
Anwendungsbeispiel Warnhinweise
Dokumentieren von Gefahren mit Unterstützung von Beziehungen
Auszug aus der BA “Mischpumpe G 4 X Standard” der Fa. Knauf PFT GmbH & Co.KG. Heruntergeladen von www.pft.eu am 17.10.2014
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
31
Anwendungsbeispiel Warnhinweise
Dokumentieren von Gefahren mit Unterstützung von Beziehungen
Auszug aus der BA “Mischpumpe G 4 X Standard” der Fa. Knauf PFT GmbH & Co.KG. Heruntergeladen von www.pft.eu am 17.10.2014
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
32
Die Vision
Aufwertung der Terminologiearbeit. Anerkennung von Terminologie als Instrument zur Wissenserstellung. Schnellere und genauere Umsetzung neuer Wissensprojekte . Grenzen zwischen TVS und Wissenssystemen verschwinden allmählich. Öffnet Wissensthemen, Wissensmodellierung einer größeren Anzahl von Teilnehmern. Dadurch schneller zu inhaltsreicheren Wissenssystemen Kooperative Wissenserstellung.
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
33
Vielen Dank für Ihre Aufmerksamkeit! Dr. F. Massion
D.O.G. Dokumentation ohne Grenzen GmbH Neue Ramtelstr. 12 71229 Leonberg, Germany
[email protected]
tekom-Tagung
11.-13. November 2014 © D.O.G. GmbH
34