Auf dem Weg zu wissensbasierten Terminologien tekom Herbst-Tagung 11.-13. November 2014 in Stuttgart D.O.G. Dokumentation ohne Grenzen GmbH Dr. François Massion, Geschäftsführer [email protected]

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

1

Historische Entwicklung 

Karteikarten: ein- und mehrsprachig  alphabetisch oder  nach Begriffssystem(en) 



Word- / Excel-Listen: alphabetisch oder  begriffsorientiert  evtl. mit Zusatzinformationen 

tekom-Tagung

Aus: Eugen Wüster. Technische Sprachnormung – Aufgaben und Stand. Sprachforum 1 (1955), Nr. 1, p. 51-61 in: Heribert Picht, Klaus-Dirk Schmitz. Terminologie und Wissensordnung. Ausgewählte Schriften aus dem Gesamtwerk von Eugen Wüster. Termnet. Wien 2001. Hier: normierter Eintrag aus einer Terminologiekarte für sein Werkzeugmaschinenwörterbuch.

11.-13. November 2014 © D.O.G. GmbH

2

Stand der Technik 

Begriffsorientierte Terminologieverwaltungssysteme (TVS)  



Begriff fasst Benennungen mehrsprachig zusammen Mit weiteren Informationen (Status, Verwendung, Definitionen usw.)

Selbständig oder in Anwendungen integriert:    

Translation Memory Systeme (TMS) Content Management Systeme (CMS) Qualitätssicherungssoftware Produktinformationsmanagement (PIM) usw.

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

3

Schwächen von TVS  



Reine Sammlung einzelner Begriffe Beziehung zwischen Begriffen nicht vorhanden oder nur hierarchisch (Oberbegriff, Unterbegriff) Keine oder lückenhafte Entscheidungshilfe bei:  

 

Fehlende Definitionen und Erläuterungen Benennungs- bzw. Begriffsalternativen ("Exit" = Ausgang oder Ausfahrt?) Fehlendem Kontext Fehlendem Wissen des Anwenders (implizites Wissen vorausgesetzt)

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

4

Warum bereiten Begriffe Kopfzerbrechen?  

Am Anfang kommt die Realität Daraus entsteht ein Begriff:   



Denkeinheit Gemeinsame relevante Merkmale Berücksichtigte Merkmale sind arbiträr

Definierter Begriff und Anwendungsfall stimmen nicht ganz überein:    

{

Auswahl von Objekten

ABC BCD

BC D ABCD

Terminologe

Begriffsdefinition mit gemeinsamen Merkmalen BCD

Nutzer

Andere Einsatzbedingungen Realität ABD Weitere technologische Entwicklungen Hybridverfahren / Hybridsituationen Beispiel MÜ-Systeme: Statistisch, regelbasiert, hybrid. Wo liegen die Grenzen?

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

5

Beispiel: Welche Übersetzung für "Behälter"?

Vessel?

(Drei Textauszüge aus Dokumenten eines Anlagebauers)

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

6

Informationen im TVS hilfreich?

Im DIN-Terminologieportal: 45 Normen definieren “Behälter”

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

7

Wissenssysteme 

Einsatzbereiche (Beispiele):   



Benutzen Ontologien: 



Produktionssteuerung (z. B. Internet der Dinge) Vertriebsunterstützung Technischer Support In der IT: Formale computerlesbare Darstellung eines Wissensbereichs auf der Basis von Begriffen und Relationen.

Meta-Ontologien = Ontologie von Ontologien 

Beispiel: das Unified Medical Language System (UMLS): 



tekom-Tagung

Mit Begriffen aus etwa 150 Ontologien und medizinischen Nomenklaturen in 15 Sprachen. Enthält 2,1 Mio. Begriffe und 9, 8 Mio. einmalige Begriffsbezeichnungen

11.-13. November 2014 © D.O.G. GmbH

8

Wissensmaterial  





Klassen [=Begriffe] und Relationen zwischen ihnen. Ontologien können Instanzen von Klassen enthalten (z. B. "Einstein" Instanz von Klasse "Physiker"). Angelehnt an objektorientierter Programmierung (Klassen, Objekte, Eigenschaften). Logik-Regeln und Abfragesprachen wie SPARQL.

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

9

Schwächen von Wissenssystemen 

Terminologisch mangelhaft aufbereitet   



Problemfall Synonyme oder Fremdsprachen 





Basis = Klasse (Begriff) Klassenname meistens einsprachige Benennung (z.B. Klasse "Hotel" ) Probleme bei Begriffssuche oder Verknüpfung von Ontologien Nur manche Ontologien ordnen mehrere Benennungen Klassen (Begriffen) zu. Mit Relationen wie "SameAs" oder "EquivalentTo".

Aufbau von Ontologien ist komplex  

Spezialwissen ist erforderlich. Einige wenige Fachleute bauen das Wissen mit auf.

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

10

TVS und Wissenssysteme 

Unterschiedliche Ziele:  



TVS: Sprachsteuerung (+ Wissen) Wissenssysteme: Einem Wissensziel untergeordnet (z. B. Vertriebsunterstützung)

Synergien nutzen: 





TVS können das Sprachwissen und die Begriffsmodelle beisteuern Über TVS werden mehr Teilnehmer am Wissensaufbau beteiligt. Wissenssysteme können Methoden und Instrumente zur Wissensstrukturierung und -abfrage beisteuern

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

11

Synergien

Bn B2 B1 B4

Begriffe (=B) Sprache A - Benennung A - Benennung B Sprache B - Benennung A

B5

B3

Wissenssystem tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

12

Unsere Zielsetzung Vorhandene begriffsorientierte Terminologiebestände nehmen  Diese mit Wissen anreichern  Arbeit standardisieren und z. T. automatisieren 

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

13

Wissen ist vorhanden 

In TVS:  



In Dokumentationen:  

 

Definitionen und Beispiele Verweise Anleitungen, Web-Sites usw. Zeichnungen, Schemata

Wissen vorhanden aber nicht strukturiert Reine Texte und kein computerlesbares Wissen

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

14

Wie entsteht Wissen? Basismaterial = Begriffe  Wissen muss "konstruiert" werden  Wissen = Begriffe + Relationen  Wissen austauschbar und maschinenlesbar machen 

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

15

Relationsmuster 

Tripel aufbauen: 

Subjekt – Prädikat – Objekt   



Subjekt = Begriff, von dem die Beziehung ausgeht. Prädikat = Beziehung Objekt = Begriff, der Ziel dieser Beziehung ist.

Beziehungsbeispiele: Subjekt

Prädikat

Objekt

Kohlebürste

ist Teil von

Lichtmaschine

Kohlebürste

bewirkt

elektrischen Kontakt Stan Zurek . Wikimedia. 2006. Kohlebürste eines Motors

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

16

Relationstypen   

Äquivalenzrelationen (in TVS) Hierarchierelationen ( in TVS) Assoziationsrelationen ( in TVS):  



Attribute und Bedingungen: 



Ursache-Wirkung, Position … Abhängig vom Wissensgebiet und von den Wissenszielen Gilt nur, wenn Objektattribut ist: 'Material = Kunststoff'

Relationseigenschaften:   

Unidirektional / Bidirektional Transitiv 1:1; 1:n; n:1

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

17

Relationen modellieren Beziehungstyp

Beispiele

KAUSALITÄT

• • • •

Bewirkt, Beeinflusst Verwendet, Benutzt Verändert Beendet, Startet

GANZ - TEIL

• •

Ist Teil von Beinhaltet, Umfasst

FUNKTION



Dient zu

ZEIT - ZEITFOLGE



Startet nach, vor

EIGENSCHAFT

• • •

Hat Zustand Hat Eigenschaft Besteht aus Material

POSITION - ORT

• •

Befindet sich Steht neben

Allgemeine Beziehungen

• •

Hat zu tun mit Ist ähnlich zu

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

18

Umsetzungsstrategie 

 

Beschränkte Anzahl an Relationen definieren und dokumentieren Teil der Arbeit automatisieren Manuelle Arbeit in virtuellen Teams verteilen (Autoren, Entwickler, Übersetzer…)

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

19

Hierarchische Relationen festlegen 

Manuell oder halbautomatisch:   

Gemeinsames Grundwort suchen (z.B. "Ventil") Zeichnungen, Stücklisten (Teil - Ganzes - Relation) Oberflächenbeschreibungen, Maskennummer

Quelle: Kuntoff. Wikimedia. 09.09.2005

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

20

Assoziative Relationen festlegen 

Manuell oder halbautomatisch: 



Z. B. Begriffe aus Normen, aus Gefahrenhinweisen extrahieren Stichwörter (Marker) für best. Relationstypen in Listen pflegen:    

tekom-Tagung

"Befindet sich"  Positionsrelation "Verwenden", "dienen zu"  Funktionsrelation "Enthalten", "besteht aus"  Teil – Ganzes - Relation "Bewirkt", "verursacht", "löst aus"  Ursache – Wirkungsrelation usw..

11.-13. November 2014 © D.O.G. GmbH

21

Umsetzungsbeispiel   

Wie lässt sich unser Übersetzungsbeispiel modellieren? Verschiedene Anreicherungsschritte Schritt 1: Wort- und Begriffsliste sammeln

tekom-Tagung

Deutsch

Englisch

Behälter

bin

Druckbehälter

tank

Paketbehälter

vessel

Tank

container

11.-13. November 2014 © D.O.G. GmbH

22

Schritt 2: Taxonomie Begriffshierarchie ("Taxonomie")  Aufbau klassischer TVS 

Behälter

DE: Behälter DE: Paketbehälter EN: Bin

tekom-Tagung

DE: Behälter DE: Druckbehälter EN: Vessel

DE: Behälter DE: Tank EN: Tank

11.-13. November 2014 © D.O.G. GmbH

DE: Behälter DE: Auffangbehälter EN: Container

23

Schritt 3: Anreicherung Definitionen  Bilder, Kommentare usw. 

Behälter

DE: Behälter (verboten) DE: Paketbehälter (erlaubt) EN: Bin

Def.: Transport, stapelbar, z.B. für Briefe, Pakete

tekom-Tagung

DE: Behälter (verboten) DE: Druckbehälter (erlaubt) EN: Vessel

Def.: Druck, Vakuum, z.B. für Gas

Def.: etwas, was zum Aufbewahren und Transportieren beliebiger Gegenstände oder Flüssigkeiten (auch Gase) dient

DE: Behälter (verboten) DE: Tank (erlaubt) EN: Tank

Def.: offen oder geschlossen, rel. groß, z.B. für Wasser

11.-13. November 2014 © D.O.G. GmbH

DE: Behälter (verboten) DE: Auffangbehälter (erlaubt) EN: Container

Def.: für die Entsorgung von Stoffen, Flüssigkeiten, Chemikalien

24

Schritt 4: Relationen

Behälter

Vessel = Druckbehälter

Hierarchisch

Container = Auffangbehälter

Tank

Paket

tekom-Tagung

Transport

Druck

Gas

Versorgung

Flüssigkeit

11.-13. November 2014 © D.O.G. GmbH

Assoziativ

Enthält

Bin = Paketbehälter

Entsorgung

25

Von der Terminologie zur Wissenslösung

Quellen • Dokumente • Web • Datenbanken

tekom-Tagung

Extraktion • Einsprachig • Mehrsprachig • Erkennung von Synonymen und Homonymen • Erfassung

Anreicherung • Definitionen • Semantische Informationen • Attribute • Bild, Zeichnung

11.-13. November 2014 © D.O.G. GmbH

Organisation • Relationen • Evtl. Bedingungen

26

Einige XML-basierte Datenformate (1/2) 

TBX (TermBase Exchange) 



Austausch begriffsorientierter Terminologien

RDF (Resource Description Framework) und RDFS (RDF Schema)     

Repräsentation von Wissen im Internet Aussagen über Ressourcen (Individuen) Einfache Relationen Benutzt Tripel Beispiele von RDF-Vokabulare: 



tekom-Tagung

FOAF – Friend of a Friend (speziell für soziale Netzwerke) SKOS – Simple Knowledge Organisation System Beschreibt Taxononomien, Klassifikationen, Thesauri

Quelle: https://github.com/seebi/planet-fsw.lod2.eu/blob/master/test/desirejeanette.rdf Zugriff: 16.10.2014)

11.-13. November 2014 © D.O.G. GmbH

27

Einige XML-basierte Datenformate (2/2) 

OWL (Web Ontology Language).    

Varianten: OWL Lite, OWL DL, OWL Full Baut auf RDF Komplexere Relationen Klassen, Objekte, Eigenschaften, Logik

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

28

Wissensabfrage  

Durch Relationen kann man Zusammenhänge abfragen. Beispiele: Welche Begriffe stehen mit dem Begriff Kohlebürste in Zusammenhang?  Was sind es für Relationen? oder  Welche Gefahren gehen vom Spritzgerät aus? 



Abfrage unabhängig von:  

Sprache ("Drehknopf", "Poti" oder "potentiomètre"). Verwendungsstatus: "erlaubt" oder "verboten"

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

29

Nutzungsszenarios 

Entlang des Produktlebenszyklus viele potenzielle Nutzer:    



Konstruktion Vertrieb Technischer Support Redaktion und Übersetzungen usw.

Beispiele: 

 

Redakteur nutzt Firmenwissen zur Optimierung der Warnhinweise oder der Normenkonformität der Dokumentation. Übersetzer prüft Übersetzungskontext ("Behälter"). Technischer Support sucht Ursache-Wirkung-Relationen zur schnelleren Lösung von Problemen.

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

30

Anwendungsbeispiel Warnhinweise 

Dokumentieren von Gefahren mit Unterstützung von Beziehungen

Auszug aus der BA “Mischpumpe G 4 X Standard” der Fa. Knauf PFT GmbH & Co.KG. Heruntergeladen von www.pft.eu am 17.10.2014

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

31

Anwendungsbeispiel Warnhinweise 

Dokumentieren von Gefahren mit Unterstützung von Beziehungen

Auszug aus der BA “Mischpumpe G 4 X Standard” der Fa. Knauf PFT GmbH & Co.KG. Heruntergeladen von www.pft.eu am 17.10.2014

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

32

Die Vision  

 



 

Aufwertung der Terminologiearbeit. Anerkennung von Terminologie als Instrument zur Wissenserstellung. Schnellere und genauere Umsetzung neuer Wissensprojekte . Grenzen zwischen TVS und Wissenssystemen verschwinden allmählich. Öffnet Wissensthemen, Wissensmodellierung einer größeren Anzahl von Teilnehmern. Dadurch schneller zu inhaltsreicheren Wissenssystemen Kooperative Wissenserstellung.

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

33

Vielen Dank für Ihre Aufmerksamkeit! Dr. F. Massion

D.O.G. Dokumentation ohne Grenzen GmbH Neue Ramtelstr. 12 71229 Leonberg, Germany

[email protected]

tekom-Tagung

11.-13. November 2014 © D.O.G. GmbH

34