Do Word Meanings Exist? Patrick Hanks

Do Word Meanings Exist? Patrick Hanks Intro • Zur Desambiguierung wurden Checklisten benutzt • checklist theories: – oberflächlich und irreführend –...
Author: Maike Koenig
13 downloads 0 Views 28KB Size
Do Word Meanings Exist? Patrick Hanks

Intro • Zur Desambiguierung wurden Checklisten benutzt • checklist theories: – oberflächlich und irreführend – wenn es Bedeutung gibt, dann nicht in Form einer Checkliste

• Vagheit und Redundanz sind wichtige Merkmale natürlicher Sprache, aber nicht kompatibel mit Checklisten

bank • bank (Finanz-) und bank (Ufer, Böschung) sind nicht zwei Bedeutungen eines Wortes, sondern zwei verschiedene Wörter, die zufällig gleich geschrieben werden • Kontext disambiguiert • aber meist werden die kanonischen Bedeutungen nicht voll aktiviert, sondern nur sehr teilweise • Auflistung der einzelnen Bedeutungen kann Überlappung und Beziehungen zwischen ihnen nicht richtig erfassen • Ungenauigkeit, die so typisch ist für Wortgebrauch, kann nicht richtig erfasst werden • Das Problem ist Vagheit – nicht Mehrdeutigkeit!

Erweiterungen von bank • Datenbank, Samenbank, …? • keine finanzielle Institution, aber hat mit wegschließen und sichern zu tun • Unter einer Lexikon-Definition zusammenfassen? Bank = eine Institution, in der Dinge gelagert und gesichert werden? • Ist das genau? Kann man das beliebig verwenden? Würstchenbank?

lexical conceptual paradigm (1) He assaulted them in a bank doorway. – Bank als Gebäude, nicht abstrakte Entität

• Institution und Gebäude zwei verschiedene Bedeutungen? • oder Teil desselben lexical conceptual paradigm? (Pustejovsky) • lcp Zeitung: {Organisation, physikalisches Objekt, Information in den Artikeln}

(2a) Die Zeitung entließ ihren Chefredakteur. (2b) Ich habe die Zeitung weggeschmissen. (2c) Er hat sich über die Zeitung geärgert.

Lexikon • Wie feinkörnig sollen die Unterscheidungen im Lexikon sein? • Lexikographen: – lumpers: fassen möglichst viel unter einer Bedeutung zusammen – splitters: unterscheiden sehr viele Bedeutungen säuberlich voneinander.

• Wenn immer mehr neue Vorkommen eines Wortes gesammelt werden und diese nicht genau auf die schon existierenden Definitionen passen, werden neue Definitionen hinzugefügt. ? Problem für computationelle Analyse

Vagheit • Sprache ist vage und variabel, aber folgt dabei Prinzipien, die wir noch nicht richtig verstanden haben. • „An adequate definition of a vague concept must aim not at precision but at vagueness: it must aim at precisely that level of vagueness which characterizes the concept itself.” (Anna Wierzbicka)

Wittgenstein • SPIELE: • Brettspiele, Kartenspiele, Ballspiele, Olympische Spiele, Ringelreihen – was haben sie gemeinsam? • Es gibt nicht eins, das sie alle gemein haben, aber Ähnlichkeiten und Beziehungen zwischen ihnen • Dienen sie alle dem Spaß? Geht es ums Gewinnen? Geschick oder Glück? • kompliziertes Netzwerk von sich überlappenden und kreuzenden Ähnlichkeiten, manchmal umfassende Ähnlichkeiten, manchmal nur Ähnlichkeiten in Details

Wittgenstein • semantische Komponenten sind mögliche, aber nicht notwendige Beiträger zur Wortbedeutung • Wittgenstein übertragen auf maschinelle Lexika: – semantische Komponenten identifizieren als separate, kombinierbare und ausnutzbare Einheiten – verringert die Zahl der einzelnen Lexikoneinträge für ein Wort

Komponenten von bank bank1: • is an institution • is a large building • for storage • for safekeeping • of finance/money • carries out transactions • consists of a staff of people

bank2: • is land • is sloping • is long • is elevated • situated beside water

Friedliche Koexistenz • wenn bank benutzt wird, wird mindestens eine, meist aber Kombination von mehreren Komponenten aktiviert • aber keine der Komponenten ist eine notwendige Bedingung für Bank • die Komponenten sind probabilistisch und prototypisch • sie müssen nicht miteinander kompatibel sein: – institution und large building sind nicht verträglich, aber das heißt nur, dass sie nicht gleichzeitig aktiviert werden

• so kann man Vagheit behandeln

(3a) Adam sat on the bank among the bulrushes. is sloping? (3b) Adam slips down the bank into the water. • man kann dann noch semantische Vererbung einbeziehen: „is a building“ impliziert „has a doorway” • Nicht immer kann die Bedeutung vom unmittelbaren phrasalen Zusammenhang bestimmt werden

Komponenten ins Wörterbuch! • Wenn ein Mensch sagen kann, welche Komponenten aktiviert sind, dann sollten sich Kriterien finden lassen, mit denen man rechnen kann. • Zusammenhänge zwischen den aktivierten Komponenten und Kontext finden • Im Wörterbuch soll stehen, wie verschiedene Aspekte einer Wortbedeutung in unterschiedlichen Kontexten aktiviert werden und was für Kontexte das sind.

Was ist Bedeutung? • Bedeutung eines aktuell benutzten Wortes: Ereignis, keine Entität! • Existieren Bedeutungen außerhalb der Kontexte, in denen sie benutzt werden? • Bedeutungen eines Wortes im Wörterbuch sind keine Bedeutungen, sondern Bedeutungspotentiale – potentielle Beiträge zur Bedeutung von Texten und Konversationen, in denen die Wörter benutzt werden • Lexika und Korpora nur Werkzeuge, um Wortbedeutungen zu untersuchen • mit Korpus lassen sich Spuren und Muster von sprachlichem Verhalten untersuchen, aber kein direkter Weg vom Korpus zur Bedeutung • Korpus: Spuren von Bedeutungs-Ereignissen • Wörterbuch: Liste von Bedeutungspotentialen

Implikationen • Verben ordnen Nomen semantische Rollen zu • Nomen haben Bedeutungspotentiale, die aktiviert werden, wenn sie in die Verbrahmen passen • so kann man Propositionen formulieren • aus Propositionen (nicht aus Wörtern) kann man logisch folgern • aber Wörter haben Implikationen (Implikationen sind schwächer als log. Folgerungen, weil sie probabilistisch sind und gelöscht werden können)

drei verschiedene Implikationen (4) the two man who first climbed Mt Everest impliziert, dass sie den Gipfel erreicht haben

(5) He climbed a tree to get a better view. impliziert, dass der Kletterer nicht unbedingt bis zur Spitze geklettert ist, sondern nur bis zu einem bestimmten Punkt

(6) He climbed a gate into a field. impliziert, dass der Kletterer nicht nur auf das Tor, sondern an der anderen Seite auch wieder runter geklettert ist

climb • Welches Wort trägt zur jeweiligen Implikation bei? • Bedeutung ergibt sich nicht nur aus einem Wort, sondern Kombinationen mehrerer • default-Interpretationen, nicht unbedingt notwendige Bedingungen: (4’) They climbed Mt Everest but did not get to the top. • climb: 2 Komponenten : KLETTERN + HOCH in Benutzung mit Richtungsadverbialen wird KLETTERN aktiviert, aber nicht HOCH (7) I climbed into the backseat. (8) Sie sind durchs Fenster geklettert. (9) After breakfast we climbed up through a steep canyon.

Schluss Es gibt Wortbedeutungen, aber: • Außerhalb des Äußerungszusammenhangs = des Bedeutungs-Ereignisses haben Wörter Bedeutungspotential! • Bedeutungspotential = Menge von Komponenten, die von anderen Wörtern aus dem Zusammenhang kognitiv aktiviert werden können • kognitiven Komponenten sind in einem Netz verbunden, das die semantische Basis der Sprache darstellt • es gibt damit Potential neue Dinge zu sagen und Unbekanntes mit Bekanntem zu verbinden

Wettbewerb und Koexistenz • Wettbewerb zwischen verschiedenen Komponenten (Mengen von Komponenten) • Friedliche Koexistenz verschiedener Komponenten in einem Benutzungszusammenhang • statt: „Welche Bedeutung hat dieses Wort in diesem Text?“ • lieber: „Welchen einzigartigen Beitrag leistet dieses Wort zur Bedeutung des Textes?“ • einzigartiger Beitrag: Kombination der Komponenten, die das Bedeutungspotential ausmachen, ausgelöst durch Kontext • nicht ausgelöste Komponenten treten beim Wettbewerb der Bedeutungen gar nicht an

Ende

Aufgabe für computationelle Lexikographie: • Identifizierung der Bedeutungskomponenten • Kombinationsmöglichkeiten • Beziehungen mit Bedeutungskomponenten von semantisch verwandten Wörtern • phraseologische Umstände, unter denen Aktivierung passiert