TIGER Annotationsschema Stefanie Albert Jan Anderssen Regine Bader Stephanie Becker Tobias Bracht Sabine Brants Thorsten Brants Vera Demberg Stefanie Dipper Peter Eisenberg Silvia Hansen Hagen Hirschmann Juliane Janitzek Carolin Kirstein Robert Langner Lukas Michelbacher Oliver Plaehn Cordula Preis Marcus Pußel Marco Rower Bettina Schrader Anne Schwartz George Smith Hans Uszkoreit
[email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected]
Projekt-Info: http://www.ims.uni-stuttgart.de/projekte/TIGER/ Mailing-Liste:
[email protected]
24. Juli 2003 DRAFT – Bitte nicht kopieren!
Projekt TIGER Aufbau eines linguistisch interpretierten Korpus des Deutschen
Universit¨at des Saarlandes FR 8.7 Computerlinguistik Universit¨at Stuttgart Institut f¨ur Maschinelle Sprachverarbeitung Universit¨at Potsdam Institut f¨ur Germanistik
2
Inhaltsverzeichnis 1
Vorwort
8
2
Nominalphrasen
9
2.1
9
2.1.1
Adjektivphrasen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.1.2
Numeralien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
2.1.3
Datums- und Zeitangaben . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
2.1.4
Syntax der Eigennamen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
2.1.5
Fremdsprachliches Material . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.1.6
Maßangaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.2
Genitive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
2.3
Postnominale PPs und Adverbien . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
2.4
Appositionen und Parenthesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
2.4.1
Appositionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
2.4.2
Parenthesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
Argumente von Substantiven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
2.5.1
VP und Satzargumente . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
2.5.2
Pr¨apositionalobjekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
2.6
Relativs¨atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
2.7
MOs in NPs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
2.5
3
4
Kern-NP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Pr¨apositionalphrasen
34
3.1
Basisstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
3.2
Die Pr¨aposition zwischen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
3.3
Kurz vor und a¨ hnliche Konstruktionen . . . . . . . . . . . . . . . . . . . . . . . . .
36
3.4
Dar¨uber hinaus - Pr¨apositionaladverbien . . . . . . . . . . . . . . . . . . . . . . . .
37
Adjektivphrasen
38
4.1
Basisstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
4.2
Adjektivisch gebrauchte Verbformen . . . . . . . . . . . . . . . . . . . . . . . . . .
39
4.3
Komplexe Adjektive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
4.4
Modifizierte Determiner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
4.5
Komparativ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
3
5
4.6
Superlativ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
4.7
Argumente von Adjektiven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
Verbphrasen und Sa¨ tze
48
5.1
Basisstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
5.2
Grammatische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
5.2.1
Komplementierer (CP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
5.2.2
Subjekt (SB) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
5.2.3
Akkusativobjekt (OA, OA2) . . . . . . . . . . . . . . . . . . . . . . . . . .
51
5.2.4
Dativ (DA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
5.2.5
Genitivobjekt (OG) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
5.2.6
Pr¨apositionalobjekte (OP) . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
5.2.7
Obligatorische Modifikatoren (OMO) . . . . . . . . . . . . . . . . . . . . .
61
5.2.8
Funktionsverbgef¨uge (CVC) . . . . . . . . . . . . . . . . . . . . . . . . . .
62
5.2.9
Pr¨adikative (PD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
5.2.10 Um zu, ohne zu - Pr¨apositionen in VPs . . . . . . . . . . . . . . . . . . . . .
66
5.2.11 Ohne daß, statt daß. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
66
5.2.12 Anrede (VO) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
66
5.2.13 VPs und S¨atze als Argumente von Verben . . . . . . . . . . . . . . . . . . .
67
Passiv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
5.3.1
Vorgangspassiv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
5.3.2
Zustandspassiv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
70
5.4
Verblose S¨atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
5.5
Direkte und Indirekte Rede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
5.6
Diskurspartikeln - DM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
5.3
6
Platzhalterphrasen
76
6.1
Pronominaladverbien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
76
6.2
Es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
6.3
Verbale Argumente von Gradadverbien . . . . . . . . . . . . . . . . . . . . . . . . .
80
6.4
So, wie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
6.5
Weitere Platzhalterkonstruktionen . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
4
7
8
Adjunkte
85
7.1
Klassifikation von Adjunkten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
7.2
Komparativ-als . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
7.3
Nichtkomparativ-als . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
86
7.3.1
MO-als . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
86
7.3.2
MNR-als . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
86
7.4
Wie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
88
7.5
Idiosynkratische Einheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
90
7.6
Anbindungsambiguit¨aten in VPs und S¨atzen . . . . . . . . . . . . . . . . . . . . . .
91
7.6.1
Modalverben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
91
7.6.2
Kontrollverben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
92
7.6.3
Wahrnehmungsverben . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
92
7.6.4
Hilfsverben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
92
7.6.5
Kopulakonstruktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
92
Modifikatoren, Fokuspartikeln und Einzelf¨alle
93
8.1
Aber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
8.2
Allein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
94
8.3
Auch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
94
8.4
Ausgerechnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
8.5
Bereits, schon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
8.6
D.h. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
8.7
Ebenso wie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
96
8.8
Eher (als) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
97
8.9
Ein paar/bißchen/wenig/. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
97
8.10 erst einmal
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
8.11 Etwa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
8.12 Immer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
8.12.1 Immer besser/schlechter/. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
8.12.2 Immer (mal) wieder
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
8.12.3 Immer noch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
8.13 Innerhalb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
8.14 Insbesondere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
5
8.15 Je, jeweils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
8.15.1 je-desto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 8.16 Leid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 8.17 Manch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 8.18 Mehr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 8.18.1 10 Leute mehr/keine Leute mehr/nicht mehr/. . . . . . . . . . . . . . . . . . . 101 8.19 Nicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 8.20 Noch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.20.1 Temporal-noch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.20.2 Noch st¨arker, besser, schlechter. . .
. . . . . . . . . . . . . . . . . . . . . . 105
8.21 Nur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.22 Recht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.23 Schon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.24 Selbst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.24.1 Selbst=Selber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 8.24.2 Selbst=Sogar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 8.25 So . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 8.25.1 so sehr - so sehr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 8.26 Sogar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 8.27 Solch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 8.27.1 Solch ein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 8.27.2 Solch + ADJA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 8.27.3 Solch + Flexionsendung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 8.27.4 Solch + wie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 8.28 Statt, außer, neben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 8.29 Umgerechnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 8.30 Vielmehr als . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 8.31 Vor allem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 8.32 Welch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 8.33 Wenn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 8.33.1 wenn-dann, wenn-so . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6
9
Koordination 9.1
112
Grundstruktur der NP-, AP-, PP-Koordination . . . . . . . . . . . . . . . . . . . . . 112 9.1.1
Koordinierende Konjunktionen . . . . . . . . . . . . . . . . . . . . . . . . . 112
9.1.2
Bin¨are koordinierende Konjunktionen . . . . . . . . . . . . . . . . . . . . . 112
9.2
Koordination von satzeinleitenden Konjunktionen (CPs) . . . . . . . . . . . . . . . 115
9.3
Koordination von Nominal- und Pr¨apositionalphrasen . . . . . . . . . . . . . . . . . 115
9.4
Koordinierte Adjektive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
9.5
Koordinierte Pr¨apositionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
9.6
Koordination von Verbalphrasen und S¨atzen . . . . . . . . . . . . . . . . . . . . . . 117
Anhang
120
A Literatur
120
B Stuttgart-Tubingen-Tagset ¨ STTS
121
B.1 Urspr¨ungliches STTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 ¨ B.2 Vorgenommene Anderungen am STTS . . . . . . . . . . . . . . . . . . . . . . . . . 123 C Listen von Pr¨apositionalobjekten und Modifikatoren
124
C.1 Pr¨apositionalobjekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 C.2 Modifikatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 D Listen von Funktionsverbgefugen ¨
136
D.1 Alphabetische Liste von Funktionsverben und deren PPs . . . . . . . . . . . . . . . 136 D.2 Nicht als FVG sehen wir folgende Wendungen an: . . . . . . . . . . . . . . . . . . . 148
7
1 Vorwort Das vorliegende TIGER-Annotationsschema wurde mehrfach u¨ berarbeitet und ge¨andert. Es baut auf dem NEGRA-Annotationsschema auf. ¨ Viele Anderungen, die w¨ahrend der Arbeit in den Projekten durchgefu¨ hrt wurden, ergaben sich durch Probleme, die beim Annotieren auftraten. Es wurde versucht, die Regeln den konkret auftretenden Problemen anzupassen, gleichzeitig aber die Konsistenz und Systematik mit den anderen Regeln zu wahren. Hierbei konnte oft keine L¨osung gefunden werden, die allen F¨allen gerecht wird. Das vorliegende Schema stellt daher einen Kompromiß dar. Einige strittige Punkte, zu denen (bis jetzt) keine einheitliche Regelung gefunden wurde, sind im Schema mit Anmerkungen, Fragen u.¨a. festgehalten. Das vorliegende Schema ist also eine vorl¨aufige Arbeitsfassung und erhebt keinen Anspruch auf Vollst¨andigkeit.
8
2 Nominalphrasen Knotenname: NP Kantennamen: AG APP CC CM MNR MO NG NK OC OP PAR PG RC
Attribute, Genitive APPosition Comparative Complement CoMparative conjunction Modifier of Np to the Right MOdifier NeGation Noun Kernel Object Clausal Object Prepositional PARenthesis Phrasaler Genitive Relative Clause
Genitivattribut Apposition Vergleichskomplement Vergleichskonjunktion postnominaler Modifikator Modifikator Negation nicht Element der Kern-NP klausales Objekt Pr¨apositionalobjekt Parenthese anstelle eines Genitivs verwendete ’von’-PP Relativsatz
2.1 Kern-NP NP 500
Eine NP besteht zun¨achst aus einer Reihe von pronominalen, substantivischen und adjektivischen Kernelementen (NP kernel elements, NK). Ihre genauere Unterteilung kann aufgrund der Part-of-Speech bzw. kategorialen Information vorgenommen werden, so daß sich eine Unterscheidung auf der Ebene der Funktionslabels er¨ubrigt.
NK
NK
die
NK
große
0
NK
schwarze 1
ART
ADJA
Katze
ADJA
3
NN
NP 500
NP 500
NK
2
NK
NK
NK
der
blaue
0
ART
jemand
Schönes
1
ADJA
PIS
0
1
NN
NP 500
NK
NK
die
NK
große
0
ART
Blonde 1
ADJA
2
NN
NKs k¨onnen in einigen F¨allen komplex sein, z.B. als APs, komplexe Numeralien (NM) und Eigennamen.
9
2.1.1
Adjektivphrasen NP 502
Im nebenstehenden Beispiel ist auf ihren Sohn ein Dependent von stolz und deshalb tief angebunden.
NK
NK
NK
AP 501
MO
HD
PP 500
AC
die
auf
0
NK
NK
ihren 1
ART
Sohn 2
APPR
PPOSAT
NN
NP 501
Entsprechendes gilt auch f¨ur die folgende NP:
NK
NK
NK
AP 500
die
sehr
0
HD
stolze
Frau
1
ART
ADV
"
Nominalisierungen von Adjektiven und Partizipien werden genauso annotiert: (NB: *der bereits Professor)
MO
2
ADJA
NN
NP 501
NK
NK AP 500
!
MO
das
bereits
ART
NP 501 NK
NK
AP 500 MO
HD
#
die
$
0
ART
gesetzlich ADJD
1
Krankenversicherten
2
NN
10
0
HD
Erreichte 1
ADV
NN
stolze
2
3
3
Frau 4
ADJA
NN
5
In beiden F¨allen bekommt bereits erreichte dieselbe Struktur zugewiesen:
NP 501 ,
NK
NK -
NK
AP 500 ,
MO
%
(
das
2.1.2
*
bereits '
&
HD
0
)
erreichte
1 &
ART
Wahlergebnis 2
&
ADV
+
ADJA
NN
Numeralien NP 501
F¨ur komplexe Numeralien (10 000, eine Million) ist das Label NM (NuMber) vorgesehen. Die einzelnen Komponenten bekommen das Funktionslabel NMC (NuMber Component).
2
NK
NK
0
NM 500 2
0
0
NMC
NMC
10 1
000
Menschen
CARD
NN
.
0
1
2
/
CARD
NP
Phrasen wie die H¨alfte, 10 Prozent werden als NP annotiert.
501 NK
NK
AG
NP 500 NK
zehn
0
Prozent
der
1
NK
2
Arbeitnehmer
3
CARD
11
NN
ART
NN
3
3
NP 502
Beachte: NM-Modifikatoren (z.B. fast 10) werden wie AP-Modifikatoren behandelt, so daß das Adjunkt erst an den AP-Knoten angebunden wird:
=
9
9
NK
NK
>
AP 501 =
MO
HD 9
NM 500 =
NMC
4
fast :
NMC
6
eine
0
1
5
ADV
8
Million 7
ART
;
2
Studenten
NN
NN
NP 501 C
NK
NK
A
AP 500 C
?
@
MO
HD
nahezu B
0
alle
Studenten
PIAT
NN
1
ADV
NP 501
rund, genau, knapp, gut sind in unflektierter Form ADJD.
E
G
G
NK F
NK
AP 500 E
MO
HD
rund
50
Gäste
ADJD
CARD
NN
D
0
1
2
NP
Zur besseren Unterscheidung von PPs wird in Ausdr¨ucken wie unter 1000 Mark der NMModifikator als ADV getaggt.
501 NK
NK
AP 500 MO
über ADV
12
HD
0
200
1
CARD
Leute NN
2
2