TIGER Annotationsschema

TIGER Annotationsschema Stefanie Albert Jan Anderssen Regine Bader Stephanie Becker Tobias Bracht Sabine Brants Thorsten Brants Vera Demberg Stefanie ...
2 downloads 0 Views 1MB Size
TIGER Annotationsschema Stefanie Albert Jan Anderssen Regine Bader Stephanie Becker Tobias Bracht Sabine Brants Thorsten Brants Vera Demberg Stefanie Dipper Peter Eisenberg Silvia Hansen Hagen Hirschmann Juliane Janitzek Carolin Kirstein Robert Langner Lukas Michelbacher Oliver Plaehn Cordula Preis Marcus Pußel Marco Rower Bettina Schrader Anne Schwartz George Smith Hans Uszkoreit

[email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected] [email protected]

Projekt-Info: http://www.ims.uni-stuttgart.de/projekte/TIGER/ Mailing-Liste: [email protected]

24. Juli 2003 DRAFT – Bitte nicht kopieren!

Projekt TIGER Aufbau eines linguistisch interpretierten Korpus des Deutschen

Universit¨at des Saarlandes FR 8.7 Computerlinguistik Universit¨at Stuttgart Institut f¨ur Maschinelle Sprachverarbeitung Universit¨at Potsdam Institut f¨ur Germanistik

2

Inhaltsverzeichnis 1

Vorwort

8

2

Nominalphrasen

9

2.1

9

2.1.1

Adjektivphrasen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

2.1.2

Numeralien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

2.1.3

Datums- und Zeitangaben . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

2.1.4

Syntax der Eigennamen . . . . . . . . . . . . . . . . . . . . . . . . . . . .

14

2.1.5

Fremdsprachliches Material . . . . . . . . . . . . . . . . . . . . . . . . . .

18

2.1.6

Maßangaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

2.2

Genitive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

2.3

Postnominale PPs und Adverbien . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20

2.4

Appositionen und Parenthesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

2.4.1

Appositionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

2.4.2

Parenthesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

Argumente von Substantiven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27

2.5.1

VP und Satzargumente . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27

2.5.2

Pr¨apositionalobjekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

29

2.6

Relativs¨atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

2.7

MOs in NPs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

2.5

3

4

Kern-NP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Pr¨apositionalphrasen

34

3.1

Basisstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

3.2

Die Pr¨aposition zwischen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

3.3

Kurz vor und a¨ hnliche Konstruktionen . . . . . . . . . . . . . . . . . . . . . . . . .

36

3.4

Dar¨uber hinaus - Pr¨apositionaladverbien . . . . . . . . . . . . . . . . . . . . . . . .

37

Adjektivphrasen

38

4.1

Basisstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

4.2

Adjektivisch gebrauchte Verbformen . . . . . . . . . . . . . . . . . . . . . . . . . .

39

4.3

Komplexe Adjektive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

41

4.4

Modifizierte Determiner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

41

4.5

Komparativ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

43

3

5

4.6

Superlativ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

46

4.7

Argumente von Adjektiven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

47

Verbphrasen und Sa¨ tze

48

5.1

Basisstruktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

48

5.2

Grammatische Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50

5.2.1

Komplementierer (CP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50

5.2.2

Subjekt (SB) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

5.2.3

Akkusativobjekt (OA, OA2) . . . . . . . . . . . . . . . . . . . . . . . . . .

51

5.2.4

Dativ (DA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

55

5.2.5

Genitivobjekt (OG) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

56

5.2.6

Pr¨apositionalobjekte (OP) . . . . . . . . . . . . . . . . . . . . . . . . . . .

56

5.2.7

Obligatorische Modifikatoren (OMO) . . . . . . . . . . . . . . . . . . . . .

61

5.2.8

Funktionsverbgef¨uge (CVC) . . . . . . . . . . . . . . . . . . . . . . . . . .

62

5.2.9

Pr¨adikative (PD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

63

5.2.10 Um zu, ohne zu - Pr¨apositionen in VPs . . . . . . . . . . . . . . . . . . . . .

66

5.2.11 Ohne daß, statt daß. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

66

5.2.12 Anrede (VO) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

66

5.2.13 VPs und S¨atze als Argumente von Verben . . . . . . . . . . . . . . . . . . .

67

Passiv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

69

5.3.1

Vorgangspassiv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

69

5.3.2

Zustandspassiv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

70

5.4

Verblose S¨atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

72

5.5

Direkte und Indirekte Rede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

73

5.6

Diskurspartikeln - DM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

75

5.3

6

Platzhalterphrasen

76

6.1

Pronominaladverbien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

6.2

Es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

77

6.3

Verbale Argumente von Gradadverbien . . . . . . . . . . . . . . . . . . . . . . . . .

80

6.4

So, wie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

83

6.5

Weitere Platzhalterkonstruktionen . . . . . . . . . . . . . . . . . . . . . . . . . . .

83

4

7

8

Adjunkte

85

7.1

Klassifikation von Adjunkten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

7.2

Komparativ-als . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

7.3

Nichtkomparativ-als . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

86

7.3.1

MO-als . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

86

7.3.2

MNR-als . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

86

7.4

Wie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88

7.5

Idiosynkratische Einheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

90

7.6

Anbindungsambiguit¨aten in VPs und S¨atzen . . . . . . . . . . . . . . . . . . . . . .

91

7.6.1

Modalverben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

91

7.6.2

Kontrollverben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

92

7.6.3

Wahrnehmungsverben . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

92

7.6.4

Hilfsverben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

92

7.6.5

Kopulakonstruktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

92

Modifikatoren, Fokuspartikeln und Einzelf¨alle

93

8.1

Aber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

93

8.2

Allein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

8.3

Auch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

8.4

Ausgerechnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

95

8.5

Bereits, schon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

95

8.6

D.h. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

95

8.7

Ebenso wie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

96

8.8

Eher (als) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

8.9

Ein paar/bißchen/wenig/. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

97

8.10 erst einmal

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

98

8.11 Etwa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

98

8.12 Immer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

98

8.12.1 Immer besser/schlechter/. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

98

8.12.2 Immer (mal) wieder

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

98

8.12.3 Immer noch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

99

8.13 Innerhalb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

99

8.14 Insbesondere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

99

5

8.15 Je, jeweils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

99

8.15.1 je-desto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 8.16 Leid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 8.17 Manch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 8.18 Mehr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 8.18.1 10 Leute mehr/keine Leute mehr/nicht mehr/. . . . . . . . . . . . . . . . . . . 101 8.19 Nicht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 8.20 Noch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.20.1 Temporal-noch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.20.2 Noch st¨arker, besser, schlechter. . .

. . . . . . . . . . . . . . . . . . . . . . 105

8.21 Nur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.22 Recht . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.23 Schon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.24 Selbst . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8.24.1 Selbst=Selber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 8.24.2 Selbst=Sogar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 8.25 So . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 8.25.1 so sehr - so sehr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 8.26 Sogar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 8.27 Solch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 8.27.1 Solch ein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 8.27.2 Solch + ADJA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 8.27.3 Solch + Flexionsendung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 8.27.4 Solch + wie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 8.28 Statt, außer, neben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 8.29 Umgerechnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 8.30 Vielmehr als . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 8.31 Vor allem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 8.32 Welch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 8.33 Wenn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 8.33.1 wenn-dann, wenn-so . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

6

9

Koordination 9.1

112

Grundstruktur der NP-, AP-, PP-Koordination . . . . . . . . . . . . . . . . . . . . . 112 9.1.1

Koordinierende Konjunktionen . . . . . . . . . . . . . . . . . . . . . . . . . 112

9.1.2

Bin¨are koordinierende Konjunktionen . . . . . . . . . . . . . . . . . . . . . 112

9.2

Koordination von satzeinleitenden Konjunktionen (CPs) . . . . . . . . . . . . . . . 115

9.3

Koordination von Nominal- und Pr¨apositionalphrasen . . . . . . . . . . . . . . . . . 115

9.4

Koordinierte Adjektive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

9.5

Koordinierte Pr¨apositionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

9.6

Koordination von Verbalphrasen und S¨atzen . . . . . . . . . . . . . . . . . . . . . . 117

Anhang

120

A Literatur

120

B Stuttgart-Tubingen-Tagset ¨ STTS

121

B.1 Urspr¨ungliches STTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 ¨ B.2 Vorgenommene Anderungen am STTS . . . . . . . . . . . . . . . . . . . . . . . . . 123 C Listen von Pr¨apositionalobjekten und Modifikatoren

124

C.1 Pr¨apositionalobjekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 C.2 Modifikatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 D Listen von Funktionsverbgefugen ¨

136

D.1 Alphabetische Liste von Funktionsverben und deren PPs . . . . . . . . . . . . . . . 136 D.2 Nicht als FVG sehen wir folgende Wendungen an: . . . . . . . . . . . . . . . . . . . 148

7

1 Vorwort Das vorliegende TIGER-Annotationsschema wurde mehrfach u¨ berarbeitet und ge¨andert. Es baut auf dem NEGRA-Annotationsschema auf. ¨ Viele Anderungen, die w¨ahrend der Arbeit in den Projekten durchgefu¨ hrt wurden, ergaben sich durch Probleme, die beim Annotieren auftraten. Es wurde versucht, die Regeln den konkret auftretenden Problemen anzupassen, gleichzeitig aber die Konsistenz und Systematik mit den anderen Regeln zu wahren. Hierbei konnte oft keine L¨osung gefunden werden, die allen F¨allen gerecht wird. Das vorliegende Schema stellt daher einen Kompromiß dar. Einige strittige Punkte, zu denen (bis jetzt) keine einheitliche Regelung gefunden wurde, sind im Schema mit Anmerkungen, Fragen u.¨a. festgehalten. Das vorliegende Schema ist also eine vorl¨aufige Arbeitsfassung und erhebt keinen Anspruch auf Vollst¨andigkeit.

8

2 Nominalphrasen Knotenname: NP Kantennamen: AG APP CC CM MNR MO NG NK OC OP PAR PG RC

Attribute, Genitive APPosition Comparative Complement CoMparative conjunction Modifier of Np to the Right MOdifier NeGation Noun Kernel Object Clausal Object Prepositional PARenthesis Phrasaler Genitive Relative Clause

Genitivattribut Apposition Vergleichskomplement Vergleichskonjunktion postnominaler Modifikator Modifikator Negation nicht Element der Kern-NP klausales Objekt Pr¨apositionalobjekt Parenthese anstelle eines Genitivs verwendete ’von’-PP Relativsatz

2.1 Kern-NP NP 500

Eine NP besteht zun¨achst aus einer Reihe von pronominalen, substantivischen und adjektivischen Kernelementen (NP kernel elements, NK). Ihre genauere Unterteilung kann aufgrund der Part-of-Speech bzw. kategorialen Information vorgenommen werden, so daß sich eine Unterscheidung auf der Ebene der Funktionslabels er¨ubrigt.



NK

NK

die

NK

große 

0

NK

schwarze 1

ART

ADJA

Katze

ADJA

3

NN

 

NP 500

NP 500



NK



2





NK



NK

NK



der

blaue 

0

ART

jemand

Schönes

1

ADJA

PIS

0

1

NN

NP 500

NK

NK

die

NK

große

0

ART

Blonde 1

ADJA



2

NN

NKs k¨onnen in einigen F¨allen komplex sein, z.B. als APs, komplexe Numeralien (NM) und Eigennamen.

9

2.1.1

Adjektivphrasen NP 502

Im nebenstehenden Beispiel ist auf ihren Sohn ein Dependent von stolz und deshalb tief angebunden.



NK

NK

NK



AP 501 





MO

HD



PP 500 





AC

die

auf 

0



NK

NK

ihren 1

ART

Sohn 2

APPR

PPOSAT

NN

NP 501 

Entsprechendes gilt auch f¨ur die folgende NP:







NK



NK

NK

AP 500 



die

sehr 

0

HD

stolze

Frau 

1

ART

ADV

"

Nominalisierungen von Adjektiven und Partizipien werden genauso annotiert: (NB: *der bereits Professor)



MO



2

ADJA

NN

NP 501 

NK

NK AP 500 

!

MO

das

bereits 

ART

NP 501 NK

NK

AP 500 MO

HD

#

die

$

0

ART

gesetzlich ADJD

1

Krankenversicherten

2

NN

10

0

HD

Erreichte 1

ADV



NN

stolze 

2

3

3

Frau 4

ADJA



NN

5

In beiden F¨allen bekommt bereits erreichte dieselbe Struktur zugewiesen:

NP 501 ,

NK

NK -

NK

AP 500 ,

MO

%

(

das

2.1.2

*

bereits '

&

HD

0

)

erreichte

1 &

ART

Wahlergebnis 2

&

ADV

+

ADJA

NN

Numeralien NP 501

F¨ur komplexe Numeralien (10 000, eine Million) ist das Label NM (NuMber) vorgesehen. Die einzelnen Komponenten bekommen das Funktionslabel NMC (NuMber Component).

2

NK

NK

0

NM 500 2

0

0

NMC

NMC

10 1

000

Menschen

CARD

NN

.

0

1

2

/

CARD

NP

Phrasen wie die H¨alfte, 10 Prozent werden als NP annotiert.

501 NK

NK

AG

NP 500 NK

zehn

0

Prozent

der

1

NK

2

Arbeitnehmer

3

CARD

11

NN

ART

NN

3

3

NP 502

Beachte: NM-Modifikatoren (z.B. fast 10) werden wie AP-Modifikatoren behandelt, so daß das Adjunkt erst an den AP-Knoten angebunden wird:

=

9

9

NK

NK

>

AP 501 =

MO

HD 9

NM 500 =

NMC

4

fast :

NMC

6

eine

0

1

5

ADV

8

Million 7

ART

;

2

Studenten

NN

NN

NP 501 C

NK

NK

A

AP 500 C

?

@

MO

HD

nahezu B

0

alle

Studenten

PIAT

NN

1

ADV

NP 501

rund, genau, knapp, gut sind in unflektierter Form ADJD.

E

G

G

NK F

NK

AP 500 E

MO

HD

rund

50

Gäste

ADJD

CARD

NN

D

0

1

2

NP

Zur besseren Unterscheidung von PPs wird in Ausdr¨ucken wie unter 1000 Mark der NMModifikator als ADV getaggt.

501 NK

NK

AP 500 MO

über ADV

12

HD

0

200

1

CARD

Leute NN

2

2