Messung der relativen Konzentration
¾
Lorenzkurve
¾
Gini-Koeffizient
¾
Standardisierter Gini-Koeffizient
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
1
Bibliografie: ¾ Prof. Dr. Kück; Universität Rostock 2005; Statistik, Vorlesungsskript ¾ Bleymüller / Gehlert / Gülicher; Verlag Vahlen; Statistik für Wirtschaftswissenschaftler ¾ Hartung; Oldenburg Verlag; Statistik ¾ http://www.wiwi.uni-rostock.de/~stat/download.htm
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
2
Konzentration Sie bedeutet soviel wie Verdichtung, Schwerpunktbildung, Ballung oder Ungleichverteilung der Merkmalssumme auf die Merkmalsträger.
Der Nachweis einer Konzentration ist nur sinnvoll bei der Untersuchung nichtnegativer extensiver Merkmale. Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
3
Extensive Merkmale - Beispiele Extensive Merkmale werden dadurch charakterisiert, dass eine Summenbildung der Merkmalsausprägungen ein interpretierbares, real vorstellbares Aggregat bildet. Beispiele: ¾
Landwirtschaftliche Fläche
¾
Einkommen
¾
Umsatz
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
4
Konzentration - Klassifikation ¾Absolute Konzentration: Die Merkmalssumme ist auf eine kleine bzw. kleiner werdende Zahl von Merkmalsträgern verteilt. ¾Relative Konzentration: Zuordnung eines großen bzw. eines größer werdenden Anteils einer Merkmalssumme zu einem kleinen bzw. kleiner werdenden Anteil der Merkmalsträger.
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
5
Konzentration - Beispiele Beispiel: Absolute Konzentration: Die drei größten deutschen Häfen hatten 1999 einen Jahresumschlag von 91 Mio. Tonnen, das sind etwa zwei Drittel des Umschlages aller deutschen Häfen. Beispiel: Relative Konzentration: In der BRD sind im Jahr 1999 80 % der gesamten Einkommenssteuer von 20 % der Steuerpflichtigen erbracht worden.
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
6
Konzentrationsmessung Absolute Konzentration Konzentrationsrate m
C m = ∑ p [i]
Herfindaal-Index Anteile an Merkmalssumme
i =1
p [i] =
a [i]
N
H = ∑ p i2 i =1
N
∑
i =1
a [i]
Relative Konzentration Lorenzkurve (grafisch) Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Gini-Koeffizient Relative Konzentration
Standardisierter Gini-Koeffizient 7
Lorenzkurve (Einzelwerte) Sei a[1] ≤ a[2] ≤ ... ≤ a[N] eine aufsteigend geordnete Reihe von Merkmalswerten. Der Streckenzug, der die Punkte (0, 0) und (ui, vi) für i=1, 2, . . ., N verbindet, heißt die Lorenzkurve der Konzentration.
i ui = N
vi
1
i
0,9 0,8 0,7
vi =
0,6 0,5
Kumulierte Anteile der Merkmalsträger
0,4 0,3
∑a
[j]
∑a
[j]
j =1 N j =1
0,2 0,1 0
x-Achse
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
ui
Kumulierte Anteile an der Merkmalssumme y-Achse
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
8
Lorenzkurve (Einzelwerte) -Beispiel Messung der relativen Konzentration des Automobilmarktes unter den 10 größten Automobilkonzernen, Stand 2001. Umsatz in Mrd. Dollar Mitsubishi PSA Peugeot Citro Honda Fiat-Gruppe Volkswagen-Grupp Renault/Nissan Toyota/Daihatsu DaimlerChrysler Ford-Gruppe General Motors Gesamt
kumulierte kumulierte Anteile der Anteile am Merkmalsträger Anteil am Gesamtumsatz Gesamtumsatz vi ui
31 ,40 40,80 52,20 53,20 7 9,00 86,20 1 21 ,30 1 52,40 1 7 0,1 0 1 84,60 97 1 ,20
0,10 0,20 0,30 0,40 0,50 0,60 0,7 0 0,80 0,90 1,00 5,50
0,032 0,042 0,054 0,055 0,081 0,089 0,1 25 0,1 57 0,1 7 5 0,1 90 1 ,000
0,032 0,07 4 0,1 28 0,1 83 0,264 0,353 0,47 8 0,635 0,81 0 1 ,000
vi
1 0,9 0,8
64,7 %
0,7 0,6 0,5 0,4 0,3
40 %
0,2 0,1 0 0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
Relative Konzentration
0,9
ui
Interpretation für den Punkt P(0,60; 0,353): 40 (100-60) Prozent unter den 10 größten Automobilkonzernen kontrollieren 64,7 (100-35,3) Prozent des Automobilmarktes. Es liegt eine mittlere relative Konzentration vor. Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
0,8
9
1
Verteilungen des Gesamtumsatzes eines Industriezweiges - Beispiel Unternehmen
Denkbare Verteilungen des Gesamtumsatzes A 1000 0 0 0 0
F G H U1 180 100 199 U2 180 100 199 U3 150 100 199 U4 150 100 199 U5 100 100 199 U6 100 100 1 U7 40 100 1 U8 40 100 1 U9 30 100 1 U10 30 100 1 Merkmals- 1000 1000 1000 1000 2000 1000 1000 1000 summe Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
B 360 300 200 80 60
C 200 200 200 200 200
D E 500 1000 140 280 130 260 120 240 110 220
Relative Konzentration
10
Lorenzkurve für die Verteilung A Unternehmen i 1 2 3 4 5
U5 U4 U3 U2 U1 Merkmalssumme
Verteilung A a*[i] 0 0 0 0 1000 1000
ui 0,2 0,4 0,6 0,8 1,0
Kummulierte vi Summe 0 0 0 0 0 0 0 0 1000 1
* aufsteigend geordnete Reihe der Merkmalswerte
Bei maximaler Konzentration bilden die Lorenzkurve und die Diagonale ein Dreieck mit der maximalen Fläche F0. Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
i ui = N
i
vi =
∑a
[j]
∑a
[j]
j =1 N j =1
11
Lorenzkurve für die Verteilung C Unternehmen i 1 2 3 4 5
U5 U4 U3 U2 U1 Merkmalssumme
Verteilung C ai 200 200 200 200 200 1000
vi
ui 0,20 0,40 0,60 0,80 1,00
Kummulierte Summe 200 400 600 800 1000
1,0
0,8
vi 0,20 0,40 0,60 0,80 1,00
0,6
0,4
0,2
0,0 0,0
0,4
0,6
0,8
1,0
ui
Bei Gleichverteilung des Umsatzes, minimaler Konzentration, stimmen die Lorenzkurve und die Diagonale des Quadrates überein. Die Diagonale bringt zum Ausdruck, dass gleiche Anteile von Merkmalsträgern gleichen Anteilen der Merkmalsteilsummen entsprechen. Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
0,2
Relative Konzentration
i ui = N
i
vi =
∑a
[j]
∑a
[j]
j=1 N
j=1
12
Lorenzkurve für die Verteilung B Unternehmen i 1 2 3 4 5
U5 U4 U3 U2 U1 Merkmalssumme
Verteilung B ai 60 80 200 300 360 1000
ui 0,20 0,40 0,60 0,80 1,00
Kummulierte Summe 60 140 340 640 1000
vi 0,06 0,14 0,34 0,64 1,00
Interpretation für den Punkt (0,80; 0,64): 20 % (1-0,80) der größten Unternehmen erbringen 36 % (1-0,64) des Gesamtumsatzes. Es liegt eine schwache relative Konzentration vor. Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
i ui = N
i
vi =
∑a
[j]
∑a
[j]
j =1 N
j =1
13
Vergleich der Lorenzkurven vi
1,0
0,8
0,6
0,4
0,2
0,0 0,0
0,2
0,4
0,6
0,8
1,0
ui
Verteilung A maximale Konzentration
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Verteilung B
Fomin ≤ Fo ≤ Fomax
Relative Konzentration
Verteilung C minimale Konzentration
14
Lorenzkurve - Interpretation ¾ Je stärker die Konzentration ist, desto stärker hängt die Lorenzkurve nach rechts unten und desto größer ist die Fläche zwischen Hauptdiagonale und Lorenzkurve. ¾ Die Diagonale bringt zum Ausdruck, dass gleiche Anteile von Merkmalsträgern gleichen Anteilen der Merkmalsteilsummen entsprechen, d. h. minimale relative Konzentration vorhanden ist.
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
15
Gini-Koeffizient - Definition Der Gini-Koeffizient gibt das Verhältnis der Fläche zwischen der Diagonale und der Lorenzkurve zur Fläche des Dreiecks unter der Diagonale an.
F0: Fläche zwischen Lorenzkurve und Diagonale F =
1 1 ⋅1 ⋅1 = 2 2
G=
Fläche des Dreiecks unter der Diagonale
Fo = 2 ⋅ Fo 1 2
h F
F =
1 ⋅ b⋅ h 2
b Fläche eines rechtwinkligen Dreiecks Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
16
Gini-Koeffizient für die Verteilung A Unternehmen i 1 2 3 4 5
Verteilung A a*[i]
U5 U4 U3 U2 U1 Merkmalssumme Fo =
0 0 0 0 1000 1000
1 1 ⋅ 1 ⋅ 1 − ⋅ 0,2 ⋅ 1 2 2
= 0,5 − 0,1 = 0,4
Kummulierte vi Summe 0 0 0 0 0 0 0 0 1000 1
ui 0,2 0,4 0,6 0,8 1,0
G=
Fo 0,4 = = 0,8 1 0,5 2
F
F =
1 ⋅ b⋅ h 2
b
F0: Fläche des Dreiecks zwischen Lorenzkurve und Diagonale. Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
h
Fläche eines rechtwinkligen Dreiecks Relative Konzentration
17
Gini-Koeffizient bei maximaler Konzentration Bei maximaler Konzentration bilden die Lorenzkurve und die Diagonale ein Dreieck mit der maximalen Fläche F0. Daher erreicht der Gini-Koeffizient den maximalen Wert. Dieser Wert ist allerdings kleiner als Eins. N− 1 F N− 1 G = 0 = 2N = 1 1 N 2 2 Fläche des Dreiecks rechts von der Lorenzkurve h
Fo =
F
1 1 1 N −1 − ⋅ = 2 2 N 2N
1 ⋅ b⋅ h 2
b
Fläche des Dreiecks unter der Diagonale Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
F =
Relative Konzentration
Fläche eines rechtwinkligen Dreiecks 18
Gini-Koeffizient - allgemeine Formel Definitionsformel
Fo G = = 2 ⋅ Fo 1 2 Um die Fläche F0 zwischen Diagonale und Lorenzkurve zu berechnen, muss man zuerst die Fläche unter der Lorenzkurve ermitteln. Diese Fläche ist die Summe der Flächen aus N-1 Trapezen und einem Dreieck, das als Sonderfall eines Trapezes mit einem Schenkel gleich Null gesehen werden kann. Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
19
Fläche eines Trapezes b
h
a
1 F = ⋅ (a + b) ⋅ h 2
F
a
b
Fi = vi-1
Fi
vi
1 1 ⋅ (v i + v i −1 ) ⋅ 2 N
(ui-ui-1)=1/N Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
20
Herleitung der allgemeinen Formel für die Fläche Fu unter der Lorenzkurve (1) 1 1 Fi = ⋅ (vi + v i −1 ) ⋅ 2 N
1 v i −1 + v i Fu = ∑ Fi = ⋅ ∑ N i =1 2 i =1 N
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
N
21
Herleitung der allgemeinen Formel für die Fläche Fu unter der Lorenzkurve (2) v N −1 + v N 1 N vi −1 + vi 1 v 0 + v1 v1 + v 2 Fu = ⋅ ∑ ) = ⋅( + +K+ N i =1 2 N 2 2 2 vN 1 v0 = ⋅ ( + v1 + K + v N −1 + ) 2 N 2 vN vN vN 1 = ⋅ (0 + v1 + K + v N −1 + + − ) N 2 2 2 vN ⎞ 1 ⎛ N vN 1⎛ N 1⎞ V 1 = ⋅ (v1 + K + v N −1 + v N − ) = ⎜ ∑ vi − ⎟ = ⎜ ∑ vi − ⎟ = N 2 N ⎝ i =1 2 ⎠ N ⎝ i =1 2⎠ N N
mit Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
V = ∑ vi − i =1
22
1 2
Herleitung der allgemeinen Formel für den Gini-Koeffizienten V Fu = N
N
mit
1 V = ∑ vi − 2 i =1
1 V N− 2 V 1 Fo = − Fu = − = 2 N 2N 2
G = Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Fo 2 N− 2 V N− 2 V = 2⋅ = = 1− ⋅V 1 N 2N N 2
Relative Konzentration
23
Gini-Koeffizient - Verteilung B ui
vi
0,0 0,2 0,4 0,6 0,8 1,0 Summe
0,00 0,06 0,14 0,34 0,64 1,00 2,18
2 G = 1− ⋅ V N N
1 V = ∑ vi − 2 i =1
1 V = 2,18 − = 1,68 2
2 G = 1 − ⋅1,68 = 1 − 0,4 ⋅1,68 = 1 − 0,672 = 0,328 5 Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
24
Gini-Koeffizient - Wertebereich vi
1,0
Fo G = = 2 ⋅ Fo 1 2
0,8
0,6
0,4
0,2
0,0 0,0
0,2
0,4
0,6
0,8
1,0
ui
minimale Konzentration
Fo min = 0
G min = 0 Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
N− 1 0≤G≤ N
maximale Konzentration
F0(max)
1 1 1 N− 1 = − ⋅ = 2 2 N 2N
Nachteil
G max = Relative Konzentration
N−1 N 25
Standardisierter Gini-Koeffizient vi
1,0
Gs =
0,8
0,6
F0 F0(max)
0,4
Gs =
0,2
0,0 0,0
0,2
0,4
0,6
0,8
1,0
ui
F0 F N = 0⋅ N− 1 1 N− 1 2N 2
bei minimaler Konzentration
N G s = G⋅ N− 1
Gs = 0
Wertebereich
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
0 ≤ G
s
≤ 1
Relative Konzentration
bei maximaler Konzentration
Gs = 1 26
Gini-Koeffizient - Beispiele vi
1,0
0,8
0,6
0,4
0,2
0,0 0,0
A Verteilung A B C
B Fo
G
Gs
0,400 0,800 1,000 0,164 0,328 0,410 0,000 0,000 0,000
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
0,2
0,4
0,6
0,8
1,0
ui
C
Fo G= 1 2
Relative Konzentration
N G s = G⋅ N− 1 Für N=5 27
Gini-Koeffizient für Einzelwerte - andere Berechnungsformel Neue Formel N
Bekannte Formel
Fo 2 G = = 1− ⋅ V 1 N 2
2 G= ⋅ N
∑ i⋅ a i =1 N
∑a i =1
i
N+1 − N
i
2 N N+1 = ⋅ ∑ i⋅ p i − N i =1 N Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
28
Gini-Koeffzient - Herleitung der Formel (1) G
2 ⎛ N 1 ⎞ = 1 − ⎜ ∑ v i − ⎟ 2 ⎠ N ⎝ i=1 N N N + 1 2 2 v v i = − − ∑ ∑ N N i=1 N i=1
2 = 1 − ⋅ V N
= 1 +
1 N
i
i
=
N + 1 2 − N N
N
∑
i=1
∑
a
[j]
∑
a
[j]
j= 1 N j= 1
=
N + 1 − N
N ⋅
∑
i
∑ ∑
N
j= 1
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
N
2 a
i=1
j= 1
a
[j]
[j]
Relative Konzentration
29
Gini-Koeffzient - Herleitung der Formel (2) N+ 1 = − N
2 N
N⋅ ∑ a [j]
⋅ (a [1] + (a [1] + a [2] ) + K + (a [1] + a [2] + K + a [N] ))
j=1
N+ 1 = − N
2 N
N⋅ ∑ a [j]
N
⋅ ∑ (N − i + 1) ⋅ a [i] i =1
j=1
N+ 1 = − N
N N ⎞ ⎛ ( ) N 1 a i a + ⋅ − ⋅ ⎜ ∑ [i] ∑ [i] ⎟ N i =1 i =1 ⎠ N⋅ ∑ a [j] ⎝
2
j=1
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
30
Gini-Koeffzient - Herleitung der Formel (3) N + 1 2 ⋅ (N + 1) = − + N N
2 N
N⋅ ∑ a [j]
N
⋅ ∑ i⋅ a [i] i =1
j=1
N
2 = ⋅ N
∑ i⋅ a i =1 N
∑a j=1
[i]
[j]
a [i] N+ 1 2 N N+ 1 − = ⋅ ∑ i⋅ N − N N i =1 N a ∑ [j] j=1
2 N N+ 1 = ⋅ ∑ i⋅ p[i] − N i =1 N
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
q. e. d
31
Gini-Koeffizient - Verteilung A Unternehmen
N
Verteilung A ai
i . ai
0 0 0 0 1000 1000 Gini-Koeffizient Standardisierter Gini-Koeffizient
0 0 0 0 5000 5000 0,800 1,000
i 1 2 3 4 5
G s = G⋅
U5 U4 U3 U2 U1 Summe
2 G= ⋅ N
∑ i⋅ a i =1 N
∑a i =1
i
N+1 − N
i
2 5000 6 G= ⋅ − = 0,8 5 1000 5
N 5 = 0,8 ⋅ = 1 N−1 4
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
32
Gini-Koeffizient - Verteilung B Unternehmen i 1 2 3 4 5
Verteilung B ai
U5 U4 U3 U2 U1 Summe
60 80 200 300 360 1000 Gini-Koeffizient Standardisierter Gini-Koeffizient
N
i . ai 60 160 600 1200 1800 3820 0,328 0,410
2 ∑ G= ⋅ i =N1 N
i⋅ a i
∑a i =1
N+1 − N
i
2 3820 6 G= ⋅ − = 0,328 5 1000 5
N 5 G s = G⋅ = 0,328 ⋅ = 0,410 N− 1 4 Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
33
Gini-Koeffizient - Verteilung C Unternehmen i 1 2 3 4 5
Verteilung C ai
200 200 200 200 200 1000 Gini-Koeffizient Standardisierter Gini-Koeffizient
G s = G⋅
U5 U4 U3 U2 U1 Summe
N
i . ai 200 400 600 800 1000 3000 0,000 0,000
2 ∑ G= ⋅ i =N1 N
i⋅ a i
∑a i =1
−
N+1 N
i
2 3000 6 G= ⋅ − =0 5 1000 5
N 5 = 0⋅ = 0 N−1 4
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
34
Gini-Koeffizient - Verteilung D Unternehmen i 1 2 3 4 5
Verteilung D ai
U5 U4 U3 U2 U1 Summe
110 120 130 140 500 1000 Gini-Koeffizient Standardisierter Gini-Koeffizient
N
i . ai 110 240 390 560 2500 3800 0,320 0,400
2 ∑ ⋅ i =N1 G= N
i⋅ a i
∑a i =1
G=
N+1 − N
i
2 3800 6 ⋅ − = 0,32 5 1000 5
N 5 G s = G⋅ = 0,32 ⋅ = 0,4 4 N−1 Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
35
Gini-Koeffizient - Verteilung E Unternehmen i 1 2 3 4 5
N
Verteilung E ai
U5 U4 U3 U2 U1 Summe
220 240 260 280 1000 2000 Gini-Koeffizient Standardisierter Gini-Koeffizient
i . ai 220 480 780 1120 5000 7600 0,320 0,400
2 ⋅ G= N
∑ i⋅ a i =1 N
∑a i =1
G=
i
−
N+1 N
i
2 7600 6 ⋅ − = 0,32 5 2000 5
N 5 G s = G⋅ = 0,32 ⋅ = 0,4 N−1 4 Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
36
Gini-Koeffizient - Verteilung F Unternehmen Verteilung F ai
i . ai
U10 30 U9 30 U8 40 U7 40 U6 100 U5 100 U4 150 U3 150 U2 180 U1 180 Summe 1000 Gini-Koeffizient Standardisierter Gini-Koeffizient
30 60 120 160 500 600 1050 1200 1620 1800 7140 0,328 0,364
i 1 2 3 4 5 6 7 8 9 10
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
N
Relative Konzentration
2 ∑ G= ⋅ i =N1 N
i⋅ a i
∑a i =1
−
N+1 N
i
2 7140 11 G= ⋅ − = 0,328 10 1000 10 N G s = G⋅ N−1 10 = 0,328 ⋅ = 0,364 9 37
Gini-Koeffizient - Verteilung G i
Unternehmen Verteilung G ai
N
i . ai
1 2 3 4 5 6 7 8 9 10
U10 100 100 U9 100 200 U8 100 300 U7 100 400 U6 100 500 U5 100 600 U4 100 700 U3 100 800 U2 100 900 U1 100 1000 Summe 1000,00 5500,00 0,000 Gini-Koeffizient 0,000 Standardisierter Gini-Koeffizient Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
2 ⋅ G= N
∑ i⋅ a i =1 N
∑a i =1
i
−
N+1 N
i
2 5500 11 G= ⋅ − =0 10 1000 10
G s = G⋅ = 0⋅
N N− 1
10 =0 9 38
Gini-Koeffizient - Verteilung H Unternehmen
N
Verteilung H ai
i . ai
1 1 1 1 1 199 199 199 199 199 1000,00 Gini-Koeffizient Standardisierter Gini-Koeffizient
1 2 3 4 5 1194 1393 1592 1791 1990 7975,00 0,495 0,550
i 1 2 3 4 5 6 7 8 9 10
U10 U9 U8 U7 U6 U5 U4 U3 U2 U1 Summe
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
2 G= ⋅ N
∑ i⋅ a i =1 N
∑a i =1
G=
i
−
N+1 N
i
2 7975 11 ⋅ − = 0,495 10 1000 10
N N− 1 10 = 0,495 ⋅ = 0,55 9
G s = G⋅
39
Gini-Koeffizient -Vergleich Verteilungen des Umsatzes UnterA B C D E F G H nehmen U1 1000 360 200 500 1000 180 100 199 U2 0 300 200 140 280 180 100 199 N−1 U3 0 200 200 130 260 150 100 199 0≤G≤ U4 0 80 200 120 240 150 100 199 N U5 0 60 200 110 220 100 100 199 4 U6 100 100 1 0 ≤ G ≤ = 0,8 U7 40 100 1 5 U8 40 100 1 U9 30 100 1 U10 30 100 1 0 ≤ G ≤1 s Summe 1000 1000 1000 1000 2000 1000 1000 1000 9 G 0,800 0,328 0,000 0,320 0,320 0,328 0,000 0,495 0≤G≤ = 0,9 1,000 0,410 0,000 0,400 0,400 0,364 0,000 0,550 Gs 10 Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
40
Lorenzkurve - klassierte oder gehäufte Werte Die Lorenzkurve für klassierte oder gehäufte Merkmalswerte bzw. Merkmalsanteile ist durch folgende Formel definiert: i
i
ui =
∑h j=1
N
j
i
= ∑f j = Fi
vi =
j=1
∑h
j
∑h
j
j =1 k j =1
Kumulierte relative Häufigkeiten x-Achse Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
i
⋅xj = ⋅xj
∑ f ⋅x
j
∑ f ⋅x
j
j =1 k j =1
j
j
Kumulierte Merkmalsanteile y-Achse Relative Konzentration
41
Messung der relativen Konzentration (klassierte Werte) -Beispiel Beispiel: Es soll die relative Konzentration für die Bauhauptbetriebe in MV nach ihrem Umsatz analysiert werden (Stand 1999): Anzahl der Beschäftigten 1 bis 9 10 bis 19 20 bis 49 50 bis 99 100 bis 199 200 und mehr Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Anzahl der Betriebe 383 438 362 135 69 29
Umsatz 1000 DM 23559 65564 148123 121159 109989 128300
Relative Konzentration
42
Lorenzkurve (klassierte Werte) -Beispiel Anzahl der Beschäftigten
Umsatz (xi .hi ) ui =Fi
Betriebe (hi )
1 bis 9 10 bis 19 20 bis 49 50 bis 99 100 bis 199 200 und mehr Summe
383 438 362 135 69 29 1416
23559 65564 148123 121159 109989 128300 596694
0,27 0,58 0,84 0,93 0,98 1,00
i
vi 0,04 0,15 0,40 0,60 0,78 1,00
ui =
∑h j=1
N
j
= Fi
i
vi =
∑h
j
⋅x
j
∑h
j
⋅x
j
j=1 k j=1
xi: durchschnittlicher Umsatz eines Betriebes; xi = Umsatz / hi Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
43
Lorenzkurve (klassierte Werte) -Beispiel ui =Fi
vi
0 0,27 0,58 0,84 0,93 0,98 1,00
0 0,04 0,15 0,40 0,60 0,78 1,00
Interpretation: 93 % der Betriebe erwirtschaften nur 60 % des Gesamtumsatzes, d. h. 7 % der größten Betriebe erwirtschaften 40 % des Gesamtumsatzes. Es liegt eine hohe relative Konzentration vor. Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
44
Gini-Koeffizient -klassierte Werte 1 k G = 1 − ⋅ ∑ h i ⋅ (v i −1 + v i ) N i =1
Wertebereich 0≤G≤
k
G = 1 − ∑ f i ⋅ (v i −1 + v i )
N− h k N
i =1
vi : siehe Lorenzkurve Standardisierter Gini-Koeffizient G s = G⋅
Wertebereich 0 ≤ Gs ≤ 1
N N− h k
hk: Häufigkeit der letzten Klasse Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
45
Gini-Koeffizient (klassierte Werte) -Beispiel 1 k G = 1 − ⋅ ∑ h i ⋅ (v i −1 + v i ) N i =1
0≤G≤
1 G = 1− ⋅ 577,9729 = 0,5918 1416 Anzahl der Beschäftigten 1 bis 9 10 bis 19 20 bis 49 50 bis 99 100 bis 199 200 und mehr Summe
Betriebe (hi ) 383 438 362 135 69 29 1416
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
N− h k N
0 ≤ G ≤ 0,9795
vi v i-1 +v i hi *(v i-1 +v i ) 0,039 0,039 15,1218 0,149 0,189 82,7136 0,398 0,547 198,0003 0,601 0,998 134,7640 0,785 1,386 95,6087 1,000 1,785 51,7645 577,9729 0,5918 Gini-Koeffizient Relative Konzentration
G s = G⋅
N N− h k
G s = 0,5918 ⋅
1416 1387
= 0,6042
0 ≤ Gs ≤ 1 46
1. Aufgabe -Klausur Februar 2005 Über Investitionen, Betriebe und Beschäftigte im verarbeitenden Gewerbe liegen Ihnen für kreisfreie Städte folgende Angaben eines Jahres vor: Kreisfreie Stadt
Bruttoanlageinvestitionen Betriebe Beschäftigte in Mill. Euro Anzahl Anzahl
Greifswald
14
25
1.700
Neubrandenburg
22
30
2.500
Rostock
34
80
6.500
Schwerin
16
40
3.800
Stralsund
12
15
1.900
102
30
3.600
Wismar
3. Geben Sie für Bruttoanlageinvestitionen die Wertepaare der Lorenz-Kurve an. 4. Berechnen Sie zusätzlich zu 1.3 den Wert des Gini-Koeffizienten (einfach und standardisiert). Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
47
Lösung 1.3 -Klausur 02. 2005 Berechnung der Koordinaten für Lorenz-Kurve. Zuerst werden die Merkmalsausprägungen aussteigend sortiert. BruttoanlageKreisfreie Stadt investitionen in Mill. Euro
ui
vi
Stralsund
12
0,17 0,06
Greifswald
14
0,33 0,13
Schwerin
16
0,50 0,21
Neubrandenburg
22
0,67 0,32
Rostock
34
Wismar
102
Summe
200
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
i ui = N
i
vi =
∑a
[j]
∑a
[j]
j=1 N j=1
Zum Beispiel:
3 u 3 = = 0,50 6 0,83 0,49 1,00 1,00
Relative Konzentration
v3 =
12 + 14 + 16 = 0,21 200 48
Lösung 1.4 -Klausur 02. 2005 Kreisfreie Stadt
Berechnung des Gini-Koeffizienten.
vi
Stralsund
0,06
Greifswald
0,13
Schwerin
0,21
Neubrandenburg
0,32
Rostock
0,49
Wismar
1,00
Summe
2,21
2 ⋅V N 2 G = 1 − ⋅ 1,71 = 0,43 6 G = 1−
N
1 V = ∑ vi − 2 i =1 V = 2,21− 0,5 = 1,71
Berechnung des standardisierten Gini-Koeffizienten.
6 N = 0,43 ⋅ = 0,516 G s = G⋅ 5 N− 1 Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
49
Relative Konzentration -Beispiel Beispiel: Untersuchen Sie vergleichend die Disparität der Verteilung des HHNE in der Bundesrepublik Deutschland. Nutzen Sie 450 Euro als untere Grenze der ersten Klasse. HHNE von…bis unter … Euro
Früheres Neue Länder Bundesgebiet und Berlin-Ost
Unter 900
7,2
12,8
900 – 1300
11,7
16,7
1300 – 1500
6,6
7,6
1500 – 2000
14,7
17,3
2000 – 2600
14,7
16,0
2600 – 3600
18,1
15,3
3600 – 5000
14,6
8,8
5000 – 18000
12,2
5,4
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
Haushaltnettoeinko mmen (HHNE) in den Neuen Ländern und Berlin-Ost. Erwerbsstatistik 2003 (DESTATIS)
50
Relative Konzentration des HHNE -ABL Früheres HHNE Bundesgebiet von…bis unter … Euro fi (in %) 7,2 Unter 900 11,7 900 – 1300 6,6 1300 – 1500 14,7 1500 – 2000 14,7 2000 – 2600 18,1 2600 – 3600 14,6 3600 – 5000 12,2 5000 – 18000 Summe
ui= Fi 0,07 0,19 0,26 0,40 0,55 0,73 0,88 1,00
Klassemitte xi
xi·fi/100 675 48,60 1100 128,70 1400 92,40 1750 257,25 2300 338,10 3100 561,10 4300 627,80 11500 1403,00 3.456,95
Kummulierte Summe xi·fi/100 48,60 177,30 269,70 526,95 865,05 1426,15 2053,95 3456,95
vi fi·(vi-1+vi)/100 0,01 0,0010 0,05 0,0076 0,08 0,0085 0,15 0,0339 0,25 0,0592 0,41 0,1200 0,59 0,1470 1,00 0,1945 0,5717
Lorenz-Kurv e
1 vi
k
G = 1 − ∑ f i ⋅ (v i −1 + v i )
0,75
i =1
0,5
= 1 − 0,5717 = 0,4283
0,25 0 0
0,25
0,5
0,75 ui 1
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
51
Relative Konzentration des HHNE -NBL Neue Länder fi (in %) 12,8 16,7 7,6 17,3 16,0 15,3 8,8 5,4
HHNE von…bis unter … Euro Unter 900 900 – 1300 1300 – 1500 1500 – 2000 2000 – 2600 2600 – 3600 3600 – 5000 5000 – 18000 Summe
ui= Fi 0,13 0,30 0,37 0,54 0,70 0,86 0,95 1,00
Klassemitte xi
xi·fi/100 675 86,40 1100 183,70 1400 106,40 1750 302,75 2300 368,00 3100 474,30 4300 378,40 11500 621,00 2.520,95
Kummulierte Summe xi·fi/100 86,40 270,10 376,50 679,25 1047,25 1521,55 1899,95 2520,95
vi fi·(vi-1+vi)/100 0,03 0,0044 0,11 0,0236 0,15 0,0195 0,27 0,0725 0,42 0,1096 0,60 0,1559 0,75 0,1194 1,00 0,0947 0,5996
L o re n z-Ku rv e
1
k
G = 1 − ∑ f i ⋅ (v i −1 + v i )
vi
0,75
i =1
0,5
= 1 − 0,5996 = 0,4004
0,25 0 0
0,25
0,5
0,75
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
ui
1
Relative Konzentration
52
Relative Konzentration -BRD HHNE Früheres Neue Länder von…bis unter … Euro Bundesgebiet und Berlin-Ost Unter 900
7,2
12,8
900 – 1300
11,7
16,7
1300 – 1500
6,6
7,6
1500 – 2000
14,7
17,3
2000 – 2600
14,7
16,0
2600 – 3600
18,1
15,3
3600 – 5000
14,6
8,8
5000 – 18000
12,2
5,4
Gini-Koeffizient
0,4283
0,4004
Lorenz-Kurv e
1
vi 0 ,7 5
0 ,5
0 ,2 5 ABL Dia gona l
0 0
0 ,2 5
0 ,5
0 ,7 5
ui 1
Interpretation: Überlegen Sie selbst! Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
53
NBL
Danke schön!!!
Dr. Ricabal Delgado/ Prof. Kück Lehrstuhl Statistik
Relative Konzentration
54