Demographie III R OLAND R AU Universität Rostock, Wintersemester 2013/2014
04. November 2013
c Roland Rau
Demographie III
1 / 34
Wichtige Konzepte der vergangenen Lehrveranstaltung(en): Bevölkerungen ohne Altersstruktur “Balancing Equation” Nt = N0 (1 + w)t (diskretes Wachstum) Nt = N0 ert (kontinuierliches Wachstum) P N(T) = N0 e¯rT ; mit ¯r = T1 t rt (variables r)
c Roland Rau
Demographie III
2 / 34
Wie könnte man ansonsten die Grösse von Bevölkerungen vorhersagen?
c Roland Rau
Demographie III
3 / 34
Wie könnte man ansonsten die Grösse von Bevölkerungen vorhersagen? Idee für kurze Zeit: Schätzung mittels Polynomen dritten Grades “It is often desired to represent by a mathematical equation the law connecting a series of observations for which theory gives no explanation. In such a case ignorance of the physical cause of the phenomena observed does not diminish the accuracy of the computed formula for purposes of prediction, provided the observations are accurate and there are enough of them, and provided the same causes continue to operate.” H.S. Pritchett (1891)
P = A + Bt + Ct2 + Dt3 Wie gut ist diese Idee?
c Roland Rau
Demographie III
4 / 34
50
Bevölkerung USA, 1790−1880
Meine Schätzwerte: P = 17.474157+5.097265t+0.635831t2 +0.031024t3 Pritchett setzte t = 0 im Jahre 1840. Im Jahr 1841 war
20 0
10
P = 17.47969+5.0988t+0.634506t2 +0.0307275t3
Bevölkerung in Mio.
Pritchett (1891, p. 280):
30
40
Wie gut ist diese Idee?
“Accordingly, the population “P” for any time “t” would be represented by the equation:
● ● ● ● ● ● ● ● ● ● ● Schätzung RR ● ●● ● ● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ●● ●● ●● ●●● ●● ● ● ●● ●● ●● ●● ●●● ●●● ● ● ● ●●● ●●●● ●●●● ●●●●● ●●●●● ●●●●●●
gemessene Werte der jeweiligen Volkszählung Schätzung Pritchett
1790
1810
t = 0.1; Im Jahr 1839 war t = −0.1; . . .
1830
1850
1870
Jahr
Quelle: Eigene Berechnungen mit Daten des R-Packages car sowie Pritchett (1891)
c Roland Rau
Demographie III
5 / 34
Pritchett (1891, p. 280): “Accordingly, the population “P” for any time “t” would be represented by the equation: P = 17.47969 + 5.0988t + 0.634506t2 + 0.0307275t3 ”
200 150 100 0
50
Bevölkerung in Mio.
250
300
Bevölkerung USA, 1790−2000
1800
1820
1840
1860
1880
1900
1920
1940
1960
1980
2000
Jahr
Quelle: Eigene Berechnungen mit Daten des R-Packages car c Roland Rau
Demographie III
6 / 34
Gibt es bessere Möglichkeiten als exponentielles Wachstum oder die Schätzung mittels eines Polynoms?
Logistisches Bevölkerungsmodell “Notice sur la loi que la population poursuit dans son accroissement” (Verhulst, 1838) “On sait que le célèbre Malthus a établi comme principe que la population humaine tend à croître en progression géométrique de manière à se doubler après une certaine période par exemple tous les vingt cinq ans.[. . . ]” Verhulst (1838, S. 113) P IERRE F RANÇOIS V ERHULST (1804–1849) Quelle: Wikipedia c Roland Rau
Demographie III
7 / 34
Logistisches Bevölkerungsmodell
Grundidee: Bevölkerung kann zu Beginn exponentiell wachsen. Es kann jedoch kein unbegrenztes Wachstum für unbestimmte Zeit geben, da diesem Grenzen gesetzt sind. Wenn die Bevölkerungsgrösse dieser Grenze entgegenstrebt, nimmt die Wachstumsrate stetig ab, bis zu einer Wachstumsrate r = 0, wenn die Bevölkerungsgrösse gleich der “carrying capacity” ist. “The theory of the logistic curve. If the relative change in any population, that is the ratio of ∆y/∆t to the population y be supposed to be always proportional to the relative remaining possibility of population, that is the ratio of (L − y) to the ultimate limit of population L say, it will become zero when the population reaches the assumed limit L.” K NIBBS (1926, 384–385)
c Roland Rau
Demographie III
8 / 34
Logistisches Bevölkerungsmodell
Verschiedene Parametrisierungen für logistische Kurve (Beispiele)
Pearl and Reed (1920): y = Keyfitz (1968): Nt =
beax 1+ceax
a 1+be−ct
Feichtinger (1973): P(t) =
P 1+ea−cPt
Keyfitz and Beekman (1984); Keyfitz and Caswell (2005): N(t) = Impagliazzo (1985): P(t) = Dinkel (1989): Pt =
a 1+e−r(t−t0 )
A 1+B exp(−mt)
K 1+C2 er0 t
c Roland Rau
Demographie III
9 / 34
Logistisches Bevölkerungsmodell
Es herrschen verschiedene Parametrisierungen des logistischen Modells vor. Unser Modell: P=
K 1 + ea+bt
(5)
“. . . the observations do not justify the elaboration beyond the simple form of equation (5)” R EED (1936, S. 136), IN B EZUG AUF V ERHULST (1838) leicht andere Schreibweise: N(t) =
K 1 + ea+bt
K: “carrying capacity”, oberes (asymptotisches) Limit der Bevölkerungsgrösse Was ist a?
c Roland Rau
Demographie III
10 / 34
Logistisches Bevölkerungsmodell Was ist a? N(t) =
N(t) =
K 1 + ea+bt
K K = 1 + ea+bt 1 + ea ebt
falls: t = 0 (also der Startpunkt unserer Betrachtungsweise): K K K K = = = 1 + ea ebt 1 + ea eb0 1 + ea e0 1 + ea 1 K K K ⇒ 1 + ea = ; ea = − 1; ⇒ a = ln −1 N(0) N(0) N(0) N(0) =
Damit drückt a das (transformierte) Verhältnis zwischen der “carrying capacity” K und der Startbevölkerung aus. Benutzen wir eine andere Parametrisierung der logistischen Gleichung, so drückt die neue Konstante genau das Verhältnis zwischen der “carrying capacity” K und der Startbevölkerung aus (minus 1). bt ist damit der einzige Teil der Gleichung, der zeitabhängig ist und somit die Wachstumsrate der Bevölkerung kontrolliert. c Roland Rau
Demographie III
11 / 34
Logistisches Bevölkerungsmodell Bevölkerungsentwicklung mit der Zeit t
K 1 + ea+bt
0
N(t) =
Bevölkerungsgrösse N(t)
K
Logistisches Bevölkerungsmodell
Zeit t
Zeit t c Roland Rau
Demographie III
12 / 34
Logistisches Bevölkerungsmodell absolute Zuwächse in der Bevölkerung
K 1 + ea+bt
bKea+bt dN(t) =− dt (1 + ea+bt )2
dN/dt
N(t) =
(danke xmaxima — http: //maxima.sourceforge.net/)
Zeit t
Zeit t c Roland Rau
Demographie III
13 / 34
Logistisches Bevölkerungsmodell relativer Zuwachs in der Bevölkerung ⇒ Wachstumsrate
dN(t) dt
N(t)
=
K 1 + ea+bt
ln N(t) bea+bt = dt 1 + ea+bt
dN/dt 1/N
N(t) =
(danke xmaxima — http: //maxima.sourceforge.net/)
Zeit t
Zeit t c Roland Rau
Demographie III
14 / 34
Logistisches Bevölkerungsmodell
Das logistisches Bevölkerungsmodell war das Modell zur Vorhersage der Bevölkerungsgrösse in den USA – in etwa zwischen 1920 und 1940 insbesondere Raymond Pearl und Lowell Reed (z.B. Pearl and Reed, 1920, 1922; Pearl et al., 1940; Reed, 1936) Raymond Pearl: Erster Präsident der “IUSSP” (http://www.iussp.org)
R AYMOND P EARL (1879–1940) Quelle: Wikipedia
c Roland Rau
Demographie III
15 / 34
Logistisches Bevölkerungsmodell
Wie gut war/ist nun das Modell von Pearl & Reed? Jahr
Beobachtet
1790 1800 1810 1820 1830 1840 1850 1860 1870 1880 1890 1900 1910
3.929 5.308 7.240 9.638 12.866 17.069 23.192 31.443 39.818 50.156 62.948 75.995 91.972
Logistic-1
Fehler Logistic-2 Logistic-1 (Angaben in Mio.) 3.929 -0.000 3.928 5.336 0.028 5.332 7.228 -0.012 7.220 9.757 0.119 9.742 13.109 0.243 13.085 17.506 0.437 17.468 23.192 -0.000 23.136 30.412 -1.031 30.331 39.372 -0.446 39.260 50.177 0.021 50.029 62.769 -0.179 62.583 76.869 0.874 76.647 91.972 -0.000 91.719
c Roland Rau
Demographie III
Fehler Logistic-2 -0.001 0.024 -0.020 0.104 0.219 0.399 -0.056 -1.112 -0.558 -0.127 -0.365 0.652 -0.253
16 / 34
K=197 Mio
60 10
20
30
40
50
Beobachtet Schätzung Pearl/Reed (1920)
0
Bevölkerung (in Mio.)
70
80
90
Logistisches Bevölkerungsmodell
1790
1810
1830
1850
1870
1890
1910
Jahr c Roland Rau
Demographie III
17 / 34
K=197 Mio
70 40
50
60
Beobachtet Schätzung Pearl/Reed (verbessert)
0
10
20
30
Bevölkerung (in Mio.)
80
90 100
Logistisches Bevölkerungsmodell
1790
1810
1830
1850
1870
1890
1910
Jahr
“Soon after the original paper was published the notation was improved, and the curve took the definitive form, still, however, without the use of the 1920 count: 197.27 y= −0.0313x ” 1+67.32e
Pearl et al. (1940, p. 486)
c Roland Rau
Demographie III
18 / 34
Logistisches Bevölkerungsmodell
250 200 0
50
100
150
Bevölkerungsgrösse
300
350
400
450
Prognostische Fähigkeiten?
1800
1850
1900
1950
2000
2050
2100
2150
2200
Jahr
Quelle: Eigene Berechnungen auf Basis von Daten des R-Packages car. Die vertikalen Referenzlinien zeigen den Zeithorizont der Datenschätzung an. Z.B. bedeutet die rote vertikale Linie im Jahr 1900, dass als Datengrundlage die Bevölkerungsgrössen von 1790 bis 1900 genommen wurden.
c Roland Rau
Demographie III
19 / 34
Zusammenfassung Zentrales Thema:
?
Nt1 ⇒ Nt2
Bisher: Nt = N0 (1 + w)t Nt = N0 ert Nt = α + β1 t + β2 t2 + β3 t3 Nt =
K 1 + eα+βt
also, keine weitere Differenzierung als die Bevölkerungsgrösse ⇒ Differenzierung der Bevölkerung nach dem Alter
c Roland Rau
Demographie III
20 / 34
Die Sterbetafel Die Hauptmethode zur Beschreibung der Mortalität in einer Bevölkerung Mittels der Sterbetafel erhält man altersspezifische Werte für die Sterberate m(x) Sterbewahrscheinlichkeit q(x) Anzahl der Überlebenden l(x) durchschnittlich durchlebten Jahre L(x) durchschnittlich noch zu durchlebenden Jahre T(x) die (Rest-)Lebenserwartung e(x)
Wir behandeln hier nur eine Sterbetafel für alle einzelnen Altersstufen, sprich keine abgekürzte Sterbetafel (z.B. 85+) oder Altersklassen (z.B. 10–14, 15–19, . . . ) ⇒ eigene Problematik (“complete life table” vs. “abridged life table”) Typischerweise handelt es sich um Periodensterbetafeln, sprich um die Werte einer synthetischen Kohorte (also keine Kohorten-/Generationensterbetafeln)
c Roland Rau
Demographie III
21 / 34
8 7 6 5 Alter
4 3 2 1 0 0
1
2
3
4
5
6
7
8
Periode c Roland Rau
Demographie III
22 / 34
Die Sterbetafel
2 1 0
Alter
3
4
Ausgangspunkt: Basiseinheiten: “Lexis-Rechtecke” (Lexis-Diagramm bekannt?) Durchschnittliche, alterspezifische Bevölkerung in einem Jahr t: N(x, t), üblicherweise der Durchschnitt der Bevölkerungzahlen vom 31.12. von zwei aufeinanderfolgenden Jahren. Anzahl der altersspezifischen Sterbefälle in einem Jahr t: D(x, t) Da wir uns nur auf ein einziges Jahr t beziehen, lassen wir ab jetzt t weg. D(x) Sterberate M(x) = N(x)
0
1
2
3
4
Jahr/Periode
c Roland Rau
Demographie III
23 / 34
Die Sterbetafel Sterberate (death rate): M(x) =
D(x) N(x)
Beispiel: Deutschland, 2006, Frauen und Männer zusammen x 0 1 2 3 4 5 6 7 8 9
N(x) 679878 698258 709477 717365 732845 758153 775510 784731 805481 810803
D(x) 2579 206 130 105 87 77 68 68 73 69
M(x) 0.003794 0.000295 0.000183 0.000146 0.000119 0.000102 0.000088 0.000087 0.000091 0.000085
Quelle: Selbst gerundete Werte von Daten der Human Mortality Database
c Roland Rau
Demographie III
24 / 34
Die Sterbetafel
0.001
0.01
m(x)
0.6 0.4
1e−04
0.2 0.0
m(x)
0.8
0.1
1.0
1
Die Sterberate m(x) im Jahr 2006 in Deutschland
0 10
30
50
70
90
110
0 10
Alter x
30
50
70
90
110
Alter x
c Roland Rau
Demographie III
25 / 34
Die Sterbetafel Sterbewahrscheinlichkeit (probability of dying): q(x) q(x) =
m(x) 1 + (1 − (a(x))m(x)
Erster Stolperstein: a(x) a(x) Die durchschnittliche Anzahl an Jahren, die eine Person, die im Alter x gestorben ist, im Alter x gelebt hat. Annahme für die meisten Altersstufen: a(x) = 0.5 Annahme für Alterstufe 0: a(x) = 0.06 x 0 1 2 3 4 5 6 7 8 9
N(x) 679878 698258 709477 717365 732845 758153 775510 784731 805481 810803
D(x) 2579 206 130 105 87 77 68 68 73 69
M(x) 0.003794 0.000295 0.000183 0.000146 0.000119 0.000102 0.000088 0.000087 0.000091 0.000085
c Roland Rau
a(x) 0.06 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50
Demographie III
q(x) 0.003780 0.000295 0.000183 0.000146 0.000119 0.000102 0.000088 0.000087 0.000091 0.000085 26 / 34
Die Sterbetafel
1
Die Sterberate m(x) und die Sterbewahrscheinlichkeit q(x) im Jahr 2006 in Deutschland
0.01 0.001 1e−04
m(x) bzw. q(x)
0.1
m(x) q(x)
0
10
20
30
40
50
60
70
80
90
100 110
Alter x
c Roland Rau
Demographie III
27 / 34
Die Sterbetafel
Die Überlebenswahrscheinlichkeit p(x) Da wir nur zwei Zustände kennen — lebend / tot — muss gelten: p(x) = 1 − q(x) x 0 1 2 3 4 5 6 7 8 9
N(x) 679878 698258 709477 717365 732845 758153 775510 784731 805481 810803
D(x) 2579 206 130 105 87 77 68 68 73 69
M(x) 0.003794 0.000295 0.000183 0.000146 0.000119 0.000102 0.000088 0.000087 0.000091 0.000085
c Roland Rau
a(x) 0.06 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50 0.50
q(x) 0.003780 0.000295 0.000183 0.000146 0.000119 0.000102 0.000088 0.000087 0.000091 0.000085
Demographie III
p(x) 0.996220 0.999705 0.999817 0.999854 0.999881 0.999898 0.999912 0.999913 0.999909 0.999915
28 / 34
Bildquellen
Raymond Pearl: Wikipedia, 04. November 2013, die Abbildung ist in der sogenannten “Public Domain” (http://upload.wikimedia.org/wikipedia/en/e/ed/ Raymond_Pearl_o.jpg) Pierre François Verhulst: Wikipedia, 04. November 2013, die Abbildung ist in der sogenannten “Public Domain” (http://upload.wikimedia.org/wikipedia/commons/0/ 04/Pierre_Francois_Verhulst.jpg)
c Roland Rau
Demographie III
29 / 34
Zitierte und weiterführende Literatur Themen: Bevölkerungen ohne Altersstruktur, exponentielles/geometrisches Wachstum, logistisches Bevölkerungsmodell Kapitel 1.2, Preston et al. (2001) Kapitel II, Dinkel (1989) Kapitel I, Keyfitz and Beekman (1984) Kapitel I, Keyfitz and Caswell (2005) Fox (2002) Kapitel 13, Shryock and Siegel (1973) Pearl and Reed (1920) Pearl and Reed (1922) Pearl et al. (1940) Verhulst (1838) c Roland Rau
Demographie III
30 / 34
Literatur I Dinkel, R. H. (1989). Demographie. Band 1: Bevölkerungsdynamik. München, D: Vahlen. Feichtinger, G. (1973). Bevölkerungsstatistik. Berlin: De Gruyter. Fox, J. (2002, January). Nonlinear Regression and Nonlinear Least Squares. Appendix to “An R and S-PLUS Companion to Applied Regression”. Available online at: http://cran.r-project.org/doc/contrib/Fox-Companion/ appendix-nonlinear-regression.pdf. Impagliazzo, J. (1985). Deterministic Aspects of Mathematical Demography. Berlin: Springer. Keyfitz, N. (1968). Introduction to the Mathematics of Population. Reading, MA: Addison-Wesley. Keyfitz, N. and J. A. Beekman (1984). Demography Through Problems. Problem Books in Mathematics. Springer-Verlag. Keyfitz, N. and H. Caswell (2005). Applied Mathematical Demography. Third Edition. New York, NY: Springer. Knibbs, S. G. H. (1926). The laws of growth of a population. Journal of the American Statistical Association 21(156), 381–398. Pearl, R. and L. J. Reed (1920). On the Rate of Growth of the Population of the United States since 1790 and its Mathematical Representation. Proceedings of the National Academy of Sciences 6(6), 274–288. c Roland Rau
Demographie III
31 / 34
Literatur II
Pearl, R. and L. J. Reed (1922). A Further Note on the Mathematical Theory of Population Growth. Proceedings of the National Academy of Sciences 8, 365–368. Pearl, R., L. J. Reed, and J. F. Kish (1940). The Logistic Curve and the Census Count of 1940. Science 92, 486–488. Preston, S. H., P. Heuveline, and M. Guillot (2001). Demography. Measuring and Modeling Population Processes. Oxford, UK: Blackwell Publishers. Pritchett, H. (1891). A formula for predicting the population of the United States. Publications of the American Statistical Association 2(14), 278–286. Reed, L. J. (1936). Population Growth and Forecasts. The Annals of the American Academy of Political and Social Science 188, 159–166. Shryock, H. S. and J. S. Siegel (1973). The Methods and Materials of Demography. Second Printing (rev.). U.S. Department of Commerce. Bureau of the Census. Verhulst, P. F. (1838). Notice sur la loi que la population poursuit dans son accroissement. Correspondance mathématique et physique 10, 113–121.
c Roland Rau
Demographie III
32 / 34
Lizenz
This open-access work is published under the terms of the Creative Commons Attribution NonCommercial License 2.0 Germany, which permits use, reproduction & distribution in any medium for non-commercial purposes, provided the original author(s) and source are given credit. Für ausführlichere Informationen: http://creativecommons.org/licenses/by-nc/2.0/de/ (Deutsch) http://creativecommons.org/licenses/by-nc/2.0/de/deed.en (English)
c Roland Rau
Demographie III
33 / 34
Kontakt Universität Rostock Institut für Soziologie und Demographie Lehrstuhl für Demographie Ulmenstr. 69 18057 Rostock Germany Tel.: +49-381-498 4044 Fax.: +49-381-498 4395 Email:
[email protected] Sprechstunde im WS 2013/2014: Mittwochs, 09:00–10:00 (und nach Vereinbarung)
c Roland Rau
Demographie III
34 / 34