Eidgenössisches Departement des Innern EDI Bundesamt für Statistik BFS Abteilung Bevölkerung und Bildung

Sektion Arbeit und Erwerbsleben, April 2012

SAKE-Daten Benutzerhandbuch

Auskünfte: Auskunftsdienst, Sektion Arbeit und Erwerbsleben Tel.: +41 32 713 64 00 E-Mail: [email protected]

Abteilung Bevölkerungsstudien und Haushaltssurveys Sektion Arbeit und Erwerbsleben

1/16

1

Bemerkungen zu den Revisionen und Präzisierungen der Variablen

4

Stichprobe ................................................................................................................................................ 4 Revision des Fragebogens ...................................................................................................................... 4 Variablen und Nomenklaturen ................................................................................................................. 4 Thema A «Informationen zum Interview» ............................................................................................. 4 Thema D «Filterfragen zum Arbeitsmarktstatus» ................................................................................. 5 Thema F «Beruf» .................................................................................................................................. 5 Thema G «Berufliche Stellung» ............................................................................................................ 6 Thema M «Betriebsinformationen»....................................................................................................... 6 Thema Q «Abgeschlossene Ausbildungen und laufende Ausbildung» ............................................... 6 Thema R «Weiterbildung» .................................................................................................................... 7 Thema S «Soziodemografische Variablen der Zielperson» und Thema J «Migration» ....................... 7 Thema W «Einkommen» ...................................................................................................................... 7 Dauer-Variablen .................................................................................................................................... 8

2

Lesen der gelieferten Dateien (Quartals- und Jahresdaten)

9

Beschreibung ........................................................................................................................................... 9 Wie Sie die Daten mit SAS und SPSS lesen (Beispiel) ......................................................................... 10

3

Struktur der Quartals- und Jahresdateien

11

4

Berechnung des mittleren Jahresbestands (Jahresdurchschnittswerte) 12

5

Technische Bemerkungen: statistische Zuverlässigkeit und Gewichtung der Daten

14

Gewichtung der Daten ........................................................................................................................... 14 Mindestanzahl Beobachtungen .............................................................................................................. 14 Durch die Nachschichtung gegebene Grenzen ..................................................................................... 15

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

2/16

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

3/16

1 Bemerkungen zu den Revisionen und Präzisierungen der Variablen Stichprobe Die Stichprobe der SAKE hat sich im Laufe der Jahre beträchtlich verändert. Zusammengefasst lässt sich sagen, dass sich die Stichprobengrösse, ohne Berücksichtigung der kantonalen Verdichtungen, von 1991 bis 2011 zwischen 12'000 und 18'000 bewegte (einzige Ausnahme war das Jahr 1995 mit 29'000 Interviews). So war es möglich, auf nationaler Ebene relativ zuverlässige Daten in Bezug auf wichtige Fragen der Arbeitsmarktpolitik zu erhalten. Im Jahr 2002 wurde die Stichprobengrösse auf 40'000 erhöht (bevor sie bis 2006 wieder auf 30'000 sank), damit zuverlässige Arbeitsmarktindikatoren nach Grossregionen sowie für kleine Bevölkerungsgruppen (z.B. Langzeitarbeitslose) berechnet werden konnten. Parallel zur Vergrösserung der Basisstichprobe (die sich aus schweizerischen und ausländischen Staatsangehörigen zusammensetzt) hat sich die Notwendigkeit ergeben, im Rahmen der SAKE die in der Schweiz wohnhaften Ausländerinnen und Ausländer besser zu erfassen. In der Folge wurde eine Zusatzstichprobe von ausländischen Staatsangehörigen eingeführt, die von 2003 bis 2009 rund 15'000 Interviews umfasste. Ab 2010 wurde die SAKE regelmässig mit einer Basisstichprobe, die aus 105'000 Interviews jährlich besteht, und einer zusätzlichen Stichprobe aus 21'000 Interviews mit ausländischen Personen durchgeführt. In der Datei Kontrolle der Resultate finden Sie alle Angaben zur Grösse der Gesamtstichprobe sowie zu den regionalen Verdichtungen seit 1991.

Revision des Fragebogens Der SAKE-Fragebogen wurde seit 1991 laufend überarbeitet und in Bezug auf inhaltliche sowie technische Aspekte verbessert (siehe Überblick über die Variablen). Während der ersten fünf Erhebungsjahre der SAKE (1991–1995) wurde jedoch auf eine grundlegende Revision des Fragebogens verzichtet, um die Datenvergleichbarkeit nicht zu beeinträchtigen. Die erste umfangreichere Revision des Fragebogens fand erst 1996 statt, im Hinblick auf die geplanten Änderungen am Erhebungskonzept, insbesondere die Integration von zusätzlichen thematischen Modulen. Im Jahr 2010, mit dem Wechsel von einer jährlichen zu einer vierteljährlichen Erhebung, hat der SAKE-Fragebogen wichtige Änderungen erfahren. Bestimmte Variablen wurden verändert, gelöscht oder hinzugefügt. Die Details zu den Variablen und die Sprungbefehle (Struktur des Fragebogens) finden sich auf der Variablenliste der SAKE. Diese Variablenliste als Grundlagendokument ermöglicht es insbesondere, zu erkennen, welche Variablen vierteljährlich (gelb = Wellen 1 bis 4) und welche jährlich (rosa = Wellen 1 und 3) sind.

Variablen und Nomenklaturen Es kommt vor, dass gewisse Variablen in den SAS-Formaten (beziehungsweise bei den Value-labels SPSS) nicht beschrieben sind. Dies gilt, wenn Variablen langen Nomenklaturen entsprechen. In solchen Fällen verwendet die SAKE offizielle Nomenklaturen des BFS, die unter dem folgenden Link abrufbar sind: http://www.bfs.admin.ch/bfs/portal/de/index/infothek/nomenklaturen.html Thema A «Informationen zum Interview»  Gemeindenummer (B019): siehe im Internet unter Nomenklaturen «Amtliches Gemeindeverzeichnis der Schweiz»  Ab 2010: Erhebungsjahr (B022) und Erhebungsquartal (B024): Diese Informationen scheinen in gewissen Fällen in einem Widerspruch mit dem Interviewdatum (B011d) zu stehen. Die Interviews eines bestimmten Erhebungsquartals werden auch noch in der ersten Woche des darauffolgenden Quartals durchgeführt. Diese Verschiebung ist darauf zurückzuführen, dass sich die Referenzwoche in den Interviewfragen in der Regel auf die Woche vor dem Interview bezieht. Beispielsweise sind einige Interviews des 4. Quartals 2010 während der ersten Januarwoche 2011 realisiert worden.

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

4/16

Thema D «Filterfragen zum Arbeitsmarktstatus»  Der Erwerbsstatus (BDU1) ist eine Analysevariable, die aufgrund von mehreren Fragen konstruiert wurde. Sie beruht hauptsächlich auf der beruflichen Stellung entsprechend der Variable EG11 (für die Erwerbstätigen), aber sie nimmt auch andere Informationen auf, die ihre Vervollständigung und Plausibilisierung ermöglichen: - Die mitarbeitenden Familienmitglieder gemäss EG11 werden in BDU1 wie Selbstständige behandelt, wenn sie bei EG15 angeben, dass sie Direktionsmitglied sind. Ab 2001 wird BDU1 mit der Rechtsform (oder der Branche) des Unternehmens plausibilisiert: - Die Selbstständigen werden wie Angestellte in der eigenen Kapitalgesellschaft behandelt, wenn ihr Unternehmen von der Rechtsform her eine AG oder eine GmbH ist. - Im umgekehrten Fall werden die Angestellten in der eigenen AG oder GmbH wie Selbstständige 1 behandelt, wenn ihr Unternehmen von der Rechtsform her eine Gesellschaft von Personen ist. - Die Selbstständigen werden wie Angestellte behandelt, wenn ihr Unternehmen von der Rechtsform her ein Verein, eine Stiftung oder ein öffentliches Unternehmen (Bund, Kantone, Gemeinden usw.) ist oder wenn es von der Branche her der öffentlichen Verwaltung angehört (BMU3=15). Seit 2010 wird diese Plausibilisierung (Umschlüsselung auf Angestellte) auch auf Angestellte in der eigenen AG und auf mitarbeitende Familienmitglieder angewendet. - Bis 2009 wurden die Personen, die bei einem anderen Privathaushalt angestellt waren (BMU3=20), wie Angestellte in BDU1 betrachtet. Seit 2010 wird diese Plausibilisierung nicht mehr vorgenommen und es ist nur noch der von der befragten Person angegebene Status massgebend. Detailliertere Auskünfte zur Bildung von BDU1 können über folgende Adresse eingeholt werden: [email protected]. 2 Die Originalvariable (entsprechend dem Fragebogen) EG11 wird weder verändert noch plausibilisiert.

Thema F «Beruf»  Schweizer Berufsnomenklatur (siehe im Internet unter Nomenklaturen «SBN 2000 – Schweizer Berufsnomenklatur 2000»): Ab 2002: Analysevariablen sind BFU6 und TEF2. Sie liefern die Kodierung auf der 1. Stufe der Nomenklatur. Diese Analysevariablen sind für den Zeitraum 1991–2001 nicht vorhanden. Ab 2001: Die Variablen EF03, EF01, LF01, AF03, NF03 und IQ37 liefern die Kodierung auf der 5. Stufe der Nomenklatur. 1991–2000: Die Variablen EF03, EF01, LF01, AF03, NF03 und IQ37 enthalten die detaillierten Originalcodes der Schweizer Berufsdatenbank (12, 10 oder 8 Positionen). Zusätzliche Informationen erhalten Sie unter folgender Adresse: [email protected].  Internationale Berufsnomenklatur (siehe im Internet unter Nomenklaturen «International Standard Classification of Occupations (ISCO-08)»): Ab 1991: Die Analysevariablen, die ISCO-08 enthalten, sind BFU7 und TEF1. Sie liefern die Kodierung auf der 1. Stufe der Nomenklatur. Die Variable BFU5I liefert die Kodierung auf der 4. Stufe der Nomenklatur. 1991–2010: Die Analysevariablen BFU7_88 und TEF1_88 liefern die Kodierung auf der 1. Stufe nach der früheren Nomenklatur ISCO-88. Die Variable BFU5I_88 liefert die Kodierung auf der 4. Stufe der Nomenklatur ISCO-08.

1

Einzelfirma, Einfache Gesellschaft, Kollektivgesellschaft, Kommanditgesellschaft Im Laufe des Interviews wurden die Fragen zu gewissen Themen entsprechend der Variable EG11 (Unterscheidung zwischen Selbstständigen und Angestellten) und nicht entsprechend der plausibilisierten Variable BDU1 gefiltert.

2

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

5/16

Thema G «Berufliche Stellung»  Berufliche Stellung (EG15, AG15, NG15, BGU1 und TEG1) Die Frage, die es ermöglicht, die Kategorie «Arbeitnehmer in Unternehmensleitung» zu bilden, wird seit 2010 restriktiver formuliert, und dies führt bei den obigen Variablen zu einem Rückgang dieser Kategorie und zu einer Zunahme der anderen Kategorien von Angestellten. Obschon diese Umformulierung Anfang 2010 eingeführt wurde, ist sie erst ab dem ersten Quartal 2011 für die gesamte Stichprobe gültig.

Thema M «Betriebsinformationen» NOGA 2008 – Allgemeine Systematik der Wirtschaftszweige 2008 (entspricht der NACE Rev.2 auf internationaler Ebene):  Wirtschaftsabschnitte – 1. Stufe (BMU3, BMU3n): 3 Für alle SAKE-Jahrgänge müssen die Analysevariablen BMU3 und BMU3n verwendet werden, weil die Allgemeine Systematik der Wirtschaftszweige im Jahr 2008 revidiert und die Daten (sowie TEM1 et TEM2) rückwirkend angepasst worden sind. Vor 2009 wurden die Daten entsprechend der alten Nomenklatur erhoben, und die neue Version wurde über einen Umsteigeschlüssel gebildet. Die alten Variablen BMU1 und BMU1n (NOGA 2002) finden sich bei den Daten von 1991 bis 2009.  Wirtschaftsklassen – 4. Stufe (EM03, EM03n, LM03, AM03, NM03) und Wirtschaftsabschnitte – Selbsteinstufung (EM01, EM01n, LM01, AM01, NM01): Für die Zeit vor 2009 sind diese detaillierten Variablen einzig nach den alten Nomenklaturen verfügbar. Daher ist die Verwendung der Analysevariablen BMU3 et BMU3n vorzuziehen. Ab 2009:

Siehe im Internet unter Nomenklaturen «NOGA 2008 – Allgemeine Systematik der Wirtschaftszweige» (6 Positionen) 1996–2008: Siehe im Internet unter Nomenklaturen «NOGA 1995/2002 – Allgemeine Systematik der Wirtschaftszweige» (4 Positionen) 1991–1995: Allgemeine Systematik der Wirtschaftszweige 1985

Thema Q «Abgeschlossene Ausbildungen und laufende Ausbildung»  Höchste abgeschlossene Ausbildung (BQU2, BQU2i und andere Kodierungen TBQ1, TBQ2 und TEQ1) Die Klassifikation der Ausbildung wurde 2007 revidiert (Fragen und Variablen). Die Daten wurden für alle konstruierten Variablen rückwirkend angepasst (mit denselben Namen). Die Originalvariablen des Fragebogens IQ21, IQ221-IQ225 und IQ37 entsprechen hingegen der alten Klassifikation. Die aktualisierten Ausbildungsvariablen sind mit folgenden Vorbehalten zu verwenden: 4

1996–2009 : Zusammenlegung der Codes 9 und 10 für Analysen mit BQU2, ebenso Zusammenlegung der Codes 51 und 52 für BQU2i sowie der Codes 8 und 9 für Analysen mit TBQ1 1996–2000: Zusammenlegung der Codes 1 und 11 für Analysen mit BQU2 1991–1995: Aktualisierung unmöglich (im Internet ist keine Standardtabelle publiziert)

3

Die Variable BMU3n (Wirtschaftsabschnitt Nebenerwerb) besteht erst seit 1996. Der Grund für diese Zusammenlegungen liegt bei der Einführung der Fachhochschulen FH und der Pädagogischen Hochschulen PH (Variablen IQ221-225, IQ27). Für die Zeit vor 2007 war es mit den Fragen nicht möglich, diese neuen Ausbildungen auf Tertiärstufe zusammen mit den Universitätsabschlüssen zu klassieren (sie werden weiterhin mit den Höheren Berufsbildungen klassiert). Ausserdem wird die abgeschlossene Ausbildung nach dem ersten Interview im Prinzip nicht mehr erfragt, daher sind diese Codes FH und PH seit 2010 komplett. 4

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

6/16

 Arten der Ausbildung (IQ21, IQ221-225 und IQ27) Diese Originalvariablen wurden 2010 geändert. Die Antwortkategorien wurden anderen BFSErhebungen entsprechend angepasst. Die Ausbildungsklassifikation ist identisch mit derjenigen von 2007, die konstruierten Variablen BQU2, BQU2i, TBQ1, TBQ2 und TEQ1 wurden demzufolge nicht geändert. Es wird empfohlen, die konstruierten Analysevariablen zu verwenden. Wenn allerdings die Verwendung der Originalvariablen erforderlich ist, sollte folgenden Bemerkungen Rechnung getragen werden: 2010: Die neuen Antwortkategorien 1 «Bachelor» und 2 «Master» für IQ30 sind noch nicht für alle Wellen vollständig. 2007–2010: Zusammenlegung der Codes 15, 16 und 17 für Analysen mit IQ21 und IQ221-225 2003–2007: Analysen mit IQ37 sollten vermieden werden, weil diese Variable 2003 eingeführt wurde und erst ab 2008 für alle Wellen vollständig ist. Ein Überblick über diese Variablen ist in der Datei «Kodierungen im Bildungsbereich» zu finden.

Thema R «Weiterbildung» Die detaillierte Liste von Weiterbildungskursen kann bei Herrn Brice Quiquerez, Tel. 032 713 69 55, E-Mail [email protected], angefordert werden.

Thema S «Soziodemografische Variablen der Zielperson» und Thema J «Migration» Nationalität und Land: Verschiedene Variablen beziehen sich auf das Verzeichnis «Staaten und Gebiete» (siehe im Internet unter Nomenklaturen). Der Code 8998 «Staatenlos» wird in den Daten manchmal verwendet, im Verzeichnis ist er jedoch nicht aufgeführt. Im Hinblick auf korrekte Analysen ist es notwendig, die detaillierten Ländervariablen (IS05 «Nationalität», IJ01b «Geburtsland», IJ02b «Nationalität zur Zeit der Geburt» usw.) mit den entsprechenden Filtervariablen zu kombinieren (IS051 «Heimat», IJ01 «Geburtsort», IJ02 «Herkunft bei der Geburt» usw.). Dies ermöglicht es z.B., schweizerisch-ausländische Doppelbürgerinnen und -bürger mit IS051 zu identifizieren und sie von IS05 abzuziehen.

Thema W «Einkommen» Das BFS hat die Einführung der Erhebung SILC (Survey on Income and Living Conditions) im Jahr 2010 genutzt, um die Grundlagen der Einkommensstatistiken von anderen Erhebungen (insbesondere der SAKE) zu revidieren und zu verbessern. Dank dieser Arbeiten konnte der Übergang vom Bruttoeinkommen zum Nettoeinkommen sowie die Methode zur Umrechnung des monatlichen Einkommens auf ein Jahreseinkommen sowohl bei den Erwerbseinkommen wie bei den Haushaltseinkommen verbessert werden. Bezüglich des Haushaltseinkommens haben Tests jedoch gezeigt, dass mit der Befragungsart der SAKE nicht alle Komponenten des Haushaltseinkommens abgedeckt werden können. Dies hat folgende Konsequenzen:  Erwerbseinkommen: Die Variablen wurden 2011 revidiert und rückwirkend auf 1991 neu eingeführt (Variablen BWU1, BWU1K, BWU2, BWU2K, TEW1 und TEW2).  Haushaltseinkommen: Die Basisvariablen (IW12, IW13K, IW14) werden nicht mehr geliefert. Den Nutzerinnen und Nutzern stehen für die Erhebungsjahre ab 1991 zwei neue Variablen zur Verfügung: das annualisierte Bruttohaushaltseinkommen, in Einkommensquintilen (BWU11K), und das annualisierte Bruttohaushaltsäquivalenzeinkommen, in Äquivalenzeinkommensquintilen (BWU11KEQ).

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

7/16

Das Jahr 2008 bildet eine Ausnahme. Zusätzlich wurden Plausibilisierungs- und Imputationsarbei5 ten durchgeführt . Deshalb werden nicht nur die Basisdaten (IW12, IW13K, IW14) geliefert, sondern es sind auch die Daten zum annualisierten Brutto- und Nettohaushaltseinkommen (BWU11 bzw. BWU12) in genauen und imputierten Beträgen verfügbar. Es obliegt der Benutzerin bzw. dem Benutzer, bei der Datenauswertung entsprechend vorsichtig zu sein. Aus diesem Grund ist es ratsam, keine Auswertungen der Einkommensverteilung von Haushalten mit mehr als zwei Personen zu machen. Es scheint jedoch möglich, das Einkommen von Haushalten mit Personen im Rentenalter auszuwerten, da diese Haushalte in der Regel ein bis zwei Personen umfassen. Anmerkungen und Definitionen: - Äquivalenzeinkommen: Um die Haushalte trotz unterschiedlicher Grösse und Zusammensetzung untereinander vergleichen zu können, wird das verfügbare Haushaltseinkommen in ein Einkommen eines Einpersonenhaushalts, d.h. in eine Verbrauchseinheit, umgewandelt. Das Einkommen wird demnach durch die «Äquivalenzgrösse» gemäss der modifizierten OECDSkala geteilt. Diese Grösse wird ermittelt, indem zuerst die einzelnen Haushaltsmitglieder gewichtet werden: Die erste erwachsene Person mit 1,0, die zweite und jede weitere im Alter von 15 und mehr Jahren mit 0,5 sowie jedes Kind unter 15 Jahren mit 0,3. Dem Begriff des Äquivalenzeinkommens liegt die Annahme zugrunde, dass ein Haushalt eine wirtschaftliche Einheit darstellt, dessen Gesamteinkommen allen Mitgliedern im selben Ausmass zugute kommt. - Quintile: Das Quintil gibt Auskunft über die Position des Haushalts in Bezug auf die Einkommensverteilung. Die Verteilung wird in fünf gleiche Gruppen unterteilt, die jede einem Fünftel des gewichteten Stichprobentotals entspricht. Das erste Quintil entspricht den 20% der Haushalte mit den geringsten Einkommen. Dieses Schema wird weitergeführt bis zum fünften Quintil, das den 20% der Haushalte mit den höchsten Einkommen entspricht. Die Grenzen der Quintile werden aufgrund der Antworten der befragten Personen festgelegt. Sie variieren deshalb je nach Erhebungsjahr. Die Tabelle «Grenzwerte der Quintile der Haushalteinkommen» verschafft Ihnen einen Überblick über die Grenzwerte der auf ganze Zahlen gerundeten Quintile der verschiedenen Erhebungsjahre.

Dauer-Variablen  Variablen, die mit T enden (Anzahl Tage): Die Anzahl Tage wird berechnet, indem das Interviewdatum mit demjenigen Datum verglichen wird, das anhand des als Antwort angegebenen Jahres und Monats ermittelt wird. Wenn das Jahr angegeben, der Monat jedoch unbekannt ist, wird die Dauer aufgrund des Datums berechnet, das je nach Typ der behandelten Dauer am kohärentesten ist. Die Dauer der Arbeitslosigkeit kann für jedes Quartal berechnet werden, da der Einfluss dieser Schätzungen nur gering ist. Dies gilt nicht für die anderen Typen von Dauer, für die empfohlen wird, sich auf eine Berechnung der jährlichen Mittelwerte zu beschränken. Bei Antwortausfällen wird eine Klassierungsfrage gestellt; der Mittelwert der Klassierung wird danach in Anzahl Tagen übernommen. Für die Antwortkategorie «mehr als 8 Jahre» wird ein Wert von 8,5 Jahren mit 365 multipliziert, was 3102,5 Tage ergibt.  Variablen, die mit K enden (Klassen): Die Kategorie 5 «13-18 Monate» enthält die Werte, die bei den Variablen, die mit T enden, 365 Tagen entsprechen. Bei den Variablen zur «Vertragsdauer» entsprechen die Originalantworten 12 Monate oder 1 Jahr dem Wert 365 Tage und werden damit auch der Klasse 5 zugeteilt. Dieser Grundsatz gilt für die Erwerbspersonen (EE09T/K), die Lehrlinge (LE09T/K), die Erwerbslosen ILO (AE09T/K) oder die Nichterwerbspersonen bis 2009 (danach gibt es die Variable NE09T/K nicht mehr). Diese Situation ist nicht ideal, das Vorgehen wird jedoch bis auf Weiteres beibehalten, um Brüche in den Zeitreihen zu vermeiden.

5

Genauere Angaben zu den Imputationen und den Plausibilisierungen des Jahres 2008 sind im Dokument «Imputation von Einkommensvariablen in der Schweizerischen Arbeitskräfteerhebung (SAKE 2008)» verfügbar. SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

8/16

2 Lesen der gelieferten Dateien (Quartals- und Jahresdaten) Beschreibung Die SAKE-Daten sind als komprimierte Dateien (WinZip) verfügbar. Jedes WinZip-Paket enthält eine Serie von Dateien (ASCII-Code), die je nach Auswertungsprogramm (SAS/SPSS) und Sprache (D/F) zusammengestellt werden können. Für die Jahre 1991 bis 2009 gibt es einen Datensatz pro Jahr. Die Ergebnisse beziehen sich jeweils auf das 2. Quartal. Seit 2010 sind für jedes Jahr fünf Datensätze verfügbar: vier Dateien mit den Quartalsvariablen – lieferbar drei Monate nach dem jeweiligen Erhebungsquartal – und eine Jahresdatei – lieferbar im April des darauffolgenden Jahres. 1) SAKE'xxxx'.TXT QUARTAL:

SAKE’xxxxqq’.TXT 2) S'xxxx'-INPUT-SAS/SPSS.TXT

QUARTAL:

S’xxxx’-INPUT-TRIM- SAS/SPSS.TXT 3) S'xxxx'-VAR-LABEL-F-SAS/SPSS.TXT

4a)

4b)

Rohdatenfile für das Jahr 'xxxx'. (xxxx = SAKE-Jahr: 1991, 1992,...) Rohdatenfile für das Quartal 'qq' (qq = ein SAKEQuartal: Q1, Q2, Q3 oder Q4) Namen und Positionen der Variablen auf dem Rohdatenfile für das Jahr (inkl. Module) Namen und Positionen der Variablen auf dem Rohdatenfile für das Quartal Namen/Label der Variablen ab 2001 (Kurzfassung)

FORMATE für SAS-Bearbeitung S'xxxx’-FORMAT-F-SAS.TXT

Formate für den Standardfragebogen (Formatname SAS = Variablenname+ Sprachcode D/F, z.B. BDU1d.)

S'xxxx'-FORMAT-F-MOD-SAS.TXT

Formate für die Zusatzmodule(Formatname SAS = Variablenname + Sprachcode D/F vor 2005: auch SAKE-Jahr (2-stellig) in der Mitte des Variablennamens ergänzen. IU01d. wird z.B. zu IU0401d. für das Jahr 2004.)

VALUE LABELS für SPSS-Bearbeitung S’xxxx’-VALUE-LABEL-F-SPSS.TXT

Labels (Antwortkategorien) für den Standardfragebogen

S'xxxx'-VALUE-LABEL-F-MOD-SPSS.TXT

Labels (Antwortkategorien) für die Zusatzmodule ab 1996

Bei SPSS müssen die «Value-labels» direkt mit einer Variable verknüpft sein. Weil nicht alle Variablen in allen SAKE-Jahren vorkommen, werden bei der Verwendung der (Value-labels-)Files «WARNINGS» angezeigt.

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

9/16

Wie Sie die Daten mit SAS und SPSS lesen (Beispiel) xxxx = SAKE-Jahre: 1991, 1992,…. qq = Quartale: Q1, Q2, Q3 oder Q4 => Um die Quartalsdaten ab 2010 zu lesen, müssen: - die Namen der Dateien «INPUT» (+TRIM) und «SAKExxxx» (+qq) angepasst werden. - die Codelinien auf den Modulen entfernt werden. (siehe unten in Kursivschrift)

SAS filename sakexxxx 'c:\répertoire\SAKExxxx.TXT';

QUARTAL: SAKExxxxqq.TXT

DATA SAKExxxx; infile sakexxxx lrecl=3000; input %include 'c:\répertoire\Sxxxx-INPUT-SAS.TXT'; ; QUARTAL: Sxxxx-INPUT-TRIM-SAS.TXT LABEL %include 'c:\répertoire\Sxxxx-VAR-LABEL-F-SAS.TXT'; ; run; PROC FORMAT; %include 'c:\répertoire\Sxxxx-FORMAT-F-MOD-SAS.TXT'; ; QUARTAL: zu entfernen %include 'c:\répertoire\Sxxxx-INPUT-SAS.TXT'; ; Quartal: run; proc freq; tables bdu1 tbd1; format bdu1 bdu1f. tbd1 tbd1f.; weight IXPXH; run;

°JAHRESDATEN (AB 2010) : IXPXHJ°

SPSS 1) Datei «Sxxxx-INPUT-SPSS.TXT» öffnen 2) Auf der ersten Linie INPUTX durch den Pfad für den Zugriff auf die Rohdaten ersetzen DATA LIST FILE="C:\répertoire\SAKExxxx.TXT"/ QUARTAL: SAKExxxxqq.TXT Wichtig: - Anführungszeichen nicht vergessen und den Slash am Ende der Zeile nicht löschen. - Am Ende der Datei muss ein Punkt stehen (z.B. TAO6 1981 - 1983 .) 3) SPSS öffnen. Danach ein Syntax-Fenster öffnen mit dem Menü File->New->Syntax und folgenden Text kopieren (dabei den Pfad für den Zugriff auf die gespeicherten TXT-Daten anpassen): INSERT FILE="C:\répertoire\Sxxxx-INPUT-SPSS.TXT". EXECUTE. INSERT FILE="C:\répertoire\Sxxxx-VAR-LABEL-F-SPSS.TXT". EXECUTE. INSERT

QUART.: Sxxxx-INPUT-TRIM-SPSS.TXT

EXECUTE. INSERT FILE="C:\répertoire\Sxxxx-VALUE-LABEL-F-MOD-SPSS.TXT". EXECUTE. WEIGHT BY IXPXH. FREQUENCIES VAR=TBD1 BDU1. SAVE OUTFILE="C:\répertoire\SAKExxxx.sav". EXECUTE.

SAKE-Daten Benutzerhandbuch

QUARTAL: zu entfernen QUARTAL: zu entfernen QUARTAL: zu entfernen °JAHRESDATEN (AB 2010): IXPXHJ°

QUARTAL: SAKExxxxqq.sav

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

10/16

3 Struktur der Quartals- und Jahresdateien

Variable 2

Variable ...

Gewichtungsvariable

1 2 3 4 5

ok ok ok ok ok

ok ok ok ok ok

ok ok ok ok ok

ok ok ok ok ok

IXPXH

Variable 1

2009 2009 2009 2009 2009

Welle: B021

Jahr

1 2 ... ... N

(2. Quartal)

Haushaltsnr.: B015

Von 1991 bis 2009 wurde die SAKE nur im 2. Quartal durchgeführt. Pro Jahr gibt es nur eine Datei, die wie folgt strukturiert ist:

Diese Datei enthält Informationen zu allen Erhebungswellen, jedoch nur zu den Quartalsvariablen. Kumuliert man die vier Quartale, erscheint ein grosser Teil der Zielpersonen 1 zwei Mal (mit derselben Haushaltsnummer ).

Diese Datei enthält Informationen zu den Quartals- sowie den Jahresvariablen, jedoch nur für die Wellen 1 und 3. Eine Zielperson erscheint nur ein einziges Mal.

ok ok ok ok

1015 1002 ... N

2010 2010 2010 2010

2 2 2 2

1 2 3 4

ok ok ok ok

x x x x

ok ok ok ok

1028 1015 ... N

2010 2010 2010 2010

3 3 3 3

1 2 3 4

ok ok ok ok

x x x x

ok ok ok ok

1041 1028 ... N

2010 2010 2010 2010

4 4 4 4

1 2 3 4

ok ok ok ok

x x x x

ok ok ok ok

SAKE-Daten Benutzerhandbuch

Jahresvariablen

Jahresvariablen x x x x

Quartalsvariablen

Quartalsvariablen ok ok ok ok

Welle: B021

Welle: B021 1 2 3 4

Quartal: B024

Quartal: B024 1 1 1 1

Jahr: B022

Jahr: B022 2010 2010 2010 2010

Haushaltsnr.: B015

Haushaltsnr.: B015 1002 0941 ... N

1002 ... 1015 ... 1028 ... 1041 N

2010 2010 2010 2010 2010 2010 2010 2010

1 1 2 2 3 3 4 4

1 3 1 3 1 3 1 3

ok ok ok ok ok ok ok ok

ok ok ok ok ok ok ok ok

Gewichtungsvariable

b) Jahresdatei (eine pro Jahr)

Gewichtungsvariable IXPXH

a) Quartalsdatei (vier pro Jahr)

IXPXHJ

Seit 2010 wird die SAKE jeweils für ein ganzes Jahr, d.h. für vier Quartale durchgeführt. Somit stehen gleichzeitig Quartals- und Jahresdateien zur Verfügung. Jede Datei ist wie folgt strukturiert:

ok ok ok ok ok ok ok ok

1)

Die Haushaltsnummer wird bei der ersten Aktivierung in der Erhebung (in Welle 1) zugeteilt und bleibt für alle weiteren Befragungen bestehen. Seit 2010 hat diese Variable B015 zehn Positionen: - Jahr der 1. Aktivierung (2 Positionen) - Nr. der Woche der 1. Aktivierung (2 Pos.) - anonymisierte Haushaltsnr. (6 Pos.)

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

11/16

4 Berechnung des mittleren Jahresbestands (Jahresdurchschnittswerte) Für die Daten von 1991 bis 2009 ist keine Berechnung des mittleren Bestands für ein ganzes Jahr, sondern nur für das jeweilige 2. Quartal möglich. Seit 2010 kann der mittlere Jahresbestand berechnet werden. Es werden drei Fälle unterschieden: a) Mittlerer Jahresbestand anhand von Quartalsvariablen Die Jahresdurchschnittswerte anhand von Quartalsvariablen werden mit einem simplen arithmetischen Mittel der mit IXPXH gewichteten Quartalswerte ermittelt ((T1 + T2 + T3 + T4)/4). Beispiel: Arbeitsmarktstatus der ständigen Wohnbevölkerung nach Nationalität I 2010

II 2010

III 2010

IV 2010

Jahresdurchschnitt 2010

Total

6586

6602

6618

6642

6612

Erwerbspersonen

4456

4472

4511

4497

4484

4228 228

4282 190

4301 210

4310 187

4281 204

2130

2130

2107

2145

2128

Erwerbstätige Erwerbslose gemäss ILO Nichterwerbspersonen

Die Quartalsvariablen werden in die Jahresdatei ebenfalls einbezogen. Es ist jedoch empfehlenswert, den Jahresdurchschnittswert der Quartalsvariablen anhand des Durchschnitts der vier Quartale zu berechnen (wie dies in den Standardtabellen der Fall ist). Für die Quartalsvariablen ist diese Methode statistisch präziser als die Berechnung des Jahresdurchschnitts anhand der Jahresdatei.

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

12/16

Zu beachten: Aufgrund der Anforderungen von Eurostat streben wir eine Kohärenz der Totale bei den folgenden Kriterien an: Geschlecht, Altersgruppe und Erwerbsstatus. Die Ergebnisse der unten stehenden Tabelle sind daher mit der Variable B0000 immer identisch, unabhängig davon, ob man sie anhand der Jahresdatei oder anhand des arithmetischen Mittels mit den vier Quartalsdateien berechnet: Mittlerer Bestand für das Jahr 2010 Status Geschlecht

1. männlich

2. weiblich

TOTAL

Erwerbstätige

Erwerbslose ILO

Nichterwerbspersonen

15-24 25-34

301139 471312

23813 25197

145183 27290

470136 523799

35-44 45-54

557417 558624

21166 16775

16731 30107

595314 605506

55+ TOTAL

438947 2327438

14120 101071

580270 799581

1033336 3228090

15-24 25-34

275728 398952

25412 26726

151313 83787

452452 509464

35-44 45-54

472398 482730

23256 17308

110666 87100

606320 587138

55+ TOTAL

323299 1953107

10035 102737

895297 1328162

1228631 3384006

15-24 25-34

576867 870264

49225 51923

296496 111077

922588 1033263

35-44 45-54

1029815 1041354

44423 34082

127396 117207

1201634 1192644

55+ TOTAL

762245 4280545

24155 203808

1475567 2127743

2261967 6612096

Altersgruppen

TOTAL

a) Mittlerer Jahresbestand anhand von Jahresvariablen Durch die Extrapolation, die anhand der Gewichtungsvariable IXPXHJ in den Jahresdateien ermittelt wurde, ergeben sich direkt die Jahresdurchschnittswerte.

c) Mittlerer Jahresbestand anhand von gekreuzten Jahres- und Quartalsvariablen Der Jahresmittelwert, der anhand von gekreuzten Jahres- und Quartalsvariablen berechnet wird, basiert auf der Jahresdatei (da die Jahresvariablen in den Quartalsvariablen nicht enthalten sind).

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

13/16

5 Technische Bemerkungen: statistische Zuverlässigkeit und Gewichtung der Daten Für repräsentative und statistisch zuverlässige Ergebnisse gilt es, drei wichtige Elemente zu beachten: die Gewichtung der Daten, die Mindestanzahl Beobachtungen und die durch die Nachschichtung gegebenen Grenzen.

Gewichtung der Daten Es muss eine Gewichtungsvariable verwendet werden, mithilfe derer alle Daten der ständigen Wohnbevölkerung ab 15 Jahren entsprechen. Ungewichtete Ergebnisse dürfen nur nach Rücksprache mit dem BFS veröffentlicht werden. Die SAKE-Dateien enthalten mehrere Gewichtungstypen. Am häufigsten werden Personenquerschnittsgewichtungen verwendet:  IXPXH, Personengewicht für die Quartalsdateien (1991–2009, 2010q1, 2010q2, 2010q3, 2010q4, 2011q1, 2011q2, …)  IXPXHJ, Personengewicht für die Jahresdateien, die es seit 2010 gibt (2010, 2011, 2012, …)  IXPXM1, Personengewicht für die Jahresdaten des europäischen Moduls, seit 2010.  IXPXM1, Personengewicht für die Jahresdaten des nationalen Moduls, seit 2010. Es ist auch möglich, sämtliche Daten mit den Privathaushalten der Schweiz in Verbindung zu setzen.  IXHHH, Haushaltsgewicht für die Jahres- und Quartalsdateien.  IXPXM1, Haushaltsgewicht für die Jahresdaten des europäischen Moduls, seit 2010.  IXPXM2, Haushaltsgewicht für die Jahresdaten des nationalen Moduls, seit 2010. (Es werden nicht für alle Module Haushaltsgewichte berechnet, gewisse Themen bieten sich für Auswertungen auf der Ebene der Haushalte nicht an.) Es ist zu beachten, dass auf den Haushaltsauswertungen basierende Ergebnisse nur als Prozentwerte und nicht in absoluten Werten ausgewiesen werden dürfen.

Mindestanzahl Beobachtungen Die vertraglich festgelegten Regeln müssen befolgt werden. Es gilt insbesondere zu beachten, dass die Mindestanzahl Beobachtungen (nicht gewichtet) eingehalten wird. Die Mindestanzahl Beobachtungen (N), die für eine Extrapolation notwendig ist, unterscheidet sich je nach Datendatei. Sie kann wie folgt zusammengefasst werden: a) Von 1991 bis 2009 sowie ab 2010: für Ergebnisse, die anhand einer einzigen Datei berechnet werden (1 Quartalsdatei oder 1 Jahresdatei):  Wenn N < 5 bedeutet dies, dass eine Extrapolation aus Datenschutzgründen nicht möglich ist. Folgender Zusatz kann bei Tabellen oder Grafiken angefügt werden: «Extrapolation aufgrund von weniger als fünf Beobachtungen. Die Resultate werden aus Gründen des Datenschutzes nicht publiziert.»  Wenn 5 ≤ N < 50 ist eine Extrapolation möglich, die Ergebnisse sind jedoch mit Vorsicht zu interpretieren. Werden solche Ergebnisse veröffentlicht, sind sie in Klammer zu setzen. Folgender Zusatz kann bei Tabellen oder Grafiken angefügt werden: «Extrapolation aufgrund von weniger als 50 Beobachtungen. Die Resultate sind mit grosser Vorsicht zu interpretieren.»

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

14/16

b) Ab 2010: für Ergebnisse, die anhand von vier Quartalsdateien des gleichen Jahres berechnet werden (Ziel: Berechnung von Jahresdurchschnittswerten anhand von Quartalsvariablen): N ist die Summe der vier Quartale. 

Wenn N < 5 bedeutet dies, dass eine Extrapolation aus Datenschutzgründen nicht möglich ist. Folgender Zusatz kann bei Tabellen oder Grafiken angefügt werden: «Extrapolation aufgrund von weniger als fünf Beobachtungen. Die Resultate werden aus Gründen des Datenschutzes nicht publiziert.»



Wenn 5 ≤ N < 90 ist eine Extrapolation möglich, die Ergebnisse sind jedoch mit Vorsicht zu interpretieren. Werden solche Ergebnisse veröffentlicht, sind sie in Klammer zu setzen. Folgender Zusatz kann bei Tabellen oder Grafiken angefügt werden: «Extrapolation aufgrund von weniger als 90 Beobachtungen. Die Resultate sind mit grosser Vorsicht zu interpretieren.»

Die obgenannten Regeln bezüglich Mindestanzahl Beobachtungen beziehen sich bei der Prozentrechnung auf den Zähler und nicht auf den Nenner. Um Ihnen die Anwendung der Regel der Anzahl Fälle zu erleichtern, stehen das «Excel-Makro für absolute Zahlen» oder das «Excel-Makro für Prozentwerte» zur Verfügung.

Durch die Nachschichtung gegebene Grenzen Darüber hinaus müssen die Grenzen beachtet werden, die durch die Nachschichtung gegeben sind («calage sur marges»). Die allgemeine Regel ist, dass keine absoluten Werte für geographische Einheiten (z.B. Kantone) vorgenommen werden sollen, die nicht im Nachschichtungsverfahren speziell bearbeitet worden sind. Die Berechnung von Prozentwerten, Durchschnittswerten, Medianen und Quantilen ist hingegen möglich, wenn die Anzahl Beobachtungen ausreichend ist. So sollte z.B. weder die Anzahl Erwerbstätige im Kanton Neuenburg vor 2009 noch die Zahl der Angestellten auf Stufe Gemeinde berechnet werden. Zur Erinnerung: Bei den Gemeinden gibt es keine Nachschichtung. Nachschichtungen nach Erhebungsjahren  Seit 2009 werden die Kantone getrennt behandelt, so wie auch die Halbkantone BS und BL. OW+NW und AI+AR werden zusammengefasst.  Von 2002 bis 2008 wurde die Nachschichtung folgendermassen vorgenommen: - ZH - BE - LU - BS - BL - AG - SG - TI - VD - GE - VS - UR + SZ + OW + NW + ZG - FR+ SO + NE + JU - GL + SH + AI + AR + GR + TG

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

15/16

 Von 1998 bis 2001: - ZH - TI - VD +VS + GE - BE + FR + SO + NE + JU - BS + BL + AG - GL + SH + AR + AI + SG + GR+ TG - LU + UR + SZ + OW + NW + ZG  Von 1996 bis 1997 sowie von 1991 bis 1994: - ZH - VD - GE - BE + FR + SO + NE + JU - LU + UR + SZ + OW + NW + ZG - GL + SH + AR + AI + SG + GR + TG - BS + BL + AG - VS + TI  1995: Alle Kantone werden separat behandelt.

Weitere Angaben finden Sie im Dokument «Nachschichtungen zur Berechnung der verschiedenen Gewichte in der SAKE» (nur auf Französisch erhältlich).

SAKE-Daten Benutzerhandbuch

Abteilung Bevölkerung und Bildung Sektion Arbeit und Erwerbsleben

16/16