AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES

AYUDA SPSS RECOFICAR EN DISTINTAS VARIABLES 1® Ruta: Transformar > Recodificar > Recodificar en distintas variables Autor: Rubén José Rodríguez 22 de abril de 2009 En comando Recodificar (Recode) en distintas variables2 se utiliza tanto para variables cualitativas (niveles de medición nominal u ordinal) como cuantitativas (nivel de medición escala). Si la variables es cualitativa o variable categorial, y se desea fusionar categorías de un sistema politómico a un sistema dicotómico, por ejemplo: Estado Civil: 1. Soltero, 2. Casado, 3. Viudo, 4. Unión de hecho, 5. Divorciado, 6. Separado; y se quiere crear una variable dicotómica: 1. Soltero y 2. No soltero. En general se utiliza para generar una nueva variable con categorías fusionadas para las cuales se requiere cambiar los viejos códigos (variables original) a los nuevos códigos (nueva variable). Pues, mediante el comando Recodificar en distintas variables se debe mantener en viejo código 1 como nuevo código 1. Soltero, y los viejos códigos 2, 3, 4, 5, y 6, se los asigna al nuevo código 2. No soltero. De ese modo se crea una nueva variable que la podemos denominar: Condición de soltería. Hemos recodificado las categorías de las nuevas variables en categorías de una nueva variable distinta: Variables de entrada (de origen)  Variable de resultado. Se debe asignar un Nombre y una Etiqueta de la nueva variable y Cambiar el nombre a la variable de origen. Por ultimo, se deben cambiar los Antiguos valores por los Nuevos valores, es decir, reemplazar la vieja codificación por la nueva codificación. Finalmente, al Aceptar se agrega la nueva variable en la última columna del fichero activo. También se utiliza el comando Recodificar cuando queremos crear intervalos de clases de una variable métrica continua. Es decir, agrupar la variable en clases o intervalos de clase. El primer paso consiste en abrir, desde el menú Transformar, el cuadro de diálogo correspondiente al comando Recodificar….En distintas variables, porque si se recodifica en la misma variable se reemplaza la codificación de la variable original y se pierden los códigos que se ingresaron originalmente.

1

® Registrado en la Propiedad Intelectual. Hecho el depósito que marca la ley 11.723. En la versión 11.51 de SPSS el comando Recodificar del menú Transformar, se abre en dos subopciones: Recodificar en la misma variable y Recodificar en distintas variables. A partir de la versión 15.0 de SPSS este comando se presenta en dos subcomandos: Recodificar en la misma variable y Recodificar en distintas variables

2

1

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES

Aplicaremos el fichero EMPLEADOS para ejemplificar el comando Recodificar. La distribución de frecuencias de la variables Salario actual es una larga tabla (Ver resultados del ejemplo en el Visor de SPSS: Estadísticos descriptivosFrecuencias-Fichero EMPLEADOS.spo) donde en la columna variable aparecen todos los valores singulares de salarios actuales y en la columna de frecuencias, las frecuencias absolutas con que se repiten dicho valores. Una manera de volver más operativa la tabla es agrupando la variable salario en Intervalos de clase. Para ello se deben dar los siguientes pasos: 1. Calcular la Amplitud total o Rango de la variable restando el valor máximo del valor mínimo: ($ 135.000-15.750 = $ 119.250) 2. Esa amplitud es un segmento que va desde un límite inferior hasta un límite superior y lo debemos dividir en un número de segmentos más chicos, por ejemplo 8, 9 o 10 segmentos o Intervalos de clase. Por ejemplo, $ 119.250 / 10 intervalo = $ 11.925, aproximadamente $ 12.000. Es decir, que la variable Salario actual va a ser agrupada en intervalos de clase de tamaño i = $12.000 3. Debemos agrupar la variable salario en intervalos de clase. Esto significa crear una nueva variable, por ejemplo: Salarint (8 caracteres). 4. Para ello hay que utilizar el menú Transformar > Recodificar > Recodificar en distintas variables. Se abre un cuadro de diálogo donde hay que realizar las siguientes operaciones: 4.1. Seleccionar del listado de variables de origen y pasarla con el botón flecha al campo de variable destino. 4.1. Registrar el Nombre y la Etiqueta de la nueva variable. 4.2 Cambiar el nombre de la vieja variable por el nombre de la nueva. Se reemplazará el signo? por salarint (Salario actual en intervalos). 4.3. Se oprime el botón Valores antiguos y nuevos. 4.4. Se abre un cuadro de diálogo secundario donde se procede a definir los rangos o intervalos de valores indicando el límite inferior y superior de cada intervalo y el nuevo código que le corresponde. 4.5. Se empieza por el límite inferior de la variable: $ 15.750 y se le suma el tamaño “i“ del intervalo: $ 15.750+$12.000= $37.750. Se procede desde este modo hasta alcanzar incluir al límite superior de la variable en el último intervalo

2

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES En la secuencia de capturas de ventanas se puede visualizar paso a paso todo el procedimiento. Paso 1

Paso 2

Paso 3

3

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES Paso 4

Paso 5

Paso 6

4

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES Paso 7

Paso 8

Se continúa el mismo procedimiento añadiendo la definición de los rangos o intervalos y sus códigos, hasta incluir en el último intervalo el límite superior de la variable. Se muestran los intervalos 1 a 6 en el Paso 9, y de 7 a 10 en el Paso 10. Paso 9

5

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES Por último, oprimimos el botón Continuar (dado que se trata de un cuadro de dialogo secundario) para volver a al cuadro de diálogo original, y en él concluir con el procedimiento para generar la nueva variable, presionando el botón Aceptar. Paso 10

Paso 11

6

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES La nueva variable salarint se agrega en la columna final del fichero EMPLEADOS. Paso 12

Paso 13 Reinsertamos la nueva variable salarint (Salario actual en intervalos) al lado de la antigua variable salario (Salario actual) para su mejor visualización. Se observa que los nuevos valores de la variable salarint corresponden a los códigos de los intervalos de valores ingresados.

Si se ejecuta el comando de Descriptivos del sub-menú Estadísticos descriptivos del menú Analizar sobre la nueva variable salarint se observará que SPSS calcula, por ejemplo, la media, mediana, modo, desvío standard sobre los códigos de la variable salarint y no sobre los propios valores salariales. La distribución de frecuencias y el histograma con curva normal aparecerá así:

7

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES Salario actual en intervalos Salario actual en intervalos 1

Válidos

Frecuencia

Porcentaje válido

Porcentaje

Porcentaje acumulado

217

45,8

45,8

45,8

2

152

32,1

32,1

77,8

3

12

2,5

2,5

80,4

4

29

6,1

6,1

86,5

5

28

5,9

5,9

92,4

6

19

4,0

4,0

96,4

7

12

2,5

2,5

98,9

8

4

,8

,8

99,8

10

1

,2

,2

100,0

474

100,0

100,0

Total

Como se comprenderá no tiene ningún significado calcular la media, mediana, modo, y desvío estándar sobre los códigos de los intervalos de clase del Salario actual. Por lo cual deberemos etiquetar los valores de la nueva variable salarint con la leyenda correspondiente a los límites inferior y superior de los valores reales de cada intervalo expresados en $.

Salario actual en intérvalos 400

300

Frecuencia

200

100 Desv. típ. = 1,71 Media = 2,2 N = 474,00

0 2,0

4,0

6,0

8,0

10,0

Salario actual en intérvalos

Para etiquetar los códigos de los valores de la variable Salario actual en intervalos de modo que aparezcan cada uno de los intervalos correspondientes a los códigos 1 ($ 15.750 a $ 27.750), ….10 ($ 123.750 a $ 135.750) se debe abrir la pestaña Vista de variable del Editor de datos y definir el Valor y las Etiquetas de cada valor.

8

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES Paso 14

1 2 3

Haciendo clic en la celda Valores (1) correspondiente a la variable con nombre salarint se abrirá el cuadro de diálogo Etiqueta de valor. En el campo Valor (2) se deben consignar los valores 1 a 10 (uno por vez) referidos a cada intervalo de valores del Salario actual; y en el campo Etiqueta del valor (3) se deben registrar los limites inferior y superior del intervalo de clase correspondiente a dicho código. Por ejemplo, para el primer intervalo es: Paso 15

Y se oprime el botón Añadir, incorporándose dicha etiqueta en el valor de la variable salarint.

9

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES Paso 16

Se procede de este modo para cada uno de los 10 intervalos de modo que finalmente la variable salarint quede con las etiquetas de los intervalos de clase de la variable Salario actual. Paso 17

Con el último intervalo se oprime el botón Aceptar Pasos 18

10

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES De modo que podemos lograr visualizar en la Distribución de frecuencias la variable salarint pero no con los códigos (1 a 10) de los intervalos, sino con los propios valores inferior y superior de cada intervalo. Si volvemos a correr el comando Frecuencias del submenú Estadísticos descriptivos sobre la variable con la nueva codificación y solamente seleccionamos la variable salaint, obtendremos: :

Salario actual en intervalos Salario actual en intervalos

Válidos

Frecuencia

Porcentaje

Porcentaje válido

Porcentaje acumulado

$ 15.750 a $ 27.759

217

45,8

45,8

45,8

$ 27.750 a $ 39.750

152

32,1

32,1

77,8

$ 39.750 a $ 51.750

38

8,0

8,0

85,9

$ 51.750 a $ 63.750

28

5,9

5,9

91,8

$ 63.750 a $ 75.750

22

4,6

4,6

96,4

$ 75.750 a $ 87.750

8

1,7

1,7

98,1

$ 87.750 a $ 99.750

4

,8

,8

98,9

$ 99.750 a $ 111.750

4

,8

,8

99,8

$ 123.750 a $ 135.750

1

,2

,2

100,0

474

100,0

100,0

Total

Si deseamos standarizar o normalizar la variable salarios debemos transformar la variable X: Salarios actuales en una variable Z, variable standarizada z, o variable tipificada o normalizada z. SPSS lo denomina valores tipificados. Para ello, se abre el comando Frecuencias del sub-menú Estadísticos descriptivos del menú Analizar. En el cuadro de diálogo se selecciona la variable salario (Salario actual está expresado en valores puntuales, en puntajes directos expresados en $) y se tilda la casilla  Guardar valores tipificados como variables. SPSS pone en funcionamiento la fórmula de transformación del puntaje bruto o directo en puntaje z, mediante el siguiente algoritmo:

zj 

Xj X s

Donde:

Xj :

Variable Salarios actuales (salarios)

X:

Media aritmética de los Salarios actuales (salarios)

S:

Desvío Standard de los Salarios actuales (salarios)

Al oprimir Aceptar en el cuadro de diálogo de Descriptivos se genera una nueva variable que tiene la misma raíz que la variable original pero que SPSS le agrega el prefijo z denominándola zsalario. Cada uno de los puntajes z de la nueva variable zsalario, expresa la distancia, diferencia o desvío respecto de la media expresado en unidades del Desvío Standard, que es la definición del puntaje z.

11

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES

Así el valor más bajo de la variable salario es $ 15.750 la media aritmética es $34.419,57 (Los valores originales tienen el formado de separador de miles con “comas” y de decimales con “puntos”) (Ver el Visor de SPSS del ejercicio: Estadísticos descriptivos-Frecuencias-Fichero EMPLEADOS.spo). El desvío será la diferencia entre $ 15.750 - $ 34.419, 57 = - $ 18.719,57. Que significa que el empleado que tiene Id n° 1, es decir, el salario más bajo, se desvía o distancia de la media aritmética en $ $ 18.719,57 pero por debajo de la media aritmética, dado que el sustraendo es mayor que el minuendo. Esto significa que ese desvío expresado en $ lo debemos dividir por el Desvío Standard que también está expresado en $, por lo que el resultado nos va a dar un puntaje sin unidades de la variable empírica. Z = ($ 15.750 - $ 34.419,57) / $17075,661 = - 1,093285349z Z = -1,09 ~ 1,1z Esto se interpreta como que el empleado con el más bajo salario anual se encuentra ubicado (desviado, distanciado) 1 vez y 1 décimo de Desvió Standard, es decir, un poco más que $ 17.975,661, exactamente $ 18.719,57, que es 1 vez y 1 décimo de DS, pero por debajo de la media aritmética. La creación de valores tipificados (puntajes z) nos permite comparar variables entre sí cuyas variables originales pueden estar expresadas en las más diversas unidades de medida, en nuestro caso dólares, con pesos, u otra moneda, para comparar distribuciones de salarios anuales de empleados. Al oprimir Aceptar en el cuadro de diálogo abierto se agrega en la última columna de la matriz de datos la nueva variable zsalario.

Si calculamos para esta nueva variable zsalario la media aritmética y el desvío standard, con el Histograma con Curva Normal, podemos observar en el Visor de re-

12

AYUDA SPSS-RECODIFICAR EN DISTINTAS VARIABLES sultados que la variable zsalario tiene como media aritmética el valor 0 y como desvío standard el valor 1, que son los parámetros de tendencia central y variabilidad de la Curva Normal. La forma del Histograma con la superposición de la Curva Normal se aleja bastante del modelo de Gauss-Laplace.

Puntuaje z: Salario actual 120

100

80

60

Frecuencia

40

Desv. típ. = 1,00

20

Media = 0,00 N = 474,00

0

00 6, 0 5 5, 0 0 5, 50 4, 0 0 4, 0 5 3, 0 0 3, 0 5 2, 00 2, 0 5 1, 0 0 1, 0 ,5 0 0 0, 0 -,500 , -1

Puntuaje z: Salario actual

Estadísticos Puntaje z: Salario actual N

Válidos Perdidos

Media Desv. típ. Asimetría Error típ. de asimetría Curtosis Error típ. de curtosis

474 0 ,0000000 1,0000000 0

2,125 ,112

5,378 ,224

Los índices descriptivos de forma3 indican que: Asimetría Positiva: +2,125 (Elevada As): Supera el valor normal de As Nor = 0 Curtosis Positiva: +5,378 (Elevada Ku): Supera el valor normal de Ku Nor = 0 3

El Índice de Asimetría indica que el Modo no se encuentra en el centro de la distribución, sino que se puede ubicar o en los valores bajos de la variable (As +), o en los valores altos (As -). Es decir, el índice de As evalúa dónde se ubica la ordenada máxima que se corresponde con la frecuencia máxima vinculada el valor del Modo. Según el tipo de As las medidas de tendencia central se ubicarán: As -: Mo < Md < Media. As + Media > Mediana. Un Índice de As = 0 o próximo a 0 indica que la forma de la curva empírica se aproxima a la Curva Normal, es decir, forma simétrica. Un índice de As > 0 es una asimetría positiva y por lo tanto la cola de la curva se extiende hacia la derecha de la abscisa, hacia los valores altos; y las frecuencias altas hacia los valores bajos. Un índice de As < 0 es una asimetría negativa, las frecuencia altas se encuentra en los valores altos y las frecuencias bajas en los valores bajos. La cola de la curva se desplaza hacia la izquierda. Si el Índice de Curtosis, o Kurtosis es Ku = 0 o próximo a 0 se trata de una curva mesocúrtica o curva normal o aproximadamente normal; si Ku > 0 la curva es leptocúrtica o curva en pico, indica gran homogeneidad. Si la Ku < 0 será platicúrtica, o curva plato o aplanada, indica gran heterogeneidad.

13