Práctica 4 Probabilidad y dependencia estadística En esta

Anuncio
Práctica 4
Probabilidad y dependencia estadística
En esta práctica se continúa avanzando en los procedimientos para el análisis de datos de
encuesta mediante el uso de PSPP a la vez que se indaga en el uso de la noción de probabilidad
para la determinación de relaciones entre variables.
Con esta práctica se pretende que el alumno afiance los conceptos de suceso dependiente e
independiente y su relación con la teoría de probabilidades. Con este acercamiento empírico
se abre también la puerta a nociones de dependencia e independencia estadística que son
centrales en la investigación de fenómenos sociales.
Vamos a comenzar indagando en lar relación que existe entre sexo y nivel de estudios, y más
adelante nos preguntaremos por la relación que existe entre Status y Voto Político.
Como en la práctica anterior habíamos generado el fichero activo “SAV”, ahora simplemente
desde PSPP le indicaremos Archivo y luego Abrir
Recordemos que se llamaba CIS2927.SAV y cuyo path era: [K:\CIS\CIS2927.SAV]
Una vez llamado el fichero vamos a solicitar la distribución de frecuencias de las siguientes
variables
-Sexo (P29)
-Estudios (ESTUDIOS) Esta variable, se encuentra en la parte final del fichero, ha sido generada
por el CIS, mediante la combinación de las preguntas P31 y P31a.
Para pedir dicha distribución, recordemos la secuencia Analizar: Estadística Descriptiva:
Frecuencias
Llevamos ambas variables a la caja, y como son nominales, desmarcamos todos los
estadísticos.
La distribución que obtenemos es la siguiente:
Con dicha información podemos calcular las siguientes probabilidades
P(Mujer)=1270/2480=0,5121
P(Superiores)=278/2480=0,1121
Si ahora nos preguntamos cuál es la probabilidad de encontrar en una selección aleatoria a una
mujer con estudios Superiores deberemos suponer que el hecho de ser mujer no tiene relación
con el nivel de estudios alcanzado. Es decir que hay independencia entre ambas variables.
Recordemos que la probabilidad de ocurrencia conjunta de dos sucesos independientes es el
producto de ambas probabilidades. En este caso el producto de la probabilidad de seleccionar
a una mujer por la probabilidad de seleccionar a alguien con estudios superiores.
P( S(Mujer)  S(Superiores) )= P(Mujer) P(Superiores)
En nuestro caso P( S(Mujer)  S(Superiores) ) = 0,5121x0,1121=0,0574
De forma análoga podríamos pensar en la probabilidad conjunta de ser hombre con estudios
superiores, en nuestro caso P( S(Hombre)  S(Superiores) ) = 0,4879x0,1121=0,0547
Vamos ahora a comprobar mediante la distribución conjunta entre las variables sexo y
estudios si nuestro supuesto es cierto. Para ello vamos a Analizar: Estadística Descriptiva y
seleccionamos en este caso Tablas Cruzadas
En filas vamos a colocar la variable ESTUDIOS y en columnas la variable P29 (sexo del
entrevistado). Conviene que en Estadísticos... que desmarque todos y en el botón Celdas...
asegúrese de que esté marcado Total –que son los porcentajes sobre el total de la tabla-. Los
resultados se presentan en una tabla:
En cada una de las celdas nos indica la frecuencia –número de casos-, el porcentaje en la
dirección de las filas, el porcentaje en la dirección de las columnas, y el porcentaje sobre el
total de casos (n=2480).
Si observamos por ejemplo la casilla de Mujeres con estudios Superiores vemos que hay 132
entrevistadas, que suponen el 47,5% de quienes tienen estudios superiores (132/278), y un
10,9% del conjunto de mujeres (132/1210). Las 132 mujeres con estudios superiores suponen
el 5,3% de la muestra (132/2480).
Este último valor 0,053 es la probabilidad de selección al azar de una mujer con estudios
superiores. Recordemos que bajo el supuesto de independencia esperábamos una
probabilidad de 0,057. Es decir la probabilidad es menor.
En el caso de los hombres encontramos que la probabilidad es 0,059 cuando esperábamos
0,055.
Las diferencias observadas son pequeñas, podemos suponer que el efecto combinado entre
sexo y nivel de estudios resulta reducido, si bien es importante señalar que dicho efecto es
positivo para los hombres, hay una mayor probabilidad de tener estudios superiores por ser
hombre que por ser mujer.
Recordemos que cuando dos sucesos no son independientes y son condicionados:
P( S(Mujer)  S(Superiores) )= P(Mujer) P(Superiores/Mujer)
En nuestro caso: 0,053=0,5121x P(Superiores/Mujer)
La probabilidad condicionada de tener estudios Superiores cuando se es mujer será:
P(Superiores/Mujer)=(0,053/0,5121)=0,1035
De forma análoga para los hombres:
P( S(Hombre)  S(Superiores) )= P(Hombre) P(Superiores/Hombre)
En nuestro caso: 0,059=0,4879x P(Superiores/Hombre)
La probabilidad condicionada de tener estudios Superiores cuando se es mujer será:
P(Superiores/Hombre)=(0,059/0,4879)=0,1209
Si bien la interacción entre género y estudios superiores no es elevada si que se puede decir
que comparativamente ser hombre ayuda a tener un nivel de estudios más elevado1
1
Si bien supera con creces el propósito de este ejercicio, podemos observar que la relación (ratio) entre
probabilidades condicionadas de Hombres respecto mujeres es (
comparativa que por ser hombres tienen para tener estudios superiores.
)
que es la ventaja
(Evidentemente el sexo no explica el nivel de estudios alcanzado, la explicación deviene en las
diferencias sociales que penalizan relativamente el acceso a las mujeres a estudios superiores).
Vamos ahora a explorar otra relación entre variables. Estatus Social y Posicionamiento
ideológico. La variable Estatus Social se encuentra al final del fichero y es una variable
generada por el propio CIS a partir de las preguntas de ocupación y de estudios. La variable de
posicionamiento ideológico vamos a construirla a partir de la pregunta 27.
Dicha pregunta posiciona entre la Izquierda y la Derecha a los entrevistados. Es una variable de
intervalo. Podemos obtener la distribución de frecuencias de dicha variable:
En este caso queremos transformar esta variable en tres categorías: Izquierda, Centro y
Derecha. De forma que
Valores entre 1 y 3 sean Izquierda
Valores entre 4 y 7 sean Centro
Valores entre 8 y 10 sean Derecha
Para realizar la transformación podemos ejecutar en el fichero de sintaxis la siguiente
secuencia de comandos:
****Generación de la variable ideología política IDEO mediante agrupamiento de P27.
****Con COMPUTE copiamos la variable.
****Con recode recodificamos los valores.
****Declaramos valores missing con MISSING VALUE y etiquetamos la variable IDEO con VALUE LABELS.
COMPUTE IDEO=P27.
RECODE IDEO (1 THRU 3=1) (4 THRU 7=2) (8 THRU 10=3).
MISSING VALUES IDEO (98,99).
VARIABLE LABELS IDEO “Posición Ideológica”
VALUE LABELS IDEO 1 “Izquierda” 2 “Centro” 3 “Derecha”.
De los comandos anteriores el único nuevo es RECODE. Se ha utilizado de una forma simple,
en la que indicamos el nombre de variable a recodificar IDEO y mediante la expresión THRU
indicamos que Desde 1 a 3, ahora se convierten en código 1; desde 4 a 7 en código 2...
P27
IDEO
THRU
1
2
3
4
5
6
7
8
9
10
98
99
1
2
3
Missing
La variable de salida tendrá 3 códigos. Lo anterior podemos hacerlo también desde el menú de
PSPP, accediendo en la barra superior a Transformar, Recodificar en Variables Diferentes
Seleccionamos la variable P27, luego pulsamos el botón valores viejos y nuevos
Vamos rellenando en la opción intervalo, los valores viejos, e indicando el valor nuevo,
pulsamos Añadir y repetimos la veces que sean necesarias.
Para introducir los valores perdidos (98 y 99) en Nuevo Valor seleccionamos la opción Perdido
por el Sistema
Después de Añadir pulsamos Continuar, al volver a la pantalla anterior escribimos el nuevo
nombre de variable IDEO y su etiqueta y pulsamos el botón de Cambio
Después finalmente Aceptar. Si elegimos esta opción, deberemos etiquetar los valores de la
nueva variable, accediendo a la misma por la pestaña de Vista de Variables, abajo de la rejilla
de datos, y seleccionando la variable introducirlos manualmente:
Después de Añadir las veces necesarias, pulsamos Aceptar.
(Recuerde, después de ejecutar transformaciones en el conjunto de datos conviene que grabe
el fichero activo (SAV) para conservar estas transformaciones para próximas sesiones).
Ahora estamos en condiciones de trabajar con la variable STATUS e IDEO. Vamos a comenzar
solicitando la distribución de frecuencias así como la tabla con el cruce de ESTATUS e IDEO.
Los resultados anteriores nos permiten obtener las probabilidades de cada suceso:
Izquierda
Centro
Derecha
TOTAL
0,2613
0,6373
0,1014
1
Clase alta/media-alta
Nuevas clases medias
Viejas clases medias
Obreros cualificados
Obreros no cualificados
No consta
TOTAL
0,1867
0,1992
0,1657
0,3000
0,1282
0,0202
1
A partir de los resultados anteriores podemos construir la tabla, bajo el supuesto de
independencia. Es decir el producto de las probabilidades de cada suceso:
Clase alta/media-alta
Nuevas clases medias
Viejas clases medias
Obreros cualificados
Obreros no cualificados
No consta
Izquierda
0,049
0,052
0,043
0,078
0,033
0,005
Centro
Derecha
0,120
0,127
0,106
0,191
0,082
0,013
0,019
0,020
0,017
0,030
0,013
0,002
Las probabilidades observadas empíricamente, las obtenemos de la encuesta:
Clase alta/media-alta
Nuevas clases medias
Viejas clases medias
Obreros cualificados
Obreros no cualificados
No consta
Izquierda
0,062
0,052
0,035
0,085
0,023
0,005
Centro
Derecha
0,122
0,140
0,100
0,178
0,085
0,010
0,017
0,020
0,028
0,021
0,013
0,003
Podemos ahora preguntarnos el efecto que tiene la clase social en la ideología. Por ejemplo
respecto a la Derecha. Para ello calculamos las probabilidades condicionadas de declararse de
izquierda por clase social. Por ejemplo en el caso de la “Clase alta/Media-alta”
P( S(Alta)  S(Derecha) ) = P(Alta) P(Derecha/Alta)
En nuestro caso: 0,017=0,1867 x P(Derecha/Alta)
P(Derecha/Alta)=0,017/0,1867=0,091
Procediendo de forma idéntica obtenemos las demás:
Clase alta/media-alta
Nuevas clases medias
Viejas clases medias
Obreros cualificados
Obreros no cualificados
No consta
Derecha
0,091
0,100
0,169
0,070
0,101
0,149
Como podemos observar las Viejas clases medias tienen una mayor propensión a posicionarse
en la derecha mientras que los Obreros Cualificados son el grupo que menos lo hace. La
relación (ratio) es que las Viejas Clases Medias lo hacen (
Cualificados.
)
mayor que los Obreros
Descargar