Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes MANUAL PARA EL USO DE SPSS INTRODUCCIÓN El propósito de este manual, es ilustrar con un ejemplo cómo generar tablas de frecuencia, tablas de contingencia, cálculos de medias, así como la generación de los estadísticos de prueba que permitan validar estos resultados. EJEMPLO Se aplicó un cuestionario a jóvenes con el objetivo de caracterizar sus hábitos de lectura. Las preguntas del cuestionario (acá se ilustran algunas) abordaban las siguientes preguntas: 1- ¿Qué es lo que más te gusta leer? 2- ¿Te gusta leer obras literarias? 3- ¿Qué tipo de obras literarias te gusta leer? 4- Califica en una escala del 1 al 5 la importancia que tiene cada uno de los siguientes factores a la hora de comprar un libro: a) precio del libro, b) habilidades del autor para narrar la historia, c) habilidades del autor para describir personajes, d) que la obra me permita aprender nuevo vocabulario, e) que la complejidad de la obra me represente un desafío, f) que la síntesis en la contraportada me motive a comprar un libro. 5- ¿Por qué no lees obras literarias? 6- Datos generales (edad, sexo, ocupación) Para analizar las respuestas de los encuestados, haremos las pruebas de hipótesis. ANTEDECENTES Se trabajará con la base de datos de hábitos de lectura. El editor de datos de SPSS tiene dos vistas: La vista de variables: donde se registra cada pregunta, con sus respectivas preguntas, categorías, valores perdidos. La base de datos de los hábitos de lectura tiene la siguiente apariencia: 1 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 2 La vista de datos contiene las respuestas para cada variable Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes TABLA DE CONTINGENCIA Nos interesa conocer si los hábitos de lectura difieren en los hombres de las mujeres. Para eso se van a contrastar dos preguntas: ¿Qué es lo que más te gusta leer?, y Sexo, esto con la finalidad si el sexo y los hábitos de lectura tienen alguna relación. Paso 1. Plantear hipótesis H0: No hay relación entre el sexo y los hábitos de lectura H1: Si hay relación entre el sexo y los hábitos de lectura Paso 2. Estadístico de prueba Chi Cuadrada, para medir la relación entre las dos variables V de Cramer para medir la fuerza de asociación entre las dos variables Paso 3. Regla de decisión En este caso es preciso calcular el valor crítico, que representa el límite entre la región de aceptación y la región de rechazo. Se trabajará con la probabilidad asociada al estadístico de prueba. Bajo la región de aceptación están las probabilidades mayores al nivel de significancia = 0.05 Bajo la región de rechazo están las probabilidades menores o iguales al nivel de significancia = 0.05 Paso 4. Calcular Chi y V de Cramer Clic en analizar 3 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes Clic en estadísticos descriptivos Clic en tablas de contingencia 4 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes Le aparecerá un cuadro de diálogo. En el cuadro de diálogo. En la izquierda tenemos tres casillas. En la casilla fila traslade la variable sexo y en la casilla columna la variable ¿Qué te gusta leer más? 5 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 6 En el mismo cuadro de diálogo, seleccione mostrar gráficos de barras agrupadas y suprimir tablas. Clic en estadísticos, clic en Chi Cuadrada y PHI Y V DE CRAMER, Clic en continuar, y clic en aceptar. Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 7 En el archivo resultado aparecerán los siguientes cuadros. Pruebas de chi-cuadrado Chi-cuadrado de Pearson Razón de v erosimilitudes Asociación lineal por lineal N de casos v álidos Valor 7.164a 9.250 .076 7 7 Sig. asintótica (bilateral) .412 .235 1 .783 gl 43 a. 14 casillas (87. 5%) tienen una f recuencia esperada inf erior a 5. La f recuencia mínima esperada es .26. Paso 5. Tomar la decisión. En este caso, puede observarse que el estadístico asociado a CHI CUADRADA da 0.412, es decir, mayor a 0.05, es decir, que se acepta la hipótesis nula que dice que no hay relación entre el sexo y lo que más le gusta leer. El resultado es evidente en la tabla de frecuencias. Paso 6. Tomar la decisión en términos del problema de investigación de mercados Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes En este caso, el sexo no es un factor determinante en las preferencias de compra. 8 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes PRUEBAS PARAMÉTRICAS PRUEBA T PARA MUESTRAS INDEPENDIENTES La prueba t para muestras independientes se hace para comparar medias de dos muestras diferentes. Podemos preguntar si el gasto promedio de los hombres difiere del gasto promedio de las mujeres. En el caso de la encuesta sobre hábitos de lectura, podemos hacer las siguientes comparaciones: Comparar la calificación promedio que los hombres dan al precio para tomar sus decisiones de compra con la que le dan las mujeres Comparar la calificación promedio que le dan los hombres al resumen en la contraportada del libro para sentirse motivados a comprarlo de la calificación promedio que le dan las mujeres. Estas comparaciones pueden hacerse solamente entre dos muestras, es decir, solamente para comparar dos medias. Paso 1. Plantear hipótesis H0: la calificación promedio que los hombres le dan al factor de resumen en la contra portada, no difiere de la calificación que le dan los hombres. H1: la calificación promedio que los hombres le dan al factor de resumen en la contra portada, difiere de la calificación que le dan los hombres. H0: 1=2 H1: 12 Paso 2. Elegir el estadístico de prueba Se trabajará con el valor de t en vista que no se conoce la desviación estándar de la población. Paso 3. Regla de decisión Se trabajará con la probabilidad asociada al estadístico t. Un valor de significancia alfa de 0.05. Una prueba de dos colas. 9 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes Paso 4. Calcular t y la probabilidad asociada a t 1- Clic en analizar 2- Clic en comparar media 3- Clic en prueba t para muestras independientes, tal y como aparece encerrado en el círculo. 10 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 11 Como puede observarse, aparece un cuadro de diálogo. En el centro aparece la casilla contrastar variables, en la cual se introduce la variable que queremos comparar, en este caso, las únicas variables que podemos comparar son las de categorías de escala, ilustradas por una regla amarilla a la izquierda de la variable que inician con la palabra califica. Traslade la variable de escala que quiera contrastar a la casilla contrastar variables. En este caso hemos elegido la variable sombreada, una vez seleccionada se despliega la descripción de toda la variable. Bien ahora está todo listo para que haga el paso 4: 4- Traslade la variable seleccionada a la casilla contrastar variables. Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 5- Traslade la varible sexo en la casilla variable de agrupación. La variable de agrupació es las que nos permitira agrupar la media de los hombres y la media de las mujeres. NOTE QUE LA CASILLA DEFINIR GRUPOS ESTÁ HABILITADA AHORA. 6- CLIC CASILLA GRUPOS. EN LA DEFINIR 12 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes NOTE QUE AHORA LE APARECE OTRO CUA DRO DE DIALOGO. Digite en grupo 1, el numero 1 y en grupo 2 el número 2, clic en continuar. 13 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 14 Estadísticos de grupo Calif ica en una escala del 1 al 5 la importancia que tiene para ti cada uno de los siguientes f actores a la hora de comprar un libro [que la síntesis de la contraportada me motiv e a comprar el libro] sexo M N Media Desv iación típ. Error típ. de la media 24 4.5833 .58359 .11913 7 3.7143 1.38013 .52164 H Puede verse que para las mujeres, el resumen en la contra portada es más importante que para las hombres. Sin embargo, hay que analizar que comparar la probabiidad asociada al estadístico t con el valor de alfa=0.05 Tenemos lo siguiente, para probar si las medias difieren o no, necesitamos saber si usamos la t asumiendo varianzas iguales, o asumiendo que las varianzas no son iguales. Note que en la primera fila, el valor de sig., la probabilidad asociada al estadístico f, es menor que 0.05. Entonces quiere decir que cae en la zona de rechazo, se rechaza la hipótesis nula que las varianzas son iguales. Nos trasladamos a la fila 2, donde se asume que las varianzas no son iguales, y trabajamos con el valor de t en la cuarta columna. En la sexta columna, el valor de la probabilidad asociada a t es mayor que alfa, lo que quiere decir que se acepta la hipótesis nula: Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes Paso 5. Toma la decisión: no hay relación entre el sexo y el uso del resumen en la contraportada como factor de decisión de compra. Paso 6. Tomar la decisión en términos del problema de investigación de mercados: el sexo no es determinante para el factor de decisión de compra: resumen en la contraportada. PRUEBA T PARA MUESTRAS RELACIONADAS Se desea conocer si difiere la calificación promedio dada por los encuestados hacia el atributo: que la complejidad de la obra represente un desafío de la calificación dada a que la lectura sea ligera, esto con el objetivo de conocer cuál es el atributo más importante como factor de decisión de compra. La prueba t para muestra relacionada se hace para comparar medias para dos categorías diferentes EJEMPLO PASO 1. PLANTEAR HIPÓTESIS Hipótesis nula: La calificación promedio de importancia dada por los encuestados al atributo: que la complejidad de la obra representa un desafío no difiere de la calificación dada al atributo que la lectura sea ligera. Hipótesis alternativa: La calificación promedio de importancia dada por los encuestados al atributo: que la complejidad de la obra representa un desafío no difiere de la calificación dada al atributo que la lectura sea ligera. PASO 2. ESTADÍSTICO DE PRUEBA Se trabajará con la prueba t. PASO 3. REGLA DE DECISIÓN Se trabajará con las probabilidades bajo la curva de distribución t. La región de rechazo representa las probabilidades menores o iguales al nivel de significancia = 0.05 La región de aceptación representa las probabilidades mayores a 0.05. PASO 4. CALCULAR LOS ESTADÍSTICOS USANDO EL EDITOR DE DATOS SPSS 15 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes Primer paso. Abra la base de datos Segundo paso. Ubíquese en la vista de datos Tercer paso. Clic en analizar Cuarto paso. Clic en comparar medias, y luego en prueba t para muestras relacionadas Quinto paso. Aparece el siguiente cuadro de diálogo. 16 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 17 La casilla seleccionada en un círculo, es donde se trasladan las variables que se van a relacionar. Sexto paso. Seleccione al mismo tiempo las dos variables que quiera relacionar Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 18 SEPTIMO PASO. CUANDO LAS DOS VARIABLES ESTÉN SOMBREADAS, ENTONCES TRASLADE LAS VARIABLES A LA CASILLA VARIABLES RELACIONADAS. Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 19 OCTAVO PASO. CLIC EN ACEPTAR. RESULTADOS Estadísticos de muestras relacionadas Media Par 1 Calif ica en una escala del 1 al 5 la importancia que tiene para ti cada uno de los siguient es f act ores a la hora de comprar un libro [ que la complejidad de la obra represente un desaf ío] Calif ica en una escala del 1 al 5 la importancia que tiene para ti cada uno de los siguient es f act ores a la hora de comprar un libro [ que la lectura sea ligera] Desv iación típ. N Error típ. de la media 3.3548 31 1.14159 .20504 3.1290 31 1.11779 .20076 ANÁLISIS DEL RESULTADO: EN EL PRIMER GRÁFICO, LA IMPORTANCIA QUE LA OBRA REPRESENTE UN DESAFÍO TIENE UN NIVEL DE 3.3548 Y LA IMPORTANCIA DE QUE LA LECTURA SEA LIGERA FUE 3.1290. HAY UNA DIFERENCIA DE 3.3548 – 3.1290 = 0.2258, UNA DIFERENCIA MÍNIMA. ¿DIFIEREN AMBOS PROMEDIOS? Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 20 ESTE FRAGMENTO DEL RESULTADO REFLEJA LA DIFERENCIA ENTRE LAS MEDIAS RELACIONADAS DE 0.22581. PASO 5. TOMAR LA DECISIÓN: EL VALOR DE SIG ES 0.428, MAYOR A 0.05, CAE EN LA REGIÓN DE ACEPTACIÓN, PUEDE COMPROBARSE ENTONCES LA HIPÓTESIS NULA, QUE NO HAY DIFERENCIAS ENTRE AMBOS PROMEDIOS. PASO 6. TOMAR LA DECISIÓN EN TÉRMINOS DEL PROBLEMA DE INVESTIGACIÓN DE MERCADOS. Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes PRUEBA DE VARIANZA (ANOVA DE UN FACTOR) la comparación de medias, usando la prueba t para muestras independientes y relacionadas, tienen una limitante, permiten comprar solamente dos medias. El promedio de calificaciones de los hombres con el promedio de calificaciones de las mujeres. El promedio de calificaciones para un atributo del promedio de calificaciones para otro atributo. Pero, ¿Qué pasa si queremos comparar el promedio de calificaciones dada por los estudiantes, con el de los profesionales y los desempleados? ¿Los clientes moderados, los frecuentes y los esporádicos? El análisis de varianza o prueba ANOVA permite hacer estas comparaciones. EJEMPLO Se desea saber si difieren los encuestados con edades entre 16 – 20, 21 – 25, 26- 30 y mayores de 30 en la importancia que le dan a que la obra generen un desafío. Puede ser que la edad sea un determinante a la hora de elegir este atributo como criterio de decisión de compra. O puede ser que no. por eso es preciso genera la información con el editor de datos SPSS. PASO 1. HIPOTESIS Hipótesis nula: 1=2=3=4 Hipótesis nula: 1234 PASO 2. Estadístico de prueba Se trabaja con el estadístico F, nivel de significancia: 0.05 PASO 3. REGLA DE DECISIÓN Si la probabilidad asociada al estadístico F es mayor que 0.05, el valor F cae en la zona de aceptación, y se acepta la hipótesis nula. Si la probabilidad asociada al estadístico F es menor o igual a 0.05. cae en la zona de rechazo, se rechaza la hipótesis nula. 21 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes PASO 4. CALCULAR EL ESTADÍSTICO Primer paso. Clic en analizar Paso 2. Clic en comparar medias y clic en ANOVA DE UN FACTOR PASO 3. EN EL CUADRO DE DIÁLOGO QUE APARECE, SELECCIONE LA VARIABLE EDAD Y TRASLADELA A LA CASILLA FACTOR 22 Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 23 PASO 4. SELECCIONE LA VARIABLE QUE LA COMPLEJIDAD DE LA OBRA REPRESENTE UN DESAFÍO A LA CASILLA DEPENDIENTE. Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes PASO 5. CLIC EN OPCIONES Y LUEGO CLIC EN DESCRIPTIVOS 24 PASO 6. CLIC EN CONTINUAR Y CLIC EN ACEPTAR RESULTADO Descriptivos Calif ica en una escala del 1 al 5 la import ancia que t iene para ti cada uno de los siguientes f actores a la hora de comprar un libro [que la complejidad de la obra represente un desaf ío] N 16 - 20 21 - 25 26 - 30 MAYOR DE 30 Total 22 7 1 1 31 Media 3.3182 3.5714 1.0000 5.0000 3.3548 Desv iación típica 1.08612 .97590 . . 1.14159 Error típico .23156 .36886 . . .20504 Interv alo de conf ianza para la media al 95% Límite Límite inf erior superior 2.8366 3.7997 2.6689 4.4740 . . . . 2.9361 3.7736 Mínimo 1.00 2.00 1.00 5.00 1.00 Máximo 5.00 5.00 1.00 5.00 5.00 Para los encuestados entre las edades de 16 y 20, la complejidad del libro como desafío tiene una importancia promedio de 3.3182, para los encuestados entre 21 y 25, tiene una calificación promedio de 3.57, para los encuestados de 26 a 30, 1 y para los mayores de 30 de 5, Y el promedio general es de 3.3548, es decir un bajo nivel de imortancia. ¿difieren estos promedios? Pruebas de Hipótesis usando SPSS Elaborado por Octavio Alvarado Cervantes 25 ANOVA Calif ica en una escala del 1 al 5 la import ancia que t iene para ti cada uno de los siguientes f actores a la hora de comprar un libro [que la complejidad de la obra represente un desaf ío] Inter-grupos Intra-grupos Total Suma de cuadrados 8.610 30.487 39.097 gl 3 27 30 Media cuadrática 2.870 1.129 F 2.542 Sig. .077 Paso 5. Tomar la decisión: el valor de sig., es probabilidad asociada a F es 0.077, mayor a 0.05, lo que quiere decir que las medias no difieren. Se acepta entonces la hipótesis nula, porque cae F en la zona de aceptación. Paso 6. Toma la decisión en los términos del problema de investigación de mercados: entre los hábitos de lectura, puede decirse que para los jóvenes, sin importar la edad, no es tan importante que el libro sea complejo o no a la hora de tomar su decisión de compra.