Case 1: Relación entre publicidad y ventas En el fichero Publicidad.xls encontramos las siguientes dos variables que hacen relación a la publicidad y las ventas de una conocida marca de detergente: GRP: índices de audiencia televisiva Mercado/Baseline: cuota de mercado de la Empresa Previo : Pequeña introducción teórica La relación entre publicidad y ventas es muy controvertida. Muchos estudios han pretendido captar si existe una relación causal entre publicidad y ventas (teorías de del efecto olvido y de fidelidad, por ejemplo). Y los resultados son diversos. A veces hay relación, a veces no hay relación, a veces la relación no se considera causal, sino espúrea. En este caso vamos a ver, con datos de la campaña publicitaria de un detergente Marsella durante 174 semanas, si existe relación entre la publicidad (medida en GRP) y las ventas (medida en su cuota de mercado respecto a los jabones del mismo tipo). Un ejemplo reciente de estudio empírico es: http://jetems.scholarlinkresearch.org/articles/The%20Association%20between%20Adve rtising%20and%20Sales%20Volume.%20A%20Case%20Study%20of%20Nigerian%20 Bottling%20Company%20Plc.pdfn ¿Qué tipo de relación tenemos, con nuestros datos entre Publicidad y Ventas? a) Utiliza la herramienta de Google correlate con el término “Publicidad” y opina sobre la asociación de esta con palabras como ventas, cuota de mercado o similares. b) Realiza una estadística descriptiva completa de ambas variables: opina acerca de su centralización, distribución y su dispersión. c) Realiza un gráfico de cada serie por separado. ¿Te parecen asociadas? d) Realiza un análisis de asociación completo: gráfico de dispersión, covarianza, correlación y análisis de regresión simple entre ambas variables. Comenta los resultados. e) ¿Se te ocurre alguna explicación para los resultados? Case 2: Precios de la vivienda Previo: Pequeña introducción teórica: PRECIOS HEDÓNICOS La demanda de un bien heterogéneo y su precio se puede considerar como una demanda de las características heterogéneas que posee. Unidades del mismo precio pueden ser muy distintas a ojos del consumidor. Por sus características físicas o por su ubicación. El activo residencial es único. El problema de la elección del individuo(maximización de utilidad) se traslada al análisis de las características que más valora el individuo. La técnica de hedónica intenta descubrir todos los atributos del bien que explican su precio, discriminando la importancia cuantitativa de cada uno de ellos, determinando, así, el precio implícito de cada característica del bien(la disposición a pagar de cada persona pro una unidad adicional de ese atributo). P=f(Z1,Z2); donde Z1 son características físicas y Z2 del entorno. Si nos planteamos una forma lineal estamos ante un modelo de regresión múltiple donde el coeficiente beta nos indica el precio implícito de la característica. Crítica: La especificación lineal implica precios implícitos constantes independientes del nivel de partida. Esto implicaría que, por ejemplo, que un año más de antigüedad se valora igual si el piso tiene 0 años que 200. Solución: especificación logarítmica que además me ofrece una interpretación en términos de elasticidad. Datos: un conjunto de vivienda de BCN tasadas (precio por metro cuadrado) en el periodo 1999-2001 con sus características físicas y la zona de la cual proceden(o los años de escolaridad medios de los individuos que pertenecen a la misma). En concreto 58671 En nuestro caso Z1 incluye superficie, edad, años transcurridos desde última reforma, planta, estado de conservación, disponibilidad de ascensor, de calefacción, condición de exterior. Por otro lado Z2 incluye los años de escolaridad promedio de los habitantes de cada una de las 248 zonas de Barcelona. La definición de las variables utilizadas es la siguiente: - vtot: precio de la vivienda Si ordenas por el identificador de cada vivienda(“identdef”) y trabajas un con una muestra de unas 600 viviendas, he probado que los resultados cualitativamente son idénticos. Seguramente incluso con menos valdría este “muestreo aleatorio”. Lo digo por si no preferimos trabajar en clase con una muestra diferente a la de la práctica 1 - Superf: superficie. m2 de superficie construida - Edad: la variable que hace referencia la antigüedad del inmueble - Estado: estado de conservación de la vivienda: definido en cinco valores: muy malo(1), malo(2), normal(3), bueno(4) y muy bueno(5). - Extint: variable binària que caracteriza la condición de exterior o interior del inmueble. - Ascensor: variable binària, 1 ó 0 según si el inmueble dispone o no de ascensor. - Banys: número de baños de la vivienda - Dorm: número de habitaciones de la vivienda - Estudis1: 248 medias de los años de estudios de los habitantes de las 248 zonas que clasifican geográficamente Barcelona(zrpvell). Se utiliza como “Proxy” de la variable zona. En el link siguiente puedes observar las implicaciones en términos “comerciales” de no utilizar un modelo de precios hedónicos: http://www.econ.upf.edu/~raya/ARTICULOSDIVULGATIVOS/leconomic.pdf o bien http://www.econ.upf.edu/~raya/ARTICULOSDIVULGATIVOS/LV_Raya1811.pdf Con los datos del fichero habitatge_new.sav: 1. Genera la variable precio por metro cuadrado de la vivienda 2. Especifica un modelo de precios hedónicos (en logaritmos). Notar la importancia de controlar por otras variables o de incluir más variables explicativas. Empezar por un modelo de regresión simple entre el precio por metro cuadrado y la superficie. Comentar el cambio si se incorpora simplemente un control por la zona(log(estudis1)) y uno por la edad(log(edad)). Incorpora también una dummy para cada uno de los años de la muestra. Comenta los resultados ***Recuerda que en la especificación en logaritmos, los coeficientes se interpretan en términos de elasticidades (En que % aumenta y al aumenta X en B%) 3. Mejora tu modelo. Incorpora variables ficticias. Interpreta los resultados. 4. Incorporar un término de interacción entre una Dummy anual y otra variable y comentar su coeficiente. Por ejemplo, utiliza un término de interacción para saber si el efecto del ascensor es mayor en el 2001. 5. Comentar el coeficiente de determinación y el corregido. Observar como si en la regresión sencilla: log(pmq) c log(superf) log(edad) log(estudis1) añadimos “extint”, aunque no es significativa, aumenta el coeficiente de determinación pero no el corregido. 6. Comentar la significación conjunta, y contrastar en la regresión del punto 4 si se valora igual el ascensor que tener una vivienda con estado normal (respecto a un estado muy malo) y si el efecto de un año de antigüedad es el mismo que el de un metro cuadrado. Ambas a la vez. 7. Dividir la muestra en dos: una para las viviendas pequeñas (por ejemplo menores de 60 m2 y otra para las viviendas mayores de 60m2). Realizar un contraste de cambio estructural. Case 3: rentabilidad de la educación Previo teórico: una de las preguntas que cualquier estudiante de Marketing Internacional debe hacerse es, ¿cuál es la rentabilidad futura de un año de estudios? La rentabilidad de un año de estudios es lo que aumentará tu salario por año académico. Que las personas obtengan una rentabilidad adecuada por sus estudios es beneficioso para cualquier economía. Lo contrario, que las personas ocupen puestos de trabajo de nivel inferior al que le corresponde, es un problema muy importante para una economía. Se llama sobrecualificación. El porcentaje de sobrecualificados (y, por tanto, de individuos que seguro que obtienen una baja rentabilidad por sus estudios) es altísimo en España. Y es el fruto de economía que ha estado basada durante muchos años en sectores poco productivos como, principalmente, el sector de la construcción. Una economía con muchos sobrecualificados es una economía que no asigna bien sus recursos, que tiene a graduados descontentos, que tiene un mercado de trabajo que no funciona, un modelo de crecimiento cortoplacista y, sin embargo, un crecimiento a largo plazo muy reducido, pues el crecimiento a largo plazo de cualquier economía está muy asociado a su capital humano. Diversos links divulgativos relacionados: Acerca de los recursos malgastados en vivienda: http://www.econ.upf.edu/~raya/ARTICULOSDIVULGATIVOS/RAYAEP.pdf El problema de la sobrecualificación en España http://www.econ.upf.edu/~raya/DOCENCIA/ESTADISTICAI/educacion.pdf Responde, utilizando, a partir del apartado b, los datos del fichero epfbis.xls: a) Con los datos de los dos casos anteriores, opina intuitivamente acerca de los problemas de regresión en cada uno de los casos anteriores b) Obtén la especificación de básica para medir la rentabilidad de la educación (Mincer, 1974) suele suponer que el efecto de un año de educación es constante. Añade la experiencia. ¿Cómo añadirías el hecho de que la experiencia suele ser más importante los primeros años de la vida laboral? ¿Cómo añadirías que el efecto de un año de la educación fuese distinto según el número de años de experiencia que tienes?Estima dicho modelo c) Estima un modelo donde se relaje el supuesto de que un año de educación no sea constante y, almenos, sea distinto, según si es un año de educación primaria, secundaria o universitaria. d) ¿Era cierto el supuesto inicial? e) Opina acerca de los problemas de este modelo de regresión. En particular de la multicolinealidad, la autocorrelación y la endogeneidad. Caso 4: Didacmanía Una empresa de juguetería didáctica pretende analizar los datos de su página web (que tiene un catálogo de productos pero no permite la compra online). En el archivo Didacmania.xls tienes el número de visitas mensuales de los últimos 9 años (así como el número de visitas mensuales cuyo tiempo en la web fue superior al minuto). Con ellos, a) Realiza primero una estadística descriptiva: media anual, media mensual, tasa de crecimiento anual, tasa de crecimiento mensual. b) Calcula el ratio “leads” del porcentaje de clientes potenciales sobre el total de visitas. Dados nuestros datos, definimos un cliente potencial como aquél que permanece en la web más de un minuto. ¿Cómo ha evolucionado dicho ratio? ¿Es mejor en algunos meses que en otros? c) Realiza el análisis de descomposición estacional X11. Comenta los resultados. ¿Cuál podría ser una predicción “naïf” para tu próximo dato? d) En un párrafo realiza una diagnosis de la situación de la página web de la compañía. Caso 5: series temporales a) Identifica, estima y valida las series del fichero simul.xls que no se hayan utilizado en clase.