Universidad de San n Andrés Departamento de EEconomía Licenciaatura de Ecconomía ¿¿Es re ealme ente ú útil Go oogle e Adw words?? : u un esttudio sobre la relació ón pu ubliciidad‐vventaas en una e e‐com mmercce Auto or: Jaure eguiberryy, Domin nique Mentorr: Svarc, Marcela Buenos A Aires, Argentina. 2015 ¿Es realmente útil Google Adwords?: Un estudio sobre la relación publicidad-ventas en una e-commerce Autora: Dominique Jaureguiberry Mentora: Marcela Svarc Este trabajo no habría sido finalizado sin el apoyo de Marcela Svarc. También quiero agradecer a mi familia porque fueron mi sostén durante todo este proceso. Mi gran agradecimiento al aporte de Agustín Gold. 2 Abstract La relación entre publicidad y ventas ha sido abordada por muchos autores, pero no muchos han abordado esta relación a partir de la existencia de Internet. Google Adwords es el sistema para publicitar en Google y en muchas páginas web. Esto suena sumamente útil si tenemos en cuenta que se ha vuelto una práctica habitual para cualquier consumidor consultar en Internet antes de realizar una compra. Además, Google Adwords ofrece un sistema de cobranzas a través de subastas que ha resultado muy novedoso para el mercado publicitario. Ahora, ¿realmente sirve Google Adwords? O, dicho de otra forma: ¿cuál es la influencia que tiene Adwords sobre las ventas de una compañía? El objetivo de este trabajo es estudiar el impacto de Google Adwords sobre las ventas de una empresa de e-commerce, que realiza solo campañas online. Esto permitirá explorar la relación entre publicidad y ventas aislada de otras influencias del mercado y circunscripto solo al espacio virtual. Se utilizarán métodos de análisis de la Economía como modelos de función de transferencia con el objetivo de modelar el comportamiento conjunto de las dos series (Adwords y Ventas). La evidencia muestra que Adwords tiene impacto sobre las ventas solo si la inversión se mantiene constante a lo largo del tiempo. Realizar una inversión puntual en Adwords no tendrá un efecto notorio sobre las ventas. Este trabajo puede ser utilizado en el futuro tanto por economistas que intenten abordar la relación ventas – publicidad, como así también por administradores de empresas que deben tomar la decisión de invertir o no en Google Adwords. 3 ÍNDICE 1. Introducción ......................................................................................................... 5 2. La publicidad en Google y el comercio eléctrónico en Argentina (Antes de meternos en el modelo) ........................................................................................... 6 2.1 Google Adwords: .................................................................................................... 6 2.2 Cómo Internet revolucionó al mercado publicitario (ZMOT) ................................. 7 2.3 Los números del comercio electrónico en la Argentina ........................................ 8 3. El modelo: estimación del impacto de la publicidad en las ventas .......................... 9 3.1 Literatura previa ..................................................................................................... 9 3.2 El caso analizado (con sus limitaciones) ............................................................... 10 3.3 El modelo: la función de transferencia y estimación ........................................... 12 3.3.1 Análisis exploratorio de las series univariadas .............................................. 12 a. Serie temporal Adwords ........................................................................... 12 b. Serie temporal Ventas .............................................................................. 16 3.3.2 Análisis exploratorio conjunto de las series Adwords y Ventas .................... 19 3.3.3 Modelo: función de transferencia ................................................................. 19 3.4 Resultados ............................................................................................................ 24 4. Conclusiones ...................................................................................................... 26 5. Apendice: Rutina en R ......................................................................................... 28 6 Bibliografía .......................................................................................................... 31 4 1. INTRODUCCIÓN (profundización del Abstract) Internet ha revolucionado el mundo de la publicidad. Antes de la existencia de Internet, muchos autores alegaban que la publicidad era una gran fuente de información y que disminuía los costos de búsqueda de los consumidores (Kaldor, 1950). Hoy dicho propósito es provisto por Internet y por sus buscadores. El objetivo de este trabajo es esclarecer el impacto que tienen los costos publicitarios sobre las ventas de una compañía que realiza toda su actividad comercial en Internet. Se quiere estudiar cuál es la importancia de Adwords (el sistema para publicitar de Google) sobre las ventas de una e-commerce. Para ello se adoptará el modelo de funciones de transferencias, cuya metodología es desarrollada por Enders (1995) y Shumway Stoffer (2011). Los trabajos previos que estudiaban la relación publicidad – ventas, como el de Clarke (1976) y el de Hanssens (1980), no contemplaban la existencia de Internet. Elegimos el sistema de Google para publicitar porque es el principal buscador y la puerta de entrada a Internet. Podríamos elegir también el sistema de Facebook y de otros sitios, pero hay que tener en cuenta que Google tiene la mayor cantidad de visitantes únicos en Latinoamérica (Comscore, El Futuro Digital Latinoamérica 2013). Según el último informe de Comscore para la región, los sitios de Google han llegado a tener en Latinoamérica más de 141 millones de visitantes únicos. En el segundo capítulo se explicará brevemente las innovaciones introducidas por Google y Google Adwords no solo en la industria de la publicidad, sino también en el consumo a nivel general. Además se presentarán las estadísticas de comercio electrónico en Argentina. En el tercer capítulo se explorará sobre la metodología para lograr los objetivos propuestos por este trabajo. Se tendrán en cuenta las recomendaciones de la literatura previa, y partir de allí, se construirá un modelo empírico de funciones de transferencia que ajuste adecuadamente a los datos obtenidos de una compañía en particular. Finalmente, en el último capítulo se describirá las conclusiones del trabajo, qué relación hay entre las conclusiones y las recomendaciones de la literatura previa, las dificultades halladas durante el estudio, y los puntos que pueden incluirse en la agenda de futuras investigaciones. Los detalles técnicos y rutinas de R se encuentran en el Apéndice. 5 2. LA PUBLICIDAD EN GOOGLE Y EL COMERCIO ELÉCTRÓNICO EN ARGENTINA (ANTES DE METERNOS EN EL MODELO) 2.1 GOOGLE ADWORDS: ¿Qué es? ¿Cómo funciona? ¿Por qué es novedoso? ¿Cuáles son sus beneficios? Google Adwords es el sistema para publicitar de Google. Al realizar una búsqueda en Google, en la página de resultados aparece una lista de anuncios. Estos anuncios están relacionados no solo con las palabras buscadas sino también con la ubicación geográfica del dispositivo que realiza la búsqueda. Adwords le permite a las empresas algunos cambios novedosos: atraer a los navegantes en el momento exacto en que están realizando una búsqueda sobre un producto o un servicio; que el anuncio sea visto solo por aquellas personas que están en un lugar determinado, y que, además, las empresas puedan llevar un control riguroso de sus gastos publicitarios. A diferencia de la manera tradicional de hacer publicidad, el espacio para publicitar en Google es infinito. Tradicionalmente cuando una empresa quería publicitar en un diario, revista o cualquier medio de comunicación, el espacio para publicar el anuncio era finito y el precio del anuncio era negociado entre la empresa y el anunciante, independientemente si el anuncio era visto por un gran público o no. Es decir, el precio variaba según el tamaño que ocupaba el anuncio. El anunciante no tenía manera de medir de manera precisa quién había visto la publicidad y quién no. Google revoluciona el mercado publicitario determinando que este precio se acordará mediante una subasta entre quienes quieren publicitar, por el lado de la oferta, y mediante la cantidad de clics realizados en el anuncio, por el lado de la demanda. Para entender el proceso de publicación de una manera sencilla, Adwords subasta las “palabras claves” entre los anunciantes. Si, por ejemplo, un empresario es dueño de una pizzería en Almagro, su anuncio probablemente contendrá las palabras claves “pizza” y “almagro”, para que cuando cualquier potencial cliente esté navegando por Internet tratando de encontrar una pizzería en Almagro, el anuncio del empresario aparezca en la página de resultados de Google del navegante. Para que su anuncio aparezca primero en la lista de anuncios, el empresario tendrá que hacer la mejor oferta entre todos los anuncios que tengan las palabras claves “pizza” y “almagro”. Quien haga la segunda mejor oferta económica por estas palabras claves, aparecerá segundo en el listado de anuncios, y así sucesivamente. Si bien el proceso de subasta no es estrictamente de esta forma, ya que Google tiene en cuenta otros criterios además de la mejor oferta económica, como por ejemplo, el porcentaje de personas que, al ver el anuncio anteriormente, hicieron click en él; el proceso de publicación de Adwords se asemeja al siguiente: 1. La búsqueda José busca "delivery de pizzas" en Google. 2. Se reduce la cantidad de anuncios por palabras claves El sistema de AdWords encuentra todos los anuncios cuyas palabras clave concuerden lo máximo posible con la frase "delivery de pizzas". 3. La cantidad de anuncios se reduce todavía más por lugar geográfico 6 En ese conjunto de anuncios coincidentes, el sistema ignora los que no son aptos, por ejemplo los anuncios que se orientan a otro país o están rechazados. 4. Los anuncios se ordenan Se muestran los anuncios restantes, ordenados en la página según una combinación de importe y calidad de la oferta (a esta fórmula Google denomina "ranking del anuncio"). 5. Los anuncios aparecen en la página de resultados de Google José ve los anuncios relevantes junto con la información buscada en Google y puede hacer click sobre el anuncio que le interesó. 6. Se repite el proceso Cada vez que un usuario quiera una pizza y realice una búsqueda, se vuelve a iniciar el proceso de subasta con la posibilidad de que aparezcan resultados distintos cada vez, según la competencia que haya en ese momento. El sistema más usual para calcular los costos en Adwords (y el que se estudiará en este trabajo) es el Costo por Clic (CPC): esta opción se basa en pagar solo por los clics realizados sobre el anuncio por los navegantes. Volviendo a la subasta: el usuario de Adwords realiza una “oferta de CPC máximo” (que es equivalente a decir cuánto está dispuesto a pagar por “las palabras claves” de su anuncio) y se le cobra por cada clic que un navegante haga sobre el anuncio. Esta innovación también ha sido revolucionaria en el mercado publicitario. Uno de los grandes beneficios de Adwords es que permite tener un control más detallado de los gastos publicitarios. La página de Adwords está diseñada para que cada usuario pueda ver fácilmente cuánto cuesta cada anuncio, cada día, la cantidad de veces que el anuncio apareció en Google, la cantidad de clics en el anuncio hechos por algún navegante y muchas otras estadísticas. Si bien gran parte de la información no es sustancial para el negocio, es importante entender que la disponibilidad de datos ha aumentado enormemente para el dueño de una pyme o de cualquier persona que tenga una página de internet. 2.2 CÓMO INTERNET REVOLUCIONÓ AL MERCADO PUBLICITARIO (ZMOT) La literatura previa a Internet veía a la publicidad como una forma de proveer información sobre precios y calidad de los productos y servicios disponibles en el mercado (Kaldor, 1950). Esta teoría es totalmente cuestionada a partir del siglo XXI. Lecinsky (2011) describe los cambios en el comportamiento de los consumidores gracias a la existencia de Internet. Los consumidores hoy exploran en Internet la información que necesitan, analizan cómo los productos pueden cambiar su calidad de vida y se motivan al interactuar con otras personas. Internet se ha vuelto un gran boca en boca gigante donde toda persona puede publicar su opinión sobre un producto consumido. El modelo mental del marketing antes de Internet se ha basado, según Lecinsky, en tres momentos cruciales en la toma de decisiones: estímulo, primer momento de la verdad y segundo momento de la verdad. El estímulo se produce la primera vez que un consumidor recibe información sobre un producto, ya sea a través de una publicidad, una referencia de otra persona, etc. El primer momento de la verdad ocurre en la tienda donde se compra el producto. Allí uno puede ver el packaging, tocarlo, olerlo o evacuar las consultas sobre el producto con el vendedor, si hubiera. El segundo momento de la verdad es equivalente a la experiencia de consumir el producto. 7 Sin embargo, junto a Internet y las redes sociales, ha aparecido un nuevo momento en este modelo mental: el momento cero de la verdad (o ZMOT, por sus siglas en inglés). Este momento se basa en la información que un consumidor puede obtener sobre un producto en Internet, ya sea googleandolo, o viendo referencias del mismo en los comentarios de una página de internet, una red social, un foro, etc. Este proceso reduce la influencia de la publicidad. Las marcas no compiten solo contra otras marcas. Un momento cero de la verdad puede ser una madre buscando un remedio para su hijo en Internet en su celular mientras espera que su hijo salga del colegio, un gerente comparando precios de impresoras láser antes de acercarse a una tienda de electrodomésticos, un estudiante mirando los rankings y comentarios de un hostel de una ciudad a la que va a viajar, un fanático del ski sacando su celular para ver los videos de los skies que se quiere comprar o una persona que se está postulando para un nuevo empleo y quiere saber información sobre su entrevistador. Gracias a la masificación de los smartphones, el momento cero de la verdad se convirtió en un hábito cotidiano: ya no se aplica solo a la industria de los autos y los viajes, y no hace falta tener una computadora enfrente para buscar información en Internet; ahora se pueden buscar las reseñas de un restaurante mientras uno va camino a dicho lugar. La diferencia entonces entre search goods y experience goods (Nelson, 1970) es casi imperceptible porque hoy con entrar en un buscador o una red social, se puede saber cómo fue la experiencia de los consumidores de casi cualquier producto de consumo masivo. 2.3 LOS NÚMEROS DEL COMERCIO ELECTRÓNICO EN LA ARGENTINA El comercio electrónico en Argentina ha crecido un 48,5% solo en el año 2013, según el Estudio de Comercio Electrónico en Argentina 2013 realizado por la Cámara Argentina de Comercio Electrónico (CACE), alcanzando ventas por 24.800 millones de pesos (excluyendo IVA). Se considera “comercio electrónico” a la suma de los valores de todos los pedidos en firme realizados a través de la web, entre empresas y consumidores y entre consumidores, con independencia del medio o forma de pago, y de la forma o lugar de entrega. Según el organismo, varios elementos han conjugado para que se lograra este impresionante desarrollo de la actividad: el continuo crecimiento del número total de usuarios de Internet en el país (31,9 millones), el crecimiento sostenido de la proporción de usuarios de internet que realizan compras en línea (38,8%), el fuerte incremento de la variedad de rubros, productos y servicios ofrecidos, y asimismo incrementos en la cantidad de artículos comercializados en línea, un importante aumento de las conexiones de internet. Asimismo han crecido exponencialmente las conexiones de banda ancha móvil alcanzando los 16 millones al finalizar 2013. Adicionalmente se siguen desarrollando los accesos semipúblicos (WiFi en bares, hoteles, etc) y otras modalidades de conexión privadas y/o públicas o gratuitas. Las cifras de la institución en el año 2013 muestran un crecimiento de la relevancia de Internet en el comercio. Además de las ventas que se realizan en línea, más de un 73% de los usuarios de Internet consulta regularmente en la web para analizar sus opciones de compra en tanto en el mundo físico como online. Por último, el rubro que tiene mayor participación en las ventas electrónicas totales realizadas en el país son los pasajes y el turismo, alcanzando un 28,7% en el mismo año. 8 3. EL MODELO: ESTIMACIÓN DEL IMPACTO DE LA PUBLICIDAD EN LAS VENTAS 3.1 LITERATURA PREVIA Anteriormente se mencionó la importancia y la innovación que introdujo Google Adwords e Internet en el mercado publicitario y en los hábitos de consumo. El objetivo de este trabajo es explorar la relación entre las ventas y los costos publicitarios para determinar el impacto de los costos incurridos en Adwords sobre las ventas. Con tal fin, se estudiará una empresa de ecommerce, es decir una empresa que realiza ventas solo por Internet, dentro de Argentina. Para la construcción del modelo se han tenido en cuenta las recomendaciones de trabajos anteriores que estudian estas relaciones previos a la existencia de Internet. Clarke (1976) estudia la duración que tiene el efecto de la publicidad sobre las ventas. El autor quiere saber cuánto tiempo persiste el efecto de la publicidad. Para ello, describe seis modelos econométricos que analizan el efecto acumulativo de la publicidad. El modelo más popular es el modelo de Koyck (1954), que es un modelo polinomial basado en rezagos que pondera el efecto de las ventas pasadas (𝑦𝑡−1 ) y el efecto de la publicidad (𝑥𝑡 ) sobre las ventas actuales (𝑦𝑡 ), es decir: 𝑦𝑡 = 𝑎0 + 𝜆𝑦𝑡−1 + 𝑏0 𝑥𝑡 + 𝑒𝑡 , donde 𝑒𝑡 es ruido blanco. El modelo de Koyck, es un caso particular del modelo que se utilizará en este trabajo, dado que este trabajo también captura el componente temporal de cada una de las variables, siendo la venta y la publicidad dos series de tiempo distintas. Clarke concluye que el intervalo en que los datos son medidos (el autor lo llama data interval) es fundamental para determinar la duración del efecto de la publicidad. Si los datos son agregados mensualmente, el efecto de la publicidad tiene una duración menor a la agregación anual. O, dicho de otra forma, la duración del efecto de la publicidad aumenta a medida que aumenta el intervalo de los datos. Para Clarke, el intervalo anual es demasiado largo ya que presenta un sesgo que no presentan intervalos menores. Otros autores también utilizaron este modelo para medir la relación entre la publicidad y las ventas, entre ellos podemos mencionar a Frances y Van Oest (2004) y Weinberg y Weiss (1982). Otro trabajo muy importante que estudia la relación publicidad - ventas es el de Hanssens (1980). El análisis utilizado por el autor es similar al utilizado en este trabajo. Él comienza realizando un análisis univariado de la serie publicidad y la serie ventas por separado, para luego realizar un análisis bivariado con ambas series. El análisis univariado de las series es prácticamente idéntico al realizado en este trabajo, dado que aplica modelos ARIMA sobre las ventas y sobre la publicidad. El análisis bivariado, en cambio, presenta algunas diferencias con nuestro trabajo, dado que se realiza un crosscorrelograma sobre cada uno de los parámetros encontrados en el paso anterior, pero no aplica la metodología rigurosa que propone el modelo de funciones de transferencia. Volviendo a este trabajo, al comenzar a construir el modelo, se ha intentado ajustar las ventas en función de la publicidad (Adwords) mediante modelos de regresión simple, que obviaban la relación temporal de los datos (Shumway y Stoffer (2011), Capítulo 2), no pudiendo hallar 9 ningún ajuste razonable. Por este motivo se decidió emplear modelos que utilizaran funciones de transferencias. Estos modelos tienen en cuenta no solo la relación temporal de cada una de las dos series de tiempo, sino también el vínculo entre las mismas. Una descripción más detallada del modelo se encuentra en el Capítulo 5.7 de Shumway y Stoffer (2011) que se especificará más adelante. La hipótesis de este trabajo parte de que los costos incurridos en Adwords van a tener un gran impacto sobre las ventas de una empresa de e-commerce. La empresa de e-commerce en cuestión realiza solo publicidad online. Es lógico suponer entonces que las ventas de la empresa dependen en una gran medida de los gastos realizados en Adwords, dado que es una de las pocas maneras en que la empresa se da a conocer entre los consumidores. Sin embargo, la bibliografía que ha tratado previamente la relación ventas – publicidad concluye en la importancia de las ventas anteriores para determinar las ventas actuales de una compañía. 3.2 EL CASO ANALIZADO (CON SUS LIMITACIONES) Estudiar la relación entre ventas y publicidad en Internet en Argentina resulta bastante novedoso dado que las empresas con estas características no tienen más de 15 años operando en el país. Los usuarios de Internet que realizan compras en línea han pasado de 300.000 en 2001 a 17 millones en 2013, según el CAECE. Según la misma institución, el crecimiento del comercio electrónico solo en el año 2013 ha sido de 48%. Una empresa de e-commerce que realiza campañas solo a través de Internet permite aislar el efecto de la publicidad sobre las ventas de otras influencias en el mercado. Tanto la publicidad como las ventas se realizan solo en Internet evitando los efectos de la visibilidad de un cartel publicitario en la calle, un aviso en un medio gráfico, etc. Toda la operación, desde el momento en que el consumidor ve el anuncio publicitario en Adwords hasta que realiza la compra, queda circunscripto al espacio de Internet. Como se ha mencionado anteriormente, Google Adwords permite llevar un registro riguroso de los usuarios que han hecho un click sobre el anuncio publicitario por día, es decir de los potenciales consumidores de la marca. Sería extremadamente útil poder comparar estos datos contra aquellos obtenidos en Google Analytics, que estudian el tráfico dentro de una página de Internet. Google Analytics permite identificar, entre otras herramientas, la cantidad de visitas por día hechas a la página, el promedio de la duración de la visita y el número de páginas vistas en cada visita. A su vez, es posible reconocer carácterísticas demógraficas del navegador de la página. En definitiva, Google Analytics posibilita conocer de manera más profunda el comportamiento y las características del consumidor. Este tipo de herramientas están en permanente evolución, por lo que se sugiere que este estudio puede llegar a ser mucho más completo dentro de unos años. González, Moral y Plaza (2012) han explorado el efecto de Google Adwords sobre el desempeño de una página web. Estos últimos datos fueron provistos por Google Analytics. Las autoras concluyen que Adwords ayuda a incrementar la visibilidad y el volumen de tráfico de una página web, pero que la calidad de la visita empeora, dado que el tiempo promedio de cada visita disminuye y decrece la cantidad de las llamadas “conversiones”. Los datos utilizados en este trabajo provienen de una firma que ha brindado acceso a su cuenta de Google Adwords y a una base de datos que registra las ventas realizadas cada día entre marzo y agosto 2013. Esta información es estratégica y confidencial para la empresa. La 10 autora de este trabajo ha asumido un compromiso de confidencialidad con la misma, no pudiendo hacer mención alguna al nombre de la compañía ni a la actividad que realiza. Si bien esto es una limitación, hay que tener en cuenta los motivos de la empresa de no divulgar sus datos reales. La firma es una pyme nacional que realiza la venta de todos sus productos a través de su página web. La página contiene una tienda donde el consumidor realiza la compra online y paga con tarjeta de crédito. El servicio de distribución es tercerizado por una empresa de correo privada y tiene un alcance nacional. La firma vende alrededor de 200 productos distintos, cuyo valor promedio es de 35 dólares (tomado al tipo de cambio dólar blue de 8,5 el peso en Julio 2013)1. La mayor inversión en publicidad se realiza en Google Adwords, representando el 21% de las Ventas. La firma compite con otras páginas webs y con otras firmas que venden productos similares a través de locales a la calle. 1 Fuente: ACM Consultores en http://www.infobae.com/2013/08/22/1502189-dia-dia-como-fue-la-cotizacion-deldolar-libre-2008 11 3.3 EL MODELO: LA FUNCIÓN DE TRANSFERENCIA Y ESTIMACIÓN El punto de partida para la construcción del modelo es un análisis exploratorio de las series univariadas, siguiendo el análisis de Enders (1995) y Shumway Stoffer (2011). Se analizará la serie temporal de Adwords y de Ventas por separado, para luego analizarlas en conjunto y determinar la relación entre ambas. 3.3.1 Análisis exploratorio de las series univariadas a. Serie temporal Adwords Los costos incurridos en Adwords registran fluctuaciones que se mantienen en cierto rango desde Marzo 2013 hasta mediados de Julio 2013. A partir de la segunda quincena de Julio hasta fines de Agosto 2013 el gasto en Adwords se duplicó. A partir de la función de autocorrelación (ACF) (Fig 2) y de la función parcial de autocorrelación (PACF) (Fig 3), podemos determinar que la serie temporal de Adwords (Fig 1) responde a un proceso autorregresivo de orden 1. Llegamos a esta conclusión a partir de la instrucción de Shumway y Stoffer (2011): ACF AR(p) Decrece MA(q) Corta abruptamente después del rezago q. Decrece ARMA(p,q) PACF Corta abruptamente después del rezago p. Decrece Decrece Ajustamos entonces un proceso AR(1) para la serie Adwords y obtenemos los siguientes coeficientes: Coefficients ar1 intercept 0.7974 243.8740 s.e. 0.0461 27.3348 sigma^2 estimated as 5577: log likelihood = -1003.63, aic = 2013.27 Tabla 1: Resultados del modelo AR(1) para Adwords Según Shumway y Stoffer (2011), el modelo general de AR(p) se escribe como: 𝜙(𝐿)𝑥𝑡 = 𝛼 + 𝑤𝑡 , (ec. 1) donde el operador autorregresivo está definido como: 𝜙(𝐿) = 1 − 𝜙1 𝐿 − 𝜙2 𝐿2 − ⋯ − 𝜙𝑃 𝐿𝑝 , y es un polinomio en el número de rezago, 𝐿𝑖 que indica que estaremos mirando la serie rezagada en i períodos, es decir 𝐿𝑖 𝑥𝑡 = 𝑥𝑡−𝑖 , y 𝑤𝑡 es ruido blanco. A partir de los resultados obtenidos, el modelo AR(1) para Adwords se expresa como: (1 − 0.8𝐿)𝐴𝑑𝑡 = 243.9 + 𝑤𝑡 𝐴𝑑𝑡 − 0.8𝐴𝑑𝑡−1 = 243.9 + 𝑤𝑡 12 𝐴𝑑𝑡 = 243.9 + 0.8𝐴𝑑𝑡−1 + 𝑤𝑡 . (ec. 2) La ecuación 2 expresa el modelo AR(1) para Adwords. Este modelo será luego utilizado para construir el modelo de funciones de transferencia. El gráfico ACF de la serie temporal Adwords denota cierto componente estacional semanal. Hay que tener en cuenta que los costos de Adwords no dependen solamente del precio ofertado por palabra clave sino también de los clicks realizados por los navegantes en el anuncio. Podemos ver que la mayor cantidad de clicks sobre el anuncio se realizan los días martes, miércoles y jueves (días laborales) y las caídas siempre se perciben los sábados y domingos. Por este motivo, para modelar la componente estacional se recurre a modelos autorregresivos integrados de media móvil con estacionalidad, o SARIMA por sus siglas en inglés (seasonal autorregresive integrated moving average model), que son una extensión de los modelos ARMA. Los modelos SARIMA capturan la estacionalidad de los datos. Muchas veces la dependencia del pasado ocurre bajo múltiplos de algún rezago s. En este trabajo, habría que capturar que el comportamiento de los navegantes se repite semanalmente. Según Shumway y Stoffer (2011), un modelo general de SARIMA se define como: 𝑑 𝑠 Φ𝑃 (𝐿𝑠 )𝜙(𝐿)∇𝐷 𝑠 ∇ 𝑥𝑡 = 𝛿 + Θ𝑄 (𝐿 )𝜃(𝐿)𝜀𝑡 , (ec. 3) donde 𝜀𝑡 es ruido blanco. El modelo general se expresa como ARIMA(p, d, q)x(P, D, Q)𝑠 El componente autorregresivo y el de media móvil está representado por los polinomios 𝜙(𝐿) y 𝜃(𝐿) de orden p y q, respectivamente, y los componentes estacionales autorregresivos y de media móvil por Φ𝑃 (𝐿𝑠 ) y Θ𝑄 (𝐿𝑠 ) de orden P y Q, respectivamente. Los componentes diferenciados ordinarios y estacionarios están representados por ∇𝑑 = (1 − 𝐿)𝑑 y 𝐷 ∇𝐷 𝑠 (1 − 𝐿) respectivamente. Después de realizar varios intentos por modelar el proceso Adwords mediante un modelo SARIMA que fuese parsimonioso y tuviera un ajuste adecuado, se decide modelarla a través de un modelo SARIMA(1,0,0)×(0,1,1)7, que es el que presenta el menor AIC. El criterio de información de Akaike (AIC) es una medida de bondad de ajuste que ayuda a seleccionar el mejor modelo entre dos o más candidatos. El AIC hace un balance entre la suma de los residuos al cuadrado y la cantidad de parámetros utilizados en el modelo. Cuanto más pequeño es el AIC, mejor es el modelo. Los resultados obtenidos del modelo aparecen en la Tabla 2 y son aplicados a la ecuación 2, siguiendo el análisis de Shumway y Stoffer (2011): Coefficients ar1 sma1 0.6129 -0.5037 s.e. 0.0753 0.0928 sigma^2 estimated as 3414: log likelihood = -881.13, aic = 1770.27 AIC: 9.16994 AICc: 9.182713 BIC: 8.224194 constant 1.2687 0.8574 Tabla 2: Resultados del modelo SARIMA(1,0,0)×(0,1,1)7 para Adwords A partir de la Tabla 2, se obtiene que: Φ𝑃 (𝐿𝑠 ) = 1 dado que P=0 𝜙(𝐿) = (1 − 0.61𝐿) 𝛿 = 1.27 13 Θ𝑄 (𝐿𝑠 )𝜀𝑡 = (1 − (−0.5)𝐿7 )𝜀𝑡 = (1 + 0.5𝐿7 )𝜀𝑡 𝜃(𝐿) = 1 dado que q=0. Combinando estos resultados en la ecuación 3: (1 − 0.61𝐿)(𝐴𝑑𝑡 − 𝐴𝑑𝑡−7 ) = 1.27 + (1 + 0.5𝐿7 )𝜀𝑡 𝐴𝑑𝑡 − 𝐴𝑑𝑡−7 − 0.61𝐴𝑑𝑡−1 + 0.61𝐴𝑑𝑡−8 = 1.27 + 𝜀𝑡 + 0.5𝜀𝑡−7 𝐴𝑑𝑡 = 1.27 + 0.61𝐴𝑑𝑡−1 + 𝐴𝑑𝑡−7 − 0.61𝐴𝑑𝑡−8 + 0.5𝜀𝑡−7 + 𝜀𝑡 . (ec. 4) La ecuación 4 expresa el modelo SARIMA(1,0,0)×(0,1,1)7 para Adwords. Es importante que los residuos de un modelo estimado no estén correlacionados. Cualquier evidencia de correlación serial implica que hay un movimiento sistemático en 𝐴𝑑𝑡 que no es explicado por los coeficientes SARIMA incluidos en el modelo. Para determinar si existe alguna autocorrelación entre los residuos distinta de cero se aplica el test de Ljung-Box test, que justamente tiene como hipótesis nula que los datos sean independientes, y como alternativa que no lo sean, según el capítulo 3.8 de Shumway y Stoffer (2011). En la Figura 4 se ve que las autocorrelaciones con rezagos menores a 13 días presentan p-valores mayores al nivel de significación, es decir que podemos asumir independencia. Esto implica que el modelo ajusta de manera adecuada. Como contrapartida se puede afirmar que las correlaciones correspondientes a 13 días o más son menos significativas. Si bien esto no es deseable, este modelo es el que mejor balanceaba el compromiso entre calidad de ajuste y cantidad de parámetros empleados. Fig 1: Serie temporal de los costos incurridos en Adwords entre Marzo y Agosto 2013 14 Fig 2 y 3: ACF y PACF respectivamente de la serie de Adwords 15 Fig 4: Modelo SARIMA(1,0,0)X(0,1,1)7 ajustado a la serie temporal de Adwords. El último gráfico representa el Ljung-Box Test para dicho modelo. A pesar de que el modelo SARIMA(1,0,0)X(0,1,1)7 captura bien el comportamiento estacional de Adwords, es menos parsimonioso que el AR(1) al incluir más cantidad de parámetros. Hay que tener en cuenta que esta serie va a ser luego vinculada con la serie de Ventas, con lo cual es preferible comenzar utilizando un modelo como el AR(1) de Adwords, que figura en la ecuación 2. Se puede cuestionar que AR(1) no captura bien la estacionalidad semanal de la serie, pero hay que aclarar que en las etapas avanzadas de la construcción del modelo, se capturará esta estacionalidad, al tener en cuenta modelos de función de transferencia. Nos quedaremos entonces con los resultados de la Tabla 1 para construir nuestro modelo general. b. Serie temporal Ventas Las ventas entre Marzo y Agosto de 2013 perciben un comportamiento mucho más irregular (Fig 5). Si bien la facturación promedio en Julio y Agosto aumentó un 30% con respecto a la de Marzo, Abril, Mayo y Junio, las fluctuaciones en las ventas no necesariamente muestran un componente estacional semanal. Sí hay que reconocer que las mayores bajas se dan generalmente los fines de semana, pero así también los días viernes. Se intentó ajustar modelos menos parsimoniosos que contemplen estas características y las ganancias en el ajuste no fueron significativas. Los gráficos de ACF (Fig 6) y PACF (Fig 7) muestran que la serie Ventas se aproxima a un proceso de media móvil de orden 1. Se ajusta entonces dicho modelo, obteniendo los siguientes coeficientes: Coefficients ma1 intercept 0.1016 2008.927 s.e. 0.0758 133.397 sigma^2 estimated as 2568599: log likelihood = -1539.72, aic = 3085.44 Tabla 3: Resultados del modelo MA(1) para Ventas 16 Según Shumway y Stoffer (2011), el modelo general de MA(q) se escribe como: 𝑥𝑡 = 𝛼 + 𝜃(𝐿)𝜀𝑡 , donde el operador de media móvil está definido como: 𝜃(𝐿) = 1 − 𝜃1 𝐿 − 𝜃2 𝐿2 − ⋯ − 𝜃𝑞 𝐿𝑞 . A partir de los resultados obtenidos, el modelo MA(1) para Ventas se expresa como: 𝑉𝑡 = 2009 + (1 − 0.1𝐿)𝜀𝑡 𝑉𝑡 = 2009 + 𝜀𝑡 − 0.1𝜀𝑡−1 . Se evalúa la independencia de los residuos de este modelo mediante el test de Ljung Box y se obtiene p-valores altos, lo que indica que el modelo ajusta correctamente (ver Fig 8). Asimismo, en el gráfico PACF de esta serie las primeras espigas múltiplos de 7 son levemente significativas, lo que daría un sutil indicio de una ligera estacionalidad, pero decidimos quedarnos con un modelo como el MA(1) por ser más parsimonioso. Fig 5: Serie temporal de los ingresos percibidos por las Ventas entre Marzo y Agosto 2013 17 Fig 6 y 7: ACF y PACF respectivamente de la serie Ventas Fig 8: Modelo MA(1) ajustado a la serie temporal de Ventas. El último gráfico representa el Ljung-Box Test para dicho modelo. 18 3.3.2 Análisis exploratorio conjunto de las series Adwords y Ventas Para clarificar la relación que puede existir entre la serie Adwords y Ventas, utilizamos la función de correlación cruzada, o CCF por sus siglas en inglés (cross-correlation function). Según Shumway y Stoffer (2011), la CCF mide la previsibilidad de una serie, en este caso Ventas, desde la serie Adwords. La CCF entre 𝑦𝑡 y 𝑥𝑡−𝑖 se define como: 𝜌𝑦𝑥 (𝑖) = 𝑐𝑜𝑣(𝑦𝑡 , 𝑥𝑡−𝑖 ) . 𝜎𝑦 𝜎𝑥 Al graficar cada valor de 𝜌𝑦𝑥 (𝑖) obtenemos el cross-correlograma. Este gráfico estudia la relación entre dos series de tiempo. La cantidad de espigas significativas después del cero denota la estacionalidad de las series. La dirección de las espigas significativas explica si la relación entre dos series de tiempo es positiva o negativa. Se grafica el cross-correlograma entre Adwords y Ventas (Fig. 9), y se analiza la relación entre las dos series. Fig 9: CCF entre la serie Adwords y la serie Ventas La dirección hacia arriba de las espigas significativas explica que la relación entre Adwords y Ventas es positiva, es decir, que si aumenta Adwords, las Ventas también lo hacen. Las espigas significativas después del cero son todos múltiplos de 7, con lo cual denota una clara estacionalidad semanal. Al haber analizado las dos series de modo univariado y haber observado que se pueden modelar de manera adecuada por modelos ARMA y habiendo analizado las dos series en forma conjunta y viendo que hay una clara vinculación entre sus comportamientos, es razonable buscar un modelo para predecir las ventas que vincule los dos procesos. Para ello, utilizaremos funciones de transferencia. 3.3.3 Modelo: función de transferencia Las funciones de transferencia es un modelo que vincula dos series de tiempo; en este caso, Adwords y Ventas. Enders (1995) lo define como: 𝑦𝑡 = 𝑎0 + 𝐴(𝐿)𝑦𝑡−1 + 𝐶(𝐿)𝑥𝑡 + 𝐵(𝐿)𝑒𝑡 , 19 donde A(L), B(L) y C(L) son polinomios en el rezago L. Shumway y Stoffer (2011) lo definen, en cambio, como: 𝜔(𝐵)𝜙𝜂 (𝐵)𝑦𝑡 = 𝜙𝜂 (𝐵)𝛿(𝐵)𝐵𝑑 𝑥𝑡 + 𝜔(𝐵)𝜃𝜂 (𝐵)𝑒𝑡 (ec. 5) Esta última ecuación se utilizará luego para combinar los resultados. Como se puede ver en la ecuación de Enders (1995), la variable endógena, yt (en este trabajo Ventas, Vt ) en tiempo presente depende de la variable endógena en tiempo pasado y de la variable exógena xt (en este trabajo Adwords, Adt ), así también como del término de error 𝑒𝑡 . El A(L) describe cuáles son los instantes y con qué ponderación las Ventas pasadas afectan a las Ventas actuales. El polinomio C(L) se denomina función de transferencia y muestra cómo la variable exógena afecta el modelo endógeno, es decir, los coeficientes de C(L) representan el efecto que tienen sobre las Ventas los valores que toma el proceso Adwords. Los coeficientes de C(L), los notaremos ci . El último término modela el error, que asumimos que et es ruido blanco. Es importante destacar que {𝑥𝑡 }, es un proceso exógeno que evoluciona de forma independiente de {𝑦𝑡 }. Las innovaciones en {𝑦𝑡 } no deben tener efecto sobre {𝑥𝑡 }. El objetivo de la función de transferencia es hallar expresiones para A(L), B(L) y C(L). El problema central en este modelo es que la serie Ventas, la serie Adwords y el término de error son procesos ARMA. Es por este motivo que estimar simultáneamente los tres polinomios no es posible y que lo llevaremos a cabo en etapas que se describen a continuación, como se indica en la literatura (ver Enders (1995), Capítulo 5, y Shumway y Stoffer (2011), Capítulo 5). Todos los cálculos fueron realizados utilizando el software R2 y las rutinas correspondientes se encuentran en el Apéndice. Paso 1: Ajustar un modelo ARMA a la serie Adwords para obtener ϕ(B) y θ(B). Este paso ya se hizo en el análisis exploratorio de la serie univariada y se ajustó el AR(1) para Adwords obteniendo: 𝐴𝑑𝑡 = 243.9 + 0.8𝐴𝑑𝑡−1 + 𝑤𝑡 . Es decir que, 𝜙(𝐿) = 1 − 0.8𝐿, y que 𝜃(𝐿) = 1. Se calculan los residuos de este modelo 𝑤 ̂, 𝑡 ya que se utilizarán para construir el crosscorrelograma en el Paso 3. Paso 2: Obtener los valores filtrados de las ventas {Ṽt } aplicando el filtro, para cada valor de {Vt }. ϕ(L) , θ(L) hallado en el Paso 1, Las expresiones de ϕ(L) y de θ(L) se obtienen del paso anterior: θ(L) = 1, dado que el q del ARMA(p,q) es cero 2 R project: http://www.r-project.org/ 20 ϕ(L) = (1 − 0.80L), Vt − 0.8Vt−1 = 𝑉̃𝑡 . Paso 3: Se realiza un cross-correlograma entre 𝑤 ̂𝑡 y 𝑉̃𝑡 para sugerir el comportamiento de A(L) y C(L) (Fig. 10). Los valores que son significativamente distintos de cero en el gráfico de CCF dan la pauta de cómo elegir A(L) y C(L). Fig 10: CCF entre los valores filtrados de las Ventas y los residuos de Adwords Las espigas no nulas del CCF indican posibles valores no nulos para ci . En este gráfico: c0 , c7 . Según Enders (1995), el patrón de decaimiento del cross correlograma sugiere posibles valores para A(L) comparable con la ACF en un modelo ARMA tradicional. En este caso, las únicas espigas significativas son aquellas que son múltiplos de 7, lo que deja en evidencia nuevamente que el componente estacional semanal, dejado de lado en el modelo AR(1) de Adwords, sigue vigente. Paso 4: Se ajusta la siguiente regresión lineal, teniendo en cuenta los parámetros hallados en la CCF del Paso 3. En principio se propone el modelo: 𝑉𝑡 = 𝛿 + 𝜔7 𝑉𝑡−7 + 𝛿0 𝐴𝑡 + 𝛿7 𝐴𝑡−7 + 𝜂𝑡 . Sin embargo, el ajuste de este modelo no resulta adecuado. Luego, mediante un procedimiento exhaustivo, se realiza un procedimiento de selección de variables. La bondad de cada modelo fue medida mediante el criterio de Akaike. Se concluye que el modelo con mejor ajuste es: 𝑉𝑡 = 𝜔7 𝑉𝑡−7 + 𝛿0 𝐴𝑡 + 𝜂𝑡 . Los resultados de la regresión son los siguientes: 21 Residuals: Min -4027.8 Coefficients: 1Q -807.8 Median -160.6 3Q 881.5 Estimate Std. Error t value ventas[1:168] 0.15931 0.07093 2.246 adwords[8:175] 6.19852 0.62972 9.843 Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 1407 on 166 degrees of freedom Multiple R-squared: 0.6879, Adjusted R-squared: 0.6842 F-statistic: 183 on 2 and 166 DF, p-value: < 2.2e-16 Max 4565.4 Pr(>|t|) 0.026 <2e-16 Tabla 4: Regresión lineal del modelo 𝑉𝑡 = 𝜔7 𝑉𝑡−7 + 𝛿0 𝐴𝑡 + 𝜂𝑡 . El modelo logra explicar en más de un 68% la variabilidad de las ventas. Hasta aquí, se ha obtenido ajustes preliminares para A(L) y C(L), donde A(L)=0.16L7 y C(L)=6.2, luego el modelo sería: 𝑉𝑡 = 0.16𝑉𝑡−7 + 6.2𝐴𝑡 + 𝜂𝑡 . (ec. 6) El problema que se encuentra en este punto es que los residuos no son necesariamente ruido blanco. Si lo fuesen, este sería el modelo final. Entonces la etapa siguiente es ajustar un modelo ARMA a los residuos y luego hallar estimaciones finales para A(L) y C(L). donde 𝑒𝑡 es ruido blanco. 𝜙𝑒 (𝐿)𝜂𝑡 = 𝛿 + 𝜃𝑒 (𝐿)𝑒𝑡 , Paso 5: Ajustar un modelo ARMA sobre 𝜂𝑡 . Para eso primero hay que estudiar el ACF y PACF sobre dicha serie: 22 Fig 11 y 12: ACF y PACF respectivamente de la serie de residuos 𝜂̂𝑡 que pertenece a la regresión 𝑉𝑡 = 𝜔7 𝑉𝑡−7 + 𝛿0 𝐴𝑡 + 𝜂𝑡 . Las dos series decaen en los gráficos y ninguna presenta un corte abrupto ni para la función de autocorrelación ni para la de autocorrelación parcial, por lo tanto es razonable ajustar un modelo ARMA(p,q). Luego de una búsqueda exhaustiva entre varios modelos, siguiendo el criterio de bondad de ajuste de Akaike, se concluye que es conveniente ajustar un modelo ARMA(1,1) sin ordenada al origen. Al ajustar el modelo ARMA (1,1), se obtienen los siguientes coeficientes: Coefficients: ar1 ma1 0.9504 0.2716 s.e. 0.0223 0.0618 sigma^2 estimated as 2677382: log likelihood = -1483.05, aic = 2972.09 Tabla 5: Resultados del modelo ARMA(1,1) sin ordenada al origen para los residuos de la regresión lineal 𝑉𝑡 = 𝜔7 𝑉𝑡−7 + 𝛿0 𝐴𝑡 + 𝜂𝑡 . Es decir que los coeficientes de los polinomios 𝜃𝑒 (𝐿) y 𝜙𝑒 (𝐿) para este modelo son: 𝜃𝑒 (𝐿) = (1 − 0.27𝐿), 23 𝜙𝑒 (𝐿) = (1 − 0.95𝐿). Es decir que, 𝜂𝑡 = 𝜃𝑒 (𝐿) 𝑒, 𝜙𝑒 (𝐿) 𝑡 (1−0.27𝐿) 𝜂𝑡 = (1−0.95𝐿) 𝑒𝑡 . (ec. 7) 3.4 RESULTADOS Combinando las ecuaciones ec. 6 y ec. 7 en la ecuación ec. 5, se obtiene que: (1 − 0.16𝐵 7 )(1 − 0.95𝐵)𝑉𝑡 = (1 − 0.95𝐵)6.2𝐴𝑡 + (1 − 0.16𝐵 7 )(1 − 0.27𝐵)𝑒𝑡 𝑉𝑡 − 0.95𝑉𝑡−1 − 0.16𝑉𝑡−7 + 0.15𝑉𝑡−8 = 6.2𝐴𝑡 − 5.86𝐴𝑡−1 + 𝑒𝑡 − 0.27𝑒𝑡−1 − 0.16𝑒𝑡−7 + 0.04𝑒𝑡−8 𝑉𝑡 = 0.95𝑉𝑡−1 + 0.16𝑉𝑡−7 − 0.15𝑉𝑡−8 + 6.2𝐴𝑡 − 5.86𝐴𝑡−1 + 𝑒𝑡 − 0.27𝑒𝑡−1 − 0.16𝑒𝑡−7 + 0.04𝑒𝑡−8 . (ec. 8) Esta ecuación expresa el modelo de funciones de transferencia que vincula la serie temporal de Adwords y la serie de Ventas. Habiendo obtenido el modelo final, en esta sección se analizarán las variables que son significativas en la determinación de las ventas actuales de la firma. En términos generales, el modelo muestra que las ventas de cada día (𝑉𝑡 ) dependen en diferente medida de las ventas del día anterior (𝑉𝑡−1), de las ventas percibidas una semana atrás (Vt−7 y 𝑉𝑡−8) (es decir que tiene un comportamiento estacional semanal), como así también de la publicidad que se realice ese día (𝐴𝑡 ) y que se haya realizado el día anterior (𝐴𝑡−1 ). Para el caso analizado, Adwords no parece tener un efecto prolongado en el tiempo. El término que domina las ventas en tiempo t es 0.95𝑉𝑡−1 . Esto último significa que, dejando la publicidad constante, uno espera vender aproximadamente lo mismo que vendió el día anterior. Los errores son ruido blanco, es decir 𝐸(𝑒𝑡 ) = 0, entonces 𝐸(𝑒𝑡 − 0.27𝑒𝑡−1 − 0.16𝑒𝑡−7 + 0.04𝑒𝑡−8 ) = 0. Si Adwords queda constante, 6.2At − 5.86At−1 ≈ 0. Por lo tanto, podemos mirar el modelo simplificado: Vt ≈ 0.95Vt−1 + 0.16Vt−7 − 0.15Vt−8 . En esta última ecuación se ve que las ventas actuales (Vt ) dependen fundamentalmente de las ventas del día anterior (0.95Vt−1). Por el contrario, el componente estacional (0.16Vt−7 − 0.15Vt−8) tiene un peso mucho menor. Si hubiera un día a la semana donde las ventas suelen ser mayores al día anterior (en la firma estudiada los martes, miércoles y jueves son días con más ventas), el componente estacional debería repercutir positivamente. En cambio, los días viernes ese mismo componente debería repercutir de manera negativa. 24 Por otra parte, si se varía mucho la inversión publicitaria entre un día y su consecutivo, entonces 6.2At − 5.86At−1 va a tener un impacto alto en las ventas. Si la inversión en publicidad aumenta, las ventas deberían aumentar, pero si se quita la inversión, las ventas caerían. De esto se desprende que una estrategia sensata es invertir en Adwords de manera constante, dado que hacer inversiones puntuales no tendría un efecto notorio. 25 4. CONCLUSIONES Adwords es una herramienta sumamente novedosa en el mercado publicitario y aún se encuentra en evolución. Google ofrece permanentemente nuevas herramientas y posibilidades a los usuarios para publicar sus avisos en Google. Poder sacar conclusiones sensatas y duraderas en el tiempo sobre esta forma de publicitar resulta por lo tanto una tarea difícil. La construcción del modelo tampoco fue sencilla: hubo que tomarse libertades para encontrar un ajuste parsimonioso. Al principio se intentó utilizar modelos de regresión simple, sin poder hallar un ajuste adecuado. Se recurrió entonces a modelos de funciones de transferencia, cuyas técnicas de estimación son más complicadas que las de los modelos de regresión simple. Según Enders, no hay duda de que estimar una función de transferencia requiere cierto juicio de parte del investigador. Es necesario hacer prueba y error más de una vez en cada paso para encontrar el modelo que ajuste mejor. Desde el punto de vista del management, los dueños de emprendimientos realizan un análisis mucho más simple y rápido para evaluar si Adwords es realmente útil: analizan el porcentaje que representa el costo promedio en Adwords sobre el ticket promedio. Si este porcentaje es muy alto, evalúan la posibilidad de bajar la inversión publicitaria y, sino, continúan invirtiendo. A partir de los resultados de este trabajo, se concluye que una estrategia sensata es invertir en Adwords de forma constante dado que el impacto de la inversión realizada en Adwords un día es contrarrestrada por el impacto de la inversión publicitaria del día anterior. Hay que admitir que esta conclusión difiere de la hipótesis del trabajo, que sostenía que Adwords iba a tener un efecto mayor sobre las ventas dado que la única manera de una ecommerce de hacerse conocida entre los consumidores es a través de su publicidad online. Clarke (1976) indicaba que el intervalo en el que son medidos los datos determina la duración del efecto de la publicidad. Para él, los datos deben ser medidos mensualmente de manera ideal. Este trabajo descubre un componente estacional semanal prominente dentro de la serie Ventas y de la serie Adwords. Previo a la construcción del modelo, se podía percibir que la mayor cantidad de clicks sobre el anuncio se realizaban los días martes, miércoles y jueves, y las caídas se percibían los sábados y domingos. Era evidente entonces que el modelo debía captar dicha estacionalidad. Encontramos que el efecto de la publicidad en este mercado dura aproximadamente una semana. Una de las críticas que plantea Clarke en su paper es la imposibilidad de capturar los efectos del marketing mix sobre las ventas. Una de las mayores contribuciones de este trabajo es que la publicidad está despejada del resto de las variables que integran el marketing mix (la atención del personal de ventas, canales de distribución, anuncios en la vía pública). El contacto entre el consumidor y el producto es igual para todos los consumidores dado que es realizado solo de manera virtual. Un punto importante que queda en la agenda de futuras investigaciones es la discriminación de las campañas de Adwords y de las Ventas por producto o SKU. Adwords permite categorizar sus avisos por palabras claves, identificando fácilmente el producto que la empresa quiere vender. Lo mismo ocurre en la empresa: lleva un registro de las ventas de cada producto. El 26 mayor inconveniente en esta tarea es construir un modelo parsimonioso para dicha especificación. Otro futuro desafío es estudiar cuál es la relación que hay entre Google Adwords, Google Analytics y las ventas de una compañía de e-commerce. Como hemos mencionado anteriormente, Google Analytics estudia la performance de una página web, es decir que provee las estadísticas que se encuentran intermediando entre Google Adwords y las ventas. Esta herramienta está estrechamente relacionada con Google Adwords y las ventas realizadas en la página web. Sin embargo, hay que reconocer que, en tal caso, la compañía en cuestión debe proveer muchos datos confidenciales. La autora de este trabajo espera que el mismo resulte una contribución tanto para economistas que quieran abordar la relación publicidad – ventas en un futuro, como así también para administradores de empresas que deben decidir si invertir en Google Adwords o no. 27 5. APENDICE: RUTINA EN R Antes de comenzar a trabajar en R con este tipo de modelos y herramientas (ARMA, SARIMA, regresión lineal robusta, etc.) es necesario instalar la libreria del libro “Applied Statistics Time Series Analysis” y el paquete MASS. library("astsa", lib.loc="C:/Program Files/R/R-3.0.2/library") library("MASS", lib.loc="C:/Program Files/R/R-3.0.3/library") Se abre la base de datos que se utilizará en este trabajo: datos<-read.table(file.choose(),header=T,sep=";") Análisis exploratorio de las series univariadas Graficar las series de tiempo Adwords y Ventas: plot(1:175,datos[,1], type="l", main="adwords", xlab="", ylab="") plot(1:175,datos[,2], type="l", main="ventas", xlab="", ylab="") Identificar a las variables “adwords”, “ventas”, etc. dentro de la base de datos para utilizarlas luego: adwords=datos[,1] ventas=datos[,2] trend = 1:175 Adwords Después de graficar ACF y PACF para la serie Adwords, se ajusta el modelo AR(1) y se obtienen los coeficientes: acf(adwords, 30, main="adwords") pacf(adwords, 30, main="adwords") salida.adw<-arima(adwords,c(1,0,0)) salida.adw Se ajusta un SARIMA(1,0,0)×(0,1,1)7 para captar la estacionalidad de Adwords, se obtienen los coeficientes y se evalúan los resultados del Ljung-Box test: adwords.arma<-sarima(adwords, 1, 0, 0, 0, 1, 1, 7) adwords.arma Ventas Graficar ACF y PACF para Ventas. Al ver que tiene un comportamiento similar a un MA(1), se aj usta dicho modelo: acf(ventas, 30, main="ventas") pacf(ventas, 30, main="ventas") ventas.arma<-arima(ventas,c(0,0,1)) ventas.arma Se evalúa mediante el Ljung-Box test la independencia de los residuos de un modelo SARIMA(0,0,1)×(0,0,1)7 para Ventas: ventas.sarima<-sarima(ventas, 0, 0, 1, 0, 0, 1, 7) 28 Análisis exploratorio de las series univariadas Graficar la CCF entre Adwords y Ventas ccf(adwords, ventas, 30, main="adwords vs ventas", ylab="CCF") Modelo: función de transferencia Paso 1 Reconocer al coeficiente del modelo AR(1) de Adwords para calcular los valores filtrados de ventas ar1<-as.numeric(salida.adw$coef[1]) ar1: 0.7973721 Se calculan los residuos del modelo 𝑤 ̂𝑡 . Se llaman los valores filtrados de {𝐴𝑑𝑡 } adw.pw<-resid(salida.adw) Paso 2 Obtener los valores filtrados de las ventas {𝑉𝑡 } aplicando el filtro 𝜙(𝐵) 𝜃(𝐵) a cada valor de {𝑉𝑡 } ventas.fil = filter(ventas, filter=c(1, -ar1), method="conv", sides=1) Paso3 Graficar la CCF entre los valores filtrados de {Adt } y los valores filtrados de las ventas {Vt } y obtener los parámetros di para luego calcular la regresión lineal. correl<-ccf(ventas.fil,adw.pw, main="ventas filtradas vs residuos de adwords filtrados", ylab="CCF", na.action=na.omit) correl Paso 4 Se ajusta un modelo lineal y se obtiene 𝜔(𝐵) y 𝛿(𝐵)𝐵𝑑 lm.fit<-lm(ventas[8:175] ~ 0 + ventas[1:168]+ adwords[8:175]) summary(lm.fit) Filtrar los residuos de la regresión lineal eta.hat<-filter(resid(lm.fit), c(1,0,0,0,0,0,0,-om1),method='recur', sides=1) Paso 5 Aplicar un modelo ARMA a estos residuos. Con tal fin, primero graficar ACF y PACF: acf(eta.hat) pacf(eta.hat) Se ajusta un ARMA(1,1) a dicha serie: eta.fit<-arima(eta.hat,c(1,0,1), include.mean = FALSE) eta.fit De estos ajustes, se obtiene 𝜙𝑒 (𝐵) y 𝜃𝑒 (𝐵). Resultados 29 Se arma el modelo manualmente, aplicando cada uno de los coeficientes obtenidos: 𝜔(𝐵)𝜙𝑒 (𝐵)𝑦𝑡 = 𝜙𝑒 (𝐵)𝛿(𝐵)𝐵𝑑 𝑥𝑡 + 𝜔(𝐵) 𝜃𝑒 (𝐵)𝑒𝑡 . 30 6 BIBLIOGRAFÍA - Assmus, G., Farley, J. U., & Lehmann, D. R. (1984). How advertising affects sales: Metaanalysis of econometric results. Journal of Marketing Research: 65-74. - Ayuda de Adwords. https://support.google.com/adwords/topic/3121763 hl=es&ref_topic=3119071. - Bass, F. M., & Parsons, L. J. (1969). Simultaneous-Equation Regression Analysis of Sales and Advertising*. Applied Economics, 1.2: 103-124. - Cámara Argentina de Comercio Electrónico (CAECE), Resumen ejecutivo: Estudio anual de Comercio Electrónico 2013. - Clarke, D. G. (1976). Econometric measurement of the duration of advertising effect on sales. Journal of Marketing Research, 13(4), 345-357. - ComScore (2013). Futuro digital Latinoamerica 2013. ComScore, Inc. - Enders, W (1995). Applied econometric time series. John Wiley & Sons, Inc. - Franses, P. H., & van Oest, R. (2004). On the econometrics of the Koyck model, ERIM Report Series Research in Management. - González, P., Moral, P., & Plaza, B. (2012). Assessing the effectiveness of AdWords campaigns on website performance: the case of a tourist SME. - Hanssens, D. M. (1980). Bivariate time-series analysis of the relationship between advertising and sales. Applied Economics, 12(3): 329-339. - Kaldor, N. (1950), The Economics Aspects of Advertising. Review of Economic Studies, 18: 1-27. - Koyck, L. M. (1954), Distributed Lags and Investment Analysis. Amsterdam: North Holland Publishing Co. - Lecinski, J. (2011). ZMOT: Winning the Zero Moment of Truth. Google. - Nelson, P. (1970). Information and Consumer Behaviour. Journal of Political Economy, 78: 311-329. - Shumway, R. H., & Stoffer, D. S. (2011). Time series analysis and its applications: with R examples. Springer. - Weinberg, C. B., &. Weiss, D. L. (1982). On the econometric measurement of the duration of advertising effect on sales. Journal of Marketing Research, 19 (4), 585-591. 31