ANÁLISIS DE SENTIMIENTOS EN INTERNET PARA DECISIONES ESTRATÉGICAS Autor: González Dulanto, Carlos. Director: Olivas Varela, José Ángel. Entidad Colaboradora: ICAI – Universidad Pontificia Comillas. RESUMEN DEL PROYECTO Introducción En la actualidad, la tecnología está presente en la vida de todas las personas, ya sea directa o indirectamente. Este efecto, además de notarse en muchos otros aspectos, está afectando a las empresas en el sentido de que Internet supone una valiosísima fuente de información para las mismas a la hora de llevar a cabo una determinada estrategia. Lo que se pretende en un futuro cercano es un cambio en la forma en que se realizan las investigaciones de mercado. Actualmente, gracias a los avances producidos en la tecnología resulta sencillo realizar algo que hace años era impensable. Este proceso que permite realizar investigaciones de mercado sin necesidad de recurrir al tradicional método de las encuestas se conoce con el nombre de análisis de sentimientos. El análisis de sentimientos es una herramienta de proceso del lenguaje natural preocupada por el tratamiento automatizado de opiniones. La intención de esta técnica es determinar la actitud del usuario que escribe su opinión en Internet respecto a un tema, realizando un rastreo en la red a través de las palabras clave que determinan el estado de ánimo, saber si es positivo o negativo. Las oportunidades que brinda el análisis de sentimientos son enormes, se puede aplicar a diversos temas, por ejemplo: - Analizar o cuantificar el éxito de un partido político o una asociación. - Conocer la opinión de los usuarios de cierta marca, producto o personaje público. - Realizar predicciones de lo que puede que ocurra en un futuro a partir de los comentarios de los usuarios. - Realizar estudios de tendencia de mercado. El proyecto consiste en el desarrollo de una aplicación informática que permita realizar un análisis de sentimientos sobre un producto concreto. A partir del análisis se podrá deducir el signo (positivo o negativo) de la opinión y ver si se trata de un comentario favorable o desfavorable. Después, con la información del signo de los distintos comentarios, también se podrá concluir qué estrategia debería llevar a cabo una organización para mejorar sus debilidades. Además el alcance de este proyecto es cualquier organización que requiera de dicha aplicación para realizar los análisis que desee, es aplicable a cualquier campo. El motivo de la realización de este proyecto se debe al auge en el que siempre se encuentra la tecnología y, sobre todo Internet, que provocan que un programa de análisis de sentimientos resulte una herramienta de gran utilidad para cualquier tipo de organización. Un programa de este tipo proporciona muchas facilidades a la par que brinda numerosas ventajas. Por otro lado, a nivel personal, se ha escogido el desarrollo de un sistema de análisis de sentimientos porque permitirá adquirir los conocimientos necesarios a la hora de desarrollar una estrategia en una organización. Metodología Para la realización del proyecto se ha empezado explicando en qué consiste Internet, cuáles son las nuevas tendencias en la red y qué es el análisis de sentimientos. Posteriormente, se ha realizado un benchmarking haciendo un profundo análisis sobre las distintas herramientas que existen actualmente en el mercado, indicando cuáles eran los puntos fuertes y débiles de cada uno para así poder orientar la aplicación desarrollada hacia las buenas prácticas. Una vez conocidas las herramientas existentes, se explica el proceso de análisis de sentimientos desde su punto inicial, en el que se realiza la recogida de información, hasta el punto final en que se detalla la tecnología que se va a emplear para desarrollar el programa que permita realizar el análisis. Resultados Ya sabidos cuáles son los requisitos del programa a desarrollar, el siguiente paso consiste en explicar cómo funciona la aplicación, su lógica y, en paralelo, se programa. Finalmente, se aplica el programa en un ejemplo concreto sobre un producto de una empresa (Iphone de Apple) para probarlo y para realizar una estrategia de la empresa a partir de los resultados de la aplicación. Conclusiones La realización de este proyecto ha conllevado un largo trabajo de estudio. Por un lado, se ha realizado un exhaustivo análisis de actuales herramientas en el ámbito del análisis de sentimientos en Internet, indicando las características de cada uno de ellos, así como ventajas y desventajas. Y por otro lado también se han estudiado técnicas de Inteligencia Artificial que han permitido al autor desarrollar un algoritmo inteligente inductivo basado en patrones que permite realizar estadísticas iniciales y además clasifica futuros comentarios según el signo. Gracias a aplicaciones como la que se ha desarrollado, las redes sociales se han convertido en instrumentos que permiten, gracias a la gran cantidad de información que ofrecen, anticiparse a situaciones futuras. La facilidad de acceso a las fuentes de información es una gran ventaja para los sistemas de análisis de sentimientos. Incorporar un sistema de análisis de sentimientos en una organización ahorrará costes internos de la propia empresa, pues dejas que un ordenador haga en segundos lo que una persona del departamento de marketing, por ejemplo, se pasa horas y horas haciendo por la calle. El análisis de sentimientos es un concepto que crece cada vez más rápido en las organizaciones, esta técnica está muy relacionada con el Bussiness Intelligence , y su aplicación se está aplicando en numerosos campos. La aplicación desarrollada, aunque se ha entrenado para el ejemplo concreto del Iphone de Apple, es una aplicación altamente escalable, se puede aplicar a cualquier campo y además se puede ir entrenando a sí misma recursivamente de tal forma que se adapte a las nuevas críticas que se sucedan. Un aspecto que debe mejorar el sistema es el tratamiento de factores no esperados como pueden ser la ironía, la subjetividad o la intención de los usuarios al realizar sus comentarios. El lenguaje natural es ambiguo y es un tema difícil de tratar. No obstante, a pesar de la aplicación que se ha desarrollado, no hay duda de que el papel humano resulta fundamental a la hora de la monitorización y análisis de los sentimientos. Esta importancia se debe a que las máquinas no poseen la habilidad de saber qué es lo importante sobre lo que se está analizando y no pueden filtrar de forma autónoma los resultados al no utilizar el sentido común. Todas las actuales, sin excepción, necesitan el factor humano para ofrecer resultados precisos. Por esta razón, debe dejarse claro que análisis de sentimientos y escucha online no son sinónimos, sino que el análisis corresponde a la etapa posterior a la monitorización en la que se analiza lo que se ha “escuchado”. Referencias [ACMT11] Association for Computing Machinery, “Tweeter as Medium and Message”, Communications of the ACM, March 2011. [SAND11] http://sandbox.yahoo.com. Última visita: Noviembre 2011. [PHCG11] Pedro H. Calais Guerra, “From Bias to Opinion: A transfer learning aproach to real time sentiment analysis”, Universidad Federal de Minas Gerais de Brazil, Agosto 2011. [TJPA11] Theresa Wilson, Janyce Wiebe, Paul Hoffman, “Recognizing Contextual Polarity in Phrase-Level Sentiment Analysis”, University of Pittsburg, Julio 2011. [DAED12] http://blog.daedalus.es/2012/05/12/analisis-de-sentimiento-capturando-laemocion/. Última visita: Mayo 2012. [CONC11] http://www.concepto05.com/2011/03/por-que-falla-el-analisis-desentimiento/ Última visita: Noviembre 2011. [LANA12] http://www.lanacion.com.ar/1170654-como-se-investigan-lossentimientos-en-internet. Última visita: Enero 2012. [WIKI11] http://en.wikipedia.org/wiki/Sentiment_analysis. Última visita: Septiembre 2011. SENTIMENT ANALYSIS FOR STRATEGIC DECISIONS Author: González Dulanto, Carlos. Director: Olivas Varela, José Ángel. Collaborating Organization: ICAI – Universidad Pontificia Comillas. PROJECT SUMMARY Introduction Nowadays, new technologies are present in everyone’s life on many ways. This is appreciated every single day on many accounts, and especially when it comes to the effects of Internet in companies’ work developing (this is: Internet is such a great source of good qualities for the companies’ strategic decisions). The aim is to change market researching in the near future thank to these new technologies, something impossible some years ago. “Sentiment Analysis” is the proper name of the concept brought to discussion in this paper, which avoids the using of classical surveys. Sentiment Analysis is a natural language processing focused on the automatic opinions’ treatment, and the users’ attitude or mood when talking about some issue on the web (is he for, or against the topic in discussion?). There are given some examples for Sentiment Analysis’ benefits: - Analyzing / quantifying the results of any political party. - Knowing the users’ opinions or feelings about any brand, product, or public figure. - Predicting the future from people’s opinion. - Achieving trending market studies. This project intends the development of a Sentiment Analysis computer application for a concrete product. From these users’ opinions it will be possible a correct management in terms of deciding the company’s strategy. This Sentiment Analysis system has been chosen in order to help the development of the company’s strategy due to its advantages and facilities. Methodology For the project’s achievement, it has been explained what Internet is, which are the new trends on the web, and the meaning of “Sentiment Analysis” too. It has been also made a benchmarking; a deep analysis of the current web tools, pointing the strengths and weaknesses of each one in order to bring the application to fruition. Once the designated tools are known, it is explained the Sentiment Analysis process from the very beginning (data collecting) until the end of that process, when it is detailed the technology which enables the correct analysis. Results Then it is time to explain the working of the application and its logical processes with the given example for a company’s product (Apple’s iPhone), in order to test it and, later on, deciding the strategy from the results. Conclusions It has been a long, hard, working, to achieve this research. On the one hand, it has been made an exhaustive analysis of the current web tools in the “Sentiment Analysis” applications field, emphasizing in the characteristics of each one of them. On the other hand, IA techniques has been studied, allowing the author the creation and developing of an inductive, intelligent algorithm, based on some patterns which enable the creating of initial statistics and the rating of future comments according to the sign (positive or negative). It has been appreciated too the importance of the social networks according to the huge amounts of information they can give, so the companies now are able to predict the future in this way. The easy access to these information sources is a wonderful advantage for the “Sentiment Analysis” systems. Moreover, this kind of systems will save costs to these companies for sure: computer software doing by itself a few people’s work is much more thrifty than the other –the classical one- option. “Sentiment Analysis” is, by far, a growing concept among the sector bodies, which is closely related to the “Business Intelligence” technique (and it is being implemented in very different fields). The one created for this research is a highly scalable, applicable in many scopes and polyvalent one when it comes to comments’ prediction and rating. A point which should be improved is the treatment of non-expected variables like irony, subjectivity, or the user’s intention when making some comment. Natural language is an ambiguous one and hard to deal with for computer software. However, despite all the benefits of the iPhone Sentiment Analysis Application developed in this research, it is capital to underline the role of the human factor according to the monitoring and sentiment analysis. Computers, they do not have the abilities to know what is truly important of what is being analyzed (the feelings), and as they do not have common sense, they cannot filter the results by themselves. Every single application of this type still needs from the human monitoring and reviewing in order to achieve a proper analysis of the results. For this reason, it is necessary to state and make clear that “Sentiment Analysis” and “online listening” are not, on no account, synonyms, but the “Sentiment Analysis” corresponds to a later step of the monitoring process (in which it is analyzed the collected data). References [ACMT11] Association for Computing Machinery, “Tweeter as Medium and Message”, Communications of the ACM, March 2011. [SAND11] http://sandbox.yahoo.com. Última visita: Noviembre 2011. [PHCG11] Pedro H. Calais Guerra, “From Bias to Opinion: A transfer learning aproach to real time sentiment analysis”, Universidad Federal de Minas Gerais de Brazil, Agosto 2011. [TJPA11] Theresa Wilson, Janyce Wiebe, Paul Hoffman, “Recognizing Contextual Polarity in Phrase-Level Sentiment Analysis”, University of Pittsburg, Julio 2011. [DAED12] http://blog.daedalus.es/2012/05/12/analisis-de-sentimiento-capturando-laemocion/. Última visita: Mayo 2012. [CONC11] http://www.concepto05.com/2011/03/por-que-falla-el-analisis-desentimiento/ Última visita: Noviembre 2011. [LANA12] http://www.lanacion.com.ar/1170654-como-se-investigan-lossentimientos-en-internet. Última visita: Enero 2012. [WIKI11] http://en.wikipedia.org/wiki/Sentiment_analysis. Última visita: Septiembre 2011.