UNIVERSIDAD TECNOLÓGICA DE CIUDAD JUÁREZ Carrera: Tecnologías de la Información y Comunicación Periodo: Enero – Abril 2022 Unidad 1: Introducción al análisis de datos Nombre: Catedrático: Materia: Extracción de Conocimiento en Base de Datos Ing. Luis Enrique Renteria Sánchez Actividad 1: Conceptos IA y Big Data Angel Alberto Magdaleno Lara Grupo: IDSM31E Fecha: 10 Enero 2022 DESARROLLO Identificar y desarrollar los siguientes conceptos 1. Inteligencia Artificial (IA) a. Características ● Capacidad de reacción ante la información disponible en el entorno; ● Memoria y aprendizaje a partir de experiencias determinadas; ● Capacidad para resolver problemas específicos; ● Adaptabilidad; ● Capacidad de percepción sensorial (auditiva, visual, táctil); ● Capacidad para gestionar, esto es, una infraestructura coherente y clara para su aplicación; ● Resiliencia, es decir, capacidad para la optimización; ● Buen rendimiento, esto es, posibilidad de manejar eficientemente gran cantidad de información; ● Carácter medible para cuantificar el rendimiento y hacer inversiones futuras. b. Beneficios ● Automatización de procesos ● Reduce el error humano ● Potencia la creatividad ● Aporta precisión ● Agiliza la toma de decisiones c. Restricciones ● Dificultad de acceso a los datos ● Falta de profesionales cualificados ● Su desarrollo es costoso 1 d. Retos o metas ● La Inteligencia Artificial tiene como objetivo el llegar a construir esas “máquinas”, y mejorar el conocimiento de la inteligencia. Esas máquinas deberían ser capaces de imitar, o superar, las capacidades mentales de los humanos: razonamiento, comprensión, imaginación, reconocimiento, creatividad, emociones e. Lenguajes ● Cualquier lenguaje de programación puede ser usado para desarrollar programas de inteligencia artificial. No obstante, destacan en especial tres lenguajes que fueron desarrollados específicamente para realizar programas dotados de inteligencia artificial, los lenguajes Lisp, Prolog y Ops5. f. Herramientas ● Máquinas reactivas ● Máquinas con memoria limitada ● Máquinas con teoría de la mente ● Máquinas con autoconciencia g. Casos de aplicación ● Automatización del hogar (climatización inteligente, programación de encendido y apagado de luces y artefactos, etc.); ● vehículos autónomos; ● asistentes de voz como Google Assistant, Siri (Apple) o Alexa (Amazon Echo), entre otros; 2. Machine Learning a. Características ● El Machine Learning es una disciplina del campo de la Inteligencia Artificial que, a través de algoritmos, dota a los ordenadores de la capacidad de identificar patrones en datos masivos y elaborar predicciones (análisis predictivo). b. Beneficios ● Mejor servicio al cliente ● Disminución de errores 2 ● Acciones preventivas ● Ciberseguridad ● Detección de fraudes ● Automatización de procesos. c. Restricciones ● Adquisición de datos ● Tiempo y recursos ● Interpretación ● Alta susceptibilidad a errores d. Retos o metas ● El objetivo es desarrollar software que sea alimentado por conjuntos de datos específicos y que aprenda a partir de ellos. Existe una fase inicial de entrenamiento en la que se nutre al software de ejemplos, experiencia directa o instrucciones. Es una fase dirigida en la que es muy importante disponer de conjuntos de datos relevantes para cumplir con los objetivos. e. Lenguajes ● R. ● Python. ● SQL. ● Java. ● Scala. ● Julia. ● MATLAB. f. Herramientas ● Supervised Learning ● Unsupervised Learning ● Reinforcement Learning g. Casos de aplicación ● Recomendaciones ● Vehículos inteligentes 3 ● Redes sociales ● Procesamiento de Lenguaje Natural (PLN) ● Búsquedas 3. Data Mining a. Características ● La minería de datos (data mining), es un proceso para detectar información de conjuntos grandes de datos, de la manera más automática posible. Su objetivo es encontrar patrones, tendencias o reglas que expliquen el comportamiento de los datos en un contexto específico. b. Beneficios ● Se puede aplicar a un montón de escenarios empresariales diferentes. ● Contribuye a gestionar y organizar la información de tu empresa de forma más eficiente. ● Colabora en el ahorro de costos y tiempo en los procesos de tu organización. ● Te ayuda a prevenir situaciones adversas futuras basándose en datos verídicos. ● Al mostrar información clave, contribuye en la toma de decisiones estratégicas. ● Facilita el conocimiento de los usuarios de tu empresa, sus gustos, preferencias, comportamientos. ● Te ayuda a optimizar tus productos o servicios en base a la información que te brinda sobre el comportamiento online de tus clientes. Esto a su vez te lleva a aumentar tus ventas. ● Brinda la posibilidad de desarrollar estrategias para encontrar y atraer nuevos clientes. ● Te posibilita mejorar la atención al cliente de tu empresa a partir de la información obtenida. c. Restricciones ● Temas de seguridad ● Problemas de privacidad ● Uso indebido de información / información inexacta d. Retos o metas 4 ● Asociación: determinar conjunto de objetos que se dan frecuentemente juntos en el contexto del problema. ● Clustering: segmentar una población de objetos heterogénea en un número de grupos más homogéneos o clústeres. ● Clasificación: consiste en examinar las características de un objeto nuevo y asignarlo a un conjunto finito predefinido de clases. ● Estimación: dado un conjunto de datos de entrada el modelo estima el valor de una magnitud continua desconocida. ● Predicción: dado un conjunto de datos de entrada el modelo estima el valor de una magnitud futura. ● Descripción: describir las características de un conjunto de objetos en forma de asociaciones significativas o causales entre diferentes variables. ● Explicación: determinar las razones de un determinado comportamiento. e. Lenguajes ● Lenguaje de programación/estadística: R, Python, C++, Java, Matlab, SQL, SAS, shell/awk/sed… ... ● Big data procesamiento de datos: Hadoop, Storm, Samza, Spark, Flink. ... ● Sistema Operativo: Linux. f. Herramientas ● RapidMiner. Quizá sea la herramienta más utilizada. ... ● Orange. Esta herramienta trabaja con operadores para clasificación, regresión y clustering. ... ● WEKA. ... ● KNIME. ● SAS. g. Casos de aplicación ● También funciona para conocer, además de eventos futuros, datos importantes que conviene saber, pero que no están a la vista. Por ejemplo, una relación inusual entre las ventas de dos productos diferentes y cómo esa relación varía de acuerdo a cómo se posicionan estos productos en los locales de ventas al por menor. 5 4. Big Data a. Características ● Volumen ● Velocidad ● Variedad b. Beneficios ● Los negocios pueden utilizar la inteligencia exterior mientras toman decisiones. ● Mejor servicio al cliente ● Identificación temprana del riesgo a los productos o servicios, de ser el caso ● Mejor eficiencia operacional c. Restricciones ● El exceso de datos ● Ciberseguridad ● Las políticas de protección de datos ● Tecnofobia d. Retos o metas ● Nuevos consumidores ● Identificar nuevos consumidores y abarcar mayor cuota en el mercado es otra de las razones por las cuales se implementan estrategias big data, pues cuenta con el 37 por ciento de las menciones. e. Lenguajes ● R. ● Python. ● SQL. ● Java. ● Scala. ● Julia. ● MATLAB. f. Herramientas 6 ● Python. Es uno de los lenguajes avanzados de programación más conocidos y utilizados en la actualidad. ... ● LENGUAJE R. ... ● HADOOP. ... ● APACHE SPARK. ... ● MONGODB. ... ● APACHE CASSANDRA. ... ● ELASTICSEARCH. ... ● APACHE STORM. g. Casos de aplicación ● Motor de recomendación. ... ● Análisis de percepciones. ... ● Análisis y modelos de riesgo. ... ● Detección de Fraude. ... ● Análisis campaña de marketing. ... ● Abandono de clientes. ... ● Análisis de la experiencia de cliente. ... ● Monitoreo de la red. 5. Cuales seria las diferencias entre los cuatro conceptos anteriores El objetivo de la IA es crear un sistema informático inteligente como los humanos para resolver problemas complejos, mientras que el del aprendizaje automático es permitir que las máquinas aprendan de los datos para que puedan dar resultados precisos. La IA está trabajando para crear un sistema inteligente que pueda realizar varias tareas complejas. Por su parte, el aprendizaje automático procura crear máquinas que puedan llevar a cabo solo aquellas tareas específicas para las que están capacitadas. Las principales aplicaciones de la IA son Siri, atención al cliente mediante chatbots, juegos en línea, robots humanoides inteligentes, etc. Por el contrario, las principales aplicaciones del aprendizaje 7 automático son los sistemas de recomendación en línea, los algoritmos de búsqueda de Google, las sugerencias de etiquetado automático de amigos en Facebook, etc. El Big Data se centra en analizar los grandes volúmenes de datos que superan la capacidad de los procesamientos informáticos habituales. Su objetivo es el de analizar en el menor tiempo posible y de forma eficaz toda la información. Es por ese motivo que hace uso de software que le permite definir las características a nivel cliente y usuario. En cambio, la minería de datos o Data Mining analiza los grandes volúmenes de datos. Sintetiza e identifica y agrupa patrones de comportamiento entre los datos. 6. Conclusión personal Todos estos conceptos que se vieron, son muy importantes y muy beneficiosos para la sociedad. Nos brindan extensas herramientas para tener un mejor control y sostenimiento de nuestras vidas. Por ejemplo, programar un evento, seleccionar una canción, ver el clima, saber la hora, realizar una llamada, etc. Pienso que en un futuro no muy lejano, las inteligencias artificiales podrán realizar más tareas en casa y sin duda alguna, nos facilitarán más la vida. 7. Citas de fuente de información ● S. (2020, 14 febrero). Inteligencia artificial (IA). Significados. https://www.significados.com/inteligencia-artificial/ ● de Expertos, E. (s. f.). Inteligencia artificial, ventajas y desventajas. VIU. https://www.universidadviu.com/es/actualidad/nuestros-expertos/inteligencia-artificial-ventajasy-desventajas ● Descubre los principales beneficios del Machine Learning. (s. f.). Iberdrola. https://www.iberdrola.com/innovacion/machine-learning-aprendizaje-automatico ● R. (2019, 8 abril). Beneficios que aporta aplicar Machine learning en la empresa. Zemsania Global Group. https://zemsaniaglobalgroup.com/machine-learning-en-la-empresa/ ● Agrawal, A. (2022, 12 enero). Destaca las ventajas y desventajas del aprendizaje automático. Aprendizaje automático. 8 https://www.cisin.com/coffee-break/es/enterprise/highlights-the-advantages-and-disadvantages -of-machine-learning.html ● A. (2020a, septiembre 9). ¿Qué es Machine Learning y por qué es tan importante? Blog de arsys.es. https://www.arsys.es/blog/soluciones/infraestructura/machine-learning ● Serrato, C. (2021, 11 junio). Conoce las limitaciones o desventajas del Data Mining. INMEDIATUM - We build and grow business on Internet. https://inmediatum.com/blog/estrategia/conoce-las-limitaciones-o-desventajas-del-data-mining/ ● 10 Habilidades Básicas que Requiere la Minería de Datos. (s. f.). Octoparse. https://www.octoparse.es/blog/10-habilidades-para-data-mining ● C. (2020, 20 noviembre). ¿Qué es el big data y cuáles son sus beneficios? Escuela de Postgrado de la Universidad Católica San Pablo. https://postgrado.ucsp.edu.pe/articulos/que-es-big-data/ ● Ventajas y desventajas del uso del Big Data - Máster en Business Intelligence y Data Science. (2021, 29 junio). Máster en Big Data y Business Analytics. https://master-bigdata.com/ventajas-y-desventajas-big-data/ ● Mesa editorial Merca2.0. (2016, 19 abril). 5 metas que buscan las empresas al implementar estrategias big data. Revista Merca2.0. https://www.merca20.com/5-metas-buscan-las-empresas-al-implementar-estrategias-big-data/ Luis--renteria@hotmail.com Asunto: IDSM31 nombre + apellido U1A1 Conceptos IA y Big Data Nombre y formato archivo: IDSM31 nombre + apellido U1A1 Conceptos IA y Big Data.PDF Fecha de entrega: jueves 13 de enero 2022 (Todo el día) 9