Introducción al Curso y al Libro de Tom Mitchell Al campo de Aprendizaje Automatizado (Machine Learning) le concierne la pregunta de: Como construir programas capaces de mejorar automáticamente con la experiencia. Recientemente, han sido desarrolladas varias aplicaciónes exitosas: desde programas de minería de datos que aprenden a detectar transacciones frauduletas de tarjetas de crédito, sistemas de filtrado de información que aprenden las preferencias de lectura de los usuarios, hasta vehículos autónomos que aprenden a manejar en autopistas públicas. Al mismo tiempo, ha habido imporantes avances en la teoría y algoritmos que conforman los fundamentos de este campo. La meta del libro de texto de Tom Mitchel, Machine Learning, es presentar los algoritmos y teoría clave que conforman el núcleo del área de aprendizaje. El área de aprendizaje, toma conceptos y resultados de muchas áreas: estadística, inteligencia artifical, filosofía, teoría de la información, biología, ciencias cognitivas, complejidad computacional, y teoría de control. Una buena manera de aprender ML es considerar estas distintas perspectivas y comprender la formulación de problemas, algoritmos y suposuciones que fundamentan cada una de ellas. Dada la naturaleza interdisciplinaria del material, se hacen pocas suposiciones sobre el background del lector. Se introducen los conceptos básicos de estadística, inteligencia artificial, teoría de la información y otras disciplinas a medida que surge la necesidad, enfocandose en aquellos conceptos que son relavantes para el área de ML. Principios que guían la escritura del libro: Ser acesible a estudiantes de pregrado Contener material que los estudiantes de doctorado en ML deberian saber Balance entre teoría y práctica Carácterísticas del curso En éste curso veremos algunos capítulos del libro de Mitchell. Concretamente, los capítulos: 1) Introducción 2) Aprendizaje de conceptos 3) Aprendizaje en Arboles de decisión 4) Redes neurales artificiales 5) Evaluación de hipótesis 6) Aprendizaje Bayesiano 9) Algoritmos genéticos 13) Aprendizaje por reforzamiento La evaluación se basará en 4 Tareas (40 %), y 2 parciales (60%). Las Tareas pueden ser en equipos de dos o tres. Las tareas se presentaran con un pequeño informe y presentación oral en clase: dificultades, resultados, graficas, etc. En la página del curso, se colocara el material correspondiente a las clases, y tareas. Se usaran las laminas elaboradas y publicadas por el autor Tom Mitchell. En lo posible colocare también el contenido (en español) de las clases en un archivo word. Definición de Minaría de Datos (Data Mining DM): Las de “Minería de Datos”, o Data Mining, tratan de extraer información y patrones de comportamiento ocultos en grandes volúmenes de datos KDD y DM: definiciones KDD: descubrimiento de conocimiento en bases de datos DM: minería de datos KDD = proceso completo: «extracción no trivial de conocimiento implícito, previamente desconocido y potencialmente útil, a partir de una base de datos» (Frawley et al., 1991) DM = etapa de descubrimiento en el proceso de KDD: «paso consistente en el uso de algoritmos concretos que generan una enumeración de patrones a partir de los datos preprocesados» Definición de Inteligencia Artificial En la bibliografía del área encontramos diferentes definiciones que pueden darnos una idea de lo que se llama inteligencia artificial: Una de las áreas de la computación encargadas de la creación de hardware y software con comportamientos inteligentes. El estudio de programas que permiten percibir, razonar y actuar Estudia como lograr que las máquinas realicen tareas que, por el momento, son realizadas mejor por los seres humanos. Desde el punto de vista de los objetivos, la IA puede considerarse como parte de la ingeniería o de la ciencia: El objetivo ingenieril de la IA es resolver problemas reales, actuando como un armamento de ideas acerca de cómo representar y utilizar el conocimiento, y de como ensamblar sistemas El objetivo científico de la IA es explicar varios tipos de inteligencia. Determinar qué ideas acerca de la representación del conocimiento, del uso que se le da a éste, y del ensamble de sistemas explican distintas clases de inteligencia. Algunas aplicaciones de la inteligencia artificial: Tareas de la vida diaria (más dificil para una máquina que las tareas de un experto) o Percepción (visión y habla) o Lenguaje natural (comprensión, generación, traducción) o Sentido común o Control de un robot Tareas formales o Juegos (ajedrez, backgammon, damas) o Matemáticas (geometría, lógica, cálculo, demostración de propiedades) Tareas de los expertos (necesitan un conocimiento menor que el conocimiento necesario en las tareas más comunes) o Ingeniería (diseño, detección de fallos, planificación de manufacturación) o Análisis científico o Diagnosis médica o Análisis financiero