Cuarto Quinto Nivel 1/18 Cuarto Quinto Nivel 1.1. La comunicación La comunicación es un proceso vital que se realiza mediante el intercambio de ideas entre dos o más interlocutores que comparten características similares a fin de que el mensaje transmitido sea comprendido. Proviene del latín communicare que significa compartir información. Este, a su vez, se deriva de communis, que es mutuo. La comunicación no es un proceso propio ni exclusivo del ser humano, existe comunicación humana que es más compleja, pero también comunicación no humana. Hablar de la evolución de la comunicación es referirnos a la historia misma de la humanidad, ya que las primeras manifestaciones de nuestra especie están ligadas a la adquisición del lenguaje y antes de este a la comunicación, pues cuando hablamos de comunicación no nos referimos únicamente al lenguaje oral transmitido por medio de la articulación de palabras ligadas a un idioma; la comunicación va más allá. Este proceso de comunicación puede ser verbal, escrito o no verbal, ligando a la comunicación con existencia misma de la voz para crear sonidos y con la existencia misma de la persona para transmitir movimientos. ▲ ▼ 2/18 Figura 1. Clasificación general de la comunicación. https://www.uaeh.edu.mx › pnle › PRES55 La comunicación es un proceso vital que se realiza mediante el intercambio de ideas entre dos o más interlocutores que comparten características similares a fin de que el mensaje transmitido sea comprendido. Proviene del latín communicare que significa compartir información. Este, a su vez, se deriva de communis, que es mutuo. La comunicación no es un proceso propio ni exclusivo del ser humano, existe comunicación humana que es más compleja, pero también comunicación no humana. Hablar de la evolución de la comunicación es referirnos a la historia misma de la humanidad, ya que las primeras manifestaciones de nuestra especie están ligadas a la adquisición del lenguaje y antes de este a la comunicación, pues cuando hablamos de comunicación no nos referimos únicamente al lenguaje oral transmitido por medio de la articulación de palabras ligadas a un idioma; la comunicación va más allá. Este proceso de comunicación puede ser verbal, escrito o no verbal, ligando a la comunicación con existencia misma de la voz para crear sonidos y con la existencia misma de la persona para transmitir movimientos. El lenguaje no verbal fue el primero desarrollado por el ser humano, después aparecería el verbal y luego el lenguaje escrito, aunque dentro del lenguaje no verbal podemos decir que la primera comunicación se da entre la madre y el hijo aun estando dentro del vientre cuando este transmite malestar, hambre, necesidades o, según entendidos, hasta sentimientos. La comunicación nació con el ser humano y con la capacidad de transmitir sus necesidades, pensamientos, sentimientos, etc. La comunicación no es un proceso inerte; por el contrario, es dinámico pues como punto de partida tenemos un emisor, que trasmite un mensaje a un receptor, este lo decodifica y se convierte en emisor para trasmitir la respuesta, volviendo al primer emisor como ente receptor de un nuevo mensaje. Además, es un proceso innato y vital no solo del ser humano. Estudios biológicos afirman que todas las especies tienen su proceso de comunicación, sea sonoro, visual, olfativo, químico, táctil. Dentro de estos mismos estudios, se ha determinado que la comunicación como un proceso de transmisión de información generalmente es entre animales de la misma especie. Así, una persona puede hablar con otra; sin embargo, también existen estudios que afirman que esta comunicación no solo es entre animales de la misma especie, pues una caricia a un perro ya es considerada una forma de comunicación. Lo que sí es igual entre todas las especies o interespecies es que esta comunicación persigue un propósito. En cuanto a la comunicación humana, el psicólogo Paul Watzlawick (1974) estudió el proceso comunicacional y estableció cinco axiomas o postulados claros e ineludibles que por sí mismos se explican sin necesidad de una demostración o de prueba alguna. Cuarto Quinto Nivel 1.1.1. El proceso de comunicación El proceso comunicativo fue y es vital para el desarrollo del ser humano y junto a este el desarrollo de la vida en sociedad. Este proceso permite que el ser humano pueda adquirir conocimientos de una persona a otra y, a la vez, que pueda transmitir los suyos, pensamientos, ideas, sentimientos, conocimientos, necesidades, etc. ▲ Bajo este concepto, se entienden como pasos de la comunicación los que nacen desde el interlocutor con la intención de transmitir el mensaje. Este proceso nace en respuesta a las capacidades cognitivas de la persona. Seguido, esta idea debe decodificarse por medio de un código que puede ser verbal, no verbal, escrito, por medio de señas, etc. Una vez determinado el código que se va a utilizar para la transmisión del mensaje, este pasa por un canal que debe ser accesible y compatible con el receptor, quien, a su vez, recibe el mensaje para nuevamente decodificarlo, según el código utilizado por el emisor que permita la interpretación del mismo. Figura 3. Proceso de la comunicación oral y escrita. https://www.youtube.com/watch?v=1t-Kd40-U7Q ▼ 3/18 Cuarto Quinto Nivel 1.1.1. El proceso de comunicación Este proceso de interpretación es igual único e independiente del receptor pasando por varios factores intrínsecos y extrínsecos. Finalmente, para que el proceso de comunicación sea efectivo, se espera una respuesta que coincide con los mismos pasos descritos. ▲ Este proceso de comunicación es bidireccional, dinámico, puede ser espontáneo o no propio no solo de organismos vivos como seres humanos o personas. En la actualidad, con la evolución de la tecnología y de la robótica, existen transmisores de información que no están ligados a la intención de un interlocutor o de un receptor. El proceso de la comunicación se enmarca en: ⬥ La producción del mensaje: información, decodificación y emisión. ⬥ La comprensión del mensaje: recepción, decodificación, interpretación, respuesta. Figura 3. Proceso de la comunicación oral y escrita. https://www.youtube.com/watch?v=1t-Kd40-U7Q ▼ 3/18 Cuarto Quinto Nivel 1.1.2. Elementos de la comunicación A fin de realizar un proceso comunicativo eficiente, dentro de este proceso de comunicación, intervienen varios factores como Emisor Receptor Mensaje La interferencia El contexto Quien genera y trasmite el mensaje valiéndose de un canal. Este es el punto de partida del mensaje quien haciendo uso de sus necesidades y procesos cognitivos promueve la generación del mensaje. Canal Código Figura 3 4/18 Cuarto Quinto Nivel 1.1.2. Elementos de la comunicación A fin de realizar un proceso comunicativo eficiente, dentro de este proceso de comunicación, intervienen varios factores como Emisor Receptor Mensaje La interferencia El contexto Canal Quien recibe el mensaje para ser decodificado y comprendido según sea transmitido. A este también se lo conoce como interlocutor. Para que un mensaje tenga éxito se espera una respuesta al mismo. Este rol de receptor es un rol dinámico ya que al transmitir una respuesta cambia el rol con el emisor principal quien, de manera voluntaria o involuntaria, en el primer mensaje puede responder o no, aunque basados en el axioma de que todo es comunicación, el no responder un mensaje también es un proceso de comunicación. Código Figura 3 4/18 Cuarto Quinto Nivel 1.1.2. Elementos de la comunicación A fin de realizar un proceso comunicativo eficiente, dentro de este proceso de comunicación, intervienen varios factores como Emisor Receptor Mensaje La interferencia El contexto Es la idea transmitida entre un emisor y un receptor. Este mensaje puede ser la combinación de grafemas o fonemas, si es escrito o verbal, o de sonidos o movimientos, si es no verbal. Para que el mensaje sea transmitido con éxito y recibido de la misma manera, es necesario que el código sea claro para ambos o para todos los intervinientes. Canal Código Figura 3 4/18 Cuarto Quinto Nivel 1.1.2. Elementos de la comunicación A fin de realizar un proceso comunicativo eficiente, dentro de este proceso de comunicación, intervienen varios factores como Emisor Receptor Mensaje La interferencia El contexto Son ruidos o perturbaciones que pueden presentarse durante la emisión del mensaje o la respuesta del mismo. Estas interferencias pueden producir retraso en el mensaje o mala interpretación del mismo. Canal Código Figura 3 4/18 Cuarto Quinto Nivel 1.1.2. Elementos de la comunicación A fin de realizar un proceso comunicativo eficiente, dentro de este proceso de comunicación, intervienen varios factores como Emisor Receptor Mensaje La interferencia El contexto Son las circunstancias que promueven que la comunicación se desarrolle. Existen circunstancias que promueven o que interfieren en la emisión de un mensaje, pueden ser asociadas con el medioambiente o con las circunstancias del momento en el que se transmite el mensaje. Por ejemplo, la hora del día, la familiaridad de los intervinientes, el factor emocional. Canal Código Figura 3 4/18 Cuarto Quinto Nivel 1.1.2. Elementos de la comunicación A fin de realizar un proceso comunicativo eficiente, dentro de este proceso de comunicación, intervienen varios factores como Emisor Receptor Mensaje La interferencia El contexto Es el medio usado para trasmitir el mensaje. Este medio puede ser físico, si se transmite el mensaje de manera escrito sobre alguna superficie; puede ser virtual, si el mensaje es transmitido utilizando algún medio tecnológico. Dentro de este contexto, intervienen los aparatos tecnológicos utilizados y pueden ser visuales o incluso si es oral o de ruidos es necesario el uso del aire. Canal Código Figura 3 4/18 Cuarto Quinto Nivel 1.1.2. Elementos de la comunicación A fin de realizar un proceso comunicativo eficiente, dentro de este proceso de comunicación, intervienen varios factores como Emisor Receptor Mensaje La interferencia El contexto Es el lenguaje empleado para transmitir el mensaje. Este puede ser verbal, no verbal o escrito. Para escoger el código a utilizar en la transmisión de un mensaje, es necesario tomar en cuenta varios factores como el propósito, el tono, el tiempo, el idioma, la forma. Canal Código Figura 3 4/18 Cuarto Quinto Nivel 1.1.2. Elementos de la comunicación A fin de realizar un proceso comunicativo eficiente, dentro de este proceso de comunicación, intervienen varios factores como Emisor Receptor Mensaje La interferencia El contexto Canal Código Figura 3 4/18 La comunicación, según su propósito, puede generar efectos negativos o positivos tanto en el emisor como en el receptor. Estos efectos pueden ser planificados o producidos por elementos externos como la interferencia o la errónea comprensión del mensaje. Dentro de estos efectos de la comunicación interviene, además, la inteligencia emocional tanto del emisor como del receptor, pues en la actualidad la comunicación que tiene mayor auge es por medio de la tecnología y el mensaje puede ser malinterpretado, incluso por la puntuación. Los efectos que puede causar la comunicación son diferentes y dependen de varios factores intrínsecos y extrínsecos; por lo tanto, ninguna respuesta a un mensaje se la puede analizar como única. Berelson (1948) determinó que “ciertos tipos de asuntos, presentados a cierto tipo de personas, producen cierto tipo de efecto”. Esto nos indica que para que el proceso de la comunicación sea efectivo depende de factores propios de cada persona. El mismo mensaje, aun cuando sea transmitido de manera correcta, puede no siempre generar el mismo efecto. 1.2.1. Efectos positivos La asertividad en la comunicación es una habilidad blanda que hoy en día es extremadamente valorada pues en un mundo en el que la comunicación cara a cara se va perdiendo y cada vez se vuelve más “fría” por medio de aparatos electrónicos, el mensaje necesita ser más claro ya que omite entonación, pausas, gestos, etc. Para afirmar que una comunicación fue positiva es necesario que el emisor logre comprender que el mensaje fue transmitido y alcanzó el propósito esperado y, a la vez, que el receptor se pueda transformar, además, en un perceptor de todo lo que trae consigo el mensaje, siendo un interlocutor del mismo, volviendo a este proceso dinámico en la transmisión y recepción de mensajes. Otros efectos positivos de la comunicación son: Permite la evolución del ser humano. Convivencia social. Expresar ideas, sentimientos, opiniones. Transmisión de conocimientos Aprendizaje por medio del conocimiento de otros Desarrollo de la empatía Enriquecimiento cognitivo Desarrollo de la inteligencia emocional Otros efectos positivos de la comunicación son: Permite la evolución del ser humano. Convivencia social. Expresar ideas, sentimientos, opiniones. Transmisión de conocimientos Aprendizaje por medio del conocimiento de otros Desarrollo de la empatía Enriquecimiento cognitivo Desarrollo de la inteligencia emocional 1.2.2. Efectos negativos La comunicación no siempre tiene efectos positivos, a veces esta es malinterpretada. En cuanto a los efectos negativos, no podemos decir que el transmitir ira sea un efecto negativo de la comunicación, pues si el emisor trata de transmitir ira y el receptor comprende esa ira, el mensaje tuvo éxito. Cuando hablamos de efectos negativos de la comunicación nos referimos a que el mensaje no fue transmitido de la manera que el emisor esperaba o que el receptor no pudo comprender el mensaje. Cuando la transmisión del mensaje es ineficiente, se producen efectos negativos en la recepción del mismo, esto puede ser por factores internos del emisor o del receptor al no encontrarse en el mismo nivel lingüístico para comprender el mensaje o factores externos como ruidos o canales ineficientes utilizados para la transmisión del mensaje o incluso el propio mensaje cuando no es claro, concreto, es ambiguo o carece de contexto, por lo que se vuelve irrelevante o absurdo. Las barreras de la comunicación Se conoce como barreras de la comunicación a los factores que interfieren para que el mensaje no sea recibido según fue planificado por el emisor del mismo. Son varios los factores que se pueden enumerar como ineficiente información, instrucciones vagas, diferencias en la comprensión y uso del vocabulario, retraso en la llegada de un mensaje, inferencias precipitadas. Entre las principales barreras de la comunicación están: Barreras ambientales para la transmisión de un mensaje Barreras tecnológicas cuando el canal es el incorrecto o no funciona Barreras verbales tanto del emisor como del receptor Barreras interpersonales cuando el nivel afectivo está muy elevado evitando una buena transmisión del mensaje Incorrecto uso de lenguaje no verbal Vocabulario confuso o doble intención Los rumores Barreras cognitivas Barreras en el uso del lenguaje Los Orígenes del Lenguaje Dr. C. George Boeree Traducción al Español: Claudio Fuenzalida Esta es una pregunta intrigante, a la cual quizás nunca podamos dar una respuesta completa. ¿Cómo pasamos de la vocalización animal al lenguaje humano? Los animales a menudo hacen uso de los signos, los cuales apuntan a lo que representan, pero no usan símbolos, los cuales son arbitrarios y convencionales. Ejemplos de signos incluyen estornudar como signo de un resfrío, nubes como signo de lluvia, o un perfume como signo de territorio. Los símbolos incluyen cosas como las palabras que usamos. Dog, Hund, chien, cane, perro – estos son símbolos que se refieren a una criatura que llamamos así, aunque cada una de estas palabras no contiene nada en sí que de alguna manera pueda dar cuenta de esta criatura. Además, el lenguaje es un sistema de símbolos, con muchos niveles de organización (al menos, fonética, sintaxis y semántica). Entonces, ¿cuándo comenzó el lenguaje? ¿A los primeros comienzos del hombre tal vez hace 4 ó 5 millones de años? ¿O con el advenimiento del hombre moderno, Cro-magnon, hace unos 125.000 años? ¿El Neandertal hablaba? Ellos tenían un cerebro más grande que el nuestro, pero su laringe estaba, al parecer, más alta en su garganta, como la de los simios. No lo sabemos. Hay muchas teorías acerca del origen del lenguaje. Muchas de éstas tienen nombres tradicionales y divertidos, y yo crearé un par más cuando sea necesario: 1. La teoría mama. El lenguaje habría comenzado con las sílabas más fáciles relacionadas con los objetos más significantes. 2. La teoría ta-ta. Sir Richard Paget, influenciado por Darwin, postuló que el movimiento del cuerpo precedió al lenguaje. El lenguaje habría comenzado como una imitación inconciente vocal de estos movimientos – tal como la boca de un niño se moverá cuando usa tijeras, o aprieto mi lengua entre mis dientes cuando trato de tocar guitarra -. 3. La teoría bow-wow. El lenguaje habría comenzado como imitaciones de sonidos naturales – mu, chu-chu, pash, bzz, miau -. Esto se conoce más con el nombre de onomatopeya. 4. La teoría pu-pu. El lenguaje habría comenzado con interjecciones, gritos instintivos y emotivos, tales como ¡oh! para indicar sorpresa, o ¡auch! para indicar dolor. 5. La teoría ding-dong. Algunas personas, incluyendo al famoso lingüista Max Muller, han planteado que existe una misteriosa correspondencia entre sonidos y significados. Palabras en inglés como small (pequeño), sharp (afilado) y en general cosas que él denomina “altas” (high things), tienden a tener vocales agudas abiertas en muchos idiomas, mientras que palabras como big (grande), round (redondo), en general cosas que él denomina “bajas” (low things) tienden a tener vocales cerradas posteriores. Esto también es conocido como simbolismo del sonido. 6. La teoría yo-hey-ho. El lenguaje habría comenzado con cantos rítmicos, tal vez finalmente de los gruñidos del trabajo pesado. El lingüista D. S. Diamond sugiere que tal vez éstos fueron llamados de apoyo o cooperación acompañado de los gestos correspondientes. Esto podría relacionar esta teoría con la teoría ding-dong. 7. La teoría sing-song. El lingüista danés Jesperson sugirió que el lenguaje habría salido del juego, la risa, arrullos, cortejos, susurros, y expresiones emocionales similares. Incluso sugirió que, contrario a las teorías, tal vez algunas de nuestras primeras palabras fueron de hecho largas y musicales, en vez de gruñidos cortos, como muchos piensan. 8. La teoría hey tú. Un lingüista de nombre Revesz sugirió que siempre hemos necesitado contacto interpersonal, y que el lenguaje comenzó como sonidos para señalar tanto la identidad (¡aquí estoy!) y la pertenencia (¡estoy contigo!). También podemos gritar de miedo, rabia o dolor (¡ayúdame!). Esta es comúnmente llamada la teoría del contacto. 9. La teoría del hocus pocus. Creo que el lenguaje pudo haber tenido algunas raíces en una especie de aspecto mágico o religioso de la vida de nuestros ancestros. Quizás empezamos llamando con sonidos mágicos a los animales para domesticarlos, lo que se convirtió en sus nombres. 10. La teoría eureka. Y finalmente quizás el lenguaje fue concientemente inventado. Tal vez algunos ancestros tuvieron la idea de asignar arbitrariamente sonidos para significar ciertas cosas. Claramente, una vez que la idea se tuvo, ¡se esparciría como fuego! Otro tema es cuántas veces el lenguaje se originó (o fue inventado). Quizás fue inventado una vez, por nuestros primeros ancestros – tal vez por los primeros que tuvieron las propiedades genéticas y psicológicas necesarias para producir complejos sonidos y organizarlos en series. Esto es llamado monogénesis. O quizás fue inventado muchas veces – poligénesis – por mucha gente. Podemos intentar reconstruir las primeras formas de lenguaje, pero sólo podemos ir hasta cierto punto antes que los ciclos de cambio destruyan cualquier posibilidad de reconstrucción. Muchos dicen que sólo podemos volver quizás hasta 10.000 años atrás antes de que la huella se enfríe. Por lo tanto, quizás simplemente nunca sabremos. Quizás el debate más grande entre los lingüistas y otros interesados en los orígenes del lenguaje es si podemos dar cuenta del lenguaje usando sólo los mecanismos básicos de aprendizaje, o si necesitamos postular algún tipo de apresto especial para el lenguaje. La gente orientada solamente al aprendizaje (por ejemplo, B. F. Skinner) dice que el condicionamiento infantil, o quizás el modelaje, puede dar cuenta de la complejidad del lenguaje. La gente orientada hacia la existencia de un dispositivo de adquisición del lenguaje (LAD: language-acquisition-device), tales como Chomsky y Pinker, dicen que la facilidad y rapidez con que los niños aprenden el lenguaje requiere la existencia de algo más. El debate sólo es real para aquellos que prefieren tomar uno u otro de estos extremos. Parece muy claro para la mayoría que ninguna es la respuesta. ¿Hay algún mecanismo neuronal especial para el lenguaje? No en el sentido de un LAD. En la mayoría de los mamíferos, ambos hemisferios lucían bastante similares. En algún punto de los primeros años de la humanidad, unas pocas personas posiblemente heredaron una mutación que dejó a un hemisferio con una capacidad limitada. En lugar de que las conexiones neuronales fueran en cada dirección, tendieron a organizarse más linealmente. El otro hemisferio no pudo relacionarse con las cosas del modo multidimensional usual. Pero ¡sorpresa!, esa misma capacidad disminuida resultó ser muy buena para ordenar cosas linealmente. Y eso es exactamente lo que el lenguaje necesita: la habilidad para convertir eventos completamente dimensionales en secuencias lineales de sonidos, y viceversa. © Copyright 2007, C. George Boeree and Claudio Fuenzalida Cuarto Quinto Nivel Bibliografía Barrera, R. (2013). Proceso de comunicación. Universidad Autónoma de Estado de Hidalgo, Sistema de Universidad Virtual. https://repository.uaeh.edu.mx/bitstream/handle/123456789/15815 Centro de Investigaciones y Servicios Educativos. (2019). El proceso de la comunicación oral y escrita. Programa Básico de Formación Docente. https://www.youtube.com/watch?v=1t-Kd40-U7Q Delgado, I. (2006). Comunicación. En Significados.com. https://www.significados.com/comunicacion/ Marín-Gutiérrez, I.; Ruiz San Miguel, F. & Robayo Valencia, C. (2016). Un concepto básico como la comunicación. 10.13140/RG.2.1.5078.1844. Tuzzo, R.; Toledo, S.; Delgado, M.; Larrosa, M. & Ghierra, A. (2009). Conceptos básicos de psicología en la formación de los profesionales de la salud. Tomo I. Montevideo: Oficina del Libro FEFMUR, Universidad de la República, Facultad de Medicina. Uriarte, J. (2020). Historia de la comunicación humana. Caracteristicas.co. https://www.caracteristicas.co/historia-de-la-comunicacion-humana/ Yáñez, M. (s/f). Efectos de la comunicación. Universidad Americana del Estado de Hidalgo. https://repository.uaeh.edu.mx/bitstream/bitstream/handle/123456789/19014/efectos-comunicacionmyr.pdf?sequence=1&isAllowed=y 7/18 Cuarto Quinto Nivel Autoevaluación ¿Qué es la comunicación? Un proceso de emitir un mensaje. Un proceso de intercambio de ideas. Un proceso de persuasión por medio de la palabra. Pregunta 1 de 10 8/18 Cuarto Quinto Nivel Autoevaluación ¿Con qué adjetivo se puede describir a la comunicación? Dinámica. Lineal. Intrépida. Pregunta 2 de 10 9/18 Cuarto Quinto Nivel Autoevaluación El proceso de comunicación se enmarca en Codificación-decodificación. Emisión-recepción. Producción-comprensión. Pregunta 3 de 10 10/18 Cuarto Quinto Nivel Autoevaluación Cuando el mensaje es transmitido de manera correcta, ¿produce siempre la misma reacción en todos los receptores? No, porque cada receptor es diferente. Sí, porque el mensaje es único. No, por lo general el emisor es el que debe reaccionar siempre. Pregunta 4 de 10 11/18 Cuarto Quinto Nivel Autoevaluación ¿Qué es el canal de la comunicación? El lugar. El lenguaje. El medio. Pregunta 5 de 10 12/18 Cuarto Quinto Nivel Autoevaluación Los efectos negativos del lenguaje son dependientes entre otros Del ambiente. De la ira del emisor. De la ira del receptor. Pregunta 6 de 10 13/18 Cuarto Quinto Nivel Autoevaluación La comunicación puede ser transmitida por Humanos, animales, robots. Solo humanos por medio de la escritura y el habla. Humanos y animales. Pregunta 7 de 10 14/18 Cuarto Quinto Nivel Autoevaluación El receptor también es conocido como Persona crítica. Interlocutor. Receptor tecnológico. Pregunta 8 de 10 15/18 Cuarto Quinto Nivel Autoevaluación ¿Puede el ambiente modificar la idea transmitida por el emisor? Sí, porque la temperatura modifica el canal. Sí, por la interferencia. Sí, porque el ambiente cambia con el interlocutor. Pregunta 9 de 10 16/18 Cuarto Quinto Nivel Autoevaluación El código en el proceso de comunicación es Lo más importante. Variable. Invariable. Pregunta 10 de 10 17/18 Este tipo de comunicación es exclusiva de los seres humanos a pesar de existir experimentos en los que los simios utilizan pinceles o lápices para “simular” una escritura. Este tipo de comunicación se basa en la transmisión de un mensaje por medio de la escritura. Algo que es importante, al igual que en la comunicación oral, es el código escrito sobre la base de grafemas, símbolos o pictografías que deben basarse en una lengua o idioma que ambos comprendan. El canal utilizado en la comunicación escrita es el visual. Los tipos de escritura son: • Ideogramas (símbolos gráficos) • Alfabético (grafemas) • Pictogramas (signos) Entre los idiomas que utilizan ideogramas podemos nombrar al chino, japonés, egipcio, esto indica que un símbolo gráfico puede expresar varias cosas o conceptos abstractos según el contexto, es una forma de comunicación escrita de más de 4000 años con raíces mesopotámicas. Ejemplo Entre los idiomas que utilizan alfabeto podemos nombrar al inglés, español, italiano. Esto indica que utilizan grafemas abstractos para la construcción de palabras. Ejemplo Entre los idiomas que utilizan pictogramas podemos nombrar los jeroglíficos egipcios. Esto quiere decir que utilizan signos para la representación gráfica de mensajes, que son importantes para la comunicación universal y han tomado impulso con la tecnología. Ejemplo Este sistema es complejo pues el sistema de escritura en cada idioma toma un proceso y está a su vez ligado al proceso lector. El primer alfabeto que se ha descubierto hasta la fecha es el fenicio (1000 a. C.), siendo el más antiguo de los tipos de escritura el pictograma pues los primeros indicios de su uso datan de hasta 9000 a. C. 2.1.2. Comunicación oral Este tipo de comunicación también es exclusivo del ser humano, pues su capacidad de abstracción, interpretación, inducción, deducción, memoria, secuencia y más le permiten llegar a este nivel de evolución. No se puede pasar por alto al hablar de la comunicación oral que su principal herramienta es la voz. Este tipo de comunicación se basa en la oralidad o la expresión del lenguaje por medio del habla. Este tipo de comunicación requiere el uso de fonemas que correspondan a un mismo idioma. A fin de llevar a cabo este proceso, tanto el emisor como el interlocutor requieren capacidades físicas y cognitivas para poder crear, comprender y transmitir el mensaje pero, además, algo que es importante al igual que en la comunicación escrita es el código que debe basarse en una lengua o idioma que ambos comprendan. El canal utilizado en la comunicación oral es el auditivo. No existe con certeza una fecha o algo que se le acerque para establecer cuándo el ser humano comenzó a desarrollar el lenguaje oral. Sin embargo, se estima que fue con el Homo Sapiens hace más de dos millones de años. Este más la aparición del fuego fueron los factores que determinaron la supremacía del ser humano frente a otras especies y, además, factores que le permitieron evolucionar y vivir en sociedad con otros. Existen varias teorías de los orígenes del lenguaje que son totalmente contrarias, ninguna ha podido ser comprobada en su totalidad ni tampoco descartada en su totalidad. La primera basada en la Monogénesis con base religiosa que sostiene que el lenguaje fue único en sus orígenes y después se subdividió. Y, la segunda basada en la Fitogénesis que sostiene que el lenguaje fue diferente desde sus inicios pues fue evolucionando con cada grupo social asentado en diferentes partes. Después de varios años de estudios e investigación, el lenguaje sigue siendo una incógnita. Se establecen que en el mundo existen alrededor de 7000 idiomas. 2.1.3. Comunicación no verbal Este tipo de comunicación omite la oralidad y la escritura, es innato y se basa en el lenguaje como el corporal, gestos, sonidos, señales. Dentro de esta categoría se establece la comunicación humana y animal que no necesita de palabras ni grafemas para transmitir información de uno a otro. Los tipos de comunicación no verbal en seres humanos son: • • • • Con base kinésica (lenguaje corporal, en el cual se incluye el lenguaje de señas) Icónica (signos) Con base proxémica (cercanía del emisor y receptor). Esta también tiene base cultural o religiosa. El psicólogo Edward Hall identificó que existen cuatro tipos de distancias entre personas y que transmiten un mensaje desde una distancia íntima, personal, social y pública. Con base paralingüística (sonidos) Esta comunicación no verbal tiene mucho que ver con la personalidad de cada uno, pues la manera como transmitimos un mensaje sin utilizar la voz ni la escritura es parte innata de cada quien y refleja una identidad por medio de las expresiones faciales, gestos, posturas, nivel de sonidos, etc. v “Se mide la inteligencia de un individuo por la cantidad de incertidumbres que es capaz de soportar” (Immanuel Kant). Esta frase nos adentra en lo que es el conocimiento, algo invaluable, profundo, confuso e inexplicable que se genera en el ser humano e incluso es capaz de trasmitirse en los genes por medio del núcleo celular como herencia genética de todo ser vivo. El conocer es adquirir información de todo tipo y tener la capacidad cognitiva de procesarla por medio de la razón, la inteligencia, la lógica, los sentimientos, las experiencias, etc. Es decir, que el conocimiento depende tanto de procesos intrínsecos como extrínsecos. Como la raíz etimológica lo dice: con que significa todo, gnoscere que significa conocer y miento que es medio. El conocimiento ha sido ampliamente estudiado desde la Edad Antigua y se divide en varias áreas. Todo ser humano conoce algo desde la primera infancia y a lo largo de su vida este conocimiento se va desarrollando, así como también lo hace él. El conocimiento no es estático y evoluciona según el paso del tiempo como evoluciona también dentro de la persona quien puede modificar, corregir, ampliar, reforzar lo conocido. La adquisición del conocimiento no siempre es consciente. Existe conocimiento que se adquiere de manera inconsciente pero que se va almacenando en el cerebro humano y sale a relucir en determinados momentos. El origen del conocimiento tiene varias teorías como todo lo que tiene que ver con el ser humano. La teoría que se apoya en el empirismo sostiene que el conocimiento se adquiere por medio del uso de los sentidos y de las experiencias que el ser humano vive a lo largo de su vida. Por otro lado, la teoría que apoya el racionalismo sostiene que solo se puede llamar conocimiento a la información adquirida por medio de la lógica y el análisis formal. Una base dogmática afirma que el conocimiento es de Dios y es dado a los hombres como regalo para comprender el mundo que les rodea y para decidir como parte de su libre albedrío. Elementos que intervienen en la adquisición del conocimiento Sujeto: es quien va a conocer. Objeto: a ser estudiado o aprendido. Conocimiento: la percepción individual frente a este objeto. Acceso al conocimiento por medio de los sentidos La epistemología Es la teoría del conocimiento que estudia cuál es el proceso para que una persona adquiera un conocimiento científico. En cuanto a las tendencias epistemológicas para la búsqueda de este conocimiento científico, se puede enumerar: • El escepticismo que indica que no es posible alcanzar un conocimiento o la verdad. • • El empirismo afirma que sí se puede llegar a un conocimiento o a la verdad por medio de los sentidos o de la experiencia que tenga el ser humano frente a un hecho. El racionalismo sostiene que sí se puede llegar a un conocimiento o a la verdad por medio del uso de la razón y fundamentado en la lógica. • El idealismo indica que sí se puede llegar a un conocimiento o a la verdad por medio de una realidad individual vivida por el ser humano en determinado momento. • El realismo con base en que sí se puede llegar a un conocimiento o a la verdad por medio de una realidad externa a la que un ser humano se enfrenta o percibe en un mundo exterior. La gnoseología Es la teoría del conocimiento que estudia cuál es el proceso para que una persona adquiera cualquier tipo de conocimiento. Es una teoría que inicia desde la Edad Antigua tratando de explicar el origen y los límites del conocimiento humano. Aún no tiene un concepto fijo pues el conocimiento humano se cree ilimitado al igual que la capacidad del cerebro humano, que según los expertos indica que solamente se ha utilizado el 12 % de su capacidad. El cerebro humano El cerebro humano es un órgano sumamente complejo que se conecta de manera directa con el sistema nervioso central donde se procesa la vida misma del ser humano y su conocimiento. Es la función de conocer haciendo representaciones del mundo e internamente del individuo mismo por medio de la actividad neuronal del encéfalo y de los hemisferios cerebrales. El ciclo de conocimiento que se da en el cerebro humano para adquirir nueva información inicia en el cerebelo donde la información percibida por los cinco sentidos recorre el sistema nervioso llegando a la corteza cerebral. A continuación, la corteza cerebral decodifica la información y esta es procesada en las zonas occipitales siguiendo un proceso largo y complejo pero inmediato. Finalmente, el cerebro ordena esta información en la zona frontal y la mitad del cerebro. Este es un ciclo habitual y permanente que se realiza durante cada momento en el que la persona está consciente. Modelo de los hemisferios cerebrales Tipos de conocimiento A priori Conocimiento teórico que el ser humano tiene previo a llevar a cabo la práctica. A posteriori Conocimiento que se adquiere después de poner en práctica algo que deja una reflexión o una experiencia en el ser humano. Proposicional Enfocándose a qué es lo que hay que saber. Es un conocimiento intelectual que permite el conocimiento racional y hasta cierto punto universal, como saber, por ejemplo, que la tierra es redonda. Práctico Enfocándose al cómo. Un conocimiento que se lo adquiere cuando se lleva a cabo una acción como saber cómo se prepara el arroz. Performativo Enfocándose al saber, que se puede dividir en dos: el conocimiento por algo que hemos visto o vivido y el conocimiento por algo que hayamos aprendido, como conocer lo que es una computadora o conocer que el cielo tiene diferentes capas. Tipos de conocimiento Segarra & Bou (2005) presentan los tipos de conocimiento sobre la base de estudios pioneros, (p. 181). Procesos cognitivos La adquisición del conocimiento implica procesos cognitivos complejos pues el cerebro humano, que es donde estos conocimientos son percibidos y procesados, es un órgano que aún no ha podido ser explorado ni utilizado en su totalidad. Cuarto Quinto Nivel 1/22 Los esquemas de organización del conocimiento se basan de primera mano en los procesos básicos del pensamiento. Estos sistemas de organización tienen dos visiones: una que se realiza dentro del cerebro humano como herramienta de organización de la información para el aprendizaje y otra que se utiliza para organizar la información en lugares donde es manejada de manera tangible o física como archivos, bibliotecas, hemerotecas, etc., con el objetivo de brindar una clasificación lógica y de rápido acceso. Hodge (2000) citado por Suárez, (2017) nos brinda la siguiente definición: los sistemas para la organización del conocimiento son entendidos como “all types of schemes for organizing information and promoting knowledge management [todos los tipos de esquemas para organizar información y promover la gestión del conocimiento]” (p. 3), estos “constituyen modelos que representan un área específica de información a la vez que brindan estructura significativa y posibilitan la exploración mediante términos, asociaciones y atributos”, (p. 5). Estos sistemas de organización del conocimiento se fundamentan en conceptos, categorías y relaciones, que facilitan la representación gráfica del conocimiento por medio de esquemas gráficos o textuales. https://es.scribd.com/document/460937706/ESQUEMAS-DE-ORGANIZACION-DELCONOCIMIENTO Para realizar un correcto proceso en cuanto a los esquemas de conocimiento, es necesario resaltar que la información debe ser previamente organizada realizando diferentes distinciones que faciliten su acceso. Así, por ejemplo, por categoría, por título, por autor, por año, según sea la organización administrativa de la organización. Esta relación tiende a separar unos con otros, sin embargo, es de igual necesidad relacionar la información para una vez encontrado lo que se esté buscando, poder ampliarlo y respaldarlo con información similar. Gnoli, Bosh & Mazzocchi (2007) indican que la interdisciplinariedad es primordial en cuanto a la organización, pues permite agrupar, clasificar y jerarquizar el conocimiento por disciplinas. Ejemplos de esquemas de organización http://iccayalaerick.blogspot.com/2013/11/leccion-7-procesos-basicos-y-esquemas_11.html Estos esquemas de conocimiento pueden ser de lo más complejos expandidos por un sinnúmero de categorías y subcategorías a las cuales con el desarrollo de la ciencia y de la tecnología se siguen aumentando más ramificaciones, pero también pueden ser tan simples como revisar el índice de un texto en el cual se han organizado temas y subtemas para guiar al lector a comprender cómo será presentada la información. Al hablar por otro lado de esquemas de conocimiento que se generan en el cerebro humano, estamos hablando de la información con la que cada ser humano cuenta frente a determinado concepto. Esta información puede estar organizada o no, tal vez, es inconsciente dentro de su propio esquema organizativo pues, por ejemplo, si una persona escucha la palabra gato, viene a su mente una categoría (animal), tal vez con esta vengan más categorías paralelas o subcategorías como mamífero, negro, cuadrúpedo, doméstico, etc. Esta información tiene interrelación con otros conceptos aprendidos, por ejemplo, si la misma persona escucha la palabra perro, algunas subcategorías se repetirán y otras no. Este conocimiento, categorías y subcategorías que el ser humano usa para organizar la información en el cerebro no es fija, sino que es dinámica y se encuentra en permanente dependencia de lo que la persona aprenda cada día para aumentar los nuevos esquemas de conocimiento. La diferencia entre los esquemas de conocimiento que cada persona tenga en su cerebro no se refieren únicamente a la información que posea, sino más bien a cómo está organizada esta información y cuáles son las conexiones entre unas y otras, como una gran telaraña mental y, a su vez, organizada como una gran biblioteca intangible, un patrón que ayuda al ser humano a pensar y modifica su forma de ver el mundo y posicionarse frente a la información que es transmitida sensorialmente. Cuarto Quinto Nivel 5.1.1. Campos de organización del conocimiento Los campos relacionados de manera directa con la organización del conocimiento se basan en el tratamiento que se brinde a esta información y su manera de clasificarla y poder acceder a ella. Esta organización del conocimiento (OC) tiene dos enfoques que han brindado una forma de construir, desarrollar y gestionar la información a fin de facilitar la recuperación de la misma de manera organizada y sencilla. Schvindt (2017) señala organizarla de la siguiente manera: a. El enfoque de la escuela española https://prezi.com/5v437njs7ll-/organizacion-del-conocimiento/ 3/22 Cuarto Quinto Nivel 5.1.1. Campos de organización del conocimiento b. El enfoque contemporáneo Los conceptos claves sobre el enfoque contemporáneo están divididos en organización social y cognitiva y organización del conocimiento. La organización del conocimiento se considera como la disciplina que estudia los procesos cognitivos básicos y superiores que se emplean sobre el conocimiento documentado, que es un patrimonio tangible de la humanidad y que ha permitido transmitir esta información por generaciones. Para que este proceso ocurra, es necesario conocer la forma cómo esta información es recuperada para su uso. https://prezi.com/5v437njs7ll-/organizacion-del-conocimiento/ 3/22 Cuarto Quinto Nivel 5.1.1. Campos de organización del conocimiento La organización del conocimiento es materia de estudio de los historiadores partiendo desde los grandes papiros encontrados o incluso los jeroglíficos de hace miles de años en Egipto; sin embargo, de primera mano se puede considerar como materia de estudio de la bibliotecología y de la ciencia de la información, que se basa en los procesos utilizados por las bibliotecas para conservar esta información y asegurar su acceso. En la actualidad, podemos evidenciar que esta ciencia ha evolucionado de una manera sorprendente pues con la digitalización de las obras y la promulgación de las revistas digitales y bibliotecas virtuales, la información que antes era exclusiva en tiempo y espacio, se ha vuelto abierta, accesible y universal. 3/22 Cuarto Quinto Nivel 5.1.2. Clasificación de la información Inventariado de activos Criterios de la clasificación Clasificar cada activo Tratamiento de la información La información tiene varias clasificaciones según la institución que lleve a cabo este proceso; sin embargo, existen estándares de clasificación de la información como ISO 27001, proceso mediante el cual se puede analizar el tipo de información que se posee y cuál es el tratamiento que se necesita dar a esta información. Este estándar se basa en cuatro pasos y un proceso de auditoría: Auditorías periódicas 4/22 Cuarto Quinto Nivel 5.1.2. Clasificación de la información Inventariado de activos Criterios de la clasificación Clasificar cada activo Tratamiento de la información Que se refiere a considerar todos los recursos con los que cuenta la institución que va a iniciar el proceso de clasificación de la información. Auditorías periódicas 4/22 Cuarto Quinto Nivel 5.1.2. Clasificación de la información Inventariado de activos Criterios de la clasificación Clasificar cada activo Tratamiento de la información Este parámetro se presenta de manera abierta, pues se indica que según la necesidad de cada organización podrá desarrollar sus criterios de clasificación. Auditorías periódicas 4/22 Cuarto Quinto Nivel 5.1.2. Clasificación de la información Inventariado de activos Criterios de la clasificación Clasificar cada activo Tratamiento de la información En este paso es necesario etiquetar a cada activo de información que se haya clasificado previamente en la organización. Auditorías periódicas 4/22 Cuarto Quinto Nivel 5.1.2. Clasificación de la información Inventariado de activos Criterios de la clasificación Clasificar cada activo Tratamiento de la información Elaborando un listado descriptivo de cómo se va a resguardar esta información a fin de proteger su confidencialidad y garantizar el acceso a la información de forma segura y fácil, según se determine. Auditorías periódicas 4/22 Cuarto Quinto Nivel 5.1.2. Clasificación de la información Inventariado de activos Criterios de la clasificación Clasificar cada activo Tratamiento de la información Auditorías periódicas A fin de verificar si estos procesos se están cumpliendo y cómo se está sumando la nueva información. Es importante mencionar que la información no se presenta únicamente de manera física, sino también en formato digital; por lo tanto, ambos ambientes necesitan un proceso de clasificación. INCIBE (2009) aporta lo siguiente en cuanto a los criterios de clasificación de la información. o Por el nivel de accesibilidad o confidencialidad ■ Confidencial. Accesible solo por la dirección o personal concreto ■ Interna. Accesible solo al personal de la empresa ■ Pública. Accesible públicamente o ■ ■ ■ ■ Por su utilidad o funcionalidad Información de clientes y proveedores Información de compras y ventas Información de personal y gestión interna Información sobre pedidos y procesos de almacén o ■ ■ ■ ■ Por el impacto por robo, borrado o pérdida Daño de imagen Consecuencias legales Consecuencias económicas Paralización de la actividad (p. 6) 4/22 Cuarto Quinto Nivel 5.1.3. Recuperación de la información A fin de poder acceder a la información, es necesario que quien posea la misma ponga en práctica procesos de organización y clasificación que permitan facilitar el acceso a estos datos. Estos procesos de igual manera deben enfocarse a la recuperación de los documentos escritos, de multimedia y los digitales. La recuperación de la información suele darse según su clasificación y el acceso que se tenga a esta. Así, por ejemplo, en las bibliotecas usualmente el sistema se basa en el autor, título de la obra o palabras clave para extender un poco más allá la búsqueda o sugerir otros objetos similares. Esta clasificación se ha trasladado también a bases de datos virtuales. 5/22 Cuarto Quinto Nivel 5.1.3. Recuperación de la información 5/22 Cuarto Quinto Nivel 5.1.4. Visualización de la información Esta visualización se suele relacionar con el acceso que el público tenga a la información. Ejemplo Niveles de información ⬥ ⬥ ⬥ ⬥ confidencialidad de la Confidencial Restringido Interno Público 6/22 Cuarto Quinto Nivel 5.1.4. Visualización de la información También se relaciona con la representación gráfica que se les dé a los contenidos mediante el uso de diferentes gráficos y organizadores, a fin de facilitar la comprensión, el análisis de los conceptos y la jerarquización de contenidos relacionados con un tema central. 5.1.5. Adquisición del conocimiento Cuando la información es accesible y llega al ser humano y este tiene la capacidad de decodificarla, se transforma en conocimiento del cual puede analizar y utilizar a futuro. Este conocimiento tiene más trascendencia que el simple aprendizaje del mismo, pues todo conocimiento se vuelve base para próximos conocimientos además que proporciona al ser humano un grado de desarrollo cognitivo. Fases del conocimiento 6/22 Cuarto Quinto Nivel 5.1.4. Visualización de la información Proceso de asimilación y acomodación Estos dos procesos son complementarios al proceso de adaptación, según la teoría de Piaget, biólogo genetista que se dedicó a estudiar al ser humano y su desarrollo; determinó que el individuo interioriza conocimientos que adquiere del mundo exterior. 6/22 Cuarto Quinto Nivel 5.2. Gestión del conocimiento La gestión del conocimiento se enfoca de manera principal en el camino que recorre la información dentro de las organizaciones en las cuales esta reposa. Este campo es el que resguarda y requiere un esquema del conocimiento. Para conceptualizar lo que es la gestión de conocimiento podemos referirnos a varios autores como Sveiby, Sáenz Vácas, quienes indican que la gestión del conocimiento es un arte, un proceso de identificar, agrupar, ordenar, optimizar, ordenar, compartir conocimiento tácito invaluable que ha sido transmitido y seguirá siendo transmitido a fin de brindar nuevas oportunidades. http://ec.globedia.com/gestion-del-conocimiento_1 7/22 Cuarto Quinto Nivel 5.2. Gestión del conocimiento De la mano de la gestión del conocimiento, es necesario organizar esta información mediante un modelo de gestión de conocimiento. Esta disciplina de la gestión de conocimientos se basa en sistemas y estrategias para aprovechar la información que exista en una organización. Los factores que orientan esta gestión de conocimientos, entre otros, son: ⬥ ⬥ ⬥ ⬥ ⬥ ⬥ Una cultura orientada al conocimiento Relevancia a la magnificación social e individual Procesos administrativos eficientes Organización y categorización de la información Categorización clara disciplinar e interdisciplinar Canales de difusión o acceso abiertos y/o cerrados 7/22 Cuarto Quinto Nivel 5.2. Gestión del conocimiento 7/22 Cuarto Quinto Nivel 5.2.1. Conocimiento social El conocimiento social es un tipo de conocimiento de doble vía; por lo tanto, se refiere a conocer cómo el individuo aprende de la sociedad y, a la vez, comprender cómo la sociedad percibe al individuo como parte de la misma. En cuanto a las organizaciones, el conocimiento social apunta a la comprensión de los recursos humanos y el entorno profesional que gira en torno a la organización. Este conocimiento es estudiado y profundizado por la sociología para comprender el rol de la sociedad y su influencia en el individuo. En todo medio en el que convivan dos o más personas existirá un conocimiento social; por lo tanto, podemos indicar que el conocimiento social se basa en el conocimiento individual, en el conocimiento grupal y en el conocimiento organizacional. 5.2.2. Conocimiento individual El conocimiento individual, como lo revisamos, es un conocimiento que mezcla conocimiento tácito y conocimiento explícito. Este conocimiento se basa en la subjetividad y en los deseos internos de cada individuo en conocer algo o en la manera de cómo procesa y usa el conocimiento adquirido, además este conocimiento se vuelve la base para analizar un nuevo conocimiento. 8/22 Cuarto Quinto Nivel 5.2.1. Conocimiento social El conocimiento individual expone las habilidades de cada uno, sus creencias, su pasado, sus metas, su entorno, sus costumbres, sus estudios y son esas las que moldean el pensar del ser humano que es el centro de toda sociedad; por lo tanto, el conocimiento individual pasa a formar parte de la sociedad del conocimiento y mediante este proceso cada individuo tiene la capacidad de moldear a su sociedad, existiendo una dependencia entre sociedad-individuo e individuosociedad. 8/22 Cuarto Quinto Nivel 5.3. Esquemas organizativos del conocimiento por época Los sistemas organizativos del conocimiento han tenido una evolución histórica desde Grecia, donde los grandes pensadores se preocupaban de cómo organizar la información, a fin de que esta sea perpetuada y transmitida para la posterior evolución de la sociedad con base a su desarrollo histórico, brindando así un “suelo” razonado y lógico de información que guíe los futuros pasos. San Segundo (1996) señala que: En las doctrinas de los filósofos griegos, se encuentra el embrión de la concepción del mundo posterior y el principio de la clasificación de los conocimientos y coordinación de las ciencias. Los filósofos griegos de la Antigüedad apreciaban ya la división de los conocimientos en teóricos y prácticos, además de establecer principios para la disposición de las distintas ramas del conocimiento, (p. 36). 5.3.1. Contexto histórico Clasificación del saber en la Antigüedad En la Antigüedad, el conocimiento era utilizado de manera principal para la sobrevivencia del ser humano, conocimiento que necesitaba ser transmitido a futuras generaciones para conservar su preservación. En cuanto a la conservación de la información, se han encontrado pictogramas y jeroglíficos que en las primeras culturas buscaban preservar historias o acontecimientos importantes de su pueblo. Existen indicios y recuperación arqueológica en el Antiguo Oriente donde se puede ya revisar cómo esta información fue conservada y no solo eso, sino que era clasificada como en la Biblioteca de Asurbanipal en Nínive la cual ya tuvo una clasificación disciplinar. La primera clasificación con base en autores y temas data de 310 a. C. por el poeta Calímaco. 9/22 Cuarto Quinto Nivel 5.3. Esquemas organizativos del conocimiento por época Clasificación del conocimiento en la Edad Media Con el paso al feudalismo, la información se iba acumulando y surgiendo la impetuosa necesidad de poder clasificarla y preservarla pues con el crecimiento de la burguesía creció la educación y con ella las ciencias. Por lo tanto, esta época se caracteriza por la clasificación según su ciencia y sus subdivisiones; las ciencias psicológicas y naturalistas de la mano de Juan Huarte en 1529 y con base en estas dos las subdivisiones presentadas por Francis Bacon en 1561, además Trivim y Quadrivium con las siete artes liberales (gramática, dialéctica, retórica, aritmética, geometría, astronomía y física). Sistematización de la información La sistematización de la información busca la lógica en cuanto a la organización y acceso a la misma. Es clasificar y ordenar la información de tal manera que sea fácil de encontrar cuando se la requiera, fortalece los espacios investigativos y ahorra tiempo. Es un proceso continuo que requiere tiempo y comprensión. 5.3.2. Época moderna En la actualidad, la organización de la información ha tomado un giro vertiginoso e impresionante pues se ha pasado de lo tangible a lo intangible, a lo digital con ahorro de tiempo y recursos, pero la desinformación y la información sin criterio ha proliferado pues las folksonomías permiten que el usuario no solo tenga acceso a la información como en las bibliotecas, sino también que él sea productor de esta información como en los Wikis que son herramientas colaborativas en las que usuarios conocedores o no de ciertos temas pueden crear, colaborar, modificar, eliminar información que está al alcance de todos los cibernautas. 9/22 Cuarto Quinto Nivel 5.3. Esquemas organizativos del conocimiento por época Clasificación de las ciencias en la época moderna Clasificación según Descartes ⬥ Filosofía ⬥ Física ⬥ Lingüística ⬥ Economía ⬥ Derecho ⬥ Medicina ⬥ Astronomía ⬥ Geometría ⬥ Ética Clasificación según Bacon ⬥ Razón ⬥ Memoria ⬥ Imaginación Clasificación según Leibniz ⬥ Según la función ⬥ Según criterios materiales o formales 9/22 RECUPERACIÓN DE INFORMACIÓN: MODELOS, SISTEMAS Y EVALUACIÓN. Francisco Javier Martínez Méndez -i- ‘Since the 1940s the problem of information storage and retrieval has attracted increasing attention’. Keith Rijsbergen. Information Retrieval, chapter 1. 1979 http://www.dcs.gla.ac.uk/Keith/Chapter.1/Ch.1.html MARTÍNEZ MÉNDEZ, Francisco Javier Recuperación de información: modelos, sistemas y evaluación / Francisco Javier Martínez Méndez. – Murcia: KIOSKO JMC, 2004. 106 p. ISBN: 1. Recuperación de Información. I. Título. 025.04.03 RECUPERACIÓN DE INFORMACIÓN: MODELOS, SISTEMAS Y EVALUACIÓN. © Francisco Javier Martínez Méndez. ISBN: 84-932537-7-4 Depósito legal: MU-729-2004 Edita, Distribuye y Vende: EL KIOSKO JMC Imprime: EL KIOSKO JMC RECUPERACIÓN DE INFORMACIÓN: MODELOS, SISTEMAS Y EVALUACIÓN. © Francisco Javier Martínez Méndez. Versión preparada para Digitum (repositorio digital institucional de la Universidad de Murcia, http://digitum.um.es) bajo licencia Creative Commons de Reconocimiento o similar). -ii- Prólogo. Si considerásemos la capacidad del ser humano para almacenar información en su cerebro, nos daríamos cuenta de hasta que extremos resulta ridículo construir dispositivos artificiales para el almacenamiento de esa información. Claro está que esta reflexión encierra su propia paradoja, ya que a pesar de la gigantesca capacidad de nuestro cerebro, se trata a su vez de un órgano en extremo complejo del que en estos albores del siglo XXI comenzamos apenas a comprender su funcionamiento. Por otro lado, las computadoras son simples máquinas por complejas que nos parezcan- y acarrean un proceso, sino inverso estrictamente hablando, contrario; de la simplicidad, casi infantil en los inicios de su aparición a la actualidad y de ahora en adelante con el desarrollo de la nanotecnología, hasta alcanzar un régimen de complejidad en estos momento difícil de adivinar -hoy ya, señalan los constructores de computadores, resulta casi imposible seguir un error dentro de la lógica de un microprocesador-. Con este panorama, ¿de qué disponemos realmente?, pues de un cerebro al que no podemos explotar más allá de un pequeño porcentaje de sus posibilidades -desconocemos las estructura del sistema operativo que lo rige- y de máquinas que no resuelven más que un pequeño porcentaje de nuestras necesidades. Con estas perspectivas tenemos que abordar el almacenamiento de datos en las computadoras, ocioso resulta señalar que el objeto de este almacenamiento es el poder encontrar eso datos cuando a cualquier persona le surja una necesidad que pueda ser cubierta con uno o un conjunto de esos datos previamente almacenados. El desarrollo de las bases de datos, en un principio, pareció la solución a todos nuestros problemas gracias a su capacidad ilimitada de almacenar datos y sus fáciles mecanismos de extracción. Y, ¿cuál es la causa de que estas bases de datos no resolviesen el problema?, si bien si han resuelto algunos. Todo responde a una cuestión crucial de reduccionismo del problema, considerar que una parte de la realidad circundante se puede reducir a una ristra de caracteres sintácticamente simples y sin ninguna ambigüedad semántica, es querer estar alejado de esa realidad. Por todo ello, se inició el desarrollo de sistemas algo más complejos, pero aun ciertamente alejados de la solución del problema, con el fin de ir acercándose a una meta más consecuente con las necesidades de los seres humanos. Estos sistemas son los conocidos como Sistemas de Recuperación de Información. Desde su creación se ha sido consciente de esa distancia entre realidad y solución propuesta entre necesidad y respuesta, de ahí que desde sus inicios se idearan de -iii- forma paralela mecanismos para medir esa distancia: los métodos de evaluación de los sistemas de recuperación de información. En el momento actual existe un ingenio: la web, sistema con una dinámica de funcionamiento y estructura para la cual muchas de las cosas desarrolladas con anterioridad están resultando estériles, entre otras las medidas de evaluación de su comportamiento. Es por eso que los investigadores de todo el mundo se encuentran en plena efervescencia creativa presentando nuevas orientaciones, añadiendo, en definitiva, más complejidad al problema de reducir la distancia, de aproximar las necesidades de los usuarios -que emergen de la mentecon la respuesta de los ingenios artificiales. Pues bien, el presente trabajo fruto de una dilatada investigación avalada por no una menos dilatada experiencia del autor, enfatiza en todos estos elementos de una forma clara y eficaz, y con un estilo sencillo pero completo. No podemos presumir, por desgracia, de abundancia de textos en español sobre el tema, pero es que, además, sobre las medidas de evaluación ni siquiera era fácil encontrar hasta ahora una monografía más o menos dedicada a este tema. Por ello se trata de un texto oportuno y necesario para tener conciencia real de la actual problemática de los sistemas de recuperación de información: son ingenios inacabados. Murcia, Marzo de 2004 Dr. José Vicente Rodríguez Muñoz Facultad de Comunicación y Documentación -iv- Índice General Índice General. 1. La Recuperación y los Sistemas de Recuperación de Información. ........................ 1 Hacia una definición de la Recuperación de Información. ........................................... 1 Sistemas de Recuperación de Información. ...................................................................... 5 Vista funcional de un SRI.................................................................................................... 5 Evolución de los SRI............................................................................................................. 7 Modelos para la recuperación de información. ............................................................... 8 Modelo del Espacio Vectorial. .............................................................................................. 9 2. La Recuperación de Información en la world wide web. ....................................... 15 Recuperar información en la web...................................................................................... 15 Breve perspectiva histórica de la web. ........................................................................ 15 Métodos de recuperación de información en la web.............................................. 17 Los motores de búsqueda como paradigma de la recuperación de información en Internet..................................................................................................................................... 25 Funcionamiento de un motor de búsqueda. .............................................................. 25 Tipos de robots................................................................................................................... 33 Confianza en el funcionamiento de los motores de búsqueda................................... 39 3. Evaluación de la Recuperación de Información. ..................................................... 43 Necesidad de la evaluación de los SRI. ............................................................................ 43 Relevancia vs Pertinencia. ................................................................................................... 45 Las primeras evaluaciones. .................................................................................................. 49 Proyectos Cranfield. ......................................................................................................... 49 MEDLARS. ............................................................................................................................ 51 SMART. ................................................................................................................................. 51 El proyecto STAIRS. ............................................................................................................ 53 Conferencias TREC. .......................................................................................................... 54 Medidas tradicionalmente empleadas............................................................................. 55 Medidas basadas en la relevancia............................................................................... 57 -ii- Índice General Medidas orientadas al usuario. ...................................................................................... 62 Cálculo de la Precisión y de la Exhaustividad............................................................. 63 Medidas Promedio E-P..................................................................................................... 68 Medidas alternativas a E-P o medidas de valor simple.................................................. 70 Modelo de Swets. ............................................................................................................. 72 Modelo de Robertson. ..................................................................................................... 73 Modelo de Cooper. ......................................................................................................... 73 Exhaustividad y Precisión normalizadas. ...................................................................... 75 Ratio de deslizamiento. ................................................................................................... 77 Satisfacción y Frustración................................................................................................ 78 Medida de Voiskunskii...................................................................................................... 80 Caso práctico de cálculo de medidas de valor simple. .......................................... 83 4. Casos prácticos de Recuperación de Información..................................................85 5. Referencias bibliográficas y fuentes de información. ..............................................97 -iii- La Recuperación y los SRI 1 La Recuperación y los Sistemas de Recuperación de Información. . Este capítulo representa una presentación del concepto de recuperación de información, y del conjunto de diferencias que posee con otras aplicaciones de la Informática en lo relacionado con la gestión y recuperación de datos. Al mismo tiempo se exponen los distintos modelos sobre los que se basan los sistemas que permiten la recuperación de información. Hacia una definición de la Recuperación de Información. Resulta cuando menos curioso el hecho de que un concepto tan empleado como el de recuperación de información presente cierta confusión a la hora de establecer una definición que lo sitúe adecuadamente dentro del campo de las Ciencias de la Información. Rijsbergen es el autor que mejor introduce este problema al considerar que “se trata de un término que suele ser definido en un sentido muy amplio” [RIJ, 1999]. En realidad, el profuso uso de este término, al igual que ocurre en otras disciplinas con otros vocablos que también pueden parecer básicos, ha propiciado que el mismo no se encuentre bien empleado en muchas ocasiones, ya que unas veces los autores lo presentan como sinónimo de la recuperación de datos llevada desde la perspectiva de las base de datos. Otro conjunto de autores expresan las diferencias que, a su juicio, presentan ambos conceptos (con lo cual la definición de recuperación de información queda, en cierto modo, supeditada a la anterior), un tercer grupo de autores la define de forma muy genérica sin entrar en mayores consideraciones sobre estas diferencias, y un cuarto y último grupo pasa de largo sobre este problema, profundizando más en la explicación de los sistemas de recuperación de información1 (SRI en adelante). El primer grupo de definiciones están muy influenciadas por la tecnología informática, cuya evolución ha inducido a considerar sinónimos ambos conceptos, llegándose a olvidar que se puede recuperar información sin procedimientos informáticos (aunque no es lo más común hoy en día). Aun así, el frecuente y necesario empleo de una tecnología no debe sustituir el adecuado uso de los conceptos terminológicos. Un claro ejemplo de este desacierto es el Glosario de la Asociación de 1 Quizás el esfuerzo realizado por los autores en definir los sistemas ha favorecido que el concepto de recuperación haya quedado relegado a un segundo plano. -1- La Recuperación y los SRI Bibliotecarios Americanos, que define el término “information retrieval” como recuperación de la información en primera acepción y como recuperación de datos en una segunda acepción [ALA, 1983], considerando ambos términos sinónimos en Lengua Inglesa2. Igualmente, el Diccionario Mac Millan de Tecnología de la Información considera a la recuperación de información como las “técnicas empleadas para almacenar y buscar grandes cantidades de datos y ponerlos a disposición de los usuarios” [LON, 1989] Un segundo grupo de autores fijan diferencias. Meadow piensa que la recuperación de la información es “una disciplina que involucra la localización de una determinada información dentro de un almacén de información o base de datos” [MEA, 1992]. Este autor, implícitamente, establece que la recuperación de información se encuentra asociada con el concepto de selectividad, ya que la información específica ha de extraerse siguiendo algún tipo de criterio discriminatorio (selectivo por tanto). Pérez-Carballo y Strzalkowski redundan en esta tesis: “una típica tarea de la recuperación de información es traer documentos relevantes desde una gran archivo en respuesta a una pregunta formulada y ordenarlos de acuerdo con su relevancia” [PER, 2000]. Del mismo modo, Grossman y Frieder indican que recuperar información es “encontrar documentos relevantes, no encontrar simples correspondencias a unos patrones de bits” [GRO, 1998]. Meadow considera que no es lo mismo la recuperación de información entendida como traducción del término inglés information recovery que cuando se traduce el término information retrieval, ya que “en el primer caso no es necesario proceso de selección alguno” [MEA, 1992]. De similar opinión es Blair, quien dedica gran parte de la presentación de su libro ‘Language and representation in information retrieval’ a asentar las diferencias entre data retrieval e information retrieval, utilizando como criterios distintivos, entre otros [BLA, 1990]: 1. En recuperación de datos se emplean preguntas altamente formalizadas, cuya respuesta es directamente la información deseada. En cambio, en recuperación de información las preguntas resultan difíciles de trasladar a un lenguaje normalizado (aunque existen lenguajes para la recuperación de información, son de naturaleza mucho menos formal que los empleados en los sistemas de bases de datos relacionales, por ejemplo) y la respuesta será un conjunto de documentos que probablemente contendrá lo deseado, con un evidente factor de indeterminación. 2. Según la relación entre el requerimiento al sistema y la satisfacción de usuario, la recuperación de datos es determinista y la Este Glosario indica que “document retrieval” es un término sinónimo de “information retrieval”. 2 -2- La Recuperación y los SRI recuperación de información es posibilista, debido al nivel de incertidumbre presente en la respuesta. 3. Éxito de la búsqueda. En recuperación de datos el criterio a emplear es la exactitud de lo encontrado, mientras que en recuperación de información, el criterio de valor es el grado en el que la respuesta satisface las necesidades de información del usuario, es decir, su percepción personal de utilidad. Tramullas Saz destaca un aspecto importante de las reflexiones de Blair, la importancia, en ocasiones ignorada, que tiene el factor de predicción por parte del usuario, ya que éste debe intuir, en numerosas ocasiones, los términos que han sido utilizados para representar el contenido de los documentos, independientemente de la presencia de mecanismos de control terminológico. Este criterio “es otro de los elementos que desempeñan un papel fundamental en el complejo proceso de la recuperación de información” [TRA, 1997] y que no se presenta en el campo de la recuperación de datos. La siguiente tabla compendia las diferencias fundamentales existentes entre recuperación de datos y recuperación de información a juicio de Rijsbergen [RIJ, 1999]: Recuperación de datos Recuperación de información Acierto Exacto Parcial, el mejor Inferencia Algebraica Inductiva Modelo Determinístico Posibilístico Lenguaje de consulta Fuertemente Estructurado Estructurado o Natural Especificación consulta Precisa Imprecisa Error en la respuesta Sensible Insensible Tabla 1.1 Recuperación de datos vs Recuperación de Información. Fuente: Rijsbergen, C.J. Information Retrieval. [En línea]. Glasgow, University, 1999. <http://www.dcs.gla.ac.uk/~iain/keith/> [Consulta: 21 de octubre de 2001] Baeza-Yates plantea las diferencias entre ambos tipos de recuperación con argumentos quizá algo menos abstractos que los anteriormente empleados por otros autores, destacando que “los datos se pueden estructurar en tablas, árboles, etc. para recuperar exactamente lo que se quiere, el texto no posee una estructura clara y no resulta fácil crearla” [BAE, 1999]. Para este autor, el problema de la recuperación de información se define como “dada una necesidad de información (consulta + perfil del usuario + ... ) y un conjunto de documentos, ordenar los documentos de más a menos relevantes para esa necesidad y presentar un subconjunto -3- La Recuperación y los SRI de aquellos de mayor relevancia”. En la solución de este problema se identifican dos grandes etapas: 1. Elección de un modelo que permita calcular la relevancia de un documento frente a una consulta. 2. Diseño de algoritmos y estructuras de datos que implementen este modelo de forma eficiente. Baeza-Yates se preocupa especialmente de las estructuras de datos y métodos de acceso a los mismos [BAE, 1992], [BAE, 1999], siendo este autor una verdadera referencia en esta materia. Curiosamente, a la hora de definir la recuperación de información, en lugar de proponer una definición propia, emplea la elaborada por Salton: “la recuperación de la información tiene que ver con la representación, almacenamiento, organización y acceso a los ítem de información” [SAL, 1983]. Salton indica que, en principio, no deben existir limitaciones a la naturaleza del objeto informativo y Baeza-Yates incorpora la reflexión siguiente: “la representación y organización debería proveer al usuario un fácil acceso a la información en la que se encuentre interesado. Desafortunadamente, la caracterización de la necesidad informativa de un usuario no es un problema sencillo de resolver” [BAE, 1999]. El tercer grupo de autores emplea la definición formulada por Salton (base de la mayoría de definiciones de a bibliografía especializada), añadiendo el rasgo diferenciador en que estos autores no profundizan en escrutar las diferencias entre “recuperación de datos” y “recuperación de información”, bien por no ser objeto de sus trabajos o por considerarlas suficientemente establecidas en trabajos previos. Feather y Storges ven a la recuperación de información como “el conjunto de actividades necesarias para hacer disponible la información a una comunidad de usuarios” [IEI, 1997]. Croft estima que la recuperación de información es “el conjunto de tareas mediante las cuales el usuario localiza y accede a los recursos de información que son pertinentes para la resolución del problema planteado. En estas tareas desempeñan un papel fundamental los lenguajes documentales, las técnicas de resumen, la descripción del objeto documental, etc.” [CRO, 1987]. Tramullas Saz impregna su definición del carácter selectivo comentado anteriormente al afirmar que “el planteamiento de la recuperación de información en su moderno concepto y discusión, hay que buscarlo en la realización de los tests de Cranfield y en la bibliografía generada desde ese momento y referida a los mecanismos más adecuados para extraer, de un conjunto de documentos, aquellos que fuesen pertinentes a una necesidad informativa dada” [TRA, 1997]. El cuarto y último grupo de autores se distinguen porque eluden definir la recuperación de la información. Su máximo exponente a Chowdhury, quien simplemente dedica el primer párrafo de su libro -4- La Recuperación y los SRI ‘Introduction to modern information retrieval’ a señalar que “el término recuperación de la información fue acuñado en 1952 y fue ganando popularidad en la comunidad científica de 1961 en adelante3”, mostrando después los propósitos, funciones y componentes de los SRI [CHO, 1999]. Otro autor perteneciente a esta corriente es Korfhage, quien se centra en el almacenamiento y recuperación de la información, considerando a estos procesos como las dos caras de una moneda. Para este autor, “un usuario de un sistema de información lo utiliza de dos formas posibles: para almacenar información en anticipación de una futura necesidad, y para encontrar información en respuesta una necesidad” [KOR, 1997]. Sistemas de Recuperación de Información. Tomando como base de partida la definición propuesta por Salton y uniéndola a las aportaciones de Rijsbergen [RIJ, 1999], correspondería ahora (siguiendo la opinión de Baeza-Yates [BAE, 1999]), elegir el mejor modelo para el diseño de un SRI, aunque antes resulta necesario definir adecuadamente “sistema de recuperación de información”. Vista funcional de un SRI. Las manifiestas similitudes existentes entre la recuperación de información y otras áreas vinculadas al procesamiento de la información, se repiten en el campo de los sistemas encargados de llevar a cabo esta tarea. Para Salton “la recuperación de información se entiende mejor cuando uno recuerda que la información procesada son documentos”, con el fin de diferenciar a los sistemas encargados de su gestión de otro tipo de sistemas, como los gestores de bases de datos relacionales. Salton piensa que “cualquier SRI puede ser descrito como un conjunto de ítems de información (DOCS), un conjunto de peticiones (REQS) y algún mecanismo (SIMILAR) que determine qué ítem satisfacen las necesidades de información expresadas por el usuario en la petición” [SAL, 1983] SIMILAR REQS DOCS Ilustración 1.1 Esquema simple de un SRI. Fuente Salton , G. and Mc Gill, M.J. Introduction to Modern Information Retrieval. New York: Mc Graw-Hill Computer Series, 1983. Chowdhury introduce una cita de Rijsbergen y Agosti, correspondiente al artículo ‘The Context of Information’, The Computer Journal, vol 35 (2), 1992. 3 -5- La Recuperación y los SRI Es el mismo Salton quien reconoce que en la práctica este esquema resulta muy simple y precisa ampliación, “porque los documentos suelen convertirse inicialmente a un formato especial, por medio del uso de una clasificación o de un sistema de indización, que denominaremos LANG” [SAL, 1983] SIMILAR REQS LANG DOCS Ilustración 1.2 Esquema avanzado de un SRI. Fuente Salton , G. and Mc Gill, M.J. Introduction to Modern Information Retrieval. New York: Mc Graw-Hill Computer Series, 1983. En la Ilustración 1.2, se observa que el proceso establecido entre la entrada REQS y SIMILAR es el proceso de formulación de la búsqueda, y el establecido entre SIMILAR y el conjunto de documentos DOCS es el proceso de recuperación. SIMILAR es el proceso de determinación de la similitud existente entre la representación de la pregunta y la representación de los ítems de información. Chowdhury identifica el siguiente conjunto de funciones principales en un SRI [CHO, 1999]: 1. Identificar las fuentes de información relevantes a las áreas de interés de las solicitudes de los usuarios. 2. Analizar los contenidos de los documentos. 3. Representar los contenidos de las fuentes analizadas de una manera que sea adecuada para compararlas con las preguntas de los usuarios. 4. Analizar las preguntas de los usuarios y representarlas de una forma que sea adecuada para compararlas con las representaciones de los documentos de la base de datos. 5. Realizar la correspondencia entre la representación de la búsqueda y los documentos almacenados en la base de datos. 6. Recuperar la información relevante 7. Realizar los ajustes necesarios en el sistema basados en la retroalimentación con los usuarios -6- La Recuperación y los SRI Evolución de los SRI. Muchos autores presentan la evolución de estos sistemas, pero quien mejor simplifica este progreso es Baeza-Yates, destacando tres fases fundamentales [BAE, 1999]: 1. Desarrollos iniciales. Ya existían métodos de recuperación de información en las antiguas colecciones de papiros. Otro ejemplo clásico que se ha venido utilizando es la tabla de contenidos de un libro, sustituida por otras estructuras más complejas a medida que ha crecido el volumen de información. La evolución lógica de la tabla de contenidos es el índice, estructura que aún constituye el núcleo de los SRI actuales. 2. Recuperación de información en las bibliotecas. Fueron las primeras instituciones en adoptar estos sistemas. Originalmente fueron desarrollados por ellas mismas y posteriormente se ha creado un mercado informático altamente especializado, en el que participan empresas e instituciones. 3. La World Wide Web. La evolución lógica de los SRI ha sido hacia la web, donde han encontrado una alta aplicación práctica y un aumento del número de usuarios, especialmente en el campo de los directorios y motores de búsqueda4. El alto grado de consolidación de la web está siendo favorecido por el vertiginoso abaratamiento de la tecnología informática, por el espectacular o desarrollo de las telecomunicaciones y por la facilidad de publicación de cualquier documento que un autor considere interesante, sin tener que pasar por el filtro de los tradicionales círculos editoriales. Los sistemas de recuperación de la información también han ido evolucionando con el fin de adaptarse a este nuevo entorno, de hecho se han desarrollado algunos de los sistemas más innovadores, al mismo tiempo que extensos, por no hablar de su popularidad, aunque aún no disponemos de metodologías suficientemente consolidadas que evalúen su efectividad. Esta evolución no es un proceso finalizado, sino más bien un proceso en realización, que lleva al establecimiento de nuevos términos, tales como WIS (“web information systems”) o “sistemas de información basados en la tecnología web destinados a integrarse plenamente con otros sistemas convencionales, llegando a ser más extendidos y de mayor influencia tanto en negocios como en la vida familiar” [WAN, 2001]. Estos sistemas se presentan posteriormente en el apartado dedicado a la recuperación de la información en la web, dentro de este mismo capítulo. 4 -7- La Recuperación y los SRI Modelos para la recuperación de información. El diseño de un SRI se realiza bajo un modelo, donde queda definido “cómo se obtienen las representaciones de los documentos y de la consulta, la estrategia para evaluar la relevancia de un documento respecto a una consulta y los métodos para establecer la importancia (orden) de los documentos de salida” [VIL, 1997]. Existen varias propuestas de clasificación de modelos, una de las síntesis más completas la realiza Dominich en cinco grupos [DOM, 2000]: Modelo Descripción Modelos clásicos Incluye los tres más comúnmente citados: booleano, espacio vectorial y probabilístico. Modelos alternativos Están basados en la Lógica Fuzzy Modelos lógicos Basados en la Lógica Formal. La recuperación de información es un proceso inferencial. Modelos basados en la interactividad Incluyen posibilidades de expansión del alcance de la búsqueda y hacen uso de retroalimentación por la relevancia de los documentos recuperados [SAL, 1989] Modelos basados en la Inteligencia Artificial5 Bases de conocimiento, redes neuronales, algoritmos genéticos y procesamiento del lenguaje natural. Tabla 1.2 Clasificación de los Modelos de Recuperación de Información según Dominich. Fuente: Dominich, S. ‘A unified mathematical definition of classical information retrieval’. Journal of the American Society for Information Science, 51 (7), 2000. p. 614-624. Baeza-Yates clasifica los modelos de recuperación de información con base en la tarea inicial que realiza el usuario en el sistema: (1) recuperar información por medio de una ecuación de búsqueda (retrieval) que se inserta en un formulario destinado a ello, o (2) dedicar un tiempo a consultar (browse) los documentos en la búsqueda de referencias [BAE, 1999], dando entrada en su clasificación al hipertexto [CON, 1988] [NIE, 1990], modelo en el cual se basa la web [BER, 1992]. Este mismo autor divide a los modelos basados en la recuperación en dos grupos: clásicos y estructurados. En el primero de ellos incluye a los modelos booleano, espacio vectorial y probabilístico. Posteriormente, presenta una serie de paradigmas alternativos a cada modelo: teoría de conjuntos (conjuntos difusos y booleano extendido), algebraicos (vector generalizado, indización por semántica latente y redes neuronales), y por último, probabilísticos (redes de inferencia y redes de conocimiento); los Respetando los grupos de Dominich, discrepamos con su opinión de no considerar los Modelos Lógicos parte de los Modelos basados en la Inteligencia Artificial. Realmente podrían englobarse en el mismo grupo de modelos. 5 -8- La Recuperación y los SRI modelos estructurados corresponden a listas de términos sin solapamiento y a nodos próximos (son modelos escasamente difundidos). Los modelos basados en la navegación entre páginas web son de tres tipos: estructura plana, estructura guiada e hipertexto. El primero es una simple lectura de un documento aislado del contexto, el segundo incorpora la posibilidad de facilitar la exploración organizando los documentos en una estructura tipo directorio con jerarquía de clases y subclases y el tercero se basa en la idea de un sistema de información que de la posibilidad de adquirir información de forma no estrictamente secuencial sino a través de nodos y enlaces [BAE, 1999]. Es también Baeza-Yates quien proporciona una clasificación adicional de estos modelos de recuperación de información, realizada en función de la modalidad de consulta y de la vista lógica de los documentos: Recuperación Términos Índice Texto Completo Texto Completo y Estructura Clásicos Clásicos Estructurados Conjuntos teóricos Conjuntos teóricos Algebraicos Algebraicos Probabilísticas Probabilísticos Navegación Estructura plana Estructura plana Hipertexto Estructura guiada Hipertexto Tabla 1.3 Clasificación de los Modelos de Recuperación de Información según Baeza-Yates. Fuente: Baeza-Yates, R. and Ribeiro-Neto, B. Modern information retrieval. New York: ACM Press ; Harlow [etc.]: Addison-Wesley, 1999 XX, 513 p. Tanto Baeza-Yates [BAE, 1999] como Villena Román [VIL, 1997] llevan a cabo una presentación detallada de cada uno de los modelos, siendo también interesante la lectura de Grossman y Frieder6 [GRO, 1998], para conocer las alternativas a los modelos clásicos. Modelo del Espacio Vectorial. Vamos a prestar un poco más de atención a este modelo, el más utilizado en la actualidad en los SRI (especialmente en la web). Estos autores prefieren emplear el término “estrategias de recuperación de información” en lugar del término “modelo”. 6 -9- La Recuperación y los SRI Este modelo entiende que los documentos pueden expresarse en función de unos vectores que recogen la frecuencia de aparición de los términos en los documentos. Los términos que forman esa matriz serían términos no vacíos, es decir, dotados de algún significado a la hora de recuperar información y por otro lado, estarían almacenados en formato “stemmed” (reducidos los términos a una raíz común, tras un procedimiento de aislamiento de la base que agruparía en una misma entrada varios términos). Si nuestro SRI contiene los siguientes cuatro documentos: D1: el río Danubio pasa por Viena, su color es azul D2: el caudal de un río asciende en Invierno D3: el río Rhin y el río Danubio tienen mucho caudal D4: si un río es navegable, es porque tiene mucho caudal Su matriz correspondiente dentro del modelo del Espacio Vectorial podría ser la siguiente: Río Danubio Viena color azul caudal invierno Rhin navegable D1 1 1 1 1 1 0 0 0 0 D2 1 0 0 0 0 1 1 0 0 D3 2 1 0 0 0 1 0 1 0 D4 1 0 0 0 0 1 0 0 1 Tabla 1.4 Ejemplo de Matriz de términos y documentos en el Espacio Vectorial. Fuente: elaboración propia. Por medio de un proceso denominado stemming, quizá el SRI hubiera truncado algunas de las entradas para reducirlas a un formato de raíz común, pero para continuar con la explicación resulta más sencillo e ilustrativo dejar los términos en su formato normal. En cuanto a las palabras vacías, hemos supuesto que el SRI elimina los determinantes, preposiciones y verbos (“el”, “pasa”, “por”, etc. ), presentes en los distintos documentos. Para entregar la respuesta a una determinada pregunta se realizan una serie de operaciones. La primera es traducir la pregunta al formato de un vector de términos. Así, si la pregunta fuera “¿cuál es el caudal del río Danubio?”, su vector de términos sería Q = (1,1,0,0,0,1,0,0,0). El siguiente paso es calcular la similitud existente entre el vector pregunta y los vectores de los documentos (existen varias funciones matemáticas diseñadas para ello) y ordenar la respuesta en función de los resultados de similitud obtenidos. Este procedimiento simple ha sido ligeramente modificado. Algunos autores comenzaron a considerar que la tf (la frecuencia absoluta de aparición de un término en un documento), es un factor que precisa de una corrección, porque la importancia de un término en función de su distribución puede llegar a ser desmesurada (por ejemplo, una frecuencia -10- La Recuperación y los SRI de 2 es 200% más importante que una frecuencia de 1, y la diferencia aritmética es sólo de una unidad). Otros autores, como es el caso de Sparck-Jones, apreciaron la capacidad de discriminación de un término frente a otro. Esta importancia o generalidad de un término dentro de la colección ha de ser vista en su conjunto no en un único documento, y se pensó en incentivar la presencia de aquellos términos que aparecen en menos documentos frente a los que aparecen en todos o casi todos, ya que realmente los muy frecuentes discriminan poco o nada a la hora de la representación del contenido de un documento. Para medir este valor de discriminación se propone la medida idf (frecuencia inversa de documento). Así, para la construcción de la matriz de términos y documentos, se consideran las siguientes definiciones: o n = número de términos distintos en la colección de documentos o tfij = número de ocurrencias de término tj en el documento Di [frecuencia del término o tf] o dfj = número de documentos que contienen el término tj o idfj = el log(d/dfj), donde d es el número total de documentos [frecuencia inversa del documento] El vector para cada documento tiene n componentes y contiene una entrada para cada término distinto en la colección entera de documentos. Los componentes en el vector se fijan con los pesos calculados para cada término en la colección de documentos. A los términos en cada documento automáticamente se le asignan pesos basándose en la frecuencia con que ocurren en la colección entera de documentos y en la aparición de un término en un documento particular. El peso de un término en un documento aumenta si este aparece más a menudo en un documento y disminuye si aparece más a menudo en todos los demás documentos. El peso para un término en un vector de documento es distinto de cero sólo si el término aparece en el documento. Para una colección de documentos grande que consiste en numerosos documentos pequeños, es probable que los vectores de los documentos contengan ceros principalmente. Por ejemplo, una colección de documentos con 10000 términos distintos genera un vector 10000dimensional para cada documento. Un documento dado que tenga sólo 100 términos distintos tendrá un vector de documento que contendrá 9900 ceros en sus componentes. El cálculo del factor de peso (d) para un término en un documento se define como combinación de la frecuencia de término (tf), y la frecuencia inversa del documento (idf). Para calcular el valor de la j-esima entrada del vector que corresponde al documento i, se emplea la ecuación siguiente: dij=tfij x idfj. El cálculo de las frecuencias inversas de los términos en los documentos y la posterior aplicación de esta fórmula sobre -11- La Recuperación y los SRI la matriz de nuestro ejemplo, proporcionaría la siguiente matriz de pesos (a la que añadimos una fila con el vector pregunta). Cálculo de frecuencias inversas Idf (río) = Log (4/4) = log (1) = 0 Idf (Danubio) = Log (4/2) = log 2 = 0.301 Idf (Viena) = Log (4/1) = log 4 = 0.602 Idf (color) = Log (4/1) = log 4 = 0.602 Idf (azul) = Log (4/1) = log 4 = 0.602 Idf (caudal) = Log (4/3) = log 1.33 = 0.124 Idf (invierno) = Log (4/1) = log 4 = 0.602 Idf (Rhin) = Log (4/1) = log 4 = 0.602 Idf (navegable) = Log (4/1) = log 4 = 0.602 Matriz tf-idf. Río Danubio Viena color azul Caudal invierno Rhin navegable D1 0 0.301 0.602 0.602 0.602 0 0 0 0 D2 0 0 0 0 0 0.124 0.602 0 0 D3 0 0.301 0 0 0 0.124 0 0.602 0 D4 0 0 0 0 0 0.124 0 0 0.602 Q 0 0.301 0 0 0 0.124 0 0 0 Tabla 1.5 Ejemplo de Matriz de términos y documentos en el Espacio Vectorial con los pesos calculados. Fuente: elaboración propia. Ahora corresponde calcular las similitudes existentes entre los distintos documentos (D1, D2, D3 y D4) y el vector Q de la pregunta. Hay que multiplicar componente a componente de los vectores y sumar los resultados. El modo más sencillo de obtener la similitud es por medio del producto escalar de los vectores (es decir, multiplicando los componentes de cada vector y sumando los resultados). Cálculo de similitudes Sim (D1,Q) = 0*0 + 0.301*0.301 + 0.602*0 + 0.602*0 + 0.602*0 + 0*0.124+ 0*0 + 0*0 +0*0 = 0.09 Sim (D2,Q) = 0*0 + 0*0.301 + 0*0 + 0*0 + 0*0 + 0.124*0.124 + 0.602*0 + 0*0 + 0*0 = 0.01 Sim (D3,Q) = 0*0 + 0.301*0.301 + 0*0 + 0*0 + 0*0 + 0.124*0.124 + 0*0 + 0.602*0 + 0*0 = 0.10 Sim (D4,Q) = 0*0 + 0*0.301 + 0*0 + 0*0 + 0*0 + 0.124*0.124 + 0*0 + 0*0 + 0.602*0 = 0.01 -12- La Recuperación y los SRI Con estos valores de similitud, se obtiene la siguiente respuesta: {D3, D2, D1, D4}. Podemos observar en este ejercicio un ejemplo de acierto y un ejemplo de fallo de este modelo, ya que el primero de los documentos recuperados sí responde a la pregunta (D3) y al mismo tiempo los demás no responden adecuadamente (realmente la similitud es muy baja). Casos como el presente, justifican la presencia de documentos no relevantes en la respuesta de los SRI y que este esquema básico de alineamiento haya sufrido muchos cambios. -13- -14- Evaluación de la Recuperación de la Información 2 La Recuperación de Información en la world wide web. La consolidación de la web como plataforma de diseño de los sistemas de información en Internet, propició la creación de los SRI más voluminosos y avanzados que hasta ahora se han desarrollado. Este capítulo presenta con detalle la base que sustenta estos sistemas y la problemática que la misma ofrece. Recuperar información en la web. Hu recuerda que “el primer motor de búsqueda desarrollado en la red Internet fue ARCHIE7, creado en 1990, aunque no fue hasta la creación del primer navegador, Mosaic8, que propició el crecimiento de los documentos y la gestión de información multimedia cuando se expandió el uso de estos sistemas” [HU, 2001]. La web es un nuevo contexto, con una serie de particularidades muy definidas, que precisa de una adaptación del concepto de recuperación de información, bajo estas premisas Delgado Domínguez afirma que “se puede definir el objetivo de la recuperación como la identificación de una o más referencias de páginas web que resulten relevantes para satisfacer una necesidad de información” [DEL, 1998]. En este caso, los SRI que se emplean en la web nos van a devolver referencias a los documentos, en lugar de los propios documentos. Breve perspectiva histórica de la web. El nacimiento y crecimiento exponencial de la web es un hecho suficientemente conocido y cuyo alcance ha traspasado los límites de la comunidad científica hasta llegar a todo el entorno social. En agosto de 1991, Paul F. Kunz, físico de la Universidad de Stanford leyó una noticia en la que difundía la invención de la World Wide Web y contactó con Tim ARCHIE es una base de datos que contiene información sobre el contenido de servidores FTP Anónimo dispuestos en la red Internet. Permite así localizar en qué servidor se puede encontrar un determinado recurso. 7 Mosaic es en la práctica el primer navegador gráfico, creado por Marc Andreessen en 1993, cuando era un estudiante de 22 años en la Universidad de Urbana-Champaign en Illinois. 8 -15- Berners-Lee, becario británico del CERN9. Berners-Lee estaba decidido a desarrollar un método eficiente y rápido para intercambiar datos científicos combinando dos tecnologías ya existentes: el hipertexto y el protocolo de comunicaciones TCP/IP, implantando un nuevo modelo de acceso a la información en Internet intuitivo e igualitario: la World Wide Web (o WWW o web). El objeto que movía a Berners-Lee en su iniciativa era disponer de un sistema de creación y distribución de documentos, que permitiera compartir información desarrollada en diferentes aplicaciones, de forma sencilla y eficiente, entre equipos de investigadores ubicados en distintos lugares geográficos y que cumpliera además los siguientes requisitos: Disponer de una interface sólida, es decir, el sistema debería permitir una conexión que al menos asegurara una transferencia de datos consistente. Integración de un amplio rango de tecnologías y distintos tipos de documentos. Proporcionar una herramienta para los documentos desde cualquier lugar de Internet y por cualquier individuo que este navegando dentro de este almacén, permitiendo accesos simultáneos. Kunz almacenó la información de su departamento en la Universidad de Stanford en un servidor, con el fin de que otros científicos pudieran acceder a ella a través de Internet gracias al formulario web de la siguiente ilustración. Fue el propio Berners-Lee fue el primero en probarlo. Ilustración 2.1 Sección de la primera página web diseñada por Kunz. Esta página sigue activa en la dirección <http://www.slac.stanford.edu/spires/hep/> de la Universidad de Stanford. El posterior desarrollo de Mosaic aumentó el número de usuarios que accedía a este novedoso sistema, crecimiento que continuó con el C.E.R.N. son las siglas del “Centro Europeo de Investigación Nuclear” de Ginebra. Actualmente es denominado “European Organization for Nuclear Research” (“Organización Europea de Investigación Nuclear”). 9 -16- Evaluación de la Recuperación de la Información desarrollo de nuevos navegadores: Netscape e Internet Explorer10. A principios del año 1995 se formó la organización Consorcio World Wide Web11 (o W3C), que está bajo la dirección del fundador de la Web Métodos de recuperación de información en la web. Sustancialmente, las técnicas de recuperación de información empleadas en Internet, proceden de las empleadas en los SRI tradicionales, y por ello surgen problemas cuando se realizan operaciones de recuperación de información, en tanto que el entorno de trabajo no es el mismo y las características intrínsecas de los datos almacenados difieren considerablemente. Al mismo tiempo, en la web surgen nuevos problemas, tales como los populares fenómenos denominados cloaking12, links farms13 y guest spamming14, o los vinculados con el enorme tamaño del índice de estos SRI, que poco a poco llega a alcanzar magnitudes impresionantes, muy difíciles de gestionar adecuadamente con los modelos tradicionales. Baeza-Yates afirma que hay básicamente tres formas de buscar información en la web: “dos de ellas son bien conocidas y frecuentemente usadas. La primera es hacer uso de los motores de búsqueda15, que indexan una porción de los documentos residentes en la globalidad de la web y que permiten localizar información a través de la formulación de una pregunta. La segunda es usar directorios16, sistemas Estas aplicaciones desencadenaron un litigio legal antimonopolio sólo comparable al entablado a principios del siglo XX por la extracción del petróleo, entonces en manos de Rockefeller y su compañía ‘Standard Oil Company’. 10 Traducción del término inglés “World Wide Web Consortium”. La URL de esta organización es <http://www.w3c.org/>. 11 Constructores de páginas web que insertan en su descripción términos que nada tienen que ver con el contenido de las mismas ("mp3", "sex", "pokemon", "Microsoft"), todos ellos de uso frecuente por los usuarios de los motores. El objetivo buscado es que su página sea recuperada también. También se incluyen bajo esta denominación las páginas optimizadas para un motor específico. 12 Páginas donde puedes insertar un enlace a tu página web. Cuanto mayor sea el número de enlaces que consigas para tu página, mayor será tu Pagerank y por tanto más posibilidades de que Google te coloque en los primeros puestos de una respuesta. Este aumento de la popularidad de tu página es algo artificioso. 13 Consiste en firmar en multitud de libros de visitas; dado que muchos ofrecen la posibilidad de introducir una dirección web, es una manera rápida de conseguir enlaces sin el engorroso trámite de pedírselo al webmaster correspondiente. 14 Empleamos el término “motor de búsqueda” como traducción de “web search engine”. También se usa coloquialmente el término “buscador” como traducción del inglés, aunque su uso suele englobar en algunas ocasiones a los directorios. 15 Empleamos el término “directorio” como traducción del término “web directory”. En términos coloquiales se utiliza también la palabra “índice”, aunque esta última 16 -17- que clasifican documentos web seleccionados por materia y que nos permiten navegar por sus secciones o buscar en sus índices. La tercera, que no está del todo disponible actualmente, es buscar en la web a través de la explotación de su estructura hipertextual (de los enlaces de las páginas web17)” [BAE, 1999]. Centrando el estudio en las primeras formas, resulta conveniente tener en cuenta el cierto grado de confusión existente entre los usuarios de estos sistemas, que a veces no tienen muy claro qué modalidad de sistema están empleando. Muchas veces, los usuarios no distinguen las diferencias que existen entre un directorio (Yahoo!, por ejemplo) y un motor de búsqueda (como pueden ser Alta Vista o Lycos), ya que las interfaces de consulta de todos estos sistemas resultan muy similares y ninguno explica claramente en su página principal si se trata de un directorio o de un motor de búsqueda. Algunas veces aparece un directorio ofreciendo resultados procedentes de un motor de búsqueda (Yahoo! y Google tienen un acuerdo para ello18), o bien un motor también permite la búsqueda por categorías, como si fuera un directorio (Microsoft Network, por ejemplo). Estas situaciones no contribuyen a superar ese grado de confusión. Los directorios son aplicaciones controladas por humanos que manejan grandes bases de datos con direcciones de páginas, títulos, descripciones, etc. Estas bases de datos son alimentadas cuando sus administradores revisan las direcciones que les son enviadas para luego ir clasificándolas en subdirectorios de forma temática. Los directorios más amplios cuentan con cientos de trabajadores y colaboradores revisando nuevas páginas para ir ingresándolas en sus bases de datos. Los directorios están “organizados en categorías temáticas, que se organizan jerárquicamente en un árbol de materias de información que permite el hojeo de los recursos descendiendo desde los temas más generales a los más específicos. Las categorías presentan un listado de enlaces a las páginas referenciadas en el buscador. Cada enlace incluye una breve descripción sobre su contenido” [AGU, 2002]. La mayoría de los índices permiten el acceso a los recursos referenciados a través de dos sistemas: navegación a través de la estructura de las categorías temáticas y búsquedas por palabras claves sobre el conjunto de referencias contenidas en el índice. El directorio más grande y famoso es Yahoo!, aunque existen otros bastante conocidos: Dmoz (un directorio alimentado por miles de colaboradores), Looksmart, palabra puede llevar a confusión en tanto que los motores de búsqueda, al igual que los directorios, hacen uso de índices para almacenar su información. 17 En algunos textos se usa “hiperenlace” como traducción de “hyperlink”. En la URL <http://es.docs.yahoo.com/info/faq.html#av> se amplía información sobre esta colaboración, que también mantienen otros sistemas. 18 -18- Evaluación de la Recuperación de la Información Infospace e Hispavista. Con mucha diferencia, el más utilizado es Yahoo!. Los directorios son más usados que los motores de búsqueda especialmente cuando “no se conoce exactamente el objetivo de la búsqueda” [MAN, 2002], ya que resulta difícil acertar con los términos de búsqueda adecuados. Los motores de búsqueda son robustas aplicaciones que manejan también grandes bases de datos de referencias a páginas web recopiladas por medio de un proceso automático, sin intervención humana. Uno o varios agentes de búsqueda recorren la web, a partir de una relación de direcciones inicial y recopilan nuevas direcciones generando una serie de etiquetas que permiten su indexación y almacenamiento en la base de datos. Un motor no cuenta con subcategorías como los directorios, sino con avanzados algoritmos de búsqueda que analizan las páginas que tienen en su base de datos y proporcionan el resultado más adecuado a una búsqueda. También almacenan direcciones que les son remitidas por los usuarios19. Entre los motores más populares destacan Altavista, Lycos, Alltheweb, Hotbot, Overture, Askjeeves, Direct Hit, Google, Microsoft Network, Terra y WISEnut, entre otros. Descubrimiento de recursos Representación del contenido Representación de la consulta Presentación de los resultados Directorios Lo realizan personas Clasificación manual Implícita (navegación por categorías) Paginas creadas antes de la consulta. Poco exhaustivos, muy precisos Motores de búsqueda Principalmente Indización de forma automática automática por medio de robots Explícita (palabras clave, operadores, etc.) Páginas creadas dinámicamente en cada consulta. Muy exhaustivos, poco precisos Tabla 2.1 Características de directorios y motores de búsqueda. Fuente: Delgado Domínguez, A. Mecanismos de recuperación de Información en la WWW [En línea]. Palma de Mallorca, Universitat de les Illes Balears, 1998. <http://dmi.uib.es/people/adelaida/tice/modul6/memfin.pdf> [Consulta: 18 de septiembre de 2001] Delgado Domínguez resume en la tabla 2.1 las características básicas de estos dos métodos de recuperación de información en la web. Es oportuno puntualizar que el razonamiento que lleva a la autora a considerar un directorio más preciso que un motor, se basa, sin duda Aunque algunas fuentes cifran entre el 95% y 97% el número de URL que son rechazadas por estos motores por diversos motivos. 19 -19- alguna, en la fiabilidad de la descripción del registro, realizada manualmente de forma detallada y ajustada, entendiendo en este caso precisión como ajuste o correspondencia de la descripción realizada con el contenido de la página referenciada, en lugar de la acepción del mismo término empleada para medir el acierto de una operación de búsqueda20. Evidentemente, este nivel de ajuste varía sustancialmente cuando la descripción se ha realizado a través de un proceso automático, como suele ser el caso de los motores de búsqueda. El tercer método de recuperación enunciado por Baeza-Yates es la búsqueda por explotación de los enlaces recogidos en las páginas web, incluyendo los lenguajes de consulta a la web y la búsqueda dinámica. Estas ideas no se encuentran todavía suficientemente implantadas debido a diversas razones, incluyéndose entre las mismas las limitaciones en la ejecución de las preguntas en estos sistemas y la ausencia de productos comerciales desarrollados [BAE, 1999]. Los lenguajes de consulta a la web21 pueden emplearse para localizar todas las páginas web que contengan al menos una imagen y que sean accesibles al menos desde otras tres páginas. Para ser capaz de dar respuesta a esta cuestión se han empleado varios modelos, siendo el más importante un modelo gráfico etiquetado que representa a las páginas web (los nodos) y a los enlaces entre las páginas y un modelo semiestructurado que representa el contenido de las páginas web con un esquema de datos generalmente desconocido y variable con el tiempo, tanto en extensión como en descripción [BAE, 1999]. Chang profundiza más en este tipo de lenguajes de recuperación, “estos lenguajes no sólo proporcionan una manera estructural de acceder a los datos almacenados en la base de datos, sino que esconden detalles de la estructura de la base de datos al usuario para simplificar las operaciones de consulta” [CHA, 2001], este aspecto cobra especial importancia en un contexto tan heterogéneo como es la web, donde se pueden encontrar documentos de muy diversa estructuración. Es por ello que estos lenguajes simplifican enormemente la recuperación de información. Los más desarrollados pueden entenderse como extensiones del lenguaje SQL22 para el contexto de la web empleado en los tradicionales gestores relacionales. Todos estos modelos constituyen adaptaciones o propuestas de desarrollo de sistemas navegacionales para la consulta de hipertextos [CAN, 1990], [NIE, 1990], [BAE, 1999], combinando la estructura de la red formada por los documentos y por sus contenidos. Al igual que sucedió en Más vinculada a términos como relevancia o pertinencia del documento recuperado con respecto de la temática objeto de la pregunta. 20 21 Traducción literal del término inglés “web query languages”. 22 SQL: Structured Query Language. -20- Evaluación de la Recuperación de la Información el entorno de los hipertextos, estos modelos resultan difíciles de implantar cuando se trata de gestionar inmensas cantidades de datos, como ocurre en la web. La búsqueda dinámica es “equivalente a la búsqueda secuencial en textos” [BAE, 1999]. La idea es usar una búsqueda online para descubrir información relevante siguiendo los enlaces de las páginas recuperadas. La principal ventaja de este modelo es que se traslada la búsqueda a la propia estructura de la web, no teniendo que realizarse estas operaciones en los documentos que se encuentran almacenados en los índices de un motor de búsqueda. El problema de esta idea es su lentitud, lo que propicia que se aplique sólo en pequeños y dinámicos subconjuntos de la web. Chang, dentro los SRI en web basados en la recuperación de información por medio de palabras clave, identifica cuatro tipos: motores de búsqueda, directorios, metabuscadores23 y técnicas de filtrado de información24 [CHA, 2001]. Los metabuscadores son sistemas desarrollados para mitigar el problema de tener que acceder a varios motores de búsqueda con el fin de recuperar una información más completa sobre un tema, siendo estos mismos sistemas los que se encargan de efectuarlos por el usuario. Un metabuscador colecciona las respuestas recibidas y las unifica, “la principal ventaja de los metabuscadores es su capacidad de combinar los resultados de muchas fuentes y el hecho de que el usuario pueda acceder a varias fuentes de forma simultánea a través de una simple interfaz de usuario” [BAE, 1999]. Estos sistemas no almacenan direcciones y descripciones de páginas en su base de datos, “en lugar de eso contienen registros de motores de búsqueda e información sobre ellos. Envían la petición del usuario a todos los motores de búsqueda (basados en directorios y crawlers25) que tienen registrados y obtienen los resultados que les devuelven. Algunos más sofisticados detectan las URL duplicadas provenientes de varios motores de búsqueda y eliminan la redundancia” [AGU, 2002]. , es decir solo presentan una al usuario. Por muy grande y exhaustiva que pudiera llegar a ser la base de datos de un motor de búsqueda o de un directorio, nunca va a cubrir un porcentaje muy elevado del total de la web, “incluso si tienes un motor de búsqueda favorito, o incluso varios de ellos, para asegurarte de que tu búsqueda sobre una materia es suficientemente exhaustiva necesitarás hacer uso de varios de ellos” [BRA, 2000]. “Metabuscador” es la traducción más aceptada del término “meta-search engine”. 23 24 Traducción literal del término inglés “information filtering”. Este término se refiere al robot que recopila páginas web para el índice de los motores de búsqueda. 25 -21- Estos sistemas se diferencian en la manera en que llevan a cabo el alineamiento de los resultados26 en el conjunto unificado27, y cómo de bien traducen estos sistemas la pregunta formulada por el usuario a los lenguajes específicos de interrogación de sus sistemas fuentes, ya que el lenguaje común a todos será más o menos reducido. Algunos metabuscadores se instalan como cliente en entorno local (Webcompass o Copernic, por ejemplo), o bien se consultan en línea (Buscopio, por ejemplo). Otra diferencia sustancial existente entre estos sistemas es la presentación de los resultados, “los llegan a clasificar en dos tipos, los multi buscadores y los meta buscadores: los multi buscadores ejecutan la consulta contra varios motores de forma simultánea y presentan los resultados sin más organización que la derivada de la velocidad de respuesta de cada motor (un ejemplo es All4One que busca en una gran cantidad de motores de búsqueda y directorios); los meta buscadores funcionan de manera similar a los multi buscadores pero, a diferencia de éstos, eliminan las referencias duplicadas, agrupan los resultados y generan nuevos valores de pertinencia para ordenarlos (algunos ejemplos son MetaCrawler, Cyber411 y digisearch)” [AGU, 2002]. Otros metabuscadores muestran los resultados en diferentes ventanas, correspondiendo cada una de ellas a una fuente distinta (Oneseek o Proteus, por ejemplo). Generalmente, el resultado obtenido con un metabuscador no es todo el conjunto de páginas sobre una materia que se almacenan en las fuentes del metabuscador, ya que suele limitarse el número de documentos recuperados de cada fuente. Aún así, “el resultado de un metabuscador suele ser más relevante en su conjunto” [BAE, 1999]. Puede sorprender esta limitación, pero no debemos olvidar uno de los elementos más considerados en las evaluaciones de los SRI, el tiempo de respuesta del sistema [LAN, 1993]. Si un metabuscador devolviera todas las referencias de todos los motores y directorios fuentes en relación con la materia objeto de una búsqueda, el tiempo de respuesta del sistema alcanzaría valores que seguramente alejarían a los usuarios del metabuscador por excesivo. Por ello resulta necesario establecer un número límite de documentos recuperados por motor, con el fin de que el tiempo de respuesta, que de por sí, ya sería siempre mayor que el precisado por un único motor, no aumente excesivamente. Actualmente, se encuentra en desarrollo una nueva generación de metabuscadores, destacando Inquirus como prototipo que emplea “búsqueda de términos en contexto y análisis de páginas para una más eficiente y mejor búsqueda en la web, también permite el uso de los operadores booleanos” [INQ, 2002]. Este sistema muestra los resultados Aunque el Diccionario de la R.A.E. admite el uso del vocablo “ranking”, preferimos emplear “alineamiento”, al tratarse el anterior de un anglicismo. 26 27 En algunos casos este proceso no se realiza [BAE, 1999]. -22- Evaluación de la Recuperación de la Información progresivamente, es decir a medida que van llegando (tras analizarlos), con lo que el usuario apenas tiene tiempo de espera y las referencias que le entrega el metabuscador son siempre correctas (es decir no va a entregar una dirección de página inexistente o páginas que hubieran cambiado su contenido desde la indización) [BAE, 1999]. Las técnicas de filtrado de la información son más un complemento de los motores que un modelo alternativo. El concepto de “filtrado” tiene que ver con la decisión de considerar (a priori) si un documento es relevante o no, eliminándolo del índice en caso contrario. Estas técnicas “se basan en una combinación de sistemas de autoaprendizaje y SRI, y han sido empleadas en la construcción de motores de búsqueda especializados” [CHA, 2001]. El filtrado de términos mejora la calidad del índice, rechazando términos de escaso o nulo valor de discriminación y aumenta la velocidad de la recuperación de información, aligerando las dimensiones del índice. Según el esquema de la ilustración 2.1, el agente (o los agentes) encargado/os de recopilar la información, someten las páginas recopiladas al filtrado. Si son aceptadas se almacenarán en el índice del motor, mientras que las rechazadas son descartadas. Ilustración 2.1 Proceso de construcción de un motor de búsqueda específico a partir de un filtrado de documentos. Fuente: Chang, G. et al. Mining the World Wide Web: an information search approach”. Norwell, Massachusetts: Kluwer Academic Publishers, 2001. Hu habla de seis tipos de tecnologías diferentes empleadas en la búsqueda de documentos en la web [HU, 2001]: 1. exploración de la estructura hipertextual 2. recuperación de la información 3. metabuscadores 4. lenguajes de consulta basados en SQL 5. buscadores multimedia basados en el contexto 6. otros -23- Hu considera que “los enlaces establecidos entre las páginas web pueden resultar de tremenda utilidad como fuentes de información para los indicadores” [HU, 2001]. El hecho de que el autor de una página web introduzca un enlace en la misma, representa, implícitamente, un respaldo para la página enlazada28. La exploración de los enlaces29 insertados en una página web y la exploración de los enlaces que apuntan hacia esa misma página, ha respaldado la creación de una nueva familia de motores de búsqueda, de la que Google30 es su mejor exponente [BRI, 1998]. Google hace uso de la conectividad de la web para calcular un grado de calidad de cada página, esta graduación se denomina PageRank (coincide con el nombre del algoritmo de alineamiento empleado por este motor) y utiliza esta propia capacidad de conexión para mejorar los resultados de búsqueda. Hu cita en segundo, tercer y cuarto lugar, a los directorios, motores de búsqueda, metabuscadores y lenguajes de consulta para la web, sistemas todos presentados anteriormente. En quinto lugar menciona la búsqueda de documentos multimedia, área en plena expansión, máxime cuando cada vez es mayor el número de documentos de esta naturaleza en la web y el número de usuarios que los demandan (gracias a las mejores conexiones a Internet). Para este autor, este desarrollo “está considerado uno de los mayores desafíos en el campo de la recuperación de información” [HU, 2001]. El último grupo citado por Hu engloba a los sistemas de recuperación con interface basada en procesamiento de lenguaje natural y los aún incipientes desarrollos de sistemas de recuperación de documentos en formato XML. Igual que en las técnicas de análisis de citas, si un artículo es citado por los autores de otros trabajos, este primer artículo se dice que “aumenta su impacto”. 28 No confundir “exploración de los enlaces” con la “explotación de la estructura hipertextual” que mencionaba Baeza-Yates. El propio autor incluye a Google y a su algoritmo de alineamiento Page Rank dentro del campo de los motores de búsqueda y los SRI basados en esa explotación de enlaces son una alternativa a los motores. Otros autores emplean el término “hyperlink spreading” (“extensión de enlaces”) para referirse al método que emplea el motor de búsqueda Google. 29 Google es un juego de palabras con el término "googol", acuñado por Milton Sirotta, sobrino del matemático norteamericano Edward Kasner, para referirse al número representado por un 1 seguido de 100 ceros. El uso del término por parte de Google refleja la misión de la compañía de organizar la inmensa cantidad de información disponible en la web y en el mundo. Fuente: Todo acerca de Google [En línea] Mountain View, CA: Google, 2001. <http://www.google.com/intl/es/profile.html> [Consulta: 21 de enero de 2002]. 30 -24- Evaluación de la Recuperación de la Información Los motores de búsqueda: paradigma de la recuperación de información en Internet. De la totalidad de los SRI que se han desarrollado en la web, los motores de búsqueda son los que más se incardinan con su naturaleza dinámica, siendo sistemas de evolución paralela al crecimiento de la web y al aumento del número de usuarios. Constituyen además uno de los desarrollos más consolidados de las técnicas de Indización Automática [SAL, 1983] [GIL, 1999] y, al mismo tiempo, son los sistemas más sensibles a toda la amplia serie de situaciones peculiares que se presentan en la red y que no tenían lugar en los tradicionales SRI. Independientemente de su método de rastreo y posteriores criterios y algoritmos usados en el alineamiento de los documentos, todos los motores parten de una situación inicial parecida: una lista de direcciones que sirve de punto de partida para el robot (o robots) del motor. Esta similitud inicial propicia, ineludiblemente, posteriores comparaciones del resultado obtenido, es decir, de la porción de web indexada y de la calidad de esta indexación. Otro factor favorecedor de estas comparaciones es el ocultismo de los métodos seguidos por cada motor, lo que nos lleva, al igual que ocurre en el caso anterior, a comparar el resultado obtenido con el fin de poder apreciar cuál de esos sistemas es de uso más recomendable. Si se asume que de lo completa, representativa y actualizada que sea la colección de un motor de búsqueda, depende su calidad; en un directorio, en cambio, esta calidad depende de la capacidad de los indicadores y en su número, motivos ambos más relacionados con capacidades presupuestarias que con prestaciones tecnológicas. En cambio, los motores representan un claro ejemplo de la aplicación de las técnicas de recuperación de información a la resolución de un reto, tan antiguo como moderno, en el campo de la Información y la Documentación: disponer en un índice las referencias a la mayor parte de los documentos existentes. Funcionamiento de un motor de búsqueda. El funcionamiento general de un motor de búsqueda se estudia desde dos perspectivas complementarias: la recopilación y la recuperación de información. Un motor compila automáticamente las direcciones de las páginas formarán parte de su índice tras indizarlas. Una vez estén estos registros depositados en la base de datos del motor, los usuarios buscarán en su índice por medio de una interface de consulta (más o menos avanzada en función del grado de desarrollo del motor). El módulo que realiza esta recopilación es conocido comúnmente como robot31, es un programa que “rastrea la estructura hipertextual de la Delgado Domínguez comenta que a los robots se les denomina también “spiders” (“arañas”) o “web crawlers” (“quienes andan a gatas por la web”). 31 -25- web, recogiendo información sobre las páginas que encuentra. Esa información se indiza y se introduce en una base de datos que será explorada posteriormente utilizando un motor de búsqueda” [DEL, 1998]. Estos robots recopilan varios millones de páginas por día, y actualizan la información depositada en los índices en períodos de tiempo muy pequeños (si se considera la extensión del espacio al que nos estamos refiriendo). Parten generalmente de una lista inicial de direcciones de sitios web, que son visitados y a partir de los cuales cada robot rastrea a su manera la web, de ahí que la información almacenada en cada base de datos de cada motor sea diferente. A diferencia de Delgado Domínguez, Baeza-Yates distingue en un robot las funciones de análisis o rastreo (“crawling”) de las de indexación (“indexing”), con lo cual habla de dos módulos independientes, el “crawler” o robot y el indexador [BAE, 1999]. Arquitectura de un motor de búsqueda. La mayoría de los motores usan una arquitectura de tipo robotindexador centralizada (ver Ilustración 2.2). A pesar de lo que puede inducir su nombre32, el robot no se mueve por la red, ni se ejecuta sobre las máquinas remotas cuyas páginas consulta. El robot funciona sobre el sistema local del motor de búsqueda y envía una serie de peticiones a los servidores remotos que alojan las páginas a analizar. El índice también se gestiona localmente. Esta arquitectura clásica es la que implementa, entre otros, el motor Alta Vista, “precisando para ello, en 1998, de 20 ordenadores multiprocesadores, todos con más de 130 Gb de memoria RAM y sobre 500 Gb de espacio en disco; sólo el módulo de interrogación del índice consume más del 75% de estos recursos” [BAE, 1999]. Baeza-Yates aporta otra denominación: “walkers” (“andadores”). Todos estos términos definen un movimiento lento y continuo entre las distintas páginas que conforman la web (que se puede traducir como “tela de araña”). Muchos textos dicen erróneamente que el robot “se mueve a lo largo de la web”, como si tuviera vida. Realmente es una aplicación informática que solicita una serie de transacciones a los servidores web que alojan las páginas analizadas. 32 -26- Evaluación de la Recuperación de la Información Query Engine ÍNDICE Interface Indexador Robot USUARIOS WEB Ilustración 2.2 Arquitectura simple de un motor de búsqueda. Fuente: o a partir de un filtrado de documentos. Fuente Baeza-Yates, R. and Ribeiro-Neto, B. Modern information retrieval. New York : ACM Press ; Harlow [etc.] : AddisonWesley, 1999 XX, 513 p. Este modelo presenta algunos problemas para gestionar adecuadamente en el entorno local la ingente cantidad de datos: La actualización de los índices es complicada y lenta. No sigue el ritmo de crecimiento de la web, indexando nuevos documentos en un nivel menor. El trasiego de páginas por la red consume un gran ancho de banda y produce una sobrecarga de tráfico [DEL, 1998]. Suelen ignorarse los contenidos dinámicos de la red, creación de páginas de consulta, ficheros en otros formatos, etc. Estos problemas propician que uno de los campos de estudio más recientes sea el desarrollo de alternativas a este modelo de arquitectura simple. Baeza-Yates destaca la arquitectura del sistema Harvest (“cosecha”) como la más importante de todas. Este sistema es un paquete integrado de herramientas gratuitas para recoger, extraer, organizar, buscar, y duplicar información relevante en Internet desarrollado en la Universidad de Colorado [BOW, 1994]. Harvest hace uso de una arquitectura distribuida para recopilar y distribuir los datos, que es más eficiente que la arquitectura centralizada. El principal inconveniente que presenta es la necesidad de contar con varios servidores para implementarla. -27- Gestor de replicados Broker USUARIO Broker Recopilador Caché de objetos Sitio web Ilustración 2.3 Arquitectura Harvest. Fuente Baeza-Yates, R. and Ribeiro-Neto, B. Modern information retrieval. New York : ACM Press ; Harlow [etc.] : AddisonWesley, 1999 XX, 513 p. En esta arquitectura distribuida, los servidores web reciben las peticiones de distintos robots (analizadores) de forma simultánea, aumentándose así la capacidad de carga de nuevas páginas del motor. Esta arquitectura solventa el problema de la carga de tráfico en las conexiones con el motor, porque aumenta la velocidad de conexión con los robots en tanto que estos descartan gran cantidad de contenidos de las páginas que analizan y no las transfieren al entorno local, aliviando mucho la carga de tráfico. En último lugar, la información se recopila de forma independiente por cada robot, sin tener que realizar una gestión sincronizada. Harvest tiene dos componentes principales: el recopilador y los brokers. El primero colecciona páginas y extrae de ellas a información necesaria para crear el índice del motor. El broker es el encargado de proporcionar el mecanismo de indexación de las páginas recopiladas y la interface de consulta. Al mismo tiempo, los brokers son los servidores de búsquedas, recuperan información desde uno o varios recopiladores o desde uno o varios brokers, actualizando constantemente sus índices. Interface de usuario. El estudio de la interface debe abordarse bajo dos perspectivas: la interface que el sistema dispone para que el usuario exprese sus necesidades de información (Chang la denomina “interface de consulta” [CHA, 2001]) y la interface de respuesta que dispone el sistema para -28- Evaluación de la Recuperación de la Información mostrar al usuario el resultado de su operación de búsqueda [BAE, 1999]. No todos los sistemas poseen iguales prestaciones en la recuperación de información. La más simple interface de usuario es la clásica caja dentro de un formulario web (ver Ilustración 2.4). En esta caja, el usuario inserta su ecuación de búsqueda, pudiendo, a veces, introducir alguna restricción a la búsqueda, como por ejemplo: el idioma de las páginas a recuperar, el tipo de objeto, si se desea emplear la búsqueda por frase literal o “búsqueda exacta”, etc. Ilustración 2.4 Formulario de búsqueda simple del motor All the Web. Fuente: <http://www.alltheweb.com> Aunque generalmente los motores de búsqueda suelen disponer de una interface de búsqueda avanzada (como la que se muestra en la Ilustración 2.5), en la cual el usuario puede incorporar a su ecuación de búsqueda una serie de parámetros adicionales, tales como: uso de operadores booleanos, búsqueda por frase literal, búsqueda aplicando operadores de adyacencia, búsqueda por términos opcionales (BaezaYates los denomina “invitados”, son esos términos que podrían aparecer o no en un documento objeto de una consulta), restricciones geográficas, restricciones por tipo de dominio, restricciones por idioma, etc. Algunos sistemas permiten refinar la búsqueda, es decir, especificar más la pregunta sobre el conjunto de documentos recuperado inicialmente e incluso algunos motores permiten restringir el alcance la operación de búsqueda a alguna de las partes de los documentos contenidos en sus índices (el caso más común es el título o el texto). -29- Ilustración 2.5 Sección del formulario de búsqueda avanzada del motor All the Web. Fuente: <http://www.alltheweb.com/advanced> Son muchos los criterios por los que se pueden identificar diferencias entre las posibilidades de recuperación de información ofrecidas por cada motor. La interface de usuario para la realización de las consultas es una de las más empleadas y constituye uno de los parámetros más empleados en los artículos y páginas web dedicadas a la evaluación de las prestaciones de cada motor [WIN, 1995], [DAV, 1996], [SLO, 1996], [ZOR, 1996] y [WES, 2001]. Otra diferencia, más interna y no tan explícita como las anteriores, es cómo un sistema interpreta una relación de varios términos como expresión de consulta sin operadores entre ellos (por ejemplo: “Historia Región Murcia”), es decir, cómo descompone la expresión y construye la ecuación de búsqueda. En este punto existen también diferencias entre los sistemas, unos realizan una búsqueda por proximidad de las palabras de la expresión (es el caso de Overture), otros motores recuperarán documentos donde aparezcan todas las palabras (Google) y otros recuperarán documentos donde al menos aparezca una de las tres palabras de la ecuación (Alta Vista). Chang identifica cinco tipos de búsqueda [CHA, 2001]: 1. Término simple 2. Términos múltiples 3. Basadas en el contexto 4. Lenguaje natural -30- Evaluación de la Recuperación de la Información 5. Correspondencia de patrones La búsqueda por término simple tiene como objeto devolver una colección de documentos donde al menos se encuentre una ocurrencia de ese término. Algunos sistemas permiten restringir esa búsqueda a un campo determinado (búsqueda por referencia cualificada). La búsqueda por términos múltiples permite diversas combinaciones basadas en el Álgebra de Boole: intersección de los subconjuntos correspondientes a cada término, unión de estos subconjuntos o exclusión de un subconjunto de otro. Algunos sistemas permiten la combinación de los operadores para construir expresiones booleanas complejas. Las búsquedas basadas en el contexto usan los operadores de proximidad, es decir, localizan documentos donde los términos integrantes de la ecuación de búsqueda se encuentren situados en la misma frase o en el mismo campo (además de, por supuesto, el mismo documento). El caso más cercano de proximidad es la adyacencia33 (caso extremo que se produce cuando los términos están escritos en un orden determinado y uno a continuación del otro). Algunos motores permiten la búsqueda en lenguaje natural, que puede resultar especialmente interesante para aquellos usuarios no experimentados en el uso de un motor específico o en el empleo de los operadores booleanos o basados en el contexto. Estos sistemas interpretan cuestiones del estilo de “¿qué jugador de fútbol es el máximo goleador de la Copa de Europa?” o “¿qué ciudad es la capital de Angola?”, devolviendo como resultados un conjunto de documentos que han considerado adecuados con la temática de la pregunta efectuada, tras haber sometido a esta expresión a un procedimiento de análisis del texto, interpretando la necesidad informativa (Alta Vista y Northern Light implementan esta modalidad). Un caso extremo de procesamiento de las expresiones en lenguaje natural es el motor Askjeeves, que llega a simular una “entrevista” con el usuario ya que, tras recibir la cuestión, la interpreta y extrae de su base de conocimientos una serie de cuestiones que traslada al usuario para refinar su exploración en la base de datos y ajustar mejor la respuesta. Por último, algunos sistemas devuelven los documentos por correspondencia con un patrón de caracteres introducido en la interface de consulta34. Esta modalidad también es conocida por “búsqueda por frase literal” o “búsqueda exacta”. 33 Es el caso de aquellos motores que permiten hacer uso del operador de truncamiento, como es el caso de Alta Vista. 34 -31- Los índices de los motores. El índice “es el corazón de un motor de búsqueda” [CHA, 2001], suele consistir en una lista de palabras con cierto valor de discriminación asociadas a sus correspondientes documentos, que en este caso son las descripciones de los contenidos de las URL recopiladas. La mayor parte de los motores de búsqueda emplean como estructura de datos un fichero inverso [BAE, 1992], [TRA, 1997], [RIJ, 1999], [CHA, 2001], [DEL, 2001], basado en la idea general que se muestra en la ilustración siguiente. Ilustración 2.6 Ejemplo de estructura de un fichero inverso simple. Fuente: Rijsbergen, C.J. Information Retrieval. [En línea]. Glasgow, University, 1999. <http://www.dcs.gla.ac.uk/~iain/keith/> [Consulta: 21 de octubre de 2001] En la práctica el fichero inverso se convierte en una enorme estructura de datos con serios problemas de gestión. Los distintos motores de búsqueda se sirven de distintos esquemas para definir estas estructuras de datos. Se cuenta con un parámetro, denominado granularidad, que distingue “la exactitud con la que el índice identifica la localización de una palabra clave; en general, los índices pueden clasificarse con base en este parámetro” [CHA, 2001]. Esta clasificación distingue tres niveles: Granularidad consistente Capaz de identificar un conjunto de documentos a partir de una palabra clave Granularidad media Capaz de identificar un documento específico a partir de una palabra clave Granularidad fina Capaz de identificar la localización de una frase o de una palabra en un documento a partir de una palabra clave Tabla 2.2 Clasificación de ficheros inversos a partir de la granularidad de su índice. Fuente: Chang, G. et al. Mining the World Wide Web: an information search approach”. Norwell, Massachusetts: Kluwer Academic Publishers, 2001. El índice emplea un conjunto de punteros que apuntan a una tabla que contiene las URL en las que aparece una palabra clave. La manera -32- Evaluación de la Recuperación de la Información de ordenar estos punteros depende de un mecanismo interno, basado generalmente en su frecuencia o en su peso en el documento. El enorme tamaño de la colección de URL recopiladas por los motores obliga a buscar formas de simplificar al máximo el tamaño de estos índices. En la Tabla 2.3 se presentan algunas de las diversas técnicas empleadas. Conversión de texto a minúsculas Se convierten todas las palabras a caracteres en minúscula, reduciendo así el número de entradas para un mismo término (Puerto – puerto) Stemming Aislamiento de la base de la palabra (por ejemplo: “comprensión” y “comprensivo” se reducirían a “compren”). Supresión de las palabras vacías Se suprimen del índice todas las palabras por las que no tiene sentido recuperar información (artículos, preposiciones, adjetivos, interjecciones, por ejemplo) Comprensión de textos Técnicas de compactación del tamaño del fichero Tabla 2.2 Técnicas usadas para reducir el tamaño de los índices de un motor de búsqueda. Fuente: Chang, G. et al. Mining the World Wide Web: an information search approach”. Norwell: Kluwer Academic Publishers, 2001. Las tres primeras reducen hasta un 30% del tamaño y la cuarta llega, a veces, hasta un 90%. Es evidente la tendencia a disminuir el tamaño del índice, ya que cuando las búsquedas constan de varios términos y uno de ellos es muy frecuente, el motor puede tardar varios segundos en responder, hecho no muy bien considerado por muchos usuarios. Los índices con granularidad más consistente implican menor tamaño y menos punteros, lo que favorece una simplificación de la estructura de datos. Baeza-Yates expone como ejemplo la idea que Glimpse emplea en Harvest: “las preguntas del usuario son resueltas por medio de ficheros inversos, que proporcionan una lista de bloques lógicos, leídos secuencialmente porque su tamaño es menor” [BAE, 1999]. Tipos de robots. Junto a los robots de carácter general dedicados a descubrir recursos, existen otras modalidades específicas de estos sistemas: “Knowbots: Programados para localizar referencias hipertexto dirigidas hacia un documento, servidor, etc., en particular. Permiten evaluar el impacto de las distintas aportaciones que engrosan las distintas áreas de conocimiento presentes en la Red. Wanderers (vagabundos): Encargados de realizar estadísticas: crecimiento de la Red, número de servidores conectados, etc. Worms (gusanos): Encargados de la duplicación de directorios FTP, para incrementar su utilidad a un número mayor de usuarios -33- WebAnts (hormigas): Conjunto de robots físicamente alejados que cooperan para la consecución de distintos objetivos, como por ejemplo para llevar a cabo una indización distribuida. [DEL, 1998]” Funcionamiento de los robots. Se ha comentado anteriormente que, habitualmente, el robot inicia su rastreo a partir de un conjunto de URL muy populares o enviadas explícitamente por los administradores de sitios web, y se siguen los enlaces contenidos en esa relación inicial de páginas evitando repeticiones. El recorrido puede ser de dos modos: breadth-first (cobertura amplia pero no profunda) y depth-first (cobertura vertical profunda) [BAE, 1999]. La extensión de la web genera problemas al actualizar los índices, ya que transcurre un considerable tiempo entre dos análisis del mismo recurso, intervalo muy variable según el motor. Baeza-Yates esboza una analogía entre el índice y las estrellas del cielo: “lo que vemos en un índice jamás ha existido, es como la luz que ha viajado a lo largo de mucho tiempo hasta llegar a nuestro ojos. Cada página se indexó en un momento distinto del tiempo, pero al ir a ella obtenemos el contenido actual” [BAE, 1999]. Seguramente por esta razón, algunos motores muestran la fecha de indización de la página. Baeza-Yates estima que alrededor del 9% de los enlaces almacenados son inválidos y Nottes cifra esta cantidad entre el 1% el 13% [NOT, 2000]. Estas cifras son objeto de revisiones frecuentes. Aguilar González resume en una tabla algunas de las principales características de rastreo y los motores que las implementan: Tipo de rastreo No Sí Excite El resto Soporte de marcos Excite, FAST El resto Mapas de imágenes Excite, FAST Alta Vista, Northern Light Robots.txt Ninguno Todos Metadatos Excite El resto Rastreo por popularidad Ninguno Todos Rastreo profundo Inclusión pagada Excite, Google35 Alta Vista, Inktomi, FAST Tabla 2.4 Características de rastreo de los robots de los principales motores de búsqueda. Fuente: Aguilar González, R. Monografía sobre motores de búsqueda [En línea]. Yahoo! Geocities, 2002. 35 Google dispone de un “sistema de publicidad autoadministrada”. En la práctica es una inclusión pagada de referencias a sitios web. -34- Evaluación de la Recuperación de la Información <http://www.geocities.com/motoresdebusqueda/crawlers.html> [Consulta: 3 de abril de 2002] Indización de las páginas. A medida que los robots recopilan páginas, la información contenida en las mismas debe ser indizada, Delgado Domínguez opina que “existen dos estrategias básicas, no mutuamente excluyentes, para realizar este proceso: usar información que provee el creador o editor del documento, o extraerla directamente del documento” [DEL, 1998]. El volumen de información que gestiona un robot obliga a que el motor de búsqueda implemente algún tipo de indización automática [GIL, 1999]. En la práctica, los principales motores emplean ambas estrategias para disponer de una completa descripción del contenido de la página analizada. Aguilar González enumera una serie de criterios utilizados para esta descripción: “el título del documento, los metadatos, el número de veces que se repite una palabra en un documento, algoritmos para valorar el peso del documento, etc.“ [AGU, 2002]. La mayoría de los motores calculan el número de veces que se repiten las palabras claves en el cuerpo de una página, después escudriñan estas palabras en el nombre del dominio o en la URL, posteriormente en el título de la página, en el encabezado y en los metadatos. El orden en que se busca en cada uno de estos elementos varía en función del motor (cada uno usa sus propios algoritmos con criterios diferentes). Si el motor encuentra las palabras claves en todos estos criterios, entonces posee una razón para asignar un peso mayor al documento. Otra metodología se basa en el número de enlaces que la misma reciba o proporcione. Aguilar González indica que la primera propuesta en esta línea es de Attardi, de la Universidad de Pisa, implementada en el motor Arianna y que ha servido de base para el desarrollo de motores que analizan los enlaces (como Google, WISEnut o Kartoo, entre otros) [AGU, 2002]. Un ejemplo representativo del comportamiento de un motor clásico a la hora de indizar las páginas web es el motor Alta Vista: Da prioridad alta a las palabras del título y a las palabras que están localizadas en el comienzo de la página. Asigna mayor peso a una palabra en un documento según su frecuencia absoluta. El mejor tamaño para una página está entre 4 y 8k. Considera las páginas largas como valiosas en contenido, cuando no están afectadas de “spamming”. Indexa las palabras claves y la descripción de los metadatos. Si no se tienen metadatos en la página, indexa las primeras 30 o 40 palabras de la página y las toma como descripción. -35- Confiere una mayor prioridad a palabras ubicadas en los metadatos o a las palabras con las cuales se registran las páginas, pero no son tan relevantes como el título y el contenido. Es sensible a las palabras claves mayúsculas y minúsculas. Puede indexar un sitio que contiene marcos. Pero se debe asegurar que todas las páginas enlacen a la página principal. Google es el mejor ejemplo de uso extensivo de los enlaces como base para mostrar los documentos a los usuarios de un motor. En Google, la indización la realizan dos módulos: el indexador y el clasificador. El primero lee las páginas procedentes del storeserver36, descomprime los documentos y selecciona los términos incluidos en los mismos. Cada documento se convierte así en un conjunto de palabras (o ‘hits’), donde se graba la palabra y su posición en el documento, una aproximación de su fuente de texto y otra serie de detalles, por medio del clasificador. El indexador analiza también los enlaces incluidos en cada página web, información necesaria para calcular el alineamiento de las páginas a la hora de la recuperación de información [BRI, 1998]. En la siguiente tabla se presentan resumidas algunas de las principales características de la indización y los motores que las implementan. Características de la indización No Texto completo Si Todos Supresión palabras vacías FAST, Northern Light AltaVista, Excite, Inktomi, Google Meta Descripción Google, Northern Light El resto Meta palabras claves Excite, FAST, Google, Northern Light El resto Texto alternativo Excite, FAST, Inktomi, Northern Light AltaVista, Google Tabla 2.5 Características de la indización realizada por los principales motores de búsqueda. Fuente: Aguilar González, R. Monografía sobre motores de búsqueda [En línea]. Yahoo! Geocities, 2002. <http://www.geocities.com/motoresdebusqueda/crawlers.html> [Consulta: 3 de abril de 2002] Alineado de los documentos (ranking). El alineado constituye uno, sino el que más, de los procesos críticos a la hora de valorar la efectividad de un motor de búsqueda, ya que se trata del orden en el que el motor presenta los resultados a sus usuarios, Este módulo es repositorio de la relación inicial de páginas a analizar por el robot. En el mismo se almacena, en formato comprimido, el contenido de las mismas. 36 -36- Evaluación de la Recuperación de la Información quienes, como es lógico esperan encontrar los documentos más relevantes con sus necesidades situados entre los primeros. El motor debe ordenar el conjunto de documentos constituyente de la respuesta en función de la relevancia de estos documentos con el tema de la pregunta realizada. En función del buen funcionamiento de su algoritmo de alineamiento, el motor será mejor o peor valorado por los usuarios del mismo. Si un motor no discrimina su respuesta en función de la relevancia con la temática objeto de la pregunta, el usuario encontrará documentos muy relevantes mezclados con otros menos relevantes e incluso con muchos nada relevantes, lo que le obligará a consultar un gran número de los documentos devueltos por el motor, teniendo que visitar muchas pantallas y perdiendo, en consecuencia, un cuantioso tiempo. En esta situación, el usuario seguramente terminará por no recurrir a este motor de búsqueda. Si por el contrario, el motor discriminara ese grado de relación, el usuario encontrará, entre los primeros documentos recuperados, los más relevantes con la temática de la pregunta, por lo que aumentará su grado de satisfacción con el motor y continuará utilizándolo. Tradicionalmente este procedimiento ha sido uno de los secretos mejor guardados por los responsables de los distintos motores de búsqueda y realmente, no se dispone de una información clara de cómo las motores lo llevan a cabo, con excepción del motor Google que ha hecho público su algoritmo PageRank [BRI, 1998]. Al igual que ocurría con los criterios de indización existen dos grandes grupos de algoritmos para el alineamiento, los que emplean variantes del modelo de espacio vectorial o del modelo booleano y los que siguen el principio de extensión de los enlaces. Baeza-Yates cita tres métodos englobados en el primer grupo, en adición al esquema tf-idf: “se denominan Booleano extendido, Vectorial extendido y Más citado. Los dos primeros son adaptaciones de los algoritmos normales de alineamiento empleados en estos modelos clásicos de recuperación de información para incluir el hecho de la existencia de enlaces entre las páginas web. El tercero se basa únicamente en los términos incluidos en las páginas que poseen un enlace hacia las páginas de la respuesta” [BAE, 1999]. El segundo grupo de algoritmos aporta una de las mayores diferencias conceptuales sobre el alineamiento: el uso de los enlaces de cada página (tanto los que recibe una página como los que emanan de ella). El número de enlaces que apuntan a una página sirve como una medida de su popularidad y calidad. La presencia de enlaces comunes entre un conjunto de página es también una medida de relación de los temas tratados en ellas. Dentro de esta nueva tipología de técnicas de alineamiento, identificamos tres clases: -37- WebQuery: da un alineamiento a las páginas que forman la respuesta a una consulta con base en cómo de conectadas están entre ellas. Adicionalmente, extiende el conjunto de páginas de la respuesta a otra serie de páginas altamente conectadas al grupo original de respuestas. HITS37: alinea las páginas Web en dos tipos distintos, que guardan una relación de mutua dependencia: autoridades (páginas muy referenciadas desde otras) y hubs (o conectores, páginas desde las que se hace referencia a otras consideradas por el autor de calidad en relación a un tema). Esta idea asume que cuando alguien establece un enlace a una página es porque la considera interesante, y que personas con intereses comunes tienden a referirse a las autoridades sobre un tema dentro de una misma página [ARA, 2000]. Conectores y autoridades son conceptos que se retroalimentan: mejores autoridades son inducidas por enlaces desde buenos conectores y buenos conectores vienen de enlaces desde buenas autoridades [BAE, 1999]. PageRank asume que el número de enlaces que una página recibe desde otras tiene mucho que ver con la calidad de la misma. Este algoritmo se puede resumir de la siguiente manera: “una página A tiene T1....Tn páginas que apuntan a ella por medio de algún enlace (es decir citas). El parámetro d es un factor que se puede fijar entre 0 y 1 (generalmente se fija en 0.85). Sea C(A) es número de enlaces que salen de la página A. Entonces, el PageRank de la página A vendrá dado por la siguiente expresión: PR(A) = (1-d) + d(PR(T1)/C(T1) + ..... + PR(Tn)/C(Tn))". Este cálculo puede realizarse por medio de un algoritmo iterativo y corresponde al vector propio de una matriz normalizada de enlaces en la web. PageRank está concebido como un modelo del comportamiento del usuario: si se asume que hay un "navegante aleatorio" que pasa de una página a otra sin presionar nunca el botón de “retroceder” y que, eventualmente nunca se aburriera, la probabilidad de que este navegante visitara una página determinada es precisamente su PageRank. Es decir, se trata de un modelo basado en los enlaces de las páginas y que pretende representar la forma de trabajar de los usuarios. Otra justificación intuitiva de PageRank es que una página puede tener un alto coeficiente de PageRank si existen muchas páginas que apuntan a ella, o si hay un número algo menor de páginas que apuntan a ella pero que posean, a su vez, un alto nivel de PageRank. Lo normal es que “aquellas páginas muy citadas son páginas que HITS: Hypertext Induced Topic Search. Se puede traducir al Español como “Búsqueda de temas hipertextual inducida”. 37 -38- Evaluación de la Recuperación de la Información vale la pena consultar y aquellas que sólo posean un enlace son páginas de poco interés para su consulta” [BRI, 1998]. Confianza en el funcionamiento de los motores de búsqueda. Tras analizar el funcionamiento de los motores de búsqueda y conocer las particularidades de los problemas que afectan a la calidad de su funcionamiento, llega el momento de establecer si los mismos son fiables o no. Es seguro que casi todos los usuarios de estos sistemas habrán reflexionado de una manera más o menos análoga al siguiente planteamiento de Manchón: “los resultados de algunos estudios indican que muchos usuarios prefieren la búsqueda jerárquica frente al motor de búsqueda. Ello puede ser causado por la proliferación de motores de búsqueda muy defectuosos que en la práctica no encuentran nunca la información deseada. Los usuarios se han acostumbrado a desconfiar de los motores de búsqueda, ya que excepto en contadas ocasiones no funcionan bien. Por ejemplo, todos los usuarios muestran incredulidad y sorpresa mayúscula al usar Google y comprobar que realmente funciona bien” [MAN, 2002]. Esta confianza en Google puede deberse a que utiliza la estructura hipertextual de la web de dos maneras: primero para establecer el alineamiento de los documentos recuperados a través del algoritmo y segundo, para extender las búsquedas textuales. También emplea esta estructura para extender la búsqueda a documentos que no han sido o no pueden ser indexados. Para ello, complementa la información con el texto que acompaña al ancla del enlace [ARA, 2000]. Grado-Caffaro opina que “es fácil ver que el problema fundamental, en este contexto de los motores de búsqueda, es que no existe modo de garantizar, de momento, en el mercado, que las páginas que se han obtenido sean realmente las más relevantes y que el ranking obedezca a la realidad en términos de la relevancia de la información que se proporciona” [GRA, 2000]. Es decir, el problema planteado es explicar razonadamente por qué el motor de búsqueda proporciona unas páginas y no otras, o lo que es lo mismo, se trata de resolver el problema de la asignación de relevancia a las páginas devueltas con respecto a la temática de la pregunta planteada. A pesar de las altas dosis de subjetividad que puedan estar presentes en estos postulados anteriores, no dejan de reflejar un problema muy común en el uso de los motores de búsqueda: estos sistemas muchas veces no proporcionan información verdaderamente relevante sobre un tema, a pesar de devolvernos una ingente cantidad de documentos en un tiempo relativamente escaso y de disponer el motor de una enorme base de datos con varios millones de documentos indexados. Este hecho -39- provoca que surjan opiniones tan rotundas como la anterior, que descalifica por completo la operatoria de estos sistemas. Partiendo de una postura mucho más positivista, hay que intentar diferenciar los problemas que padecen estos sistemas a la hora de llevar a cabo correctamente su tarea, e intentar aislarlos en su contexto, exponiendo claramente su alcance y sus posibles soluciones. Esta serie de problemas podrían clasificarse de la siguiente manera: 1. Formulación adecuada de la pregunta 2. Interactividad con la interface de usuario 3. Inadecuada indización de los documentos 4. Actualización de los índices del motor El primer grupo de problemas se encuentra muy ligado, la mayor parte de las veces, a una inadecuada formulación de la ecuación de búsqueda. Este problema, típico en la recuperación de información, cobra más importancia si cabe, en el contexto de los motores de búsqueda cuyos usuarios no tienen por qué disponer de unos conocimientos mínimos en técnicas de recuperación de información. Este problema intenta ser paliado por los responsables de los propios motores quienes, en mayor o menor medida, insertan en la ayuda de estos sistemas explicaciones de cómo sacar el mejor partido al motor para recuperar información. También es frecuente encontrar publicaciones impresas y páginas web que realizan esta labor de asesoramiento al usuario no iniciado. Paralelamente al problema de los legos en la materia, surge el problema de adaptación que sufren algunos usuarios al cambiar de un motor a otro, aunque este problema es de menor incidencia. Con ello, el problema de la formulación inadecuada de las ecuaciones de búsqueda subyace y va a estar, de alguna manera, siempre presente en toda operación de recuperación de información. El segundo problema es la interactividad con la interface del motor de búsqueda. En algunos casos esta interface ofrece escasas prestaciones a los usuarios para mejorar la calidad de sus operaciones de búsqueda y, en otros casos, resultan confusas e inducen a error a los usuarios, lo que tampoco contribuye a mejorar la efectividad del sistema. El tercero de los problemas es el de la inadecuada indización de las páginas web. A la ausencia de una estructura básica de los documentos analizados por los robots, hay que unir lo reciente de esta tecnología (algunos motores con más de cien millones de páginas en su base de datos y aún se consideran “prototipos”). En este punto confluyen muchas circunstancias, “además de por las propias limitaciones de la tecnología en su estado actual, existen también claros intereses, por parte de los propietarios de las páginas web, en que sus páginas aparezcan en la búsqueda y que aparezcan en la mejor posición. -40- Evaluación de la Recuperación de la Información Este interés, legítimo en principio, puede dejar de serlo cuando se utilizan mecanismos que distorsionan la realidad en ese afán por aparecer en los procesos de búsqueda38. Además de este problema, no hay que olvidar que las técnicas de indización automática ofrecen un rendimiento en absoluto cercano a la perfección, por lo que los algoritmos que implementan los motores cometen fallos que se trasladan al conjunto de resultados. Se ha comentado varias veces el problema que representa la naturaleza dinámica de la web para la actualización de los índices de los motores. Pero esta situación no puede dejar de ser óbice para que los administradores de los distintos sistemas, además de seguir recopilando nuevos recursos, presten la debida atención a mantener adecuadamente los índices de sus bases de datos. Hay que unir a esta tesitura el factor no sólo de la importancia/relevancia de la página sino de la importancia/relevancia del cambio que se ha podido producir lo que introduce un nuevo y adicional nivel de complejidad a la efectividad de la recuperación de información. Ante esta amplia serie de problemas, es por lo que estos sistemas precisan de herramientas de medida de su efectividad, que analicen de forma objetiva su rendimiento y establezcan enunciados sobre su funcionamiento que sean objetivos y fundamentados, alejados de opiniones personales e intuitivas, como las que se han recogido al principio de este apartado. Es por ello que, casi al mismo tiempo que surgieron los SRI se desarrollaron diversas técnicas para medir su rendimiento, tanto en el contexto tradicional como en el más reciente de la web. Se han citado varias de estas técnicas desgraciadamente frecuente, en la página 21. 38 -41- de indebido uso, aunque -42- Evaluación de la Recuperación de la Información 3 Evaluación de la Recuperación de la Información. La naturaleza determinista de los SRI propicia su necesidad intrínseca de evaluación. Por ello y paralelamente al desarrollo de su tecnología, surge un amplio campo de trabajo dedicado específicamente a la determinación de medidas que permitan valorar su efectividad. Un repaso exhaustivo de la bibliografía especializada permite identificar varios grupos de evaluaciones: las basadas en la relevancia de los documentos, las basadas en los usuarios y un tercer grupo de medidas alternativas a la realización de los juicios de relevancia, que pretenden evitar afectarse de las dosis de subjetividad que estos juicios poseen de forma inherente. Necesidad de la evaluación de los SRI. Los SRI, como cualquier otro sistema, son susceptibles de ser sometidos a evaluación, con el fin de que sus usuarios se encuentren en condiciones de valorar su efectividad y, de este modo, adquieran confianza en los mismos. Borlund opina que “la tradición de la evaluación de los SRI fue establecida desde la realización de los experimentos de Cranfield, seguido de los resultados y experiencias que Lancaster desarrolló en la evaluación de MEDLARS y los diversos proyectos SMART, de Salton; y hoy poseen vigencia con los experimentos TREC. Las evaluaciones de los SRI se encuentran estrechamente vinculadas con la investigación y el desarrollo de la recuperación de información” [BOR, 2000]. Blair afirma que “es la propia naturaleza de los SRI la que propicia su necesidad crítica de evaluación, justo como cualquier otro campo de trabajo que aspire a ser clasificado como campo científico” [BLA, 1990]. Baeza-Yates manifiesta que “un SRI puede ser evaluado por diversos criterios, incluyendo entre los mismos: la eficacia en la ejecución, el efectivo almacenamiento de los datos, la efectividad en la recuperación de la información y la serie de características que ofrece el sistema al usuario” [BAE, 1992]. Estos criterios no deben confundirse, la eficacia en la ejecución es la medida del tiempo que se toma un SRI para realizar una operación. Este parámetro ha sido siempre la preocupación principal en un SRI, especialmente desde que muchos de ellos son interactivos, y un largo tiempo de recuperación interfiere con la utilidad del sistema, llegando a alejar a los usuarios del mismo. La eficiencia del almacenamiento es -43- Evaluación de la Recuperación de la Información medida por el espacio que se precisa para almacenar los datos. Una medida común de medir esta eficiencia, es la ratio del tamaño del fichero índice unido al tamaño de los archivos de documentos, sobre el tamaño de los archivos de documentos, esta ratio es conocida como exceso de espacio. Los valores de esta ratio comprendidos entre 1,5 y 3 son típicos de los SRI basados en los ficheros inversos. Para finalizar, Baeza-Yates subraya que “de forma tradicional se ha conferido mucha importancia a la efectividad de la recuperación, normalmente basada en la relevancia de los documentos recuperados” [BAE, 1992]. Bors considera que “los experimentos, evaluaciones e investigaciones tienen una larga tradición en la investigación de la recuperación de la información, especialmente los relacionados con el paradigma de comparación exacta, concentrados en mejorar el acierto entre los términos de una pregunta y la representación de los documentos para facilitar el aumento de la exhaustividad y de la precisión de las búsquedas” [BOR, 2000]. Este mismo autor sugiere una diferencia, a la hora de esa evaluación, entre la evaluación del “acceso físico” y la evaluación del “acceso lógico” (o “intelectual”); considerando que las evaluaciones que se lleven a cabo, deben centrarse en el segundo tipo. El acceso físico es el que concierne a cómo la información demandada es recuperada y representada de forma física al usuario. Tiene que ver con la manera en la que un SRI (manual o automatizado) encuentra dicha información, o indica ciertas directrices al usuario sobre cómo localizarla, una vez que le proporciona su dirección. Este acceso se encuentra muy vinculado con las técnicas de recuperación y de presentación de la información. El acceso lógico está relacionado con la localización de la información deseada. Para ilustrar las reflexiones anteriores, Blair propone el siguiente ejemplo: “consideremos una biblioteca: descubrir dónde se encuentra un libro con una signatura determinada es un problema relacionado con el acceso físico al objeto informativo (el libro); descubrir qué libro puede informarnos sobre una determinada materia es un problema relacionado con el acceso lógico” [BLA, 1990]. Este segundo caso tiene que ver con la relevancia del objeto localizado con una determinada petición de información. Es por ello que Blair considera que los problemas del acceso lógico cobran mucho más protagonismo frente a los problemas del acceso físico, que deben resolverse una vez solucionado los anteriores. Estas afirmaciones, realizadas a principio de la década de los años noventa, siguen enteramente vigentes diez años después. Borlund distingue entre “aproximaciones al funcionamiento del sistema y aproximaciones centradas en el usuario” [BOR, 2000], plenamente coincidentes con el “acceso físico” y el “acceso lógico” de Blair. Otro hecho que no debemos perder de vista es la actual competencia establecida entre los desarrolladores de los algoritmos que emplean los directorios, motores de búsqueda o metabuscadores de la red Internet, sistemas que rivalizan sobre cómo facilitar al usuario más documentos en -44- Evaluación de la Recuperación de la Información el menor tiempo posible, sin entrar a considerar que, quizá el usuario prefiera que la información entregada como respuesta le sea verdaderamente útil para sus necesidades, aunque tenga que esperar algunas milésimas de segundo más para recibirla. Esta tendencia a avanzar en el desarrollo del aspecto físico certifica los temores de Blair, quien además considera que se llevan a cabo excesivas evaluaciones sobre determinados aspectos relacionados con el acceso físico, cuando donde deberían realizarse más evaluaciones es sobre el lógico. Siguiendo esta línea de razonamiento, ¿qué debería ser evaluado con el fin de determinar con certeza que la información que un SRI proporciona es válida para los usuarios del mismo? Para Blair, evidentemente, debería evaluarse el acceso lógico por medio del análisis de la relevancia o no relevancia del documento recuperado. Baeza-Yates afirma que existen dos tipos de evaluaciones a efectuar: “cuando se analiza el tiempo de respuesta y el espacio requerido para la gestión se estudia el rendimiento de las estructuras de datos empleadas en la indexación de los documentos, la interacción con el sistema, los retrasos de las redes de comunicaciones y cualquier otro retardo adicionalmente introducido por el software del sistema. Esta evaluación podría denominarse simplemente como evaluación del funcionamiento del sistema” [BAE, 1999]. En un SRI, los documentos recuperados no serán respuestas exactas a esta petición (a veces, porque los usuarios plantean las preguntas de una forma algo vaga). Los documentos recuperados se clasifican de acuerdo a su relevancia con la pregunta. Los SRI requieren evaluar cómo de relacionado con la temática objeto de la pregunta es el conjunto de documentos que forman la respuesta, “este tipo de evaluación, se conoce como evaluación del funcionamiento de la recuperación” [BAE, 1999] Relevancia vs Pertinencia. En este punto surge una nueva cuestión, si bien podría parecer trivial a primera vista, puede marcar en gran medida el resultado de un proceso de evaluación. Esta cuestión no es otra que responder con certeza a la pregunta “¿cuándo un documento es relevante?”. El término relevancia significa “calidad o condición de relevante, importancia, significación”, y el término “relevante” lo define como “importante o significativo”. Entendemos, por extensión de las definiciones anteriores, que un documento recuperado se puede considerar relevante cuando el contenido del mismo posee alguna significación o importancia con motivo de la pregunta realizada por el usuario, es decir, con su necesidad de información. Conocer el significado del término no nos ayuda, desgraciadamente en demasía, ya que surgen nuevos problemas a la hora de determinar con exactitud cuándo un documento puede ser considerado relevante o no. No debemos olvidar que estos problemas se encuentran estrechamente entroncados con la naturaleza cognitiva de este proceso, destacando los siguientes a continuación: -45- Evaluación de la Recuperación de la Información Un mismo documento puede ser considerado relevante, o no relevante, por dos personas distintas en función de los motivos que producen la necesidad de información o del grado de conocimiento que sobre la materia posean ambos. Llegados a un caso extremo, un mismo documento puede parecer relevante o no a la misma persona en momentos diferentes de tiempo [LAN, 1993]. Resulta difícil definir, a priori, unos criterios para determinar cuándo un documento es relevante e incluso resulta complicado explicitarlos de forma clara y concisa, “es más fácil proceder a la determinación de la relevancia que explicar cómo la misma se ha llevado a cabo” [BLA, 1990]. De hecho, considera que “el concepto de la relevancia no está claro en un primer término, se nos presenta como un concepto afectado de una gran dosis de subjetividad que puede ser explicado de múltiples maneras por distintas personas y, por tanto, dentro del contexto de una búsqueda en un sistema de recuperación de información este concepto puede ser precisado de muchas maneras distintas por todos aquellos que realicen búsquedas en el mismo. En un segundo lugar, no debe sorprendernos que un usuario afirme que unos determinados documentos son relevantes a sus necesidades de información y que, en cambio, no sea capaz de precisarnos con exactitud qué significa ser relevante para él” [BLA, 1990]. Esto no quiere decir que el concepto carezca de importancia, sino que la realización de un juicio de relevancia viene a formar parte de ese amplio conjunto de tareas cotidianas que llevamos a cabo los seres humanos (procesos cognitivos por tanto) pero que generalmente, no podemos encontrar las palabras adecuadas para proceder a su descripción" [BLA, 1990]. Por último, puede resultar aventurado calificar de forma categórica a un documento como relevante con un tema, o por el contrario, calificarlo como no relevante de igual manera. Resulta muy normal encontrar documentos que, en alguno de sus apartados resulta relevante con una materia determinada pero que no en el resto de sus contenidos. Para algunos autores, surge entonces el concepto de “relevancia parcial”, debido a que, en realidad, la relevancia no puede medirse en términos binarios (sí/no), sino que puede adquirir muchos valores intermedios (muy relevante, relevante, escasamente relevante, mínimamente relevante, etc.), lo que propicia que la relevancia pueda medirse en términos de función continua en lugar de una función binaria (que sólo admite dos estados). Todos estos impedimentos condicionan, en cierto grado, la viabilidad de la relevancia para constituirse en un criterio de evaluación -46- Evaluación de la Recuperación de la Información de la recuperación de la información. Cooper introduce la idea de “utilidad de un documento”, considerando que es mejor definir a la relevancia en términos de la percepción que un usuario posee ante un documento recuperado, es decir: “si el mismo le va a ser útil o no” [COO, 1973]. Este nuevo punto de vista presenta, esencialmente, una ventaja: emplaza la estimación de la adecuación o no de un documento recuperado dentro del juicio que llevará a cabo el usuario, en tanto que, tal como hemos comentado anteriormente enumerando los problemas de la relevancia, podemos asumir que un usuario tendrá problemas a la hora de definir qué es relevante y qué no lo es, pero tendrá pocos problemas a la hora de decidir si el documento le parece o no útil. Es el usuario quién va a analizar el documento y quien lo va a utilizar si le conviene, por lo que los juicios de relevancia van a ser realizados por él, y son esos juicios de relevancia los que van propiciar que un SRI sea considerado bueno o malo. La importancia del concepto de “utilidad” lleva a Blair a concluir que “la misma simplifica el objetivo de un SRI y, aunque su evaluación es subjetiva, es posible medirla de mejor manera que si no se aplica este criterio, en tanto que es una noción primitiva que denota la realización de una actividad” [BLA, 1990]. Frants plantea otra acepción de relevancia, muy similar a la anterior, en términos de “eficiencia funcional”, un SRI alcanzará altos niveles de este valor cuando la mayoría de los documentos recuperados satisfagan la demanda de información del usuario, es decir, le resulten útiles. [FRA, 1997]. Lancaster introduce un pensamiento muy interesante sobre esta cuestión: “aunque puede usarse otra terminología, la voz relevancia parece la más apropiada para indicar la relación entre un documento y una petición de información efectuada por un usuario, aunque puede resultar erróneo asumir que ese grado de relación es fijo e invariable, siendo mejor decir, que un documento ha sido juzgado como relevante a una específica petición de información”. [LAN, 1993]. Prolongando este pensamiento, Lancaster reflexiona de una manera muy paralela a los planteamientos de Blair y considera que la relevancia de un documento con respecto a una necesidad de información planteada por un usuario no tiene por qué coincidir con los juicios de valor que emitan muchos expertos sobre el contenido del documento sino con la satisfacción de ese usuario y la “utilidad” que estos contenidos van a tener para él, opinando que “es mejor, en este segundo caso, hacer uso de la palabra pertinencia”. Es decir, relevancia va a quedar asociada con el concepto de la relación existente entre los contenidos de un documento con una temática determinada y pertinencia va a restringirse a la “relación de utilidad” existente entre un documento recuperado y una necesidad de información individual. Para Salton: “el conjunto pertinente de documentos recuperados puede definirse como el subconjunto de los documentos almacenados en -47- Evaluación de la Recuperación de la Información el sistema que es apropiado para la necesidad de información del usuario” [SAL, 1983]. El término pertinencia significa “calidad de pertinente”, entendiéndose como “pertinente” a todo lo que viene a propósito o resulta oportuno, es decir que podemos decir que un documento pertinente es un documento que resulta oportuno, porque le proporciona al usuario final la información que a él le cumple algún propósito. Opiniones similares de esta distinción se recogen en el trabajo de Foskett, quien define como documento relevante a aquel “documento perteneciente al campo/materia/universo del discurso delimitado por los términos de la pregunta, establecido por el consenso de los trabajadores en ese campo”, igualmente define como documento pertinente a “aquel documento que añade nueva información a la previamente almacenada en la mete del usuario, que le resulta útil en el trabajo que ha propiciado la pregunta” [FOS, 1972]. Verdaderamente, “las diferentes aproximaciones que se desarrollan para evaluar los SRI poseen todas los mismos objetivos finales, porque los procesos de evaluación están relacionados con la capacidad del sistema de satisfacer las necesidades de información de sus usuarios” [BOR, 2000]. Bibliografía adicional sobre esta acepción de la relevancia es propuesta por Lancaster [LAN, 1993] recogiendo citas de Cooper (ya citado anteriormente), Goffman, Wilson, Bezer y O’Connor. Otra recopilación de citas sobre este concepto la realiza Mizzaro, citando, entre otros, a Vickery, Rees y Schultz, Cuadra y Katter, Saracevic y Schamber [MIZ, 1998]. Este conjunto de opiniones ha sido aceptado por los autores que han trabajado con posterioridad en este campo, de hecho, en un número especial de la revista Informing Science dedicado a la investigación en nuestra área (volumen 3 del año 2000), encontramos la siguiente frase de Greisdorf: “en los últimos treinta años no se ha encontrado sustituto práctico para el concepto de relevancia como criterio de medida y cuantificación de la efectividad de los SRI” [GRE, 2000]. Incidiendo en esta opinión, Gordon y Pathak opinan: “si los juicios de relevancia son llevados a cabo por expertos en la materia, decidiendo por su cuenta qué páginas web son relevantes y cuáles no, se introducirían muchas disfunciones debidas a la familiaridad con la materia o al desconocimiento exacto de las necesidades de información del usuario, de las motivaciones que provocan la necesidad de información y de otra serie de detalles más o menos subjetivos que escapan a la percepción del localizador de información. No podemos enfatizar suficientemente la importancia de los juicios de relevancia realizados por aquellos quienes verdaderamente necesitan la información” [GOR, 1999]. En realidad, los documentos recuperados no son relevantes o no relevantes, propiamente hablando, es decir, que no se trata de una decisión binaria, en tanto que los contenidos de los documentos pueden -48- Evaluación de la Recuperación de la Información coincidir en mayor o menor parte con las necesidades de información. Lo que sí podemos determinar es si son o no relevantes para una determinada persona. Desde un punto de vista pragmático, el mismo documento puede significar varias cosas para personas diferentes; los juicios de relevancia pueden sólo realizar evaluaciones semánticas o incluso sintácticas de documentos o preguntas. Pero estos juicios fallan al involucrar a usuarios particulares, y también fallan al identificar dónde el usuario realmente encuentra a un documento particularmente relevante. Estos autores bromean un poco al respecto, parafraseando, ligeramente modificada, una vieja frase: “la relevancia reside en los detalles”. Asumimos, por tanto, el planteamiento de que un documento será relevante para nuestra necesidad de información, cuando el mismo verdaderamente nos aporte algún contenido relacionado con nuestra petición, con lo cual, realmente, cuando hablemos de relevancia podemos estar hablando de pertinencia, siempre que estemos refiriéndonos al punto de vista del usuario final que realiza una operación de recuperación de información. Las primeras evaluaciones. Es norma común en toda la bibliografía consultada, hacer referencia a una serie de evaluaciones pioneras llevadas a cabo a partir de la mitad de la década de los años cincuenta, que marcaron el camino de los trabajos en este campo, llegando a aportar (a pesar de lo primitivos que eran esos SRI), una serie de medidas que siguen estando vigentes hoy en día. Ya se ha indicado al principio de este capítulo que Borlund vincula la existencia de los SRI a la necesidad de evaluarlos, manifestando que algunos estudios de evaluación son casi tan antiguos como los propios sistemas: Cranfield, MEDLARS o SMART [BOR, 2000]. Algunos de los manuales consultados presentan estos estudios con amplio detalle, por lo que no parece oportuno llevar a cabo una detallada exposición de los mismos, sino que se considera más interesante exponer los objetivos y logros alcanzados en los procesos de evaluación más destacados y resaltar qué ha trascendido posteriormente de cada uno de ellos, remitiendo a la bibliografía consultada para una mayor amplitud en las exposiciones. En lo que sí coinciden la mayoría de los manuales consultados es remitir al lector hacia trabajos previos de SparckJones, quien recopila todos los estudios sobre la medida de la efectividad de la recuperación de información realizados entre los años 1958 y 1978. Proyectos Cranfield. Si bien Lancaster afirma que los primeros estudios datan del año 1953, verdaderamente “los primeros estudios significativos fueron los Proyectos Cranfield, que proporcionaron una nueva dimensión a la investigación en SRI” [CHO, 1999]. Estos estudios se llevaron a cabo en el Instituto Cranfield de Tecnología y representan el arranque de la investigación en la evaluación de la recuperación de información, tal -49- Evaluación de la Recuperación de la Información como dice López Huertas para quien “los tests Cranfield son el punto de partida de las investigaciones empíricas y experimentales sobre la recuperación de la información, estudios que, hasta ese momento, se desenvolvían en un ámbito filosófico o especulativo” [LOP, 1998]. Originariamente, este estudio proyectaba evaluar el funcionamiento de varios sistemas de indización y el rendimiento de los SRI basados en ellos, aunque su repercusión ha sido mayor, ya que algunas de las medidas más comúnmente empleadas en la evaluación de los SRI (precisión39, exhaustividad40, tasa de fallo41, etc.) fueron establecidas a partir de la realización de este estudio. Son dos los estudios Cranfield más importantes. El primero de ellos, dirigido por Cleverdon, comenzó en 1957 y tenía como objetivos comparar la efectividad de cuatro sistemas de indización: un catálogo alfabético de materias basado en una lista de encabezamientos; una clasificación CDU; un catálogo basado en una clasificación por facetas y, finalmente, un catálogo compilado por un índice coordinado de unitérminos. Los resultados de este estudio proporcionan unos valores de exhaustividad altos (entre el 60-90% con un promedio del 80%), favorecidos por el tiempo dedicado a la indización, y proporcionó algunos datos sobre el sistema de indización: “primeramente, el test probó que el rendimiento de un sistema no depende de la experiencia del indizador; en segundo lugar, mostró que los sistemas donde los documentos se organizan por medio de una clasificación facetada rendían menos que los basados en un índice alfabético” [CHO, 1999]. López Huertas cita a Belkin para resaltar la repercusión de este experimento en los sistemas de indización y en los lenguajes documentales42 [LOP, 1998], aunque donde realmente ha sido realmente importante es en el área de la evaluación de los SRI, principalmente por dos razones: estableció los factores más implicados en el funcionamiento de los SRI y refrendó el desarrollo de la primera metodología de evaluación, sobresaliendo la introducción de las medidas de exhaustividad y precisión, que, bien ligeramente modificadas, bien Medida que se presenta en el apartado siguiente y que determina el porcentaje de acierto de una operación de recuperación de información. 39 Medida que se presenta en el apartado siguiente y que determina la profundidad de una operación de recuperación de información, es decir, el porcentaje de documentos recuperados válidos para el usuario comparado con el total de documentos interesantes para el usuario que hay en la base de datos. 40 Medida que se presenta en el apartado siguiente y que determina el porcentaje de error cometido en una operación de recuperación de información. 41 Belkin considera esta experiencia el origen del paradigma físico y del paradigma lógico o cognitivo que tanta fama ha proporcionado a este autor. 42 -50- Evaluación de la Recuperación de la Información provistas de nuevas interpretaciones o bien asociadas a exacerbadas críticas, nos siguen acompañando hasta nuestros días. El segundo proyecto Cranfield fue un experimento controlado destinado a fijar los efectos de los componentes de los lenguajes de indización en la ejecución de los SRI. Este test también pretendía ofrecer datos sobre la naturaleza de los fallos de un SRI43. Sus resultados mostraron resultados contradictorios, principalmente a la hora de seleccionar los términos más adecuados para representar los conceptos contenidos en los documentos, ya que los sistemas de indización libre (no controlados) ofrecieron mejor rendimiento que los controlados, obteniéndose mejores resultados con lenguajes de indización basados en los títulos de los artículos que en los basados en los resúmenes, hecho sorprendente cuando menos. Vickery comenta “que las medidas usadas en el segundo experimento Cranfield no caracterizaron adecuadamente los aspectos operativos de un SRI” [CHO, 1999]. Por lo tanto, este segundo proyecto no ha tenido tanta repercusión como el primero. MEDLARS. El funcionamiento del sistema MEDLARS44 fue evaluado entre los años 1966 y 1967 por Lancaster. Se trata, probablemente, “del SRI más famoso disponible de la Biblioteca Nacional de Medicina” [SAL, 1983]. La experiencia pretendía observar la efectividad de la recuperación de información de esta base de datos y averiguar la manera de mejorarla. Los resultados emanados proporcionaron valores medios de exhaustividad más bajos que los obtenidos en el primer test de Cranfield, cifrándose aproximadamente en torno al 57%, y valores medios de precisión del 50%. A diferencia del test de Cranfield, sí proporcionó pormenores sobre las razones de los fallos producidos en la recuperación de información, centrándose la mayor proporción de los problemas en la indización, en la realización de las búsquedas y en la interacción del usuario con el sistema (estas tres razones totalizan un 87% de los fallos) [CHO, 1999]. SMART. El sistema SMART, diseñado en 1964 por Salton, fue concebido como una herramienta experimental de la evaluación de la efectividad de muchos tipos de análisis y procedimientos de búsqueda. Este sistema se distingue a si mismo del resto de los SRI convencionales en cuatro aspectos fundamentales: (1) usa métodos de indización automática para asignar descriptores a los documentos y a la peticiones de información; (2) agrupa documentos relacionados dentro de clases comunes de materias, siendo posible comenzar a estudiar un término específico y obtener sus términos 43 Este problema no fue considerado en el primero de los tests de Cranfield. MEDLARS: Medical Literature Analysis and Retrieval System, sistema de recuperación de información de la Biblioteca Nacional de Medicina (<http://www.nlm.nih.gov/>). 44 -51- Evaluación de la Recuperación de la Información asociados; (3) identifica los documentos a recuperar por similitud con la pregunta realizada por el usuarios y finalmente, (4) incluye procedimientos automáticos para generar mejores ecuaciones de búsqueda basadas en la información obtenida de búsquedas anteriores” [SAL, 1983]. Los experimentos originales realizados con SMART intentaban desarrollar un prototipo de SRI íntegramente automatizado. Se propusieron medidas suplementarias a las usadas en los tests Cranfield, algunas de las cuales se han incorporado a posteriores evaluaciones de SRI45. En total, se determinaron cuatro grupos de evaluación: Grupo evaluación de Función A Autores de las búsquedas, cada uno de ellos lleva a cabo juicios de relevancia de las búsquedas que realiza. B Enjuiciadores de la relevancia de búsquedas realizadas por otros autores, y sólo una de cada una de ellas. Son personas distintas. C El documento es relevante para una búsqueda determinada si el juicio A o el juicio B es relevante. D El documento es relevante para una búsqueda determinada si el juicio A y el juicio B es relevante. Tabla 3.1 Grupos de evaluación formados para el experimento del sistema SMART. Fuente: Salton, G. and Mc Gill, M.J. Introduction to Modern Information Retrieval. New York: Mc Graw-Hill Computer Series, 1983 SMART incorpora tres procedimientos diferentes de análisis del lenguaje, conocidos como palabra, lema y tesauro. El primero de estos métodos emplea palabras comunes reducidas a su forma singular a las que se les asigna un peso. El segundo método extrae la base de la palabra, desprendiéndola de los sufijos, de manera que se agrupan varias palabras en un mismo lema, que es a quien se le asigna el peso. Por último, con el tesauro se asignan los términos descriptores que mejor representan a los conceptos de los documentos y se les asigna un peso. Tras la realización de los experimentos sobre este sistema, se obtuvieron dos series de resultados principales: 1. El procedimiento de análisis del texto que hace uso del tesauro mejora ligeramente al de los lemas y ambos resultan bastante mejores que el los términos simples o palabras. 2. Los mejores resultados en términos de exhaustividad y precisión se obtienen en el cuarto grupo de evaluaciones, es decir, cuando Se refieren a los gráficos Exhaustividad-Precisión promedio de ambos valores y a sus versiones normalizadas. Estas medidas se presentan posteriormente. 45 -52- Evaluación de la Recuperación de la Información tanto los usuarios que realizan las preguntas como los evaluadores ajenos a esas preguntas están de acuerdo [CHO, 1999]. Salton realiza una interesante comparación de su sistema con el sistema MEDLARS [SAL, 1983], a partir de una subcolección de documentos extraída del sistema Science Citation Index (SCI). Los resultados de exhaustividad y precisión de MEDLARS son ligeramente inferiores que los obtenidos por SMART cuando se aplica el método del tesauro para reconocer el texto. En cambio, MEDLARS supera a los otros dos procedimientos de SMART. El proyecto STAIRS. La evaluación del funcionamiento de STAIRS46 fue un proyecto desarrollado en los años ochenta por Blair y Maron [BLA, 1990], quienes evaluaron la efectividad en la recuperación de información de este sistema examinando alrededor de 40.000 documentos legales (unas 350.000 páginas de texto completo), lo que representa un sistema de tamaño real. Los juicios de relevancia fueron llevados a cabo por los usuarios que realizaron las consultas. El número de documentos útiles no recuperados fue estimado a través de la aplicación de una serie de técnicas de muestreo estadístico. Los usuarios utilizaron, durante el ensayo, los SRI de similar manera que si estuvieran realizando una consulta normal y corriente. El experimento proporcionó unos resultados de precisión que rondaban valores cercanos al 75%, y unos valores de exhaustividad que oscilaban alrededor del 20%, cuantías algo más bajas que las obtenidas en otros estudios anteriores47, especialmente en el caso de la exhaustividad. Esta medida se analizó dependiendo de si el juicio de valor lo realizaba el abogado (experto) o el pasante (abogado también, pero menos experto). Los resultados mostraron que la media de las exhaustividades obtenida por los abogados (9,73%) superaba a la media de los pasantes (7,56%). En cambio, las diferencias en precisión son mayores, alcanzando los trece puntos (85% frente a un 82%). Basándose en el valor de la precisión, este experimento propugna que los juicios de relevancia deben llevarlo a cabo un grupo de expertos, aunque esta conclusión parece muy simple, en tanto que las diferencias, tanto de precisión como de exhaustividad no son muy grandes. 46STAIRS: Storage And Information Retrieval System. 47Estos bajos valores de exhaustividad planteaban una duda a considerar en el seno del contexto de una base de datos de legislación, ya que este sistema debería entregar al abogado la mayor parte de documentos relacionados con un tema. De hecho, los usuarios pensaban que estaban recuperando alrededor del 75% de los documentos relevantes con un tema. -53- Evaluación de la Recuperación de la Información Otra conclusión importante de este estudio es que existen grandes diferencias entre la percepción de los usuarios del SRI y la realidad en todo lo relacionado con la exhaustividad de una búsqueda. De hecho, este estudio muestra la dificultad de estimar fiablemente el nivel de esta medida, es decir, demostró lo difícil que resulta estimar cuántos documentos relacionados con la temática de la pregunta van a estar incluidos en la base de datos, a partir de una muestra. Por último, los autores achacan los pobres resultados obtenidos en este estudio a razones de “desinformación”, en este caso incide mucho que el sistema STAIRS sea de texto completo y el usuario se siente incapaz de predecir las palabras y frases que representan a los documentos útiles de la colección. Conferencias TREC. Las conferencias TREC48 se han convertido en el foro de intercambio científico más prestigioso del campo de la recuperación de información. TREC reúne a creadores de diferentes sistemas y compara los resultados que éstos obtienen en diferentes pruebas, previamente estandarizadas y acordadas por todos. Este foro se viene celebrando anualmente desde 1991. TREC nació con la idea de resolver uno de los mayores problemas de las evaluaciones de los SRI: las mismas suelen llevarse a cabo sobre pequeñas colecciones de documentos, y sus resultados resultan de difícil extrapolación a la totalidad de la colección almacenada. En 1991, con la idea de salvar este problema, DARPA49 propuso poner en marcha los experimentos TREC en el Instituto Nacional de Ciencia y Tecnología (NIST), para propiciar que los investigadores en recuperación de información probaran sus sistemas en una gran colección de documentos. Chowdhury sintetiza los cinco objetivos de estos experimentos: 1. Aumento de la investigación en recuperación de información sobre grandes colecciones de documentos. 2. Desarrollo de la comunicación entre los entornos académicos, industrial y gubernamentales a través de la realización de un foro abierto. 3. Incremento de la transferencia de tecnología. 4. Presentación del estado de la investigación y desarrollo en este campo de forma anual 5. Perfeccionamiento de las técnicas de evaluación [CHO, 1999]. TREC: Text REtrieval <http://trec.nist.gov/> 48 Conferences. Se puede ampliar información en DARPA: Defence Advanced Research Projects Agency. Es la Agencia de Proyectos de Investigación del Departamento de Defensa de Estados Unidos de América. Es la organización a la que debe su nacimiento la Red Internet. 49 -54- Evaluación de la Recuperación de la Información La primera conferencia, TREC-1 (1992), ofreció como resultado principal el hecho de la existencia de una amplia similitud entre los SRI que hacen uso de técnicas basadas en lenguaje natural y los basados en los modelos probabilístico y los basados en el modelo del vector. En la conferencia TREC-2 (1993), se detectó una significativa mejoría de la recuperación de información, con respecto a la anterior. Las siguientes conferencias aportaron nuevas prestaciones a los experimentos: localización de información en varias bases de datos de forma simultánea, presencia de errores ortográficos con el fin de valorar el comportamiento de los SRI ante ellos y recuperación de información en idiomas distintos del Inglés (se eligieron el Español y el Chino) para valorar los posibles cambios de comportamiento de los SRI. Estas conferencias han aportado la evaluación de variadas modalidades de recuperación de información (desde el clásico modelo booleano a la búsqueda por cadenas de texto o las búsquedas basadas en diccionarios), y han demostrado hasta qué punto pueden alcanzarse resultados significativos de investigación a través de la cooperación entre investigadores en el ámbito mundial. De hecho, en palabras de Sparck Jones, “la comunidad investigadora debe estar muy agradecida a las conferencias TREC, en tanto que han revitalizado la investigación en recuperación de información y también ha demostrado la importancia de este campo de investigación en áreas afines, tales como el procesamiento del lenguaje natural y la inteligencia artificial” [CHO, 1999]. Medidas tradicionalmente empleadas. Tras haber delimitado conceptualmente qué se entiende por resultado relevante y por resultado pertinente, se procederá a la identificación de los parámetros utilizados en la medida de la efectividad de los SRI. Es decir, a partir de este punto, se abandona la discusión sobre qué se debe considerar relevante y qué no se debe considerar, y bajo qué circunstancias se desarrolla ese juicio o evaluación, para adentrarnos en el estudio de las variables a medir en la recuperación de información. Es conveniente recordar que, de un lado, existen una serie de medidas orientadas a analizar el acceso físico a los datos, y por el otro, existen otras que intentarán analizar si el contenido es o no pertinente. Rijsbergen se pregunta qué evaluar, y se responde citando a Cleverdon (tests Cranfield) con seis medidas principales: “la cobertura de una colección; el tiempo de respuesta del sistema; la forma de presentación de los resultados; el esfuerzo realizado por el usuario; la exhaustividad y la precisión del sistema” [RIJ, 1999]. Para este autor, las cuatro primeras medidas son intuitivas y fácilmente estimables. Considera además que la exhaustividad y la precisión, son las que verdaderamente pretenden medir la efectividad del SRI: “la efectividad es puramente una -55- Evaluación de la Recuperación de la Información medida de la capacidad del sistema para satisfacer al usuario en términos de la relevancia de los documentos recuperados” [RIJ, 1999]. Chowdhury presenta las medidas de Cleverdon y cita a Vickery, quien propone seis medidas divididas en dos grupos: “el primero lo forman la cobertura (proporción de las referencias que potencialmente podrían haberse recuperado), la exhaustividad y el tiempo de respuesta; el segundo lo forman la precisión, la usabilidad (el valor de las referencias considerado en términos de fiabilidad, comprensión, actualidad, etc. ) y la presentación (la forma en la que los resultados de la búsqueda son presentados al usuario)” [CHO, 1999]. Las medidas de Cleverdon es también usado por Salton, quien tiene similares dudas sobre el cálculo de los valores de la precisión y de la exhaustividad [SAL, 1983]. Junto a las medidas basadas en la relevancia, diversos autores proponen una amplia serie de medidas basadas en otros criterios. Meadow las sintetiza en tres grupos según su base: la relevancia, el resultado y el proceso [MEA, 1992]. Medidas basadas en la Relevancia Precisión Documentos relevantes recuperados divididos entre el total de documentos recuperados Exhaustividad Documentos relevantes recuperados dividido entre el total de documentos relevantes Promedio de la efectividad E-P Promedios de la efectividad en pares de valores de exhaustividad y precisión Tabla 3.2. Medidas basadas en la relevancia. Fuente: Meadow, C. T. Text Information retrieval Systems. San Diego: Academic Press, 1993. En esta primera tabla aparecen las medidas de Precisión y Exhaustividad que serán, a pesar de las críticas que han recibido por su subjetividad, las más empleadas en todos los estudios de evaluación. Medidas de Resultado Precisión -- ya definida anteriormente -- Exhaustividad -- ya definida anteriormente -- Promedio efectividad E-P -- ya definida anteriormente -- Medidas promedio de la satisfacción del usuario Medidas que pretenden medir la reacción de los usuarios ante el resultado de una búsqueda Tabla 3.3 Medidas basadas en los resultados. Fuente: Meadow, C. T. Text Information retrieval Systems. San Diego: Academic Press, 1993. Prácticamente se trata del mismo conjunto de medidas. A este conjunto se le une una nueva, la medida de la satisfacción del usuario ante el resultado obtenido. -56- Evaluación de la Recuperación de la Información Medidas basadas en el Proceso Selección Mide cuántos documentos hay en la base de datos, el grado de solapamiento con otras relacionadas, qué se espera de la base de datos antes de las búsquedas Contenido Tipo de documentos de la base de datos, temática de los documentos, frecuencia de actualización Traducción de una consulta Se verifica si el usuario puede plantear la consulta directamente o precisa de intermediación Errores en establecimiento de la consulta Media de errores sintácticos en la escritura de la búsqueda que propician la recuperación de conjuntos vacíos y erróneos Tiempo medio de realización de la búsqueda Tiempo medio de realización de una estrategia de búsqueda Dificultad en la realización de la búsqueda A la ratio anterior habrá que añadir los problemas que usuarios inexpertos se pueden encontrar Número de comandos precisos para una búsqueda Promedio de instrucciones necesarias para realizar una búsqueda Coste de la búsqueda Costes directos e indirectos en su realización Nº docs recuperados Extensión del resultado de una búsqueda Número de documentos revisados por el usuario Promedio de documentos que los usuarios están dispuestos a revisar Tabla 3.4 Medidas basadas en el proceso de la recuperación de la información. Fuente: Meadow, C. T. Text Information retrieval Systems. San Diego: Academic Press, 1993. Medidas basadas en la relevancia. Se considera de una mayor importancia el conjunto de las medidas basadas en la relevancia que el conjunto de las medidas basadas en el proceso y en el resultado. Las medidas correspondientes al segundo grupo sirven para diferenciar unos sistemas de otros con base en las prestaciones de la aplicación informática subyacente, y no permiten la evaluación de aspectos relacionados con el contenido de los documentos. Las medidas del tercer grupo se encuentran muy relacionadas con las basadas en la relevancia, aunque introducen algunos aspectos diferenciadores que presentaremos en el desarrollo de este capítulo, pero, en términos generales, hemos de decir que, son más frecuentes las coincidencias que las discrepancias. En una búsqueda de información, un usuario obtiene un conjunto de documentos, de los cuales unos formarán parte del subconjunto de -57- Evaluación de la Recuperación de la Información documentos relevantes con la temática objeto de la búsqueda y otros van a formar parte del subconjunto de documentos que no lo van a ser. Asimismo, este usuario dejará de recuperar otro conjunto de documentos igualmente relevantes con esa temática, y otro conjunto de documentos no relevantes, tal como muestra la ilustración 3.1. docrel docRecrel docRecNorel docNorel docRec Ilustración 3.1 Distribución de los resultados de una operación de búsqueda. docRec: documentos recuperados: docRecrel: documentos recuperados relevantes; docRecNorel: documentos recuperados no relevantes; docrel: documentos relevantes; docNorel: documentos no relevantes. Esta distribución de los resultados de una operación de búsqueda, conforma la especificación de una serie de subconjuntos de la base de datos en relación con la pregunta realizada, que nos muestra Rijsbergen en la tabla 3.5, más conocida como Tabla de Contingencia: RECUPERADOS NO-RECUPERADOS RELEVANTES NO-RELEVANTES AB A B B A B A B B A A N N = número documentos en el sistema Tabla 3.5 Tabla de contingencia de Rijsbergen. Fuente: Rijsbergen, C.J. Information Retrieval. [En línea]. Glasgow, University, 1999. <http://www.dcs.gla.ac.uk/~iain/keith/> [Consulta: 21 de octubre de 2001] Esta tabla, que también encontramos en [SAL, 1983], [FRA, 1997], [LAN, 1993], [MEA, 1992], [CHO, 1999] y [KOR, 1997], sirve de base para formular una definición de las medidas de exhaustividad, de precisión así como una tercera medida, que Rijsbergen destaca como muy -58- Evaluación de la Recuperación de la Información interesante, la tasa de fallo. Estas especificaciones se recogen en la siguiente tabla: Precisión Exhaustividad Fallo Tabla 3.6 Fórmulas de Precisión, Exhaustividad y Fallo. Fuente: Rijsbergen, C.J. Information Retrieval. [En línea]. Glasgow, University, 1999. <http://www.dcs.gla.ac.uk/~iain/keith/> [Consulta: 21 de octubre de 2001] La primera medida basada en la relevancia propuesta es la precisión, la cual es, quizás, la medida más intuitiva y más sencilla de recordar: La precisión mide el porcentaje de documentos recuperados que resultan relevantes con el tema de la pregunta y su cálculo es verdaderamente simple: se divide el total de documentos relevantes recuperados entre el total de documentos recuperados. La exhaustividad conlleva algunos problemas más en su cálculo, si bien la definición está clara, el número de documentos relevantes recuperados dividido entre el número de documentos totales relevantes de la base de datos, no está tan claro cuál es el valor de ese denominador, más bien no está nada claro. Lógicamente, si el usuario conociera de antemano cuántos documentos relevantes hay en la base de datos, ¿por qué no los recupera todos en esa operación de búsqueda obteniendo los valores máximos en ambas medidas?. La respuesta es simple: porque no los puede conocer de antemano, como máximo puede inferir un número aproximado pero nunca podrá afirmar esa cantidad con total seguridad. La tasa de fallo equivale al porcentaje de documentos recuperados no relevantes sobre el total de documentos no relevantes de la base de datos. Esta medida es especialmente importante si se considera que la precisión se encuentra muy sujeta a posibles variaciones en el contenido de la base de datos, y se observa que la tasa de fallo no adolece tanto de esta dependencia: “los cambios en la generalidad de una colección afectan menos a la tasa de fallo que a la precisión, que resulta más sensible. En particular, si el nivel de generalidad decrece (bien porque el número de documentos relevantes disminuye o bien porque se acrecienta el número de documentos en la colección), el número de documentos recuperados relevantes tiende a decrecer, pero el número total de documentos recuperados así como el número total de documentos no recuperados pueden permanecer en un nivel constante” [SAL, 1983]. Estos argumentos han resaltado la importancia de esta medida. -59- Evaluación de la Recuperación de la Información Salton tambíen se refiere a una nueva medida, el factor de generalidad: “el grado de documentos relevantes contenidos en una colección” [SAL, 1983]. Una colección con un alto grado de generalidad es una colección donde los documentos relevantes son mayoría frente a los que no lo son. Todas estas medidas se encuentran muy vinculadas entre ellas, tanto que incluso la “precisión puede definirse en función de las tres restantes” [SAL, 1983], tal como podemos observar en la siguiente expresión: P (E G ) ( E G ) F (1 G ) P =precisión; E =exhaustividad; G = generalidad y F = fallo Tabla 3.7 Enunciación de la Precisión con base en el resto de las tasas. . Fuente: Salton, G. and Mc Gill, M.J. Introduction to Modern Information Retrieval. New York: Mc Graw-Hill Computer Series, 1983 Estas medidas suelen expresarse en un rango que oscila entre 0 y 1, aunque también podrían expresarse en tanto por ciento, como hacen [LAN, 1993] y [CHO, 1999]. La precisión y la exhaustividad tienden a relacionarse de forma inversa. A mayor valor de precisión menor será el valor de la exhaustividad. Esta situación viene recogida en casi todos los textos y manuales revisados por medio de una gráfica similar a la que reproducimos: Ilustración 3.2 Evolución típica de la precisión y de la exhaustividad en un SRI Consideramos, como primera aproximación a la evolución manifestada en esta gráfica, que un usuario lleva a cabo una operación de recuperación de información en la cual inserta condiciones muy específicas, seguramente obtendrá un conjunto de resultados muy preciso pero, de igual modo, habrá dejado de recuperar algunos documentos a causa de ese alto nivel de especificación. Como ejemplo de esta -60- Evaluación de la Recuperación de la Información situación tenemos estas dos operaciones de búsqueda que planteamos a continuación: B1: “contaminación del agua en los ríos” B2: “contaminación en los ríos” Ambas búsquedas pretenden recuperar el mismo tipo de documento, pero, en el caso de la primera (B1), el usuario la plantea de una forma más específica que la segunda (B2). Este segundo usuario ha pensado que no es necesario emplear el término “agua” en la operación de recuperación de información, ya que, a lo mejor piensa que cuando se contamina un río, es el agua lo que se contamina y le ha parecido redundante e innecesaria tanta especificación. Con toda seguridad, la primera búsqueda (B1) va a adolecer del problema que estamos presentando, ya que basta que en un documento el autor o el indizador no haya alcanzado el nivel de especificación empleado por el usuario que plantea la búsqueda, para que sea recuperado por la segunda (B2) pero no por la primera (B1). En esta situación, la segunda búsqueda presentará unos niveles mayores de exhaustividad frente a la primera y unos niveles de precisión algo más bajos. El caso contrario se presenta también frecuentemente: un usuario plantea una ecuación de búsqueda demasiado general, con la que seguramente recuperará la mayoría de los documentos relevantes con el tema de la cuestión, pero, al mismo tiempo recuperará muchos documentos que no resultan relevantes. Esto implicará que los valores de precisión se reduzcan sustancialmente. Si por ejemplo, los usuarios del ejemplo anterior, hubieran realizado estas búsquedas: b1: “contaminación” b2: “contaminación en los ríos” Este es un claro ejemplo de lo que venimos comentando, en tanto que ahora el primer usuario, con su operación de búsqueda (b1), en lugar de presentar un exceso de especificidad en su planteamiento, presenta un defecto, ya que va a recuperar con toda seguridad la totalidad de documentos de la base de datos sobre contaminación fluvial, pero, de igual forma, va a recuperar documentos sobre contaminación atmosférica o contaminación acústica, documentos que, obviamente, no son relevantes con el tema de la búsqueda y cuya presencia en el conjunto de documentos recuperados provocará que el nivel de precisión sea bastante bajo. Al significativo problema mencionado anteriormente de la imposibilidad de determinar con exactitud el valor de la exhaustividad, Korfhage añade otros dos: “en segundo lugar, no está claro que la exhaustividad y la precisión sean medidas significativas para el usuario” [KOR, 1997]. -61- Evaluación de la Recuperación de la Información De hecho, la mayoría de los usuarios consideran mucho más importante la precisión, relegando a la exhaustividad a un cometido secundario. Así, mientras la búsqueda proporcione información relevante con la materia objeto de la necesidad informativa, el usuario no se detiene a pensar en la cantidad de documentos relevantes que no recupera, aunque este razonamiento no puede aplicarse como regla general en todos los SRI (como es el caso de las bases de datos jurídicas, donde es necesario garantizar un alto nivel del exhaustividad, si queremos estar en posesión de todos los precedentes legales sobre un tema objeto de litigio con el fin de que un abogado fundamente su argumentación ante el tribunal en las debidas condiciones y con las mayores posibilidades de éxito). Medidas orientadas al usuario. El tercer problema apuntado por Korfhage, reside en el hecho de que las medidas basadas en la relevancia están excesivamente vinculadas con la persona que lleva a cabo la evaluación y resultan de difícil traslado a otra persona, tal como alude Baeza-Yates: “ambas medidas se basan en el supuesto de que el conjunto de documentos relevantes para una respuesta es siempre el mismo, independientemente del usuario que lleva a cabo la evaluación. Esta situación, evidentemente, no responde adecuadamente a la realidad, en tanto que diferentes usuarios pueden tener una interpretación desigual de qué documento es relevante y cuál no lo es” [BAE, 1999]. Para solucionar este problema, [BAE, 1999], [KOR, 1997] y [SAL, 1983] presentan una serie de nuevas medidas en las cuales se parte del supuesto de que los usuarios forman un grupo homogéneo, de similar respuesta en el proceso de determinación de la relevancia del resultado de una operación de búsqueda. Esta situación, aunque algo difícil de asumir en el mundo real, permite el desarrollo de una serie de nuevas medidas denominadas “Medidas Orientadas al Usuario”. Korfhage indica que este nuevo conjunto de medidas “fue propuesto por Keen a principio de la década de los setenta. Hay tres comunes: 1. Cobertura: proporción de los documentos relevante conocidos que el usuario ha recuperado 2. Novedad: proporción de los documentos recuperados relevantes que eran previamente desconocidos para el usuario 3. Exhaustividad Relativa: la ratio de los documentos relevantes recuperados examinados por el usuario entre el número de documentos que el usuario está dispuesto a examinar.” [KOR, 1997]. De esta forma, la obtención de un valor alto de cobertura indica que el sistema ha localizado la mayoría de los documentos relevantes que el usuario esperaba encontrar. Un valor alto de novedad indica que el -62- Evaluación de la Recuperación de la Información sistema ha mostrado al usuario una considerable documentos, los cuales desconocía previamente. cantidad de Ambos autores sugieren una cuarta medida orientada al usuario: la conocida como “esfuerzo de exhaustividad”, entendida como “la ratio entre el número de documentos relevantes que el usuario espera encontrar y el número de documentos examinados en un intento de encontrar esos documentos relevantes” [BAE, 1999]. Esta medida, para Korfhage, parte de dos supuestos primordiales: “la colección contiene el número deseado de documentos relevantes y el SRI permite al usuario localizarlos todos” [KOR, 1997]. Ilustración 3.3 Distribución de documentos relevantes y de documentos integrantes de una respuesta a una operación de búsqueda. Fuente: Baeza-Yates, R. and Ribeiro-Neto, B. Modern information retrieval. New York : ACM Press ; Harlow [etc.] : Addison-Wesley, 1999. Cálculo de la Precisión y de la Exhaustividad. Si bien la precisión de una operación de recuperación de información puede ser calculada fácilmente, el cálculo de la Exhaustividad se presenta inviable, “solamente puede ser estimado” [BLA, 1990]. La estimación de esta medida ha constituido el objeto de trabajo de varios investigadores. Blair lleva a cabo una amplia revisión de algunos de estos trabajos, que vamos a ir presentando de forma sintetizada. Uno de los primeros métodos empleados consistió en limitar el tamaño de la base de datos, por ejemplo, a algo menos de 1000 documentos (cantidad que se entiende como factible para localizar la información documento a documento), y calcular el valor de la exhaustividad una vez analizados todos los documentos. Este método ha resultado de gran aceptación y su posible justificación procede del campo de la experimentación en Física, donde los resultados a pequeña escala producían resultados generalmente extrapolables al mundo real. Aunque, por desgracia, éste no es el caso de los SRI, donde un cambio cuantitativo de la colección provoca un cambio cualitativo en el modo que la recuperación de información ha de llevarse a cabo. -63- Evaluación de la Recuperación de la Información Si por ejemplo, tenemos un SRI cuya base de datos posee un tamaño de 1000 documentos, y un usuario recupera el 10% de los documentos de la base de datos (es decir, 100), a este usuario le puede resultar tedioso y aburrido analizar esta cantidad de documentos uno a uno (para verificar la relevancia o no del mismo con la materia objeto de su necesidad de información), pero esa operación resulta posible. En cambio, si se supone que la misma técnica de recuperación y el mismo vocabulario controlado de términos, es aplicado a una colección de 100.000 documentos, es lógico presumir que el resultado rondará la cantidad de 10.000 documentos recuperados (diez veces mayor que el tamaño de la base de datos anterior), extensión absolutamente inmanejable para el usuario, quien se vería obligado a introducir nuevas expresiones en su ecuación de búsqueda con el fin de limitar la extensión del conjunto de documentos resultado (es decir, tendría que refinar su búsqueda), esta nueva serie de expresiones implica una variación de la estrategia de recuperación que ya no será igual que la efectuada sobre la búsqueda. Blair cita a Resnikoff, para quien “las pruebas a pequeña escala no dicen mucho sobre el rendimiento del SRI o sobre las estrategias óptimas de recuperación para sistemas del mismo tipo pero mayores en tamaño” [BLA, 1990], y a Swanson, quien opina que “un argumento estadístico simple mostrará que las pruebas sobre colecciones de unos pocos cientos de documentos no son lo suficientemente sensitivas ni siquiera para permitir una aproximación del rendimiento en colecciones de cientos de miles de documentos, que son sobre los que debemos realizar las pruebas” [BLA, 1990]. Lancaster, en el desarrollo de la evaluación de MEDLARS, determina de antemano los valores de la exhaustividad [LAN, 1968], procediendo a lo que se conoce como una “estimación informal” de la exhaustividad. Este estudio de Lancaster aporta también un copioso análisis de las causas de los errores que se cometen en las operaciones de recuperación de información. Otro procedimiento de cálculo de la exhaustividad, consiste en asignar a varias personas la tarea de analizar la documentación recuperada. Este procedimiento, además de más complejo y costoso en recursos humanos, contradice el sentido de la utilidad del documento recuperado para el ser humano que realiza la búsqueda (o pertinencia), ya que dos personas emiten, de forma ineludible, distintos juicios de valor y lo que puede ser bueno para uno no tiene por qué serlo para el otro. Más lógica parece la idea de calcular la exhaustividad a partir de la toma de una muestra aleatoria de la colección documental, donde el usuario evaluará la pertinencia de los mismos y entonces, empleando técnicas estadísticas fiables, procederá a la estimación del número de documentos útiles de la colección. -64- Evaluación de la Recuperación de la Información Esta técnica, que parece viable y de sencilla realización, también presenta problemas, porque no está muy claro qué tamaño debe tener la muestra a analizar. Blair cita a Tague [BLA, 1990] quien avisa de la dificultad de llevar a cabo esta tarea en base de datos de muy baja generalidad (es decir, donde el porcentaje de documentos relevantes es muy bajo); en este caso el tamaño de la muestra debería ser muy grande y el análisis se complicaría. Como ejemplo de lo anterior se puede presentar el siguiente caso: si la materia que deseamos localizar es demasiado específica, por ejemplo del orden de 1 documento pertinente por cada 100, la muestra que deberíamos manejar rondaría la cantidad de 5.000 documentos. Aunque este problema subyace, esta técnica ha resultado ser la más empleada por la mayoría de los estudios que hemos repasado, asumiendo todos ellos, que los niveles de generalidad no alcanzarán cotas tan bajas. También se apunta una última técnica: realizar sondeos exploratorios en el resto de los documentos no recuperados. Este conjunto de estimaciones será más o menos fiable en función de la profundidad y alcance de los sondeos. Blair prosigue presentado ampliamente esta problemática, incorporando las reflexiones de Sparck-Jones (quien recopila trabajos desarrollados a lo largo de treinta años en este campo), Swanson y Salton. En todos los casos surge la duda, razonable por otra parte, del tamaño de la muestra, la cual, además de los problemas inherentes a su determinación, presenta otra problemática: difícilmente garantizará una similar distribución de la temática de los documentos recuperados fuera de ella. Sparck-Jones critica también la realización de estudios donde los fallos resultan más achacables a un inadecuado (e incluso inexistente, a veces) método de estimación estadística de estos valores. Con la idea de proporcionarnos algo de luz en este oscuro panorama, Salton [SAL, 1983] apuesta por calcular los valores de exhaustividad y precisión sobre una muestra de documentos de la colección total. Realmente Salton50 no llega a afirmar en ningún momento que los resultados de este análisis puedan trasladarse sin problema alguno a la globalidad de una gran base de datos, pero como afirma que no existen evidencias de lo contrario, sugiere que puede hacerse. Esta actitud positivista, es absolutamente contrarrestada por la opinión de Swanson, quien aboga por encontrar pruebas de su corrección 50 Salton defiende esta postura en el curso del estudio de comparación del rendimiento de los sistemas de recuperación de información STAIRS y SMART, que hemos citado anteriormente. -65- Evaluación de la Recuperación de la Información antes de aplicarla [BLA, 1990], actitud loable, sin duda alguna, pero que no aporta solución a este problema. Aceptando que el cálculo de la precisión y exhaustividad debe llevarse a cabo sobre una muestra pequeña de la amplia colección de documentos de la base de datos, se va a exponer a continuación cómo se realiza este cálculo. En primer lugar, se supone que se elige una muestra constituida por los primeros ocho documentos (d1, d2, ... , d8) recuperados en una búsqueda Q, en la que resultan pertinentes los documentos {d1, d2, d4, d6, d8}. Salton entiende que los cálculos Exhaustividad-Precisión (E-P en adelante), deben realizarse documento a documento recuperado, es decir, no son iguales el par de valores E-P en el primer documento que en el segundo. Siguiendo lo indicado por Salton los valores de exhaustividad y precisión calculados son los siguientes: Exhaustividad – Precisión N Relevante E P d1 X 0.2 1 d2 X 0.4 1 0.4 0.66 0.6 0.75 0.6 0.60 0.8 0.66 0.8 0.57 1 0.625 d3 d4 X d5 d6 X d7 d8 X Tabla 3.8 Cálculo de pares de valores E-P de la búsqueda ejemplo. Fuente: elaboración propia. Cuando realizamos los cálculos en el primer documento (d1), se ha recuperado un único documento que es pertinente y, por tanto, la precisión valer uno (un acierto en un intento) y la exhaustividad (resultado de dividir el valor de uno entre el total de documentos relevantes de la muestra, valor que sí conocemos de antemano y es cinco), vale 0.2. Así, el documento d1 tiene asignado el par de valores E-P (0.2, 1). A continuación, procedemos a calcular el par de valores E-P de d2, también relevante, aquí la precisión será el resultado de dividir el valor de dos documentos relevantes recuperados (d1 y d2) entre el total de documentos recuperados hasta el momento (dos también), por lo que adquiere de nuevo el valor de la unidad; la exhaustividad será el resultado de dividir el valor de dos (ambos son relevantes) entre el total de -66- Evaluación de la Recuperación de la Información documentos relevantes de la muestra (cinco), obteniéndose un valor de 0.4, por lo que al documento d2 se le asignaría el par de valores E-P (0.4,1). Siguiendo este método se determinan el resto de los pares de valores E-P para los seis restantes documentos recuperados. Este conjunto de ocho pares de valores caracterizará, en principio, a la búsqueda Q, y se podría construir un gráfico E-P similar al reflejado en la ilustración 3.4: 1 1 0,75 0,66 0,2 0,4 0,4 0,6 0,6 0,6 0,66 0,57 0,8 0,8 0,625 1 Ilustración 3.4 Evolución distribución pares de valores E-P del ejemplo. Fuente: elaboración propia. Gráficos como el de la anterior ilustración son muy criticados por no representar claramente algunos parámetros, tales como “el tamaño del conjunto de documentos recuperados y el tamaño de la colección” [SAL, 1983]. Junto a esta serie de deficiencias, se añade que los problemas aumentan al tratarse de un gráfico que muestra una sucesión discreta de valores E - P en lugar de una sucesión continua de los mismos. Sirva como ejemplo que la Ilustración 3.4 no indica qué valor de precisión corresponde a un valor de exhaustividad de 0.4, ya que el mismo varía desde el valor inicial de 1 hasta el de 0.66. Este problema aumentaría bastante si en lugar de representar el resultado de una búsqueda individual, se quisiera representar los resultados de varias, con el fin de determinar el comportamiento promedio del sistema. Salton opina que “es conveniente sustituir las curvas con ‘dientes de sierra’ de las preguntas individuales, por líneas atenuadas que simplifiquen el proceso de representar los promedios” [SAL, 1983]. Además, en el gráfico anterior, se detecta una cierta divergencia entre los valores de la línea de regresión de los pares E-P y los representados en el gráfico. Resulta vital que la representación de la evolución de los pares de valores E-P muestre un único valor de precisión para cada valor de exhaustividad, truncando (si es preciso), a un valor intermedio de la precisión las situaciones de similar valor de la exhaustividad. Así, Salton renombra la tradicional formulación -67- Evaluación de la Recuperación de la Información de las medidas exhaustividad y precisión, proponiendo una “exhaustividad instantánea” y una “precisión instantánea”, distintas para cada operación. 1 0,83 d1 d2 0,83 0,675 0,675 d4 d5 d3 0,615 0,615 0,625 d6 d7 d8 Ilustración 3.5 Evolución distribución valores E-P del ejemplo corregida. Fuente: elaboración propia. En esta ilustración se determinan valores similares de precisión para valores análogos de exhaustividad, y la línea de regresión E-P se aproxima mucho más a los valores representados en el gráfico de barras. Medidas Promedio E-P. Por estos problemas, Salton propone calcular las medidas E-P en términos de promedio, reflejando que “el promedio que el usuario puede esperar de la realización de las búsquedas por parte del sistema, puede ser calculado tomando la media aritmética sobre un número de N búsquedas de la exhaustividad y de la precisión individuales de cada una de ellas”. Exhaustividad = 1/N * i=1 (RecReli / RecReli + NoRecReli) Precisión = 1/N * i=1 (RecReli / RecReli + RecNoReli) RecRel: documentos recuperados relevantes RecNoRel: relevantes documentos recuperados NoRecRel: relevantes documentos no recuperados no NoRecNoRel: documentos no recuperados no relevante Tabla 3.9 Formulación de las Medidas Promedio E-P. Fuente: Salton , G. and Mc Gill, M.J. Introduction to Modern Information Retrieval. New York: Mc Graw-Hill Computer Series, 1983. Esta formulación permite representar una curva E-P con valores diferentes de exhaustividad para cada valor de precisión siendo la función ahora continua y la representación gráfica coincide con la tradicional curva de Rijsbergen. -68- Evaluación de la Recuperación de la Información Gráfico E - P 1 1 1 0,95 0,9 Precisión 0,85 0,8 0,75 0,75 0,7 0,65 0,66 0,66 0,625 0,6 0,6 0,57 0,55 0,5 Exhaustividad Ilustración 3.6 Representación de la evolución E-P real y óptima del ejemplo. Fuente: elaboración propia. Ahora, la curva E-P de la búsqueda Q presenta la evolución real de los valores obtenidos, más cercana a la tendencia natural de los pares de valores E-P (línea discontinua). Este método de cálculo se conoce como exhaustividad y precisión relativas, entendiéndose estas medidas como aproximaciones a los verdaderos valores de ambas ratios, sencillas de calcular y base sólida para la evaluación de los SRI. Korfhage presenta dos maneras de calcular el promedio de la exhaustividad y de la precisión. La primera consiste en “calcular los promedios de la precisión para un conjunto de tres o de once valores previamente establecidos de la exhaustividad” o “promedio en tres puntos” y “promedio en once puntos” [KOR, 1997]. El segundo de los procedimientos aportados por Korfhage es “una forma completamente diferente de obtener los promedios. Se parte del supuesto de que en una evaluación, los documentos relevantes para cada conjunto de preguntas son conocidos a priori. Si también se supone que cada pregunta no se realiza hasta que una determinada condición sea satisfecha (como puede ser el recuperar un determinado número de documentos). Tanto la precisión como la exhaustividad pueden ser medidas en ese punto, obteniéndose un par de valores para cada pregunta. A partir de estos valores, se puede proceder a la construcción de una tabla E-P aumentando ambas medidas en un valor de 0.1” [KOR, 1997]. Ambos procedimientos proporcionan, generalmente, diferentes resultados, en tanto que analizan el funcionamiento del sistema de diferente manera, llegándose, a veces, a conclusiones harto dispares. -69- Evaluación de la Recuperación de la Información Medidas alternativas a E-P o medidas de valor simple. Rijsbergen presenta un amplio conjunto de medidas alternativas a la relevancia. Todas pretenden superar los problemas antes estudiados de las medidas E-P. Casi todas usan técnicas probabilísticas y resultan difíciles de calcular [RIJ, 1999]. La mayoría de los autores presentan a estas medidas por separado, no llegando a ponerse de acuerdo en su denominación (“alternativas”, “valor simple” u “otras medidas”). Salton las denomina como “de valor simple”, porque no representan el resultado de una evaluación en función de un par de valores sino de un único valor, que puede ser objeto de clasificación. Posteriormente presenta el Modelo de Swet (que desarrolla la “Medida E”), las medidas SMART (sistema de indización automática desarrollado por Salton) y la longitud esperada de búsqueda basada en el Modelo de Cooper [SAL, 1983]. Rijsbergen es el primero que muestra una medida relacionada con el valor simple, la satisfacción. El autor cita a Borko, para quien este factor de satisfacción es el resultado de sumar los valores de precisión y de exhaustividad. Otras medidas de esta naturaleza se han definido en diversos trabajos de otros autores, siendo todas ellas un instrumento útil para valorar la calidad de una búsqueda, aunque luego veremos que diversos autores opinan que no es suficiente (en todos los casos) realizar una operación aritmética para conseguirlo, y que harán falta otras medidas para estimar esta satisfacción. Autor Expresión Borko I EP Meadow Heine Vickery M 1 (1 P 2 ) (1 R 2 ) 2 D1 1 1 1 1 1 P R V 1 1 2 2 3 P R Tabla 3.10 Medidas de la calidad de una búsqueda propuestas por varios autores. Fuente: Meadow, C. T. Text Information retrieval Systems. San Diego: Academic Press, 1993. Los críticos a las medidas de valor simple basan sus opiniones fundamentalmente en la escasa capacidad que confieren a la exhaustividad y a la precisión en la representación de la efectividad de -70- Evaluación de la Recuperación de la Información una búsqueda. Tampoco se debe olvidar que cada medida tiene una interpretación diferente, en las propuestas por Borko y Meadow, un valor mayor equivale a una búsqueda mejor (o más efectiva), mientras que en las medidas de Heine y Vickery, ocurre justo al contrario. Como justificación sirve el siguiente ejemplo: un usuario realiza una búsqueda “ideal” en la que recupera diez documentos de los cuales todos son relevantes y en toda la base de datos sólo están estos diez documentos relevantes. En este caso “ideal”, el valor de E es igual a 1 y el valor de P es igual a 1, siendo la suma igual a 2 (lo máximo que alcanza la medida de Borko), mientras que la medida de Meadow valdrá 1 (su máximo) y las otras dos medidas valdrían cero. Si se supone a continuación, que la cantidad de documentos relevantes en la base de datos es de 20, el valor de P seguirá siendo 1 pero el valor de E descenderá a 0.5; en este supuesto (que tampoco corresponde con una búsqueda que pueda calificarse de mala), la medida de Borko valdrá ahora 1.5, la medida de Meadow valdrá 0.38 (mucho menos que antes), la medida de Heine tendrá un valor de 0.5 y la medida de Vickery tendrá un valor de 0.66. En último lugar, si se imagina que sólo la mitad de los documentos recuperados son relevantes, P valdría ahora 0.5 y E valdría 0.25 (supuesto algo más desfavorable que en los dos casos anteriores), obteniéndose un valor de 0.75 para la medida de Borko, un valor de 0.07 para la medida de Meadow, de 0.8 para la medida de Heine y de 0.88 para la de Vickery. Así, a mayor efectividad de la búsqueda, los valores de las medidas de Borko y de Meadow serán mayores y, por el contrario, los valores de las medidas de Heine y Vickery decrecerán. Quedan otras medidas alternativas o de valor simple propuestas. Rijsbergen presenta el Modelo de Swet, el Modelo de Robertson, el Modelo de Cooper y las medidas SMART [RIJ, 1999]. Korfhage separa las medidas simples de la medida longitud esperada de búsqueda, pasando a comentar luego las medidas de satisfacción y frustración [KOR, 1997]. Baeza-Yates es mucho más sintético en la presentación de estas medidas. Considera que se engloban dentro de la determinación de valores de E-P [BAE, 1999]. Posteriormente se refiere a la “Medida E” de Swet (dedicándole un párrafo) y cita la existencia de otras medidas (sin explicar cómo se obtienen), entre ellas la medida de satisfacción y de longitud esperada de búsqueda. En lo que coinciden casi todos los autores es en desarrollar unas medidas alternativas a las tradicionales, “algunos observadores repudian por completo la tabla de contingencia como base para la construcción de parámetros capaces de reflejar la efectividad de la recuperación de información” [SAL, 1983]. Para este autor, las medidas a emplear deberían cumplir las siguientes condiciones: 1. Deben ser capaces de recuperación únicamente. reflejar la efectividad de la 2. Deben ser independientes de cualquier límite, es decir, el número de documentos recuperados en una búsqueda específica no debe influenciar a estas medidas. -71- Evaluación de la Recuperación de la Información 3. Deben ser expresadas en un número simple, en lugar de hacer uso de un par de valores (tales como E-P). Modelo de Swets. Bajo estas premisas se desarrolla el Modelo de Swets, explicado en [RIJ, 1999], [SAL, 1983]. Este modelo define la terna E-P-F (exhaustividadprecisión-tasa de fallo), en términos probabilísticos. La exhaustividad será una estimación de la probabilidad condicionada de que un documento recuperado sea relevante; la precisión será una estimación de la probabilidad condicionada de que un documento relevante sea recuperado y la tasa de fallo una estimación de la probabilidad condicionada de que un documento recuperado no sea relevante. Este modelo convierte las representaciones E-P en una serie de funciones basado en el cómputo de un número de documentos relevantes o no. Las búsquedas dan como resultado unas funciones lineales que guardan una cierta distancia con la distribución de las probabilidades anteriormente citadas. Es precisamente el valor de esa distancia (multiplicado por la raíz cuadrada de dos) el valor de la “Medida E de Swets”. El ejemplo de la Ilustración 3.7 muestra dos líneas (A y B) que propician el cálculo de dos distancias (DIST2 y DIST1 respectivamente), que derivarán en dos valores distintos de la medida de Swets. También resultan determinables las pendientes de ambas líneas. La principal ventaja de este modelo y de esta medida reside en “que la misma se basa en una teoría estadística suficientemente reconocida y aceptada” [SAL, 1983]. DIST2 Línea A 0 DIST1 Línea B Ilustración 3.7 Ejemplo del Modelo de Swets. Fuente: Salton, G. and Mc Gill, M.J. Introduction to Modern Information Retrieval. New York: Mc Graw-Hill Computer Series, 1983.. -72- Evaluación de la Recuperación de la Información Esta medida, “a diferencia de la E-P, estas medidas (la distancia y la pendiente) no son fácilmente descifrables por los usuarios y difícilmente las usarán. Asimismo, el valor de E51 no puede obtenerse a partir de un simple umbral que distinga documentos relevantes de no relevantes, tal como se hace en las evaluaciones convencionales; en cambio, un simple par de valores E-P es fácil de calcular en todo momento” [SAL, 1983]. Esta opinión coincide con la realidad, “otras medidas globales basadas en sólidas teorías, especialmente en la teoría de la probabilidad y en la teoría de la información, han sido descritas por diversos autores pero no han recibido consideración en la práctica” [SAL, 1983]. Modelo de Robertson. Rijsbergen presenta el Modelo de Robertson, una aproximación logística a la estimación de los valores E-P”. Robertson y Teather desarrollan un modelo estimando las probabilidades correspondientes a EP basado en un procedimiento inusual ya que al calcular una estimación de ambas probabilidades para una pregunta simple, toman en consideración dos cosas: la cantidad de datos empleados para alcanzar esas estimaciones y los promedios de las estimaciones de todas las demás preguntas” [RIJ, 1999]. El objetivo de este método no es otro que obtener un valor, denominado “delta” que puede considerarse como candidato para ser una medida simple de la efectividad de un SRI [RIJ, 1999]. Modelo de Cooper. En 1968, Cooper estableció que “la función primaria de un SRI es poner a salvo a sus usuarios, en la medida que esto sea posible, de la tarea de leer detenidamente todo el conjunto de documentos recuperados en la búsqueda, para discernir los relevantes” [RIJ, 1999]. Este “ahorro de esfuerzo” es lo que se debe medir y para ello sólo haría falta una medida simple. Esta medida sólo se aplicaría a los sistemas que mostraran la salida de los documentos ordenados según un criterio de alineamiento. Salton indica que “algunas medidas adicionales de valor único, emplean también las diferencias entre los rangos de los documentos relevantes recuperados y, o bien los rangos ideales (aquellos casos donde los documentos relevantes son recuperados antes que los no relevantes), o bien los rangos aleatorios (donde los documentos relevantes son aleatoriamente incluidos en la salida entre los no relevantes). Una de estas medidas es la longitud esperada de búsqueda.” [SAL, 1983]. En [SAL, 1983] y [KOR, 1997] recurren al mismo ejemplo de cálculo de esta medida. Se supone que el conjunto de documentos recuperados se divide en K subconjuntos (S1, ...., Sk), tal que los elementos de cualquiera de los subconjuntos sean equivalentes pero de manera que los documentos del subconjunto Si sean mejores que los documentos del subconjunto Si+1. Si la búsqueda realizada es una booleana disyuntiva 51 El valor de la medida E de Swets. -73- Evaluación de la Recuperación de la Información (unión de dos o más expresiones o condiciones), que produce un resultado { t1 OR t2 OR t3 OR .... tn }, entonces S1 podría consistir en aquellos documentos que contienen todos los términos de la expresión disyuntiva, S2 en aquellos que contuvieran sólo n-1 términos, S3 sería el conjunto de los documentos con sólo n-2 términos y así sucesivamente. Para presentar estos documentos en orden, se desarrolla un conjunto débilmente ordenado de documentos. Esto es, todos los documentos de cualquier subconjunto de igual rango, pero peor que el precedente y mejor que el siguiente52. En estos términos la longitud esperada de búsqueda puede ser definida como el número promedio de documentos no relevantes que pueden ser llegar ser examinados por el usuario, antes de acceder al número deseado de documentos. Si se supone que el conjunto de documentos recuperados se divide en tres subconjuntos {S1, S2 y S3}. S1 contiene tres documentos, de los cuales sólo uno es relevante; S2 contiene cuatro documentos relevantes y uno que no lo es, y, finalmente, S3 contiene dos documentos relevantes y tres que no lo son. Si el usuario sólo desea recuperar un documento relevante, al usuario le basta con el subconjunto S1. Como el documento relevante de S1, puede ser el primero, el segundo o el tercero de los examinados y, asumiendo que todas las combinaciones son iguales, el usuario tiene una probabilidad de 1/3 de acceder al documento deseado al instante. Así, la longitud esperada de búsqueda, sería el resultado de sumar las probabilidades: (1 * 1/3) + (2 * 2/3) + (3 * 3/3), lo que totaliza un valor de dos, que significa: “como promedio, el usuario necesitará examinar un documento no relevante antes de encontrar el documento relevante que desea” [KOR, 1997]. Si ahora se supone que el usuario desea recuperar seis documentos relevantes, el examen de los subconjuntos S1 y S2 sólo le proporcionaría 5 documentos relevantes, por lo que ha de localizar el sexto en el subconjunto S3. Forzosamente, el usuario tendrá que examinar los ocho documentos incluidos en S1 y S2 más los que le sean necesarios en S3. Considerando dónde pueden encontrarse en S3 los dos documentos relevantes, hay cuatro situaciones en los que el primero de ellos (el único de interés) está en la primera posición, tres situaciones en segunda, dos situaciones en tercer lugar y una única oportunidad donde está en el cuarto lugar, lo que totaliza un total de 10 posibles situaciones diferentes. En este caso, la longitud esperada de búsqueda sería el valor resultante de las operaciones: (9 * 4/10) + (10 * 3/10) + (11 * 2/10) + (12 * 1/10); “lo que resulta un valor de 10, es decir, que el usuario, como término medio, va a consultar cuatro documentos no relevantes antes de encontrar el sexto relevante deseado” [KOR, 1997]. Muy bien puede aparecer sólo un documento en cada subconjunto o bien pueden llegar a aparecer todos los documentos en el mismo subconjunto. 52 -74- Evaluación de la Recuperación de la Información Esta medida no proporciona directamente un valor simple. Proporciona una serie de valores que muestran qué puede esperar el usuario del sistema bajo distintos requerimientos de exhaustividad. No obstante, esta serie de valores pueden sintetizarse en una valor simple obtenido al dividir la longitud esperada de búsqueda correspondiente a cada valor distinto de documentos relevantes entre ese valor de documentos relevantes, sumar todas los cocientes y hallar la media aritmética. Documentos Relevantes Longitud esperada de búsqueda DocRel / Long 1 2,0 2,0 2 4,2 2,1 3 5,4 1,8 4 6,6 1,65 5 7,8 1,56 6 10,0 1,67 7 12,0 1,71 Suma 12,49 E 12,49/7 = 1.78 Tabla 3.11 Ejemplo de determinación de la medida E de longitud esperada de búsqueda. Fuente: Korfhage, R.R. Information Retrieval and Storage. New York: Wiley Computer Publisher, 1997. Exhaustividad y Precisión normalizadas. Otro de los problemas que conlleva el uso de las medidas E-P es la secuencialidad de la lectura de los resultados: “los SRI típicos presentan los resultados al usuario formando una secuencia de documentos. Incluso en aquellos sistemas que no presentan así la información, el usuario suele examinar los documentos secuencialmente. Este modo de examinar va a afectar al juicio que el usuario ha de llevar a cabo sobre la relevancia o no de los documentos siguientes” [KOR, 1997]. Todos los usuarios de los SRI han sufrido este problema alguna vez, cuando, al consultar dos documentos más o menos igual de interesantes, centran su atención preferentemente en el primero de ellos, aunque el segundo no desmerezca en nada al anterior. Otra situación frecuente ocurre cuando un usuario realiza una búsqueda y los primeros documentos recuperados resultan relevantes. En esta circunstancia, el usuario va a tener una sensación positiva y se considerará satisfecho (no preocupándose por el número de documentos no relevantes que también recupera que puede llegar a ser muy grande). La situación contraria también se produce cuando los documentos no relevantes al principio de -75- Evaluación de la Recuperación de la Información la secuencia de documentos entregados son mayoría, entonces la sensación de frustración va a ser de cierta consideración, independientemente de que se entreguen muchos más documentos relevantes que no relevantes. Esto propicia el desarrollo de medidas que tomen en consideración la secuencia en la que los documentos son presentados a los usuarios. La primera se debe a Rocchio [RIJ, 1999], [KOR, 1997], quien define una exhaustividad normalizada y una precisión normalizada para sistemas que presentan los documentos alineados según un criterio de clasificación y donde no afecte el tamaño de la muestra analizada. Rocchio define un “sistema ideal donde los documentos relevantes se recuperan antes que los documentos no relevantes y se puede representar en un gráfico la evolución de la exhaustividad de esta operación de búsqueda”. Ilustración 3.8 Ejemplo de cómo la Exhaustividad normalizada queda comprendida entre el pero y mejor resultado posible. Fuente: Rijsbergen, C.J. Information Retrieval. [En línea]. Glasgow, University, 1999. <http://www.dcs.gla.ac.uk/~iain/keith/> [Consulta: 21 de marzo de 2002] Si en una base de datos de 25 documentos se sabe que cinco de ellos son relevantes, y que han sido devueltos por el sistema al realizar una búsqueda en las posiciones {3, 5 , 10, 11, 15}, se puede representar el gráfico etapa a etapa como muestra la anterior Ilustración 3.8. La exhaustividad de esta búsqueda alcanza el valor de 0.2 (1 documento relevante recuperado dividido entre el total de 5 documentos relevantes de la colección) al analizar el tercer documento (hasta entonces vale cero). Cada vez que analizamos un documento relevante, el valor de la exhaustividad aumenta hasta llegar a la unidad (en este caso, en el documento 15), permaneciendo constante hasta el último documento recuperado, porque todos los relevantes han sido recuperados. La comparación con la mejor búsqueda posible (cinco documentos relevantes en las cinco primeras posiciones de la secuencia) o con la peor búsqueda posible (correspondiente a presentar los cinco documentos relevantes en las cinco últimas posiciones de la secuencia), resulta muy intuitiva, tal como se puede ver en la anterior ilustración. -76- Evaluación de la Recuperación de la Información Para Korfhage, “el área comprendida entre la búsqueda actual y la gráfica ideal representa una medida de la ejecución del SRI” [KOR, 1997]. Esta medida se calcula restando al valor de la unidad el resultado de dividir el valor de esta área por (n1 * (N – n1))53. En el ejemplo anterior, el valor del área es 29, por lo que el valor de la exhaustividad normalizada, aplicando la anterior fórmula, será el resultado de la siguiente operación: (1 – 21/(5 * (25 – 5)) = (1 – 0.21) = 0.79 La precisión normalizada se define de manera análoga: “mientras la precisión ordinaria es una medida exactamente definida, esta medida depende del conocimiento del número total de documentos relevantes.” [KOR, 1997]. Rijsbergen propone como método para su cálculo “restar a la unidad el resultado de dividir el valor de esta área por el valor del área existente entre la búsqueda ideal y la peor búsqueda” [RIJ, 1999]. En el ejemplo propuesto, el resultado de esta precisión normalizada sería (1 – 21/(95 – 15)) = (1 – 21/80) = 0.7375. Rijsbergen destaca algunos aspectos de estas medidas: “ambas presentan un comportamiento consistente, es decir, cuando una se aproxima a cero la otra se aproxima a la unidad. Ambas medidas asignan valores distintos de peso a los documentos recuperados en la secuencia, la precisión los asigna a los iniciales y la exhaustividad asigna un valor uniforme a todos los documentos relevantes. En tercer lugar, estas medidas pueden entenderse como una aproximación de la precisión y exhaustividad promedio (estudiadas anteriormente) y, por último, los problemas que surgían en la determinación de la longitud esperada de búsqueda (por la posición de los documentos relevantes), son inexistentes en este caso” [RIJ, 1999]. Ratio de deslizamiento. Salton y Korphage presentan la ratio de deslizamiento, medida muy similar conceptualmente a la exhaustividad normalizada y basada en “la comparación de dos listas ordenadas de documentos recuperados (es decir, el SRI devuelve los resultados según un criterio de rango). Una lista es la salida de nuestro sistema actual, y la otra representa un sistema ideal donde los documentos recuperados se muestran en orden descendente” [SAL, 1983]. Este modelo es más complejo que el anterior, porque asigna pesos a los documentos en función de su relevancia con la pregunta realizada. La ratio se establece como el resultado de dividir la suma de los pesos de los documentos recuperados por nuestro sistema entre la suma de los pesos de los documentos que hubiera devuelto el sistema ideal. Este modelo sustituye la asignación binaria de relevancia de un documento, por la asignación de un peso. 53 n1 es el número de documentos relevantes y N el número total de documentos -77- Evaluación de la Recuperación de la Información La situación más favorable para un sistema evaluado es que la búsqueda realizada sea exactamente igual que la que ofreciera el sistema ideal, adquiriendo la ratio de deslizamiento un valor de uno. Para ilustrar su cálculo, Korfhage propone el siguiente ejemplo: “supongamos que un sistema ha recuperado 10 documentos, con el siguiente peso: 7.0, 5.0, 0.0, 2.5, 8.2 4.5, 3.7, 1.1, 5.2 y 3.1, en el orden de recuperación. En un sistema ideal, estos documentos habrían sido recuperados y presentados en el orden descendente de pesos, y se podría calcular la tabla 3.12 de ratios: Ratio de Deslizamiento N ΣPesos Reales Σpesos Ideales Deslizamiento 1 7.0 8.2 0.85 2 12.0 15.2 0.79 3 12.0 20.4 0.59 4 14.5 25.4 0.57 5 22.7 29.9 0.76 6 27.2 33.6 0.81 7 30.9 36.7 0.84 8 32.0 39.2 0.82 9 37.2 40.3 0.92 10 40.3 40.3 1 Tabla 3.12 Ejemplo de determinación de la ratio de deslizamiento. Fuente: Korfhage, R.R. Information Retrieval and Storage. New York: Wiley Computer Publisher, 1997. Esta medida, como las anteriores normalizadas, cuantifica la diferencia entre la secuencia de documentos que entrega un sistema real y la que entregaría un sistema ideal, tomando en cuenta las posiciones de los documentos relevantes y los no relevantes. En cambio, la ratio de deslizamiento aporta dos ventajas: “su uso de los pesos de relevancia y que sólo depende de los documentos recuperados” [KOR, 1997]). Satisfacción y Frustración. El esfuerzo que implica la determinación de las medidas anteriores, propicia que se establezcan otra nueva serie: satisfacción, frustración y total [KOR, 1997], [BAE, 1999]. La primera de estas medidas sólo considera los documentos relevantes, la segunda únicamente contempla a los no relevantes y la tercera combina ponderadamente las medidas anteriores. Cuando se usan los pesos, a los documentos relevantes se les suele asignar los valores -78- Evaluación de la Recuperación de la Información más cercanos al umbral superior de la escala, y a los no relevantes se les asigna valores cercanos al cero. Para calcular la medida de la satisfacción, el peso de los documentos no relevantes se simplifica a cero, aunque se debe considerar sus posicionen en la secuencia. Similarmente, para calcular la ratio de frustración, los documentos relevantes tendrán peso cero. La elección de un esquema de peso en la definición de la medida total se determina por el nivel de satisfacción que alcance el usuario cuando reciba los documentos relevantes pronto y su tolerancia a la presencia de documentos no relevantes. Comparación medidas satisfacción, frustración y total para sistemas A y B Ideal Sistema A Sistema B N S F T S F t S f T 1 4 0 4 3 0 3 0 2 -2 2 8 0 8 7 0 7 4 2 2 3 11 0 11 9 0 9 6 2 4 4 14 0 14 9 2 7 9 2 7 5 17 0 17 11 2 9 11 2 9 6 19 0 19 14 2 12 11 4 7 7 21 0 21 17 2 15 11 5 6 8 21 1 20 21 2 19 14 5 9 9 21 3 18 22 3 19 17 5 12 10 21 5 16 22 5 17 21 5 16 Tabla 3.13 Ejemplo propuesto por Korfhage para determinar la medida de la satisfacción. Fuente: Korfhage, R.R. Information Retrieval and Storage. New York: Wiley Computer Publisher, 1997. El modo más simple de determinar esta medida es calcular la diferencia entre las otras dos anteriores, aunque se han propuesto algunas expresiones más refinadas. Korfhage propone el siguiente ejemplo: “supongamos que vamos a comparar dos SRI, cada uno de los cuales recupera los mismos 10 documentos. Estos documentos serán juzgados siguiendo una escala de 5 puntos, donde 0 y 1 representan documentos no relevantes; y 2, 3 y 4 representan documentos relevantes. El sistema A recupera los documentos en el orden {3, 4, 2, 0, 2, 3, 3, 3, 4, 1, 0} y el sistema B recupera los documentos en el orden {0, 4, 2, 3, 2, 0, 1, 3, 3, 4} Si se entiende que la medida total va a ser el resultado de -79- Evaluación de la Recuperación de la Información restarle el valor de frustración al valor de satisfacción, vamos a proceder a representar estos valores en la siguiente tabla54“ [KOR, 1997]. Aunque, a primera vista, los valores de satisfacción del sistema A están más cerca que los del sistema B del sistema ideal, se puede resumir la tabla anterior en la siguiente tabla 3.14, que Korfhage denomina: “tabla de diferencias de áreas”. Tabla de diferencias de área dS dF dT N A B A B A B 1 1 4 0 2 1 6 2 1 4 0 2 1 6 3 2 5 0 2 2 7 4 5 5 2 2 7 7 5 6 6 2 2 8 8 6 5 8 2 2 7 12 7 4 10 2 5 6 15 8 0 7 1 4 1 11 9 0 4 0 2 0 6 10 0 0 0 0 0 0 Tabla 3.14 Tabla de “diferencias de áreas” para el jemplo de determinación de la ratio de deslizamiento. Fuente: Korfhage, R.R. Information Retrieval and Storage. New York: Wiley Computer Publisher, 1997. En este ejemplo, se observa que el sistema A es, al menos igual de bueno que el sistema B, aunque realmente es bastante mejor en casi todos los niveles para las tres medidas. Todo este conjunto de medidas que pretenden calcular el nivel de satisfacción del usuario de un SRI resultan, para Meadow, “las de mayor utilidad de todas las empleadas normalmente si el objetivo es establecer el promedio del proceso de la recuperación de información” [MEA, 1997]. Medida de Voiskunskii. El ejemplo anterior introduce una nueva dimensión en la evaluación de la recuperación de información, no centrada únicamente en la comparación de dos sistemas A y B sino preocupada también en intentar discernir “uno de los más importantes y complejos problemas de las Ciencias de la Información, la creación de un mecanismo de selección 54 La representación de la tabla propuesta por Korfhage es la Tabla 3.13. -80- Evaluación de la Recuperación de la Información que permita elegir el mejor método de búsqueda (de entre las posibles variaciones) para una cuestión Q” [VOI, 1997]. Los grandes problemas a los que alude Voiskunskii, residen básicamente en la ausencia de criterios sólidos y consistentes de comparación de los resultados de una búsqueda, a pesar de los esfuerzos de muchos autores centrados en ello en los últimos treinta años. El autor considera que estos criterios deben cumplir los siguientes requerimientos: a. “Los criterios deben proveer una comparación pragmática y justificada de los resultados de la búsqueda; y b. la cantidad de trabajo precisa para determinar la información que es requerida para el establecimiento de estos criterios debe ser admisible” [VOI, 1997]. Tradicionalmente se ha empleado la medida de valor simple propuesta por Borko I0= E + P (es decir, la suma de los valores de la exhaustividad y de la precisión) [RIJ, 1999], aunque estas dos medidas (exhaustividad y precisión) no cumplen totalmente los criterios comentados, debido, fundamentalmente, a que infieren el valor de la exhaustividad. Para esta medida I0, una búsqueda será mejor que otra cuanto mayor sea el resultado de la suma, aunque la misma puede llevar, a veces, a una serie de conclusiones equivocadas. Como ejemplo de una situación de esta naturaleza, Frants, Shapiro y Voiskunskii enuncian el siguiente caso: “supongamos que sobre una colección de 10.000 documentos, de los cuales se consideran pertinentes para una determinada materia aproximadamente 100, se llevan a cabo tres operaciones de búsqueda con los siguientes resultados. a. Se recuperan 100 documentos, 50 de ellos son pertinentes y el resto no lo es. b. Se recuperan 67 documentos, siendo pertinentes 40 de ellos. c. Por último, se recupera sólo un documento que resulta pertinente. Si calculamos los valores de exhaustividad y de precisión vamos a obtener los siguientes valores de la medida I0: Búsqueda E P I0 A 0.5 0.5 1 B 0.4 0.597 0.997 C 0.01 1 1.01 Tabla 3.15 Ejemplo del cálculo de la medida I1 de Borko para el ejemplo propuesto por Frants, Shapiro y Voiskunskii. Fuente: Frants , V.I. et al. Automated information retrieval : theory and methods. San Diego [etc.] : Academic Press, cop.1997. XIV, 365 p. -81- Evaluación de la Recuperación de la Información La interpretación literal de estos valores indica que la mejor búsqueda es la "c", al ser el valor más alto” [FRA, 1997]. Si bien el cálculo está bien realizado, estos resultados resultan algo incongruentes cuando el observador se aleja un poco de la mera interpretación matemática, reflexiona y se da cuenta de que difícilmente la búsqueda "c" puede considerarse incluso "admisible", máxime cuando sólo entrega al usuario un único documento y es casi seguro que el usuario preferirá cualquiera de las otras dos búsquedas que le entregan más documentos, independientemente de lo que nos diga esta fórmula. Para solucionar este problema, Frants, Shapiro y Voiskunskii proponen una nueva medida de valor simple I1 [FRA, 1997] [VOI, 1997], a partir de la ratio entre el cuadrado de documentos relevantes recuperados y el número de documentos que conforman el resultado, “ratio cuya formulación analítica se corresponde con la raíz cuadrada del producto de los valores E-P” [VOI, 1997]. Si en el ejemplo anteriormente planteado se aplicara esta nueva medida a las tres búsquedas realizadas, los resultados serían: Búsqueda E P I1 A 0.5 0.5 0.25 B 0.4 0.597 0.2388 C 0.01 1 0.01 Tabla 3.16 Ejemplo del cálculo de la medida I2 de Voiskunskii para el ejemplo propuesto por Frants, Shapiro y Voiskunskii. Fuente: Frants , V.I. et al. Automated information retrieval : theory and methods. San Diego [etc.] : Academic Press, cop.1997. XIV, 365 p. En este caso, la medida I1 de Voiskunskii propondría a la búsqueda “a” como la mejor de las tres realizadas, conclusión algo más lógica y coherente que la anterior. Frants, Shapiro y Voiskunskii desarrollan otro ejemplo donde muestran una búsqueda en la que coinciden ambas medidas y otra en la que difieren (en la determinación de cuál es mejor búsqueda). Aunque, tal como el mismo Frants indica posteriormente: “es evidente que dos ejemplos no resultan suficientes para justificar plenamente las bondades de las medidas I0 y I1, aunque escapa al objeto de nuestro trabajo considerar todos los casos adecuados para dicha justificación. Limitamos nuestra exposición a los ejemplos previamente presentados, ejemplos que, en nuestra opinión, proporcionan una clara y suficiente ilustración de estas medidas” [FRA, 1997]. Unos años más tarde, Voiskunskii llega a desarrollar hasta nueve medidas más, medidas que, evidentemente van ganando en complejidad en su cálculo y entendimiento, aunque él mismo indica que “aplicando la medida I2 en búsquedas de precisión mayor que 0.5, las conclusiones que se extraigan quedan suficientemente justificadas” [VOI, 1997]. -82- Evaluación de la Recuperación de la Información Caso práctico de cálculo de medidas de valor simple. En la práctica, la medida I0 de Borko y la medida I1 de Voiskunskii, suelen coincidir en sus resultados, excepto en casos extraordinarios (como puede ser el del ejemplo anterior, donde cabría pensar que ni siquiera vale la pena plantearse el determinar la calidad de una búsqueda, si los niveles de exhaustividad o de precisión disminuyen demasiado). Para verificar los ejemplos que proporcionan los distintos autores que han abordado esta materia, se propone la realización de un pequeño ensayo consistente en intentar localizar en el motor de búsqueda Google información sobre “alquiler de apartamentos en Málaga”. Para ello se han formulado tres preguntas, cuya sintaxis se transcribe a continuación: 1. B1: alquiler apartamentos Málaga 2. B2: “alquiler de apartamentos” Málaga 3. B3: (“alquiler de apartamentos” OR “alquiler de viviendas” OR “alquiler de alojamientos”) AND Málaga Como se desprende fácilmente de la sintaxis de estas expresiones, a medida que se han realizado las búsquedas, se ha aumentado la complejidad de la ecuación de búsqueda, haciendo uso de las prestaciones que este SRI proporciona. A continuación se han analizado los treinta primeros documentos recuperados en B1, B2 y B3, observando que aumentan los niveles de E y P relativos calculados para cada uno de ellas, lo que propicia la siguiente evolución de las distintas medidas estudiadas. E P I0 I1 Meadow Heine Vickery B1 0,5159 0,8045 1,32 0,64 0,26 0,54 0,70 B2 0,5282 0,9018 1,43 0,69 0,32 0,50 0,66 B3 0,5512 0,9462 1,49 0,72 0,36 0,46 0,63 Tabla 3.17 Ejemplo del cálculo de las medidas de valor simple estudiadas para el ejemplo propuesto. Fuente: elaboración propia. Estos datos confirman que, en situaciones normales, todas las medidas responden del mismo modo, indicando que la mejor búsqueda es B3 (I0 de Borko, I1 de Voiskunskii y medida de Meadow, aumentando el valor frente a los valores de B1 y B2; mientras que las medidas de Heine y Vickery disminuyen su valor en B3 frente a los valores de las otras dos búsquedas analizadas). Esta coincidencia permite afirmar, como hacen todos los autores que abogan por el uso de medidas simples, que la efectividad de una operación de búsqueda en un SRI puede medirse en términos de una medida simple, tal como puede ser cualquiera de las expuestas, o bien alguna que se desarrolle “ad hoc” para la evaluación de SRI que presenten algunas variantes que le diferencien de los empleados por -83- Evaluación de la Recuperación de la Información norma general, tal como puede ser el caso de los sistemas que permiten la recuperación de información en la web, donde tienen lugar fenómenos que no suelen encontrarse en los SRI convencionales y que debemos tener en consideración a la hora de reflexionar sobre la viabilidad de una medida de esta naturaleza. -84- Casos prácticos 4 Casos prácticos. 1. En un SRI basado en el modelo del espacio vectorial, calcula la similitud de los siguientes vectores de documentos A y B por medio de la función del coseno. Vector T1 T2 T3 T4 T5 T6 T7 A 1 1 0 0 1 1 1 B 1 0 0 0 1 0 1 Solución. La función de similitud del coseno se define por la siguiente expresión: Fuente: Baeza-Yates, R. and Ribeiro-Neto, B. Modern information retrieval. New York : ACM Press ; Harlow [etc.] : Addison-Wesley, 1999 XX, 513 p. Equivale a calcular el producto escalar de los vectores A y B y dividirlo por la raíz cuadrada del sumatorio de los componentes del vector A multiplicada por la raíz cuadrada del sumatorio de los componentes del vector B. El producto escalar de los vectores A y B se calcula multiplicando los componentes y sumando los productos, así (A B) es igual a: (A B) = 1*1 + 1*0 + 0*0 + 0*0 + 1*1 + 1*0 + 1*1 = 1 + 0 + 0+ 0 +1 + 0 + 1 = 3 La suma de los cuadrados de los vectores es igual a: Σ(Ai)2 = 1*1 + 1*1 + 0*0 + 0*0 + 1*1 + 1*1 + 1*1 = 1 + 1 + 0 + 0 + 1 + 1 + 1 = 5 Σ(Bi)2 = 1*1 + 0*0 + 0*0 + 0*0 + 1*1 + 0*0 + 1*1 = 1 + 0 + 0 + 0 + 1 + 0 + 1 = 3 Sólo resta dividir el producto escalar de los dos vectores (3) entre la raíz cuadrada de 5 multiplicada de la raíz cuadrada de 3 (o raíz de quince, ya que el producto de raíces cuadradas es la raíz cuadrada del producto). La raíz cuadrada la vamos a denotar como sqrt. Así tendremos como resultado: Sim(A,B) = Cos(A,B) = 3 / sqrt (15) = 3 / 3.87 = 0.77 -85- Casos prácticos 2. En un SRI basado en el modelo vectorial, determina la similitud media de todos los vectores almacenados. Vector T1 T2 T3 T4 T5 T6 A 1 1 0 0 1 1 B 1 0 0 0 1 0 C 0 1 1 1 1 1 D 0 0 0 0 0 1 Solución. La similitud media existente entre todos los vectores se obtiene calculando la media aritmética de las similitudes de cada par de vectores. Se usará la función del coseno para calculas los valores de similitud. (A,B) (A B) = 1*1 + 1*0 + 0*0 + 0*0 + 1*1 + 1*0 = 1 + 0 + 0+ 0 +1 + 0 = 2 Σ(Ai)2 = 1*1 + 1*1 + 0*0 + 0*0 + 1*1 + 1*1 = 1 + 1 + 0 + 0 + 1 + 1 = 4 Σ(Bi)2 = 1*1 + 0*0 + 0*0 + 0*0 + 1*1 + 0*0 = 1 + 0 + 0 + 0 + 1 + 0 = 3 Sim(A,B) = 2 / sqrt (12) = 2 / 3.46 = 0.57 (A,C) (A C) = 1*0 + 1*1 + 0*1 + 0*1 + 1*1 + 1*1 = 0 + 1 + 1 + 0 + 0 + 1 + 1 = 4 Σ(Ai)2 = 1*1 + 1*1 + 0*0 + 0*0 + 1*1 + 1*1 = 1 + 1 + 0 + 0 + 1 + 1 = 4 Σ(Ci)2 = 0*0 + 1*1 + 1*1 + 1*1 + 1*1 +1*1 = 0 +1 + 1 + 1 + 1 + 1 = 5 Sim(A,C) = 4 / sqrt(20) = 4 / 4.47 = 0.89 (A,D) (A D) = 1*0 + 1*0 + 0*0 + 0*0+ 1*0+ 1*1 = 0 + 0 + 0 + 0 + 0 + 1 = 1 Σ(Ai)2 = 1*1 + 1*1 + 0*0 + 0*0 + 1*1 + 1*1 = 1 + 1 + 0 + 0 + 1 + 1 = 4 Σ(Di)2 = 0*0 + 0*0 + 0*0 + 0*0 + 0*0 +1*1 = 0 +0 + 0+ 0 + 0 + 1 = 1 Sim(A,D) = 1 / sqrt(4) = 1 / 2 = 0.50 -86- Casos prácticos (B,C) (B C) = 1*0 + 0*1 + 0*1 + 0*1+ 1*1+ 0*1 = 0 + 0 + 0 + 0 + 1 + 0 = 1 Σ(Bi)2 = 1*1 + 0*0 + 0*0 + 0*0 + 1*1 + 0*0 = 1 + 0 + 0 + 0 + 1 + 0 = 3 Σ(Ci)2 = 0*0 + 1*1 + 1*1 + 1*1 + 1*1 +1*1 = 0 +1 + 1 + 1 + 1 + 1 = 5 Sim(B,C) = 1 / sqrt(15) = 1 / 3.87 = 0.26 (B,D) (B D) = 1*0 + 0*0 + 0*0 + 0*0+ 1*0+ 0*1 = 0 + 0 + 0 + 0 + 1 + 0 = 0 No hace falta proseguir ya que el numerador de la expresión es cero, lo que implica que la similitud entre los vectores B y D es nula. Sim(B,D) = 0 (C,D) (C D) = 0*0 + 1*0 + 1*0 + 1*0+ 1*0+ 1*1 = 0 + 0 + 0 + 0 + 0 + 1 = 1 Σ(Ci)2 = 0*0 + 1*1 + 1*1 + 1*1 + 1*1 +1*1 = 0 +1 + 1 + 1 + 1 + 1 = 5 Σ(Di)2 = 0*0 + 0*0 + 0*0 + 0*0 + 0*0 +1*1 = 0 +0 + 0+ 0 + 0 + 1 = 1 Sim(C,D) = 1 / sqrt(5) = 1 / 2.23 = 0.44 Si se suman las seis similitudes obtenidas y se calcula la media aritmética, se establecerá la similitud media del SRI. SIM_MEDIA = (0.57 + 0.89 + 0.50 + 0.26 + 0 + 0.44) / 6 = 2.66 / 6 = 0.44 -87- Casos prácticos 3. En un SRI basado en el modelo vectorial cuya tabla de vectores de documentos podemos ver a continuación, calcula el alineamiento de la respuesta proporcionada por el sistema para responder a un vector pregunta Q = (2,0,0,0,1,1). Vector T1 T2 T3 T4 T5 T6 A 1 1 0 0 1 1 B 1 0 0 0 1 0 C 0 1 1 1 1 1 D 0 0 0 0 0 1 Solución. Entendiendo que en la matriz origen que nos proporcionan, los términos son todos no vacíos y se encuentran ya agrupados por una entrada común, el primer paso a seguir para resolver este problema es calcular las frecuencias inversas del conjunto de términos (T1, T2, .. .., T6). Frecuencias Inversas Idf(T1) = log (4/2) = log 2 = 0.301 Idf(T2) = log (4/2) = log 2 = 0.301 Idf(T3) = log (4/1) = log 4 = 0.602 Idf(T4) = log (4/1) = log 4 = 0.602 Idf(T5) = log (4/3) = log 1.33 = 0.124 Idf(T6) = log (4/3) = log 1.33 = 0.124 Matriz de pesos Vector T1 T2 T3 T4 T5 T6 A 0.301 0.301 0 0 0.124 0.124 B 0.301 0 0 0 0.124 0 C 0 0.301 0.602 0.602 0.124 0.124 D 0 0 0 0 0 0.124 Q 2*0.301=0.602 0 0 0 0.124 0.124 -88- Casos prácticos Productos vectoriales. (A Q) = 0.301*0.602 + 0.301*0 + 0*0 + 0*0 + 0.124*0.124 + 0.124*0.124 = 0.181 + 0 + 0 + 0 + 0.015 + 0.015 = 0.211 (B Q) = 0.301*0.602 + 0*0 + 0*0 + 0*0 + 0.124*0.124 + 0*0.124 = 0.181 + 0 + 0 + 0 + 0.015 + 0 = 0.196 (C Q) = 0.301*0.602 + 0.301*0 + 0.602*0 + 0.602*0 + 0.124*0.124 + 0.124*0.124 = 0.181 + 0 + 0 + 0 + 0.015 + 0.015 = 0.211 (D Q) = 0*0.602 + 0*0 + 0*0 + 0*0 + 0*0.124 + 0.124*0.124 = 0 + 0 + 0 + 0 + 0 + 0.015 = 0.015 Resultado Ordenando los documentos de mayor a menor similitud, la respuesta del motor será: (A, C, B, D) -89- Casos prácticos 4. En un SRI basado en el modelo del espacio vectorial compuesto por los siguientes documentos: D1: “el Río Segura pasa por Murcia y desemboca en el Mediterráneo” D2: “Murcia es una región mediterránea seca con gran producción agrícola” D3: “el Río Mundo es afluente del Río Segura” D4: “los ríos Turia, Jucar y Segura, son ríos que desembocan el Mediterráneo” D5: “el río Segura riega las huertas de Alicante y Murcia” Determina el alineamiento del motor de búsqueda a la siguiente pregunta: “¿por qué región pasa el Río Segura?” Solución Se establece la matriz de frecuencias absolutas y se incluye la pregunta. Río Segura pasa Murcia Desemboca Mediterráneo región seca Producción agrícola Mundo afluente Turia Jucar riega huertas Alicante D1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 D2 0 0 0 1 0 0 1 1 1 1 0 0 0 0 0 0 0 D3 2 1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 D4 2 1 0 0 1 1 0 0 0 0 0 0 1 1 0 0 0 D5 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 Q 1 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 1 -90- Casos prácticos Se calculan las frecuencias inversas de todos los términos Idf(río) = Idf(Segura) = log (5/4) = log 1.25 = 0.096 Idf(pasa) = log (5/1) = log 5 = 0.698 Idf(Murcia) = Idf(desemboca) = Idf(Mediterráneo) = log (5/2) = log 2.5 = 0.397 Como el resto de términos de la matriz sólo aparecen una vez, su Idf será igual a Idf(pasa), es decir, el resto de las frecuencias inversas es igual a 0.698. Con estos valores se elabora la matriz de pesos y se calculan los productos escalares. Río Segura pasa Murcia Desemboca Mediterráneo región seca Producción agrícola Mundo afluente Turia Jucar riega huertas Alicante D1 0.09 0.09 0.69 0.39 0.39 0.39 0 0 0 0 0 0 0 0 0 0 0 D2 0 0 0.39 0 0 0.69 0.69 0.69 0.69 0 0 0 0 0 0 0 D3 0.19 0.09 0 0 0 0 0 0 0 0 0.69 0.69 0 0 0 0 0 D4 0.19 0.09 0 0 0.39 0.39 0 0 0 0 0 0 0.69 0.69 0 0 0 D5 0.09 0.09 0 0 0 0 0 0 0 0 0 0 0 0 0.69 0.69 0.69 Q 0.69 0 0 0.39 0.69 0 0 0 0 0 0 0 0 0 0 0 0.09 0.09 (D1 Q) = 0.09*0.09 + 0.09*0.09 + 0.69*0.69 + 0 + 0 + 0.39*0.39 + 0 + ...... + 0 = 0.008 + 0.008 + 0.476 + 0 + 0 + 0.152 + 0 ... + 0 = 0.796 (D2 Q) = 0 + 0 + 0 + 0 + 0 + 0 + 0.69*0.69 + 0 + 0 + ...... + 0 = 0.476 (D3 Q) = 0.19*0.09 + 0.19*0.09 + 0 + + 0 + ...... + 0 = 0.034 (D4 Q) = 0.19*0.09 + 0.09*0.09 + 0 + 0 + 0.39*0.39 + 0 + 0 + ...... + 0 = 0.034 + 0.008 + 0 + 0 + 0.152 + 0 + ...... + 0 = 0.194 (D5 Q) = 0.09*0.09 + 0.09*0.09 + 0 + 0 + ...... + 0 = 0.008 + 0.008 = 0.016 En función de estos valores obtenidos, la -91- respuesta será (D1, D2, D4, D3, D5) Casos prácticos 5. Aplicando el método de cálculo aproximado de la Exhaustividad y Precisión de Salton, calcula los valores de la operación de búsqueda que se plasma en la siguiente tabla. D1 D2 D3 X X X D4 D5 D6 X X D7 D8 X X documento relevante Solución: Esta búsqueda ha obtenido 6 documentos relevantes de un total de 8 recuperados. Aplicando el método de Salton se considera que el total de documentos relevantes del sistema es 6 y esto permite calcular los pares de valores E-P de la siguiente forma: Exhaustividad – Precisión N Relevante E P d1 X 1/6 = 0.16 1/1 = 1 d2 X 2/6 = 0.33 2/2 = 1 d3 X 3/6 = 0.50 3/3 = 1 3/6 = 0.50 3/4 = 0.75 d4 d5 X 4/6 = 0.66 4/5 = 0.80 d6 X 5/6 = 0.83 5/6 = 0.83 5/6 = 0.83 5/7 = 0.71 6/6 = 1 6/8 = 0.75 Sumatorios 4.81 6.84 Medias 0.60 0.85 d7 d8 X Los valores medios E-P que se obtienen son (0.60 – 0.85) -92- Casos prácticos 6. Aplicando el método de cálculo aproximado de valores E-P de Salton, calcula cuál de las tres búsquedas siguientes es más precisa. D1 D2 D3 B1 X X X B2 X X B3 X D4 X X D5 D6 D7 D8 X X X X X X X X X X X X documento relevante Solución: La primera operación de búsqueda es la misma que se ha realizado en el ejercicio 5, por lo tanto ya conocemos su exhaustividad. Queda ahora por calcular la exhaustividad media de las búsquedas B2 y B3. Ambas recuperan 8 documentos, siendo 6 los relevantes en B2 y 7 los relevantes en B3. Precisión B1 B2 B3 N Rel P Rel P d1 X 1/1 = 1 X 1/1 = 1 d2 X 2/2 = 1 X 2/2 = 1 X 1/2 = 0.50 d3 X 3/3 = 1 2/3= 0.66 X 2/3 = 0.66 3/4 = 0.75 2/4= 0.50 X 3/4 = 0.75 d4 Rel P 0/1 = 0 d5 X 4/5 = 0.80 X 3/5 = 0.60 X 4/5 = 0.80 d6 X 5/6 = 0.83 X 4/6 = 0.66 X 5/6 = 0.83 5/7 = 0.71 X 5/7 = 0.71 X 6/7 = 0.85 6/8 = 0.75 X 6/8 = 0.75 X 7/8 = 0.87 d7 d8 X Sumatorios 6.84 5.88 5.26 Medias 0.85 0.73 0.65 Los valores medios obtenidos indican claramente que la búsqueda más precisa es la búsqueda B1. -93- Casos prácticos 7. Aplicando el método de cálculo aproximado de valores E-P de Salton, calcula cuál de las tres búsquedas siguientes es más exhaustiva. D1 D2 B1 X X B2 X D3 B3 D4 X X D5 D6 D7 X X X X X X X X D8 X X X documento relevante Solución: La búsquedas B1 y B2 recuperan 5 documentos relevantes de un total de 8 documentos recuperados. La tercera búsqueda recupera 5 documentos relevantes de un total de 7 documentos recuperados. Aplicando a continuación el método de Salton, obtendremos los valores medios de exhaustividad. Exhaustividad B1 B2 N Rel E Rel E d1 X 1/5 = 0.2 X 1/5 = 0.2 d2 X 2/5 = 0.4 1/5 = 0.2 d3 2/5 = 0.4 d4 2/5 = 0.4 B3 Rel E 1/5 = 0.2 X 1/5=0.2 1/5 = 0.2 X 2/5=0.4 d5 X 3/5 = 0.6 X 2/5 = 0.4 X 3/5=0.6 d6 X 4/5 = 0.8 X 3/5 = 0.6 X 4/5=0.8 4/5 = 0.8 X 4/5 = 0.8 X 5/5=1 5/5 = 1 X 5/5 = 1 d7 d8 X Sumatorios 4.4 3.6 3 Medias 0.55 0.45 0.42 -94- Casos prácticos 8. Aplicando la fórmula de Borko, indica cuál de las siguientes tres búsquedas es mejor. D1 D2 D3 D4 X X X X B2 X X B3 X X B1 D5 X X X documento relevante Solución: Las búsquedas B1 y B2 recuperan cinco documentos, resultando relevantes 4 en la primera y 3 en la segunda. La búsqueda B3 recupera 4 documentos, siendo relevantes 3 de ellos. Aplicando el método reducido de Salton para calcular los valores medios E-P se obtiene lo siguiente: Exhaustividad-Precisión B1 N Rel E d1 X d2 B2 P Rel B3 E P 1/4 = 1/1 = 0.25 1 0 0 X 2/4 = 2/2 = X 0.5 1 1/3 = 1 / 2= X 0.33 0.5 1/3 0.33 = 1 / 2= 0.5 d3 X 3/4 = 3/3 = X 0.75 1 2/3 = 2/3 = X 0.66 0.66 2/3 0.66 = 2/3 = 0.66 d4 X 4/4 = 4/4 = 1 1 2/3 = 2/4 0.66 0.5 = X 3/3 = 1 ¾ = 0.75 d5 4/4 = 4/5 = X 1 0.8 3/3 1 = Sumatorios 3.5 4.8 2.65 2.26 1.99 1.91 Medias 0.7 0.96 0.53 0.45 0.49 0.47 = 3/5 0.6 Rel E 0 0 Aplicando la fórmula de Borko (suma de los valores medios E-P obtenidos en cada búsqueda), se obtienen los siguientes resultados. Io (B1) = 0.7 + 0.96 = 1.66 Io (B2) = 0.53 + 0.45 = 0.98 Io (B3) = 0.49 + 0.47 = 0.96 Con estos valores, resulta evidente que la búsqueda B1 es la mejor de las tres, quedando en segundo lugar la búsqueda B2 y en tercer lugar la búsqueda B3, aunque con unos niveles de efectividad muy similares. -95- Casos prácticos 9. Aplicando la fórmula de Voiskunskii, indica cuál de las siguientes tres búsquedas es mejor. B1 D1 D2 D3 X X X X X B2 D4 D5 X X X documento relevante Solución: Las búsquedas B1 y B2 recuperan cinco documentos, resultando relevantes 3 en la primera (los tres primeros) y 4 en la segunda (todos menos el primero). Aplicando el método de Salton vamos a calcular los valores medios E-P de cada una de estas búsquedas. B1 B2 N Rel E P d1 X 1/3 = 0.33 1/1 = 1 d2 X 2/3 = 0.66 2/2 = 1 d3 X 3/3 = 1 d4 Rel E P 0 0 X 1/4 = 0.25 1 / 2= 0.5 3/3 = 1 X 2/4 = 0.5 2/3 = 0.66 3/3 = 1 3/4 = 0.75 X 3/4 = 0.75 3/4 = 0.75 d5 3/3 = 1 3/5 = 0.6 X 4/4 = 1 4/5 = 0.8 Sumatorios 3.99 4.35 2.5 2.71 Medias 0.79 0.87 0.5 0.54 Aplicando la fórmula de Voiskunskii (raíz cuadrada del producto de los valores medios E-P obtenidos) a las búsquedas B1 y B2 se obtienen los siguientes valores. I1 (B1) = sqrt (0.79*0.87) = 0.829 I1 (B2) = sqrt (0.5*0.54) = 0.519 Con estos valores, la fórmula de Voiskunskii indica que la mejor búsqueda es la operación B1. -96- Referencias bibliográficas y fuentes de información 5 Referencias bibliográficas y fuentes de información. [AGU, 2002] Aguilar González, R. Monografía sobre motores de búsqueda [En línea]. Yahoo Geocities, 2002. <http://www.geocities.com/motoresdebusqueda/inicio.html> [Consulta: 3 de abril de 2002] [ALA, 1983] Glosario A.L.A. de Bibliotecología y Ciencias de la Información. Madrid: Díaz de Santos, 1983. [ARA, 2000] Arauzo Galindo, M. et al. Nuevas técnicas de búsqueda en Internet [En línea]. Madrid: Universidad Complutense, 2000. <http://www.fdi.ucm.es/asignaturas/ssii_sup/SI/grupo1/resumenes/Nuevas %20tecnicas%20de%20busqueda.htm> [Consulta: 2 de marzo de 2002] [BAE, 1992] Baeza-Yates, R. and Frakes, W.B. Information retrieval : data structures & algorithms Englewood Cliffs, New Yersey : Prentice Hall, 1992 504 p. ISBN 0-13-463837-9 [BAE, 1999] Baeza-Yates, R. and Ribeiro-Neto, B. Modern information retrieval. New York : ACM Press ; Harlow [etc.] : Addison-Wesley, 1999 XX, 513 p. ISBN 0-201-39829-X [BER, 1992] Berners-Lee, T. et al World-Wide Web: The Information Universe [En línea]. World Wide Web Consortium: MIT, Massachusetts, 1992. <http://www.w3.org/History/1992/ENRAP/Article_9202.pdf> [Consulta: 18 de enero de 2002] [BLA, 1990] Blair, D.C. Language and representation in information retrieval. Amsterdam [etc.]: Elsevier Science Publishers, 1990. [BOR, 2000] Bors, N. ‘Information retrieval, experimental models and statistical analysis’. Journal of Documentation, vol 56, nº 1 January 2000. p. 71-90 [BOW, 1994] Bowman, C. M. The Harvest Information Discovery and Access System [En línea]. Illinois: NCSA Information Techn. Division, 1994 <http://archive.ncsa.uiuc.edu/SDG/IT94/Proceedings/Searching/schwartz. harvest/schwartz.harvest.html> [Consulta: 4 de febrero de 2002] [BRA, 2000] Multi-search Engines - a comparison [En línea]. <http://www.philb.com/msengine.htm> [Consulta: 2 de abril de 2002] -97- Referencias bibliográficas y fuentes de información [BRI, 1998 Brin, S. and Page, L. ‘The anatomy of a large-scale hypertextual web search engine’. Computer Netsorks and ISDN Systems, 30, 1998. p. 107117. También: [En línea] Stanford: University, 1999. <http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm> [Consulta: 21 de noviembre de 2001] [CAN, 1990] Canals Cabiró, I. "El concepto de hipertexto y el futuro de la documentación". REDC, 13(2), 685-709, 1990. p. 49-73. [CHA, 2001] Chang, G. et al. Mining the World Wide Web: an information search approach”. Norwell, Massachusetts: Kluwer Acad. Publishers, 2001. [CHO, 1999] Chowdhury, G. G. Introduction to modern information retrieval. London: Library Association, 1999. [CON, 1987] Conklin, J. ‘Hypertext: and introduction and survey’. IEEE Computer 20, 9, 1987. p.17-41. [COO, 1973] Cooper, W.S. ‘On selecting a Measure of Retrieval Effectiveness’. Journal of the American Society for Information Science, v. 24, March-April 1973. p.87-92 [CRO, 1987] Croft, W. B. ‘Approaches to intelligent information retrieval’. Information Proccesing & Management, 23, 4,1987. p. 249-254 [DAV, 1996] Davis, E. A Comparison of Seven Search Engines [En línea]. Kent University, 1996. <http://www.iwaynet.net/~lsci/Search/paper.htm> [Consulta: 29 de diciembre de 2000] [DEL, 1998] Delgado Domínguez, A. Mecanismos de recuperación de Información en la WWW [En línea]. Mallorca, Universitat Illes Balears, 1998. <http://dmi.uib.es/people/adelaida/tice/modul6/memfin.pdf> [Consulta: 18 de septiembre de 2001] [DEL, 2001] Delgado Domínguez, A. Herramientas de búsqueda para la WWW [En línea]. Mallorca, Universitat Illes Balears, 1998. <http://dmi.uib.es/people/adelaida/CIVE/adecive.htm> [Consulta: 6 de enero de 2002] [DOM, 2000] Dominich, S. ‘A unified mathematical definition of classical information retrieval’. Journal of the American Society for Information Science, 51 (7), 2000. p. 614-624. [FOS, 1972] Foskett, D.J. ‘A Note on the Concept of Relevance’. Information Storage and Retrieval, 8 (2):77-78, April 1972 [FRA, 1997] Frants , V.I. et al. Automated information retrieval : theory and methods. San Diego [etc.] : Academic Press, cop.1997. XIV, 365 p. [GIL, 1999] Gil Leiva, I. La automatización de la indización de documentos. Gijón: Trea, 1999. 221 p. ISBN 84-95178-11-7 [GOR, 1999] Gordon, M., Pathak, P. ‘Finding information on the World Wide Web: the retrieval effectiveness of search engines’. Information Processing and Management 35, 1999. p. 141-180 -98- Referencias bibliográficas y fuentes de información [GRA, 2000] Grado-Caffaro, M. Mecanismos/motores de búsqueda: ¿qué es lo que buscan? Valencia: Quadernsdigital.net, 2000. <http://www.quadernsdigitals.net/articles/idg/mecanismos.htm> [Consulta: 11 de enero de 2002] [GRE, 2000] Greisdorf, H. ‘Relevance: An interdisciplinary and Informacion Science perspective’. Informing Science: Special Issue on Information Science Research. Vol 3 No 2, 2000. [También accesible en línea en <http://inform.nu/Articles/Vol3/v3n2p67-72.pdf> [Consulta: 16 de octubre 2001] [GRO, 1998] Grossman, D.A. and Frieder, O. Information retrieval: algorithms and heuristics. Boston: Kluwer Academia Publishers, 1998. [HU, 2001 Hu W-C et al. ‘An overview of World Wide Web search technologies”. Proceedings of the 5th World Multi-Conference on Systemics, Cybernetics and Informatics, SCI 2001. , Orlando, Florida, 2001. p. 356-361. También accesible [En línea] <http://www.eng.auburn.edu/users/wenchen/publication/overview.ps> [Consulta: 12 de marzo de 2002] [IEI, 1997] International Encyclopedia of Information & Library Science. London: Rotledge, 1997 [INQ, 2002] Welcome to Inquirus [En línea]. Princeton: NEC Research Inst, 2002. < http://inquirus.nj.nec.com/> [Comsulta: 12 de marzo de 2002] [KOR, 1997] Korfhage, R.R. Information Retrieval and Storage. New York: Wiley Computer Publisher, 1997. [LAN, 1968] Lancaster, F.W. Evaluation of the MEDLARS Demand Search Service. Library of Medicine, Betsheda, Md, 1968. [LAN, 1993] Lancaster, F. W. and Warner, A.J. Information Retrieval Today. Arlington, VIrginia : Information Resources, 1993. [LON, 1989] Longley, D. and Shain M. Mac Millan Dictionary of IT. London and Basingstoke: The MacMillan Press, 1989. [LOP, 1998] López Huertas, M.J. “La representación del usuario en la recuperación de la información”. Actas de las VI Jornadas de Documentación Automatizada. Valencia: FESABID 98. p. [MAN, 2002] Manchón, E. Navegación jerárquica o categorial frente al uso de buscador [En línea]. Ainda.info: Barcelona, 2002. <http://www.ainda.info/navegacion_vs_buscador.html> [Consulta: 21 de febrero de 2002] [MEA, 1992] Meadow, C. T. Text Information retrieval Systems. San Diego: Academic Press, 1993. [MIZ, 1998] Mizzaro, S. ‘How many relevances in information retrieval?’ [En línea]. Udine: Università degli Studi, 1998. <http://www.dimi.uniud.it/~mizzaro/papers/IwC/> [Consulta: 6 de septiembre de 2001] -99- Referencias bibliográficas y fuentes de información [NIE, 1990] Nielsen, J. Hypertext and hypermedia. Oxford: Oxford Academia Press, 1990. [NOT, 2000] Notess, G. R. Search Engine Statistics: Dead reports. [En línea]. Bozeman, MT: Notes.com, 2000. <http://www.searchengineshowdown.com/stats/dead.shtml> [Consulta: 12 marzo 2002] [PER, 2000] Pérez-Carballo, J. and Strzalkowski, T. ‘Natural language information retrieval: progress report’. Information Processing and Management 36, 2000. p. 155-178 [RIJ, 1999] Rijsbergen, C.J. Information Retrieval. [En línea]. Glasgow, University, 1999. <http://www.dcs.gla.ac.uk/~iain/keith/> [Consulta: 21 de octubre de 2001] [SAL, 1983] Salton , G. and Mc Gill, M.J. Introduction to Modern Information Retrieval. New York: Mc Graw-Hill Computer Series, 1983. [TRA, 1997] Tramullas Sáez, J. Introducción a la Documática [En línea]. Zaragoza: Kronos, 1997. <http://www.tramullas.com/nautica/documatica/3-1.html> [Consulta: 18 de noviembre de 2001] [VIL, 1997] Villena Román, J. Sistemas de Recuperación de Información [En línea]. Valladolid: Departamento Ingeniería Sistemas Telemáticos, Universidad. <http://www.mat.upm.es/~jmg/doct00/RecupInfo.pdf> [Consulta: 20 de febrero de 2002] [VOI, 1997] Voiskunskii, V. G. ‘Evaluation of search results’. Journal of the American Society for Information Science. 48(2) 1997. p.133-142 [WAN, 2001] WANG, S. ‘Toward a general model for web-based information systems’. International Journal of Information Management 21, 2001. p. 385–396 [WES, 2001] WESTERA, G. Comparison of Search Engine User Interface Capabilities [En línea]. Curtin: University of Technology, july, 2001. <http://lisweb.curtin.edu.au/staff/gwpersonal/compare.html> [Consulta: 9th-july-2001] [WIN, 1995] Winsip, I. ‘World Wide Web searching tools - an evaluation’. Vine 99, 1995. p. 49-54 También disponible en: [En línea] <http://gti1.edu.um.es:8080/javima/World-Wide-Web-searching-tools-anevaluation.htm> [Consulta: 5 de noviembre de 2000] [ZOR 1996] Zorn, P., Emanoil, M., Marshall, L. and Panek, M. Advanced Searching: Tricks of the Trade. [En línea]. Wilton, CT: Online Inc, 1996. <http://www.onlinemag.net/MayOL/zorn5.html > [Consulta: 15 de julio de 2001] -100- Biblioteca Universitaria ISSN: 0187-750X public@dgb.unam.mx Universidad Nacional Autónoma de México México Torres Vargas, Georgina Araceli; Juárez Santamaría, Beatriz Los sistemas de organización del conocimiento y el manejo de contenidos digitales Biblioteca Universitaria, vol. 11, núm. 1, enero-junio, 2008, pp. 3-12 Universidad Nacional Autónoma de México Distrito Federal, México Disponible en: http://www.redalyc.org/articulo.oa?id=28512651002 Cómo citar el artículo Número completo Más información del artículo Página de la revista en redalyc.org Sistema de Información Científica Red de Revistas Científicas de América Latina, el Caribe, España y Portugal Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto Los sistemas de organización del conocimiento y el manejo de contenidos digitales Georgina Araceli Torres Vargas* Beatriz Juárez Santamaría** Resumen Abstract Se muestra el uso de los Sistemas de Organización del Conocimiento, para la organización y recuperación de los contenidos digitales dispuestos en la biblioteca digital. Para ello se detallan algunas características de los sistemas más representativos y relacionan con las características que guardan los contenidos digitales. The main features of knowledge organization systems are presented. In particular, the differences between digital documents, contents and objects, as well as the distributed digital contents. Then, the usefulness of knowledge organization systems for the organization and retrieval of digital contents in a digital library is discussed. Finally, some features of the most representative systems are described as well as their relationship to the structure and special characteristics of digital contents. Palabras clave: Sistemas de Organización del Conocimiento, contenido digital, biblioteca digital. Keywords: Knowledge Organization Systems, digital contents, digital library. Introducción E s bien conocido que la información digital manifiesta una estructura distinta de la que presenta la impresa y que esto dificulta su análisis y representación al momento de organizarla dentro de una colección digital. Es por ello que para poder manejar esta información se requiere de otras propuestas que den los elementos necesarios para un análisis documental eficiente, que a su vez permita una recuperación adecuada. Si bien existen diversas alternativas, todavía no se encuentra una que se apegue completamente a las necesidades en el entorno digital. Sin embargo, los soc (Sistemas de Organización del Conocimiento) ofrecen en este momento opciones prometedoras para la representación y organización de los contenidos digitales. * Investigadora del Centro Universitario de Investigaciones Bibliotecológicas (cuib), Universidad Nacional Autónoma de México (unam), Torre ii de Humanidades, Ciudad Universitaria, 04510, México, D.F., México. ** Alumna de la Maestría en Bibliotecología y Ciencias de la Información, Universidad Nacional Autónoma de México (unam), Facultad de Filosofía y Letras, Circuito Interior, Ciudad Universitaria, 04510, México, D.F. BIBL. UNIV., ENERO-JUNIO 2008, VOL. 11, No. 1, P. 3-12 3 Los sistemas de organización del conocimiento y el manejo de contenidos digitales Los soc incluyen una variedad de esquemas que organizan, manejan y recuperan información. Los esquemas que ofrecen van desde archivos de autoridad a esquemas de clasificación, tesauros y ontologías. siste en una secuencia de bits, que bajo una correcta codificación representan todo tipo de información, la cual puede tomar dos formas: • ¿Documentos, contenidos u objetos digitales? En el terreno de la biblioteca digital (bd) se establece una relación directa con el documento digital, mismo que a simple vista no puede caracterizarse. Sobre todo se dificulta diferenciar la dualidad contenido-contenedor que sí es claramente definida en los impresos y que en el caso de los documentos digitales no es claro, sobre todo en el caso del contenedor que es intangible. Por eso es que en la actualidad muchos autores prefieren llamar contenido digital a los documentos que se muestran en la red. A la fecha existen solo algunas aproximaciones a la caracterización de los documentos digitales; entre éstas se puede mencionar el estudio realizado por Pédauque1, quien señala que en el medio impreso el documento es la suma de medio + inscripción, en donde el medio se enfatiza como aquello que puede manipularse. Los signos2 representan los contenidos, materializados en una inscripción. Si el concepto de documento fue más o menos claro hasta el momento en que comenzó la aparición de formas digitales, ya en el plano de lo digital se da poca distinción entre el documento y el programa, donde programa = software + datos. Al documento digital se le considera un caso especial de programa de cómputo, en donde el software es parte de la estructura y los datos son los contenidos. En esta dualidad, la ecuación que resulta para un documento digital es: Documento digital = estructura + datos A partir de esto, se ha optado por llamar objeto digital (od) a los documentos que pueden integrar las colecciones de una bd, puesto que un objeto digital con1 Pédauque, Roger T. Document [en línea]:… <http://archi- • Los objetos digitales son parte esencial de la bd y son definidos como una “unidad flexible y dinámica, consistente de contenido no lineal, representado como conjunto de ítems de información, enlazados, almacenados en uno o más medios físicos o en red, creados y utilizados por uno o más individuos en el desarrollo de algún proceso o proyecto”.3 Desde el punto de vista informático un objeto digital, “puede ser considerado como una secuencia de bits, de ceros y unos, ya que con ellos y una adecuada codificación se puede representar cualquier tipo de información, incluyendo los contenidos de los materiales tradicionales”.4 El objeto digital es “cualquier unidad de contenido, cualquier descriptor de contenido: datos midi, texto, mundo vmrl, imagen, textura, movimiento.” 5 Además de la información presentada al usuario, en el objeto digital se incluye una serie de datos adicionales que nos expresan algunas propiedades técnicas o descriptivas de los mismos objetos. En la idea de od subyace la necesidad de administrar -hacia diferentes puntos y tiempos- uno o más documentos para ser leídos, enriquecidos, anotados por varios participantes. Esto es realmente complicado, sobre todo al momento de administrar versiones con3 vesic.ccsd.cnrs.fr/documents/archives0/00/00/05/94/ sic_00000594_01/sic_00000594.pdf> 2 “señal o figura que se emplean en la escritura y en la imprenta” BIBL. UNIV., ENERO-JUNIO 2008, VOL. 11, No. 1 4 Schamber, Linda. What is the document? Rethinking the concept in uneasy times, p.669. 4 De acuerdo con el Diccionario de la Real Academia Española de la Lengua [en línea]. <http://www.rae.es/>, un signo es la Estructural: Interpreta los bits para organizarlos en tipos o grupos específicos de datos y en ocasiones da también una descripción del hardware y software necesarios para acceder a ellos. Semántica: Le aporta significados adicionales a la información estructural que permiten identificar, por ejemplo, el idioma de un escrito. García Camarero, Ernesto; García Menero, Luis Ángel. La biblioteca digital, p. 144. 5 Galloway, Alex. ¿Qué son los estudios digitales? [en línea]. <http://aleph-arts.org/pens/galloway.html> Georgina Araceli Torres Vargas y Beatriz Juárez Santamaría secutivas de un documento por individuos, por organizaciones y a gran escala, a través de redes de bibliotecas digitales. La sola identificación de las distintas versiones, las partes de documentos, los orígenes de las modificaciones, independientemente de su formato, es algo complicado y representa retos para la organización de los datos contenidos en el documento, pero también del conocimiento mismo. Contenidos digitales distribuidos A los ojos de muchos, la bd permitirá que todos los textos puedan ser ubicados, reunidos y leídos. Por lo que la biblioteca del futuro se muestra como una opción ideal, pues en comparación con la biblioteca física basada en impresos, provee información de manera más rápida y eficiente.6 De acuerdo con ideas como esta, muchas bibliotecas y programas han llevado a cabo acciones para lograr un acceso universal a la información. 6 Crawford, Walt. Future libraries: dreams, madness and reality, p.133. Este acceso universal a los documentos digitales que se le atribuye a la bd, se podrá concebir a partir de la cooperación entre bibliotecas digitales con temáticas e intereses afines, es decir, de la constitución de sistemas de redes de información7 que ofrezcan acceso a los documentos que cada biblioteca tiene en sus servidores. Es así como se habla de repositorios, en el sentido de que hay diversos sitios (o servidores) en donde se albergan documentos digitales que pueden ser consultados por más de una biblioteca.8 De hecho esto es lo que predomina en la actualidad; el ejemplo más ilustrador es la Digital Library Initiative, en sus fases 1 y 2. En este gran proyecto de desarrollo de bibliotecas digitales, sobresale la participación de bibliotecas académicas y especializadas, que cuentan con objetivos muy similares. Esta situación ha dado pie 7 Chen, Su-Shing. Digital libraries : the life cycle of information, p. 19. 8 Heery, Rachel. Digital Repositories review [en línea], <http://ahds. ac.uk/preservation/digital-repositories-review-2005.pdf>, p. 2. BIBL. UNIV., ENERO-JUNIO 2008, VOL. 11, No. 1 5 Los sistemas de organización del conocimiento y el manejo de contenidos digitales a la creación de consorcios9 de bibliotecas como forma de organización bibliotecaria. • En estos consorcios está siendo prioritaria la colaboración para: • 9 La adquisición de licencias y el pago de precios por recursos electrónicos. Bastan- • • • • Un consorcio puede definirse como una “sociedad formada por un grupo de bibliotecas, generalmente restringidas a zonas geográficas, a una clase de bibliotecas o al interés por tes consorcios identifican la negociación de licencias como su principal prioridad. Creación de catálogos colectivos. Se trata de adoptar un sistema único para todas las bibliotecas miembro que alimentan una única base. Instalación de servidores comunes para el almacenamiento. Gestión cooperativa de la colección. Suministro de servicios. Creación de colecciones digitales.10 una materia, que se constituye para desarrollar y compartir los recursos de todos los miembros y para ello mejorar los servicios bibliotecarios y los recursos de que disponen sus respectivos grupos de usuarios”. Cfr. Ferrer Sapena, Antonia. Torres Santo Domingo, Marta. Los consorcios, forma de orga- Guía metodológica para la implantación de una biblioteca nización bibliotecaria en el siglo xxi. Una aproximación desde digital universitaria, p. 146. la perspectiva española, p. 28-29. BIBL. UNIV., ENERO-JUNIO 2008, VOL. 11, No. 1 6 10 Georgina Araceli Torres Vargas y Beatriz Juárez Santamaría En cierto sentido, la creación de consorcios está ligada a la visión de la bd como empresa. Este conjunto de empresas tienden a generar capacidad de innovación, es decir, de crear mejoras en tecnología, insumos, generación y ofrecimiento de servicios y nuevas formas de comercialización, debido a su continua búsqueda por optimizar sus servicios de información digitales. Para todo esto se requiere que las bibliotecas digitales que conforman cada red funcionen bajo una interoperabilidad11 y estandarización adecuadas, que permita compartir información, por lo que es necesario el diseño de sistemas de información distribuidos, que puedan ser usados de manera compartida.12 El servicio en un ambiente digital no se restringe al acceso y uso de la información; también implica aspectos administrativos como, por ejemplo, al momento de permitir el acceso a la información a los repositorios distribuidos. Esto requiere la integración de procedimientos apropiados para la autenticación, el registro, la autorización y los procesos para el uso de la información digital.13 Aspectos como los señalados ya se pueden mostrar claramente en los espacios de aprendizaje en red, donde se provee acceso a distancia de materiales para la enseñanza. Para Pradt,14 esta colaboración puede darse en un marco de federaciones; el modelo tradicional, donde la biblioteca controlaba desde la conformación de su colección hasta el ofrecimiento del acceso, no es viable en el medio digital. La federación es un modelo que permite distribuir las responsabilidades, mismas que requieren especificarse a través de un convenio. 11 La interoperabilidad se define como la compatibilidad entre los sistemas de un gran sistema, bajo la especificidad de niveles de interacción y un conjunto de reglas y protocolos para que la información pueda fluir. Implica la compatibilidad de aplicaciones y servicios. 12 Peña, Rosalía. Gestión digital de la información: de bits a bibliotecas digitales y la web, p. 400. 13 Greenstein, Daniel. Digital libraries and their changes, p.291. 14 Pradt, Lougee. Diffuse Libraries [en línea]: Emergent Roles for the Research Library in the Digital Age. <http://www.clir. org/pubs/reports/pub108/contents.html> Cada parte habrá de determinar las condiciones para el uso del contenido, así como las responsabilidades que les corresponde a cada parte para preservar los documentos, entre otras cuestiones. Los sistemas de organización del conocimiento y su utilidad en el manejo de contenidos digitales El valor de las bibliotecas digitales depende de la calidad de los contenidos y de su organización, así como de los sistemas de gestión que faciliten el acceso a los datos almacenados. La importancia de los contenidos radica en poder transmitir y generar conocimientos, ya que si no se tiene algo de interés para los usuarios la biblioteca carecerá de importancia, pues la creación de una biblioteca digital debe responder a las necesidades de los usuarios; por ello es determinante una adecuada selección de contenidos basada en los intereses y necesidades de los usuarios. Por eso, es de suma importancia el ordenamiento que se utilizará en los contenidos digitales y para ello es necesario tomar en cuenta las cualidades de los tipos de documentos que las componen, pues por sus características los contenidos digitales permiten ciertas formas de manejo y uso. El orden que se establezca permitirá o no que estos manejos sean posibles. En este tenor algunos autores afirman que los Sistemas de Organización del Conocimiento (soc) apoyan la recuperación efectiva de los contenidos digitales. Estos sistemas se enfocan a todos los tipos de proyectos para organizar información y para promover el manejo del conocimiento, además incluyen esquemas de clasificación para organizar los materiales a un nivel general, encabezamientos de materia que otorgan un acceso más detallado y archivos de autoridad que controlan varias versiones de información clave (nombres geográficos y personales). También incluyen proyectos menos tradicionales, como ontologías y redes semánticas. Para describir a los sistemas de organización del conocimiento (soc) tenemos que tomar en cuenta las características de estructura y complejidad, las rela- BIBL. UNIV., ENERO-JUNIO 2008, VOL. 11, No. 1 7 Los sistemas de organización del conocimiento y el manejo de contenidos digitales ciones entre términos y su función. Por ello, podemos decir que los sistemas se agrupan dentro de tres categorías generales: 1. Listas de términos (entre las listas de términos se encuentran los archivos de autoridad, glosarios, diccionarios y diccionarios gráficos), en éstas se pone énfasis en listas de términos frecuentemente con definiciones. Si bien esta categoría es de uso ya tradicional en las bibliotecas –sean o no digitales−, en la actualidad cobran mayor realce, sobre todo al momento de plantear la posibilidad de crear redes de bibliotecas digitales en donde será necesario hacer precisiones de idioma, región, etcétera. 2. Clasificaciones y categorías (se encuentran los Encabezamientos de materia, Esquemas de Clasificación, Taxonomías y Esquemas de Categorización), que ponen énfasis en la creación de grupos de términos. De manera particular destacan las taxonomías como alternativa para la clasificación. Centelles define a la taxonomía como un tipo de vocabulario controlado en que todos los términos están conectados mediante algún modelo estructural (jerárquico, arbóreo, facetado...) y especialmente orientado a los sistemas de navegación, organización y búsqueda de contenidos de los sitios web. 15 3. Listas de relaciones (se encuentran los tesauros, redes semánticas y ontologías), en éstas se pone énfasis en las relaciones entre términos y conceptos. Redes semánticas. Con la revaloración del lenguaje natural en la organización documental, las redes semánticas se muestran como uno de los recursos más importantes. En estas redes no existe una ordenación jerárquica, sino que se muestra como una red. En la Web semántica la información se procesará en términos de 15 Cabe señalar que xml es la base de rdf y de la Web semántica. El rdf es la base para procesar metadatos y proporciona interoperabilidad entre aplicaciones que intercambian información legible por máquina en la web. owl es un lenguaje de marcado para la publicación de ontologías en la www y tiene como objetivo facilitar un modelo de marcado construido sobre rdf y codificado en xml. El objetivo de la Web semántica es que toda la información sea comprensible por humanos y también por computadoras. Para lograr dicho objetivo se deberá codificar la semántica de los documentos web mediante lenguajes de metadatos y ontologías. La red semántica es una ampliación de la red actual, en la cual la información está dotada de significados bien definidos, con la finalidad de que la coordinación del trabajo entre humanos y computadoras sea más completa.16 La Web semántica tendrá su base en los metadatos. Las ontologías actuarán como metadatos, y los recursos de la red se marcarán con instancias de las ontologías. El uso de ontologías será una forma de añadir metadatos a los recursos de la web actual. La Web semántica se parecerá a la figura A. Por otro lado, cabe señalar que el uso de metadatos fracasó en la web ordinaria por falta de confianza: las palabras que aparecían en los campos meta de las páginas html no solían describir el contenido real de éstas, como el siguiente ejemplo: Meta name:”keywords” contents =”ontologías, web semántica, owl, rdf” Centelles, Miquel. Taxonomías para la categorización y la organización de la información en sitios web [en línea]. <http://www.hipertext.net> BIBL. UNIV., ENERO-JUNIO 2008, VOL. 11, No. 1 8 su semántica. La infraestructura de la Web semántica basada en metadatos aportará un camino para razonar en la web. Para obtener la definición correcta de los datos, la Web semántica utiliza los estándares rdf y owl que ayudan a la web a compartir y reutilizar datos y documentos entre diferentes tipos de usuarios. 16 Web semántica [en línea]:...<http://www.nosolousabilidad.com/articulos/web_semantica.htm> Georgina Araceli Torres Vargas y Beatriz Juárez Santamaría Como no existía alguien que controlara que las palabras descriptivas de los campos meta correspondieran realmente al contenido de las páginas web, las personas que elaboraban las páginas solían incluir en este campo las palabras más populares o atractivas de la página. Los buscadores clasificaban las páginas web tomando en cuenta las palabras clave de los campos meta y los resultados que se obtenían decepcionaban a los usuarios, por lo que en la actualidad los buscadores como Google o Yahoo no toman en cuenta los campos meta. Por último, hay que señalar que la Web semántica no se basa solamente en los metadatos sino también en la confianza. Ontologías. Una ontología es la definición de un conjunto de conceptos, su interrelación, taxonomía y las reglas que gobiernan dichos conceptos.17 Las ontologías son utilizadas por las personas, las bases de datos y las aplicaciones que necesitan compartir un dominio de información. Sus características son: En la Web semántica no todas las fuentes serán de confianza, algunas serán más fiables que otras. Para evitar extraer datos erróneos o falsos, la Web semántica tendrá que disponer de mecanismos de confianza y credibilidad como son: las firmas digitales, los certificados de terceras partes o recomendaciones y hasta en algunos casos el propio usuario podrá valorar la fiabilidad de los documentos. • • • 17 Define los conceptos, propiedades, relaciones, funciones, axiomas y restricciones que la componen. Es legible e interpretado por máquinas. Es un modelo abstracto y una vista simplificada de las entidades que representa. López de Vergara, Jorge. Gestión semántica [en línea]:... <http://jungla.dit.upm.es/~jlopez/publicaciones/jite103.pdf> BIBL. UNIV., ENERO-JUNIO 2008, VOL. 11, No. 1 9 Los sistemas de organización del conocimiento y el manejo de contenidos digitales • Refleja un consenso previo sobre la información, entre un grupo de expertos. En el futuro se requerirá de un tipo de catálogo que sea el enlace a una cadena de servicios que permita a los usuarios la búsqueda, selección y obtención de Una ontología sirve para definir los términos usados para describir y representar un área de conocimiento y es útil para diversas aplicaciones inteligentes, como es el caso de la recuperación de información o el comercio electrónico. Las ontologías incluyen definiciones de conceptos básicos del dominio,18 y las relaciones entre ellos, que son útiles para las computadoras. Codifican el conocimiento de un dominio y también el conocimiento que extiende los dominios. los objetos de información que requiera.19 La Web social es la tendencia más reciente en cuanto a manejo de los documentos digitales a través del catálogo. Algunos la definen como “el siguiente nivel en Internet, en donde podrán unirse personas y organizaciones”20; otros la consideran una etapa de evolución en la web, que dará paso a un catálogo abierto.21 Otro uso de las ontologías se da en la administración de colecciones multimedia, en las que a cada archivo de imagen, video o audio les puede ser asociada información semántica que permita acceder a él de manera más rápida y precisa. La promesa de la Web social es servir de enlace entre personas y organizaciones. Vista como organización, la bd es uno de los elementos que se vería involucrada. Para que esto sea posible, el primer problema por resolver es el intercambio de datos a través de diferentes dominios, en donde se utilizan diversos sistemas operativos, bases de datos y aplicaciones. Web social. Aunque no se concibe como parte de los Sistemas de Organización del Conocimiento, por sus características la llamada Web social se muestra como una buena alternativa al momento de organizar colecciones de la bd. Sin un medio que permita compartir datos entre las bd, sería inoperable el establecimiento de redes y, por consiguiente, la noción de bd estaría limitada. En este contexto el protocolo abierto xdi se plantea como el protocolo que ha de dar paso a la creación de la Web social.22 Hay que notar que si bien los documentos que constituyen a la bd guardan diferencias frente a los documentos impresos, hasta hace poco los catálogos no habían mostrado casi ninguna diferencia, pese a que en el ambiente digital se demandan otras cosas en materia de recuperación de la información. Si bien el opac (Online Public Access Catalog) se mostró como un cambio sustancial, todavía no representaba el cambio necesario para el medio digital. En el 2006 la Biblioteca del Congreso de los Estados Unidos presentaba un informe que indicaba: En el entorno de esta web se podría dar lo que llama Kaenel23 “enriquecimiento de los catálogos” y que básicamente consistiría en relacionar los catálogos de la bd con la información digital que complemente y ayu- 18 19 www.loc.gov/catdir/calhoun-report-final.pdf> 20 net/article.php?lab=reed0704&page=1> 21 Recordon, David. OpenID2.0: a platform for user-centric cierta visión del mundo con respecto a un dominio. Cfr. Abián, identity management, p. 11-16. Miguel Ángel. Ontologías: qué son y para qué sirven [en línea]. Strongin, Geoffrey. The role of trusted computed in Internet scale drm, p. 25-26 <http://www.wshoy.sidar.org/index.php?2005/12/09/ 10 Para más detalles sobre el protocolo xdi, se pueden consultar escritos como: fabricación de productos, etc.) Toda ontología representa BIBL. UNIV., ENERO-JUNIO 2008, VOL. 11, No. 1 Kaenel, Isabelle de. “Les catalogues des bibliotéques [en línea], <http://www.otracuba.org/ressi/?q=kaenel_iriarte_05> 22 de conocimiento (física, aeronáutica, medicina, contabilidad, 30-ontologias-que-son-y-para-que-sirven> Drummond Reed, Marc. The social Web [en línea] : Creating an Open Social Network with xdi. <http://journal.planetwork. El término “dominio” en ontología se usa para denotar un área específica de interés (el río Duero, por ejemplo) o un área Calhoun, Karen. The changing nature of the catalog and its integration with other discovery tools [en línea]. <http:// 23 Kaenel, Isabelle de, Op. Cit., p. 7. Georgina Araceli Torres Vargas y Beatriz Juárez Santamaría de en la búsqueda de los usuarios. Así, por ejemplo, se podrían integrar resúmenes, comentarios, tablas de materia, imágenes, videos y muchos otros tipos de documentos que guarden relación con cada obra registrada. Pero sobre todo, se espera que el catálogo ofrezca el enlace a la obra en formato digital, lo que correspondería perfectamente con la idea de bd y abriría las posibilidades para organizar los materiales. • Conclusiones • A manera de conclusión, podemos señalar que: • • Las colecciones de naturaleza digital demandan una representación y organización distinta de la que se emplea en las colecciones de impresos. Hoy en día, los Sistemas de Organización del Conocimiento (soc) son usados para organizar materiales con el propósito de recuperar y manejar una colección; sirven de puente entre la necesidad de informa- • ción del usuario y el material en la colección y son vistos como una buena alternativa para los contenidos digitales que conforman colecciones. Las organizaciones como la Biblioteca Digital (bd) son las que crean y usan más los Sistemas de Organización del Conocimiento, debido a que por sus características los objetos digitales que conforman sus colecciones no pueden ser representados y organizados con los sistemas tradicionales. Los soc que en la actualidad se muestran como las propuestas más prometedoras son las taxonomías, redes semánticas, ontologías y, aunque en la literatura no se mencionan como un soc, se puede mencionar a la Web semántica como un medio para los objetos digitales propios de la bd. Sin concebir nuevas formas de organización, es imposible pensar en la constitución efectiva de la bd. Obras Consultadas Calhoun, Karen. The Changing Nature of the Catalog and its Integration with other Discovery Tools [en línea]. <http:// www.loc.gov/catdir/calhoun-report-final.pdf> [Consulta: 3 mayo 2007]. Centelles, Miquel. Taxonomías para la categorización y la organización de la información en sitios web [en línea]. <http://www.hipertext.net>. [Consulta: 30 enero 2007]. Chen, Su-Shing. Digital libraries : the life cycle of information. Columbia: Better Earth, 1998. Crawford, Walt. Future Libraries: dreams, madness and reality. Chicago: ala, 1995. 210 p. Diccionario de la Real Academia Española de la Lengua [en línea]. <http://www.rae.es/> [Consulta: junio 2007]. Drummond Reed, Marc. The Social Web [en línea] : creating an open social network with xdi. <http://journal.planetwork.net/article.php?lab=reed0704&page=1> [Consulta: 3 mayo 2007]. Ferrer Sapena, Antonia. Guía metodológica para la implantación de una biblioteca digital universitaria. Madrid: trea, 2005. 202 p. BIBL. UNIV., ENERO-JUNIO 2008, VOL. 11, No. 1 11 Los sistemas de organización del conocimiento y el manejo de contenidos digitales Galloway, Alex. ¿Qué son los estudios digitales? [en línea]. <http://aleph-arts.org/pens/galloway.html> [Consulta: 13 septiembre 2005]. García Camarero, Ernesto; García Menero, Luis Ángel. La biblioteca digital. Madrid : Arco/Libros, 2001. 380 p. Greenstein, Daniel. Digital Libraries and their Changes. Library Trends, fall 2000, vol. 49, no. 2, p. 290-303. Heery, Rachel. Digital Repositories Review [en línea]. Reino Unido: ukoln, 2005. <http://ahds.ac.uk/preservation/ digital-repositories-review-2005.pdf> [Consulta: junio 2007] Kaenel, Isabelle de. “Les catalogues des bibliotéques [en línea] : du web invisible au web social”. Revue électronique suisse de Science de l’Information, Mar., 2007, año 3, no. 5. <http://www.otracuba.org/ressi/?q=kaenel_iriarte_05> [Consulta: junio 2007] López de Vergara, Jorge. Gestión semántica [en línea]: aplicando las ontologías a la gestión de red. <http://jungla.dit. upm.es/~jlopez/publicaciones/jite103.pdf> [Consulta: 25 abril 2007]. Pédauque, Roger T. Document [en línea]: form, sign and medium, as reformulated for electronic documents. 2003. <http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/05/94/sic_00000594_01/sic_00000594.pdf> [Consulta: junio 2007] Peña, Rosalía. Gestión digital de la información: de bits a bibliotecas digitales y la web. Madrid: rama, 2002. 440 p. Pradt, Lougee. Diffuse Libraries [en línea]: emergent roles for the research library in the digital age. <http://www.clir.org/ pubs/reports/pub108/contents.html> [Consulta: junio 2007] Schamber, Linda. What is the Document?: Rethinking the concept in uneasy times. Journal of the American Society for information science, 1996, vol.47, no. 9, p.669. Recordon, David, Reed, Drummond. OpenID2.0: a platform for user-centric identity management [en línea]. En: Conference on Computer and Communications Security Proceedings of the second acm workshop on Digital identity management, Alejandria, Virginia, usa, november 03-03, 2006, p. 11-16. Strongin, Geoffrey. The Role of Trusted Computed in Internet Scale drm [en línea]. En: Conference on Computer and Communications Security Proceedings of the first acm workshop on Scalable trusted computing, Alejandria, Virginia, usa, november 03-03, 2006, p. 25-26. Torres Santo Domingo, Marta. Los consorcios, forma de organización bibliotecaria en el siglo xxi. Una aproximación desde la perspectiva española. En: Consorcios de bibliotecas. Maribel Gómez Campilejo, ed. Cádiz: Universidad de Cádiz: ebsco, 1999, p. 28-29. Web semántica [en línea]: el papel del arquitecto de la información. <http://www.nosolousabilidad.com/articulos/web_semantica.htm> [Consulta: junio 2007] BIBL. UNIV., ENERO-JUNIO 2008, VOL. 11, No. 1 12 Cuarto Quinto Nivel Bibliografía Argüello, N. & Jiménez, J. (2014). Procesos básicos y esquemas de conocimiento organizacional. Augbur. (2014). Gestión del conocimiento. http://ec.globedia.com/gestion-del-conocimiento_1 Fernández Hernández, A.; López, M. J. & Prevot Urgellés, Y. (2015). Modelo de sistema de organización del conocimiento basado en ontologías. Revista Cubana de Información en Ciencias de la Salud, 26(4). http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S2307-21132015000400010&lng=es&tlng=es. García Gutiérrez, A. (2013). La organización del conocimiento desde la perspectiva poscolonial: itinerarios de la paraconsistencia. Perspectivas em Ciência da Informação, 18(4), 93-111. https://doi.org/10.1590/S141399362013000400007 Gnoli, C.; Bosch, M. & Mazzocchi, F. (2007). A new relationship for multidisciplinary knowledge organization systems: dependence. VIII Congreso ISKO; España. http://www.iskoi.org/ilc/dependence.rtf Guzmán Gómez, M. (2008). Sistemas de organización del conocimiento y transdisciplinariedad: un acercamiento desde el enfoque de los niveles integrativos. ACIMED, 18(5) http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1024-94352008001100007&lng=es&tlng=es. Hassan, Y. (2006). Visualización y recuperación de información. II Encontro de Ciências e Tecnologias da Documentação e Informação. Escola Superior de Estudos Industriais e de Gestão (Vila do Conde). https://www.yusef.es/visualizacion_y_recuperacion_de_informacion.pdf INCIBE. (2009). Primeros pasos para clasificar la información de tu organización. https://www.incibe.es/protege-tu-empresa/blog/primeros-pasos-clasificar-informacion-tu-organizacion Luna. (2016). Esquemas de organización del conocimiento. https://es.scribd.com/document/460937706/ESQUEMAS-DE-ORGANIZACION-DEL-CONOCIMIENTO Morato, J. (2009). Organización de la información. GlosasairumBITri. http://glossarium.bitrum.unileon.es/Home/recuperacion-de-informacion 11/22 ▲ ▼ Cuarto Quinto Nivel Autoevaluación ¿Por qué es importante el esquema de organización del conocimiento? Porque permite construir esquemas conceptuales. Porque permite ahorrar tiempo y recursos. Porque brinda trabajo a los bibliotecarios. Pregunta 1 de 10 12/22 Cuarto Quinto Nivel Autoevaluación ¿Qué son conceptos, categoría y relaciones? Fundamentos de los sistemas de organización del conocimiento. Desarrollos fundamentales del cerebro humano. Gráficos y mapas mentales. Pregunta 2 de 10 13/22 Cuarto Quinto Nivel Autoevaluación ¿Qué es la interdisciplinariedad? Agrupar, clasificar y jerarquizar el conocimiento por disciplinas. La manera estricta de ejercer disciplina cuando así se amerita. La disciplina interna. Pregunta 3 de 10 14/22 Cuarto Quinto Nivel Autoevaluación El conocimiento adquirido con antelación es Lo que aprendimos exclusivamente en la primera infancia. Individual y único de manera segmentada. La base para comprender el nuevo conocimiento. Pregunta 4 de 10 15/22 Cuarto Quinto Nivel Autoevaluación ¿Cuáles son los enfoques de la organización del conocimiento? Enfoque de la escuela española y enfoque contemporáneo. Enfoque antiguo y enfoque moderno. Enfoque antiguo, Edad Media y era contemporánea. Pregunta 5 de 10 16/22 Cuarto Quinto Nivel Autoevaluación ¿Qué es OC? Operaciones de comunicación. Organización del conocimiento. Orden contemporáneo. Pregunta 6 de 10 17/22 Cuarto Quinto Nivel Autoevaluación ¿A qué se refiere el tratamiento de la información? Elaborar un listado descriptivo de lo que se va a resguardar. Presentar parámetros de organización de la información. Considerar los recursos con los que se cuentan. Pregunta 7 de 10 18/22 Cuarto Quinto Nivel Autoevaluación ¿Qué es sinonimia? Igual pronunciación de palabras, pero diferencia en su significado. Igual escritura de palabras con diferente significado. Dos palabras que se pronuncian diferente, pero significan lo mismo. Pregunta 8 de 10 19/22 Cuarto Quinto Nivel Autoevaluación Cuando una información es “interna”, ¿quién puede ver la información? Todos los seguidores de la empresa internos y externos. Todos los miembros de la información. Todos los auditores externos e internos. Pregunta 9 de 10 20/22 Cuarto Quinto Nivel Autoevaluación ¿En qué se basa el conocimiento individual? En el conocimiento tácito y explícito. En la trascendencia de la época vivida. En el conocimiento interinstitucional. Pregunta 10 de 10 21/22 Cuarto Quinto Nivel 1/16 Cuarto Quinto Nivel 6.1. Dimensiones del aprendizaje de Marzano Marzano es un investigador-educador que el 1991 desarrolla proyectos de investigación sobre el perfil ideal del futuro egresado universitario, no solo en el ámbito académico sino cuáles van a ser las competencias reales necesarias para que un profesional triunfe en esta sociedad. Una vez llevada a cabo esta investigación resume esta como atributos: ⬥ Debe desarrollar las competencias de liderazgo y toma de decisiones. ⬥ Ser capaz de analizar críticamente su realidad y resolver problemas reales. ⬥ Como un ser social, es necesario que aporte a esta sociedad de manera efectiva. ⬥ Un punto sensible es la gestión del conocimiento, por lo tanto, el manejo de la información se vuelve indispensable para todo profesional. ⬥ Con el desarrollo tecnológico, la comunicación al igual que la educación han superado limitaciones de tiempo y espacio, esta comunicación a la vez ha llegado a los niveles más bajos de ética y credibilidad; por lo tanto, las habilidades comunicativas y de transmitir información marcarán una necesidad para los futuros profesionales. ⬥ El uso de la matemática y del lenguaje que abre las puertas al desarrollo del pensamiento lógico y al pensamiento verbal La taxonomía de Marzano y Kendall es un sistema comprobado de gran importancia para todo aprendiz, practicante y estudiante, a fin de aprender sobre una clasificación de objetivos a nivel educativo. Este modelo apunta a que el conocimiento debe ser significativo, es decir útil, para que sea considerado como conocimiento y no solo es el aprender, sino tener la capacidad de conservar este conocimiento para así transmitirlo a una sociedad en la que el individuo aporta y al mismo tiempo recibe conocimiento social. 2/16 Cuarto Quinto Nivel 6.1. Dimensiones del aprendizaje de Marzano Al hablar de sociedad, nos referimos a ese componente humano que a lo largo de la historia ha vivido diferentes etapas de evolución que le ha construido su realidad; sin embargo, esta dependencia dinámica es de consideración proporcional al desarrollo del ser humano. Es decir, que el ser humano se ha vuelto más competitivo y con él la sociedad se vuelve más competitiva, así mismo, la sociedad exige evolucionar y el ser humano, a la vez, exige que la sociedad evolucione, es un proceso dependiente de ser social = sociedad = educación. Los dominios de conocimiento se basan en el tipo de aprendizaje que un estudiante puede adquirir, los dominios que Marzano detalla son tres: ⬥ Información ⬥ Procedimientos mentales ⬥ Procedimientos psicomotores 2/16 Cuarto Quinto Nivel 6.1. Dimensiones del aprendizaje de Marzano Dentro de esta taxonomía de Marzano, también se establecen cuáles serían las cualidades del futuro profesional, estas cualidades son blandas y no 100 % cognitivas, así se determina: ⬥ El pensamiento creativo y lateral. ⬥ La toma de decisiones frente a sus problemas y los de su entorno. ⬥ La resolución a estos problemas presentando soluciones prácticas acordes a la realidad. ⬥ El profesional y los estudiantes deben ser autodidactas, es decir, que sean los creadores de su conocimiento y sean ellos quienes dirijan qué y cómo aprender. ⬥ Deben ser colaborativos y desarrollar capacidades para trabajar en equipo. ⬥ Resalta la independencia en todos estos procesos y en su vida misma como un ser único e inteligente. En cuanto a la educación, proporcional al desarrollo de esta sociedad y del ser humano, también ha evolucionado, no solo en su dinámica metodológica, sino también pedagógica y en la mira de sus objetivos y qué tipo de estudiante es el que tiene y qué tipo de egresado es el que debe aportar a la sociedad para responder a sus necesidades. Al analizar las cualidades y las necesidades del futuro profesional, es evidente que los espacios de instrucción deben evitarse y profundizar la educación integral de los estudiantes. Como educación integral entendemos que es formar no solo en las ciencias, sino formar a un ser integral con capacidades sociales, cognitivas, reflexivas, críticas, sin cerrar los ojos a la evolución social, así no sea entendida, y aportar para que esta realidad social no se deforme con el paso del tiempo y la apertura para que los procesos de evolución tengan lugar. 2/16 Cuarto Quinto Nivel 6.1. Dimensiones del aprendizaje de Marzano Este modelo de dimensiones de aprendizaje parte de la adquisición del conocimiento por medio de las actitudes y de las percepciones y la integración del conocimiento, a continuación la extensión y la profundización del conocimiento por medio del uso de las habilidades cognitivas. Una vez procesada esta información, se extiende a la utilización significativa de esta. Cuando el conocimiento es útil y puesto en práctica, esto se vuelve un hábito mental y el ser humano es consciente de que entre más conocimiento, más amplitud de actuar y de expandir su vida de manera positiva en diferentes ámbitos. 2/16 Cuarto Quinto Nivel 6.1.1. Adquisición e integración del conocimiento Este proceso se refiere a hacer uso del bagaje con el que cuente el estudiante previo a adquirir un nuevo conocimiento. Este conocimiento previo servirá para el análisis del nuevo conocimiento integrándolo a lo ya conocido, descartándolo o modificándolo de tal manera que se vuelva útil y de acuerdo con cada realidad. Según el proceso que se requiera para la adquisición de este conocimiento puede dividirse en: Conocimiento declarativo es un tipo de conocimiento que requiere un proceso simple de comprensión a fin de ser memorizado. Para llevar a cabo este proceso, es necesario que el estudiante pueda establecer una conexión sustancial entre lo que sabe y el nuevo conocimiento adquirido, he aquí la importancia de que el conocimiento pueda ser práctico y no solo teórico, debe también poder organizar este conocimiento haciendo una clasificación de lo que será útil o no para, acto seguido, poder almacenarlo y recuperarlo siempre que así lo necesite. Conocimiento procesal es un tipo de conocimiento que requiere un proceso más complejo de decodificación para su desarrollo teniendo en cuenta qué tipo de estrategias se necesita utilizar para desarrollar el conocimiento, la puesta en práctica del mismo y la automatización; el ejercicio constante para adquirir práctica y desarrollar este proceso. 6.1.2. Actitudes y percepciones positivas acerca del conocimiento En cuanto a las dimensiones de aprendizaje, las actitudes y la percepción son un fin que el docente debe motivar en el estudiante como un producto final o como un punto de partida; por el contrario, es la búsqueda permanente para la educación efectiva. 3/16 Cuarto Quinto Nivel 6.1.1. Adquisición e integración del conocimiento Son varios los factores que pueden determinar en el estudiante el desarrollo de estas actitudes y percepciones tanto positivas como negativas, siendo imperativo fomentar las positivas. El docente debe fomentar y cuidar: ⬥ El clima en el salón de clase pues es el ambiente académico en el cual el estudiante adquiere los conocimientos de forma teórica y despeja sus dudas. ⬥ La aceptación de las percepciones del maestro y de los compañeros como los actores dinámicos dentro del proceso de enseñanza-aprendizaje, la relación que se desarrolle entre docente-estudiante y estudiante-estudiante debe estar regida al ámbito académico sin olvidar que ambos son seres humanos y sociales con diferencias individuales que deben ser respetadas. ⬥ El sentido de confort y el orden sin duda ambos pueden ser vistos como opuestos pues el uno es libre y el otro necesita de organización, pero ambos confluyen en el desarrollo físico e intelectual del estudiante. Las reglas y los procedimientos a ser aplicados deben ser explícitos. ⬥ El desarrollo de actitudes positivas en el desarrollo de tareas, viéndolas a estas como un refuerzo del aprendizaje que busca un propósito y es el de afianzar conocimientos tanto teóricos como prácticos. ⬥ La autoestima, fomentando la autoconsciencia y el valor propio a ser capaces de conseguir las tareas y metas planteadas para el aprendizaje, diseñando tareas pertinentes que fomenten el interés de los estudiantes quienes podrán reconocer el valor de las mismas. 3/16 Cuarto Quinto Nivel 6.1.1. Adquisición e integración del conocimiento Estas actitudes y percepciones afectan de manera directa al aprendizaje del estudiante y al desarrollo de sus habilidades, pues estas actitudes y percepciones se desarrollan con base en lo que los estudiantes viven y el entorno que se presenta a él durante este proceso de aprendizaje. Pensamiento crítico es pensar por sí mismo, no dejar alienarse por otros pensamientos, analizando de manera individual. Es una habilidad blanda que exige su desarrollo en todo ser humano para poder ser el constructor de su propia realidad. Pensamiento creativo es una habilidad blanda que permite innovar, ser creador de nuevas ideas y conceptos con base a la propia realidad de manera lógica y original. 6.1.3. Extender y refundar el conocimiento Esta tercera dimensión se refiere a la adquisición misma del conocimiento, cómo este conocimiento es adquirido y procesado para su uso de manera individual bajo las capacidades cognitivas que cada estudiante haya desarrollado. Realizar las distinciones y las nuevas conexiones para incrementar el propio conocimiento. Las habilidades que se deben desarrollar en esta tercera dimensión son: 3/16 Cuarto Quinto Nivel 6.1.1. Adquisición e integración del conocimiento 3/16 Cuarto Quinto Nivel 6.1.1. Adquisición e integración del conocimiento 6.1.4. Usar el significativamente conocimiento El conocimiento significativo es el conocimiento que el estudiante se apropia pues lo analiza como algo que va a utilizar en su vida diaria. Es un conocimiento que es fácil de poner en práctica y aporta significativamente en la vida del estudiante pues este mismo al ver la utilidad lo valora y lo transforma en conocimiento previo, base para futuros aprendizajes. 3/16 Cuarto Quinto Nivel 6.1.1. Adquisición e integración del conocimiento 6.1.5. Hábitos mentales productivos Es la última dimensión en la cual se hace énfasis sobre la importancia de los hábitos que los estudiantes deben poner en práctica para que el conocimiento sea almacenado y recuperado permitiendo así el autoaprendizaje con un pensamiento crítico, creativo y de autocontrol. Esta dimensión puede considerarse la más importante de todas, pues es transversal y al igual que la de actitudes y percepciones debe guiar todo el proceso de conocimiento desde que tenemos el primer contacto en el aprendizaje hasta que este conocimiento sea significativo y de primera mano para su uso. Pensamiento autorregulatorio, la autorregulación es una competencia que permite autodirigirnos. Esta autorregulación es una capacidad blanda que permite tener control sobre quiénes somos y quiénes queremos ser, a dónde vamos por medio del planteamiento de metas y objetivos claros. Es necesario conocernos y estar conscientes de quiénes somos, cuáles son nuestras emociones, actitudes y hasta en qué porcentaje nuestras metas nos dominan o nos impulsan a seguir adelante; es imposible regular lo que no se conoce. Una vez realizada esta autorreflexión y estando conscientes de en qué lugar de la vida nos encontramos, podemos autodirigirnos hacia dónde queremos ir. Así mismo, en educación, a fin de ser autodidactas debemos conocernos para dirigir nuestras metas educativas y de aprendizaje. 3/16 Cuarto Quinto Nivel Bibliografía López, C. (2008). Dimensiones de aprendizaje. https://es.slideshare.net/lorca86/dimensiones-de-aprendizaje Martínez, M.; Pérez, M. E. & Ascanio, A. (2017). El aprendizaje de conceptos relacionados con la actividad científica utilizando al taller de cocina como escenario pedagógico. Revista de Investigación, 41(92), 163-184. http://ve.scielo.org/scielo.php?script=sci_arttext&pid=S1010-29142017000300009&lng=es&tlng=es. Marzano, R. & Kendal, J.S. (2007). The New Taxonomy of Educational Objectives. Corwin Press. http://books.google.com.gt/books? hl=es&lr=&id=kg108NbATFMC&oi=fnd&pg=PR11&dq=marzano+s+taxonomy&ots=XqCnWIEOB3&si g=Tw4CX8EPNtUCADJ-rUrJ9e7dZq8#v=onepage&q=marzano%20s%20taxonomy&f=false Paredes, D. M. (2019). Dimensiones pedagógicas que configuran las prácticas de aprendizajeservicio. Páginas de Educación, 12(2), 23-42. Epub 01 de diciembre de 2019. https://dx.doi.org/10.22235/pe.v12i2.1834 5/16 Cuarto Quinto Nivel Autoevaluación ¿Cómo se desarrolló la taxonomía de Marzano? Por medio de una hipótesis. Por medio de una investigación. Por medio de la experiencia. Pregunta 1 de 10 6/16 Cuarto Quinto Nivel Autoevaluación ¿Qué son las habilidades blandas? Habilidades personales no teóricas. Habilidades cognitivas superficiales. Habilidades lógicas. Pregunta 2 de 10 7/16 Cuarto Quinto Nivel Autoevaluación ¿A qué apuntan las dimensiones del aprendizaje? A la implementación de docentes calificados académicamente. A la mejora de los espacios físicos. A que el aprendizaje sea significativo. Pregunta 3 de 10 8/16 Cuarto Quinto Nivel Autoevaluación ¿Qué son los procedimientos mentales? El conocimiento que se adquiere para resolver divisiones. El conocimiento que se puede adquirir de forma básica. El conocimiento que se adquiere para organizar procesos. Pregunta 4 de 10 9/16 Cuarto Quinto Nivel Autoevaluación ¿Qué son los procedimientos psicomotores? La adquisición de conocimientos por medio del sistema motor. La adquisición de conocimientos ajustando la motricidad. La adquisición de conocimientos por medio de la regulación caligráfica. Pregunta 5 de 10 10/16 Cuarto Quinto Nivel Autoevaluación ¿Qué es el conocimiento declarativo? Conocimiento que requiere una forma simple de comprensión a fin de ser memorizado. Conocimiento que requiere una forma compleja de comprensión a fin de ser memorizado. Conocimiento que requiere ejercicios físicos de comprensión a fin de ser memorizado. Pregunta 6 de 10 11/16 Cuarto Quinto Nivel Autoevaluación ¿Qué es el conocimiento procesal? Conocimiento que requiere una forma simple de comprensión a fin de ser memorizado. Conocimiento que requiere una forma compleja de comprensión a fin de ser memorizado. Conocimiento que requiere ejercicios físicos de comprensión a fin de ser memorizado. Pregunta 7 de 10 12/16 Cuarto Quinto Nivel Autoevaluación ¿Cuáles son las dimensiones transversales? Actitudes y percepciones positivas y hábitos mentales productivos. Extender y profundizar el conocimiento y adquisición e integración del conocimiento. Usar el conocimiento significativamente y hábitos mentales productivos. Pregunta 8 de 10 13/16 Cuarto Quinto Nivel Autoevaluación ¿Qué es el pensamiento crítico? Es criticar todo lo que conocemos. Es pensar de manera independiente. Es aprender según las experiencias ajenas. Pregunta 9 de 10 14/16 Cuarto Quinto Nivel Autoevaluación ¿Qué es el pensamiento autorregulatorio? Conocerse y reflexionar sobre uno mismo. Ir de a poco en el conocimiento. Aprender más rápido que los demás. Pregunta 10 de 10 15/16 Aprendizaje de la Lengua y la Literatura Msc. Fernando Bravo dfbravo@espe.edu.ec 1 Normas del curso y sesiones sincrónicas. • • • • • • • Puntualidad. Micrófonos apagados (prenderlos en el caso de una participación puntual). Revisar la plataforma (anuncios, calendario, correo institucional, whatsapp). Contenido: Temas y actividades. Archivos y Sitios Respeto y compañerismo. Comandancia. Presentación del Sílabo Conceptos básicos 4 Proceso de Comunicación EMISOR CODIFICACIÓN CANAL DECODIFICACIÓN RECEPTOR RETROALIMENTACIÓN 5 Elementos de la Comunicación • Emisor: persona que transmite algo a los demás. • Mensaje: información que el emisor envía al receptor. • Canal: elemento físico que establece la conexión entre el emisor y el receptor. • Código: es un conjunto de signos sistematizados. El emisor y el receptor deben utilizar los mismos códigos. • Receptor: persona que recibe el mensaje a través del canal y lo interpreta. • Contexto: ámbito o espacio de real en el que se desarrolla el mensaje. 6 Concepto “COMUNICACIÓN” se refiere a un sistema de conferir y extraer significados sobre la transmisión y recepción de mensajes, mediante la utilización de un lenguaje específico para desarrollar una interacción social y procesos de representación”’ (Mc Quail, 1998). https://www.youtube.com/watch?v=_akEvAf5OSQ 7 Modelo de comunicación - Wilbur Schramm Modelo de comunicación - David Berlo Modelo de Osgood y Schramm (1954). (McQuail y Windhal, 1997, p. 47) 10 https://www.youtube.com/watch?v=rg81aDcGPsQ 11 ¿Cuál es el papel que deben jugar los medios de comunicación (digitales, tradicionales) en la actualidad? ¿Desde su opinión, cómo la comunicación puede ser una herramienta para mejorar nuestra sociedad? Tipos de barreras en la comunicación Físicas Efectos del medio ambiente, tales como: ruidos, iluminación, distancia, etcétera. Semánticas Problemas en el contexto de significación e interpretación. Fisiológicas Distorsiones en los sentidos que dificultan la comunicación. Psicológicas Se refiere a las actitudes y la predisposición de los actores de la comunicación. Tales como: prejuicios, estados anímicos, emocionales (miedo, alegría, tristeza, enojo, etc.) 13 Bibliografía • Mc Quail, Denis. 1998. Introducción a la teoría de la comunicación de masas. México: Paidos Comunicación. • Rosenberg, M. (2000). Comunicación no violenta. El lenguaje de la compasión. Barcelona: Ediciones Urano. • Williams, Raymond. 1999. Las relaciones entre lenguaje y comunicación. México: Paidos Comunicación. 14 Material de apoyo http://www.koiwerrhh.com.ar/comunicaciones_p roceso.html https://neetwork.com/proceso-de-comunicacion/ Cuarto Quinto Nivel 1/19 Cuarto Quinto Nivel Introducción Etimológicamente, la palabra morfosintaxis proviene de la combinación de dos palabras griegas; morfo que significa “forma” y sintaxis que significa “orden”, por lo que se puede definir a la morfosintaxis como el estudio de las reglas morfológicas y sintácticas de una lengua. Se encuentra dentro de la lingüística y ayuda a identificar los elementos que permiten construir oraciones de manera lógica y con sentido, que cumplan tanto en la adecuada aplicación de las reglas necesarias para cada palabra como para unirlas dentro de una oración. ▲ La morfosintaxis combina la morfología y la sintaxis para la comprensión de las diferentes derivaciones de una palabra. El estudio de la lingüística y de la gramática actual no consigue llegar a un punto de encuentro si la morfología puede ser considerada por sí sola como una disciplina o debe siempre estar acompañada de la sintaxis. Al estudiar la morfosintaxis, estamos hablando de componentes lingüísticos para analizar tanto la estructura de cada palabra como de la oración. Figura 1. ▼ 2/19 Cuarto Quinto Nivel Introducción Para realizar un estudio más específico, es necesario poner énfasis y entender los siguientes apartados. ▲ ⬥ Semántica, significado gramatical y léxico de cada palabra. ⬥ Sintaxis, estructura y organización de las palabras dentro de la oración. ⬥ Fonética, prosodia, acento, pronunciación de cada palabra y sus variantes cuando una se enlaza con otra dentro de una oración o frase. Figura 1. ▼ 2/19 Cuarto Quinto Nivel 7.1.1. Constituyentes sintácticos Al hablar de constituyentes sintácticos, se hace referencia a una palabra y a la posición jerárquica que cumple dentro de la oración. ▲ Estos constituyentes no son únicos dentro de todas las oraciones, por el contrario, según su uso, es posible descomponerles en dos o más subsecuencias, cada una de estas brinda un nuevo constituyente, estos constituyentes suelen ser confundidos con sintagmas y en algunos libros los analizan bajo los mismos parámetros, sin embargo, su diferenciación se basa en: Sintagma Es un constituyente sintáctico, pero maximal, esto quiere decir que un sintagma es una proyección sintáctica de un núcleo sintáctico. Los núcleos sintácticos son el morfema o, en general, la palabra, que establece las propiedades sintácticas y las posibles combinaciones del sintagma al que pertenece dicho núcleo. Figura 2. ▼ 3/19 Cuarto Quinto Nivel 7.1.1. Constituyentes sintácticos Noam Chomsky es un lingüista, filósofo, pedagogo, politólogo, profesor, conferencista, él estableció cuatro núcleos sintácticos léxicos: ⬥ ⬥ ⬥ ⬥ ▲ (+N,+V) = adjetivo, adverbio (+N,-V) = nombre, pronombre (-N,+V) = verbo (-N,-V) = preposición En español, existen tres grupos de sintagmas tanto léxicos como nominales. Sintagma predicativo (-N) Indica que su núcleo se relaciona con diferentes sintagmas designativos. Se subdivide en sintagma verbal (verbo) y sintagma preposicional (preposición). Sintagma designativo (+N) Indica que su núcleo incluye un sintagma nominal (nombre, pronombre), adjetival (adjetivo), determinante (articulo) y adverbial (adverbio). Figura 2. ▼ 3/19 Cuarto Quinto Nivel 7.1.1. Constituyentes sintácticos Sintagmas especiales Indican que su núcleo incluye un sintagma de negación (polaridad negativa), complementante (coordinadores, cuestionadores, relativos) y de tiempo (verbos auxiliares). Los sintagmas se dividen en: ⬥ ⬥ ⬥ ⬥ ⬥ ▲ Sintagma nominal Sintagma adjetival Sintagma adverbial Sintagma verbal Sintagma preposicional Constituyente Un constituyente sintáctico es una palabra o una oración que tiene una jerarquía dentro de sí misma. No toda secuencia de palabras se puede identificar como constituyente sintáctico, estas necesitan enmarcarse en ciertos parámetros como son: Figura 2. ▼ 3/19 Cuarto Quinto Nivel 7.1.1. Constituyentes sintácticos Sustitución nominal Es posible sustituir el constituyente por un pronombre o proforma manteniendo el mismo significado. ▲ Sustitución convencional Es posible sustituir el constituyente por otra secuencia similar manteniendo la misma categoría jerárquica. Desplazamiento Es posible desplazar el constituyente al inicio sin que esto altere el significado. Aislabilidad Es posible analizar el constituyente de manera aislada al resto de las palabras cuando estas tienen sentido o dan respuesta a una pregunta específica. Reordenamiento Es posible reordenar los constituyentes dando lugar a nuevas oraciones con sentido lógico. Figura 2. ▼ 3/19 Cuarto Quinto Nivel 7.1.2. Morfología La morfología en la lingüística estudia la estructura interna de las palabras y las variaciones que se pueden presentar manteniendo la misma raíz que es única para cada palabra. Estas variaciones permiten clasificar las palabras en distintos grupos y unidades y, a la vez, crear nuevas palabras o variaciones. ¿Qué es la MORFOLOGÍA? La raíz de una palabra o lexema es la parte de la palabra que aporta el significado mismo de esta, y cuando se le añade afijos, varía en cuanto a su forma y grupo mas no su significado mismo; esta raíz puede ser compartida por varias palabras. https://www.youtube.com/watch?v=0H2fvcyTf3U 4/19 Cuarto Quinto Nivel 7.1.2. Morfología Los morfemas Los morfemas léxicos o lexemas existen en todas las lenguas como base de cada palabra, que pueden ser compartidos por distintas palabras conservando su significado. Ejemplo Lexema = (gat) Variaciones = gato, gatos, gata, gatitos, gatas Por otro lado, los morfemas gramaticales son las variaciones de una palabra dependientes de las restricciones gramaticales. No puede formarse, por ejemplo, gaticción, pues no existe la combinación de esa raíz con esa variación. Los morfemas son las unidades mínimas con un significado léxico o gramatical que no pueden dividirse en unidades más pequeñas con un significado diferente o el mismo significado. Los tipos de morfemas son: ⬥ Morfemas dependientes o trabados, los cuales necesitan de manera imprescindible de un lexema. ⬥ Morfemas independientes o libres, los cuales pueden aparecer de manera independiente. ⬥ Morfemas cero, los cuales existen como morfemas, pero no se reflejan gramaticalmente. Ej. Internet. Es singular femenino aún sin estar presente el artículo. 5/19 Cuarto Quinto Nivel 7.1.2. Morfología En cuanto a las alteraciones que una palabra experimenta por sus morfemas constituyentes, podemos dividirla en morfología flexiva y morfología léxica. Morfología flexiva Estudia las variaciones que pueden presentar las palabras en cuanto a diferentes características que modifican su significado global, pero no así el significado de la raíz de la palabra. 5/19 Cuarto Quinto Nivel 7.1.2. Morfología Morfología léxica Esta se dedica al estudio de la estructura misma de la palabra, permite la creación de nuevas unidades léxicas que son independientes o dependientes. Esta se divide en derivación y composición. 5/19 Cuarto Quinto Nivel 7.1.3. Sintaxis La sintaxis, a diferencia de la morfología que estudia la estructura interna de las palabras y cómo se forman nuevas, estudia el proceso mediante el cual las palabras se combinan para formar oraciones y frases. ¿QUÉ ES LA SINTAXIS? (EJEMPLOS - C… C… Larousse (2003) señala a la sintaxis como “la parte de la gramática que estudia la manera cómo se combinan y ordenan las palabras para formar oraciones”. Analiza las funciones que aquellas desempeñan, así como los fenómenos de concordancia que pueden presentar entre sí, (p. 139). Sintaxis estructural Se ocupa de la forma en que se conectan las palabras a fin de crear frases u oraciones. Estas conexiones estructurales se presentan de manera dependiente pues cada conexión determina ciertos elementos de la misma oración, es decir, si el sujeto es singular el verbo será singular. Este orden puede ser estructural, lineal o viceversa. https://www.youtube.com/watch?v=lBOzsiCe2nw ▼ 6/19 Cuarto Quinto Nivel 7.1.3. Sintaxis Sintaxis generativa Se ocupa de las relaciones, reglas, principios que determinan las combinaciones correctas a ser utilizadas para crear oraciones o conexiones lógicas. ¿QUÉ ES LA SINTAXIS? (EJEMPLOS - C… C… Sintaxis funcionalista Se ocupa de la explicación del lenguaje humano y la función que cumple como herramienta comunicativa. Para que esta comunicación se desarrolle, es necesario un proceso lógico y jerárquico de las palabras y de las conexiones a ser utilizadas. https://www.youtube.com/watch?v=lBOzsiCe2nw ▼ 6/19 Cuarto Quinto Nivel Autoevaluación 1. ¿Qué significa en griego “morfo”? Modificación. Modo. Forma. Pregunta 1 de 10 9/19 Cuarto Quinto Nivel Autoevaluación 2. ¿Qué es el sintagma? Un morfema sintáctico. Una proyección sintáctica. Un lexema sintáctico. Pregunta 2 de 10 10/19 Cuarto Quinto Nivel Autoevaluación 3. ¿Qué es un constituyente? Palabra o conjunto de palabras con jerarquía dentro de la oración. Una raíz que es única dentro de la palabra. Un sintagma que varía según su posición gramatical. Pregunta 3 de 10 11/19 Cuarto Quinto Nivel Autoevaluación 4. ¿En qué consiste el parámetro de desplazamiento? Un constituyente puede desplazarse al inicio sin que cambie su significado. Un constituyente puede desplazar a otro de igual jerarquía gramatical. Un constituyente puede ser cambiado por un sintagma según la jerarquía que ocupe. Pregunta 4 de 10 12/19 Cuarto Quinto Nivel Autoevaluación 5. ¿Qué estudia la morfología? Los sinónimos que se pueden reemplazar entre sí. Los cambios y las variantes de la oración. La estructura interna de las palabras. Pregunta 5 de 10 13/19 Cuarto Quinto Nivel Autoevaluación 6. ¿Pueden los morfemas subdividirse? Sí, porque pueden tener derivaciones. No, son la unidad mínima. Sí, porque son compuestos. Pregunta 6 de 10 14/19 Cuarto Quinto Nivel Autoevaluación 7. ¿Qué es la morfología flexiva? El estudio de la raíz de la palabra. El estudio de las variaciones de las palabras. El estudio de la palabra interna. Pregunta 7 de 10 15/19 Cuarto Quinto Nivel Autoevaluación 8. ¿Qué es la morfología léxica? El estudio de la estructura misma de cada palabra. El estudio general de las estructuras de las oraciones. El estudio específico de las variaciones de las conexiones entre palabras. Pregunta 8 de 10 16/19 Cuarto Quinto Nivel Autoevaluación 9. ¿Qué es la sintaxis? El estudio de las oraciones. El estudio de las palabras. El estudio de los conectores. Pregunta 9 de 10 17/19 Cuarto Quinto Nivel Autoevaluación 10. ¿Qué es la sintaxis funcional? El análisis del uso que se puede dar al lenguaje. El estudio de las funciones que cumple cada palabra. La estructura de la función que cumple cada palabra. Pregunta 10 de 10 18/19 Cuarto Quinto Nivel 1/20 Cuarto Quinto Nivel 8.1. La oración simple Las oraciones son enunciados que constan al menos de un verbo que tiene la capacidad de transmitir un mensaje completo de manera lógica. Algunas están constituidas de sujeto y predicado. El sujeto es de quien se habla en la oración y el predicado es de lo que se habla, aquí se encuentra el verbo. Entre las características de la oración están: · Transmite un mensaje lógico. · Posee una entonación propia. · Es independiente del resto del texto y, sin embargo, forma parte del mismo cuando se trata de un párrafo. Las oraciones simples son un grupo de palabras lógicamente ordenadas que se componen de un solo verbo. Se puede determinar que la oración es simple cuando el verbo está conjugado y es único; fácilmente se reconoce el sujeto y el predicado. Martha y Tatiana son mejores amigas. Sujeto Predicado Qué o quién Qué hace o qué es el sujeto 2/20 Las oraciones son enunciados que constan al menos de un verbo que tiene la capacidad de transmitir un mensaje completo de manera lógica. Algunas están constituidas de sujeto y predicado. El sujeto es de quien se habla en la oración y el predicado es de lo que se habla, aquí se encuentra el verbo. Entre las características de la oración están: · Transmite un mensaje lógico. · Posee una entonación propia. · Es independiente del resto del texto y, sin embargo, forma parte del mismo cuando se trata de un párrafo. Las oraciones simples son un grupo de palabras lógicamente ordenadas que se componen de un solo verbo. Se puede determinar que la oración es simple cuando el verbo está conjugado y es único; fácilmente se reconoce el sujeto y el predicado. Martha y Tatiana son mejores amigas. Sujeto Predicado Qué o quién Qué hace o qué es el sujeto Al hablar de un solo verbo, no se trata de una sola palabra ya que este verbo, al estar conjugado, puede depender de un verbo auxiliar como ha estado, estoy escribiendo, etc. Martha y Tatiana han sido mejores amigas. Sujeto Predicado Qué o quién Qué hace o qué es el sujeto Clasificar las oraciones simples en español, no ha sido tarea fácil debido a que existen diferentes formas de ordenarlas. Alternativa 1 Oraciones personales Esta clasificación está dada por el tipo de sujeto. Las oraciones personales siempre tienen sujeto que es fácilmente reconocido; sin embargo, este criterio ha sido debatido porque en las oraciones interrogativas, el sujeto puede ser omitido sin que deje de ser personal. La distinción del sujeto se torna difícil en algunos casos. Existen varios tipos de sujetos: el sujeto explícito, por ejemplo, cuando el sujeto está ubicado y es de fácil reconocimiento una vez que se establece la pregunta ¿quién? Sandra tiene un gato. ¿Quién tiene un gato? Sandra Sujeto explícito El sujeto elíptico puede ser omitido ya que está implícito en la conjugación del sujeto. Responde a la pregunta ¿quién? Soy feliz. ¿Quién es feliz? Yo Sujeto elíptico El sujeto indeterminado es omitido debido a que se desconoce el mismo, puede reemplazarse con sujetos como alguien, pronombres personales, pronombres indeterminados. Este tipo de sujeto es utilizado en voz pasiva, el énfasis está en la acción o en el resultado de la acción. Quemaron el bosque. ¿Quién quemó el bosque? Alguien, ellos, alguna persona, ella, el, (¿?) Sujeto indeterminado Oraciones impersonales Estas oraciones no tienen un sujeto explícito o lógico que se pueda determinar de manera inmediata dentro de la oración. La distinción del sujeto se torna difícil y no siempre es posible responder la pregunta ¿quién? Estas oraciones impersonales se subclasifican en: Unipersonales o naturales Este tipo de oraciones hace mención a fenómenos naturales. Algunos de estos verbos se pueden utilizar de manera simbólica al hablar de otros acontecimientos no atmosféricos como, por ejemplo, llovieron piedras en la manifestación de estudiantes. Esta oración no es unipersonal, pues la palabra piedras es la que brinda la conjugación al verbo llovieron y no es posible utilizar llovió piedras en la manifestación; por lo tanto, el sujeto está conjugado y no pertenece a esta clasificación. Granizó fuerte en Chicago. ¿Quién? ---Sujeto unipersonal o natural Gramaticalizadas Este tipo de oraciones utiliza los verbos “ser, hacer y haber” y pueden estar conjugados; sin embargo, el sujeto es impersonal pues no se puede dar respuesta a la pregunta ¿quién? Es importante hacer deporte. ¿Quién? ---- Sujeto gramaticalizado Impersonales reflejas Este tipo de oraciones utiliza un sujeto impersonal general que no se refiere a una persona en específico ni singular ni plural, exclusivamente utiliza la tercera persona del singular. El sujeto es impersonal ya que no se puede dar respuesta a la pregunta ¿quién? En Quito se usa poncho. ¿Quién? ---Sujeto impersonal reflejo Ocasionales Este tipo de oraciones utiliza la tercera persona del plural, pero no se la menciona de manera directa. El sujeto es impersonal porque no se puede dar respuesta a la pregunta ¿quién? Le han dado un regalo. ¿Quiénes? ---Sujeto ocasional Alternativa 2 Oraciones enunciativas Estas oraciones se distinguen porque afirman o niegan algo de manera explícita. En las que niegan es usual el uso de sintagmas de negación como nunca, jamás, no, nada, nadie. El perro está bañado. ¿Quién está bañado? El perro Acción explícita afirmativa El perro nunca está bañado. ¿Quién nunca está bañado? El perro Acción explícita negativa Oraciones no enunciativas Estas oraciones ni afirman, ni niegan la acción o la persona, por lo general, expresan sentimientos del hablante. Se subdividen en: Oraciones exhortativas. Los verbos en este tipo de oraciones son imperativos cuando la oración es afirmativa y subjuntivos cuando la oración es negativa. Ve a comprar. Mandato Verbo imperativo Exhortativo afirmativo Usa mascarilla, por favor. Ruego Verbo imperativo Exhortativo afirmativo No salgas hoy. Prohibición Verbo subjuntivo Exhortativo negativo Oraciones desiderativas. Estas oraciones expresan deseo. Ojalá venga Petro. Deseo Función emotiva o expresiva Oraciones dubitativas. Estas oraciones expresan duda. Tal vez seas tú. Duda Uso de locuciones adverbiales Función emotiva o expresiva Oraciones exclamativas. Estas oraciones formulan exclamaciones, tienen una puntuación exclusiva ¡!. ¡Qué hermosura! Exclamación Uso de pronombres, adjetivo y adverbios exclamativos Función emotiva o expresiva Oraciones interrogativas. Estas oraciones formulan preguntas. Tienen signos de puntuación (¿?) y entonación exclusiva. Se dividen en parciales, totales, directas e indirectas. ¿Quién está aquí? Pregunta por el sujeto Una parte del contenido está omitida que es la motivación de la pregunta. Oración interrogativa parcial ¿Te gusta el chocolate? Pregunta de contestación total Todo el contenido está omitido que es la motivación de la pregunta. La respuesta se orienta a sí o no. Oración interrogativa total ¿Tienes frío? Oración en forma de pregunta La respuesta puede variar de SÍ o NO, no empieza con adverbios interrogativos. Oración interrogativa directa Andrés pregunta si quieres salir en la tarde. Plantea elección Puede iniciar como un parafraseo de pregunta y espera una respuesta. Oración interrogativa indirecta Oraciones realizativas. Estas oraciones expresan idea general de algo. Te prometo que no salí. Juramento No es descriptiva, sino que genera es un acto de promesa o juramento. Función emotiva o expresiva Alternativa 3 Oraciones copulativas Estas oraciones tienen un predicado nominal, esto significa que el verbo exige un componente para tener un significado completo. Los verbos copulativos son: parecer, estar, ser, semejar. El pastel está quemado. ¿Cuál es el atributo? quemado Sintagma nominal que atribuye una cualidad. Oraciones predicativas Estas oraciones tienen un predicado verbal, es decir, que el verbo tiene la cualidad de perífrasis verbal, todos los verbos son predicativos a excepción de los copulativos. Estos verbos predicativos tienen la cualidad de expresar por sí mismos una idea completa. Se dividen en transitivos, los que pueden usar objeto directo que es un sustantivo en el cual recae la acción, e intransitivos los que no necesitan objeto directo. Fabricio cocina un pastel. Verbo transitivo Puede complementarse con un objeto directo Oración predicativa con objeto directo Fabricio baila. Verbo intransitivo No necesita o no puede usar objeto directo Oración predicativa sin objeto directo Oraciones transitivas Estas oraciones necesitan un objeto directo que es modificado o recae directamente su acción. El perro mordió la alfombra. ¿Sobre quién recae la La alfombra acción? Transitiva la acción recae en el objeto directo Oraciones reflexivas Estas oraciones necesitan pronombres reflexivos para indicar que el sujeto realiza una acción que recae en sí mismo. Gabriel se compró un auto. ¿Quién realiza la acción? Gabriel ¿En quién recae la acción? Gabriel Pronombres reflexivos: me, te, se, nos. Oraciones recíprocas Estas oraciones tienen predicado en el cual el verbo expresa reciprocidad o mutua realización entre dos o más sujetos. Camila y Valentina se extrañan mucho. ¿Quién extraña a quién? Camila a Valentina y Valentina a Camila. Verbo conjugado en plural Oraciones pasivas Estas oraciones tienen la característica de que el sujeto es pasivo, es decir, es quien recibe la acción del verbo, no quien la realiza. El auto es reparado. ¿Quién realiza la acción? No se sabe. ¿Quién recibe la acción? El auto Oración pasiva cuando existe un objeto directo o indirecto Cuarto Quinto Nivel 8.1.1. Elementos de la oración Los elementos de la oración son sujeto y predicado. El núcleo del sujeto es el sustantivo y el núcleo del predicado es el verbo. Existen varias palabras que pueden ser utilizadas tanto en el sujeto como en el predicado, algunas, sin embargo, son exclusivas del predicado. Artículo En español, el artículo es utilizado para expresar género, número de un sustantivo. Puede ser utilizado en el sujeto y en el predicado. Se subdivide en: · · Artículos definidos · El sol es fuego. · La luna es un satélite. · Los árboles son hermosos. · Las rosas huelen perfumadas. Artículos indefinidos · Un niño corre en el parque. Una niña corre en el parque 3/20 Los elementos de la oración son sujeto y predicado. El núcleo del sujeto es el sustantivo y el núcleo del predicado es el verbo. Existen varias palabras que pueden ser utilizadas tanto en el sujeto como en el predicado, algunas, sin embargo, son exclusivas del predicado. Artículo En español, el artículo es utilizado para expresar género, número de un sustantivo. Puede ser utilizado en el sujeto y en el predicado. Se subdivide en: · · Artículos definidos · El sol es fuego. · La luna es un satélite. · Los árboles son hermosos. · Las rosas huelen perfumadas. Artículos indefinidos · Un niño corre en el parque. · Una niña corre en el parque. · Unos niños corren en el parque. · Unas niñas corren en el parque. Sustantivo Es la palabra que se utiliza para nombrar algo. En español, tienen género y número. El sustantivo debe coincidir con el artículo en caso de usarse y con el verbo al ser conjugado. Se divide en: · Masculinos y femeninos o Las niñas son educadas. o Los niños son educados. · Singulares y plurales o La casa es verde. o Las casas son verdes. · Propios y comunes o El mantel está lavado. (común) o IPhone es una buena marca de celular. (propio) · Abstractos y concretos o El amor es incalculable. (abstracto) o La computadora no sirve. (concreto) · Individuales y colectivos o La abeja me picó. (individual) o El enjambre se cayó del árbol. (colectivo) · Contables e incontables o Necesito una silla o tres asientos. (contable; singular y plural) o Necesito mucha agua. (incontable) · Primitivos y derivativos o La construcción está por terminar. (primitivo) o El constructor necesita material. (derivativo) · Compuestos o El guardachoque del carro debe ser cambiado. o Necesito un sacapuntas. Adjetivo o frase adjetiva Son características que se utilizan para describir algo. Por lo general, se utilizan para dar cualidades a un sustantivo. o La hermosa mariposa cruzó el jardín. o El ave es hermosa. · Adjetivo posesivos o Refleja posesión utilizado en el predicado (Este auto es mío). · Frases adjetivas; adverbio más adjetivo o Mi padre conduce muy rápido. · Adjetivo más complemento o Mónica, cansada de escuchar tonterías, salió de la habitación. Verbo Es la acción que se realiza en la oración. Esta acción es conjugada y tiene relación con el sujeto en número, aspecto y puede expresarse en diferentes tiempos. Es el núcleo del predicado. o Ella canta todos los días. o Ella cantó ayer. o Ella está cantando en su habitación. o Ella ha cantado desde hace una hora. Adverbio Es la palabra que complementa al verbo y se utiliza en el predicado. Sirve para dar información sobre el lugar, la cantidad, el modo, el tiempo, la frecuencia, puede expresar duda, afirmación, negación, etc. No varía en género ni número. · Me gusta mucho el chocolate. (cantidad) · Nunca salimos juntos. (tiempo) · El armario está detrás de la puerta. (lugar) · Así está mejor. (modo) · Quizá Gina nos visite mañana. (duda) · ¿Por qué no sabemos eso? (interrogación) · ¡Cuánto te extraño! (exclamación) Pronombre Los pronombres se dividen en pronombres personales, objetivos, posesivos. · Pronombres personales o Son usados como sujeto de la oración: Él salió corriendo. · Pronombres objetivos o Reciben la acción del verbo, se utilizan como objeto directo: Yo te amo. · Pronombres posesivos o Expresan propiedad de algo: Mi auto chocó. Este es mi auto. Conjunciones Son nexos que permiten unir palabas, oraciones o proposiciones en una sola sin dividir con punto o iniciar una nueva oración o idea. Existen conjunciones coordinantes, conjuntivas y adversativas. Preposiciones Es una palabra invariable, no tiene género ni número, que complementa a una palabra o enlaza ideas para que la oración tenga sentido. En español existen 23 preposiciones. Objeto directo Palabra que recibe directamente la acción del verbo, puede ser un sustantivo o una forma pronominal. · Jésica escribió una carta. · José lo vio. Objeto indirecto Palabra que recibe indirectamente una acción del verbo, existen verbos que admiten ambos objetos directo como indirecto. · Jésica escribió una carta a su mamá. · El jefe le dio un ascenso a Daniela. Complemento circunstancial Complementa la idea en el predicado por medio de un modo, tiempo, lugar, causa, finalidad, cantidad, o compañía. · Alejandro escribió rápidamente tres cartas ayer. · Patricia lavó los platos para poder cocinar bien. Aposición Modifica el sujeto de la oración brindando mayor detalle del mismo, puede ser omitido sin alterar el significado de la oración y va entre comas. · Nancy, mi madre, está almorzando este momento. · Los niños, quienes se graduaron, no necesitan fiesta. · Cecilia, tu amiga, llamó ayer a mi casa. Cuarto Quinto Nivel 8.1.2. Sintagma nominal y sintagma verbal Los sintagmas. El Sintagma Nominal - A… A… Sintagma nominal Sintagma verbal Cuenta con un sustantivo como núcleo. El sintagma nominal (SN) tiene como núcleo un sustantivo, por ejemplo, las casas; un pronombre, por ejemplo, nosotros; o, una palabra sustantiva, por ejemplo, el claro. https://www.youtube.com/watch?v=9xlFVJmqFdA 4/20 Cuarto Quinto Nivel 8.1.2. Sintagma nominal y sintagma verbal El Sintagma Verbal - Análisis sintáctico … Sintagma nominal Sintagma verbal Cuenta con un verbo como núcleo. Siendo esta la parte más importante de la oración. Tiene sentido por sí mismo de manera independiente en la oración. https://www.youtube.com/watch?v=yY_VsOXnxPk 4/20 Cuarto Quinto Nivel 8.2. La oración compuesta Las oraciones compuestas son aquellas que están compuestas de dos o más oraciones enlazadas entre sí por medio de un coordinador o un subordinado. Estas se caracterizan por tener dos núcleos verbales. 8.2.1. Oraciones yuxtapuestas Estas oraciones es la unión de una oración con sentido independiente más otra dependiente sintácticamente para que tenga sentido. La puntuación es la que hace que estas oraciones tengan sentido. ▪ Te necesito urgente, ¡ven! ▪ Los niños están despiertos; siguen viendo la televisión. ▪ Alex te necesita: repitió el semestre. 5/20 Cuarto Quinto Nivel 8.2.2. Oraciones coordinadas Son aquellas oraciones que se unen por medio de un conector y tienen un sentido claro. Cada una es independiente de la otra y cada una puede ser entendida si se la separa de la otra. Por ejemplo, Ana limpia la casa y Leonardo lava los platos. Ana limpia la casa; Leonardo lava los platos las dos oraciones tienen sentido de manera independiente, para ser unidas se utiliza un coordinador “y” y tienen sentido también. Las oraciones coordinadas se dividen en: Oraciones copulativas Permiten agregar o adicionar información sea afirmativa o negativa. ⬥ Comiste pastel y dijiste gracias. ⬥ Comiste pastel y no dijiste gracias. Oraciones disyuntivas Son las oraciones que se expresan para exponer elección u opciones. ⬥ Quieres pastel o prefieres empanada. ⬥ Vamos a comer o salimos al centro comercial. 6/20 Cuarto Quinto Nivel 8.2.2. Oraciones coordinadas Oraciones adversativas Permiten exponer contradicción entre las oraciones. ⬥ Me gusta el chocolate, a pesar de ello, no puedo comerlo. ⬥ Valentina siempre hace ejercicio, excepto los domingos que sale con su familia. Oraciones distributivas Son las que unen dos oraciones distribuyendo atributos individuales a cada uno. ⬥ Puedes festejar tu cumpleaños; ya sea yendo a la discoteca o bien viajando a Galápagos. Oraciones explicativas Son oraciones que unen dos ideas en las que una es la causa y otra la consecuencia de la misma. ⬥ No me gusta el arroz porque sube mis triglicéridos. ⬥ Estudié fuerte, de modo que puedo disfrutar de mis vacaciones. 6/20 Cuarto Quinto Nivel 8.2.3. Oraciones subordinadas Son oraciones compuestas que se unen una con sentido completo e independiente con otra dependiente que sirve para esclarecer o aportar mayor información. Se clasifican en: Oraciones subordinadas sustantivas Son oraciones subordinadas que van unidas por un verbo infinitivo o un nexo, que puede ser reemplazado por un pronombre demostrativo neutro. ⬥ No me voy hasta que no me digas qué pasó. ⬥ Preguntaste que fue lo que sucedió ayer. Oraciones subordinadas adjetivas Son subordinaciones que cumplen la función de dar una característica, por lo que pueden ser reemplazadas por un adjetivo. ⬥ Carlos, quien siempre sonríe, vino a buscarte. ⬥ Carlos el sonriente vino a buscarte. 7/20 Cuarto Quinto Nivel 8.2.3. Oraciones subordinadas Oraciones adverbiales Son subordinaciones que expresan una circunstancia puntual para dar mayores detalles a la oración principal mediante un adverbio. Se subdividen en: ⬥ ⬥ ⬥ ⬥ ⬥ Subordinadas concesivas Subordinadas causales Subordinadas condicionales Subordinadas finales Subordinadas consecutivas 7/20 Publicat a: 1- (2004) Textos de didáctica de la Lengua y la Literatura, 37, 36-51. 2- Camps, A.; Zayas, F. (coords.) (2006) Secuencias didácticas para aprender gramática, pp. 193-210. Barcelona: Graó La enseñanza de la gramática: pensar la oración Marta Milian. UAB Resumen: A partir de la caracterización del conocimiento gramatical de los alumnos, se propone la reflexión a lo largo de dos ejes: las situaciones de enseñanza y aprendizaje de la gramática y los objetivos y contenidos de gramática en el curriculum, centrados en el concepto de “oración”. El interés de la actividad metalingüística de los alumnos, implicados en secuencias didácticas que promueven y permiten el contraste de representaciones e interpretaciones sobre el funcionamiento de los elementos lingüísticos, se dibuja como una vía útil para mejorar la enseñanza de la gramática. Palabras clave: reflexión gramatical, actividad metalingüística, secuencia didáctica, oración. Características del conocimiento gramatical de los alumnos1 “Las funciones gramaticales de la oración (sujeto, complemento directo, indirecto, circunstancial, etc.) son conceptos que nos son muy familiares. Sin embargo, es poco habitual encontrar personas que no duden a la hora de identificarlas, sobretodo si analizan textos reales”.2 (Cuenca, 2003:51) A2. A1. A2. A1. A3. A1. A2. esto es complicado e:/ lo de la “oración”\ muy chungo\ @@@ bueno de momento ponemos “está formada por un suje- por un sujeto y predicado”\ “por un sujeto =y un predicado”\= =y un “predicado”\= “predicado verbal”\no/ da igua:l\ Los resultados de investigaciones recientes sobre los conocimientos gramaticales de los alumnos apuntan la idea de que las informaciones teóricas que reciben en clase no 1 El contenido de este artículo se inscribe en el proyecto de investigación “El razonamiento lingüístico de los escolares” (DGI BSO-2001-1911), coordinado por Anna Camps. 2 Las citas de originales no escritos en castellano son traducción de la autora del artículo. 1 contribuyen a construir un conocimiento organizado sobre la lengua que usan, ni tampoco un conocimiento compartido entre ellos y con el profesor acerca de los objetos lingüísticos que manejan. Y, sin embargo, en las actividades que se les proponen, utilizan el metalenguaje gramatical con extremada soltura y conocen o se han apropiado de un conjunto de términos científicos propios de las teorías lingüísticas que informan los contenidos gramaticales del currículum. ¿En qué consiste el saber gramatical de nuestros alumnos? ¿Qué tipo de saber gramatical debería ser objeto de enseñanza y aprendizaje en los niveles de enseñanza obligatoria? Estas dos preguntas nos llevan a la necesidad primera de clarificar el significado del término “gramática”. Es evidente que los hablantes de una lengua usan la gramática en sus producciones verbales, es decir, combinan los elementos lingüísticos de manera adecuada a la situación de uso y de acuerdo con las reglas de funcionamiento del sistema de la lengua en cuestión. Es evidente, asimismo, que son capaces de controlar estas reglas de funcionamiento en sus propias producciones y también en las de los demás, y son capaces de darse cuenta de problemas, errores o equivocaciones en el uso del lenguaje propio y ajeno. Lo que no es tan evidente, o por lo menos no es tan generalizado, es que los hablantes de una lengua, por el mero hecho de serlo, sean capaces de subsanar estos errores a partir del análisis y la explicitación del problema y su solución. El saber gramatical de los hablantes -nuestros alumnos incluidos- es, en el sentido indicado, operativo en tanto que incide sobre los usos lingüísticos y contribuye a su control. Pero no es únicamente el dominio del uso lo que se persigue en la enseñanza de la gramática, sino un conocimiento declarativo sobre la naturaleza y el funcionamiento de los elementos lingüísticos, ya sea con fines normativos, ya sea con la intención descriptiva del objeto del saber, compartida con otros conocimientos en otras áreas, como la composición química de determinadas substancias, la clasificación de los animales en determinadas categorías, o el funcionamiento de los volcanes. A estos objetivos debe añadirse, asimismo, la idea que este saber contribuye a mejorar el uso. La enseñanza de la gramática, al igual que la enseñanza de otros saberes objeto de aprendizaje, generalmente ha prescindido de este saber gramatical particular de los hablantes, y ha marcado su ritmo a base de la transmisión de conocimientos aportados por las sucesivas corrientes en la lingüística del siglo XX y, en las últimas décadas, por el conjunto un tanto heterogéneo de las denominadas ciencias del lenguaje, desde la sociolingüística al análisis crítico del discurso, pasando por la pragmática y la lingüística textual, añadiendo a todo ello la exigencia de la gramática normativa como elemento imprescindible en la formación lingüística de los futuros ciudadanos. El cuestionamiento tanto de los contenidos como de las maneras de enseñar gramática ha sido abordado desde perspectivas y posicionamientos distintos, tanto desde la lingüística como desde la didáctica de la lengua (entre otros: Bosque, 1988; Bronckart, 1985; Camps, 1986; Castellà, 1994; Cuenca, 1992; Camps i Colomer, 1998; Hernanz, 1997; Zayas, 1993, 2 1994)3. Pero en pocas ocasiones se ha investigado sobre los procedimientos y resultados de la enseñanza de la gramática, ni sobre cómo se construye el saber gramatical de los hablantes a partir del saber personal que aportan a las situaciones de enseñanza y aprendizaje. De las investigaciones realizadas sobre los conocimientos gramaticales de los alumnos podemos apuntar lo siguiente (Camps, 2000): Los conocimientos gramaticales de los alumnos constituyen un conglomerado de elementos distintos: saberes “escolares” memorizados, saberes personales fruto de la reflexión, saberes intuitivos, saberes bien de orden formal, bien de orden lógicosemántico. Los procedimientos elaborados para la construcción y operatividad de estos saberes no son estables ni generalizables, y a menudo tienen un campo de aplicación limitado. Se constatan las dificultades para recuperarlos en situaciones distintas a aquellas en las que los han aprendido; también se constatan las dificultades para consolidarlos a lo largo de una etapa educativa. Los conceptos gramaticales que los alumnos aprenden pasan por el filtro de procedimientos personales. Dichos procedimientos –de identificación, por ejemplopueden ser muy diversos. Se pueden basar en justificaciones referidas a la forma, al significado, al lugar que ocupa una palabra en el texto o en la frase, a la relación con la enunciación, a la relación con paradigmas memorizados. Estas consideraciones nos sitúan de manera clara frente a un dilema conocido, aunque no abordado desde la perspectiva global y sistemática de la situación de enseñanza y aprendizaje: ¿Cómo conciliar la gramática implícita y la gramática explícita? El espacio entre estos dos tipos de conocimientos sobre la lengua se puede recorrer de distintas maneras: la imposición del conocimiento formal –el metalenguaje- sin considerar el conocimiento metalingüístico individual puede ser un camino que no contribuya a construir conocimiento sobre la lengua. E, inversamente, el hecho de prescindir del conocimiento formal del lenguaje, de la gramática explícita, puede repercutir sobre la competencia en los usos lingüísticos y discursivos de los alumnos, sobretodo en el ámbito del lenguaje escrito y en el ámbito del aprendizaje de nuevas lenguas4. La relación entre el que aprende y el contenido de la enseñanza no se produce de manera automática sino a partir de la intervención, de la mediación de unas actividades o unos agentes que pongan a disposición del aprendiz la oportunidad de observar, de manipular y de analizar estos contenidos. No solamente las actividades que se propongan han de poder generar esta actitud de observación y de descubrimiento, de indagación, en definitiva, sino que es necesario asimismo promover un planteamiento de estas actividades que 3 No es objeto de este artículo tratar de los procesos de transposición didáctica de las diversas teorías lingüísticas en el ámbito de la enseñanza de la gramática. Para profundizar en esta línea, véase Camps i Ferrer, 2000; Camps, 2003b, González Nieto, 2001. 4 En relación a los usos del lenguaje escrito, los primeros estudios sobre las operaciones de revisión de Bartlett (1982) y Scardamalia & Bereiter (1987), citados en Camps (1994), ponen de manifiesto la necesidad de distanciarse del texto y observarlo para detectar, diagnosticar y corregir. Los conocimientos gramaticales necesarios para cada una de estas operaciones son de naturaleza distinta. 3 desencadene el intercambio entre los aprendices, o entre los aprendices y el profesor y que permita la interacción entre los conocimientos individuales que se ponen en juego en una situación compartida. La interacción durante la realización de las actividades contribuye a desencadenar el comentario sobre la actividad y sobre los elementos que la constituyen. Estamos hablando de promover la actividad metalingüística como procedimiento de distanciación del objeto y de observación, manipulación y reflexión sobre el mismo: qué es, cómo actúa, en relación a qué, en qué condiciones, etc. En lugar de basarse en la transmisión de definiciones, categorizaciones y reglas, la vía de problematizar los datos lingüísticos, de poner en cuestión las nociones aprendidas y de plantearse interrogantes e indagar a partir de un corpus o de una definición memorizada y contrastarla con la evidencia del uso puede contribuir a la manifestación de los conocimientos e intuiciones implícitas y a su vez a la elaboración compartida del conocimiento sobre el funcionamiento y el comportamiento de los elementos lingüísticos en distintos contextos. Veamos un fragmento de una situación de clase, en el que tres alumnos discuten sobre si el enunciado Han pasado tantos años y aún siento una humedad cálida y vergonzosa resbalando por mis piernas es una oración o no. 47. A2 48. A3 49. A1 50. A2 51. A3 52. A2 53. A1 54. A3 55. A1 56. A3 57. A1 58. A2 bueno\qué hacemos al final/la damos como una “frase” entera/ “compuesta”/ o por separado/ (muy bajito)XXX claro\pero yo\ lo que puedo decir es que tenemos una dudanosotros ninguno XXX\ sabes a lo que me refiero/ o sea es difícil\pero es queyo lo—yo lo— yo la haría “compuesta”\ cuando nos— cuando nos— yo la dejaría así\ cuando trabajamos— cuando trabajamos en una “oración” que tenía XXX y acaba en un punto\ al final decíamos que todo era una “oración” porque la definición de “oración” es un conjunto— bueno pero era con “significado propio” y tal\ (..) pero claro\ esto si lo cortas tiene “significado propio”\ (..) yo diría que esto es una “oración” pero que está “compuesta” y que se puede dividir en dos “oraciones”\ pero- (..) no deja de ser una “oración compuesta” porque una “oración” puede tener dos— dos— verbos\ yo creo que es “compuesta”\ e:/ yo la haría toda una “oración”\ Estos tres alumnos de tercero de E.S.O. combinan sus conocimientos de orden morfológico y sintáctico para determinar los límites y la definición de oración –a partir de la presencia o ausencia de verbo- con otros conocimientos de orden semántico, un tanto confusos a pesar de utilizar el metalenguaje aprendido, puesto que el hecho de “tener significado propio” no se manifiesta como un punto de referencia claro. Aparecen asimismo otros términos 4 aprendidos, oración compuesta, frase entera, que les sirven para compartir la actividad, pero que no les ayudan a resolver el dilema, que sigue abierto. Pero, sobretodo, aparece también algo a lo que deberíamos prestar una atención preferente: la duda, junto con las distintas representaciones de cada uno de los interlocutores, esbozadas tímidamente o de manera poco explícita, y por distintas razones, de entre las que podríamos apuntar las siguientes: la falta de conocimientos, la falta de argumentos adecuados a la discusión, la falta de objetivos o implicación para la discusión, la poca experiencia en el hecho de discutir, la necesidad de llegar a un acuerdo para cumplir con la tarea escolar, la presión intuida de dicha tarea escolar… Podríamos añadir a esta lista otros elementos a poco que nos adentráramos en el análisis de la situación; por el momento, sin embargo, queremos destacar uno sólo de estos aspectos: la posibilidad de avanzar a partir de la puesta en común de conocimientos y pareceres en una tarea de análisis sobre un texto 5. Esta posibilidad de observar y razonar a partir de los conocimientos de cada uno, de sus representaciones y de sus argumentos, de reflexionar ante el objeto “oración”, en definitiva, requiere de unas condiciones determinadas para llevarse a cabo. No se trata únicamente de proponer actividades de observación y manipulación que promuevan la capacidad de reflexión de los alumnos y que les orienten en la formulación de un modelo de análisis, o en la aceptación de alguno de los modelos de análisis de las teorías gramaticales (Hernanz, 1997); se trata, además, de vencer la resistencia a una determinada manera de concebir la enseñanza y el aprendizaje de la gramática –y por extensión la de cualquier materia- no solamente por parte de los alumnos sino por parte del mundo educativo: instituciones administrativas y escolares, profesores, alumnos, y también familias y sociedad en general. Es urgente llevar a cabo una revisión de las ideas que subyacen a los términos “enseñar” y “aprender”, una revisión que impregne y trascienda el ámbito de los agentes de la educación para cumplir con las exigencias de la sociedad del futuro, tantas veces invocadas como justificación de cambios y reformas que, inexplicablemente, –o, paradójicamente, de manera explicable según los estudios sociológicos (Bourdieu, entre otros)- sólo llegan a los gestos superficiales –cambios curriculares, agrupaciones de alumnos, propuestas de actividades, sistemas de calificación- y no tienen la fuerza necesaria para generar cambios sustantivos en las concepciones básicas de la educación. Desde la psicología del desarrollo, desde la psicología de la educación, desde las didácticas de las diferentes disciplinas numerosas voces autorizadas y reconocidas en el ámbito de las ciencias sociales y humanas han puesto de manifiesto la importancia del entorno de aprendizaje –en el sentido social o cultural, relativo al comportamiento de los congéneres-; la importancia de la mediación formativa en la elaboración del conocimiento, y la importancia de los procesos de interiorización en la apropiación de dicho conocimiento (Bronckart, 2001). Es en este sentido que debemos dirigir los esfuerzos conjuntos de los agentes educativos, no únicamente en la formación inicial y permanente de nuestro profesorado sino también en la difusión y extensión de esta cultura del aprendizaje y de la enseñanza, que necesariamente ha de alcanzar a la cultura social de la educación escolar de manera operativa y eficaz6. 5 Se trata de un fragmento de La lengua de las mariposas, de Manuel Rivas. Se plantea aquí otra cuestión que únicamente apuntamos como línea de actuación posible, puesto que trasciende el marco de la enseñanza de la gramática y el marco de este artículo. Nos referimos a los procedimientos de extensión de esta concepción sobre la elaboración y la apropiación de saber en contextos 6 5 El concepto de oración7 Contrariamente a lo que podríamos creer a juzgar por la importancia del concepto de oración en las teorías gramaticales y en su transposición a la enseñanza de la lengua, la noción de oración tiene una antigüedad relativa. Séguin (1993)8 sitúa su aparición a principios del siglo XVIII y su propagación decisiva a lo largo del siglo XIX, a causa de la voluntad de racionalizar la actividad discursiva junto con el interés por la generalización de la enseñanza del lenguaje escrito. En un momento inmediatamente anterior en el tiempo, aunque especialmente fructífero en relación al nacimiento de la reflexión lingüística del siglo XX, es importante notar que la oración tiene un papel reducido en la gramática de Port-Royal, que basa su estudio en las partes del discurso. También es relevante su ausencia en los estudios de lógica y retórica de esta misma época, basados asimismo en el orden de las palabras en el seno de la proposición, compuesta de sujeto y predicado. Se produce, pues, una primera confrontación entre la noción de proposición y la noción de frase9, unidad que se analiza en términos de rección sintáctica y de los elementos que la constituyen. Hernanz y Brucart (1987) señalan la aparición de la oración como unidad gramatical abstracta a partir de los planteamientos de la gramática generativa, que sitúa el concepto de oración como el “símbolo inicial del sistema de reglas de que consta la gramática [con un] status teórico semejante al de un axioma” (49), formulado como una hipótesis que permite predecir los enunciados “potenciales” de una lengua. A finales del siglo XX esta concepción de oración se pone en cuestión junto con la evidencia de la insuficiencia de la lingüística oracional para tratar de los fenómenos de discurso, sobretodo los relacionados con la cohesión textual. A lo largo de su periplo en la evolución de las teorías gramaticales, el concepto de oración ha sido definido a partir de criterios diferentes. En el cuadro siguiente aparecen sintetizados (Béguelin, 2000): Tipo de criterio Semántico a) semántico lógico Elementos constitutivos de la Propiedad funcional externa oración sujeto y predicado “sentido completo” educativos a partir de los tres ejes citados: el entorno o la situación de aprendizaje y la representación que de ella tienen los participantes, la mediación para la construcción de conocimiento y los procesos de interiorización. Justificar esta posición con palabras, con teorías, con demostraciones basadas en experimentaciones reales no es suficiente, es preciso hacerla operatoria, convertir el teorema en acto, vivirlo en forma de experiencia en el acto de enseñar y en el acto de aprender, e interiorizarlo como procedimiento de actuación (Vergnaud, 1996). 7 Utilizamos el término oración para designar a la unidad abstracta y teórica de base que se toma como punto de partida de la descripción gramatical en los contenidos de enseñanza de la gramática. 8 Citado por Béguelin (2000) 9 El término frase aparece en el Renacimiento con un sentido léxico, y se mantiene este significado en vocablos como paráfrasis o fraseología. En las gramáticas escolares este término es a menudo utilizado como sinónimo de oración tal como la hemos definido en este artículo. Por otra parte, en las gramáticas escolares el término frase puede recubrir otros elementos, distintos de oración y con una variación amplia (Hernanz y Brucart , 1987). 6 b) psicológico c) pragmático Sintáctico Prosódico Gráfico modus y dictum secuencia organizada de signos SN + SV secuencia marcada entonativamente secuencia organizada de palabras escritas “sentido completo” valor de acto autonomía sintáctica compleción melódica, demarcación por pausas compleción gráfica (mayúscula-punto) La observación de los tipos de criterios nos puede dar la medida de la dificultad de definir el concepto de una manera operativa, sobretodo si consideramos que esta definición corresponde a una noción abstracta, que únicamente conviene a las llamadas oraciones tipo u oraciones canónicas, una idea de oración que no se corresponde necesariamente con las oraciones que aparecen en el discurso y que responden a la práctica cotidiana de los hablantes. Esta dualidad representa una dificultad añadida a la enseñanza de la gramática, que intenta resolverla con la diferenciación entre oración y enunciado. Estos dos conceptos, sin embargo, no siempre se han delimitado de manera clara, y han suscitado una polémica irreconciliable entre los defensores del criterio nocional o semántico y los defensores del criterio sintáctico para definir a la oración. Es evidente que el criterio nocional, basado en la idea del “sentido completo”, acerca la noción de oración a la de enunciado y tiende a borrar los límites marcados por la existencia de un verbo flexionado, como apuntan Hernanz y Brucart (1987) a partir de los ejemplos, entre otros: (1) El Etna ha entrado en erupción y (2) ¡Qué maravilla!. En efecto, vemos que tanto el primer ejemplo como el segundo tienen sentido completo, aunque el segundo carece de verbo. Se han apuntado numerosas explicaciones para defender el valor de oración de enunciados como (2), como el papel del contexto lingüístico o extralingüístico o la elipsis interpretativa, aunque por otra parte también se podría alegar la dificultad de otorgar sentido completo a frases con verbo, como en el siguiente ejemplo (3) Se lo he prometido, que requiere también del contexto para su interpretación, con lo cual el mismo argumento serviría para defender posiciones opuestas. Podríamos aportar ejemplos que cuestionan cada uno de los criterios que aparecen como válidos para definir el concepto oración, como hacen Campana (2002), Hernanz y Brucart (1987) o Cuenca (1996), entre otros10. Nuestra intención es poner de relieve la dificultad de un concepto que podríamos decir sin temor a equivocarnos que se maneja en las situaciones de enseñanza y aprendizaje con pocas precauciones, con lo que se contribuye, quizás, a un Cada uno de estos autores analiza la cuestión desde su propia perspectiva, Campana desde el punto de vista didáctico, y Hernanz y Brucart desde el punto de vista del análisis lingüístico. Cuenca (1996)se sitúa en el marco de la gramática cognitiva y distingue otros niveles, inferiores y superiores a la oración, en lo que denomina “categorías oracionales”. Propone nuevas unidades, o nuevos nombres para unidades ya reconocidas, como la cláusula, que equipara al concepto de oración con un signo de predicación, y el período, referido a la unidad formada por dos oraciones conectadas sintácticamente. Para evitar interferencias entre conceptos, su propuesta para los términos oración, proposición y enunciado en relación a la supracategoría “oración” es la siguiente: “en el nivel sintáctico, tendríamos oraciones, en el nivel semántico, hablaríamos de proposiciones, y en el nivel pragmático, hablaríamos de enunciados”. (68) 10 7 desconcierto mayor por parte de los alumnos, que como consecuencia de ello pueden optar por la renuncia a la comprensión y por la aplicación de fórmulas estereotipadas. El análisis de la oración al margen de los ejercicios mecánicos de reconocimiento o de manipulación guiada que aparecen como práctica en la mayoría de libros de texto generalmente a base de ejemplos que no se alejan demasiado de los ejemplos canónicos y, por consiguiente, no generan dificultades mayores-, se enfrenta además a otras dificultades a partir del auge de los estudios sobre la enunciación y sobre el discurso. Si la definición de oración tuviera un valor unívoco, la distinción entre el ámbito de la sintaxis oracional y el ámbito del discurso sería admisible, pero en realidad, si nos atenemos a los elementos constitutivos de la oración –sujeto y predicado, o SN+SV- desde la perspectiva discursiva nos damos cuenta de que algunos de los constituyentes no están ligados al núcleo –el verbocon la misma fuerza o dependencia. En realidad, los límites de la oración y la frontera entre oración y enunciado presentan contornos difusos. En el orden de la práctica discursiva, por añadidura, la oración no constituye una unidad natural de producción o de interpretación, como se pone de manifiesto en múltiples ejemplos de textos literarios y cotidianos, orales y escritos. Como dice Campana (2002): “Cuando escribimos, juzgamos la pertinencia de una oración no por referencia a un prototipo de oración, sino a partir de la referencia no consciente a nuestra experiencia de lector y/o de escritor, experiencia que poco a poco nos ha dotado de una competencia, de un conocimiento implícito originado en la frecuentación de numerosos contextos en los que hemos encontrado esta unidad …/… En este sentido, nos sentiríamos tentados a afirmar que el conocimiento de la oración que necesitamos para la producción escrita estaría más alejado del concepto [de oración] que de la idea de esquema en el sentido que le otorgan los cognitivistas, es decir, de un conocimiento de los contextos en los que los conceptos [relación sintáctica, cohesión textual, etc.] aparecen con frecuencia”. (22) A pesar de las dificultades apuntadas hasta aquí, la concepción de la sintaxis oracional, a menudo situada en un marco formal y casi geométrico, que ha dominado durante muchos decenios los estudios lingüísticos y ha sido exportado de forma estereotipada y esquemática al mundo de la enseñanza, puede compaginarse con una manera de observar los fenómenos oracionales que tenga en cuenta la semántica y la pragmática. Aludimos a la visión de la sintaxis de Tesnière, referida sobretodo al análisis de los componentes de la oración. Tesnière, heredero de una tradición reconocida en la historia de las ideas lingüísticas, postula que las relaciones de dependencia entre los grupos sintácticos de la oración tienen un origen semántico. Los componentes de la oración se agrupan alrededor de un núcleo –el verbo- con grados de dependencia diversos en función de las “exigencias” semánticas de dicho núcleo, que determina un sistema de papeles semánticos o argumentos. Así, por ejemplo, el verbo ir es bivalente: exige dos argumentos, un agente y un complemento de lugar, necesario para la compleción semántica del verbo. Esta concepción basada en las características semánticas de los elementos lingüísticos revela una relación estrecha con los postulados de la gramática cognitiva11, cuyos principios se basan en la manera en que el locutor conceptualiza las relaciones entre las entidades a 11 Para una introducción a la gramática cognitiva, véase Cuenca y Hilferty (1999) 8 partir de la experiencia compartida en los usos lingüísticos de su entorno. El locutor, asimismo, en la medida en que la gramática de su lengua se lo permite, puede focalizar en alguna de las relaciones entre las entidades, de manera que puede escoger, en función de su intención, entre, por ejemplo, decir Roberto ha atado su bicicleta al árbol con una cadena – en cuyo caso el verbo atar tendría cuatro argumentos-, o decir Roberto ha atado su bicicleta a un árbol –si no quiere focalizar su atención en el instrumento-, o decir, Roberto ha atado a su perro –utilizando el mismo verbo con sólo dos argumentos, agente y objeto, si al locutor no le interesa poner de relieve ni dónde, ni con qué, sino solamente manifestar la inmovilidad del perro (Charolles y Combettes, 2001). Abordar el concepto de oración en la enseñanza se revela como una tarea difícil, sobretodo desde la perspectiva de la actividad metalingüística con la intención de reflexionar sobre el funcionamiento del sistema de la lengua. Se cruzan en él múltiples perspectivas de análisis desde los distintos modelos de descripción lingüística, a la vez que se produce la interferencia con la “unidad psicolingüística” de oración, pertinente para las operaciones discursivas del locutor. Ante las dificultades expuestas, ¿qué tipo de planteamientos se proponen para promover el análisis del concepto de oración por parte de nuestros alumnos? ¿qué actividades pueden ayudar a la observación, al contraste, a la duda? Se han llevado a cabo experiencias interesantes que tienen por objetivo promover la actividad de reflexión sobre el funcionamiento lingüístico, bien ligadas a la actividad textual, bien ligadas a la actividad metalingüística con intención puramente especulativa (Jimeno, 2000; Zayas, 2001). En la misma línea se describe, a continuación, la propuesta de secuencia didáctica gramatical. Una propuesta de mediación en la elaboración de conocimiento gramatical Desde el departamento de Didáctica de la Lengua y la Literatura de la UAB se ha experimentado y promovido el modelo de Secuencia Didáctica (SD) para la enseñanza y el aprendizaje de las habilidades lingüísticas y la construcción de competencias en los usos discursivos del lenguaje. Las características generales de este modelo didáctico se basan en los principios de la teoria sociopsicológica de Vigotsky, en los postulados sociohistóricos de Bakhtin, en la teoría de la actividad de Leontiev, en las premisas pedagógicas de Dewey, en los presupuestos de la psicología sociocultural, teniendo en cuenta las evidentes interrelaciones entre estas líneas de pensamiento (Camps, 1996, 2003a). Aplicando el modelo de SD a la didáctica de la gramática, podemos destacar las siguientes características: La tarea o proyecto que se propone a los estudiantes está formada por un conjunto de actividades diversas aunque relacionadas entre sí para cumplir con un objetivo global que les da sentido y que constituye su finalidad. Por ejemplo, y en el caso que nos ocupa, descubrir la organización de los elementos constitutivos de la oración en torno al verbo. La unidad de la secuencia no se refiere únicamente a los conocimientos sobre la oración sino 9 al proceso de elaboración de dichos conocimientos, a la actividad global que se desarrolla sobre el tema. En la secuencia didáctica sobre gramática, SDG, se llevan a cabo dos tipos de actividades: a) una actividad de observación, de indagación, de manipulación sobre materiales lingüísticos reales, que por lo general se concreta en una síntesis del trabajo realizado y de las conclusiones a las que se ha llegado, en forma de informe o de exposición oral; b) una actividad de aprendizaje a partir de la actividad anterior y de la sistematización de los resultados, que desemboque en la elaboración de conocimientos gramaticales aptos para contribuir a la realización de actividades posteriores, gramaticales o comunicativas. La puesta en marcha de situaciones interactivas que faciliten la construcción de conocimiento a partir de la confrontación y el consenso, y de la ayuda puntual del profesor. Estas situaciones de interacción constituyen la base de la regulación de los aprendizajes, o evaluación formativa. Los fragmentos de interacción entre estudiantes ejemplificados anteriormente corresponden a la SDG sobre la oración, llevada a cabo en dos aulas de tercero de E.S.O. en dos centros de secundaria de la zona de Barcelona12. La secuencia didáctica parte de una primera actividad que consiste en segmentar las oraciones de un texto literario con fragmentos de diálogo. A partir de esta discusión inicial, se propone a los estudiantes de reflexionar sobre el concepto oración y sobre los componentes de la oración a partir del verbo como eje. Las actividades propuestas instan a la observación de enunciados y a su manipulación para promover la reflexión metalingüística. La secuencia se orienta a la elaboración de un informe sobre los resultados del proceso. Los datos recogidos durante la realización de esta secuencia se hallan en fase inicial de análisis, aunque a partir de una primera observación, se pueden apuntar algunos datos. A pesar de la dificultad del tema, la experiencia muestra aspectos interesantes. Por un lado, la constatación de las características de los saberes escolares de los alumnos sobre el concepto “oración”: aplicación de conocimientos memorizados sin haberlos contrastado con los usos reales del lenguaje en situaciones comunicativas; uso de un metalenguaje incuestionado, casi fosilizado, que les sirve para responder mecánicamente a las preguntas que se plantean en las actividades propuestas; constatación de la dificultad de abstracción que necesariamente requiere la reflexión metalingüística. Por otro lado, sin embargo, también es preciso dar cuenta de otros aspectos que aparecen a lo largo de la SDG, consecuencia directa de las características de la propuesta: apertura a líneas de indagación no exploradas o poco exploradas en las prácticas gramaticales anteriores; descubrimiento de perspectivas inesperadas a partir de la posibilidad de pensar Las profesoras Lola Ribelles y Francisca Pérez llevaron a cabo la secuencia didáctica sobre la oración en sus aulas de 3º de E.S.O. 12 10 más allá de los límites de los ejercicios mecánicos de aplicación de conceptos o de reglas; y una tímida complacencia, tímida por su condición de no general ni generalizable, en el sistema de trabajo, no necesariamente abocado a soluciones prefijadas y absolutas, sino justamente abierto al proceso propio de la elaboración del pensamiento científico: observación, elaboración de hipótesis, comprobación de las hipótesis a partir de la búsqueda de ejemplos en los usos discursivos propios y del entorno, perplejidad ante ejemplos y contraejemplos, búsqueda de soluciones clarificadoras, a menudo mediante el retorno y revisión de las hipótesis iniciales. Conclusión Las líneas de reflexión que se plantean en este artículo están relacionadas con los aspectos siguientes: La necesidad de repensar los contenidos gramaticales del curriculum, en relación a los objetivos que se pretenden. A lo largo de la historia de la enseñanza, desde la antigüedad clásica, el objetivo de enseñar gramática se ha relacionado con el uso del lenguaje, especialmente del lenguaje escrito. Pero también la reflexión sobre el funcionamiento del lenguaje tiene un lugar destacado en la enseñanza de la lengua, y actualmente se considera necesario y útil elaborar un conjunto de contenidos sobre el conocimiento de la lengua para uso de cualquier ciudadano alfabetizado (Camps, 2003b). La necesidad de establecer criterios para la transposición didáctica de los saberes gramaticales a partir de la diversidad de modelos de descripción lingüística en el ámbito de las ciencias del lenguaje. Uno de los puntos cruciales en este sentido es la necesidad de clarificar el metalenguaje gramatical para uso de la escuela en los niveles de primaria y de secundaria, un objetivo no menor que han abordado algunos autores en nuestro país (Brucart, 2000; Cuenca, 2000). La necesidad de extender, en las aulas y más allá de las aulas, una cultura didáctica basada en la consideración conjunta del entorno o la situación de aprendizaje y la representación que de ella tienen los participantes, la mediación para la construcción de conocimiento y los procesos de interiorización. No es suficiente la elaboración de una ingeniería didáctica que atienda a los gestos externos de los enseñantes y considere la participación de los alumnos; es preciso insistir en las representaciones y las actitudes de los actores sociales sobre el acto de enseñar y aprender. Aunque de alguna manera se incluye en el punto anterior, me interesa señalar también la necesidad de aceptar la duda y la problematización como procedimiento de elaboración de saber y de evaluación del proceso de aprendizaje. La ciencia se construye a partir de la confrontación y la interpretación, no de la aplicación de “verdades indiscutibles”. Referencias bibliográficas BÉGUELIN, M.-J. (dir.) (2000): De la phrase aux énoncés: grammaire scolaire et descriptions linguistiques. Bruxelles: De Boeck/Duculot. BLANCHE-BENVENISTE, C. (2002): “Phrase et construction verbale”. Verbum, XXIV, 12, pp. 7-22. BOSQUE, I. (1988): Consideraciones sobre la enseñanza de la gramática. En Actas I 11 Jornadas de Metodología y Didácticade la Lengua y Literatura Españolas. Cáceres. Universidad de Extremadura, ICE. BRONCKART, J.-P. (1985) Les sciences du langage : un défi pour l’enseignement?Paris : UNESO /Delachaux et Niestlé. BRONCKART, J.-P. (2001): “La psychologie ne peut êtee que sociale et la didactique est l’une de ses discipines majeures”. En J.-P. Bernié (dir.) Apprentissage, développement et significations. (pp. 19-41). Bordeaux: Presses Universitaires de Bordeaux. BRUCART, J.M. (2000): “L’anàlisi sintàctica i la seva terminologia en l’ensenyament secundari”. En J. Macià y J. Solà (eds.) La terminologia lingüística a l’ensenyament secundari. Propostes pràctiques. (pp. 163-229). Barcelona: Graó. CAMPANA, M. (2002): Une grammaire pour mieux écrire. Amiens: CNDP de Créteil CAMPS, A. (1986): La gramàtica a l’escola bàsica entre els 5 i els 10 anys. Barcelona: Barcanova. CAMPS, A. (1994) L’ensenyament de la composició escrita. Barcelona: Barcanova CAMPS, A. (2003a): Secuencias didácticas para aprender a escribir. Barcelona: Graó. CAMPS, A. (2003b): “La construcció dels continguts gramaticals escolars”. Papers de treball, 2. Bellaterra: GREAL, Dept. de Didàctica de la Llengua i la Literatura, UAB. CAMPS, A., COLOMER, T. (coords.) (1998): L’ensenyament i l’aprenentatge de la llengua i la literatura en l’educació secundària. Barcelona: ICE/ Horsori. CAMPS, A., FERRER, M. (coords.) (2000): Gramàtica a l’aula. Barcelona: Graó CASTELLÀ, J.M. (1994): “¿Qué gramática para la escuela? Sobre árboles, gramáticas y otras formas de andarse por las ramas”. Textos de didáctica de la lengua y de la literatura, 2, 15-23. CHAROLLES, M. y COMBETTES, B. (2001): “De la phrase au discours: rupture et continuité”. En AAVV Quelles grammaires enseigner à l’école et au collège? Discours, genres, texte, phrase (pp. 119-141). Paris: Delagrave. CUENCA, M.J. (1992): Teories gramaticals i ensenyament de la llengua. València: Tàndem. CUENCA, M.J. (1996): Sintaxi fonamental. Barcelona: Empúries CUENCA, M.J. (1994): “La gramàtica i les gramàtiques en l’ensenyament de llengües”. En M.J. Cuenca (ed.) Lingüística i ensenyament de llengües, pp. 15-34. València: Universitat de València. CUENCA, M.J. (2000): Definicio i delimitació del concepte de “connector”. En J. Macià y J. Solà (eds.) La terminologia lingüística a l’ensenyament secundari. Propostes pràctiques. (pp.77-90). Barcelona: Graó. CUENCA, M.J. (2003): Sintaxi catalana. Barcelona: UOC. CUENCA, M.J. Y HILFERTY, J. (1999): Introducción a la lingüística cognitiva. Barcelona:Ariel. GONZÁLEZ NIETO, L. (2001): Teorías lingüísticas y enseñanza de la lengua. Madrid: Cátedra. HERNANZ, M.L. (1997): “Teoria i descripció en l’anàlisi gramatical”. Articles de Didáctica de la llengua i la literatura, 11, 39-59. HERNANZ, M.L.; BRUCART, J.M. (1987): La sintaxis. Barcelona: Crítica. JIMENO, P. (2000): “La cohesió textual en l’ensenyament de la llengua”. En A. Camps y M. Ferrer (coords.) Gramàtica a l’aula. Barcelona: Graó 12 MASSERON, C. (1995): “Bâtir et finaliser une progression grammaticale: des usages aux besoins langagiers”. Pratiques, 87, 7-45. TOMASSONE, R. (1996): Pour enseigner la grammaire. Paris: Delagrave. VERGNAUD, G. (1996): “Au fond de l’action, la conceptualisation”. En J.-M. Barbier et al. Savoirs théoriques et savoirs d’action. Paris: PUF. ZAYAS, F. (1993): “Las actividades gramaticales desde una perspectiva textual”. En C. Lomas, y A. Osoro (eds.) El enfoque comunicativo en la enseñanza de la lengua, pp. 192222. Barcelona: Paidos. ZAYAS, F. (2001): “L’activitat metalingüística: més enllà de l’anàlisi gramatical”. Articles de Didàctica de la llengua i la literatura, 25, 19-30. 13 Cuarto Quinto Nivel Autoevaluación 1. Toda oración simple tiene sujeto y verbo. Sí. No. A veces. Pregunta 1 de 9 11/20 Cuarto Quinto Nivel Autoevaluación 2. ¿Es el punto y aparte el único indicativo de que la oración concluyó? Sí, al final de cada oración se requiere un punto y aparte. No, existen otros signos de puntuación que se pueden utilizar. No, el punto puede ser omitido. Pregunta 2 de 9 12/20 Cuarto Quinto Nivel Autoevaluación 3. ¿Tienen las oraciones compuestas dos sujetos y un verbo? Siempre. No, puede ser un sujeto tácito y un sujeto implícito. No, tienen dos o más verbos. Pregunta 3 de 9 13/20 Cuarto Quinto Nivel Autoevaluación 4. ¿Qué es una oración impersonal? Las oraciones que no tienen sujeto lógico. Las oraciones que se pueden conjugar. Las oraciones que necesitan verbos en voz pasiva. Pregunta 4 de 9 14/20 Cuarto Quinto Nivel Autoevaluación 5. ¿Qué es el sujeto elíptico? _ _ _ _ personal. Sujeto que se escribe al inicio de la oración. Sujeto sin representación fonética o gráfica. Sujeto que es quien hace la acción y se representa con un pronombre Pregunta 5 de 9 15/20 Cuarto Quinto Nivel Autoevaluación 6. ¿Qué tipo de oración es “Hay muchos caramelos”? Gramaticalizada. Personal. Natural. Pregunta 6 de 9 16/20 Cuarto Quinto Nivel Autoevaluación 7. ¿Qué son las oraciones desiderativas? Las que expresan negación. Las que expresan deseo. Las que expresan súplica. Pregunta 7 de 9 17/20 Cuarto Quinto Nivel Autoevaluación 8. Un objeto indirecto es usado en: El predicado. El sujeto. La exclamación. Pregunta 8 de 9 18/20 Cuarto Quinto Nivel Autoevaluación 9. Las oraciones compuestas tienen: Dos sujetos que se pueden conjugar. Varios elementos gramaticales coordinados. Dos núcleos verbales. Pregunta 9 de 9 19/20 Oraciones simples y compuestas Las ORACIONES SIMPLES son unidades de sentido que tienen autonomía sintáctica y que están compuestas por un único predicado, simple o compuesto, que corresponde a un mismo sujeto. Por ejemplo: La plaza está desierta. Las ORACIONES COMPUESTAS, por su parte, son aquellas que tienen dos o más verbos que corresponden a más de un sujeto. Por ejemplo: Los adultos trabajan y los niños juegan. Oraciones simples Una oración es simple cuando todos los verbos (sea uno o más) refieren al mismo sujeto. Sujeto simple. Se trata de un sujeto que tiene un solo núcleo (sustantivo, pronombre). Por ejemplo: María, mi hermana, baila muy bien. Por ejemplo: Juan corre mucho. / Juan corre y salta. Sujeto compuesto. Se trata de un sujeto que tiene más de un núcleo. Por ejemplo: María y Juana bailan muy bien. Sujeto tácito. Se trata de un sujeto que no está explícito en la oración pero que puede deducirse por la conjugación del verbo principal o por el contexto. Por ejemplo: Bailan muy bien. Predicado simple. Se trata de un predicado que tiene un solo núcleo verbal. Por ejemplo: María baila muy bien. Predicado compuesto. Se trata de un predicado que tiene más de un núcleo verbal. Por ejemplo: María baila y canta muy bien. Oraciones simples https://www.youtube.com/watch?v=K_b FNniZh0M Oraciones compuestas Las oraciones compuestas son aquellas que presentan más de un verbo conjugado y que corresponden a distintos sujetos. Por ejemplo: Mi amiga llegó tarde y sus padres se enojaron. En las oraciones compuestas, las suboraciones, también llamadas proposiciones, tienen coherencia sintáctica y autonomía de sentido. Así, en este caso, las suboraciones [Mi amiga llegó tarde] y [sus padres se enojaron] pueden comprenderse de manera independiente una de otra. Oraciones coordinadas. Se combinan proposiciones sintácticamente independientes utilizando conectores o nexos de diferentes tipos (aditivos, adversativos, distributivos, explicativos). Por ejemplo: [La casa quedó vacía] y [ella se sintió sola]. Oraciones compuestas Oraciones yuxtapuestas. Se unen dos proposiciones con el mismo valor sintáctico, pero sin coordinante o nexo, sino con algún signo de puntuación (coma, punto y coma, dos puntos). Por ejemplo: [Martín come mucho helado]; [Gimena detesta los dulces]. https://www.youtube.com/watch?v=VlhoF lWaPsQ Oraciones subordinadas. Una proposición depende sintácticamente de otra, que es la proposición principal. Oraciones compuestas Por ejemplo: La guitarra [que me regalaste] es hermosa. https://www.ejemplos.co/100-ejemplos-deoraciones-simples-y-compuestas/ Trabajo en clase: • Desarrollar un escrito de 3 párrafos que abarquen todos los ejemplos de oraciones simples y compuestas que hemos revisado en clase. Parámetros: - El trabajo es grupal. - El trabajo debe ser presentado y desarrollado en clase. - El tema del escrito es completamente abierto y libre. - Se deben señalar los diferentes ejemplos de oraciones simples y compuestas vinculados al escrito. Bibliografía: •Yuxtapuestas (oraciones independientes, con sentido completo, separadas por comas unas de otras)(En proceso de extinción) Ej.: Vine, vi, vencí. a. Copulativas (y, e, ni... ni, que, amén de, junto con, además de,…) Ej.: Juan estudia Derecho y Ana trabaja en una farmacia. Ej.: Jugamos muy bien pero perdimos el partido. b. Adversativas (mas, pero, sin embargo, no obstante, sino,…) (P1 - P2) Ej.: O vienes o te quedas. c. Disyuntivas (o, u, o bien) Las PC tienen por separado, sentido pleno —están en el mismo nivel gramatical—. Están unidas por una conjunción que modifica d. Distributivas (ya... ya, bien… bien, sea… sea, ora… ora,…) Ej.: Unos jugáis al fútbol, otros hacéis las tareas del colegio. en cierto modo el contenido de las oraciones coordinadas. Ej.: Le hizo un quite, esto es, se llevó el toro. e. Explicativas (es decir, o sea, esto es,…) Ej.: Me preocupa que estudies mucho. de Sujeto Ej.: Andrés piensa que Carlos tenía razón. de Complemento directo (CD) a. Sustantivas Ej.: Tenemos el convencimiento de que te presentarás voluntaria. de Complemento del nombre (CN) Desempeña la función de un sustantivo. Se suele poder sustituir por “eso”, “esas cosas”. Ej.: Juan está que muerde. de Atributo Sirve de nexo la conjunción que. de Complemento de un adjetivo (C Adj) Ej.: Estaba seguro de que ganaríamos el concurso. (de relativo sustantivadas) de Complemento Agente (C Ag) b. Adjetivas o de relativo Especificativas •Coordinadas Oración Compuesta •Subordinadas (PP - PS) Existe una relación de subordinación o dependencia de una respecto de la otra. La PS desempeña una función gramatical dentro de la PP. Ej.: El hombre que está sentado es su padre. (selecciona al antecedente de entre Desempeña la función de un adjetivo: calificar a un nombre. A este nombre se le el grupo al que pertenece) llama antecedente. Sirven de nexo: Explicativas - pronombres relativos: que, cual(es), quien(de persona). (puede omitirse sin alterar el sentido Ej.: El jugador, que estaba cansado, se marchó. - los adverbios relativos donde, como, cuando. de la oración) - el pronombre cuyo (a/os/as), que actúa como relativo—posesivo. - Sirve para situar en el tiempo la acción principal: puede ser de anterioridad (antes de), de posterioridad (después de) o de de tiempo simultaneidad (durante). Ej.: Siéntate cuando quieras. Nexos: cuando, mientras (que), antes (de que), desde que, al mismo tiempo que, después (de que), hasta que, a medida que, siempre que,… de relación circunstancial c. Adverbiales de lugar - Señala el lugar relacionado con la acción principal. Indica: situación (en donde), dirección (a donde), procedencia (de donde) y transcurso (por donde). Nexos: donde —con o sin preposición—. Ej.: Siéntate donde quieras. de modo - Informa sobre la manera de realizar(se) la acción principal. Nexos: como, según, conforme,… Ej.: Siéntate como quieras. Comparativas - Hay una comparación con la PP. Esa relación es de: superioridad (más… que, más... de); igualdad (tan/tanto… como/cuanto, igual que,…); inferioridad (menos… que). Ej.: Es más listo que Javier. Ej.: Es tan listo como pensé. Ej.: Es menos torpe que ayer. Causales - Expresa el motivo por el cual acontece la PP. Nexos: porque, ya que, puesto que, pues, como,… Ej.: Me voy porque llueve. Consecutivas - La PS es consecuencia de la PP. Se invierte con la causal. Nexos: por lo tanto, luego, pues, de tal modo/tanto… que, así que... Ej.: Pienso, luego existo. Concesivas - Opone una dificultad al cumplimiento de la PP. Nexos: aunque —no sustituible por pero—, a pesar de que, aun cuando,… Ej.: Gané aunque fui enfermo. Condicionales - Formula una condición para que se cumpla la acción principal. Nexos: si, con tal de que, siempre que, con que, a condición de que... Ej.: Me quedaré si me ayudas. Finales - Explica para qué se realiza la acción principal. Nexos: para que, para, a fin de que, con el objeto de que… Ej.: Jugaré para divertirnos. (tienen la función de un adverbio) de relación lógica © Nicolás Chazarra. 2005. Colegio Retamar. Cuarto Quinto Nivel 1/23 Cuarto Quinto Nivel 9.1. Conectores de la oración Para crear oraciones compuestas, existen varias conjunciones que pueden ser utilizadas. Las conjunciones son una palabra o un grupo de palabras que sirven de nexo entre dos oraciones para extender la idea principal de la primera oración o de la segunda. Estas oraciones pueden ser independientes, es decir, tener por sí solas significado completo o subordinadas, no tener un significado completo por sí solas. Las conjunciones no tienen número ni género, son invariables. Existen diferentes relaciones que se pueden crear entre dos palabras, oraciones o proposiciones al unirlas y según estas se utiliza la conjunción creando una relación entre las dos palabras, oraciones o proposiciones. Las conjunciones tienen la característica de brindar un sentido a la relación entre las dos partes que serán unidas. Esta relación puede ser de adicionar información, contraponerla, señalar opciones, razón, consecuencia, etc. El uso de estas conexiones de manera adecuada permite vislumbrar el nivel de conocimiento de la lengua que tiene el redactor o hablante, a la vez que brinda fluidez al texto evitando el uso únicamente de oraciones simples. 2/23 Para crear oraciones compuestas, existen varias conjunciones que pueden ser utilizadas. Las conjunciones son una palabra o un grupo de palabras que sirven de nexo entre dos oraciones para extender la idea principal de la primera oración o de la segunda. Estas oraciones pueden ser independientes, es decir, tener por sí solas significado completo o subordinadas, no tener un significado completo por sí solas. Las conjunciones no tienen número ni género, son invariables. Existen diferentes relaciones que se pueden crear entre dos palabras, oraciones o proposiciones al unirlas y según estas se utiliza la conjunción creando una relación entre las dos palabras, oraciones o proposiciones. Las conjunciones tienen la característica de brindar un sentido a la relación entre las dos partes que serán unidas. Esta relación puede ser de adicionar información, contraponerla, señalar opciones, razón, consecuencia, etc. El uso de estas conexiones de manera adecuada permite vislumbrar el nivel de conocimiento de la lengua que tiene el redactor o hablante, a la vez que brinda fluidez al texto evitando el uso únicamente de oraciones simples. Como se puede analizar en los ejemplos dados, estas palabras que brindan un nexo entre dos oraciones pueden ser preposiciones, adverbios o conjunciones. Signos de puntuación utilizados con conectores de la oración Como se sabe, los signos de puntuación son utilizados para brindar pausa y entonación a las palabras, oraciones, párrafos, etc. Brindan coherencia y tienen la capacidad de cambiar el sentido de lo que se expresa, así, por ejemplo: Vengan a comer niños. ¡Vengan! A comer niños. Vengan a comer, niños. ¡Vengan! ¿a comer niños? La omisión de los signos de puntuación puede crear mala comprensión del texto y el agotamiento para el lector. Los signos de puntuación son necesarios para: · Otorgar estructura clara al texto. · Facilitar la lectura evitando el agotamiento. · Proporcionar entonación a las palabras y oraciones. · Determinar dónde empieza y termina cada oración, párrafo, texto en general. · Brindar secuencia lógica al texto y a las ideas. · Hacer énfasis en las ideas por medio de preguntas o signos de interrogación. · Eliminar ambigüedades. Algunos de estos signos de puntuación son: Signo Punto Coma Uso Ejemplo . Se coloca al final de los Estamos estudiando. , Se utiliza para hacer una Mónica fue a comprar arroz, pausa a una idea. En cuanto a y en la noche viajará a los conectores, se utiliza Otavalo. enunciados. previo a un coordinador y en medio cuando un subordinador comienza la A pesar de que Mónica salió a comprar, no llevó dinero. oración. Además, su uso es necesario después de palabras de transición, para enumerar más de tres elementos, entre otros. Punto y coma Punto final ; . Se utiliza para unir dos ideas Fabricio viajó a Santo relacionadas y oraciones Domingo en bus; necesita compuestas, puede ser hacer un trasbordo para sustituido por conectores. llegar a Esmeraldas. Es el punto con el que Estamos estudiando todos concluye todo el texto. los días. Necesitamos que nos ayuden a conseguir libros, por lo que hicimos una colecta. Punto y aparte . Se utiliza para separar dos Estamos estudiando. Yo párrafos o ideas diferentes. necesito un libro. Después de este, se comienza la escritura en otra Mañana viajaremos a Loja línea. Punto y seguido . Separa oraciones, va seguido Estamos estudiando. Así de la última palabra y tiene un que, necesitamos los libros. espacio antes del inicio de la siguiente palabra, la cual va en mayúsculas. Dos puntos : Sirven al igual que el punto y Querido Jhon: coma para separar dos partes de la oración. Se utilizan antes de una cita textual, para añadir una causa o consecuencia, para enumerar, ejemplificar, etc. Los números impares son: uno, tres, cinco, siete. Necesito dormir: quiero una almohada. Puntos … suspensivos Se utilizan para indicar texto León menciona: “… de esto omitido antes o después de lo se infiere que es necesario escrito. usar mascarilla.” León menciona; “siempre que salgamos podemos correr riesgo…” León menciona: “No se debe salir a bailar…esto constituye respeto a los demás.” Comillas “” En citas textuales, la oración León menciona que: “No es termina con el cierre de necesario una pausa”. comillas y el punto va fuera de las mismas. Paréntesis Signos de () ¿? interrogación Se utilizan para introducir Ayer le envié el pedido (el información separada del que me solicitó por teléfono) texto, pero acorde. espero sea de su agrado. Son signos de inicio y de ¿Quién fue la persona que cierre que enmarcan a una se comió mi queso? pregunta. El cierre constituye un punto y la siguiente palabra si va seguida empieza con mayúscula. Signos de ¡! exclamación ¿Dónde? Son signos de inicio y de ¡Hace tanto tiempo que no cierre que enmarcan una te veo! exclamación. El cierre constituye un punto y la siguiente palabra si va seguida empieza con ¡Así! mayúscula. Guion - Establecer relaciones entre Calidad-precio conceptos. Unir dos sustantivos que tiene el mismo referente. Director-presentador Cuarto Quinto Nivel 9.1.1. Conjunciones coordinantes Estas conjunciones se utilizan para unir dos ideas independientes que tienen lógica por sí solas. Ambos elementos poseen igual jerarquía sintáctica. Como su nombre lo indica, estas conjunciones brindan una coordinación entre las dos ideas que tienen una misma jerarquía. Estas conjunciones coordinantes se pueden subdividir en: Cuando se habla de que una oración, palabra o proposición tienen la misma jerarquía sintáctica, nos referimos a que por sí mismas poseen significado y no son dependientes de otras. 3/23 Cuarto Quinto Nivel 9.1.2. Conjunciones subordinantes Estas conjunciones se utilizan para unir una idea independiente que tiene lógica por sí sola y una dependiente, la cual no tiene sentido por sí sola y necesita de la independiente para tener lógica. Tienen diferente jerarquía sintáctica. Es importante indicar que al hablar de primera o segunda, no es indicativo de orden, sino de que se necesitan dos cláusulas, pues tanto la coordinada como la subordinada pueden estar al inicio o al final de la oración. Conjunción Condicionales Definición Ejemplos La segunda cláusula Si, si no, si es que, a Si jugamos bien, es dependiente de la no ser que. ganaremos. primera para que se Ganaremos si cumpla. Causales Uso jugamos bien. La segunda cláusula Dado que, debido a Dado que el virus es es dependiente de la que, porque mortal, debemos primera y expresa cuidarnos. causa. Debemos cuidarnos dado que el virus es mortal. 4/23 Estas conjunciones se utilizan para unir una idea independiente que tiene lógica por sí sola y una dependiente, la cual no tiene sentido por sí sola y necesita de la independiente para tener lógica. Tienen diferente jerarquía sintáctica. Es importante indicar que al hablar de primera o segunda, no es indicativo de orden, sino de que se necesitan dos cláusulas, pues tanto la coordinada como la subordinada pueden estar al inicio o al final de la oración. Conjunción Condicionales Definición Ejemplos La segunda Si, si no, si es Si jugamos bien, cláusula es que, a no ser que. ganaremos. dependiente de la Ganaremos si primera para que jugamos bien. se cumpla. Causales Uso La segunda Dado que, debido Dado que el virus cláusula es a que, porque es mortal, dependiente de la debemos primera y expresa cuidarnos. causa. Debemos cuidarnos dado que el virus es mortal. Consecutivas La segunda Así que, Entonces vimos el cláusula es entonces, de alba, cuando el sol dependiente de la modo qué. salió. primera indicando Cuando el sol una secuencia. salió, entonces vimos el alba. Concesivas La segunda Aunque, a pesar Aunque corrimos, cláusula es de, aun así el perro nos dependiente de la alcanzó. primera señalando El perro nos una dificultad de la alcanzó, aunque primera. Finales La segunda corrimos. Para, para que, a A fin de que cláusula es dependiente de la primera señalando su finalidad de lo expresado. fin de que estudiemos, tenemos la guía. Tenemos la guía a fin de que estudiemos. Locuciones conjuntivas Casi todas las conjunciones subordinadas son locuciones conjuntivas entendiendo estas como dos o más palabras que adoptan una forma de conjunción, esto quiere decir que las conjunciones subordinadas en su mayoría no son solo una palabra como “para” sino que se componen de dos o más palabras como “por lo que,” “a fin de que.” Entre las características de estas conjunciones subordinantes están: · Unen dos proposiciones en las cuales una tiene mayor jerarquía que la otra, es decir, que una tiene significado completo y la otra es dependiente. · No son intercambiables con el uso de la conjunción pues su significado sería diferente o ambiguo. · La idea completa se llama principal y la otra, subordinada. Cuarto Quinto Nivel 9.2. Elementos gramaticales Los elementos gramaticales se refieren a los elementos de la oración que ya hemos revisado; sin embargo, a fin de identificar cada uno en su uso, sea en el sujeto o en el predicado, haremos un análisis de estos. Recordemos que son necesarios para formar una oración lógica que permitan su comprensión; se utilizan en el lenguaje escrito y verbal. Sujeto y Predicado | Lengua - Educatina Elementos de la oración 1 Elementos de la oración 2 Toda oración bimembre posee una estructura interna que se puede clasificar según su categoría y las palabras utilizadas. Por lo general, las oraciones se crean con el uso de un sujeto y de un predicado. https://www.youtube.com/watch?v=b7VjRyKc18k 5/23 Cuarto Quinto Nivel 9.2. Elementos gramaticales Los elementos gramaticales se refieren a los elementos de la oración que ya hemos revisado; sin embargo, a fin de identificar cada uno en su uso, sea en el sujeto o en el predicado, haremos un análisis de estos. Recordemos que son necesarios para formar una oración lógica que permitan su comprensión; se utilizan en el lenguaje escrito y verbal. Elementos de la oración 1 Elementos de la oración 2 5/23 Cuarto Quinto Nivel 9.2.1. Análisis del sujeto El sujeto dentro de la oración es la palabra o grupo de palabas de las cuales la oración hace referencia o es quien ejecuta la acción del verbo. Existen diferentes formas de expresar el sujeto en la oración, estos son los tipos de sujetos. Sujeto desinencial o tácito El sujeto desinencial o tácito es el que no está escrito o no es pronunciado como parte de la oración, pues en la conjugación del verbo se lo puede identificar fácilmente y esta omisión puede ser reemplazada por un pronombre. Eres a quien más quiero. ¿Quién es a quién más quiero? Tú (sujeto) Sujeto tácito Tú eres a quién más quiero. Siempre queremos estar aquí. ¿Quiénes siempre quieren estar aquí? Nosotros (sujeto) Sujeto tácito Nosotros siempre queremos estar aquí. 6/23 El sujeto dentro de la oración es la palabra o grupo de palabas de las cuales la oración hace referencia o es quien ejecuta la acción del verbo. Existen diferentes formas de expresar el sujeto en la oración, estos son los tipos de sujetos. Sujeto desinencial o tácito El sujeto desinencial o tácito es el que no está escrito o no es pronunciado como parte de la oración, pues en la conjugación del verbo se lo puede identificar fácilmente y esta omisión puede ser reemplazada por un pronombre. Eres a quien más quiero. ¿Quién es a quién más quiero? Tú (sujeto) Sujeto tácito Tú eres a quién más quiero. Siempre queremos estar aquí. ¿Quiénes siempre quieren estar aquí? Nosotros (sujeto) Sujeto tácito Nosotros siempre queremos estar aquí. Sujeto expreso El sujeto expreso es el que se escribe y se pronuncia de manera explícita en la oración. El orden del mismo puede variar y aun así sigue siendo de fácil reconocimiento como el sujeto de quien se habla en la oración. Estamos nosotros totalmente felices de estudiar. ¿Quiénes están totalmente felices de estudiar? Nosotros De manera pronta, Martha se fue a su casa. ¿Quién de manera pronta se fue a su casa? Martha Nadie quiere contagiarse del virus. ¿Quién quiere contagiarse del virus? Nadie Ayer corriendo y saltando se fue a su casa David. ¿Quién ayer corriendo y saltando se fue a su casa? David Sujeto simple El sujeto simple tiene un solo núcleo, es decir, un solo sustantivo o pronombre. Ecuador es un país pequeño. ¿Quién es un país pequeño? Ecuador ¿Cuál es el núcleo del sujeto? Ecuador ¿Cuántos núcleos tiene el sujeto? Uno Nosotros bailaremos toda la noche. ¿Quiénes bailarán toda la noche? Nosotros ¿Cuál es el núcleo del sujeto? Nosotros ¿Cuántos núcleos tiene el sujeto? Uno Sujeto compuesto El sujeto compuesto tiene más de un núcleo, es decir, más de un sustantivo o más de un pronombre o la combinación de estos. Ecuador y Colombia son países pequeños. ¿Quiénes son países pequeños? Ecuador y Colombia ¿Cuál es el núcleo del sujeto? Ecuador – Colombia ¿Cuántos núcleos tiene el sujeto? Dos La casa, el parque, la calle y la avenida están siendo reparadas. ¿Quiénes están siendo reparadas? La casa, el parque, la calle y la avenida ¿Cuál es el núcleo del sujeto? Casa – parque – calle – avenida ¿Cuántos núcleos tiene el sujeto? Cuatro Karina y él necesitan comer más vegetales. ¿Quiénes necesitan comer más Karina y él vegetales? ¿Cuál es el núcleo del sujeto? Karina – él ¿Cuántos núcleos tiene el sujeto? Dos Sujeto complejo El sujeto complejo tiene modificadores directos, indirectos o subordinados. La dama del vestido rojo luce hermosa. ¿Quién luce hermosa? La dama del vestido rojo ¿Cuál es el núcleo del sujeto? Dama ¿Cuántos núcleos tiene el sujeto? Uno La dama, del vestido rojo, luce hermosa. ¿Quién luce hermosa? La dama, del vestido rojo, ¿Cuál es el núcleo del sujeto? Dama ¿Cuántos núcleos tiene el sujeto? Uno La dama Andrea luce hermosa. ¿Quién luce hermosa? La dama Andrea ¿Cuál es el núcleo del sujeto? Dama ¿Cuántos núcleos tiene el sujeto? Uno La dama, del vestido rojo, y la señora, del sombrero, lucen hermosas. ¿Quiénes lucen hermosas? La dama, del vestido rojo, y la señora, del sombrero, ¿Cuál es el núcleo del sujeto? Dama – señora ¿Cuántos núcleos tiene el sujeto? Dos La dama Andrea, el caballero Luis y la niña Lucía lucen hermosos. ¿Quiénes lucen hermosos? La dama Andrea, el caballero Luis y la niña Lucía ¿Cuál es el núcleo del sujeto? Dama – caballero – niña ¿Cuántos núcleos tiene el sujeto? Tres El núcleo del sujeto puede ser un sustantivo o un pronombre. Núcleo del sujeto El núcleo del sujeto forma parte de un sintagma nominal o pronominal. Puede ser un sustantivo, que es una palabra que nombre a un objeto, a un sujeto, a un lugar o a un concepto. Sujeto Predicado Jorge corre. Núcleo del sujeto: Jorge Sustantivo sujeto propio Sujeto Mi primo Jorge Predicado corre. Núcleo del sujeto: Jorge Sustantivo sujeto propio Sujeto Predicado Mi primo hermoso Jorge corre. Núcleo del sujeto: Jorge Sustantivo sujeto propio Sujeto Predicado Jorge, quien vive al frente, corre. Núcleo del sujeto: Jorge Sustantivo sujeto propio Clases de sustantivos Existen varios tipos de sustantivos que pueden ser utilizados como sujetos de la oración. Clase Concepto Ejemplo Parte del sujeto Sustantivos propios Siempre se escriben con mayúsculas. Nombres propios de Narcisa, Nelson, Mateo es mi mejor personas Estela amigo. Nombres de países, Ecuador, Cuenca, Galápagos tienen ciudades, Asia, Los Alpes. variedad de continentes, lugares especies. naturales con nombre propio Marcas de productos Sony, Dell, IPhone es una Samsumg marca reconocida mundialmente. Organizaciones, Colegio Amazonas, El Ministerio de instituciones, Universidad de las Salud no autoriza funciones del Estado Fuerzas Armadas, aún el regreso a Ministerio de clases presenciales. Deportes Nombres de Aerosmith, Nirvana, Juan Luis Guerra y álbumes, libros, Bon Jovi, El nombre 4/40 es un grupo de películas, grupos, de la Rosa, bachata que nunca festividades, etc. Carnaval se separó. Sustantivos comunes Sin mayúsculas pues nombran a una persona, a un animal o a una cosa de manera general. Clasificación de los sustantivos comunes Sustantivos Amor, felicidad, El amor es un abstractos odio, rencor, sentimiento compasión inexplicable. Sustantivos Teléfono, sillón, Mi perro necesita un concretos lentes, pantalla baño urgente. Sustantivos no Luz, agua, arena, El agua es vital para contables aceite los seres vivos. Sustantivos Individuales: gato, El elefante tiene contables jirafa, casa buena memoria. Colectivos: pandilla, conjunto, cardumen El enjambre está en Sustantivos Lavaplatos, El cortaúñas está en compuestos sacapuntas, el primer cajón. la cima del árbol. quitaesmalte Un pronombre como núcleo del sujeto Los pronombres se dividen en singular y plural. Tanto en singular como en plural existe la primera, la segunda y la tercera persona y según estas tienen la correspondencia en la conjugación de los artículos los verbos dentro de la oración. En español, los pronombres personales que pueden ser utilizados en el sujeto son: Pronombre Ejemplo utilizado en el sujeto Yo Yo estoy en casa. Tú Tú necesitas ayuda. Él Él tiene que estudiar más. Ella Ella nos invitó a su casa. Nosotros Nosotros buscamos una salida. Nosotras Nosotras hemos ganado el concurso. Vosotros Vosotros estáis en apuros. Vosotras Vosotras sois las primeras en llegar. Vos Vos tienes que apurarte. Ustedes Ustedes han llegado temprano. Ellos Ellos han visitado la ciudad en varias ocasiones. Me Me gustan las flores. Te Te sacaron de la lista. Le Le abrieron la puerta. Nos Nos invitaron a una fiesta. Les Les prendieron fuego. Os Os brindaron un caluroso saludo. Se Se te dijo la verdad. Elementos del sujeto El sujeto puede estar constituido por una palabra o por un grupo de palabras expresas o tácitas de quien o quienes se habla en la oración. El núcleo El núcleo del sujeto es un sustantivo o un pronombre o varios sustantivos o pronombres. - La casa es hermosa. - La casa y el parque son hermosos. - Tú estás aprendiendo. - Tú y yo estamos aprendiendo. - Ecuador, Perú y Colombia son países latinoamericanos. El modificador directo Un modificador directo es una palabra o un grupo de palabras que modifican el núcleo de manera directa, este puede ser un adjetivo, un artículo, un determinante o una proposición subordinada. o Mi casa es hermosa. (“mi” es un adjetivo posesivo). o La hermosa casa es mía. (“hermosa” es un adjetivo). o La casa es verde. (“la” es un artículo determinado) o Las casas que están frente al parque necesitan luz. (“que están frente al parque” es una proposición subordinada). o Las grandes casas que están recién construidas están frente al parque. (“las grandes” articulo, adjetivo, “que están recién construidas” proposición subordinada). El modificador indirecto Es una palabra o conjunto de palabas que modifican al sujeto, pero a diferencia del modificador directo, estas son introducidas por medio de una preposición. o Los platos con dibujos están a la moda. (“con dibujos”). o Canciones como estas no pasan de moda. (“como estas”). o La casa de mi tía es la más linda. (“de mi tía”). La aposición Se conoce como aposición a un elemento que puede utilizarse en el sujeto para dar información extra del sustantivo o pronombre, que es el núcleo del sujeto. o Mi hermano, quien es policía, es una de las mejores personas que he conocido. (“quien es policía” aposición explicativa la cual va entre comas y otorga detalles sobre el sustantivo. Se puede eliminar sin que la oración cambie su significado pues esta información es opcional”. o Mi hermano José es una de las mejores personas que he conocido. (“José” aposición especificativa, va sin comas y no es posible eliminarla pues brinda información concreta que, al ser omitida, podría cambiar el significado de la oración). Cuarto Quinto Nivel 9.2.2. Análisis del predicado El predicado dentro de la oración es la palabra o grupo de palabras que hacen mención a lo que hace el sujeto. Como predicado, entendemos a todo elemento gramatical que no forme parte del sujeto. Su núcleo es el verbo. El predicado constituye un sintagma verbal, dentro del cual pueden existir uno o más elementos. El predicado con su núcleo (verbo) no puede ser omitido, pues perdería la condición de oración y su sentido. Tipos de predicado El tipo de predicado depende del tipo de oración. Podemos nombrar, en las oraciones simples, dos tipos de predicado: verbal y nominal. Predicado verbal Este tipo de predicado se basa en verbos de acción que realiza el sujeto, no son sentimientos ni estados. - Gioconda baila todas las noches. - El pájaro amarillo toma agua de la fuente. - Stalin escribe cartas todos los días. Predicado nominal Este tipo de predicado se basa en verbos de estados que no involucran acción sino sentimientos o condiciones. 7/23 El predicado dentro de la oración es la palabra o grupo de palabras que hacen mención a lo que hace el sujeto. Como predicado, entendemos a todo elemento gramatical que no forme parte del sujeto. Su núcleo es el verbo. El predicado constituye un sintagma verbal, dentro del cual pueden existir uno o más elementos. El predicado con su núcleo (verbo) no puede ser omitido, pues perdería la condición de oración y su sentido. Tipos de predicado El tipo de predicado depende del tipo de oración. Podemos nombrar, en las oraciones simples, dos tipos de predicado: verbal y nominal. Predicado verbal Este tipo de predicado se basa en verbos de acción que realiza el sujeto, no son sentimientos ni estados. - Gioconda baila todas las noches. - El pájaro amarillo toma agua de la fuente. - Stalin escribe cartas todos los días. Predicado nominal Este tipo de predicado se basa en verbos de estados que no involucran acción sino sentimientos o condiciones. - Lucía fue mi mejor amiga. - Andrea siente paz. - Mis amigos son buenos en Historia. Predicado adjetival Este tipo de predicado se basa en un complemento que es un adjetivo o un sintagma adjetival. - Isabela es digna de toda mi confianza. - Gabriel es por mucho el mejor de los amigos. - José tiene gran valor en lo que hace. Predicado simple Este tipo de predicado tiene solo un núcleo, es decir, un solo verbo. - Mili come toda su comida. - Giomi cocina delicioso. Predicado compuesto Este tipo presenta dos o más núcleos, es decir, dos o más verbos. - Ginna salta y corre muy rápido. - Junior estudia y duerme todo el día. Predicado adverbial Este tipo de predicado se basa en el uso de un adverbio o modificador del verbo. - Tati está puntual. - Carlitos llegó atrasado. Núcleo del predicado El núcleo del predicado forma parte de un sintagma verbal y es el verbo de la oración. No puede existir una oración sin verbo, convirtiéndose por esto en la parte más importante que no se puede omitir. Verbo elidido o tácito Son oraciones en las que no es necesario pronunciar o escribir el verbo pues se sobreentiende por una primera mención o porque es obvia la acción. Por ejemplo, dando respuesta a la pregunta, ¿Cómo te llamas? – Carlos, el verbo “me llamo” está sobreentendido pues da respuesta a la pregunta en la cual ya se hace mención al verbo, así también en oraciones compuestas como las yuxtapuestas que utilizan signos de puntuación para unir dos partes, se puede omitir el verbo usando una coma, por ejemplo, El perro, grande. Se omite el verbo “es” por el uso de la coma. Perífrasis verbales Estas son conjugaciones de los verbos. Se refieren a los verbos conjugados de tal manera que necesitan un verbo auxiliar o modal. https://mdm.usta.edu.co/remos_downloads/lectoescritura/2015/1gramatica/las_perfrasis_verbales. html Elementos del predicado El predicado puede estar constituido por una palabra o un grupo de palabras expresas o tácitas sobre lo que hace el sujeto, cómo lo hace, cuándo lo hace, etc., es decir, modificadores del verbo. El núcleo El núcleo del predicado es el verbo. Tipo Transitivo Uso La acción recae sobre un objeto Ejemplo Micaela escribe un libro. directo. Intransitivo La acción no recae sobre ningún Emilia estudió. objeto. Reflexivo Impersonal La acción recae sobre el mismo Voy a cocinarme una sujeto. deliciosa cena. Verbos naturales que se utilizan en Llueve fuerte. infinitivo y en tercera persona del singular. Defectivo No admite su conjugación en todas La ley transgrede los las personas ni en todos los derechos fundamentales. tiempos. Auxiliar Son verbos que no tienen sentido por sí solos en algunos tiempos y auxilian a la comprensión del verbo central. Hemos vivido felices. Tienes que comer vegetales. Eli está sentada en el sillón. Ser evaluado causa nervios. Complementos directos Son complementos que usan los verbos transitivos, siendo palabras en las cuales recae la acción. o Anaís escribe cartas. o Narcisa prende fuego. o Alfredo come chifles. Complementos indirectos Son complementos que utilizan preposiciones o conjunciones para complementar la idea del verbo, no son de uso necesario y pueden ser omitidos. o Anaís escribe a su madre. o Narcisa prende fuego con la mano. o Alfredo come la cena. Complementos circunstanciales Son elementos temporales, espaciales o de modo que brindan detalles de la acción o verbo. o Kevin estudia todas las noches. (tiempo) o Kevin estudia concentradamente. (modo) o Kevin estudia para pasar el semestre. (finalidad) o Kevin estudia porque necesita un 10. (causa) o Kevin estudia en su habitación. (lugar) o Kevin estudia tres materias. (cantidad) o Kevin estudia con la computadora. (instrumento) o Kevin estudia con su novia. (compañía) Complemento agente Este complemento es usado en oraciones en voz pasiva para señalar quién hace la acción, por lo general se utiliza la preposición “por”. o La iglesia fue construida por el alcalde. o Varios libros fueron escritos por Agatha Christie. o La casa es pintada por los obreros. o El barco será utilizado por la NASA. Complementos de régimen verbal Es un grupo de palabras que brinda detalles que no son complementos ni directos ni indirectos, sino que es un elemento sintáctico que usualmente es introducido en el predicado por medio de “atreverse a” “acordarse de” “etc. o Israel se acordó de cerrar la puerta con seguro. o Alejandra se atrevió a decir el mensaje claramente. https://www.youtube.com/watch?v=a5nsoiUSmK8 Cuarto Quinto Nivel 9.3. Elementos paralingüísticos Los elementos paralingüísticos de la oración son aquellos que dan énfasis al mensaje sin la necesidad de ser escritos. Los signos de puntuación son considerados como elementos paralingüísticos de la escritura y los gestos, la entonación, etc., elementos paralingüísticos del habla. Los elementos en ambos casos son necesarios para que se desarrolle una comunicación efectiva en la cual, mediante estos elementos paralingüísticos, el mensaje sea recibido de manera clara por parte del receptor y el emisor tenga la oportunidad de expresarse con claridad. Los elementos paralingüísticos escritos han tenido diferentes etapas como: La mnemónica, que fue a base de colores y grosor de cuerdas. La pictórica, que fue a base de objetos y colores con intensión comunicativa. La ideográfica, que es la asociación de símbolos o dibujos en representación de algún elemento comunicativo. También se pueden analizar los elementos paralingüísticos con base a la intención no explicita en la transtextualidad. 8/23 Cuarto Quinto Nivel 9.3. Elementos paralingüísticos Los elementos de la paralingüística escrita son: ⬥ Las letras mayúsculas para denotar importancia, enojo o incluso apuntan a la elevación del tono de voz. ⬥ Signos utilizados como exclamación, puntuación, comas, puntos seguidos, acrónimos, incluso el tipo de letra utilizado. ⬥ Emoticones para expresar sentimientos. 8/23 Cuarto Quinto Nivel 9.4. Fenómenos prosódicos La prosodia es un conjunto de fenómenos fónicos que abarcan diferentes elementos que se dan durante la emisión de un mensaje. Es una rama de la lingüística que representa los elementos del lenguaje verbal. Estos fenómenos responden a varios factores y transmiten información emotiva, sociolingüística y cultural. 9/23 La prosodia es un conjunto de fenómenos fónicos que abarcan diferentes elementos que se dan durante la emisión de un mensaje. Es una rama de la lingüística que representa los elementos del lenguaje verbal. Estos fenómenos responden a varios factores y transmiten información emotiva, sociolingüística y cultural. La acentuación Es un rasgo fónico que permite la distinción de las sílabas dentro de una palabra y, a la vez, la conexión de cada sílaba con la subsecuente dentro de una oración. El tono Esta particularidad viene dada por los sonidos y los diferentes decibeles que se utilizan para poner mayor o menos énfasis en las palabras, esto significa que las palabras pueden pronunciarse en altos y bajos, de igual manera en la escritura se lo grafica por medio de una tilde o no. En cuanto a la pronunciación y el tono, las preguntas de manera particular tienen un tono que hace énfasis a su naturaleza de interrogación. La entonación En el idioma español, la entonación está dividida por dos fenómenos: el primero es ascendente en cuanto a la pronunciación individual de cada palabra y el segundo una vez alcanzado el acento tónico, es la entonación de descenso. Las pausas Las pausas son los silencios voluntarios que se presentan de manera intercalada en el discurso oral e incluso durante la lectura. Están establecidas en cuanto a la separación de palabras y de manera gráfica por los signos de puntuación. La articulación Es el proceso de producir sonidos durante el desarrollo del lenguaje oral, esta articulación es un proceso tanto mental como físico que se lleva a cabo a través del movimiento de la lengua, labios, respiración, proceso de inhalación y exhalación, esta articulación puede ser precisa o imprecisa. Inicio / Lengua Predicado Te explicamos qué es el predicado de una oración, su núcleo, estructura y tipos que existen. Además ejemplos de oraciones con sujeto y predicado. Escuchar 3 min. de lectura En el predicado se encuentra el verbo y su información contextual. Índice temático ¿Qué es el predicado? Desde un punto de vista sintáctico, las oraciones bimembres se dividen en un sujeto y un predicado. El sujeto es la persona u objeto a la que nos referimos. En cambio, el predicado de una oración es todo aquello que no forma parte del sujeto (es decir, del sintagma nominal del sujeto). Visto de otra manera, es todo aquello en una proposición que se afirma del sujeto: las acciones que llevó a cabo, las condiciones en que está, las acciones que recibió de otros, etc. El predicado es indispensable en una oración para que ésta tenga sentido. Existen diversas formas y tipos de predicado, pero casi siempre está compuesto por un sintagma verbal, de mayor o menor tamaño y con más o menos elementos. Su eje lo constituye el verbo principal de la oración. Este verbo principal es reconocible porque está conjugado de manera tal que responde al sujeto (persona). Además, en el predicado se encuentra la información contextual o complementaria (en la forma de complementos directos, indirectos o circunstanciales) del verbo. Ver también: Sujeto Tipos de predicado En las oraciones simples, los predicados pueden ser básicamente de dos tipos: Predicado verbal. Se trata del predicado que detalla acciones o eventos que atañen al sujeto, y está caracterizado por verbos acompañados de complementos verbales (complemento directo, indirecto o circunstancial), atributos o elementos adverbiales. Por ejemplo: “Mi gato maúlla” (sólo verbo), “Mi gato come sardinas” (verbo con complemento directo), “Mi gato le maúlla al vecino” (verbo con complemento indirecto), “Mi gato maúlla de manera extraña” (verbo con complemento de régimen). Predicado nominal. En este caso, el predicado consiste en un atributo que se expresa del sujeto, lo cual requiere de un verbo copulativo o semicopulativo, y de un sintagma nominal. Por ejemplo: “Mi gato es gris”, “Mi gato fue el ganador del concurso”, “Mi gato estaba enojado esta mañana”. Núcleo del predicado Los sintagmas del predicado y del sujeto poseen siempre un núcleo, que es la palabra sobre la cual recae la mayor importancia sintáctica dentro de sus respectivos segmentos de la oración. En el caso del sintagma verbal, el núcleo es el verbo principal de la oración, o sea, el verbo conjugado con el sujeto, sea del tipo que sea. Por ejemplo: en “Mi gato come la mejor comida disponible”, podemos identificar un sujeto (“Mi gato”) y un predicado verbal: “come la mejor comida disponible”. De dicho predicado, el núcleo viene siendo el verbo come (comer). Pero al mismo tiempo, en “Mi gato está un poco gordo”, el sujeto será el mismo, pero tendrá un predicado nominal: “está un poco gordo”, cuyo núcleo será el verbo está (estar). Más en: Núcleo del sujeto y del predicado Estructura del predicado Generalmente, el predicado se compone de un sintagma verbal. Dicho sintagma puede ser, como vimos en el caso previo, de tipo verbal o copulativo, dependiendo de si se trata de un predicado verbal o nominal. Pero grandes rasgos, todo predicado está estructurado por: Un núcleo, que se corresponde con el verbo principal de la oración. Complementos verbales, que acompañan al verbo y le permiten expresar totalmente su contenido, es decir, lo complementan, como su nombre lo dice. Estos pueden ser: Complementos directos (u objetos directos). Abreviados como CD (u OD), se trata de los complementos típicos de un verbo transitivo, los cuales refieren al objeto sobre el cual recae la acción indicada por el verbo y desempeñada por el sujeto. Se le identifica fácilmente porque responde a la pregunta “¿qué cosa?” o al cambio por el pronombre “eso”. Por ejemplo: en “Mi gato caza ratones” el CD será ratones (“¿Qué cosa caza mi gato?”), y en “Mi gato tiene pulgas y garrapatas”, el CD será pulgas y garrapatas (“Mi gato tiene eso”). Complementos indirectos (u objetos indirectos). Abreviados como CI (u OI), son los complementos generalmente no obligatorios, que refieren al receptor, benefactor o perjudicado por la acción referida por el verbo. Suele responder a la pregunta “¿a quién?” o al cambio por el pronombre “le/les”. Por ejemplo: en “Mi gato rasguña al vecino”, el CI será al vecino (“¿A quién rasguña mi gato?”). Complementos circunstanciales. Consiste en un sintagma nominal, adverbial o preposicional que acompaña al verbo y señala alguna circunstancia temporal, espacial o de modo respecto de la acción referida. Los complementos circunstanciales más usuales son de: tiempo (CCT, responde a la pregunta “¿cuándo?”), de lugar (CCL, responde a la pregunta “¿dónde?”), de modo (CCM, responde a la pregunta “¿cómo?”), de causa (CCC, responde a la pregunta “¿por qué?”), de finalidad (CCF, responde a la pregunta “¿para qué?”), entre otros. Por ejemplo: “Mi gato come muy rápidamente” (CCM: muy rápidamente), “Mi gato come en la cocina” (CCL: en la cocina), “Mi gato comió ayer” (CCT: ayer). Complemento agente. Este complemento aparece únicamente en las oraciones en su forma pasiva, y consiste en un sintagma preposicional que, de estar la oración en su forma activa, correspondería al sujeto. Por ejemplo: en “Mi gato fue acariciado por el vecino”, el complemento agente será por el vecino, ya que si la oración estuviera en voz activa sería “El vecino acarició a mi gato”. Complemento de régimen verbal. En este caso nos referimos a un sintagma proposicional que no cumple funciones de CO, CI ni de CC, ni de agente ni atributo, sino que forma parte necesaria del modo sintáctico de expresarse del verbo. Son complementos meramente sintácticos, cuyas preposiciones son invariables, tales como atreverse a, acordarse de, burlarse de, etc. Por ejemplo: “Mi gato se atreve a maullar de madrugada” (CRV). Atributos. Los atributos son complementarios de los verbos copulativos generalmente, ya que se trata de adjetivos o sintagmas nominales que expresan cualidades, capacidades o rasgos del sujeto. Por ejemplo: en “Mi gato es persa con angora”, el verbo copulativo “ser” pide un atributo que es persa con angora. Oraciones con sujeto y predicado Las oraciones dotadas de sujeto y predicado discernibles se conocen como oraciones bimembres (o sea, de dos miembros). Entre ellas se incluye a las que poseen un sujeto tácito o un predicado elidido, porque en ambos casos se puede inferir el contenido ausente a partir del contexto. Algunos ejemplos de oraciones bimembres son: Mi padre limpia el patio con el rastrillo Sujeto: Mi padre Núcleo del sujeto: padre Predicado: limpia el patio con el rastrillo Núcleo del predicado: limpia Complemento directo: el patio Complemento circunstancial: con el rastrillo Los artistas fueron ovacionados por el público Sujeto: Los artistas Núcleo del sujeto: artistas Predicado: fueron ovacionados por el público Núcleo del predicado: fueron Atributo: ovacionados Complemento agente: por el público Un gato persa se pasea por el comedor Sujeto: Un gato persa Núcleo del sujeto: gato Predicado: se pasea por el comedor Núcleo del predicado: se pasea (pasearse) Complemento circunstancial: por el comedor LA COMUNICACIÓN La intención comunicativa y funciones del lenguaje La Habilidad de Escuchar COMPETENCIA GRAMATICAL O COMPETENCIA LINGÜÍSTICA Gramática: Niveles de estudio de la lengua Las Palabras LAS CATEGORÍAS GRAMATICALES Determinantes - El artículo El sustantivo El pronombre El adjetivo El verbo División de los verbos según su conjugación Clases de verbos según su significación Verbos copulativos Verbos predicativos Las perífrasis verbales El adverbio La interjección La preposición La conjunción LA ORACIÓN El Sujeto El Predicado Complemento Agente Complemento Directo Las perífrasis verbales Complemento indirecto Ejercicio: Análisis Morfológico y Sintáctico Una perífrasis verbal es una construcción de dos o más verbos que cumplen la función de uno solo. Dicha construcción está formada por un verbo conjugado en forma personal (simple o compuesto), un enlace o ausencia de éste (preposición o conjunción) y otro verbo en infinitivo, gerundio o participio. El verbo conjugado es el auxiliar y sólo entrega información acerca de la persona, número, modo o tiempo. Mientras que la forma no conjugada (verbo en infinitivo, gerundio o participio) entrega el significado argumental de la oración. Verbo conjugado en forma personal Preposición o Conjunción salió Verbo en infinitivo, gerundio o participio a Caminar llorando viene lavada El tenista fue a comprar una nueva raqueta. El verbo fue me indica: Modo Indicativo, pretérito perfecto, 3º persona singular. El verbo comprar nos expresa la acción principal que realiza el tenista. PERÍFRASIS CON INFINITIVO Acabar de + infinitivo El vendedor acaba de abrir la puerta Deber + infinitivo Las leyes deben estar claras. Volver a + infinitivo El perro volvió a entrar a la casa con las patas sucias PERÍFRASIS CON INFINITIVO Estar de + participio La ropa aún está mojada. Llevar + participio Lleva sentado más de una hora. Tener + participio Afortunadamente, tenía lavada la ropa. Quedar + participio ¿Quedó cerrado? PERÍFRASIS CON GERUNDIO Acabar + gerundio Finalmente, Sergio acabará asumiendo su error. llevar + gerundio ¡Descansa, llevas trabajando muchas horas seguidas! Salir + participio Anita salió cantando sin darse cuenta de mi llegada. Cuarto Quinto Nivel Autoevaluación 1. ¿Qué son las conjunciones? Conectores. Palabras de transición. Signos de puntuación. Pregunta 1 de 10 13/23 Cuarto Quinto Nivel Autoevaluación 2. Las conjunciones coordinantes: Permiten la creación de párrafos. Facilitan que el discurso sea formal. Unen dos ideas independientes. Pregunta 2 de 10 14/23 Cuarto Quinto Nivel Autoevaluación 3. Las conjunciones subordinantes: Enlazan dos oraciones de igual jerarquía. Unen una idea independiente y una subordinada. Tienen la característica de ser una sola palabra. Pregunta 3 de 10 15/23 Cuarto Quinto Nivel Autoevaluación 4. “A fin de” es un ejemplo de conector: De finalidad. De conclusión. Condicional. Pregunta 4 de 10 16/23 Cuarto Quinto Nivel Autoevaluación 5. Cuando se utilizan comillas, el punto va: Antes de las comillas de cierre. Después de las comillas de cierre. No se lo grafica cuando se utiliza comillas. Pregunta 5 de 10 17/23 Cuarto Quinto Nivel Autoevaluación 6. ¿Qué oración tiene un ejemplo de sustantivo común en el sujeto? César es mi gran amigo. Europa tiene alto índice de migración. El cortaúñas es muy grande. Pregunta 6 de 10 18/23 Cuarto Quinto Nivel Autoevaluación 7. ¿Qué es la oración bimembre? Una oración que tiene sujeto y predicado. Una oración que tiene dos sujetos conectados. Una oración que tiene dos verbos en diferentes posiciones. Pregunta 7 de 10 19/23 Cuarto Quinto Nivel Autoevaluación 8. ¿Qué es el verbo elidido? Verbo auxiliar. Verbo tácito. Verbo modal. Pregunta 8 de 10 20/23 Cuarto Quinto Nivel Autoevaluación 9. ¿Qué son los elementos paralingüísticos? Los elementos fónicos. Los elementos no lingüísticos. Los elementos gramaticales. Pregunta 9 de 10 21/23 Cuarto Quinto Nivel Autoevaluación 10. ¿Qué son los fenómenos prosódicos? Fenómenos gramaticales tenues. Fenómenos paralingüísticos de segunda categoría. Fenómenos fónicos. Pregunta 10 de 10 22/23 Conectores de la oración Conjunciones coordinantes: Estas conjunciones se utilizan para unir dos oraciones independientes que tienen lógica por sí solas. Ambos elementos tienen igual jerarquía sintáctica. Brindan una coordinación entre las dos ideas que tienen una misma jerarquía. Conectores de la oración https://www.elabueloeduca.com/apr ender/lengua/palabras/conjunciones. html https://www.ejemplos.co/conjuncion es-coordinantes/ https://www.ejemplos.co/nexossubordinantes/ Conjunciones subordinantes: Estas conjunciones se utilizan para unir una oración independiente que tienen lógica por sí sola y una dependiente, la cual no tienen sentido por sí sola. La coordinada como la subordinada pueden estar al inicio o al final de la oración. Locuciones conjuntivas: Casi todas las conjunciones subordinadas son locuciones conjuntivas entendiendo esta como dos o más palabras que adoptan una forma de conjunción, esto quiere decir que las conjunciones subordinadas en su mayoría no son solo una palabra como “para” sino que se componen de dos o más palabras como “por lo que,” “a fin de que.” Los signos de puntuación. Los signos de puntuación (la coma, el punto, los paréntesis, los puntos suspensivos, etc.) facilitan la lectura y la comprensión de los textos. Estos signos ortográficos desempeñan funciones diversas: pueden limitar la extensión de elementos de la oración, indicar la modalidad de un enunciado (si es enunciativo, interrogativo, exclamativo, imperativo, etc.) e incluso señalar la omisión de una parte del mismo. Los signos de puntuación en español son de uso OBLIGATORIO en la mayoría de los casos, pues su presencia o ausencia marca cambios de significado o son u reflejo de la función sintáctica de los componentes de una oración. Solo en determinados contextos el uso de los signos de puntuación es opcional y una cuestión de estilo personal del orador. La coma (,) es un signo de puntuación que sirve para delimitar unidades del discurso inferiores al enunciado o incisos que aportan información secundaria, también representa una pausa en la lectura. En determinados casos, el uso de las comas es opcional y responde al estilo del orador, quien decide cómo quiere presentar la información. El punto (.) se utiliza para marcar gráficamente el final de una oración enunciativa (afirmativa o negativa). El punto sigue las normas de escritura siguientes: • Se escribe pegado a la palabra que lo precede; • La palabra siguiente se escribe dejando un espacio libre; • La palabra siguiente se escribe siempre con mayúscula. El punto recibe distintos nombres según señale el final de un enunciado, de un párrafo o de un texto: • Punto y seguido: si a continuación, en el mismo párrafo, comienza otra oración. • Punto y aparte: si la oración a la que pone fin es la última del párrafo y en el renglón nuevo se inicia otro. • Punto final: si la oración a la que pone fin es la última del texto. https://espanol.lingolia.com/es/re daccion/signos-depuntuacion/punto#a-con-otrossignos-de-puntuacion El punto y coma (;) representa una pausa mayor que la de una coma y más débil que la de un punto. Se escribe sin separación con la palabra que lo precede y seguido de minúscula. En muchos casos, el punto y coma puede reemplazarse por otros signos de puntuación, como la coma, el punto y seguido o los dos puntos. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/punto-y-coma Los dos puntos (:) introducen algo relacionado con lo presentado en un párrafo o texto como: ejemplos, enumeraciones, explicaciones, conclusiones, etc. Después de los dos puntos se escribe minúscula, excepto cuando introducen un enunciado en estilo directo. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/dos-puntos#a-titulos-de-obras Los puntos suspensivos (…) son tres puntos consecutivos que se emplean para dejar un discurso en suspenso o interrumpirlo. Si se emplean al final del enunciado, la palabra de la siguiente oración (en el mismo párrafo o no) se escribe con mayúscula. Si no marcan el final del enunciado, y la oración continúa, la palabra siguiente se escribe con minúscula. Ejemplo: La noticia me pareció… bien, supongo. El ascenso de Julia… No estoy segura de que se lo mereciera más que yo. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/puntos-suspensivos El paréntesis ( ) enmarca un enunciado que aporta información adicional, secundaria o aclaratoria sobre el mensaje principal. El paréntesis lleva por regla general por fuera un espacio antes y después, pero no por dentro. Los incisos también pueden aislarse del resto del texto con comas o rayas. El aislamiento que ofrece el paréntesis es, no obstante, de mayor grado. El enunciado o frase dentro del paréntesis suele tener sentido pleno y no guarda necesariamente una relación o similitud sintáctica con el resto de elementos del texto principal. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/parentesis Bibliografía: • Cantú, L., Flores, J., Roque, M. (2005). Comunicación oral y escrita. México: continental. Compañía editorial • Espinosa, S. (1992). Manual de ortografía, aprender sonriendo. Bogotá: Norma. • Fonseca, S., Correa, A., Pineda, M., Lemus, F. (2011). Comunicación oral y escrita. México: México: Pearson. • Maqueo, A., (1995). Ortografía. México: Editorial Limusa, S.A. • Real Academia Española. (2002). Ortografía de la lengua española. Madrid: Espasa Calpe. • Viteri, E. (2003). Antología básica e historia del cuento ecuatoriano. Quito: Editor E. Viteri, ISBN 9978404783, 9789978404782 • https://espanol.lingolia.com/es/ Práctica en clase • Establecer una actividad pedagógica para el aprendizaje de los elementos abordados en clase: Conectores de la oración (conjunciones, signos de puntuación), elementos gramaticales (análisis del sujeto, elementos del predicado). Parámetros: • La actividad pedagógica debe cumplir con los siguientes pasos: tema, objetivos, metodología, desarrollo de contenido, recursos y evaluación. • El trabajo debe ser subido en el aula virtual en formato PDF o Word. • El trabajo debe llevar referencias y estar sustentado a partir de la normativa APA. • El trabajo debe ser presentado de manera grupal. Conectores de la oración Conjunciones coordinantes: Estas conjunciones se utilizan para unir dos oraciones independientes que tienen lógica por sí solas. Ambos elementos tienen igual jerarquía sintáctica. Brindan una coordinación entre las dos ideas que tienen una misma jerarquía. Conectores de la oración https://www.elabueloeduca.com/apr ender/lengua/palabras/conjunciones. html https://www.ejemplos.co/conjuncion es-coordinantes/ https://www.ejemplos.co/nexossubordinantes/ Conjunciones subordinantes: Estas conjunciones se utilizan para unir una oración independiente que tienen lógica por sí sola y una dependiente, la cual no tienen sentido por sí sola. La coordinada como la subordinada pueden estar al inicio o al final de la oración. Locuciones conjuntivas: Casi todas las conjunciones subordinadas son locuciones conjuntivas entendiendo esta como dos o más palabras que adoptan una forma de conjunción, esto quiere decir que las conjunciones subordinadas en su mayoría no son solo una palabra como “para” sino que se componen de dos o más palabras como “por lo que,” “a fin de que.” Los signos de puntuación. Los signos de puntuación (la coma, el punto, los paréntesis, los puntos suspensivos, etc.) facilitan la lectura y la comprensión de los textos. Estos signos ortográficos desempeñan funciones diversas: pueden limitar la extensión de elementos de la oración, indicar la modalidad de un enunciado (si es enunciativo, interrogativo, exclamativo, imperativo, etc.) e incluso señalar la omisión de una parte del mismo. Los signos de puntuación en español son de uso OBLIGATORIO en la mayoría de los casos, pues su presencia o ausencia marca cambios de significado o son u reflejo de la función sintáctica de los componentes de una oración. Solo en determinados contextos el uso de los signos de puntuación es opcional y una cuestión de estilo personal del orador. La coma (,) es un signo de puntuación que sirve para delimitar unidades del discurso inferiores al enunciado o incisos que aportan información secundaria, también representa una pausa en la lectura. En determinados casos, el uso de las comas es opcional y responde al estilo del orador, quien decide cómo quiere presentar la información. El punto (.) se utiliza para marcar gráficamente el final de una oración enunciativa (afirmativa o negativa). El punto sigue las normas de escritura siguientes: • Se escribe pegado a la palabra que lo precede; • La palabra siguiente se escribe dejando un espacio libre; • La palabra siguiente se escribe siempre con mayúscula. El punto recibe distintos nombres según señale el final de un enunciado, de un párrafo o de un texto: • Punto y seguido: si a continuación, en el mismo párrafo, comienza otra oración. • Punto y aparte: si la oración a la que pone fin es la última del párrafo y en el renglón nuevo se inicia otro. • Punto final: si la oración a la que pone fin es la última del texto. https://espanol.lingolia.com/es/re daccion/signos-depuntuacion/punto#a-con-otrossignos-de-puntuacion El punto y coma (;) representa una pausa mayor que la de una coma y más débil que la de un punto. Se escribe sin separación con la palabra que lo precede y seguido de minúscula. En muchos casos, el punto y coma puede reemplazarse por otros signos de puntuación, como la coma, el punto y seguido o los dos puntos. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/punto-y-coma Los dos puntos (:) introducen algo relacionado con lo presentado en un párrafo o texto como: ejemplos, enumeraciones, explicaciones, conclusiones, etc. Después de los dos puntos se escribe minúscula, excepto cuando introducen un enunciado en estilo directo. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/dos-puntos#a-titulos-de-obras Los puntos suspensivos (…) son tres puntos consecutivos que se emplean para dejar un discurso en suspenso o interrumpirlo. Si se emplean al final del enunciado, la palabra de la siguiente oración (en el mismo párrafo o no) se escribe con mayúscula. Si no marcan el final del enunciado, y la oración continúa, la palabra siguiente se escribe con minúscula. Ejemplo: La noticia me pareció… bien, supongo. El ascenso de Julia… No estoy segura de que se lo mereciera más que yo. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/puntos-suspensivos El paréntesis ( ) enmarca un enunciado que aporta información adicional, secundaria o aclaratoria sobre el mensaje principal. El paréntesis lleva por regla general por fuera un espacio antes y después, pero no por dentro. Los incisos también pueden aislarse del resto del texto con comas o rayas. El aislamiento que ofrece el paréntesis es, no obstante, de mayor grado. El enunciado o frase dentro del paréntesis suele tener sentido pleno y no guarda necesariamente una relación o similitud sintáctica con el resto de elementos del texto principal. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/parentesis Bibliografía: • Cantú, L., Flores, J., Roque, M. (2005). Comunicación oral y escrita. México: continental. Compañía editorial • Espinosa, S. (1992). Manual de ortografía, aprender sonriendo. Bogotá: Norma. • Fonseca, S., Correa, A., Pineda, M., Lemus, F. (2011). Comunicación oral y escrita. México: México: Pearson. • Maqueo, A., (1995). Ortografía. México: Editorial Limusa, S.A. • Real Academia Española. (2002). Ortografía de la lengua española. Madrid: Espasa Calpe. • Viteri, E. (2003). Antología básica e historia del cuento ecuatoriano. Quito: Editor E. Viteri, ISBN 9978404783, 9789978404782 • https://espanol.lingolia.com/es/ Práctica en clase • Establecer una actividad pedagógica para el aprendizaje de los elementos abordados en clase: Conectores de la oración (conjunciones, signos de puntuación), elementos gramaticales (análisis del sujeto, elementos del predicado). Parámetros: • La actividad pedagógica debe cumplir con los siguientes pasos: tema, objetivos, metodología, desarrollo de contenido, recursos y evaluación. • El trabajo debe ser subido en el aula virtual en formato PDF o Word. • El trabajo debe llevar referencias y estar sustentado a partir de la normativa APA. • El trabajo debe ser presentado de manera grupal. Cuarto Quinto Nivel 1/17 Cuarto Quinto Nivel 10.1. La tragedia La tragedia es un arte que se lo expresa de manera literaria, teatral o dramática a fin de dar a conocer hechos de la vida real que acongojan o generan un conflicto a un pueblo, a la sociedad o a una persona en particular. Se caracteriza porque la conclusión no es la esperada y genera sentimientos de tristeza tanto en sus personajes protagónicos como en el público. A diferencia de otros géneros, en la tragedia no se llega a un final feliz, por el contrario, Aristóteles acuñó el término “hamartia” para expresar la causa que conduce a esta tragedia final; este término significa error fatal o pegado. A pesar de que la tragedia se hunde en eventos desafortunados, sus personajes heroicos o de la realeza buscan incansablemente solucionar los errores, pero no lo logran. El lenguaje utilizado en la tragedia es literario, culto o solemne, pues los personajes protagónicos son ilustres y representan no solo a ellos mismos sino a una cultura en general o a un grupo de nombres que se ven envueltos en un error fatal que desenlaza tristemente en su fin sea por muerte o cualquier otro hecho trágico. 2/17 La tragedia es un arte que se lo expresa de manera literaria, teatral o dramática a fin de dar a conocer hechos de la vida real que acongojan o generan un conflicto a un pueblo, a la sociedad o a una persona en particular. Se caracteriza porque la conclusión no es la esperada y genera sentimientos de tristeza tanto en sus personajes protagónicos como en el público. A diferencia de otros géneros, en la tragedia no se llega a un final feliz, por el contrario, Aristóteles acuñó el término “hamartia” para expresar la causa que conduce a esta tragedia final; este término significa error fatal o pegado. A pesar de que la tragedia se hunde en eventos desafortunados, sus personajes heroicos o de la realeza buscan incansablemente solucionar los errores, pero no lo logran. El lenguaje utilizado en la tragedia es literario, culto o solemne, pues los personajes protagónicos son ilustres y representan no solo a ellos mismos sino a una cultura en general o a un grupo de nombres que se ven envueltos en un error fatal que desenlaza tristemente en su fin sea por muerte o cualquier otro hecho trágico. Historia de la tragedia La tragedia tiene raíces griegas y mitológicas, pues nace como reverencia al dios Dioniso que era un dios hijo de Zeus y Sémele; Afrodita, quien era también venerada como diosa de la fertilidad, era su abuela. Esta deidad era considerada como el dios de la fertilidad y el vino. Los griegos le rendían culto para que sus cosechas y sus mujeres se vean fértiles, para lo cual creaban canciones y hacían sacrificios, de estas canciones nace la tragedia. Los primeros autores que desarrollan este género literario son: Tespis, un dramaturgo que pasó a la historia como el primer actor y además el padre del teatro y Frínico, quien a su vez fue un poeta trágico. Objetivo La tragedia trata de llegar al público dando a conocer que no siempre es posible alcanzar el bien por más que se lo intente, y además que los finales felices para la gente que hace el bien no son siempre los esperados. Un solo error puede crear situaciones difíciles e imposibles de controlar llevando a personajes aún sin merecerlo a finales trágicos. Características del género trágico o El infortunio como su característica principal. o Manifestaciones culturales empáticas con el público. o Connotación moral y ética. o Crítica social. o Emotivo, brinda una reflexión final. o En la antigüedad, dedicado a deidades y en la época moderna, a la naturaleza humana. o Desenlace fatal y caída del protagonista. o Presentación por medio de escenas. o Uso de escenarios llamativos acordes a cada escena. Autores destacados en el género de la tragedia - Esquilo. Es considerado como el padre de la tragedia griega y como su primer representante, además de ser él quien introduce máscaras, coros y coturnos (calzado de corcho utilizado en la antigua Roma). Con él empieza la tragedia a ser presentada sobre la base de una trilogía. Pasa de un monólogo, que era costumbre en otros géneros, a ser personificada por diferentes actores. La producción literaria de Esquilo se caracterizaba por mantener la solemnidad en sus obras enfocadas al culto de los dioses griegos y a la sublimidad de sus personajes. - Sófocles. Fue un poeta griego que desarrolló en grandes obras el género de la tragedia. De sus varias obras solo se conservan siete, entre ellas Antígona, que se desarrolla en el género trágico y es representada bajo el mito del mismo nombre. Sus obras, a diferencia de las de Esquilo, no se caracterizaban por la sublimidad de sus personajes como héroes o dioses, sino que introducía personajes más simples con los cuales su público se sentía conectado. Fue el primero que incluye una escenografía para que la obra tenga lugar y sea más realista y llamativa. De la mano de Sófocles, evoluciona el género dramático. - Eurípides. Entre los tres grandes poetas que dieron vida a la tragedia, Eurípides es uno de ellos. Se diferencia de los dos anteriores porque presenta de manera más técnica la evolución de los personajes haciendo a la tragedia más emotiva y empática con el público, pues se aleja de los personajes sobrenaturales y heroicos bendecidos por las deidades y se enfoca en un realismo de personajes más humanos que no logran contener sus impulsos que son los que los lleva a su final trágico. La tragedia griega Grecia fue la cuna de la cultura y de las artes, no podía ser la excepción, fue la cuna de los géneros literarios, en este caso de la tragedia. Los tres grandes autores que constan en la historia griega como los pioneros de la tragedia son: Esquilo, Sófocles y Eurípides. La tragedia tuvo un inicio basado en la mitología debido a que de las canciones ofrecidas a Dionisio, siendo canciones trágicas que invocaban su ayuda al no poder alcanzar el bien, nace la tragedia. La tragedia griega ha tenido una evolución de 2000 años. Incluso siendo poco conocida en la Edad Media, tomó ya varias obras con estilo trágico y fue considerada como un estilo genérico del drama; sin embargo, la tragedia tiene un final trágico a diferencia del drama que después de las situaciones puede concluir con un fin satisfactorio. Obras trágicas reconocidas o Los siete contra Tebas o Las suplicantes o La Orestíada o Áyax o Filoctetes o Edipo Rey o Medea o Las troyas o Hipólito La tragedia moderna Durante el Renacimiento, las antiguas tradiciones se reconcilian con el escenario político y las artes. En este tiempo, empieza la tragedia a tomar nueva connotación en la cultura y en la sociedad creciente que abría la puerta a una amalgama de tradiciones más allá de las religiosas. Una obra trágica reconocida hasta nuestro tiempo es Hamlet de Shakespeare. Autores como Calderón de la Barca, Tirso de Molina, Lope de Vega, Goethe, Voltaire, Lemercier, entre otros, enriquecen el género con sus obras. En la actualidad, personajes femeninos y actuación de mujeres, que en la antigüedad estaba prohibido, son introducidos con gran aceptación, llegando al público la tragedia de manera más libre y abierta con respecto a la desarrollada en Grecia. La tragedia ya no se desarrolla como género literario en su pureza, sino que ha dado paso al teatro y a la dramaturgia que es más desarrollada con tintes trágicos. Cuarto Quinto Nivel 10.2. La comedia La comedia es uno de los cinco artes dramáticos mayores. La comedia tiene un desarrollo opuesto a la tragedia, ya que siempre tiene un final feliz y las situaciones que se desarrollan causan agrado y despiertan la simpatía del público al ser consideradas jocosas y risibles, a pesar de que ambas comparten el mismo origen como parte del culto al dios Dionisio; por lo tanto, su origen también se basa en la mitología griega. Es considerada un género dramático realista porque tiene una ruptura con el romanticismo y la formalidad; utiliza un lenguaje regular y hasta obsceno en ocasiones. Autores destacados - Aristófanes. Fue un comediante griego que desarrolló sátiras con tinte cultural o como denuncia de ciertas situaciones habituales que tomaban lugar en la sociedad. - Menandro. Se le atribuye la evolución del género cómico. Fue griego al igual que Aristófanes; es quien promueve el género cómico cuando se da la conquista romana. Suprime los coros y da al público una posición activa en la cual se siente identificado y participa en el desarrollo de la obra. - Plauto. Actor cómico que hereda la línea teatral de Menandro, incluye el gesto y la exageración de la obra cómica llevándola así a elevados niveles de empatía. No era difícil para él realizar gestos que provoquen risas pues sus inicios fueron de mimo y de payaso. 3/17 La comedia es uno de los cinco artes dramáticos mayores. La comedia tiene un desarrollo opuesto a la tragedia, ya que siempre tiene un final feliz y las situaciones que se desarrollan causan agrado y despiertan la simpatía del público al ser consideradas jocosas y risibles, a pesar de que ambas comparten el mismo origen como parte del culto al dios Dionisio; por lo tanto, su origen también se basa en la mitología griega. Es considerada un género dramático realista porque tiene una ruptura con el romanticismo y la formalidad; utiliza un lenguaje regular y hasta obsceno en ocasiones. Autores destacados - Aristófanes. Fue un comediante griego que desarrolló sátiras con tinte cultural o como denuncia de ciertas situaciones habituales que tomaban lugar en la sociedad. - Menandro. Se le atribuye la evolución del género cómico. Fue griego al igual que Aristófanes; es quien promueve el género cómico cuando se da la conquista romana. Suprime los coros y da al público una posición activa en la cual se siente identificado y participa en el desarrollo de la obra. - Plauto. Actor cómico que hereda la línea teatral de Menandro, incluye el gesto y la exageración de la obra cómica llevándola así a elevados niveles de empatía. No era difícil para él realizar gestos que provoquen risas pues sus inicios fueron de mimo y de payaso. Tipos de comedia Al referirnos al género dramático y dentro de ella como género mayor a la comedia, siendo de mayor agrado del público, esta ha sido utilizada hasta la actualidad para denunciar de manera jocosa situaciones sociales que aquejan a una realidad. Por ejemplo, Cantinflas y Los Simpson son comedias que topan puntos sensibles sociales que siempre terminan de manera positiva para los personajes. Entre los tipos de comedia podemos nombrar: Comedia musical Es una representación musical que se enfoca en la comedia introduciendo diferentes números como bailes, música, teatro. Comedia de enredos Es un tipo de comedia que se basa en la intriga y en la trama complicada pero, a la vez, graciosa. Comedia griega Nace como una sátira política que tenía lugar en vivo denunciando situaciones de manera incluso grotesca para concienciar a los espectadores de las consecuencias de estos actos de manera cómica. Comedia de caracteres Tiene un personaje central alrededor de quien se desarrolla la obra. Este personaje es hilarante y resalta entre los demás convirtiéndolo en el personaje que transmite un mensaje. Comedia bandoleros El bandolero siempre ha llamado la atención, en este caso es el protagonista central, pero su accionar un tanto cómico o quien no puede evitar situaciones cómicas, provoca risas y, a la vez, cuenta una historia. Comedia burlesca Es un tipo de obra disparatada donde al parecer las situaciones son exageradas y fuera de todo contexto; sin embargo, presenta situaciones paradójicas con base en la realidad. Comedia de capa y espada Es una pieza teatral que proliferó en el Siglo de Oro por la coherencia de las ideas presentadas y, a la vez, con matiz hilarante que se desarrolla con personales nobles. Comedia de figurón Los figurones son personajes cómicos. Este subgénero nace de la mano de Alonso de Castillo Solórzano como continuación de la comedia de capa y espada. Comedia de magia A partir de los milagros que llamaban la atención de las personas, nace la comedia de magia, que se basó en efectos espectaculares alrededor de la magia blanca. Comedia mitológica Regresando a sus raíces, este tipo de comedia basada en la mitología griega y en la romana se fundamentó en la personificación de los dioses y en situaciones en las que sus decisiones intervenían en la vida de los humanos. Comedia negra Esta comedia estuvo mal vista en sus inicios ya que trataba sobre temas tabúes para la época e incluso hoy en día se trata de comedia negra de temas que usualmente pertenecerían al drama o a la tragedia. Comedia nueva Se conoce como comedia nueva a los parámetros que Lope de Vega puso como pauta de refrescar la comedia mediante su verso “Arte Nuevo de hacer comedias” en el cual se aparta de los modelos clásicos y amplía la forma de hacer comedia de manera más libre. Comedia palatina Este tipo de comedia se basa en personales de la nobleza en general. Se desarrolló bajo un mismo guion en el cual el personaje noble se siente atraído por una persona que no pertenece a su mismo nivel. Comedia de privanza Desmonta a la nobleza y a los personajes nombres como superiores y los presenta de manera cómica como personas normales, algunos de ellos que no han sido siempre nobles y van ascendiendo a la realeza volviéndose caprichosos y hasta, cierto punto, ridículos tratando de encajar. Comedia pastoral Este subgénero se desarrolla con un tinte romántico entre pastores y cómo se dan sus amores y desamores. Es interesante ver cómo las historias contadas de manera narrativa van tomando giros cómicos y responden al manejo del romance en cada época. Comedia romana La comedia es un género que nace en Grecia. Una vez que Roma conquista Grecia, esta comedia se desarrolla y se centra en divertir a los romanos. Se basa en su cultura o a veces en las conquistas. Comedia sentimental Este subgénero no es únicamente basado en el amor de pareja, sino en toda relación de sentimientos y ternura que lleva consigo una moraleja. Comedia satírica La sátira es un tipo de comedia que critica temas no cómicos como la política; se centra en ridiculizar a personajes y a determinadas situaciones de la vida real. La comedia en la actualidad ha sido desarrollada cinematográficamente y por la pantalla chica pues aún cuenta con gran aceptación por parte del público. Rompe las limitaciones establecidas en la comedia antigua y hoy en día no se utiliza la comedia con el fin de hacer denuncias sociales, aunque algunos programas así lo manejan, la mayoría se basa en hacer reír al público. Cuarto Quinto Nivel Autoevaluación 1. ¿A qué grupo dramático pertenece la tragedia? Menor. Mayor. Subgénero. Pregunta 1 de 10 7/17 Cuarto Quinto Nivel Autoevaluación 2. ¿A qué grupo dramático pertenece la comedia? Mayor. Menor. Subgrupo. Pregunta 2 de 10 8/17 Cuarto Quinto Nivel Autoevaluación 3. ¿Qué lenguaje emplea la tragedia? Vulgar. Arbitrario. Solemne. Pregunta 3 de 10 9/17 Cuarto Quinto Nivel Autoevaluación 4. ¿Qué lenguaje emplea la comedia? Formal y solemne. Coloquial y jocoso. Lineal y claro. Pregunta 4 de 10 10/17 Cuarto Quinto Nivel Autoevaluación 5. ¿De qué trata la tragedia? De hechos o conflictos de la vida real. De hechos o conflictos fatales. De hechos o conflictos alegres. Pregunta 5 de 10 11/17 Cuarto Quinto Nivel Autoevaluación 6. ¿De qué trata la comedia? De situaciones jocosas. De escenas desarrolladas en medio de coros. De tragedias formales y bien estructuradas. Pregunta 6 de 10 12/17 Cuarto Quinto Nivel Autoevaluación 7. ¿Cómo se desencadena el fin de la tragedia? Misteriosamente. Jocosamente. Tristemente. Pregunta 7 de 10 13/17 Cuarto Quinto Nivel Autoevaluación 8. ¿Cuáles son las raíces de la tragedia? Mitología nórdica. Mitología griega. Mitología romana. Pregunta 8 de 10 14/17 Cuarto Quinto Nivel Autoevaluación 9. ¿Quién introduce por primera vez la escenografía a las obras trágicas? Sófocles. Esquero. Aristóteles. Pregunta 9 de 10 15/17 Cuarto Quinto Nivel Autoevaluación 10. ¿Cuál es un ejemplo de comedia con denuncia social? Los Simpson. Son como niños. El chavo. Pregunta 10 de 10 16/17 Géneros Literarios https://www.youtube.com/watch?v=ue6R6bE_lhY El TEXTO LITERARIO es aquel que usa el lenguaje literario y que persigue un fin estético para captar el interés del lector. El autor de literatura busca los elementos sintácticos adecuados para expresar sus ideas de manera depurada y según un criterio de estilo. Se denomina género literario a cada una de las clases en que se dividen los textos literarios, escritos por los autores con una finalidad determinada. https://www.youtube.com/watch?v=41j4C-Jq7yE Cada género literario comprende, a su vez, otros subgéneros literarios. 1.Género lírico: Se usa para expresar sentimientos y para ello, emplea generalmente el verso. 2.Género narrativo: Se utiliza para presentar historias realizadas por personajes que pueden intervenir mediante el diálogo. El narrador cuenta la historia y para ello puede utilizar distintas formas de elocución, esto es, la narración, la descripción, la exposición o la argumentación. 3.Género dramático: Es aquél destinado a ser representado ante unos espectadores. Los personajes intervienen sin la mediación de ningún narrador, siguiendo las indicaciones sobre vestuario, gestos, movimientos, etc. que contienen las acotaciones del texto teatral. Subgéneros literarios • Canción: poema de tema amoroso. • Elegía: poema en el que se llora la muerte de un ser querido. Subgéneros líricos: • Oda: poema que trata un tema serio y elevado. • Sátira: poema utilizado para ridiculizar a alguien o a algo. • Égloga: poema extenso con temas de la naturaleza y ambiente pastoril. • Cuento: narración breve con pocos personajes y con el tiempo y espacio escasamente desarrollados. • Novela: narración más extensa y compleja que el cuento donde aparece una trama complicada o intensa, personajes sólidamente trazados, ambientes descritos, creando un mundo autónomo e imaginario. Subgéneros narrativos • Poema épico: Relata las hazañas heroicas con el propósito de glorificar hazañas. Por ejemplo, La Eneida, de Virgilio. • Cantar de gesta: Poema escrito para ensalzar la acción de un héroe. Por ejemplo, el Poema de Mío Cid. • Romance: Poema épico-lírico usado para narrar hazañas o hechos de armas. • Comedia: Desarrolla conflictos divertidos y amables, con personajes pertenecientes al mundo de la normalidad. Subgéneros dramáticos • Drama: Los personajes luchan contra la adversidad, que suele reflejar sus vicisitudes y peligros. Pueden intervenir elementos cómicos y entonces toma el nombre de tragicomedia. • Tragedia: Presenta terribles conflictos entre personajes nobles, ilustres o héroes- que son víctimas de pasiones o fatalidades que les llevan a un desenlace funesto. • Otros subgéneros dramáticos: el auto sacramental, el entremés, el paso, el melodrama, etc. Bibliografía Castro Robaina, Israel. (2016). "¿Muerte de la tragedia?". México: Primer Acto. Colomer, Josep. (1990). La comedia politica. Barcelona: Enlace. López Fonseca, Antonio. (2000). La comedia latina: una aproximación a la literatura dramática desde la perspectiva del género y la recepción. Cuadernos de filología italiana, ISSN 1133-9527, Nº. 7. Actividad de aprendizaje N°9 • Desarrollar una grabación de la implementación de una actividad de aprendizaje en relación a los géneros literarios. Parámetros: - Deben escoger un subgénero literario (novela, comedia, tragedia, cuento, etc.) para implementar la actividad. - La actividad de aprendizaje debe ser grabada en un formato de video (debe durar entre 5 a 10 minutos) - Se debe grabar el desarrollo de la actividad (la explicación de la actividad y la implementación didáctica). - El video debe ser subido en el aula virtual dentro de un enlace. - El trabajo es grupal. - El trabajo debe ser creativo y recursivo. Cuarto Quinto Nivel 1/17 Cuarto Quinto Nivel 11.1. El drama El drama es considerado el primer género literario que existió en Grecia del cual se desprenden los demás y de estos, los subgéneros. La palabra drama de hecho significa en griego actuar. Esta actuación puede ser presentada de varias maneras (literarias, teatrales, musicales) por una persona (en un monólogo) o por un grupo de actores o artistas. El drama tiene la particularidad de que los hechos no se cuentan ni se desarrollan por medio de un relato, sino que se actúan y se dan vida. Historia del género dramático Como la mayoría de los géneros literarios, el drama tuvo sus orígenes en Grecia con el culto a las deidades griegas y en especial a Dioniso, quien era venerado como el dios de la fertilidad y del vino, a quien se debían las buenas o las malas cosechas. Como en estos inicios el drama rendía pleitesía, se lo hacía de manera solemne y formal, tipo cánticos, después se fueron introduciendo otras aristas como música y personajes, así se desarrolla el drama. A inicios de la Edad Media, el género dramático fue olvidado y resurge una vez más de manera religiosa para personificar escenas del evangelio en fechas importantes para la religión cristiana. Desde entonces es retomado en diferentes ámbitos e idiomas, siendo la obra Auto de los Reyes Magos la primera obra que se escribió en castellano de manera completa, aunque anónima. Características principales del drama 2/17 El drama es considerado el primer género literario que existió en Grecia del cual se desprenden los demás y de estos, los subgéneros. La palabra drama de hecho significa en griego actuar. Esta actuación puede ser presentada de varias maneras (literarias, teatrales, musicales) por una persona (en un monólogo) o por un grupo de actores o artistas. El drama tiene la particularidad de que los hechos no se cuentan ni se desarrollan por medio de un relato, sino que se actúan y se dan vida. Historia del género dramático Como la mayoría de los géneros literarios, el drama tuvo sus orígenes en Grecia con el culto a las deidades griegas y en especial a Dioniso, quien era venerado como el dios de la fertilidad y del vino, a quien se debían las buenas o las malas cosechas. Como en estos inicios el drama rendía pleitesía, se lo hacía de manera solemne y formal, tipo cánticos, después se fueron introduciendo otras aristas como música y personajes, así se desarrolla el drama. A inicios de la Edad Media, el género dramático fue olvidado y resurge una vez más de manera religiosa para personificar escenas del evangelio en fechas importantes para la religión cristiana. Desde entonces es retomado en diferentes ámbitos e idiomas, siendo la obra Auto de los Reyes Magos la primera obra que se escribió en castellano de manera completa, aunque anónima. Características principales del drama - Representación pública Final feliz o dramático Personificación de los caracteres Desarrollo actuado o cantado de la obra Tiene inicio, nudo y conclusión Autores destacados - Tespis Esquilo Sófocles Terencio Séneca - Plauto Actualmente, el género dramático y el teatro se han separado con base a los elementos que intervienen en cada uno. Adicional, el género dramático que antes era considerado como género mayor, siendo el drama y la comedia subgéneros, en la actualidad, los tres forman parte del grupo de géneros mayores. El drama se divide en: - Géneros realistas Géneros simbólicos Actualmente, el drama se ha desarrollado como género cinematográfico y se centra principalmente en el amor. Obras antiguas destacadas del género dramático - Agamenón Sobre el daño que ocasiona el tabaco Ubú Rey La cantante calva Recursos expresivos del drama - El diálogo El soliloquio o monólogo El aparte El mutis El drama y el teatro En la antigüedad, se concebía al teatro como una forma de poner en marcha al género dramático; sin embargo, hoy en día se separan por los matices que cada uno presenta y por la forma de ser evaluados. El drama se caracteriza por los diálogos y el teatro, por la escenificación. El drama y la comedia El drama es catalogado como el primer género artístico del cual se desprenden los demás como subgéneros; sin embargo, por la evolución de cada uno, se trata en la actualidad, aunque no todos concuerdan, de cinco a siete géneros mayores y varios subgéneros. El drama y la comedia están entre los géneros dramáticos mayores. La comedia es considerada dentro del género dramático a toda representación teatral que no pertenezca a otro género mayor y que tiene una característica específica. El drama satírico La sátira es una de las características de la comedia que es otro de los géneros mayores. La comedia se basa en que todo el desarrollo se realiza en actos risibles, a diferencia del drama satírico que desarrolló sus escenas a partir de una base dramática con tinte satírico que no siempre tienen finales felices. Tipos de drama - Histórico Isabelino - Lírico Litúrgico De la pasión - Social Satírico - Escolar Abstracto En general, es considerado como drama todo evento que puede conmover al público, incluso fuera del escenario pudiendo ser clasificados como dramas eventos de la vida real. El arte moderno es dominado por dramaturgos como Henrik Ibsen y Bertolt Brecht. Cuarto Quinto Nivel 11.2. La tragicomedia La tragicomedia en sus inicios fue considerada como subgénero del género dramático; actualmente, es uno de los géneros dramáticos mayores. En la tragicomedia, los elementos trágicos y los cómicos se mezclan para crear una obra que conmueva en ambos aspectos (el triste y el alegre). La conclusión de la tragicomedia no se puede suponer por los hechos pues puede ser feliz o triste, lo esperado o inesperado juega un papel primordial. La tragicomedia o drama satírico, como todo género literario, tiene sus orígenes en Grecia. A pesar de alejarse de las raíces mitológicas, los temas que toca son de conocimiento popular. El primer gran autor que defiende la tragicomedia como género híbrido pero independiente es Plauto, quien no tuvo aceptación de primera mano; por el contrario, fue rechazado pues la situación de que algo cómico involucre a la vez tragedia o lo contrario, no se aceptaba ya que se percibía a la tragedia como algo sublime y que esta se mezcle con algo grotesco o burlesco no conformaba al público; con el aparecimiento del teatro del absurdo, este género híbrido fue aceptado. Autores destacados de la tragicomedia - Vaudeville Plauto Robert Garnier Lope de Vega Shakespeare 3/17 La tragicomedia en sus inicios fue considerada como subgénero del género dramático; actualmente, es uno de los géneros dramáticos mayores. En la tragicomedia, los elementos trágicos y los cómicos se mezclan para crear una obra que conmueva en ambos aspectos (el triste y el alegre). La conclusión de la tragicomedia no se puede suponer por los hechos pues puede ser feliz o triste, lo esperado o inesperado juega un papel primordial. La tragicomedia o drama satírico, como todo género literario, tiene sus orígenes en Grecia. A pesar de alejarse de las raíces mitológicas, los temas que toca son de conocimiento popular. El primer gran autor que defiende la tragicomedia como género híbrido pero independiente es Plauto, quien no tuvo aceptación de primera mano; por el contrario, fue rechazado pues la situación de que algo cómico involucre a la vez tragedia o lo contrario, no se aceptaba ya que se percibía a la tragedia como algo sublime y que esta se mezcle con algo grotesco o burlesco no conformaba al público; con el aparecimiento del teatro del absurdo, este género híbrido fue aceptado. Autores destacados de la tragicomedia - Vaudeville Plauto Robert Garnier - Lope de Vega Shakespeare Obras destacadas basadas en la tragicomedia - La Celestina (La tragicomedia de Calisto y Melibea) La dama boba “El Cid” de Corneille - Anfitrión Las características principales de la tragicomedia se basan primero en la mezcla de tragedia y comedia, De la mano de estos géneros mayores, se da una fusión de las características de cada uno, es decir, existen momentos en la obra en los que el público se sentirá conmovido por lo que está viendo, leyendo o escuchando; sin embargo, el lenguaje también puede tornarse grotesco o satírico pues este también es característica de la comedia; así, con diferentes sentimientos, se llegará a una conclusión que puede o no ser la esperada. El lenguaje usualmente utilizado en la tragicomedia es simple con tintes satíricos y hasta grotescos. El sarcasmo es una forma de expresar de manera sutil e indirecta las situaciones de desagrado. Este género fue utilizado para inculcar valores cásicos por parte de los jesuitas. Cuarto Quinto Nivel 11.3. El auto sacramental El auto sacramental es considerado un género dramático mayor de clase litúrgico. En algunas clasificaciones se lo considera subgénero, sin embargo, cuenta con sus características, expositores y obras que lo han situado como género mayor. El auto sacramental es una obra religiosa que se basa en la personificación de parábolas o historias bíblicas que usualmente se representaban durante la Semana Mayor o en fechas de trascendencia cristiana como la Navidad. El nombre auto sacramental surge a mediados del siglo XVI. Antes de esta época, toda obra que representaba el culto a lo religioso, sea cristiano o pagano, era considerada como misteriosa y respetada, era parte del drama religioso; sin embargo, por sus características propias, se desprende del género dramático. Su auge fue durante el Siglo de Oro cuyo fin era consolidar la Contrarreforma, que era la respuesta de la Iglesia católica contra la Reforma de Martín Lutero. 4/17 El auto sacramental es considerado un género dramático mayor de clase litúrgico. En algunas clasificaciones se lo considera subgénero, sin embargo, cuenta con sus características, expositores y obras que lo han situado como género mayor. El auto sacramental es una obra religiosa que se basa en la personificación de parábolas o historias bíblicas que usualmente se representaban durante la Semana Mayor o en fechas de trascendencia cristiana como la Navidad. El nombre auto sacramental surge a mediados del siglo XVI. Antes de esta época, toda obra que representaba el culto a lo religioso, sea cristiano o pagano, era considerada como misteriosa y respetada, era parte del drama religioso; sin embargo, por sus características propias, se desprende del género dramático. Su auge fue durante el Siglo de Oro cuyo fin era consolidar la Contrarreforma, que era la respuesta de la Iglesia católica contra la Reforma de Martín Lutero. Autores destacados del auto sacramental - Diego Sánchez de Badajoz Pedro Calderón de la Barca Tirso de Molina Lope de Vega Lucas Fernández Gil Vicente Hernán López de Yaguas José Clavijo y Fajardo Nicolás Fernández de Moratín La puesta en escenario de los auto sacramentales tuvo varios oponentes quienes consideraban que interpretar partes bíblicas y hacer de ellas comedia era blasfemo y perjudicial para la moral y la religión, por lo que durante varias épocas fueron prohibidos y olvidados. En la actualidad, junto con la generación de escritores y poetas del siglo XX, llamados la Generación del 27, se ha tratado de revivir y mantener el auto sacramental como un género propio y mayor. Características del auto sacramental - Basado en drama alegórico y litúrgico. Influencia de la apoteosis eucarística. Auge durante el Corpus Christi. Representación de parábolas. Lenguaje formal, ilustre o cómico. Tipos de obras auto sacramentales Pastorelas Son unas formas musicales con ritmo sencillo y alegre, su auge se dio en los autos de Navidad. Son una parodia entre el bien y el mal. Auto bíblico Se enfocan en parábolas bíblicas y su representación es solemne. Auto teológico Su fin es dar a conocer las bondades y los atributos de Dios y cómo su bondad ha ayudado a los humanos desde su creación. Auto hagiográfico Representación de cada uno de los santos dando a conocer cómo fue su vida y su consagración a la espiritualidad. Investigación y Postgrado versión impresa ISSN 1316-0087 Investigación y Postgrado v.18 n.2 Caracas oct. 2003 Servicios Personalizados Revista SciELO Analytics IMPACTO DE LAS ACTIVIDADES DRAMÁTICAS EN LA COMPETENCIA COMUNICATIVA EN INGLÉS Rosaura Hernández Ávila (UPEL-IPB) rha82000@yahoo.com Rosaura Hernández Ávila Profesora de Inglés egresada del Instituto Pedagógico de Barquisimeto (1993). Magister en Educación, Mención Enseñanza de la Literatura en Inglés, egresada del Instituto Pedagógico de Caracas (2001). Sus áreas de interés incluyen el desarrollo de la lecto-escritura en inglés y la enseñanza de la cultura a través de la literatura. Actualmente es miembro del Consejo Técnico Asesor de Investigación del Instituto Pedagógico de Barquisimeto. Correo electrónico: rha82000@yahoo.com Articulo Articulo en XML Referencias del artículo Como citar este artículo SciELO Analytics Traducción automática Enviar articulo por email Indicadores Links relacionados Compartir Otros Otros RESUMEN Permalink Esta investigación es un estudio de carácter descriptivo que determinó el tipo de impacto que las actividades dramáticas tienen en la competencia comunicativa de los participantes del Club de Teatro en Inglés del Departamento de Idiomas Modernos del Instituto Pedagógico de Barquisimeto. Para ello, los estudiantes fueron entrevistados con un cuestionario de 40 items, a fin de analizar las discrepancias de medias entre el impacto esperado y el impacto percibido al realizar actividades dramáticas. Además, se consultó a los coordinadores del Club para precisar su opinión sobre la competencia comunicativa en inglés de los miembros. Después de aplicarse la técnica estadística de la Prueba t de Student Pareada o Correlacionada, se encontró que las diferencias de medias entre los dos impactos no resultaron significativas; en cuanto a las opiniones de los coordinadores, éstas revelaron que los alumnos han desarrollado una buena competencia comunicativa en inglés, además de que la actividad contribuyó a su formación tanto personal como profesional. Palabras clave: impacto; actividades dramáticas; competencia comunicativa. IMPACT OF DRAMA IN COMMUNICATIVE COMPETENCE IN ENGLISH ABSTRACT This research is a descriptive study with the intention to determine the type of impact produced in the communicative competence in English when drama was implemented by the participants of the English Theatre Club of the Modern Languages Department at the Instituto Pedagógico de Barquisimeto. In order to contrast mean variations between the expected impact and the perceive impact of this activity students answered a 40 items questionnaire. In addition, the coordinators were consulted regarding the communicative competence of the club members in the target language. After applying the Paired or Correlated Student t Test, no significant difference was found between the expected and perceived mean. In terms of coordinator opinions, they pointed to students good development of their communicative competence in English as well as a personal and professional improvement. Key words: impact; drama; communicative competence. Contexto En 1998, específicamente el 2 de abril, se realizó en Estocolmo, Suecia, la Conferencia Intergubernamental sobre Políticas Culturales para el Desarrollo, promovida por la UNESCO (Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura), en la cual fue aprobado un Plan de Acción que formula las prioridades de la sociedad moderna sobre la cultura y la cohesión social. En esta conferencia, se destaca lo que se entiende por cultura que en su sentido más amplio, puede considerarse actualmente como el conjunto de los rasgos distintivos, espirituales y materiales, intelectuales y afectivos que caracterizan una sociedad o un grupo social. Ella engloba, además de las artes y las letras, los modos de vida, los derechos fundamentales del ser humano, los sistemas de valores, las tradiciones y las creencias. Se puede vislumbrar a través de esta definición que el hombre de hoy en día y de cualquier nación necesita conocer y valorar, no sólo su propia tradición, sino también la de otros pueblos para poder así enfrentar los desafíos planteados por una globalización que acerca cada vez más a los ciudadanos del mundo actual. El conocer otras comunidades permite estrechar y consolidar los lazos entre las naciones lo cual tiene como aspectos favorables el diálogo, la coexistencia pacífica y la creación de un medio humano favorable para el desarrollo sostenible de los pueblos. En esta conferencia se reconoció la importancia que tiene el hecho cultural en el desarrollo de los países, se plantearon diversas políticas, entre las cuales se destacó: promover la creatividad y la participación en la vida cultural. A partir de este objetivo se plantean dos acciones primordiales para ser llevadas a cabo en el ámbito educativo: a) promover el conocimiento y la comprensión de la diversidad cultural y lingüística, fortaleciendo el contenido cultural en la educación formal y no formal, en particular incitando el aprendizaje de uno o más idiomas extranjeros y, b) promover nuevos lazos entre la cultura y el sistema educativo, lo cual hace posible reconocer plenamente la cultura y el arte como una dimensión fundamental de la educación de cada uno; desarrollar la educación artística y estimular la creatividad en programas de educación en todos los niveles. Esto indica que si desde la escuela un individuo está expuesto a la vida cultural que lo distingue, es decir, sus valores, su idioma, sus manifestaciones artísticas, sus creencias, etc., y la puede desarrollar, también podrá lograr su desarrollo pleno como ser humano y, por ende, contribuirá con el progreso de su país. Estas acciones planteadas por la UNESCO ofrecen una fundamentación muy sólida para todo grupo o persona que desee formar a los individuos que requiere la sociedad cambiante y exigente de nuestros tiempos. Consciente del papel fundamental que las universidades tienen en el desarrollo integral del individuo, el personal docente del Departamento de Idiomas Modernos del Instituto Pedagógico de Barquisimeto siempre había coincidido con la idea de estimular la participación de los estudiantes de inglés a través de actividades extra-curriculares que pudieran permitirles crecer como individuos sensibles y maduros y que fomentaran el desarrollo de sus aptitudes y destrezas en áreas o tópicos que no son abordados en los cursos que normalmente pertenecen al curriculum de la profesión. Sin embargo, ninguna gestión de este tipo se había desarrollado en la institución. En 1996, el Departamento de Idiomas Modernos creó un club dedicado a las artes dramáticas que, debido a su relación con el uso de textos literarios, proveerían al estudiante con materiales ricos en lenguaje auténtico en inglés y, además, les permitiría aprender haciendo y disfrutando al mismo tiempo. Hoy en día, el Club de Teatro en Inglés cuenta con 23 miembros, todos ellos estudiantes del Departamento de Idiomas Modernos en la UPEL-IPB, quienes participaron en la presente investigación. El Club de Teatro en Inglés tiene dos objetivos: 1) el estudio de las artes dramáticas; y, 2) la aplicación de las técnicas de dramatización en los procesos de enseñanza y aprendizaje. Estos objetivos serían logrados a través del uso de estas estrategias que involucrarían al estudiante en un contexto que les permitiría tomar decisiones, discutir en grupos, tomar riesgos, dudar y evaluar, expresar sus sentimientos y desarrollar su competencia comunicativa. En un sentido general, el principal objetivo del Club de Teatro en Inglés era usar el drama como un recurso didáctico en el contexto de la enseñanza del inglés. Todo proyecto socio-educativo debe ser observado y evaluado con el fin de estudiar sus objetivos y logros como una forma de mejorar y cambiar adecuadamente aquellos aspectos que podrían perjudicar el normal desarrollo de un proceso que involucra la participación de los individuos. Por tal motivo se llevó a cabo un estudio de impacto para observar el efecto de las actividades dramáticas ejecutadas en el Club, además de obtener información relevante acerca de los resultados, los procesos que se habían seguido y los cambios necesarios que debían hacerse para mejorar el funcionamiento del mismo. Los estudios de impacto constituyen hoy en día una herramienta básica para que el investigador determine los efectos o cambios que ocurren a través de la incidencia de diversos factores (Medina, 1997). Por lo tanto, es de suma importancia observar permanentemente los impactos y otros aspectos relacionados con los cursos o programas a través de la evaluación de sus efectos. Con respecto al Club de Teatro en Inglés, era necesario determinar si las actividades dramáticas llevadas a cabo por los estudiantes habían tenido un impacto negativo o positivo en su competencia comunicativa en inglés. Esto se obtuvo al analizar las diferencias entre el impacto esperado y el impacto real percibido por los estudiantes. Los siguientes objetivos definen lo que se realizó en esta investigación. Objetivos General Estudiar el impacto que tienen las actividades dramáticas realizadas en el Club de Teatro en Inglés del Departamento de Idiomas Modernos del IPB en la competencia comunicativa de los alumnos participantes. Específicos 1. Definir las actividades dramáticas realizadas en el Club de Teatro en Inglés del Departamento de Idiomas Modernos del IPB. 2. Analizar las discrepancias entre el nivel real percibido como impacto real (Es) y el nivel teórico expresado en las actividades dramáticas realizadas percibido como el impacto esperado (Db s). 3. Determinar la percepción de los participantes del Club con relación a otros impactos que las actividades dramáticas han tenido en su desarrollo profesional y personal. 4. Estudiar la opinión de los coordinadores del Club con relación al tipo de impacto que las actividades dramáticas han tenido en la competencia comunicativa en inglés de los participantes del Club de Teatro. Justificación De acuerdo con la Ley Orgánica de Educación (1980) y la Ley de Universidades (1970), la educación tiene como finalidad el desarrollo pleno de los ciudadanos que conforman nuestra sociedad por lo cual se debe fomentar, no sólo el conocimiento en la ciencia y la tecnología, sino también en las artes y otras manifestaciones creadoras del espíritu. En el logro de este fin, las universidades cumplen un rol fundamental ya que en tales recintos se debe completar la formación integral que los ciudadanos iniciaron en ciclos educacionales anteriores, razón por la cual se justifica la inclusión en los pensa de estudios de cátedras y actividades extra-cátedras que promuevan esa formación integral del individuo. A raíz de este planteamiento se puede justificar la creación del Club de Teatro en Inglés del Departamento de Idiomas Modernos del IPB ya que en éste se promueve el estudio de las artes dramáticas como una manifestación artística del ser humano, y se intenta contribuir con el desarrollo integral de los estudiantes de la carrera docente que al mismo tiempo pertenecen al Club. Sin embargo, después de crear el Club de Teatro en Inglés, se plantean una serie de interrogantes que sólo serían respondidas después de estudiar lo que se había hecho, hasta el momento de esta investigación, dentro del Club. Por un lado, uno de los planteamientos por responder es determinar el impacto que tienen las actividades dramáticas en la competencia comunicativa en inglés de los participantes del Club de Teatro del IPB. Al satisfacer esta interrogante, esta investigación generará conocimiento con respecto al uso de este tipo de estrategias para desarrollar las destrezas comunicativas del aprendiz de un idioma extranjero. Además este estudio debe constituirse en un aporte válido para los lingüistas, por cuanto ofrece información organizada cuantitativamente del impacto que tienen las representaciones teatrales en la competencia comunicativa de un aprendiz de lengua extranjera. Otra de las interrogantes es si las actividades realizadas en el Club de Teatro en Inglés contribuyen realmente con el desarrollo integral de los estudiantes docentes, y si contribuyen con el desarrollo profesional y personal de los alumnos participantes del Club, además se intenta verificar hasta qué punto se puede apoyar la creación de actividades extra cátedra dentro de la universidad. Por lo tanto, esta investigación puede ser de gran utilidad para los planificadores de pensa de estudios, docentes e investigadores en el área educativa, pues permitirá la inclusión y utilización de actividades extra-cátedra en los recintos universitarios o en otros niveles educativos. Desde el punto de vista metodológico, esta investigación presenta una definición sobre estudios de impacto y cómo ejecutarlos, debido a la escasa bibliografía que existe en relación con este tipo de experiencia en el ámbito educativo. Desde que el Club de Teatro en Inglés del Departamento de Idiomas Modernos fue creado hasta la actualidad, sus miembros, estudiantes de inglés, han participado en una serie de presentaciones de obras de teatro y pequeñas demostraciones en vivo tanto en eventos regionales como nacionales, para las cuales los coordinadores llevaron a cabo planes de acción que incluían desde la selección del casting para el montaje de cada obra, hasta la elaboración de los programas de mano; mientras que los actores, actrices y técnicos se prepararon a través de pequeños talleres de actuación. Esto indica que esta actividad ha tenido trascendencia en el instituto, no sólo por la continuidad en el trabajo que se ha realizado en él, por el apoyo que las autoridades universitarias le han dado, y por las opiniones positivas que el personal docente y los estudiantes que pertenecen al Departamento de Idiomas Modernos y a otras dependencias han expresado, sino también porque, a raíz de su creación, surgieron dos asignaturas que dentro de los nuevos planes curriculares fueron abordadas como asignaturas electivas y optativas de la especialidad de inglés. Sólo el hecho de que una actividad extra-cátedra como la del Club haya trascendido, ya amerita que se investigue y evalúe, lo cual puede ser de gran utilidad, no sólo para los que coordinan el Club, sino para toda persona que desee proyectar otra actividad extra-cátedra con características similares a la que ya existe en el Departamento de Idiomas Modernos del Instituto Pedagógico de Barquisimeto. Marco conceptual Actividades dramáticas Es de suma importancia definir y señalar cuáles son aquellas actividades dramáticas que realizan los miembros del Club del Departamento de Idiomas Modernos del IPB, pues este estudio tuvo como objetivo fundamental determinar el impacto que tienen éstas en la competencia comunicativa en inglés de un grupo de estudiantes. El concepto de actividades dramáticas se asocia inmediatamente con el término drama, el cual tiene a su vez dos implicaciones: como género literario (elaboración de obras de teatro escritas, o lo que en inglés se denomina play), y como la producción y representación de obras de teatro en vivo ante un público determinado con la presencia de los actores y un director. Si se toma en cuenta el término drama visto desde la perspectiva de un montaje teatral, se podría decir, es una actividad práctica en la que se fusionan la actuación de los histriones, la elaboración de la escenografía, las indicaciones de un director y la observación que proviene de un público. En este estudio el drama se abordará desde una perspectiva práctica, es decir, como representaciones teatrales. Minford (1985), fundamentándose en la definición que los griegos le dieron a la palabra drama como vivir a través de, establece que las actividades dramáticas son aquellas que brindan un medio para el aprendizaje, con el fin de aumentar las experiencias del individuo y, más específicamente, para aprender un segundo idioma a través de las representaciones de diferentes situaciones, roles y emociones. Por otra parte, Holden (1981) señala que las actividades dramáticas son ejercicios que se adaptan con mayor naturalidad al estudiante en la etapa de producción en un idioma extranjero, ya que éstas permiten la creatividad y la improvisación. Carlson (1986) establece que un profesor de inglés puede percibir intuitivamente que las actividades dramáticas (representaciones, dramatizaciones, role plays e improvisaciones), pueden ser usadas para desarrollar las destrezas en un idioma extranjero debido al hecho de que los estudiantes deben usar el lenguaje en situaciones similares a aquellas de la vida real. Al respecto, Minford (1985) señala que son aquéllas que proveen un apropiado contexto de aprendizaje que incrementa las experiencias del individuo y, más específicamente, un medio para aprender un segundo idioma a través de diferentes situaciones, roles y emociones. Holden (1981) también estableció que las actividades dramáticas son ejercicios que se adaptan naturalmente a la fase de producción de una lengua extranjera y permiten manejar el idioma de una manera menos controlada. Las ideas apoyadas por estos investigadores fueron tomadas en consideración para constituir la base teórica del Club y estimuló a sus coordinadores a profundizar más en el uso adecuado y en los beneficios que las actividades dramáticas podrían tener en el desarrollo de las destrezas en un segundo idioma, entre otros aspectos. Minford (1985) describe las implicaciones y resultados que pueden obtenerse del uso de actividades dramáticas y sostiene que pueden desarrollar en el aprendiz de un segundo idioma aspectos tales como: lenguaje corporal, identificación con el contexto socio-cultural, competencia lingüística, desarrollo profesional y algunos aspectos filosóficos y psicológicos. Las técnicas ejecutadas por los miembros del Club serán descritas a continuación: 1. Improvisaciones: cuando se aplica en un salón de idiomas, tiene como intención, darle a los estudiantes la oportunidad de representar ciertos roles en situaciones cotidianas. En el Club de Teatro, las improvisaciones siempre son ejecutadas en inglés antes de cada ensayo, y permiten el desarrollo del potencial creativo de los aprendices al igual que sus destrezas en ese idioma. 2. Lecturas dramatizadas de obras de teatro, cuentos y poemas: la lectura en voz alta permite al estudiante expresar sus emociones, mejorar la proyección de la voz, el ritmo, la sonoridad, la entonación, la pronunciación del idioma y, además, se familiariza con diferentes géneros literarios. 3. Lecciones de canto: mejoran la proyección de la voz de los estudiantes. 4. Mímica: debido a la importancia que tienen los gestos y el movimiento corporal para todo docente, las lecciones de mímica fueron incorporadas en los ensayos del Club con el fin de que los estudiantes conocieran la técnica y su aplicación en las dramatizaciones y consecuentemente, adquirieran mayor conciencia de sus movimientos corporales. 5. Tai-Chí: esta técnica china se aplica para ayudar a los estudiantes a controlar su cuerpo, con la finalidad de armonizar todas sus energías. 6. Lecciones de danza contemporánea: desarrollan la flexibilidad y la coordinación rítmica corporal de los estudiantes. Se puede concluir, entonces, que las actividades dramáticas que se realizan en el Club de Teatro en Inglés del IPB son aquéllas que pueden llegar a desarrollar las destrezas del habla en lengua inglesa de una manera natural, en situaciones similares a las de la vida real, y que, al mismo tiempo, le permiten al individuo tener más conciencia de su propio desenvolvimiento escénico, tanto dentro del salón de clases como fuera de éste. Estudios de impacto El término impacto fue definido por la Fundación para el Desarrollo de la Región Centro Occidental (FUDECO, 1979) como cualquier cambio positivo o negativo, fuerte o débil, permanente o temporal y sólo se denominaría beneficio a aquellos cambios positivos. Valbuena (citado por Velásquez, 1995) clasifica los impactos de acuerdo al momento (inmediatos, a corto plazo y a largo plazo); al beneficio que ofrezca (negativo y positivo); al nivel en el cual toman lugar (individuos, familia, comunidad, trabajo y sociedad); y de acuerdo con su duración (estables y no estables). En esta investigación, sólo fueron tomados en cuenta los impactos negativos y positivos. Hay una amplia variedad de investigaciones que estudian el impacto de programas, cursos y técnicas en áreas como la medicina, la economía y la ecología. Sin embargo, en el campo educativo los estudios de impacto son escasos. Entre los investigadores que han llevado a cabo estudios de impacto, Longmore, (1995) realizó uno sobre los cursos y programas educativos dirigidos a niños con dificultades de aprendizaje y su relación con el aprendizaje efectivo logrado en esos programas. Rivera (1996) analiza el impacto de las nuevas tecnologías en el salón, señalando que éste ha sido positivo porque le permite al docente, al igual que al alumno, tener rápido acceso a la información científica y a áreas diversas, entre otros beneficios. Palmer (1996) analiza el término impacto como una de las cualidades que debe poseer un test de idiomas útil; al mismo tiempo realiza un estudio para determinar el impacto positivo o negativo que puede tener el tomar un test y usar los resultados del mismo en los individuos, es decir, estudiantes, profesores y sistemas educacionales. En el año 1999 la Red de Información Nacional de Educación y las Artes, creada por el Departamento de Educación de los Estados Unidos (www.artsedge.kennedy-center.org/champions/exec_summ.html), realizó una serie de estudios acerca del profundo impacto que las artes tienen sobre el aprendizaje de los estudiantes del último nivel del ciclo diversificado. Los resultados obtenidos por el grupo de investigadores responsables de llevar a cabo diversos estudios de impacto en diversos liceos demostraron que todos aquellos alumnos que se involucraron con cualquier disciplina artística desarrollaron un mejor desempeño académico que aquellos que no tuvieron casi ningún contacto con alguna forma de arte. Los estudios de impacto son, entonces, el primer análisis de los efectos de una actividad y se constituyen como punto de partida para evaluar una situación, actividad o programa específico y, luego, elaborar y ejecutar planes de acción. Es importante no interpretarlos como estudios de opinión (ya que entre ambos existen diferencias), pues éstos últimos intentan predecir la conducta humana por medio de la indagación de los puntos de vista, creencias y juicios de las personas en cuanto a situaciones específicas, tal como se puede ver en el sitio web www.gallup.com. Los estudios de impacto sólo intentan describir efectos, mas no las opiniones de los individuos en cuanto a esos efectos, de allí que se define como estudio de impacto a aquel que pueda demostrar los cambios que se producen en un individuo (docente o estudiante), derivados de la acción educativa. En esta investigación se consideraron sólo los impactos en el individuo (negativos y/o positivos). Conceptualización de competencia comunicativa Comunicarse es un asunto que no sólo concierne a los que enseñan un segundo idioma, sino también a todas las personas independientemente de las actividades que realicen y la lengua que utilicen, forma parte de la esencia del ser de una persona que expresa lo que siente y lo que piensa a través de diversos medios. Estos medios de comunicación conllevan el sistema de signos y símbolos que cada grupo social crea y emplea en su propio contexto y en otros, sin dejar a un lado los sistemas paralingüísticos como el lenguaje corporal, los cuales sabe manejar para expresar significados. Comunicación es un proceso continuo de expresión, interpretación, y negociación (Savignon, 1983). Partiendo de esta consideración acerca de lo que implica, de manera general, el término comunicación, surge de inmediato, la necesidad de definir lo que significa competencia comunicativa, específicamente, en el contexto del proceso de enseñanza y del aprendizaje de un segundo idioma. El término competencia comunicativa se originó en sociolingüística con Dell Hymes en el año 1972, y luego en los ochenta, Canale y Swain (citados por Irvine-Niakaris, 1997) crean el modelo que guía la enseñanza comunicativa de idiomas, según la cual la competencia comunicativa describe la habilidad del aprendiz en usar el lenguaje en términos de las siguientes competencias: competencia lingüística (conocimiento de la forma); sociolingüística (habilidad para usar el lenguaje apropiadamente en diferentes contextos); discurso (cohesión y coherencia); y estratégica (conocimiento de estrategias de comunicación verbales y no-verbales). Por otro lado, McGroarty (1984) señala en su estudio acerca de las implicaciones que tiene la competencia comunicativa en el contexto del aprendizaje de un segundo idioma, que este término puede significar diferentes cosas para diferentes grupos de estudiantes y que sólo hasta que los planificadores de programas, profesores y administradores comprendan y estén de acuerdo acerca de cuáles son las necesidades comunicativas de sus estudiantes en términos de los propósitos específicos para los cuales el lenguaje tiene que ser usado, serán ellos entonces capaces de ofrecer una mejor instrucción. Sin embargo, considerando las diversas definiciones que tiene el término competencia comunicativa, se puede decir que ésta va más allá de la memorización de patrones y frases, repeticiones, análisis de estructuras gramaticales y del estudio de las formas lingüísticas del idioma que se está aprendiendo. Según el antropólogo Dell Hymes (citado por Minford, 1985), la competencia comunicativa no sólo incluye esas formas lingüísticas de un idioma: Sino también el conocimiento del cuándo, cómo y con quién es adecuado emplear dichas formas. Esto implica aprender las reglas que rigen la comunidad dentro de un nuevo grupo social y perfeccionar el uso de roles sociales y de identidad social que aquel grupo espera de sus miembros. La competencia comunicativa implica por lo tanto el hacer adecuadamente la selección de los registros y del estilo en términos de la situación y de los otros individuos participantes. Es también un concepto dinámico más que estático, de acuerdo con Savignon (1983), debido a que existe una negociación del significado entre las personas que emplean el mismo sistema simbólico (el lenguaje escrito y el oral). De lo anteriormente expuesto, se puede notar que hay un fuerte elemento social en la competencia comunicativa ya que el individuo debe ser capaz, no sólo de hablar apropiadamente en diferentes situaciones, sino también de actuar pertinentemente ante los demás. En el ámbito escolar, este componente parece ser más fuerte aún. Luego de realizar una revisión detallada de los estudios de lingüistas, antropólogos y sociólogos contemporáneos, McGroarty (1984) demostró cuán críticas y demandantes pueden llegar a ser las relaciones sociales en el logro y mantenimiento de la competencia en el segundo idioma dentro y fuera del ámbito escolar. Además de exigírseles el logro exitoso de una gran variedad de actividades sociales y académicas como el hacer amigos, establecer buenas relaciones con sus padres y maestros, obtener reconocimientos, aprobar exámenes, practicar algún deporte, entre otras, los estudiantes deben lograr un dominio aceptable de las formas lingüísticas de su propio idioma y del que están aprendiendo, lo que hace que la competencia comunicativa en la lengua por aprender, sea un proceso complejo ya que no es una, sino varias destrezas las que deben desarrollar, más que en cualquier otro contexto. No existen nociones predeterminadas que indiquen cuán proficiente tiene que ser un estudiante para ampliar su competencia comunicativa en un segundo idioma. Factores como la edad y los cursos influyen en la selección de las destrezas por desarrollar en el idioma. Sin embargo, la competencia comunicativa se incrementa una vez que el individuo integra los códigos paralingüísticos del lenguaje (gestos, movimientos corporales) con su performance en esa lengua, es decir, la manifestación observable de su habilidad en el idioma. Debe existir, por lo tanto, una buena combinación de destrezas dentro de las formas orales y escritas del idioma que se está aprendiendo. Una manera de incrementar la competencia comunicativa es, según Reimel (1995), a través del uso de las actividades dramáticas, las cuales poseen todos los elementos y requerimientos necesarios para usar un segundo idioma de manera significativa y enfocar la atención en el mensaje más que en la forma. Metodología Tipo de investigación El presente estudio de impacto se constituye como una investigación de campo, descriptiva, la cual persigue identificar el impacto (positivo o negativo) que las actividades dramáticas produjeron en la competencia comunicativa de los participantes del Club de Teatro del Departamento de Idiomas Modernos. De acuerdo con la revisión realizada de diversos estudios de impacto en diferentes áreas, se pudo constatar que no existe una metodología específica para elaborar estos análisis1. Sin embargo, se le dio a este estudio un carácter cuantitativo en el sentido de que los datos fueron analizados en términos del promedio (Media) existente entre el impacto esperado (IE) y el impacto real percibido (IRP) de cada ítem del cuestionario en relación con las diferentes dimensiones. Además, presenta un carácter cualitativo en atención a las técnicas de recolección de datos como el cuestionario y la entrevista, la primera de las cuales contenía una pregunta abierta relacionada con otros tipos de impacto que el participante consideraba habían tenido las actividades dramáticas en su formación profesional y personal y, la segunda, tres preguntas abiertas relacionadas con la opinión que le merece a los coordinadores del Club el impacto que las actividades dramáticas han tenido en la competencia comunicativa en inglés de los participantes. Sujetos Instituto Pedagógico de Barquisimeto y la muestra estudiada la conformaron todos los participantes del Club de Teatro en Inglés de dicho departamento, es decir, 23 estudiantes de diferentes semestres quienes han pertenecido al Club desde sus inicios. Y tres coordinadores, profesores de Inglés del Instituto Pedagógico de Barquisimeto. Técnica de recolección de los datos Como instrumento de recolección de datos fue utilizado un cuestionario con 40 items objetivos y cuyas respuestas podían ser seleccionadas dentro de una escala de Likert que se extendía del 1 al 4; al final del mismo, se incluye una pregunta abierta sobre otros tipos de impacto percibidos por los sujetos de la investigación. Para elaborar el instrumento y determinar su validez, se elaboró un ejemplar preliminar del cuestionario que contenía una serie de items para cada dimensión, los cuales fueron evaluados por tres expertos en el área de investigación educativa, enseñanza del inglés como lengua extranjera y técnicas dramáticas con respecto a los siguientes aspectos: pertinencia del ítem con su dimensión, pertinencia sugerida en caso de que el ítem no se correspondiera con la dimensión propuesta, claridad en la redacción del ítem y, finalmente, el lenguaje utilizado en la redacción del ítem. Para efectos de darle al instrumento confiabilidad y validez, se realizó un estudio piloto con 40 alumnos del Instituto Pedagógico de Barquisimeto que cursaron una asignatura electiva relacionada con las actividades dramáticas denominada Taller de Teatro Permanente en Inglés y con algunos integrantes del Grupo de Teatro Estable de la UPEL-IPB. Después de aplicar el cuestionario se le agregaron ciertas modificaciones relacionadas con la redacción, el número de items y el vocabulario empleado. Procedimiento de recolección y análisis de los datos Se le aplicó el instrumento a los sujetos del estudio durante varias sesiones, específicamente en la sala de lectura del Departamento de Idiomas Modernos del IPB. Una vez recolectados todos los cuestionarios (23), se hizo el procesamiento de los datos, a través del programa estadístico Statistica 0.6, aplicándose la técnica estadística de la Prueba t de Student Pareada o Correlacionada, ya que la unidad de análisis impacto fue medida con la misma característica en dos oportunidades diferentes (lo que se esperaba y lo que se percibió o logró). Resultados Con la finalidad de interpretar los resultados, se presentan dos tablas que muestran el análisis de discrepancia entre el nivel real, (impacto real percibido, Es) y, el nivel teórico (impacto esperado, Deber ser). El análisis de esta discrepancia se determinó a través de la diferencia de la Media Aritmética de cada impacto (Esperado y Real Percibido). Es necesario resaltar que sólo se presentan las tablas que reflejan las discrepancias entre el impacto esperado y el percibido de dos dimensiones para ejemplificar el procedimiento metodológico utilizado en esta investigación; sin embargo el análisis de las discrepancias también fue realizado en los aspectos expresión lingüística, fundamentos filosóficos y psicológicos y formación profesional. En la tabla 1, se presentan los resultados del promedio de las puntuaciones de los 23 sujetos para cada uno de los items que conforman la dimensión Expresión Corporal. En la segunda columna se puede observar el bajo nivel de discrepancia que existe entre los promedios del IE y el IRP resultando esta diferencia muy poco significativa. Esto muestra que en cuanto a expresión corporal, los integrantes del Club de Teatro han logrado satisfacer las expectativas que tenían antes de iniciarse en el mismo, es decir, el realizar actividades dramáticas en el club les ha permitido tener un mejor dominio del movimiento y plasticidad de su cuerpo. El ítem nº 39 es un ejemplo de la poca o ninguna diferencia del promedio del IE (Impacto Esperado) y el IRP (Impacto Real Percibido), lo que indica que los miembros del Club esperaban poder transmitir mensajes a través de gestos apropiados a cada situación y después de la práctica de actividades dramáticas lograron plenamente ese objetivo. En la tabla 2 se observa suficiente evidencia estadística como para afirmar que las discrepancias entre los promedios del IE y el IRP no son importantes, es decir, que en cuanto a la identificación de los miembros del Club con su contexto socio-cultural, éstos lograron un buen nivel de integración con el grupo al cual pertenecen. Por otra parte, la diferencia entre los promedios del IE y el IRP del ítem nº 6 resultó altamente significativa dado que las probabilidades calculadas son menores que 0.05000, lo cual demuestra que los miembros del Club no lograron aprender, durante las actividades realizadas, las costumbres de otros grupos sociales en épocas pasadas y en la actualidad, es decir, que no se logró lo que se esperaba en este aspecto. Con respecto al tercer objetivo de esta investigación, los resultados indican que el 100% de la muestra opinó que el realizar actividades dramáticas ha tenido impactos satisfactorios en los siguientes aspectos: - Han logrado sentir mayor seguridad en ellos mismos en su papel como docentes. - Se han adaptado a trabajar en grupos muy numerosos. - Han descubierto que poseen talento y lo han explotado para desempeñarse mejor en el área de la enseñanza. - Logran relajarse más efectivamente. - Han desarrollado su parte espiritual como seres humanos. - Logran divertirse y pasar momentos agradables. - Han vencido el miedo escénico y la timidez. - Han logrado ser más puntuales y responsables en el contexto universitario y fuera de éste. - Han descubierto que es posible aprender de una manera amena. - Han logrado una mejor comunicación con los demás, es decir, son más sociables. - Han logrado apreciar las artes en general. - Han tomado conciencia de la importancia de la imagen que debe proyectar un docente. - Han logrado ser mejores observadores. - Han sentido motivación para utilizar mucho más el inglés fuera del salón de clases. - Han logrado respetar y aceptar a las demás personas con mayor facilidad. En concordancia con el objetivo 4 de este estudio, se realizaron entrevistas orales a los tres coordinadores del Club de Teatro en Inglés con el fin de determinar el impacto de las actividades dramáticas en la competencia comunicativa en inglés de los participantes. El investigador trató de determinar con la técnica de triangulación implementada por Medina (1997), ese impacto tomando en consideración no sólo la percepción de los integrantes del Club, sino también la de aquellos que lo dirigen. Las tres (3) preguntas abiertas realizadas a los coordinadores del Club estaban dirigidas a determinar 3 aspectos relevantes para los objetivos de la investigación: el nivel de satisfacción que ellos sentían al trabajar como coordinadores del Club de Teatro, la forma en la cual ellos percibían que las actividades dramáticas habían tenido algún impacto sobre la competencia comunicativa en inglés de los estudiantes, y por último, la forma en la cual las actividades dramáticas habían tenido algún impacto en algún aspecto del plano personal o profesional de los estudiantes. Los coordinadores del Club de Teatro son todos profesores de Inglés de la UPEL-Barquisimeto excepto el director artístico del grupo, cuya especialidad es la dirección teatral. Apesar de existir diferencias entre los coordinadores del Club en cuanto a los años de experiencia dedicados a la docencia, todos se rigen por el mismo proyecto formulado desde la creación del Club y por tanto, persiguen los mismos objetivos. Las preguntas formuladas a los Coordinadores fueron: a) Si Ud. tuviera que escoger entre trabajar o no como coordinador del Club de Teatro en Inglés, ¿cuál sería su decisión?; b) ¿Cree Ud. que las actividades dramáticas realizadas en el Club de Teatro han tenido un impacto positivo en la competencia comunicativa en inglés de sus participantes?; y finalmente, c) ¿Cree Ud. que las actividades dramáticas han tenido un impacto negativo en la competencia comunicativa en inglés de sus participantes o en algún otro aspecto en el plano personal o profesional? Como respuesta a estas interrogantes, los actores gerenciales claves expresaron que sí consideraban que las actividades dramáticas realizadas en el Club de Teatro producían un efecto positivo en la competencia comunicativa en inglés de sus participantes ya que siempre han percibido entre los estudiantes un gran entusiasmo y un ambiente fraternal que propició la práctica apropiada de patrones de entonación y pronunciación reflejados en una mayor fluidez al hablar, mejor empleo de vocabulario y más soltura al interactuar con otras personas utilizando el idioma inglés. Por otra parte, los coordinadores del Club consideraron que las actividades dramáticas no producían un impacto negativo ni en la competencia comunicativa en inglés de sus participantes ni en ningún otro aspecto y que, por el contrario, aumentaban su confianza en sí mismos, mejoraban la proyección de su voz, se lograban sentir mejor, más seguros y cómodos, enfrentaban retos lingüísticos de mayor complejidad y exigencia como el manejar el inglés antiguo y luchaban por vencer el nerviosismo cuando estaban frente a una audiencia. En cuanto a la pregunta que expresaba si tuvieran que elegir entre ser coordinadores del Club o no, dos respondieron afirmativamente. El coordinador que respondió de manera negativa alegó que la carga académica es muy pesada, es decir, que requiere de mucha dedicación y que a veces el tiempo no es suficiente como para realizar una actividad extra-cátedra de la magnitud del Club de Teatro en Inglés. Conclusiones El impacto que las actividades dramáticas tuvieron sobre la competencia comunicativa en inglés de los participantes del Club de Teatro del Departamento de Idiomas Modernos perteneciente al IPB fue positivo. Los resultados arrojados por las entrevistas dadas a los actores gerenciales claves y por el cuestionario aplicado a los 23 sujetos indicaron que las actividades dramáticas que realizaron dentro del Club lograron cumplir con las expectativas que ellos tenían antes de llevarlas a cabo, es decir, que se mantuvo un equilibrio entre lo que ellos esperaban (Impacto Esperado) y lo que lograron (Impacto Real Percibido) con respecto a las actividades dramáticas que desarrollaron como miembros del Club. A pesar de que la diferencia de los promedios del IE y el IRP de un sólo ítem del cuestionario resultó ser significativa y, como consecuencia, se demostró que los sujetos no lograron aprender acerca de las costumbres de otros grupos sociales actuales y de épocas pasadas a través de las actividades dramáticas, en general, la diferencia de los promedios de los demás items del instrumento no fue significativa. Por lo tanto se puede afirmar que al realizar actividades dramáticas los estudiantes de un segundo idioma pueden no sólo desarrollar un alto grado de competencia comunicativa sino que también pueden desarrollarse en otros aspectos tales como: expresión corporal, identificación y aceptación de diversos contextos socio-culturales, entrenamiento y preparación como futuros docentes, conocimiento de sí mismos y del mundo que les rodea. Hubo otros impactos positivos de las actividades dramáticas en la formación profesional y personal de los participantes del Club los cuales fueron calificados como satisfactorios ya que todos estaban referidos al logro de objetivos profesionales y personales y al bienestar de ellos como seres humanos. Más allá de los resultados cuantitativos de esta investigación, los cuales fueron positivos, es más importante señalar la trayectoria del Club, sus fases de desarrollo y los resultados que ha obtenido hasta ahora, es decir, que ésta no ha sido una actividad transitoria dentro de la universidad y que quizás valdría la pena investigar aún más sobre el por qué y las condiciones que permitieron que el Club de Teatro en Inglés encontrara un asidero firme dentro del Departamento de Idiomas Modernos del Instituto Pedagógico de Barquisimeto, que puedan aportar datos para otras instituciones. NOTA: 1 Para ampliar esta afirmación puede consultar las páginas web: www.mip.org/PDFS/AIMS/spbr1.pdf,www.unesco.org/education/educprog/pead/SP/AIDSP/AISPtx/ImpactSP/IntroSP.pdf www.txinfinet.com/mader/ecotravel/trade/ambiente.html. Referencias 1. Carlson, V. (1986). The use of Drama in the Classroom Some Implications. [Instituto Pedagógico de Maturín] Ponencia presentada en la VII Convención Nacional de Profesores de Inglés. Universidad Pedagógica Experimental Libertador, Instituto Pedagógico de Maturín, Maturín. [ Links ] 2. Fundación para el Desarrollo de la Región Centro Occidental de Venezuela. (1979). Impacto de las Inversiones en Vialidad Agrícola en la Región Centro Occidental de Venezuela. Barquisimeto: Autor. [ Links ] 3. Holden, S. (1981). Drama in Language Teaching. Gran Bretaña: Longman Group. [ Links ] 4. Irvine-Niakaris, C. (1997). Current Proficiency Testing. English Teaching Forum. 35(2), 16. [ Links ] 5. Ley de Universidades. (1970). Gaceta Oficial de la República de Venezuela, 1.429 (Extraordinario), Septiembre 8, 1970. [ Links ] 6. Ley Orgánica de Educación. (1980). Gaceta Oficial de la República de Venezuela, 2.6035 (Extraordinario), Julio 2, 1980 [ Links ] 7. Longmore, P. (1995). Examining the Impact of Post Secondary Students of the Dissability Studies Programs. San Francisco: San Francisco State University, Department of History. [ Links ] 8. McGroarty, M. (1984). Some Meanings of Communicative Competence for Second Language Students. TESOL Quarterly, junio 1984. [ Links ] 9. Medina, C. (1997). Estudio de Impacto del Curso de Capacitación Docente del Decanato de Medicina de la Universidad Centro-Occidental Lisandro Alvarado en el Desempeño de la Docencia de sus Participantes Egresados. Trabajo de grado de maestría no publicado, Universidad Pedagógica Experimental Libertador, Instituto Pedagógico de Barquisimeto Luis Beltrán Prieto Figueroa, Barquisimeto. [ Links ] 10. Minford, H. (1985). Las Actividades Dramáticas en los Programas de Inglés como Lengua Extranjera y su relación con el Enfoque Comunicativo: Un Manual para Profesores. Trabajo de ascenso no publicado, Universidad Pedagógica Experimental Libertador, Instituto Pedagógico de Caracas, Caracas. [ Links ] 11. Palmer, A. y Bachman, L. (1996). Language Testing in Practice. Oxford University Press. [ Links ] 12. Red de Información Nacional de Educación y las Artes, Departamento de Educación de los Estados Unidos. (1999). Champions of Change The Impact of the Arts on Learning. [Libro en línea]. Disponible: www.artsedge.kennedy-center.org/cahmpions/exec_summ.html. [Consulta: 1999, septiembre 22] [ Links ] [ Links ] 13. Reimel, S. (1995). Conceptualizing Games, Simulations, Role-plays and Dramatizations. Revista Venezolana de Lingüística Aplicada, 1(2). 14. Rivera, E. (1996). Impacto de las Nuevas Tecnologías de la Computación y Telecomunicaciones en el Salón de Clases. Ponencia presentada en el 19º Congreso Internacional de Educación y Eruditos, San Juan, Puerto Rico. [ Links ] 15. Savignon, S. (1983). Communicative Competence: Theory and Classroom Practic. USA: Addison Wesley Publishing Company. [ Links ] 16. UNESCO. (1982). Informe final de la Conferencia Intergubernamental sobre Políticas Culturales para el Desarrollo. Estocolmo, Suecia. [ Links ] 17. Velázquez, C. (1995). Impacto del Programa Matemática Interactiva en los Alumnos y Docentes de Segundo grado de Educación Básica. Revista Laurus, 3(5) [ Links ] Cuadros Tabla 1. Prueba t de Student para Muestras Dependientes de la Dimensión Expresión Corporal T-test for Dependent Samples (impacto.sta) Marked differences are significant at p < ,05000 Std.Dv. Medias Std.Dv. N Diff. Diff. t IE1 1,73913043 0,6191924 IR1 1,69565217 0,558796 IE2 1,43478261 0,5897678 IR2 1,26086957 0,4489778 23 0,173913043 0,777652289 1,072532889 IE9 1,56521739 0,6623709 IR9 1,39130435 0,4990109 23 0,173913043 0,650326765 1,282520882 23 0,043478261 0,705707953 0,29546842 df p 22 0,77040673 22 0,2951054 22 0,21300913 IE11 1,43478261 0,5897678 IR11 1,34782609 0,4869848 23 0,086956522 0,792753744 0,52605091 22 0,60411597 IE13 1,69565217 0,470472 IR13 1,65217391 0,5727681 23 0,043478261 0,562321557 0,370809924 22 0,71432572 IE19 1,60869565 0,6563764 IR19 1,43478261 0,5897678 23 0,173913043 0,886882892 0,940437191 22 0,35720555 IE21 1,72727273 0,7025002 IR21 1,81818182 0,5884899 22 -0,09090909 0,811177328 -0,525657483 21 0,60463314 IE28 1,47826087 0,5931093 IR28 1,34782609 0,5727681 23 0,130434783 0,694415898 0,900819299 22 0,37744039 IE36 1,73913043 0,8100163 IR36 1,82608696 0,8868829 23 -0,08695652 0,848155404 -0,491689172 22 0,62780914 IE39 1,43478261 0,6623709 IR39 1,43478261 0,5068698 23 0 0,603022689 0 22 1 Tabla 2. Prueba t de Student para Muestras Dependientes de la Dimensión Identificación con el Contexto Socio-Cultural T-test for Dependent Samples (impacto.sta) Marked differences are significant at p < ,05000 Std.Dv. Medias Std.Dv. IE6 1,68181818 0,7162311 IR6 1,36363636 0,492366 N Diff. Diff. t df p 22 0,318181818 0,646334989 2,309027115 21 0,03120625 IE30 1,39130435 0,6563764 IR30 1,26086957 0,4489778 23 0,130434783 0,757048565 0,826292092 22 0,41751005 IE32 1,60869565 0,8387832 IR32 1,43478261 0,5897678 23 0,173913043 0,716822148 1,163548948 22 0,25707165 IE34 1,60869565 0,7827185 IR34 1,56521739 0,6623709 23 0,043478261 0,562321557 0,370809924 22 0,71432572 IE37 1,52173913 0,6653478 IR37 1,34782609 0,4869848 23 0,173913043 0,576208131 1,447493729 22 0,16185959 IE38 1,43478261 0,6623709 IR38 1,34782609 0,4869848 23 0,086956522 0,73317761 0,568796459 22 0,57525551 Vicerrectorado de Investigación y Postgrado. Universidad Pedagógica Experimental Libertador. Caracas. Av. Sucre. Parque del Oeste. Catia. Caracas Venezuela. Teléfono 864.7822-864.7922. Fax 860.7227 ppdi@upel.edu.ve Cuarto Quinto Nivel Autoevaluación 1. ¿Cuál es el significado etimológico de la palabra “drama”? Sufrir. Actuar. Llorar. Pregunta 1 de 10 7/17 Cuarto Quinto Nivel Autoevaluación 2. ¿En el drama se puede relatar la obra? No. Sí. Depende del guion. Pregunta 2 de 10 8/17 Cuarto Quinto Nivel Autoevaluación 3. El drama nace como culto a: Dioniso. Zeus. Afrodita. Pregunta 3 de 10 9/17 Cuarto Quinto Nivel Autoevaluación 4. ¿Cuál fue la primera obra literal escrita en castellano? Auto de los Reyes Magos. La Divina Comedia. El Evangelio de la Resurrección. Pregunta 4 de 10 10/17 Cuarto Quinto Nivel Autoevaluación 5. ¿Cuál es la subclasificación actual del género dramático? La tragedia y la comedia. Los romances y el género libre. Géneros realistas y simbólicos. Pregunta 5 de 10 11/17 Cuarto Quinto Nivel Autoevaluación 6. ¿Qué es la tragicomedia? Una obra que estudia la tragedia y la comedia. Una obra con tinte trágico y cómico. Una obra que evita la tragedia y la comedia. Pregunta 6 de 10 12/17 Cuarto Quinto Nivel Autoevaluación 7. ¿Qué es el auto sacramental? Una obra religiosa. Una obra autobiográfica. Una obra de relatos y sacrificios humanos. Pregunta 7 de 10 13/17 Cuarto Quinto Nivel Autoevaluación 8. ¿Cuántos géneros literarios conforman los géneros mayores? Cuatro. Cinco-Tres. Cinco-Siete. Pregunta 8 de 10 14/17 Cuarto Quinto Nivel Autoevaluación 9. ¿Qué son las pastorelas? Formas de obras musicales religiosas. Representaciones de la vida de los pastores. Obras literarias sobre los cultivos. Pregunta 9 de 10 15/17 Cuarto Quinto Nivel Autoevaluación 10. ¿Qué es la contrarreforma? Frente de revolución reformador. Respuesta contra la Reforma de Martín Lutero. Una reforma de ida y vuelta. Pregunta 10 de 10 16/17 Tragedia y Comedia El DRAMA o la dramática es uno de los géneros literarios de la antigüedad, tal y como los describió el filósofo griego Aristóteles, precursor de lo que hoy en día conocemos como dramaturgia o teatro. El término de hecho proviene del griego “drama” que se traduce como “hacer” o “actuar”, lo cual tiene mucho sentido pues en el drama la acción literaria y ficcional es llevada a escena mediante diálogos y acciones en un tiempo presente indefinido. Hay una distinción entre drama y teatro. El primero sería el conjunto de elementos lingüísticos, escritos o no, que componen los personajes, los diálogos (o monólogos, soliloquios), las acotaciones de la acción y las descripciones del mundo ficcional en que la acción transcurre, y es un género literario. El segundo, en cambio, sería la materialización de dicho género, su aspecto espectacular, involucrando a los actores, el escenario, la dirección, etc. Se llama COMEDIA a uno de los más antiguos géneros dramáticos, opuesto en su temática a la tragedia. Esta caracterizada por tramas y narraciones que evocan a la risa y que tienen un final feliz. Según la describe el filósofo griego Aristóteles en su Poética (siglo VI a.C.), la comedia consiste en una representación de los hombres peores de lo que realmente son, lo cual posibilita que los espectadores se burlen de ellos, incluso siendo figuras poderosas en vida real. La comedia, como la tragedia, tiene su origen como género en la Antigua Grecia (alrededor del 600 a.C.), como una evolución artística de los primitivos cantos de honor a Dionisos. La comedia, a diferencia de la tragedia, no se ocupa de enaltecer o de abordar solemnemente a sus personajes, sino que los escoge del vulgo y los somete no a un destino fatal, sino a los rigores del azar. De allí que en muchos tipos de comedia los personajes se libren de situaciones difíciles o embarazosas por la pura casualidad. https://www.youtube.com/watch?v=KJJAXKTAVN4 Los antiguos griegos la cultivaron como una de las dos formas cumbre de la dramática, asociándola a la musa bucólica y pastoril de nombre Talía, quien junto a Melpómene (musa de la tragedia) eran las inspiradoras del teatro. Desde entonces se representan estas dos artes mediante dos caretas: una sonriente y la otra llorosa, asociándolas a dos perspectivas en torno a la vida: la optimista y la pesimista. La TRAGEDIA se caracteriza por representar mediante un lenguaje solemne a personajes ilustres (“hombres mejores de lo que realmente son”, según Aristóteles), que se ven enfrentados contra un destino inevitable (el fatum latino o ananké griego) a causa de un error o una condición de su carácter (el orgullo o la hybris en la tragedia griega). https://www.youtube.com/watch?v =cXmvxHTW_60 La consecuencia de ello es siempre fatal y los héroes son castigados por los dioses, por lo general, con la locura o la muerte. El origen de la tragedia griega se remonta al siglo VI a.C. y parece estar relacionado con prácticas religiosas. La voz griega tragoedia de donde proviene el término actual, significaba literalmente “canto del macho cabrío”, pues su origen data de las celebraciones en honor al dios Dionisio, a quien se ofrendaba un macho cabrío que era públicamente degollado. https://www.youtube.com/watch?v=hx64 0mxyfRM Elementos de la tragedia La tragedia clásica se componía de los siguientes elementos: •Coro. El coro representaba en las tragedias un papel fundamental pues representaba la voz del pueblo: aconsejaba, explicaba los dilemas, daba información y dejaba en claro el dilema moral, etc. •Corifeo. El conductor del coro, que podía salir de éste y tener voz propia para increpar a los coreutas (miembros del coro) o a los demás personajes. •Personajes. Los distintos personajes, héroes o antagonistas jugaban su papel en la obra. Todos estaban representados por actores varones, independientemente de su sexo, pues las mujeres no tenían lugar en el teatro de la antigüedad. Estructura de la tragedia griega En cuanto al texto dramático, la tragedia griega posee la siguiente forma y estructura: •Prólogo: es una especie de sumario que relata los antecedentes de la historia. •Párodos: es el momento que da entrada al coro, con lo que inicia la acción dramática. •Episodios: son las escenas propiamente dichas, donde tienen lugar los diálogos de los personajes. •Estásimos: son los cantos del coro que, a lo largo de la pieza, aparecen para explicar la secuencia de las acciones o para sancionar las acciones de los personajes. •Éxodo: el éxodo es el desenlace del conflicto dramático. Casi siempre representa la caída del héroe, aunque en algunas ocasiones, el héroe puede verse redimido. Bibliografía • Castro Robaina, Israel. (2016). "¿Muerte de la tragedia?". Primer Acto. 350. • Colomer, Josep. (1990). La comedia politica. Enlace. • López Fonseca, Antonio. (2000). La comedia latina: una aproximación a la literatura dramática desde la perspectiva del género y la recepción. Cuadernos de filología italiana, ISSN 1133-9527, Nº. 7. Cuarto Quinto Nivel 1/23 Cuarto Quinto Nivel Introducción El drama, al ser considerado el primer género dramático, se subdividió en otros géneros como la comedia, la tragedia. Con el paso del tiempo y la evolución de los mismos, fueron apareciendo otros géneros considerados dentro del género dramático y, a la vez, estos se fueron dividiendo en los que hoy se consideran géneros menores. Estos géneros menores pueden utilizar lenguaje en prosa o en verso. La prosa es el uso del lenguaje de manera continua, no rítmica ni dividida por estrofas, sino que se divide en párrafos. El verso es una forma de presentación del lenguaje más artística que se desarrolla bajo ciertas reglas silábicas o métrica, figuras retóricas y literarias, y de rima. Es por excelencia el lenguaje utilizado en la poesía. 2/23 Cuarto Quinto Nivel 12.1. La ópera La ópera nace como un intento de revivir la tragedia griega, que había prácticamente desaparecido en la segunda mitad de la Edad Media. Como no se conocía la puesta en marcha de la tragedia, se supuso que los diálogos podían haber sido contados y así lo hicieron, dando paso a la ópera. Es un género menor de gran aceptación, arte y expansión hasta la actualidad. Es la puesta en escena de una obra cantada, además es acompañada de una sinfónica, orquesta o agrupación musical. Es considerado uno de los géneros dramáticos más completos y llamativos porque para su ejecución intervienen artistas tras y en escena, maquillaje llamativo según la obra; los músicos también suelen utilizar trajes acordes a la obra a presentar. La escenografía es impecable al igual que la iluminación y los efectos escénicos. De la mano de los cantores y de los actores, el director de la orquesta suele tener gran participación y reconocimiento. La primera composición de ópera es Dafne de Jacopo Peri. Este género tiene la peculiaridad de que la música es más resaltada que la interpretación de los actores y así se ha mantenido hasta la actualidad. La interpretación de la ópera se la realiza por medio de cantantes con diferente tesitura, es decir, distintos alcances o diversidad de notas. Estos diálogos cantados los ejecutan: 3/23 Cuarto Quinto Nivel 12.1. La ópera Notas masculinas ⬥ El tenor ⬥ El barítono ⬥ El bajo Notas femeninas ⬥ La soprano ⬥ La mezzosoprano ⬥ La contralto Notas infantiles ⬥ Voces blancas La ópera es un género muy expandido y desarrollado. Entre los diversos tipos de ópera podemos nombrar algunos como la ópera clásica o la de cámara. Al igual que el género dramático, puede desarrollarse con tinte dramático, trágico, tragicomedia o cómico. 3/23 Cuarto Quinto Nivel 12.1. La ópera Géneros musicales que se desprenden de la ópera ⬥ ⬥ ⬥ ⬥ ⬥ ⬥ ⬥ La zarzuela El singspiel La opereta La opéra-comique El musical La ópera-ballet Verismo La representación de una obra suele darse en un teatro pues requiere de un escenario y de varios otros elementos; no podría ser realizada de manera improvisada. La obra suele ser interpretada por dúos, tríos o grupos dependiendo de los personajes que se establezcan en el libreto. 3/23 Cuarto Quinto Nivel 12.2. El género musical El género musical es muy amplio. Como base de su desarrollo, cuenta con la música como principal componente o como fondo para la realización de una obra o de la pieza musical. Con el paso del tiempo se ha adaptado el concepto de género musical de manera independiente a estilo musical o géneros musicales, los cuales ya no responden a una línea específica de canto o representación de una obra, sino a un contexto y a la aceptación del público, hablando hoy en día de la industria musical. Tipos de géneros musicales ⬥ Música culta. Se refiere a la música clásica en la cual sus intérpretes se han formado para interpretar las piezas, usualmente en conservatorios, y tienen reconocimiento en tonos específicos del uso de las notas musicales con su voz. ⬥ Música folclórica. Es un género musical acorde a las tradiciones y a los instrumentos propios de una cultura, del sentir de un pueblo con letras que suelen expresar cánticos históricos o instrumentos típicos de la región. ⬥ Música popular. Se considera como música popular a un tipo de música que no es culta ni representa a la cultura de ningún pueblo; sin embargo, es aceptada de manera general por un cierto público. Es la música de las masas que no requiere de intérpretes que se hayan formado como músicos ni de instrumentos elevados, sino de primera mano se enfoca a la comercialización. 4/23 Cuarto Quinto Nivel 12.2. El género musical Clasificación musical ⬥ Por la función. Al clasificar el género musical por su función estamos hablando de cuándo o por qué motivo se va a utilizar determinada pieza musical. Así, podemos dividirla en música religiosa, que es utilizada en un contexto de culto o adoración; música profana o secular como se conoce a la música que no tiene un fin religioso; y, música incidental, que es la música que se utiliza de fondo. ⬥ Por el instrumento. Al hablar de la voz únicamente sin la necesidad de un instrumento musical que acompañe a esta interpretación estamos hablando de canto individual o a capella y si es de dos o más personas, música coral. Por el contrario, si se necesita de un instrumento, estamos hablando de música instrumental. El género musical y la música en general han formado parte de las artes apreciadas por el ser humano. La música es hoy en día utilizada con diferentes y variados fines no solo como arte, son incluso como parte necesaria para la relajación. 4/23 Cuarto Quinto Nivel 12.3. El monólogo El monólogo es un género dramático menor que lo ejecuta un solo personaje. Su forma de interpretación es mediante un discurso que lo desarrolla como conversación con el público, a fin de captar su atención. El único instrumento utilizado es la voz. El lenguaje empleado puede ser variado (de prosa a verso, ritmas o incluso lenguaje vulgar). El intérprete no siempre es el autor y debe ser capaz de exponer los sentimientos que este quiso expresar durante la creación del discurso. Este discurso se lo desarrolla en primera persona, es decir, que el intérprete habla de las situaciones como que le han ocurrido a sí mismo y no se permiten otros personajes en escena. antes con diferente tesitura, es decir, distintos alcances o diversidad de notas. Estos diálogos cantados los ejecutan: Características del monólogo ⬥ ⬥ ⬥ ⬥ ⬥ Es unipersonal. El intérprete es dramático y capaz de transmitir por sí solo emociones buscando la empatía del público. Simulación de conversaciones o relatos. El lenguaje es variado según la interpretación. Puede desarrollarse en contextos formales o informales. 5/23 Cuarto Quinto Nivel 12.3. El monólogo Autores destacados ⬥ ⬥ ⬥ ⬥ ⬥ ⬥ Robert Browning Alfred Tennyson Luis Cernuda Jorge Luis Borges Matthew Arnold Dante Gabriel Rossetti Al hablar de monólogo dramático, se puede dividir en dos: uno con tinte cómico desarrollado a finales de la Edad Media y otro lírico-dramático que surgió en el siglo XIX. Su puesta en marcha es de manera abierta y sin muchas explicaciones, el personaje inicia la obra de forma súbita exponiendo cómo se da o cuál es el argumento de la obra. El monólogo en ocasiones no es una obra única o independiente, sino también puede darse dentro de otra obra, en una escena determinada en la que uno de los personajes tenga que narrar algo por sí mismo o muy a menudo cuando debe reflexionar sobre algo y conversa consigo mismo. 5/23 Cuarto Quinto Nivel 12.4. La obra didáctica El género didáctico se caracteriza por la divulgación de pensamientos literales, no es ficción. Se da a manera de diálogo para exponer las ideas claras sobre un tema en particular. Esta obra se enfoca en la transmisión de conocimientos hacia un público determinado. Parte del auto sacramental pues este género mayor se enfocaba en la transmisión de la religión y de pasajes bíblicos para dejar una enseñanza, así también la obra didáctica busca transmitir conocimientos y dejar una enseñanza, pero de manera educativa con temas pedagógicos y de interés popular. Características de la obra didáctica. ⬥ ⬥ ⬥ ⬥ ⬥ ⬥ ⬥ ⬥ Tienen contexto pedagógico. Comparten un conocimiento verídico. Son educativos y formales. El lenguaje es estándar. Se enfoca a un grupo determinado. Su desarrollo es en asuntos religiosos, sociales y políticos. No es cómica, ni trágica. Se enfoca en la transmisión de ciencia, tecnología y arte. 6/23 Cuarto Quinto Nivel 12.4. La obra didáctica El público al que se enfoca la obra didáctica cumple la función de espectador y, a la vez, de alumno, pues al final de la obra se supone que adquiere un nuevo conocimiento. Los campos en los que se expone una obra didáctica son temáticos, en los que se desarrolla un tema específico y anecdótico, que transmite una enseñanza experimental. Autores destacados ⬥ Calderón de la Barca ⬥ Lope de Vega ⬥ Bertolt Brecht El lenguaje es formal y culto, los personajes son elocuentes y lógicos interpretando o desarrollando temas de fácil comprensión por medio de diferentes recursos. 6/23 Cuarto Quinto Nivel 12.5. La farsa Es una pieza de corta duración que se utilizaba, al igual que el entremés, para hacer pausas entre una escena y otra de los géneros mayores. Utiliza situaciones que llaman la atención del público en el corto tiempo de presentación. En la actualidad, existen farsas que pueden llegar a los 30 minutos siendo consideradas como obras únicas y ya no como paso, como lo sigue siendo el entremés. Este subgénero también es conocido como el género imposible. Es parte de los géneros teatrales no realistas, enfocándose en sus inicios para entretener a un extracto social bajo; sin embargo, se desarrolló para ser utilizado de manera cómica como pausa de obras de géneros mayores. Se puede contextualizar a la farsa como una obra teatral exagerada y burlesca en la que los personajes exageran las situaciones reales para llamar la atención del público. Usualmente consta de un solo acto que busca elevar el ánimo de la audiencia, es meramente cómico, pero puede ser utilizado en otras áreas. Se caracteriza por empatizar con todo tipo de público, es decir, que el lenguaje debe ser simple y hasta vulgar para llegar a las masas o al populacho, como antes se lo llamaba, por lo que el uso de sátiras, ironías y hasta groserías vulgares es común en su interpretación. A esto se llama metalenguaje. Uno de los comediantes que interpretó obras basadas en la farsa como denuncia social fue Charles Chaplin. Existen otros autores destacados como Alfred Jarry o Enrique Jardiel que han utilizado este género para transmitir de manera cómica realidades enfrentando a la audiencia con sus limitaciones o vicios ocultos como humanos. 7/23 Cuarto Quinto Nivel 12.6. El melodrama El melodrama, como su nombre lo indica, presenta situaciones dramáticas que llegan a emocionar al público incorporando piezas musicales acordes a cada escena. El francés Jean-Jacques Rousseau fue el primero en introducir la palabra melodrama al referirse a una obra dramática que es organizada de tal manera que introduce de forma sucesiva palabas y música para llegar a conmover al público. Es uno de los géneros más extendidos y con mayor representación tanto en el teatro como en el cine y en la televisión. Actualmente, el melodrama se ha popularizado en la televisión con la gran acogida de las telenovelas, que se basan en dramas sentimentales para llegar a la empatía de cierto público, causando alegría, llanto y dolor al analizar las situaciones que se les presentan a los protagonistas a causa de villanos; casi siempre los finales son felices y los “malos” tienen su lección según sus actos. Características del melodrama ⬥ ⬥ ⬥ ⬥ ⬥ ⬥ Exageración en las situaciones que se relacionen con sentimientos. Usualmente es la lucha entre el personaje virtuoso o protagonista y los villanos o antagonistas. La historia es lineal y concluye con un final feliz. Los personajes están claramente expuestos pudiendo determinar desde un principio quién es bueno y quién es malo. Conmueve los sentimientos del público. Las situaciones presentadas son de la vida real, pero de manera exagerada o inverosímil. Un ejemplo característico de melodrama que ha sido llevado al teatro, ópera, cine y televisión es Romeo y Julieta, también está la película Titanic. 8/23 Cuarto Quinto Nivel 12.7. La sátira Es un género literario que se desprende de la comedia como género mayor, es una forma de expresar indignación y denuncia social de manera clara y ruda llevando consigo un mensaje o una moraleja para cambiar las situaciones presentadas en la obra. El lenguaje que utiliza puede en verso o en prosa; se considera, además, un recurso literario de un género literario para dar énfasis a una situación incorrecta pero admitida dentro de la sociedad. Busca ridiculizar, por medio de la exposición burlesca y hasta cruel, ciertas situaciones, dando así una crítica indirecta y directa al mismo tiempo. Utiliza la exageración de situaciones, la burla como arma literaria para ridiculizar, va de la mano de la crítica e incluso la parodia o imitación burlesca se desprende de ella debido a que hace la interpretación humorística de situaciones que no lo son para aludirlas y llamar a la reflexión del público. 9/23 Cuarto Quinto Nivel 12.8. Otros subgéneros Al hablar de otros subgéneros dramáticos, nos referimos a las diferentes expresiones y al desarrollo que han tenido los géneros menores derivándose en otros subgéneros como las pastorelas, el sketch, la comedia de caracteres. Entre este grupo podemos nombrar los siguientes. El sainete Por esencia, es una obra teatral cómica que presenta de manera indirecta los vicios de la sociedad. Es una sola pieza que se desarrolla con lenguaje común y personajes que se pueden encontrar en la vida diaria, así como los vicios. Al igual que el entremés, que se lo presentaba entre escenas de géneros mayores, el sainete también era presentado al final como cierre de una obra. La loa Es una composición tipo prólogo expresada en verso que abre un acto cómico. Es un acto fuera de la obra que permite exponerla como un breve resumen. Su objetivo principal era predisponer al público a la aceptación de la obra que se iba a exponer. El entremés Es una pieza jocosa que se presenta en medio de los actos de géneros mayores a fin de que la pausa que se necesita para el cambio de escenario y de vestuario no quede en un espacio vacío, sino que brinde al público un entretenimiento que se sienta como espera. Por lo general, no tiene continuación pues es un solo acto corto. 10/23 Cuarto Quinto Nivel 12.8. Otros subgéneros El vodevil Es un tipo de pausa para obras musicales; es una pieza sencilla, cómica, ligera, que exponía situaciones hilarantes. En la actualidad, ha ido desapareciendo pues el entremés ha ocupado su lugar al ser un acto más extenso. La fábula Se desprende de la obra literaria pues su finalidad principal es transmitir un mensaje o una moraleja una vez que se concluya. Los hechos, a pesar de ser en muchas ocasiones ficticios, no se centran en la importancia de cada uno, sino en la concatenación que tienen para llegar a una moraleja. La zarzuela Se desprende de la ópera, tuvo mejor acogida en España por lo que se la suele denominar zarzuela española. Es una forma de teatro cantado de manera híbrida entre cantos, diálogos y actuación. La pieza Es una obra literaria escrita en forma de prosa en la que se presentan personajes claros que cada uno cumple un rol. Es una interpretación clara de cualquier hecho suscitado para atraer la atención del público y exponer situaciones emocionantes pero inteligibles y con finales establecidos de manera lógica y explicados con claridad. 10/23 Cuarto Quinto Nivel 12.8. Otros subgéneros El soliloquio Es un discurso tipo monólogo en el que el intérprete como único personaje interviniente se encarga de realizar las pausas que requiera el libreto a fin de marcar nuevas escenas. 10/23 Cuarto Quinto Nivel Autoevaluación 1. ¿A qué género menor se lo conoce como el género imposible? Al entremés. Al soneto. A la farsa. Pregunta 1 de 10 13/23 Cuarto Quinto Nivel Autoevaluación 2. ¿Qué es la ópera? Es un acto cantado y actuado al mismo tiempo. Es un concierto lírico propio del renacimiento. Es una presentación de artistas de todo tipo en un escenario vistoso y colorido. Pregunta 2 de 10 14/23 Cuarto Quinto Nivel Autoevaluación 3. ¿Qué es el género musical? Es una obra dramática con orquesta. Es la división de géneros musicales. Es una categoría que se basa en una pieza musical. Pregunta 3 de 10 15/23 Cuarto Quinto Nivel Autoevaluación 4. ¿Qué es la farsa? Una mentira teatral. Una obra teatral burlesca que exagera situaciones reales. La interpretación con personajes sin experiencia previa. Pregunta 4 de 10 16/23 Cuarto Quinto Nivel Autoevaluación 5. ¿Qué es el melodrama? Un acto dramático con fondo musical. Una exposición de la melancolía. Una obra romántica al límite conocida como melosa. Pregunta 5 de 10 17/23 Cuarto Quinto Nivel Autoevaluación 6. ¿Qué es la sátira? Un chiste contado por medio de una obra musical que busca empatizar con el público. Una obra en la que intervienen personajes que son odiados por el público desde su aparición. Una crítica picante que busca ridiculizar o menospreciar situaciones reales conocidas por la sociedad. Pregunta 6 de 10 18/23 Cuarto Quinto Nivel Autoevaluación 7. ¿Qué es la loa? Un cuento que busca dejar una lección moral en el público. Una poesía romántica usualmente usada en el siglo XX. Composición en verso que abre un acto cómico. Pregunta 7 de 10 19/23 Cuarto Quinto Nivel Autoevaluación 8. ¿Qué es el entremés? Una pequeña pieza que marca una pausa en la obra. Una pieza musical que alegra situaciones tristes que se presenten en la obra. Una canción propia del género romántico. Pregunta 8 de 10 20/23 Cuarto Quinto Nivel Autoevaluación 9. ¿Qué es el vodevil? Un acto corto que busca hacer llorar al público. Una comedia ligera en desuso. Una obra que se utiliza en la actualidad para motivar personas. Pregunta 9 de 10 21/23 Cuarto Quinto Nivel Autoevaluación 10. ¿Qué es la zarzuela? Se deriva de la ópera como pausa musical de una obra. Es un género musical trágico. Es una forma de baile tradicional que expresa sentimientos de venganza. Pregunta 10 de 10 22/23 Tragedia y Comedia El DRAMA o la dramática es uno de los géneros literarios de la antigüedad, tal y como los describió el filósofo griego Aristóteles, precursor de lo que hoy en día conocemos como dramaturgia o teatro. El término de hecho proviene del griego “drama” que se traduce como “hacer” o “actuar”, lo cual tiene mucho sentido pues en el drama la acción literaria y ficcional es llevada a escena mediante diálogos y acciones en un tiempo presente indefinido. Hay una distinción entre drama y teatro. El primero sería el conjunto de elementos lingüísticos, escritos o no, que componen los personajes, los diálogos (o monólogos, soliloquios), las acotaciones de la acción y las descripciones del mundo ficcional en que la acción transcurre, y es un género literario. El segundo, en cambio, sería la materialización de dicho género, su aspecto espectacular, involucrando a los actores, el escenario, la dirección, etc. Se llama COMEDIA a uno de los más antiguos géneros dramáticos, opuesto en su temática a la tragedia. Esta caracterizada por tramas y narraciones que evocan a la risa y que tienen un final feliz. Según la describe el filósofo griego Aristóteles en su Poética (siglo VI a.C.), la comedia consiste en una representación de los hombres peores de lo que realmente son, lo cual posibilita que los espectadores se burlen de ellos, incluso siendo figuras poderosas en vida real. La comedia, como la tragedia, tiene su origen como género en la Antigua Grecia (alrededor del 600 a.C.), como una evolución artística de los primitivos cantos de honor a Dionisos. La comedia, a diferencia de la tragedia, no se ocupa de enaltecer o de abordar solemnemente a sus personajes, sino que los escoge del vulgo y los somete no a un destino fatal, sino a los rigores del azar. De allí que en muchos tipos de comedia los personajes se libren de situaciones difíciles o embarazosas por la pura casualidad. https://www.youtube.com/watch?v=KJJAXKTAVN4 Los antiguos griegos la cultivaron como una de las dos formas cumbre de la dramática, asociándola a la musa bucólica y pastoril de nombre Talía, quien junto a Melpómene (musa de la tragedia) eran las inspiradoras del teatro. Desde entonces se representan estas dos artes mediante dos caretas: una sonriente y la otra llorosa, asociándolas a dos perspectivas en torno a la vida: la optimista y la pesimista. La TRAGEDIA se caracteriza por representar mediante un lenguaje solemne a personajes ilustres (“hombres mejores de lo que realmente son”, según Aristóteles), que se ven enfrentados contra un destino inevitable (el fatum latino o ananké griego) a causa de un error o una condición de su carácter (el orgullo o la hybris en la tragedia griega). https://www.youtube.com/watch?v =cXmvxHTW_60 La consecuencia de ello es siempre fatal y los héroes son castigados por los dioses, por lo general, con la locura o la muerte. El origen de la tragedia griega se remonta al siglo VI a.C. y parece estar relacionado con prácticas religiosas. La voz griega tragoedia de donde proviene el término actual, significaba literalmente “canto del macho cabrío”, pues su origen data de las celebraciones en honor al dios Dionisio, a quien se ofrendaba un macho cabrío que era públicamente degollado. https://www.youtube.com/watch?v=hx64 0mxyfRM Elementos de la tragedia La tragedia clásica se componía de los siguientes elementos: •Coro. El coro representaba en las tragedias un papel fundamental pues representaba la voz del pueblo: aconsejaba, explicaba los dilemas, daba información y dejaba en claro el dilema moral, etc. •Corifeo. El conductor del coro, que podía salir de éste y tener voz propia para increpar a los coreutas (miembros del coro) o a los demás personajes. •Personajes. Los distintos personajes, héroes o antagonistas jugaban su papel en la obra. Todos estaban representados por actores varones, independientemente de su sexo, pues las mujeres no tenían lugar en el teatro de la antigüedad. Estructura de la tragedia griega En cuanto al texto dramático, la tragedia griega posee la siguiente forma y estructura: •Prólogo: es una especie de sumario que relata los antecedentes de la historia. •Párodos: es el momento que da entrada al coro, con lo que inicia la acción dramática. •Episodios: son las escenas propiamente dichas, donde tienen lugar los diálogos de los personajes. •Estásimos: son los cantos del coro que, a lo largo de la pieza, aparecen para explicar la secuencia de las acciones o para sancionar las acciones de los personajes. •Éxodo: el éxodo es el desenlace del conflicto dramático. Casi siempre representa la caída del héroe, aunque en algunas ocasiones, el héroe puede verse redimido. Bibliografía • Castro Robaina, Israel. (2016). "¿Muerte de la tragedia?". Primer Acto. 350. • Colomer, Josep. (1990). La comedia politica. Enlace. • López Fonseca, Antonio. (2000). La comedia latina: una aproximación a la literatura dramática desde la perspectiva del género y la recepción. Cuadernos de filología italiana, ISSN 1133-9527, Nº. 7. Oraciones simples y compuestas Las ORACIONES SIMPLES son unidades de sentido que tienen autonomía sintáctica y que están compuestas por un único predicado, simple o compuesto, que corresponde a un mismo sujeto. Por ejemplo: La plaza está desierta. Las ORACIONES COMPUESTAS, por su parte, son aquellas que tienen dos o más verbos que corresponden a más de un sujeto. Por ejemplo: Los adultos trabajan y los niños juegan. Oraciones simples Una oración es simple cuando todos los verbos (sea uno o más) refieren al mismo sujeto. Sujeto simple. Se trata de un sujeto que tiene un solo núcleo (sustantivo, pronombre). Por ejemplo: María, mi hermana, baila muy bien. Por ejemplo: Juan corre mucho. / Juan corre y salta. Sujeto compuesto. Se trata de un sujeto que tiene más de un núcleo. Por ejemplo: María y Juana bailan muy bien. Sujeto tácito. Se trata de un sujeto que no está explícito en la oración pero que puede deducirse por la conjugación del verbo principal o por el contexto. Por ejemplo: Bailan muy bien. Predicado simple. Se trata de un predicado que tiene un solo núcleo verbal. Por ejemplo: María baila muy bien. Predicado compuesto. Se trata de un predicado que tiene más de un núcleo verbal. Por ejemplo: María baila y canta muy bien. Oraciones simples https://www.youtube.com/watch?v=K_b FNniZh0M Oraciones compuestas Las oraciones compuestas son aquellas que presentan más de un verbo conjugado y que corresponden a distintos sujetos. Por ejemplo: Mi amiga llegó tarde y sus padres se enojaron. En las oraciones compuestas, las suboraciones, también llamadas proposiciones, tienen coherencia sintáctica y autonomía de sentido. Así, en este caso, las suboraciones [Mi amiga llegó tarde] y [sus padres se enojaron] pueden comprenderse de manera independiente una de otra. Oraciones coordinadas. Se combinan proposiciones sintácticamente independientes utilizando conectores o nexos de diferentes tipos (aditivos, adversativos, distributivos, explicativos). Por ejemplo: [La casa quedó vacía] y [ella se sintió sola]. Oraciones compuestas Oraciones yuxtapuestas. Se unen dos proposiciones con el mismo valor sintáctico, pero sin coordinante o nexo, sino con algún signo de puntuación (coma, punto y coma, dos puntos). Por ejemplo: [Martín come mucho helado]; [Gimena detesta los dulces]. https://www.youtube.com/watch?v=VlhoF lWaPsQ Oraciones subordinadas. Una proposición depende sintácticamente de otra, que es la proposición principal. Oraciones compuestas Por ejemplo: La guitarra [que me regalaste] es hermosa. https://www.ejemplos.co/100-ejemplos-deoraciones-simples-y-compuestas/ Trabajo en clase: • Desarrollar un escrito de 3 párrafos que abarquen todos los ejemplos de oraciones simples y compuestas que hemos revisado en clase. Parámetros: - El trabajo es grupal. - El trabajo debe ser presentado y desarrollado en clase. - El tema del escrito es completamente abierto y libre. - Se deben señalar los diferentes ejemplos de oraciones simples y compuestas vinculados al escrito. Bibliografía: Géneros Literarios https://www.youtube.com/watch?v=ue6R6bE_lhY El TEXTO LITERARIO es aquel que usa el lenguaje literario y que persigue un fin estético para captar el interés del lector. El autor de literatura busca los elementos sintácticos adecuados para expresar sus ideas de manera depurada y según un criterio de estilo. Se denomina género literario a cada una de las clases en que se dividen los textos literarios, escritos por los autores con una finalidad determinada. https://www.youtube.com/watch?v=41j4C-Jq7yE Cada género literario comprende, a su vez, otros subgéneros literarios. 1.Género lírico: Se usa para expresar sentimientos y para ello, emplea generalmente el verso. 2.Género narrativo: Se utiliza para presentar historias realizadas por personajes que pueden intervenir mediante el diálogo. El narrador cuenta la historia y para ello puede utilizar distintas formas de elocución, esto es, la narración, la descripción, la exposición o la argumentación. 3.Género dramático: Es aquél destinado a ser representado ante unos espectadores. Los personajes intervienen sin la mediación de ningún narrador, siguiendo las indicaciones sobre vestuario, gestos, movimientos, etc. que contienen las acotaciones del texto teatral. Subgéneros literarios • Canción: poema de tema amoroso. • Elegía: poema en el que se llora la muerte de un ser querido. Subgéneros líricos: • Oda: poema que trata un tema serio y elevado. • Sátira: poema utilizado para ridiculizar a alguien o a algo. • Égloga: poema extenso con temas de la naturaleza y ambiente pastoril. • Cuento: narración breve con pocos personajes y con el tiempo y espacio escasamente desarrollados. • Novela: narración más extensa y compleja que el cuento donde aparece una trama complicada o intensa, personajes sólidamente trazados, ambientes descritos, creando un mundo autónomo e imaginario. Subgéneros narrativos • Poema épico: Relata las hazañas heroicas con el propósito de glorificar hazañas. Por ejemplo, La Eneida, de Virgilio. • Cantar de gesta: Poema escrito para ensalzar la acción de un héroe. Por ejemplo, el Poema de Mío Cid. • Romance: Poema épico-lírico usado para narrar hazañas o hechos de armas. • Comedia: Desarrolla conflictos divertidos y amables, con personajes pertenecientes al mundo de la normalidad. Subgéneros dramáticos • Drama: Los personajes luchan contra la adversidad, que suele reflejar sus vicisitudes y peligros. Pueden intervenir elementos cómicos y entonces toma el nombre de tragicomedia. • Tragedia: Presenta terribles conflictos entre personajes nobles, ilustres o héroes- que son víctimas de pasiones o fatalidades que les llevan a un desenlace funesto. • Otros subgéneros dramáticos: el auto sacramental, el entremés, el paso, el melodrama, etc. Bibliografía Castro Robaina, Israel. (2016). "¿Muerte de la tragedia?". México: Primer Acto. Colomer, Josep. (1990). La comedia politica. Barcelona: Enlace. López Fonseca, Antonio. (2000). La comedia latina: una aproximación a la literatura dramática desde la perspectiva del género y la recepción. Cuadernos de filología italiana, ISSN 1133-9527, Nº. 7. Actividad de aprendizaje N°9 • Desarrollar una grabación de la implementación de una actividad de aprendizaje en relación a los géneros literarios. Parámetros: - Deben escoger un subgénero literario (novela, comedia, tragedia, cuento, etc.) para implementar la actividad. - La actividad de aprendizaje debe ser grabada en un formato de video (debe durar entre 5 a 10 minutos) - Se debe grabar el desarrollo de la actividad (la explicación de la actividad y la implementación didáctica). - El video debe ser subido en el aula virtual dentro de un enlace. - El trabajo es grupal. - El trabajo debe ser creativo y recursivo. Conectores de la oración Conjunciones coordinantes: Estas conjunciones se utilizan para unir dos oraciones independientes que tienen lógica por sí solas. Ambos elementos tienen igual jerarquía sintáctica. Brindan una coordinación entre las dos ideas que tienen una misma jerarquía. Conectores de la oración https://www.elabueloeduca.com/apr ender/lengua/palabras/conjunciones. html https://www.ejemplos.co/conjuncion es-coordinantes/ https://www.ejemplos.co/nexossubordinantes/ Conjunciones subordinantes: Estas conjunciones se utilizan para unir una oración independiente que tienen lógica por sí sola y una dependiente, la cual no tienen sentido por sí sola. La coordinada como la subordinada pueden estar al inicio o al final de la oración. Locuciones conjuntivas: Casi todas las conjunciones subordinadas son locuciones conjuntivas entendiendo esta como dos o más palabras que adoptan una forma de conjunción, esto quiere decir que las conjunciones subordinadas en su mayoría no son solo una palabra como “para” sino que se componen de dos o más palabras como “por lo que,” “a fin de que.” Los signos de puntuación. Los signos de puntuación (la coma, el punto, los paréntesis, los puntos suspensivos, etc.) facilitan la lectura y la comprensión de los textos. Estos signos ortográficos desempeñan funciones diversas: pueden limitar la extensión de elementos de la oración, indicar la modalidad de un enunciado (si es enunciativo, interrogativo, exclamativo, imperativo, etc.) e incluso señalar la omisión de una parte del mismo. Los signos de puntuación en español son de uso OBLIGATORIO en la mayoría de los casos, pues su presencia o ausencia marca cambios de significado o son u reflejo de la función sintáctica de los componentes de una oración. Solo en determinados contextos el uso de los signos de puntuación es opcional y una cuestión de estilo personal del orador. La coma (,) es un signo de puntuación que sirve para delimitar unidades del discurso inferiores al enunciado o incisos que aportan información secundaria, también representa una pausa en la lectura. En determinados casos, el uso de las comas es opcional y responde al estilo del orador, quien decide cómo quiere presentar la información. El punto (.) se utiliza para marcar gráficamente el final de una oración enunciativa (afirmativa o negativa). El punto sigue las normas de escritura siguientes: • Se escribe pegado a la palabra que lo precede; • La palabra siguiente se escribe dejando un espacio libre; • La palabra siguiente se escribe siempre con mayúscula. El punto recibe distintos nombres según señale el final de un enunciado, de un párrafo o de un texto: • Punto y seguido: si a continuación, en el mismo párrafo, comienza otra oración. • Punto y aparte: si la oración a la que pone fin es la última del párrafo y en el renglón nuevo se inicia otro. • Punto final: si la oración a la que pone fin es la última del texto. https://espanol.lingolia.com/es/re daccion/signos-depuntuacion/punto#a-con-otrossignos-de-puntuacion El punto y coma (;) representa una pausa mayor que la de una coma y más débil que la de un punto. Se escribe sin separación con la palabra que lo precede y seguido de minúscula. En muchos casos, el punto y coma puede reemplazarse por otros signos de puntuación, como la coma, el punto y seguido o los dos puntos. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/punto-y-coma Los dos puntos (:) introducen algo relacionado con lo presentado en un párrafo o texto como: ejemplos, enumeraciones, explicaciones, conclusiones, etc. Después de los dos puntos se escribe minúscula, excepto cuando introducen un enunciado en estilo directo. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/dos-puntos#a-titulos-de-obras Los puntos suspensivos (…) son tres puntos consecutivos que se emplean para dejar un discurso en suspenso o interrumpirlo. Si se emplean al final del enunciado, la palabra de la siguiente oración (en el mismo párrafo o no) se escribe con mayúscula. Si no marcan el final del enunciado, y la oración continúa, la palabra siguiente se escribe con minúscula. Ejemplo: La noticia me pareció… bien, supongo. El ascenso de Julia… No estoy segura de que se lo mereciera más que yo. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/puntos-suspensivos El paréntesis ( ) enmarca un enunciado que aporta información adicional, secundaria o aclaratoria sobre el mensaje principal. El paréntesis lleva por regla general por fuera un espacio antes y después, pero no por dentro. Los incisos también pueden aislarse del resto del texto con comas o rayas. El aislamiento que ofrece el paréntesis es, no obstante, de mayor grado. El enunciado o frase dentro del paréntesis suele tener sentido pleno y no guarda necesariamente una relación o similitud sintáctica con el resto de elementos del texto principal. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/parentesis Bibliografía: • Cantú, L., Flores, J., Roque, M. (2005). Comunicación oral y escrita. México: continental. Compañía editorial • Espinosa, S. (1992). Manual de ortografía, aprender sonriendo. Bogotá: Norma. • Fonseca, S., Correa, A., Pineda, M., Lemus, F. (2011). Comunicación oral y escrita. México: México: Pearson. • Maqueo, A., (1995). Ortografía. México: Editorial Limusa, S.A. • Real Academia Española. (2002). Ortografía de la lengua española. Madrid: Espasa Calpe. • Viteri, E. (2003). Antología básica e historia del cuento ecuatoriano. Quito: Editor E. Viteri, ISBN 9978404783, 9789978404782 • https://espanol.lingolia.com/es/ Práctica en clase • Establecer una actividad pedagógica para el aprendizaje de los elementos abordados en clase: Conectores de la oración (conjunciones, signos de puntuación), elementos gramaticales (análisis del sujeto, elementos del predicado). Parámetros: • La actividad pedagógica debe cumplir con los siguientes pasos: tema, objetivos, metodología, desarrollo de contenido, recursos y evaluación. • El trabajo debe ser subido en el aula virtual en formato PDF o Word. • El trabajo debe llevar referencias y estar sustentado a partir de la normativa APA. • El trabajo debe ser presentado de manera grupal. Conectores de la oración Conjunciones coordinantes: Estas conjunciones se utilizan para unir dos oraciones independientes que tienen lógica por sí solas. Ambos elementos tienen igual jerarquía sintáctica. Brindan una coordinación entre las dos ideas que tienen una misma jerarquía. Conectores de la oración https://www.elabueloeduca.com/apr ender/lengua/palabras/conjunciones. html https://www.ejemplos.co/conjuncion es-coordinantes/ https://www.ejemplos.co/nexossubordinantes/ Conjunciones subordinantes: Estas conjunciones se utilizan para unir una oración independiente que tienen lógica por sí sola y una dependiente, la cual no tienen sentido por sí sola. La coordinada como la subordinada pueden estar al inicio o al final de la oración. Locuciones conjuntivas: Casi todas las conjunciones subordinadas son locuciones conjuntivas entendiendo esta como dos o más palabras que adoptan una forma de conjunción, esto quiere decir que las conjunciones subordinadas en su mayoría no son solo una palabra como “para” sino que se componen de dos o más palabras como “por lo que,” “a fin de que.” Los signos de puntuación. Los signos de puntuación (la coma, el punto, los paréntesis, los puntos suspensivos, etc.) facilitan la lectura y la comprensión de los textos. Estos signos ortográficos desempeñan funciones diversas: pueden limitar la extensión de elementos de la oración, indicar la modalidad de un enunciado (si es enunciativo, interrogativo, exclamativo, imperativo, etc.) e incluso señalar la omisión de una parte del mismo. Los signos de puntuación en español son de uso OBLIGATORIO en la mayoría de los casos, pues su presencia o ausencia marca cambios de significado o son u reflejo de la función sintáctica de los componentes de una oración. Solo en determinados contextos el uso de los signos de puntuación es opcional y una cuestión de estilo personal del orador. La coma (,) es un signo de puntuación que sirve para delimitar unidades del discurso inferiores al enunciado o incisos que aportan información secundaria, también representa una pausa en la lectura. En determinados casos, el uso de las comas es opcional y responde al estilo del orador, quien decide cómo quiere presentar la información. El punto (.) se utiliza para marcar gráficamente el final de una oración enunciativa (afirmativa o negativa). El punto sigue las normas de escritura siguientes: • Se escribe pegado a la palabra que lo precede; • La palabra siguiente se escribe dejando un espacio libre; • La palabra siguiente se escribe siempre con mayúscula. El punto recibe distintos nombres según señale el final de un enunciado, de un párrafo o de un texto: • Punto y seguido: si a continuación, en el mismo párrafo, comienza otra oración. • Punto y aparte: si la oración a la que pone fin es la última del párrafo y en el renglón nuevo se inicia otro. • Punto final: si la oración a la que pone fin es la última del texto. https://espanol.lingolia.com/es/re daccion/signos-depuntuacion/punto#a-con-otrossignos-de-puntuacion El punto y coma (;) representa una pausa mayor que la de una coma y más débil que la de un punto. Se escribe sin separación con la palabra que lo precede y seguido de minúscula. En muchos casos, el punto y coma puede reemplazarse por otros signos de puntuación, como la coma, el punto y seguido o los dos puntos. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/punto-y-coma Los dos puntos (:) introducen algo relacionado con lo presentado en un párrafo o texto como: ejemplos, enumeraciones, explicaciones, conclusiones, etc. Después de los dos puntos se escribe minúscula, excepto cuando introducen un enunciado en estilo directo. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/dos-puntos#a-titulos-de-obras Los puntos suspensivos (…) son tres puntos consecutivos que se emplean para dejar un discurso en suspenso o interrumpirlo. Si se emplean al final del enunciado, la palabra de la siguiente oración (en el mismo párrafo o no) se escribe con mayúscula. Si no marcan el final del enunciado, y la oración continúa, la palabra siguiente se escribe con minúscula. Ejemplo: La noticia me pareció… bien, supongo. El ascenso de Julia… No estoy segura de que se lo mereciera más que yo. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/puntos-suspensivos El paréntesis ( ) enmarca un enunciado que aporta información adicional, secundaria o aclaratoria sobre el mensaje principal. El paréntesis lleva por regla general por fuera un espacio antes y después, pero no por dentro. Los incisos también pueden aislarse del resto del texto con comas o rayas. El aislamiento que ofrece el paréntesis es, no obstante, de mayor grado. El enunciado o frase dentro del paréntesis suele tener sentido pleno y no guarda necesariamente una relación o similitud sintáctica con el resto de elementos del texto principal. https://espanol.lingolia.com/es/redaccion/signos-depuntuacion/parentesis Bibliografía: • Cantú, L., Flores, J., Roque, M. (2005). Comunicación oral y escrita. México: continental. Compañía editorial • Espinosa, S. (1992). Manual de ortografía, aprender sonriendo. Bogotá: Norma. • Fonseca, S., Correa, A., Pineda, M., Lemus, F. (2011). Comunicación oral y escrita. México: México: Pearson. • Maqueo, A., (1995). Ortografía. México: Editorial Limusa, S.A. • Real Academia Española. (2002). Ortografía de la lengua española. Madrid: Espasa Calpe. • Viteri, E. (2003). Antología básica e historia del cuento ecuatoriano. Quito: Editor E. Viteri, ISBN 9978404783, 9789978404782 • https://espanol.lingolia.com/es/ Práctica en clase • Establecer una actividad pedagógica para el aprendizaje de los elementos abordados en clase: Conectores de la oración (conjunciones, signos de puntuación), elementos gramaticales (análisis del sujeto, elementos del predicado). Parámetros: • La actividad pedagógica debe cumplir con los siguientes pasos: tema, objetivos, metodología, desarrollo de contenido, recursos y evaluación. • El trabajo debe ser subido en el aula virtual en formato PDF o Word. • El trabajo debe llevar referencias y estar sustentado a partir de la normativa APA. • El trabajo debe ser presentado de manera grupal. •Yuxtapuestas (oraciones independientes, con sentido completo, separadas por comas unas de otras)(En proceso de extinción) Ej.: Vine, vi, vencí. a. Copulativas (y, e, ni... ni, que, amén de, junto con, además de,…) Ej.: Juan estudia Derecho y Ana trabaja en una farmacia. Ej.: Jugamos muy bien pero perdimos el partido. b. Adversativas (mas, pero, sin embargo, no obstante, sino,…) (P1 - P2) Ej.: O vienes o te quedas. c. Disyuntivas (o, u, o bien) Las PC tienen por separado, sentido pleno —están en el mismo nivel gramatical—. Están unidas por una conjunción que modifica d. Distributivas (ya... ya, bien… bien, sea… sea, ora… ora,…) Ej.: Unos jugáis al fútbol, otros hacéis las tareas del colegio. en cierto modo el contenido de las oraciones coordinadas. Ej.: Le hizo un quite, esto es, se llevó el toro. e. Explicativas (es decir, o sea, esto es,…) Ej.: Me preocupa que estudies mucho. de Sujeto Ej.: Andrés piensa que Carlos tenía razón. de Complemento directo (CD) a. Sustantivas Ej.: Tenemos el convencimiento de que te presentarás voluntaria. de Complemento del nombre (CN) Desempeña la función de un sustantivo. Se suele poder sustituir por “eso”, “esas cosas”. Ej.: Juan está que muerde. de Atributo Sirve de nexo la conjunción que. de Complemento de un adjetivo (C Adj) Ej.: Estaba seguro de que ganaríamos el concurso. (de relativo sustantivadas) de Complemento Agente (C Ag) b. Adjetivas o de relativo Especificativas •Coordinadas Oración Compuesta •Subordinadas (PP - PS) Existe una relación de subordinación o dependencia de una respecto de la otra. La PS desempeña una función gramatical dentro de la PP. Ej.: El hombre que está sentado es su padre. (selecciona al antecedente de entre Desempeña la función de un adjetivo: calificar a un nombre. A este nombre se le el grupo al que pertenece) llama antecedente. Sirven de nexo: Explicativas - pronombres relativos: que, cual(es), quien(de persona). (puede omitirse sin alterar el sentido Ej.: El jugador, que estaba cansado, se marchó. - los adverbios relativos donde, como, cuando. de la oración) - el pronombre cuyo (a/os/as), que actúa como relativo—posesivo. - Sirve para situar en el tiempo la acción principal: puede ser de anterioridad (antes de), de posterioridad (después de) o de de tiempo simultaneidad (durante). Ej.: Siéntate cuando quieras. Nexos: cuando, mientras (que), antes (de que), desde que, al mismo tiempo que, después (de que), hasta que, a medida que, siempre que,… de relación circunstancial c. Adverbiales de lugar - Señala el lugar relacionado con la acción principal. Indica: situación (en donde), dirección (a donde), procedencia (de donde) y transcurso (por donde). Nexos: donde —con o sin preposición—. Ej.: Siéntate donde quieras. de modo - Informa sobre la manera de realizar(se) la acción principal. Nexos: como, según, conforme,… Ej.: Siéntate como quieras. Comparativas - Hay una comparación con la PP. Esa relación es de: superioridad (más… que, más... de); igualdad (tan/tanto… como/cuanto, igual que,…); inferioridad (menos… que). Ej.: Es más listo que Javier. Ej.: Es tan listo como pensé. Ej.: Es menos torpe que ayer. Causales - Expresa el motivo por el cual acontece la PP. Nexos: porque, ya que, puesto que, pues, como,… Ej.: Me voy porque llueve. Consecutivas - La PS es consecuencia de la PP. Se invierte con la causal. Nexos: por lo tanto, luego, pues, de tal modo/tanto… que, así que... Ej.: Pienso, luego existo. Concesivas - Opone una dificultad al cumplimiento de la PP. Nexos: aunque —no sustituible por pero—, a pesar de que, aun cuando,… Ej.: Gané aunque fui enfermo. Condicionales - Formula una condición para que se cumpla la acción principal. Nexos: si, con tal de que, siempre que, con que, a condición de que... Ej.: Me quedaré si me ayudas. Finales - Explica para qué se realiza la acción principal. Nexos: para que, para, a fin de que, con el objeto de que… Ej.: Jugaré para divertirnos. (tienen la función de un adverbio) de relación lógica © Nicolás Chazarra. 2005. Colegio Retamar. Morfosintaxis La Morfosintaxis es el estudio de las reglas morfológicas y sintácticas de una lengua. Etimológicamente la palabra morfosintaxis proviene de la combinación de dos palabras griegas; morfo que significa “forma” y sintaxis que significa “orden”. Ayuda a identificar los elementos que permiten construir oraciones de manera lógica y con sentido, considerando las reglas necesarias que utiliza cada palabra y cómo estás deben estar unidas en una oración. La morfosintaxis combina la morfología y la sintaxis para la comprensión de las diferentes derivaciones de una palabra o una oración. Al estudiar la morfosintaxis, estamos hablando de componentes lingüísticos para analizar tanto la estructura de cada palabra como de la oración. Para realizar un estudio más específico, es necesario poner énfasis y entender: - Semántica, significado gramatical y léxico de cada palabra. - Sintaxis, la estructura y organización de las palabras dentro de la oración. - Fonética, la prosodia, acento, pronunciación de cada palabra y sus variantes cuanto una se enlaza con otra dentro de una oración o frase. La morfología en la lingüística estudia la estructura interna de las palabras y las variaciones que se pueden presentar manteniendo la misma raíz que es única para cada palabra. Estas variaciones permiten clasificar las palabras en distintos grupos y unidades y a la vez crear nuevas palabras o variaciones. La raíz de una palabra o lexema es la parte de la palabra que aporta el significado mismo de la palabra, la cual añadida afijos varía en cuanto a su forma y grupo más no su significado mismo, esta raíz puede ser compartida por varias palabras. https://www.youtube.com/watch?v=0H2fvcyTf3U Morfología flexiva. – Estudia las variaciones que pueden presentar las palabras en cuanto a diferentes características que modifican su significado global, pero no así el significado de la raíz de la palabra. Morfología léxica. – Esta se dedica al estudio de la estructura misma de la palabra, permite la creación de nuevas unidades léxicas que son independientes o dependientes. Esta se divide en derivación y composición. La sintaxis a diferencia de la morfología que estudia la estructura interna de las palabras y cómo se forman nuevas palabras, la sintaxis estudia el proceso mediante el cual las palabras se combinan para formar oraciones y frases. Larousse (2003) contextualiza a la sintaxis como ““la parte de la gramática que estudia la manera como se combinan y ordenan las palabras para formar oraciones. Analiza las funciones que aquellas desempeñan, así como los fenómenos de concordancia que pueden presentar entre sí.” (pp. 139) https://www.youtube.com/watch?v=ns_uAuTLYcc Sintaxis estructural. – Se ocupa de la forma de conectarse las palabras a fin de crear frases u oraciones. Estas conexiones estructurales se presentan de manera dependiente pues cada conexión determina ciertos elementos de la misma oración, es decir que, si el sujeto es singular, el verbo será singular. Este orden puede ser estructural o lineal o viceversa. Sintaxis generativa. – Se ocupa de las relaciones, reglas, principios que determinan las combinaciones correctas a ser utilizadas para crear oraciones o conexiones lógicas. Sintaxis funcionalista. – Se ocupa de la explicación del lenguaje humano y la función que cumple como herramienta comunicativa, para que esta comunicación se desarrolle, es necesario un proceso lógico y jerárquico de las palabras y las conexiones a ser utilizadas. El sintagma es una unidad menor que la oración y mayor que la palabra. Un sintagma, en gramática, es una palabra o un grupo de palabras que se articula en torno a un núcleo y que tiene función sintáctica. Los núcleos sintácticos son el general la palabra, que propiedades sintácticas y combinaciones del sintagma al dicho núcleo. morfema o en establece las las posibles que pertenece https://www.youtube.co m/watch?v=qmAIFlyy5Y U https://www.youtube.com/ watch?v=kr6sCq06NhU https://www.aulafacil.com/cursos/lenguaj e-secundaria-eso/analisissintactico/ejemplos-de-analisis-deoraciones-simples-ii-l27675 Las oraciones están constituidas habitualmente por dos componentes básicos: el sintagma verbal predicado y el sintagma nominal que desempeña la función de sujeto. En la oración Nuestro vecino llegó podemos distinguir: Cada sintagma puede contener dentro de sí otros sintagmas. En el análisis sintáctico hay que precisar qué función sintáctica desempeña cada uno de ellos (relación entre tipo de sintagma y función). Por ejemplo, podemos alargar la oración anterior introduciendo distintos tipos de sintagmas, cada uno con su función: • SN / Sujeto: Nuestro vecino del quinto • SPrep / CN: del quinto • SN / Sujeto: Nuestro vecino • SV / Predicado verbal: llegó ayer muy contento del trabajo • SV / Predicado verbal: llegó • SAdv / CCTiempo: ayer • SAdj / CPvo : muy contento • SPrep / CCLugar: del trabajo Un constituyente sintáctico es una palabra, o secuencia de palabras, que funciona en conjunto como una unidad dentro de la estructura jerárquica de una oración. Un constituyente puede descomponerse frecuentemente en dos subsecuencias o más, cada una de las cuales es, a su vez, otro constituyente. El conjunto de todos los constituyentes una oración es un conjunto ordenado, donde el orden se basa en descomponibilidad de los constituyentes subsconstituyentes. de en la en Bibliografía: