ACTIVIDAD 7. CUESTIONES DE CODIFICACIÓN Y ANOTACIÓN Responde a las siguientes cuestiones relacionadas con el apartado 6 del curso de Lingüística de corpus: 1) ¿Por qué un corpus codificado y anotado resulta útil? Pon un ejemplo. (2 puntos) 2) A continuación tienes un fragmento del primer capítulo de la primera parte de la novela Blanco nocturno de Ricardo Piglia (Anagrama, Barcelona, 2010). ¿Qué aspectos extratextuales podrías codificar? ¿Y qué aspectos textuales? (4 puntos) [Tomado de URL: http://www.elpais.com/especial/libros/pdf/blanco_nocturno.pdf] 3) ¿Por qué se han propuesto estándares de etiquetación? (1 punto) 4) Utilizando el sistema de las referencias COCOA, codifica el fragmento de texto anterior. No olvides incluir la clave de las etiquetas que emplees. (10 puntos) 5) Codifica el mismo texto usando la propuesta de la TEI. Para la cabecera, codifica solo la información obligatoria. (10 puntos) 6) ¿En qué se diferencia la anotación de la codificación? (1 punto) 7) ¿Por qué no se puede emplear la anotación automática en todos los casos? (1 punto) 8) ¿Qué ventajas se han señalado para los corpus anotados frente a los no anotados? (1 punto) 9) La anotación categorial es la más frecuente en los corpus. Haz una propuesta de anotación de este tipo para el texto siguiente. No olvides incluir la clave de las etiquetas que utilices. (30 puntos) Una amante inoportuna “Algunas veces suelo recostar mi cabeza en el hombro de la luna y le hablo de esa amante inoportuna que se llama soledad” (Joaquín Sabina) 10) Luego introduce el texto en los analizadores para el español que figuran a continuación. Contrasta los resultados de tu análisis con los de los programas (2 puntos) http://gemini.uab.es:9080/SFNsite/sfn-tools/sfn-parser http://nlp.lsi.upc.edu/freeling/demo/demo.php 11) La anotación gramatical no está exenta de problemas. Comenta los que detectes en el siguiente fragmento de “Que se llama soledad” (Hotel dulce hotel, 1987) de Joaquín Sabina. (10 puntos) […] Algunas veces vivo Algunas veces gano y otras veces y otras veces la vida se me va con lo que escribo; pongo un circo y me crecen los enanos; algunas veces busco un adjetivo algunas veces doy con un gusano inspirado y posesivo en la fruta del manzano que te arañe el corazón; prohibido del padre Adán; luego arrojo mi mensaje, o duermo y dejo la puerta se lo lleva de equipaje de mi habitación abierta una botella…, al mar de tu incomprensión. por si acaso se te ocurre regresar; No quiero hacerte chantaje, más raro fue aquel verano sólo quiero regalarte una canción. que no paró de nevar. 12) La lematización es otro proceso que permite aumentar la utilidad de un corpus. Lee de nuevo el texto anterior y señala únicamente las palabras que suelen estar recogidas como entradas en un diccionario, es decir, aquellas que son formas básicas. ¿Qué clase de palabras son las que se beneficiarían más de la lematización? Después contrasta los resultados con el DRAE y el lematizador de Thera. (35 puntos) DRAE: http://www.rae.es/rae.html Thera: http://www.thera-clic.com/site/Demos/Morfologico-ES.html Palabra Lema DRAE Thera *Las palabras que aparecen más de una vez no es necesario que las analices dos veces. 13) El análisis sintáctico y semántico de los textos también añade valor a un corpus. Consulta la Base de Datos Sintácticos del Español Actual (http://www.bds.usc.es/consultas/index.html) para contestar las cuestiones que figuran debajo a propósito de estos dos titulares: (13 puntos) El 2010 acaba con 4.100.073 parados, un 4,5% más Público.es, 04/01/2011 El mejor diciembre de paro en 10 años cierra un 2010 para olvidar El Pais.com, 04/01/2011 13a) ¿En qué esquema sintáctico son más frecuentes los verbos acabar y cerrar? Piensa en ejemplos de uso y luego consulta el corpus para contrastar tu intuición. (Opción: verbos esquemas) 13b) Busca en el corpus un ejemplo de cada verbo en el esquema más frecuente. (Opción: ejemplos de un verbo con un esquema) 13c) ¿En qué esquema aparecen usados estos verbos en los textos? ¿Es el esquema más frecuente de estos verbos? 13d) ¿Con es la única preposición con la que aparece acabar en este esquema concreto? ¿Se emplea con esta preposición en otro esquema? ¿En cuál? (Opción: verbos subesquemas) 13e) ¿Qué verbos crees que se utilizan frecuentemente con este subesquema? (Opción: preposiciones verbos y subesquemas con una preposición) 13f) Por lo que se refiere al verbo cerrar, ¿en el ejemplo se usa en el subesquema más frecuente? ¿Cuál es este subesquema? 14) Por último, observa el siguiente texto y subraya los sintagmas que contienen referencias anafóricas que se refieren al mismo referente. Identifícalas con un mismo número, de tal forma que quede claro cuáles son correferentes. (12 puntos) Soy Inés Suárez, vecina de la leal ciudad de Santiago de la Nueva Extremadura, en el Reino de Chile, en el año 1580 de Nuestro Señor. De la fecha exacta de mi nacimiento no estoy segura, pero, según mi madre, nací después de la hambruna y la tremenda pestilencia que asoló a España cuando murió Felipe el Hermoso. No creo que la muerte del rey provocara la peste, como decía la gente al ver pasar el cortejo fúnebre, que dejó flotando en el aire, durante días, un olor a almendras amargas, pero nunca se sabe. La reina Juana, aún joven y bella, recorrió Castilla durante más de dos años llevando de un lado a otro el catafalco, que abría de vez en cuando para besar los labios de su marido, con la esperanza de que resucitara. A pesar de los ungüentos del embalsamador, el Hermoso hedía. Cuando yo vine al mundo, ya la infortunada reina, loca de atar, estaba recluida en el palacio de Tordesillas con el cadáver de su consorte; eso significa que tengo por lo menos setenta inviernos entre pecho y espalda y que antes de la Navidad he de morir. Isabel Allende, Inés del alma mía, 2006 Expresión referencial Expresión correferente