Proyecto de investigación “El habla de Monterrey. Segunda etapa” actualización de la liga “Publicaciones” José Josimar Pulido Hernández/ Karla Paola Medellín Flores Centro de Estudios Humanísticos, Estudiantes de la Licenciatura en Bibliotecología y Ciencias de la Información Facultad de Filosofía y Letras, UANL Profesora asesora: Dra. María Eugenia Flores RESUMEN “El Habla de Monterrey” es una investigación sociolingüística que posee un corpus de entrevistas orales de tres grupos sociales del noreste mexicano, que se aprovecha para investigar sobre el habla oral desde diversas perspectivas. Desarrolla su segunda etapa y es dirigido por la Dra. Lidia Rodríguez Alfano (apoyado por el CONACYT, 2008-2010). La Dra. María Eugenia Flores Treviño co-responsable de dicha investigación (proyecto PAICYT de la UANL, 2008-2010). Este macroproyecto posee una página electrónica que requiere actualizar las bases de datos del site “publicaciones” para ofrecer a los estudiosos de todas partes del mundo, los resultados del proyecto. PALABRAS CLAVES: Documentación, Indización, Español, Sociolingüística, Vocabulario controlado. INTRODUCCIÓN El presente proyecto es una segunda etapa que continúa del que se ha venido desarrollando por estudiantes del Colegio de Bibliotecología desde el año 2006 hasta el año 2008, dentro del proyecto de “El Habla de Monterrey” en su primera etapa recopilatoria. Hasta el momento, la página electrónica de este proyecto no cuenta con el procedimiento de indización. Por tales razones, el presente proyecto se propone la ejecución de la propuesta de indizar la página del Habla de Monterrey con sustento en métodos calificados, así como compilar, catalogar y organizar los insumos para actualizar la base de datos con la que cuenta. ANTECEDENTES “El Habla de Monterrey” es una investigación sociolingüística que reúne entrevistas orales de tres grupos sociales del noreste mexicano. El corpus se aprovecha para realizar investigaciones sobre la lengua (el habla oral) en la región de Monterrey, desde diversas perspectivas. Este proyecto se desarrolla actualmente en su segunda etapa y es dirigido por la Dra. Lidia Rodríguez Alfano, cuenta con el apoyo del Consejo Nacional de Ciencia y Tecnología, CONACYT (2008-2010). La Dra. María Eugenia Flores Treviño es la coresponsable de dicha investigación dentro del proyecto PAICYT de la UANL. La Mtra. Tzitel Pérez Aguirre es colaboradora en esta investigación. En este macroproyecto fue indispensable la creación de bases de datos para accesibilidad a todos los interesados, tanto dar del Colegio de Ciencias del Lenguaje en la Facultad de Filosofía y Letras, como a estudiosos de todas partes del mundo, pues fue el compromiso adquirido ante el CONACYT con el que se diseñó este proyecto: el dar a conocer esta investigación al mayor número de usuarios y ofrecer la base de datos así construida.. El corpus El habla de Monterrey es catalogado como el pionero y más completo de América Latina debido a las 600 horas de grabación que conforman este corpus. Desde el 2005, en el XIV Congreso ALFAL organizado por la Dra. Lidia Rodríguez y varios colaboradores entre la que se encuentra la Dra. María Eugenia Flores Treviño, se incorpora El habla de Monterrey al Programa de Estudios del Español y América (PRESEEA), coordinado desde la Universidad de Alcalá y en el cual se propone realizar estudios comparativos del uso del español en diversas ciudades del continente americano y de España. En la página web se encuentran documentos de acuerdo a diferentes tipos de datos: 1) Datos escritos: los textos de las 600 entrevistas transcritos en Word. 2) Datos orales: el audio de las 600 entrevistas disponibles en muestras seleccionadas para la Internet o bien en discos compactos, según la solicitud de los usuarios de esta página web. 3) Datos en que se pone en paralelo el audio y su trascripción por escrito 4) Datos sociodemográficos con la caracterización de los informantes con base en variables sociológicas. 5) Datos informáticos. 6) Datos bibliográficos, donde se ofrece información y se pone a disposición de los usuarios todas las publicaciones así como los textos de tesis y ponencias presentadas por distintos investigadores a lo largo de más de 20 años, desde el inicio del proyecto "El habla de Monterrey". Como menciona Humberto López Morales en su ponencia Los Corpora lingüísticos hispanoamericanos: situación actual “la confección de un corpus han alcanzado tales complejidades en los diseños, composiciones, etiquetado, y demás actividades inherentes al corpus que en Alemania se preparaba el lanzamiento de la primera revista especializada en dicho tema” (López, 2005 : 31) Una de las finalidades de este proyecto El habla de Monterrey. Segunda fase (20072010) es aprovechar este nuevo corpus, que recoge muestras de conversación oral, para emplearlo como material de enseñanza de la lengua en la educación superior y compilar las alternativas didácticas reflejadas en un manual que resulte de utilidad para docentes e investigadores del idioma español. De tal tarea, es responsable la Dra. María Eugenia Flores, quien ha convocado a un grupo de 10 investigadores para desarrollar el proyecto “Aprovechamiento de un corpus oral en la enseñanza del español” . Este proyecto derivado, estuvo apoyado por el programa de mejoramiento del profesorado de la Secretaría de Educación (2008-2010) y actualmente tiene como resultados ponencias, artículos y un libro en prensa. Como se observa, son numerosos los resultados que se han producido a través de los 23 años en que se ha desarrollado esta investigación y se requiere de la actualización permanente, así como la incorporación de la nueva producción académica que se incrementa continuamente al sitio electrónico en que se ofrece la información a los usuarios e interesados en el estudio del lenguaje. Para realizar este trabajo, las responsables han invitado, desde 2006 a alumnos del Colegio de Bibliotecología, dentro del programa de becas del Centro de Estudios Humanísticos (CEH), dirigido por el Dr. Alfonso Rangel, por considerar que son el recurso humano idóneo para ejecutar esta tarea. Por lo tanto dentro del trabajo desarrollado en el proyecto de El “Habla de Monterrey”, se ha podido proseguir con el trabajo que se ha realizado hasta el momento dentro de la colaboración llevada a cabo por la Lic. Yanel Martínez Dimas, con base en la propuesta de la estructura del contenido de una liga. “Publicaciones” dentro de la página electrónica de la Facultad de Filosofía y Letras, UANL (http://www.filosofia.uanl.mx/posgrado/investigaciones.html). Su trabajo consistió en compilar y organizar la información para incorporar en dicha liga un corpus con las publicaciones realizadas por los diferentes autores dentro del proyecto. Igualmente se creó una base de datos curriculares de los colaboradores, la cual se puso a disposición de los usuarios. Así mismo se propuso un sistema de indizado que no se alcanzó a realizar en la primera etapa. PROPÓSITO Por tales razones, este proyecto se propone la realización de este procedimiento con base en políticas de indización algunas de las cuales podrían ser: Automatización. Evaluación de servicios/usuarios. Evaluación del Sistema de Información Especializado en la temática. Capacitación del usuario. Criterios para indización de las publicaciones. Formación continua del indizador. Lenguaje/terminología. Manual de indización. Procedimientos para indización. Recursos humanos y financieros. Softwares/ Sistema de Información Especializado en la temática. Valorización profesional del indizador. Tomamos en cuenta las ventajas de la normalización con base a sistemas de calidad como son ISO 5963 / 1985, UNESCO, Harold Borko, entre otros, Los cuales nos indican que: El documentalista se encuentra una estructura ordenada presentándola por ello con una mayor eficacia, y facilitando la labor. Se facilita el almacenamiento de la información. Los productos finales de la indización del análisis del contenido son más precisos. Estos productos finales son los Índices. Ahorra tiempo y rapidez en cuanto a la elaboración de documentos secundarios. Se facilitan las tareas al usuario. Difusión internacional de la información. Como se indicó, las responsables trabajan en una segunda etapa del proyecto en el cual se efectuaron 108 nuevas entrevistas orales y sobre ellas ya se cuenta con trabajos de investigación en formas de ponencias, artículos, capítulos de libro y tesis, por tanto se requiere de compilar los trabajos, realizar los resúmenes, catalogarlos así como incorporarlos a la liga. Éste trabajo se desarrolla dentro de esta segunda fase de trabajo de los bibliotecólogos. JUSTIFICACIÓN La propuesta que se menciona es pertinente, ya que el proceso de indización colabora a: a) Que las búsquedas no sean generalizadas, sino más bien específicas y concretas; esto ayudaría a que los interesados no perdieran demasiado tiempo en localizar los términos que se requieren en específico, para sus investigaciones o consultas. b) Con lo que se define según Lancaster como “la preparación de una representación del contenido temático de los documentos en donde el indizador describe el contenido al emplear uno o varios términos seleccionando algún vocabulario controlado. Con el objetivo de indicar de qué trata el documento sintetizar su contenido y representarlo con un grupo de términos en donde estos sirven como punto de acceso mediante los cuales un ítem bibliográfico puede ser localizado o recuperado en un índice o en una base de datos”. (Lancaster, 1996 : 5) c) Una vez definida la indización se llevará a cabo el proceso de indización el cual consiste en “extraer los conceptos representativos del contenido de un documento con la ayuda de un lenguaje documental o lenguaje controlado. Se pueden emplear materias, palabras claves o descriptores (término normalizado o controlado que expresa el contenido significativo del documento). No se limita sólo a detectar los vocablos presentes en el documento, sino también su traducción para pasar del lenguaje natural al lenguaje documental. El indizador, cuando ya tiene el documento original o su expresión condensada, retiene unas cuantas nociones que representan su contenido con la máxima fidelidad”. (Pinto) d) Para el proceso, se requiere una búsqueda de tesauros que según la UNESCO, tesauro es un “vocabulario estructurado y comprensible de términos interrelacionados, algunos de los cuales se utilizan para indizar y recuperar uno o más dominios de la ciencia y tecnología”. O como nos dice, Carlos César Correia Gonçalves, se buscan los tesauros con el objetivo de “normalizar la terminología, determinando que solamente un único vocablo es aceptable, y no el de ofrecer un mundo de alternativas, con las consecuentes dudas respecto al término a emplear, reflejando con exactitud la información sólida de un documento”. (Correia, 2001). Con dicho procedimiento se pretende encontrar las temáticas específicas de cada publicación. Así mismo, buscar tecnologías especializadas para el presente como: base de datos, elaborador de resúmenes automatizado y, principalmente, el personal adecuado. e) Mediante este proceso, las investigaciones tendrían formalidad (al momento en que el interesado acceda a la página) y podrían expandirse no solamente a nivel local sino a un público más general. DELIMITACIÓN La indización abarcará todo el corpus de investigación a fin de que los términos en ella puedan ser encontrados de manera específica, dentro de la liga que corresponde a “Publicaciones” en la página del Habla de Monterrey, el trabajo incluirá las publicaciones producidas durante un periodo que va de 2010 a 2011. OBJETIVOS Las metas a cumplir en este proceso son: a) Analizar lo avances realizados hasta la fecha en la página del proyecto. b) Delinear los métodos más eficientes para la indización de las publicaciones del proyecto. c) Actualizar la página de El Habla de Monterrey. HIPÓTESIS a) Revisión de las investigaciones publicadas, la realización de resúmenes y palabras claves proporcionadas por el autor y a su vez, analizarlos para la búsqueda de los términos específicos a ubicar en el tesauros. b) La ubicación de la página de El Habla de Monterrey en la página principal de la Universidad Autónoma de Nuevo León. c) Como principal objetivo, la diseminación de las publicaciones dentro de la página del Habla de Monterrey. METODOLOGÍA Solicitar autorización expresa de los autores para revisar el material disponible en la investigación. Una labor de la compilación, edición y preparación de la información de las publicaciones que sean analizadas y extraídas posteriormente sus resúmenes para luego irlas incorporando en la página de acuerdo a estándares que se establecerán previamente al momento de subir la información a la página El habla de Monterrey. La búsqueda de las herramientas necesarias para la indización. (Tecnologías especializadas) Realizar los resúmenes o abstract de acuerdo al formato requerido en el proceso de indización. Analizar las reseñas y definir los términos de búsqueda. La uniformidad de las reseñas y/o resúmenes que no cuenten con los lineamientos que se especificará para que todos lleven el mismo formato estándar con el propósito de una correcta identificación. Hacer una labor de recopilación de los currículos de los profesores participantes para que estos sean identificados fácilmente por las personas visitantes a esta página y que necesiten información detallada de los profesores involucrados en esta. La elaboración de un directorio de correos electrónicos los cuales servirán para una fácil localización y por ende, favorecer un contacto más personal entre las personas interesadas hacia una publicación en particular. AVANCES DEL PROYECTO Al momento la página electrónica de la Facultad de Filosofía y Letras, UANL (http://www.filosofia.uanl.mx/posgrado/investigaciones.html). Cuenta con 85 publicaciones…. Se acordó que una opción viable y práctica es la de utilizar búsquedas simples, locales para la recuperación de información relacionada con diversos aspectos de búsqueda; Se contempla la realización de índices de acuerdo con estos rubros: Índice de autores Índice de publicaciones Índice de áreas Índice de palabra clave También se concretó el esbozo de un formato curricular, que se refleja en el Concentrado curricular; igualmente la recuperación y concentrado del Directorio de investigadores el que se les enviaría por correo electrónico en el cual se les invita a participar en el Proyecto de investigación "El habla de Monterrey", actualización de la liga Publicaciones enviándonos sus colaboraciones y/o investigaciones relacionados a este proyecto. Así mismo se llegó al consenso de digitalizar la introducción de las publicaciones en formato PDF y en su defecto, si éstos lo requieren, transcribir los formatos que se encuentren en condiciones no legibles y aptas para esta página y convertirlo nuevamente en formato PDF para que reúna las características de calidad para que pueda integrarse a los recursos que conforman las publicaciones de esta página. Aunado a esto y para que todas las publicaciones que se reciban vayan teniendo uniformidad en su formato, irles asignando las palabras claves que identifiquen la temática de la investigación o colaboración del investigador en dado caso de que estos no se hayan designado previamente por el investigador colaborador de este proyecto. PERSPECTIVAS El trabajo que aquí se expone permitirá difundir eficientemente los resultados de un macroproyecto de investigación que ha sido avalado por las instituciones científicas más importantes del país. Al culminarse el trabajo de indexado, se ofrecerán posibilidades de acceso a estudiantes, investigadores y estudiosos del área e igualmente, un trabajo realizado con eficacia, ofrecerá una proyección positiva. A) Del colegio de bibliotecología, en cuanto dará testimonio del perfil de los estudiantes formados en esta licenciatura; B) Del Centro De Estudios Humanísticos de la UANL, porque los recursos destinados a sus becarios tendrán impacto positivo en la divulgación del conocimiento; C) De la Facultad De Filosofía Y Letras y de la Universidad Autónoma de Nuevo León, ya que se ofrecerá evidencia del cumplimiento del objetivo de la difusión y aplicación del conocimiento, que forma parte de la misión académica de estas instituciones. BIBLIOGRAFIA Correia Gonçalves, Carlos César. (2001). La función documentación/biblioteca: una perspectiva en Portugal. Portugal: Documentación de las Ciencias de la Información, 24, 323-341. Consultado 20 de Marzo de 2010, de http://revistas.ucm.es/inf/02104210/articulos/DCIN0101110323A.PDF Curras, E. (1998). Tesauros : manual de construcción y uso. Madrid : Kaher. Lancaster, F. W. (1996). Indización y resúmenes: teoría y práctica. Buenos Aires: EB publicaciones. Naumis Pena, C. (2007). Los tesauros documentales y su aplicación en la información impresa, digital y multimedia. México : UNAM, CUIB : Library Outsourcing Service. Buenos Aires : Alfagrama Pinto Molina, María. Análisis y síntesis. Portal Alfintra. Consultado 7 de diciembre de 2009, de http://www.mariapinto.es/alfintra/contenido/ANALISIS_SINTESIS.pdf Rodríguez Alfano, L., coordinadora. (2005). Investigación sociolingüística "el habla de monterrey: su trayectoria en una página electrónica. México: Trillas: U.A.N.L. Roggau, Z. (2001). Tesauro de lengua y literatura. Rosario, Santa Fe, Argentina: Nuevo Paradigma Ediciones. Slype, Georges Van. (1991). Los lenguajes de indización: concepción, construcción y utilización en los sistemas documentales. Madrid: Fundación Germán Sánchez Ruipérez, Urdiciain, Blanca Gil. Niveles de análisis documental de contenido. EUBD Complutense. Vergara Huancas, Roberto. (1999-2002). Propuestas para optimizar la organización, procedimientos y resultados de la indización. San Marcos: Universidad Nacional Mayor de San Marcos. (2005).BIREME - Centro Latino-Americano y del Caribe de Información en Ciencias de la Salud. Manual de Indización de Documentos para la base de datos LILACS. Sao Paulo: Organización Panamericana de la Salud · Organización Mundial de la Salud.