MEDICAL SUBJECT HEADINGS (Mesh) Fabiola Gabriela Navarro López Resumen La indización de documentos es una técnica del análisis documental que trata de retener una o varias nociones que representan el contenido de un documento y adecuarlas a un lenguaje documental determinado, con el objetivo primordial de organizar y recuperar la información. El lenguaje utilizado es conocido como Thesahurus o lenguaje controlado, este trabajo pretende analizar un thesahurus especializado en el área de medicina y ciencias de la salud, conocido como Medical Subject Headings (Mesh) realizado por la National Lybrary Medicine desde 1960 y que representa un ejemplo exitoso de un vocabulario controlado. El trabajo aquí realizado se enfocara a revisar la estructura del Mesh para recuperar información indizada en la base de datos medica de MED LINE. Thesahurus La primera parte que se necesita comprender para el análisis de Mesh es la definición de un thesahurus que es: una lista de palabras o descriptores, que proporcionan la indización, forman lo que se denomina un vocabulario controlado en el que hemos depurado el lenguaje natural seleccionando los términos pertinentes,1. La descripción de las relaciones semánticas que trata el tesauro son: Relaciones de sustitución, que reenvían de un sinónimo el término aceptado por el lenguaje documental, su incorporación tiende a eliminar la sinonimia y polisemia. Fernández, Caballero Antonio. Teoría de la información y la documentación. España 1998 1 Relaciones hieráticas o jerárquicas, que conducen de los términos aceptados más específicos a los términos más generales, también aceptados y viceversa. Relaciones asociativas entre nociones emparentadas patentiza las relaciones de subordinación colateral, similaridad funcional causa-efecto. Relaciones sintagmáticas, que tratan del lugar que una palabra ocupa en un texto determinado. El Mesh El thesahuro con terminología médica más utilizado para la indización de documentos médicos es El Medical Subject Headings (MeSH) es producido por la National Library Medicine de EU (NLM) desde 1960 hasta hoy. La edición hasta el año 2007 era de forma impresa actualmente se presenta de forma electrónica. La versión del 2008 contenía un total de 24,767 descriptores los cuales son acompañados de una breve descripción y una lista de sinónimos o términos muy similares. La revisión anual de términos hace que cada año se incorporen términos nuevos y otros se modifiquen de acuerdo a las necesidades del propio lenguaje medico. La siguiente tabla muestra la revisión anual que se ha hecho al vocabulario: MeSH Total New Changed Deleted descriptors descriptors descriptors descriptors 2002 20,232 847 185 47 2003 21,079 1250 93 20 2004 22,329 666 109 20 2005 22,995 487 129 60 2006 23,885 933 188 43 2007 24,357 494 99 22 La misión que cumplen estos descriptores es la de representar los conceptos principales tratados en los artículos publicados y facilitar su recuperación. La idea es que cada concepto esté representado por un único término, y que cada término represente un único concepto con la finalidad de resolver los problemas de sinonimia, polisemia y ambigüedad que comporta el lenguaje natural. Estructura del Mesh El MeSH se divide en dos partes: la primera es la lista alfabética de descriptores aceptados con las referencias cruzadas de sinónimos y términos relacionados que nos indica cuál es la palabra clave a utilizar; así, por ejemplo, si buscamos la palabra cáncer, la lista nos remite a la palabra neoplasms que es el descriptor adecuado. Debajo de cada entrada podemos encontrar una pequeña nota histórica sobre el año de introducción del descriptor en el tesauro y otros descriptores utilizados para este concepto. La mayoría de los artículos indizados en la base de datos MEDLINE llevan asignados de 10 a 12 descriptores; los que están señalados con un asterisco, los Major Concept, indican el tema principal del artículo, y los restantes hacen referencia a aspectos tratados o discutidos en el mismo. Esta opción nos permite limitar nuestra búsqueda a los artículos identificados como más importantes y prescindir de las otras citas irrelevantes. La segunda parte del MeSH es la clasificación jerárquica llamada "Tree Structures” que agrupa a todos los descriptores de la lista alfabética en 15 grandes categorías temáticas. Estas categorías se subdividen al mismo tiempo en subcategorías, en donde los descriptores se hallan ordenados jerárquicamente del más general al más específico. Los descriptores llevan asociados unos códigos alfanuméricos que permiten también seleccionar la información mediante dichos códigos. La aplicación práctica más interesante de la clasificación jerárquica consiste en que permite recuperar citas bibliográficas muy específicas sobre un tema, al mismo tiempo que existe la posibilidad de ir ampliando el concepto introduciendo los descriptores de categorías más generales que incluyen los términos subordinados. Por poner un ejemplo, podríamos seleccionar sólo aquellos artículos que hicieran referencia a la Meningitis viral o bien ampliar el conjunto utilizando el descriptor más general de Meningitis que incluye a todos los restantes. Será en función del tema que nos interese buscar y de los distintos aspectos que queramos combinar que utilizaremos los descriptores que nos amplíen o bien limiten el conjunto de registros bibliográficos. Existe además el apartado de los subencabezamientos, o "MeSH Subheadings", que consta de 88 divisiones o facetas temáticas que lógica y debidamente relacionados con los descriptores del tesauro permite seleccionar distintos aspectos (etiología, diagnóstico, tratamiento, cirugía) de enfermedades o patologías tratadas en la literatura médica. En la parte introductoria de MeSH donde se relaciona la lista de los "Subheadings" hay una pequeña explicación que indica la utilización adecuada de cada uno de ellos y señala las categorías temáticas a las que pueden ir asociados. Si buscamos información sobre la prevención y control del cáncer de mama, la combinación del descriptor BREAST NEOPLASMS y el "subheading" Prevention and control (PC) sería la forma más correcta de obtener esta información, mientras que si cruzamos estos dos términos de forma independiente, obtenemos también esta información, pero con un mayor número de referencias bibliográficas añadidas, en las cuales aparecen estos términos pero en un contexto distinto al que nos interesa. La combinación de un descriptor y un subencabezamiento es a menudo la manera más precisa de concretar un tema.