Búsquedas en las bases de datos. Palabras clave y tesauro. Antonio Cano Vindel Cuando vamos a hacer una búsqueda sobre la evidencia científica que existe en una determinada base de datos a favor de un tema que estamos revisando, debemos tener en cuenta que existe una gran diferencia entre hacer una búsqueda simple de los términos que se nos ha ocurrido que son importantes, y hacer una búsqueda sistemática, siguiendo un proceso que nos llevará a usar el tesauro de la base de datos, una elección más adecuada de los términos clave, y poner como condición que dichos términos se encuentren el campo “palabras clave”, utilizando el sistema de búsqueda avanzada. 1. Al buscar en cualquier base de datos es imprescindible utilizar el tesaurus propio de esa base de datos. Es decir, el diccionario de términos clave que se han usado para guardar los trabajos que ahora quieres buscar. Si tú le dices al buscador (la base de datos) que utilice términos que no conoce, aunque sean sinónimos, no te podrá ofrecer artículos que te interesan, pero sí están en la base de datos. Un problema de sensibilidad de tu búsqueda, porque no has detectado trabajos que pueden ser esenciales para tu revisión. Cualquier revisor especialista podría echar en falta estos trabajos esenciales al revisar tu artículo, en el proceso de publicación. A su vez, si tú utilizas un lenguaje diferente al del buscador, te ofrecerá cosas que tú en realidad no querías. Son los falsos positivos, o el problema de la especificidad de tu búsqueda. 2. La base de datos Pubmed tiene un excelente tesaurus, que se ha ido tejiendo con mucho esfuerzo durante mucho tiempo (más de 50 años), y que se llama Mesh (http://www.ncbi.nlm.nih.gov/mesh). Pubmed ha ido asignando palabras o términos clave a cada artículo almacenado, en el campo "key word" o campo "Mesh". Al mismo tiempo, ha ido creando y puliendo una base de datos de términos clave utilizados en este proceso de indización. Es la base de datos Mesh. Otras bases de datos, como PsycInfo, tienen también su propio tesauro. 3. En los materiales de mi curso de doctorado (http://www.ucm.es/info/seas/invest/formac/index.htm) se encuentra el enlace al tutorial de Pubmed en español (http://www.sap.org.ar/staticfiles/medline/tutorial/), en el que se explica de manera interactiva la búsqueda avanzada en Pubmed utilizando los términos Mesh. En el Glosario te explica qué significa MeSH, Medical Subject Heading. Es un vocabulario controlado utilizado para asegurar que la indización tenga consistencia a la hora de asignar los términos a los artículos o citas sobre un tema específico. Ayudan en la búsqueda al evitar tener que pensar todas las palabras que pueden identificar un concepto. Por ejemplo el término MeSH “AGED” es asignado en lugar de aging, older, elderly, senior citizen, geriatric person, etc. que pueden aparecer en el título o resumen. 4. Por lo tanto, antes de hacer una búsqueda, debemos usar la base de datos del tesauro, es decir la base de datos de términos Mesh si utilizamos Pubmed (o el Tesauro de PsycInfo), para conocer cuáles son las palabras clave que debo usar en mi búsqueda. 5. Si quiero hacer una revisión en Pubmed sobre “bienestar psicológico en el trabajo” y busco "wellness" en la búsqueda sencilla, me saldrán muchos artículos que han utilizado la palabra wellness en algún campo (título, abstract, etc.), pero que no han investigado el bienestar psicológico. Mi búsqueda tendrá un problema de baja especificidad. A su vez me perderé muchos trabajos que sí han investigado el bienestar psicológico, pero que han sido almacenados con "job satisfaction", por ejemplo. Mi búsqueda tendrá también un problema de baja sensibilidad. ¿Y cómo puedo saber que es más adecuado usar "job satisfaction" que "wellness"? Es facil. Buscando primero en la base de datos Mesh (tesauro de Pubmed). Primero debo buscar una serie de sinónimos en la base de datos Mesh, como wellness, well being, satisfaction. Lo mismo debo hacer con job, workplace, etc. 6. Cuando uso un término Mesh (es decir, que sí está en la base de datos Mesh), estoy utilizando el mismo lenguaje que el sistema buscador de la base de datos Pubmed. En este caso será más fácil entendernos, porque utilizamos los mismos términos. Mesh me ofrece la definición de cada término, el año de inclusión del término en la base de datos Mesh, el árbol lógico en el que se incluye, así como distintas opciones para seleccionar este término, subtérminos, etc. Por ejemplo, el árbol lógico de “job satisfaction” es: Psychological Phenomena and Processes [F02] Psychology, Applied [F02.784] Psychology, Industrial [F02.784.692] Absenteeism [F02.784.692.107] Efficiency [F02.784.692.351] Job Satisfaction [F02.784.692.425] Task Performance and Analysis [F02.784.692.746] + Time Management [F02.784.692.816] Vocational Guidance [F02.784.692.887] Además, me informa que este término se indizaba previamente (entre 1972 y 1975) como “personal satisfaction”. 7. No sólo debo buscar los términos clave (Mesh), sino también los términos secundarios que hay dentro de cada término clave. Por ejemplo, muchos términos clave de la base de datos Mesh incluyen a su vez acepciones, o categorías, que pueden ser de tipo médico o psicológico. Yo debo seleccionar las que realmente estoy buscando. De lo contrario obtendré muchos artículos que no me interesan y que probablemente no pueda abarcar (con lo cuál, puede que utilice de nuevo más criterios de exclusión, para reducir el tamaño del resultado hasta hacerlo manejable, que no sean adecuados). 8. Además, no es lo mismo usar un término en el campo "palabra clave", "key word", o "Mesh", que usar ese mismo término en cualquier campo (título, abstract, etc.). Aunque yo utilice un término Mesh, si lo utilizo en cualquier campo, me saldran artículos que incluyen ese término en el abstract, por ejemplo, pero que en realidad no han investigado ese término. Utilizando la sintaxis de Pubmed, no es lo mismo buscar "job satisfaction"[Mesh] que "job satisfaction". En el primer caso, estoy pidiendo artículos que sí han trabajado la satisfacción laboral y han sido clasificados en Pubmed con ese término clave; mientras que en el segundo caso, estoy pidiendo cualquier artículo que contenga "job satisfaction", aunque no trate sobre ese tema. 9. Entonces, ¿debo aprender la sintaxis de búsqueda de Pubmed y saber que debo escribir exactamente "job satisfaction"[Mesh], en la búsqueda simple de la página principal de Pubmed, en lugar de buscar "job satisfaction"? Puede ser útil, pero no es imprescindible, ya que las bases de datos como Pubmed ofrecen la posibilidad de hacer búsquedas avanzadas eligiendo fácilmente, por ejemplo, el campo en el que debe buscar el término (key word, Mesh) que escribamos (job satisfaction), sin tener que escribir la sintaxis correspondiente. En este caso, bastará con hacer esta misma búsqueda como "búsqueda avanzada" y no como "búsqueda simple". Los resultados serán muy diferentes y yo no tendré que aprender a utilizar la sintaxis de la base de datos. 10. Uso simple de la base de datos Mesh. Puedo buscar en Google "pubmed" y me aparecerá la dirección de la base de datos Pubmed, así como la dirección de la base de datos Mesh (http://www.ncbi.nlm.nih.gov/mesh), aunque también puedo acceder Pubmed y luego pinchar en "Mesh Database". En la búsqueda simple de Mesh (similar a la de Pubmed) puedo buscar un término clave como, por ejemplo, "stress". Me aparecerán 459 términos clave que usan esta palabra. Selecciono "Stress, psychological". Entro en este término, pues me permite seleccionar muchos términos secundarios, algunos de los cuales no me interesan ("blood", "cerebro spinal fluid", etc.), mientras que otros sí ("psychology", por ejemplo). Si marco éste y pulso un botón que dice "Add to search builder" con "AND", me añadirá la sintaxis "Stress, Psychological/psychology"[Mesh] a la caja de búsqueda de Pubmed, a la que podré seguir añadiendo términos de búsqueda, eligiendo los operadores "AND", "OR", "NOT". Por ejemplo: ("Stress, Psychological/psychology"[Mesh]) AND ( "Stress, Psychological/etiology"[Mesh]). Cuando haya añadido todos los términos que quiero buscar, enlazados por estos operadores, pulsaré el botón "Search Pubmed". Me dará el resultado de la búsqueda que deseaba. 11. Estrategias de búsqueda de términos clave. Un buena estrategia a la hora de seleccionar los términos clave idóneos para mi revisión es echar un vistazo a los artículos que me acaba de proporcionar Pubmed y ver qué titulos se aproximan más a lo que yo estoy buscando realmente. Entro en el que más se aproxima y veo cuales son las palabras clave (Mesh) que tiene asignadas este artículo. Esto me puede ayudar a incluir nuevos términos o modificar los que ya tenía. Además, cuando entro en el resumen de un artículo que está muy centrado en lo que busco, no sólo puedo ver sus palabras clave, sino que Pubmed tiene un algoritmo que le permite ofrecerme una selección de artículos muy próximos, por semejanza en sus palabras clave, al que estoy accediendo. Puedo echar un vistazo a los títulos de este listado de artículos similares. Si encuentro alguno que me interesa, puedo observar sus palabras clave o el listado de artículos relacionados, etc. 12. Uso avanzado de la base de datos Mesh. Para hacer más accesibles las distintas características u opciones que ofrece Mesh, puedo utilizar la página Mesh Browser (http://www.nlm.nih.gov/mesh/MBrowser.html). En esta herramienta veo que puedo buscar una(s) palabra(s) que sea(n) un término principal, o secundario, o ambos. Además, puedo interrelacionar sinónimos que se usan en Mesh. Así, puedo utilizar una palabra exacta, pero también puedo buscar términos que incluyen esta palabra, o una parte de ella. Si busco "satisfaction", como término principal (main headings), o bien secundario (supplementary Concepts), mediante la opción “ambos” (all the above), y con todos los fragmentos incluidos en otros términos (“find terms with all fragments”, otros términos que incluyan "satisfaction"), me aparecerán varias salidas, que incluyen “satisfaction”, como "job satisfaction" y "personal satisfaction". Puedo utilizar un OR entre ambas, si creo que puedo encontrar artículos interesantes con ambos términos ("Job Satisfaction"[Mesh] OR "Personal Satisfaction"[Mesh]). También puedo buscar “job*” y las opciones anteriores, lo que me dará entre otros resultados el término “job satisfaction”, o el término “workplace”. 13. ¿Puedo incluir una palabra que NO es término Mesh en mi búsqueda? Por ejemplo, ¿puedo incluir "Well being" en el título ("well being[Title])? No es una práctica muy recomendable. Porque las palabras que los millones de autores usan para titular su trabajo no son modificadas por el equipo de Mesh y puede haber muchos problemas de sinonimia, que no han sido trabajados por la base de datos. Por lo tanto, "well being" en el título nos puede llevar a perder sensibilidad y especificidad (a una peor revisión). Así, es probable que haya pocos trabajos que incluyan “well being” en el título, pero que me interesarían para mi revisión. 14. Ejemplo. Si yo hago una búsqueda simple en Pubmed con los términos psychological wellness and work (porque me parecen inicialmente como los más adecuados), obtengo más de once mil trabajos, que no puedo revisar uno por uno. Pero es muy probable que haya en este resultado muchos artículos que no investigan el bienestar psicológico en el trabajo (falsos positivos, problema de especificidad). Además, es probable que la búsqueda tenga una baja sensibilidad y se me hayan escapado muchos artículos importantes para mi revisión (por ejemplo, los que no hayan utilizado en ningún campo la expresión “pyschological wellnes”, pero sí hayan estudiado mi tema). Si yo busco “job satisfaction”[Mesh] me salen en principio todavía más, unos dieciséis mil artículos, pero estos sí que han investigado el tema que estoy revisando (alta especificidad) y no se me han escapado los imprescindibles (buena sensibilidad). Ahora tendré que seguir buscando más términos Mesh (principales y secundarios) que sean adecuados para mi revisión. Por ejemplo, si yo quiero centrar mi búsqueda en el bienestar psicológico de los trabajadores sanitarios de cuidados paliativos, buscaré “palliative” en Mesh, exploraré las distintas opciones mencionadas más arriba y finalmente puedo optar por (“palliative care team”[Mesh] OR “palliative care/Manpower”[Mesh]). Pero al cruzar estos términos con “job satisfaction”[Mesh], unidos por un AND no obtengo resultados. Por lo tanto, tengo que ser menos restrictivo y pruebo con la siguiente sintaxis: ("Job Satisfaction"[Mesh]) AND (“palliative care”[Mesh]). Obtengo 46 artículos muy específicos sobre el tema que busco. Si creo que he podido perder trabajos de investigación al ir seleccionando estos términos (por ejemplo, algunas investigaciones estudian el estrés laboral, en lugar de estudiar la satisfacción laboral, puedo hacer una nueva búsqueda. Así, podría comenzar por revisar ("Stress, Psychological/prevention and control"[Mesh] OR "Stress, Psychological/psychology"[Mesh]), que cruzaría con (“palliative care”[Mesh]). Obtengo 179 artículos, que quizás puedo revisar manualmente, aunque sería mejor cruzar este resultado con la anterior búsqueda ((“Job satisfaction”[Mesh] OR "Stress, Psychological/prevention and control"[Mesh] OR "Stress, Psychological/psychology"[Mesh]) AND (“palliative care”[Mesh])), pues obtengo 212 (menor que 46+179=235), eliminando los repetidos en ambas. 15. El resultado final de la búsqueda debería recogerlo en un programa de gestión de referencias bibliográficas, como EndNote, My EndNoteWeb, RefWorks, etc., porque me permitiría (1) insertar las citas en Word mientras escribo (sin tener que teclear información, riesgo de cometer errores, o perder productividad, al repetir un trabajo que ya está hecho), en un determinado estilo que elijo para una revista y que puedo modificar en cualquier momento, sin volver a teclear o corregir la información; (2) no tener que preocuparme de las normas de estilo APA, o cualquier otras, sino que por el contrario, el programa de referencias gestiona el estilo correspondiente, ordena la bibliografía de acuerdo con las normas del estilo seleccionado, por ejemplo, alfabéticamente en el estilo APA; (3) tener accesibles no sólo los datos que hay que incluir en una referencia bibliográfica (autores, año, título, etc.), sino también el resumen, las palabras clave, etc.; (4) poder hacer búsquedas electrónicas en el resultado final, sin tener que acceder de nuevo a la base de datos online; (5) hacer rápidamente listados de referencias bibliográficas en formato APA, ordenados alfabéticamente, o cambiar inmediatamente a otro estilo; etc. 16. EndNote permite hacer búsquedas directas (sin importación) en la base de datos Pubmed. My EndNoteWeb permite hacer búsquedas directas en Pubmed y la Web of Sicences. El programa RefWorks permite hacer importaciones directas desde PsycInfo. Y todos los programas de gestión bibliográfica permiten la importación de ficheros de búsqueda que se han obtenido en cualquier base de datos.