2 Av. Carrilet, 3, 9.a planta, Edificio D - Ciutat de la Justícia 08902 L’Hospitalet de Llobregat Barcelona (España) Tel.: 93 344 47 18 Fax: 93 344 47 16 Correo electrónico: consultas@wolterskluwer.com Revisión científica Mtra. Rosa A. Zárate Grajales Coordinadora de Investigación ENEO/UNAM Responsable del Centro Colaborador OPS/OMS Traducción Médico cirujano Martha Elena Araiza Martínez Universidad Nacional Autónoma de México Dirección editorial: Carlos Mendoza Editora de desarrollo: Cristina Segura Flores Gerente de mercadotecnia: Juan Carlos García Cuidado de la edición: Gloria Morales Veyra Maquetación: Carácter Tipográfico/Eric Aguirre Gómez • Aarón León • Ernesto Aguirre Diseño de portada: : Jesús Mendoza M. Impresión: R.R. Donnelley Shenzen / Impreso en China Se han adoptado las medidas oportunas para confirmar la exactitud de la información presentada y describir la práctica más aceptada. No obstante, los autores, los redactores y el editor no son responsables de los errores u omisiones del texto ni de las consecuencias que se deriven de la aplicación de la información que incluye, y no dan ninguna garantía, explícita o implícita, sobre la actualidad, integridad o exactitud del contenido de la publicación. Esta publicación contiene información general relacionada con tratamientos y asistencia médica que no debería utilizarse en pacientes individuales sin antes contar con el consejo de un profesional médico, ya que los tratamientos clínicos que se describen no pueden considerarse recomendaciones absolutas y universales. El editor ha hecho todo lo posible para confirmar y respetar la procedencia del material que se reproduce en este libro y su copyright. En caso de error u omisión, se enmendará en cuanto sea posible. Algunos fármacos y productos sanitarios que se presentan en esta publicación solo tienen la aprobación de la Food and Drug Administration (FDA) para uso limitado al ámbito experimental. Compete al profesional sanitario averiguar la situación de cada 3 fármaco o producto sanitario que pretenda utilizar en su práctica clínica, por lo que aconsejamos consultar con las autoridades sanitarias competentes. Derecho a la propiedad intelectual (C. P. Art. 270) Se considera delito reproducir, plagiar, distribuir o comunicar públicamente, en todo o en parte, con ánimo de lucro y en perjuicio de terceros, una obra literaria, artística o científica, o su transformación, interpretación o ejecución artística fijada en cualquier tipo de soporte o comunicada a través de cualquier medio, sin la autorización de los titulares de los correspondientes derechos de propiedad intelectual o de sus cesionarios. Reservados todos los derechos. Copyright de la edición en español © 2018 Wolters Kluwer ISBN de la edición en español: 978-84-17033-27-9 Depósito legal: M-24924-2017 Edición en español de la obra original en lengua inglesa Essentials of Nursing Research. Appraising Evidence for Nursing Practice, 9th ed., de Denise F. Polit y Cheryl Tatano Beck, publicada por Wolters Kluwer Copyright © 2018 Wolters Kluwer ISBN de la edición original: 978-1-4963-5129-6 Two Commerce Square 2001 Market Street Philadelphia, PA 19103 4 A Nuestras familias: nuestros esposos, nuestros hijos (y sus cónyuges/prometidos) y nuestros nietos Esposos: Alan y Chuck Hijos: Alex (Maryanna), Alaine (Jeff), Lauren (Vadim), Norah (Chris), Curt y Lisa Nietos: Maren, Julia, Cormac, Ronan y Cullen 5 Denise F. Polit, PhD, FAAN, es una investigadora estadounidense de atención de la salud reconocida internacionalmente como autoridad en métodos de investigación, estadística y medición. Recibió su licenciatura del Wellesley College y su doctorado del Boston College. Es la presidenta de una compañía consultora en investigación, Humanalysis, Inc., en Saratoga Springs, Nueva York, y profesora en Griffith University, Brisbane, Australia. Ha publicado en numerosas revistas especializadas y escrito varios libros premiados. En fecha reciente escribió una innovadora obra sobre la medición en la salud, Measurement and the Measurement of Change: A Primer for the Health Professions. Sus libros sobre métodos de investigación con la doctora Cheryl Beck están traducidos al francés, español, portugués, alemán, chino y japonés. Ha sido invitada a pronunciar conferencias y presentaciones en muchos países, incluidos Australia, India, Irlanda, Dinamarca, Noruega, Sudáfrica, Turquía, Suecia y Filipinas. Denise ha vivido en Saratoga Springs durante 29 años y se mantiene activa en su comunidad. Ha ayudado a varias organizaciones no lucrativas en el diseño de encuestas y el análisis de datos de sondeos. Hoy en día forma parte del consejo de directores de la YMCA, la Opera Saratoga y la Saratoga Foundation. 6 Cheryl Tatano Beck, DNSc, CNM, FAAN, es una profesora distinguida en la University of Connecticut, School of Nursing, con un nombramiento conjunto en el Department of Obstetrics and Gyneology en la School of Medicine. Recibió su maestría en enfermería materno-neonatal de Yale University y su doctorado en ciencia de la enfermería de la Boston University. Ha recibido numerosos premios, como el Association of Women’s Health, Obstetric and Neonatal Nursing’s Distinguished Professional Service Award, el Eastern Nursing Research Society’s Distinguished Researcher Award y el Distinguished Alumna Award de la Yale University School of Nursing, así como el Diamond Jubilee Award de la Connecticut Nurses’ Association por su contribución a la investigación en enfermería. Durante los últimos 30 años, Cheryl ha enfocado sus esfuerzos de investigación en el desarrollo de un programa de investigación sobre el estado de ánimo y los trastornos por ansiedad en el puerperio. Con base en los hallazgos de su serie de estudios cualitativos, Cheryl creó la Postpartum Depression Screening Scale (PDSS), publicada por Western Psychological Services. Es una escritora prolífica que ha publicado más de 150 artículos de investigación en revistas especializadas. Además de ser coautora en libros premiados sobre métodos de investigación con Denise Polit, escribió junto con la doctora Jeanne Driscoll Postpartum Mood and Anxiety Disorders: A Clinician’s Guide, que recibió el American Journal of Nursing Book of the Year Award en 2006. Además, Cheryl ha publicado otros dos libros: Traumatic Childbirth y Routledge International Handbook of Qualitative Nursing Research. Su obra más reciente es Developing a Program of Research in Nursing. 7 Investigación en enfermería, novena edición, ayuda a los estudiantes a aprender cómo leer y analizar los reportes de investigación y a desarrollar el aprecio por la investigación como una vía para mejorar la práctica de la enfermería. Disfrutamos actualizar este libro con innovaciones importantes en los métodos de investigación y con el uso de los métodos nuevos entre los investigadores en enfermería. La retroalimentación de nuestros lectores leales inspiró varios cambios importantes en el contenido y la organización. Estamos convencidas de que estas revisiones introducen mejoras importantes, al tiempo que conservan muchas características que han hecho de este libro un éxito en ventas en el mundo. La novena edición de esta obra, su guía de estudio y sus recursos en línea harán más fácil y satisfactoria la búsqueda de una vía profesional que incorpore la evaluación razonada de la evidencia para los profesionales de enfermería. LEGADO DE INVESTIGACIÓN EN ENFERMERÍA Esta edición, como las anteriores, se enfoca en el arte y la ciencia del análisis de la investigación. El libro ofrece una guía a los estudiantes que están aprendiendo a evaluar los reportes de investigación y a aplicar los hallazgos de la investigación en la práctica. Entre los principios básicos que ayudaron a conformar esta edición y las anteriores están los siguientes: 1. El supuesto de que la competencia para realizar y evaluar la investigación es crucial para la profesión de la enfermería. 2. La convicción de que la consulta de la investigación es intelectual y profesionalmente gratificante para el personal de enfermería. 3. La creencia inquebrantable de que el aprendizaje de los métodos de 8 investigación no debe ser intimidante ni aburrido. En concordancia con estos principios, intentamos presentar los fundamentos de la investigación de una manera que facilite la comprensión y estimule la curiosidad y el interés. ELEMENTOS NUEVOS EN ESTA EDICIÓN Nueva organización En la edición anterior, dividimos los capítulos según los diseños y métodos cuantitativos y cualitativos en dos partes separadas. En la presente, organizamos las partes de acuerdo con el contenido metodológico. Por ejemplo, en esta edición la Parte 3 cubre los diseños y métodos de investigación cuantitativos, cualitativos y mixtos, y la Parte 4 se dedica al análisis e interpretación de estudios cuantitativos y cualitativos. (Véase “El texto” en este prefacio para obtener más información.) Creemos que la nueva organización ofrece mayor continuidad de los conceptos metodológicos y facilitará la comprensión de las diferencias metodológicas clave entre la investigación cuantitativa y cualitativa. También confiamos en que cubrirá mejor las necesidades de estudiantes y profesores. Texto razonable para un curso semestral Simplificamos el texto para hacerlo más manejable con el fin de usarlo en un curso semestral. Redujimos la extensión mediante una organización diferente del contenido y conservando la información esencial en el texto, al tiempo que trasladamos los contenidos de antecedentes/avanzado a la página en línea, lo que convierte esta obra en un libro de 18 capítulos en lugar de los 19 que tenía la octava edición. Mayor accesibilidad Con la finalidad de que esta edición sea aún más fácil de usar que las anteriores, hicimos un esfuerzo conjunto para simplificar la presentación de temas complejos. Lo más importante, redujimos y simplificamos la cobertura de la información estadística. Eliminamos el capítulo sobre medición y optamos por presentar una sección más 9 corta y sencilla de este tema en el capítulo sobre recolección de datos cuantitativos, que se complementa con la información del capítulo de análisis estadístico. Además, en todo el libro se usó un lenguaje más directo y conciso. Contenido nuevo Además de actualizar el libro con nueva información de los métodos de investigación convencionales, agregamos contenido de los siguientes temas: Proyectos para mejora de calidad: se describe cómo se distinguen de los estudios de investigación y los proyectos con práctica basada en evidencia (PBE). Este nuevo contenido se encuentra en el capítulo 13. Relevancia clínica: un tema pocas veces mencionado, pero importante, que ha ganado prominencia entre los investigadores en otros campos de atención a la salud, pero solo hasta hace poco llamó la atención de los investigadores en enfermería. Este nuevo contenido se encuentra en el capítulo 15. EL TEXTO El contenido de esta edición es el siguiente: Parte 1. Generalidades de la investigación en enfermería y su papel en la práctica basada en evidencia. Introduce conceptos fundamentales de la investigación en enfermería. El capítulo 1 resume los antecedentes de la investigación en enfermería, analiza los sustentos filosóficos de la investigación cualitativa frente a la cuantitativa y describe los principales propósitos de la investigación en enfermería. El capítulo 2 ofrece una guía sobre el uso de la investigación para construir una práctica basada en evidencia. El capítulo 3 introduce a los lectores a los términos clave de la investigación y presenta una revisión de los pasos del proceso de investigación para estudios cuantitativos y cualitativos. El capítulo 4 se enfoca en artículos de investigación en revistas, explica qué son y cómo leerlos. El capítulo 5 examina la ética en los estudios de enfermería. Parte 2. Pasos preliminares en la investigación cuantitativa y 10 cualitativa. Establece las bases para aprender acerca del proceso de investigación mediante la consideración de los aspectos de la conceptualización de un estudio. El capítulo 6 se enfoca en el desarrollo de preguntas de investigación y la formulación de hipótesis de investigación. El capítulo 7 explica cómo recuperar evidencia de la investigación (sobre todo en bases de datos bibliográficas electrónicas) y el papel de las revisiones bibliográficas en la investigación. El capítulo 8 presenta información relacionada con marcos teóricos y conceptuales. Parte 3. Diseños y métodos para la investigación cuantitativa y cualitativa en enfermería. Presenta material sobre el diseño y la conducción de todos los tipos de estudios en enfermería. El capítulo 9 describe los principios fundamentales del diseño y analiza muchos aspectos específicos del diseño de investigación cuantitativa, incluidos los esfuerzos para aumentar su rigurosidad. El capítulo 10 introduce los temas de muestreo y recolección de datos en estudios cuantitativos. En este capítulo se incorporan los conceptos relacionados con la calidad de las mediciones: confiabilidad y validez. El capítulo 11 detalla las diversas tradiciones de la investigación cualitativa que han contribuido al crecimiento de la búsqueda constructivista y presenta los fundamentos del diseño cualitativo. El capítulo 12 expone los métodos de muestreo y recolección de datos usados en la investigación cualitativa, y describe cómo difieren de las estrategias empleadas en los estudios cuantitativos. El capítulo 13 hace énfasis en la investigación con métodos mixtos, pero también analiza otros tipos especiales de investigación, como las encuestas, la investigación de resultados y los proyectos para la mejora de calidad. Parte 4. Análisis e interpretación en la investigación cuantitativa y cualitativa. Presenta las herramientas para dar sentido a los datos de la investigación. El capítulo 14 revisa los métodos de análisis estadístico, asume la ausencia de instrucción previa en estadística y se enfoca sobre todo en ayudar a los lectores a comprender por qué la estadística es útil, qué prueba podría ser apropiada en una situación determinada y qué significa la información estadística en un artículo de investigación. El capítulo 15 estudia las estrategias para interpretar los resultados estadísticos, incluidas las interpretaciones relacionadas con la valoración de la relevancia clínica. El capítulo 16 describe el análisis cualitativo, con énfasis en 11 estudios etnográficos, fenomenológicos y con teoría fundamentada. El capítulo 17 trata sobre los criterios para evaluar la confianza y la integridad de los estudios cualitativos. Por último, el capítulo 18 estudia las revisiones sistemáticas e incluye cómo comprender y evaluar los metaanálisis y las metasíntesis. Al final del libro se ofrece a los estudiantes un apoyo adicional para el análisis. En los apéndices se presentan cuatro artículos de investigación completos: dos cuantitativos, uno cualitativo y uno con métodos mixtos que los estudiantes pueden leer, analizar y criticar. Los estudiantes pueden desarrollar sus comentarios sobre el modelo de crítica integral de dos de los estudios incluidos o comparar su trabajo con dichos análisis críticos. Un glosario al final del libro proporciona un apoyo adicional para quienes necesitan buscar el significado de un término metodológico. CARACTERÍSTICAS DEL TEXTO Conservamos muchas de las características que tuvieron éxito en las ediciones anteriores para ayudar a aquellos que aprenden a leer y aplicar evidencia de la investigación en enfermería: Estilo claro y accesible. Nuestro estilo de redacción es fácil de comprender y nada intimidante, y nos esforzamos aún más en esta edición para escribir con claridad y sencillez. Los conceptos se introducen con cuidado, las ideas difíciles se explican de manera concienzuda y se asume que los lectores no tienen un conocimiento previo de los términos técnicos. Lineamientos para el análisis. Cada capítulo incluye lineamientos para realizar una crítica a varios aspectos de un reporte de investigación. Las secciones sobre lineamientos proporcionan una lista de preguntas que conducen a los estudiantes a través de un estudio y llaman la atención a los aspectos del estudio susceptibles de evaluación por parte de los consumidores de investigación. Ejemplos de investigación y ejercicios de pensamiento crítico. Cada capítulo concluye con uno o dos ejemplos reales de investigación diseñados para resaltar los puntos cruciales descritos en el capítulo y para entrenar las habilidades de pensamiento crítico del lector. Además, se usan muchos ejemplos de investigación para ilustrar los puntos clave en el texto y para estimular el pensamiento de los estudiantes acerca de áreas con interrogantes por investigar. 12 Se eligieron muchos ejemplos internacionales para comunicar a los estudiantes que la investigación en enfermería tiene cada vez más relevancia en todo el mundo. Algunos de los ejercicios de pensamiento crítico se enfocan en los artículos completos del apéndice A (un estudio cuantitativo) y el apéndice B (un estudio cualitativo). Consejos para los estudiantes. El texto está lleno de guías prácticas y consejos (tips) acerca de cómo traducir las nociones abstractas de los métodos de investigación en aplicaciones más concretas. En estos tips, se puso atención especial para ayudar a los estudiantes a leer los reportes de investigación, que a menudo resultan atemorizantes para los que no tienen entrenamiento especializado en investigación. Gráficos. Los gráficos a color, en forma de tablas, figuras y ejemplos de apoyo, refuerzan el texto y ofrecen estímulos visuales. Objetivos del capítulo. Los objetivos de aprendizaje se identifican al inicio de cada capítulo para enfocar la atención del estudiante en el contenido primordial. Términos clave. La introducción de cada capítulo incluye una lista de términos nuevos, e hicimos listas más enfocadas y menos abrumadoras al incluir solo términos clave nuevos. En el texto, los términos nuevos se definen en el contexto (y se resaltan con negritas) cuando se usan por primera vez; los términos menos importantes se presentan en cursivas. Los términos clave también se definen en el glosario. Puntos de resumen con viñetas. Al final de cada capítulo se encuentra una lista concisa del resumen que se enfoca en el contenido sobresaliente del capítulo. Investigación en enfermería: fundamentos para el uso de la evidencia en la práctica de la enfermería, novena edición, tiene recursos auxiliares en línea que se diseñaron pensando en los estudiantes y los profesores, disponibles en inglés en el sitio web interactivo . Recursos para el estudiante disponibles en inglés 13 en Suplementos para cada capítulo que fomentan la exploración de temas específicos por parte del estudiante. En la página xxii se presenta una lista completa de los suplementos en inglés. Pueden asignarse como una base adicional o como material avanzado con el fin de cubrir necesidades específicas de los estudiantes. La Interactive Critical Thinking Activity traslada los ejercicios de pensamiento crítico del texto (salvo los enfocados en los estudios de los apéndices) a una herramienta interactiva fácil de usar que permite a los estudiantes aplicar las nuevas habilidades que aprenden en cada capítulo. Se guía a los estudiantes por evaluaciones de ejemplos reales de investigación y luego se les acompaña en una serie de preguntas que los orillan a pensar en la calidad de la evidencia del estudio. Las respuestas pueden imprimirse o enviarse por correo electrónico a los profesores como tareas o exámenes. Cientos de Student Review Questions les ayudan a identificar sus áreas de fortaleza y las que requieren más estudio. Las Answers to Critical Thinking Exercises incluyen las de las preguntas relacionadas con los estudios de los apéndices A y B del libro. 14 Artículos de revistas especializadas. Se incluyen 18 artículos en inglés completos de las publicaciones de Wolters Kluwer (uno correspondiente a cada capítulo) como oportunidades adicionales para el análisis. Muchos de estos son los artículos completos de estudios usados como ejemplos de investigación al final de los capítulos. Todos los artículos de revistas especializadas que aparecen en el sitio web se identifican en el texto con y se mencionan en las listas de referencias para los capítulos apropiados con dos asteriscos (**). Acceso directo a Internet Resources con páginas relevantes y útiles relacionadas con el contenido del capítulo sin tener que escribir de nuevo el URL, con riesgo de un error tipográfico. Esta edición también incluye enlaces a todos los artículos de libre acceso citados en el libro; estos artículos se señalan con un asterisco (*) en las listas de referencias para los artículos apropiados. Los Critiquing Guidelines y los Learning Objectives del libro están disponibles en Microsoft Word para su conveniencia. Nursing Professionals Roles and Responsibilities. Recursos para el profesor disponibles en inglés en ¡NUEVO! Las Test Generator Questions son nuevas y están redactadas por las autoras del libro para esta novena edición. Cientos de preguntas de opción múltiple en inglés ayudan a los profesores a valorar la comprensión de sus estudiantes sobre el contenido del capítulo. El Instructor’s Manual incluye un prefacio que ofrece una guía para mejorar la experiencia pedagógica. Reconocemos la necesidad de un sólido respaldo para los profesores que conducen un curso que puede ser muy difícil. Parte de la dificultad deriva de la ansiedad de los estudiantes con respecto al contenido del curso y su preocupación acerca de que los métodos de investigación pudieran no ser relevantes para su práctica de la enfermería. Ofrecemos numerosas sugerencias sobre cómo hacer más gratificante el aprendizaje –y la enseñanza– de los métodos de investigación. El contenido del manual del profesor, disponible en inglés, incluye lo siguiente para cada capítulo: Statement of Intent. Describe los objetivos de las autoras para 15 cada capítulo. Special Class Projects. Presenta muchas ideas para proyectos de clase interesantes y relevantes. Revise los elementos para iniciar la comunicación y las actividades relativas al Gran experimento de galletas (Great Cookie Experiment), con los archivos SPSS acompañantes. Test Questions and Answers. Las preguntas de falso/verdadero más preguntas de aplicación importantes ponen a prueba la comprensión de los estudiantes y su capacidad para usar sus recién adquiridas habilidades para el análisis. Las preguntas de aplicación se enfocan en un breve resumen de un estudio e incluyen varias preguntas de respuesta corta (con nuestras respuestas), además de preguntas tipo ensayo. El fin de estas preguntas de aplicación es valorar el conocimiento de los estudiantes sobre los conceptos metodológicos y sus habilidades críticas. Answers to the Interactive Critical Thinking Activity. Las respuestas sugeridas a las preguntas de la actividad interactiva de pensamiento crítico están disponibles para los profesores. Los estudiantes pueden imprimir o enviar sus respuestas por correo electrónico al profesor como exámenes o como tarea. Dos presentaciones de PowerPoint: Diapositivas de PowerPoint “Test Yourself!”. Para cada capítulo hay un conjunto de diapositivas con cinco preguntas de opción múltiple “Autoevaluación” referentes a los conceptos clave del capítulo, que van seguidas de las respuestas a las preguntas. El objetivo de estas presentaciones no es evaluar el desempeño de los estudiantes. Recomendamos entregarlas a los estudiantes para autoevaluación o pueden usarse en el aula con iClickers para valorar la comprensión de los alumnos acerca de conceptos importantes. Para aumentar la probabilidad de que los alumnos reconozcan la relevancia de los conceptos para la práctica clínica, todas las preguntas son de aplicación. Esperamos que los profesores usen las presentaciones para aclarar cualquier malentendido e, igual de importante, para estimular a los estudiantes con una retroalimentación positiva inmediata en relación con las habilidades recién adquiridas. Las presentaciones de PowerPoint ofrecen resúmenes tradicionales de los puntos clave en cada capítulo para usarlos en 16 las clases. Estas diapositivas están disponibles en un formato que permite su fácil adaptación y también incluyen preguntas de la audiencia que pueden usarse por sí mismas, aunque también son compatibles con iClicker y otros programas y dispositivos inalámbricos de respuesta de la audiencia. El Image Bank incluye las figuras del texto. El QSEN Map (Quality and Safety in Education for Nurses) muestra cómo el contenido del libro se integra en las competencias de QSEN. El BSN Essentials Competencies Map (Bachelor in Science of Nursing) expone cómo el contenido del libro integra las competencias de Essentials of Baccalaureate Education for Professional Nursing Practice de la American Association of Colleges of Nursing (AACN). Las Strategies for Effective Teaching ofrecen enfoques creativos para interesar a los estudiantes. Learning Management System Course Cartridges. Acceso a todos los recursos para el estudiante descritos antes. GUÍA DE ESTUDIO La Study Guide for Essentials of Nursing Research, 9e., está disponible en inglés para compra y enriquece el libro al proporcionar a los estudiantes oportunidades para aplicar su aprendizaje. Las oportunidades de análisis abundan en la Study Guide, que incluye ocho artículos de investigación íntegros. Los estudios representan temas de enfermería y enfoques para investigación diversos, como un estudio aleatorizado controlado, un estudio con métodos de correlación/mixtos, un proyecto de PBE, tres estudios cualitativos (etnográfico, fenomenológico y teoría fundamentada), un metaanálisis y una metasíntesis. Los Application Exercises de cada capítulo guían a los estudiantes en la lectura, comprensión y crítica de estos ocho estudios. Las respuestas a la sección Questions of Fact en los Application Exercises de cada capítulo se presentan en el apéndice I de la Study Guide, para que los estudiantes puedan obtener retroalimentación inmediata sobre sus respuestas. 17 Aunque las habilidades para la crítica se subrayan en la Study Guide, otras actividades respaldan el aprendizaje de términos y principios fundamentales de la investigación, como ejercicios para completar frases, ejercicios de relación y preguntas de estudio enfocadas. Las respuestas a las preguntas que tienen una contestación objetiva se encuentran en el apéndice I. SOLUCIONES DE APRENDIZAJE DIGITAL INTEGRADAS E INTEGRALES Nos complace introducir una estrategia ampliada de soluciones digitales en inglés para apoyar a los profesores y estudiantes en el uso de Investigación en enfermería, novena edición. Ahora, por primera vez, el libro está incluido en dos soluciones digitales integrales de aprendizaje –una específica para programas de pregrado y la otra para posgrado– que se desarrollan con base en las características del texto con estrategias de diseño instructivas probadas. Para aprender más acerca de estas soluciones, visite http://www.nursingeducationsuccess.com/ o comuníquese con su representante local de Wolters Kluwer. Nuestra solución para pregrado, Lippincott CoursePoint, es un valioso ambiente de aprendizaje que favorece el éxito del curso y del plan de estudios con el fin de preparar a los estudiantes para la práctica. Lippincott CoursePoint está diseñado según la manera en que los estudiantes aprenden. La solución conecta el aprendizaje con la aplicación en la vida real mediante la integración del contenido de Investigación en enfermería con casos en video, módulos interactivos y artículos de revistas basados en evidencia. Ideal para el aprendizaje activo basado en casos, esta solución ayuda a los estudiantes a desarrollar un nivel más alto de habilidades cognitivas y les pide que tomen decisiones relacionadas con situaciones que van de sencillas a complejas. Lippincott CoursePoint para investigación en enfermería está disponible en inglés e incluye lo siguiente: Contenido de vanguardia en contexto. El contenido digital de 18 Investigación en enfermería, novena edición, está incluido en nuestras potentes herramientas, involucra a los estudiantes y fomenta la interacción y el aprendizaje más profundo. El libro electrónico interactivo completo incluye actualizaciones anuales al contenido, con la práctica basada en enfermería más reciente y permite el acceso a los estudiantes en cualquier momento, en cualquier parte y con múltiples dispositivos. El acceso en línea completo a Stedman’s Medical Dictionary for the Health Professions and Nursing asegura que los estudiantes trabajen con el mejor diccionario médico disponible. Potentes herramientas para maximizar el desempeño de la clase. Herramientas adicionales específicas para el curso permiten el aprendizaje basado en casos para cada estudiante: Los casos en video muestran cómo la investigación en enfermería y la práctica basada en evidencia se relacionan con la práctica en la vida real. Al observar los videos y completar las actividades relacionadas, los estudiantes demuestran sus habilidades en la práctica basada en la evidencia y desarrollan un espíritu investigador. Los módulos interactivos ayudan a los estudiantes a identificar con rapidez qué comprenden y qué no, con el fin de estudiar inteligentemente. Con un diseño instructivo excepcional que impulsa a los estudiantes a descubrir, reflexionar, sintetizar y aplicar, los alumnos aprenden de manera activa. Los enlaces para la solución al libro digital están integrados en todo el contenido. 19 Se proporcionan colecciones organizadas de artículos de investigación a través de Lippincott NursingCenter, el destino líder de Wolters Kluwer para revistas de enfermería revisadas por pares. Mediante la integración de CoursePoint y NursingCenter, los estudiantes se involucrarán en la manera en que la investigación en enfermería influye en la práctica. Datos para medir el progreso de los estudiantes. Los datos sobre el desempeño de los estudiantes obtenidos en una presentación intuitiva permiten a los profesores valorar con rapidez si los alumnos vieron los módulos interactivos y los casos en video fuera de clase, así como su desempeño en las pequeñas pruebas estilo NCLEX (National Council for Licensure Exam), lo que asegura que los estudiantes acuden al aula listos y preparados para aprender. Para saber más sobre Lippincott CoursePoint, www.nursingeducation success.com/coursepoint. visite Lippincott RN to BSN Online: Nursing Research es una solución de posgrado para cursos en línea e híbridos que conjunta el aprendizaje experimental con el contenido confiable de Investigación en enfermería, novena edición. Creado alrededor de los objetivos de aprendizaje concordantes con BSN Essentials y los estándares del plan de estudios para enfermería de QSEN, todos los aspectos de Lippincott RN to BSN Online están diseñados para involucrar, estimular y cultivar a los estudiantes de posgrado. El contenido está disponible en inglés. Los Self-Paced Interactive Modules utilizan estrategias de diseño instruccional que incluye narrativas, modelos y situaciones basadas en casos y en problemas para involucrar a los estudiantes de manera activa en el aprendizaje de material nuevo y enfocar los resultados del aprendizaje en la aplicación a la vida real. 20 Las Pre- and Postmodule Assessments activan el conocimiento previo de los estudiantes antes de revisar el módulo y luego valoran su competencia al completarlo. Las Discussion Board Questions generan un diálogo continuo para favorecer el aprendizaje social. Las Writing and Group Work Assignments perfeccionan la competencia de los alumnos en la redacción y comunicación, y generan las habilidades necesarias para avanzar en sus carreras de enfermería. Los Collated Journal Articles presentan a los estudiantes la investigación en enfermería que se ha publicado en la bibliografía reciente. Las Case Study Assignments, incluido el despliegue de casos que evolucionan a partir de casos en los módulos interactivos, ayudan a los alumnos a aplicar la teoría a situaciones reales. La Best Practices in Scholarly Writing Guide cubre el formato y lineamientos de estilo de la APA. Ya sea que se utilice solo o con otros recursos creados por los profesores, Lippincott RN to BSN Online favorece la interactividad con los cursos. También ahorra tiempo a los profesores al mantener el libro y los recursos para el curso vigentes y precisos por medio de 21 actualizaciones periódicas del contenido. Para saber más sobre Lippincott RN to BSN Online, visite http://www.nursingeducationsuccess.com/nursing-educationsolutions/lippincott-rn-bsn-online/. NOTA FINAL Esperamos que el contenido, el estilo y la organización de esta novena edición de Investigación en enfermería sean útiles a los estudiantes que desean volverse lectores reflexivos y hábiles de estudios en enfermería y para los que quieren mejorar su desempeño clínico con base en los hallazgos de la investigación. También esperamos que este libro ayude a desarrollar un entusiasmo por los tipos de descubrimientos y conocimiento que la investigación puede generar. Denise F. Polit, PhD, FAAN Cheryl Tatano Beck, DNSc, CNM, FAAN 22 Objetivos de aprendizaje: enfocan la atención del estudiante en el contenido fundamental. Términos clave: alertan a los estudiantes sobre terminología importante. Ejemplos: ayudan a los alumnos a aplicar el contenido a la investigación real. 23 Recuadros TIP: describen lo que se encuentra en los artículos de investigación reales. Recuadros TIP Cómo saber: explican aspectos confusos de artículos de investigación reales. Lineamientos para la crítica: guían a los estudiantes por los aspectos clave de un artículo de investigación. Ejemplos de investigación: resaltan puntos cruciales del capítulo y 24 afinan las habilidades de pensamiento crítico. Ejercicios de pensamiento crítico: son oportunidades para practicar el análisis de artículos de investigación reales. Puntos de resumen: revisan el contenido del capítulo para asegurar el éxito. Iconos especiales: alertan a los estudiantes acerca de contenido importante que se encuentra en y en la Study Guide. 25 Lisa Aiello-Laws, RN, MSN, AOCNS, APN-C Assistant Clinical Professor College of Nursing and Health Professions Drexel University Philadelphia, Pennsylvania Elizabeth W. Black, MSN, CSN Assistant Professor Gwynedd Mercy University Gwynedd Valley, Pennsylvania Lynn P. Blanchette, RN, PhD Program Director Rhode Island College Providence, Rhode Island Anne Watson Bongiorno, PhD, APHN-BC, CNE Associate Professor State University of New York at Plattsburgh Plattsburgh, New York Katherine Bowman, PhD, RN Assistant Teaching Professor Sinclair School of Nursing University of Missouri Columbia, Missouri Barb Braband, EdD, RN, CNE Master’s Program Director University of Portland Portland, Oregon Vera Brancato, EdD, MSN, RN, CNE Professor of Nursing 26 Alvernia University Reading, Pennsylvania Jennifer Bryer, PhD, RN, CNE Chairperson and Associate Professor Department of Nursing Farmingdale State College Farmingdale, New York Wendy Budin, PhD, RN-BC, FACCE, FAAN Adjunct Professor New York University New York, New York Carol Caico, PhD, CS, NP Associate Professor New York Institute of Technology New York, New York Mary Ann Cantrell, PhD, RN, CNE, FAAN Assistant Professor Villanova University Villanova, Pennsylvania Ruth Chaplen, RN, MSN, DNP, ACNS BC, AOCN Associate Professor of Nursing Rochester College Rochester Hills, Michigan Lori Ciafardoni, RN, MSN/ED Assistant Professor State University of New York at Delhi Delhi, New York Leah Cleveland, EdD, RN, CNS, PHN, CDE Lecturer California State University, Fullerton Fullerton, California Susan Davidson, EdD, APN, NP-C Professor School of Nursing Coordinator Gateway RN-BSN Program 27 School of Nursing University of Tennessee at Chattanooga Chattanooga, Tennessee Pamela de Cordova, PhD, RN-BC Assistant Professor Rutgers University New Brunswick, New Jersey Josephine DeVito, PhD, RN Undergraduate Chair and Associate Professor College of Nursing Seton Hall University South Orange, New Jersey Nancy Ann C. Falvo, BSN, MSN, PhD Assistant Professor Clarion University of Pennsylvania Clarion, Pennsylvania Jeanie Flood, PhD, RN-C, IBCLC RN to BSN Faculty Advisor University of Hawaii at Hilo Hilo, Hawaii Deborah Hunt, PhD, RN Associate Professor College of New Rochelle New Rochelle, New York Linda Johanson, EdD, RN Associate Professor Appalachian State University Boone, North Carolina Lucina Kimpel, PhD, RN Associate Professor Mercy College of Health Sciences Des Moines, Iowa Pamela Kohlbry, PhD, RN, CNL Associate Professor Med/Surg Lead and CNL Program Coordinator California State University San Marcos 28 San Marcos, California Leann Laubach PhD, RN Professor Career Advancement Coordinator University of Central Oklahoma Edmond, Oklahoma Hayley Mark, PhD, MSN, MPH, RN Chairperson Department of Nursing Towson University Towson, Maryland Donna Martin, DNP, MSN, RN-BC, CDE Assistant Professor Lewis University Romeoville, Illinois Ditsapelo McFarland, PhD, MSN, EdD Associate Professor Adelphi University Garden City, New York Kristina S. Miller, DNP, RN, PCNS-BC Instructor of Maternal Child Nursing College of Nursing University of South Alabama Mobile, Alabama Kathy T. Morris, EdD, MSN, RN Assistant Professor Armstrong State University Savannah, Georgia Elizabeth Murray, PhD, RN, CNE Assistant Professor Florida Gulf Coast University Fort Myers, Florida Sarah Newton, PhD, RN Associate Professor School of Nursing Oakland University 29 Rochester, Michigan Mae Ann Pasquale, RN, BSN, MSN Assistant Professor of Nursing Cedar Crest College Allentown, Pennsylvania Kim L. Paxton DNP, APRN, ANP-BC, LIHT-C Assistant Professor Cardinal Stritch University Milwaukee, Wisconsin Janet Reagor, PhD, RN Interim Dean and Assistant Professor of Nursing Director RN-BSN Program Avila University Kansas City, Missouri Elizabeth A. Roe, PhD, RN Acting Assistant Dean College of Human and Health Sciences Saginaw Valley State University Saginaw, Michigan Cathy Rozmus, PhD, RN Professor Associate Dean for Academic Affairs University of Texas Health Science Center at Houston Houston, Texas Milena P. Staykova, EdD, FNC-BC Director Post-Licensure Bachelor of Science in Nursing Jefferson College of Health Sciences Roanoke, Virginia Amy Stimpfel, PhD, RN Assistant Professor College of Nursing New York University New York, New York Yiyuan Sun, DNSc 30 Associate Professor Adelphi University Garden City, New York Annie Thomas, PhD, RN Assistant Professor Loyola University Chicago Chicago, Illinois Elizabeth VandeWaa, PhD Professor of Adult Health Nursing University of South Alabama Mobile, Alabama Adrienne Wald, BSN, MBA, EdD Assistant Professor College of New Rochelle New Rochelle, New York Camille Wendekier, PhD, CRRN, CSN, RN Assistant Professor Saint Francis University Loretto, Pennsylvania Kathleen Williamson, RN, PhD Chair Wilson School of Nursing Midwestern State University Wichita Falls, Texas Roxanne Wilson, PhD, RN Assistant Professor St. Cloud State University St. Cloud, Minnesota Paige Wimberley, RN, CNS, CNE Assistant Professor of Nursing Arkansas State University Jonesboro, Arkansas Charlotte A. Wisnewski, PhD, RN, CDE, CNE Associate Professor University of Texas Medical Branch Galveston, Texas 31 Esta novena edición, como las ocho anteriores, fue posible gracias a la contribución de muchas personas generosas. Estamos muy agradecidas con todos los profesores y estudiantes que usaron el libro e hicieron sugerencias invaluables para mejorarlo. Las sugerencias nos llegaron directamente por interacciones personales (la mayoría en la University of Connecticut y la Griffith University en Australia) y por correspondencia electrónica. En particular deseamos agradecer a Valori Banfi, bibliotecaria de enfermería en la University of Connecticut, y a John McNulty, miembro de la facultad de la University of Connecticut. También queremos reconocer a los revisores de la novena edición de Investigación en enfermería. Otras personas hicieron contribuciones específicas. Aunque sería imposible mencionarlas a todas, nos referimos en particular a los investigadores en enfermería que compartieron su trabajo con nosotras mientras desarrollábamos los ejemplos, que incluyen trabajos que en algunos casos todavía no se publicaban. También agradecemos cálidamente a los que nos ayudaron a convertir el manuscrito en un producto terminado. El personal de Wolters Kluwer ha sido de enorme ayuda por el apoyo que nos ha brindado durante años. Estamos en deuda con Christina C. Burns, Emily Lupash, Meredith L. Brittain, Marian Bellus y todos los demás que están tras bambalinas por sus magníficas contribuciones. Gracias también a Rodel Fariñas por su paciencia y buen humor al convertir nuestro manuscrito en este libro. Por último, agradecemos a nuestras familias, nuestros seres queridos y nuestros amigos, que nos brindaron su apoyo y aliento continuos durante toda esta empresa y que fueron tolerantes cuando trabajamos hasta tarde por las noches, en fines de semana y en días festivos para terminar esta novena edición. 32 Parte 1 Generalidades de la investigación en enfermería y su papel en la práctica basada en evidencia 1 Introducción a la investigación en enfermería para la práctica basada en evidencia 2 Fundamentos de la práctica basada en evidencia en la enfermería 3 Conceptos clave y pasos de la investigación cuantitativa y cualitativa 4 Lectura y crítica de artículos de investigación 5 Ética en la investigación Parte 2 Pasos preliminares en la investigación cuantitativa y cualitativa 6 Problemas de investigación, preguntas de investigación e hipótesis 7 Búsqueda y revisión de evidencia de investigación en la bibliografía 8 Marcos teórico y conceptual Parte 3 Diseños y métodos para la investigación cuantitativa y cualitativa en enfermería 9 Diseño para investigación cuantitativa 33 10 11 12 13 Muestreo y recolección de datos en estudios cuantitativos Diseños y estrategias cualitativas Muestreo y recolección de datos en estudios cualitativos Métodos mixtos y otros tipos especiales de investigación Parte 4 Análisis e interpretación en la investigación cuantitativa y cualitativa 14 Análisis estadístico de datos cuantitativos 15 Interpretación y relevancia clínica en la investigación cuantitativa 16 Análisis de datos cualitativos 17 Confianza e integridad en la investigación cualitativa 18 Revisiones sistemáticas: metaanálisis y metasíntesis Apéndice Estudio de Swenson et al. (2016): Uso de afirmaciones A positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental Apéndice Estudio de Beck y Watson (2010): Parto posterior a un B parto traumático Apéndice Estudio de Wilson et al. (2016): Estudio controlado C aleatorizado de una intervención educativa preoperatoria individualizada para el control de síntomas después de artroplastia total de la rodilla Crítica del estudio de Wilson y colaboradores Apéndice Estudio de Sawyer et al. (2010): Diferencias en las D percepciones del diagnóstico y tratamiento de la apnea obstructiva en el sueño y la terapia de presión positiva continua en la vía aérea entre sujetos observantes e inobservantes Crítica del estudio de Sawyer y colaboradores Glosario de símbolos estadísticos seleccionados Glosario 34 Índice alfabético de materias SUPLEMENTOS DE CAPÍTULO DISPONIBLES EN INGLÉS EN Suplemento del capítulo 1 Suplemento del capítulo 2 Suplemento del capítulo 3 Suplemento del capítulo 4 Suplemento del capítulo 5 Suplemento del capítulo 6 Suplemento del capítulo 7 Suplemento del capítulo 8 Suplemento del capítulo 9 Suplemento del capítulo 10 Suplemento del capítulo 11 Suplemento del capítulo 12 Suplemento del capítulo 13 Suplemento The History of Nursing Research Evaluating Clinical Practice Guidelines—AGREE II Deductive and Inductive Reasoning Guide to an Overall Critique of a Quantitative Research Report and Guide to an Overall Critique of a Qualitative Research Report Informed Consent Simple and Complex Hypotheses Finding Evidence for an EBP Inquiry in PubMed Prominent Conceptual Models of Nursing Used by Nurse Researchers Selected Experimental and Quasi-Experimental Designs: Diagrams, Uses, and Drawbacks Vignettes and Q-Sorts Qualitative Descriptive Studies Transferability and Generalizability Other Specific Types of Research Multivariate Statistics 35 del capítulo 14 Suplemento del capítulo 15 Suplemento del capítulo 16 Suplemento del capítulo 17 Suplemento del capítulo 18 Research Biases A Glaserian Grounded Theory Study: Illustrative Materials Whittemore and Colleagues’ Framework of Quality Criteria in Qualitative Research Publication Bias in Meta-Analyses 36 Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Comprender por qué la investigación es importante para la enfermería. Explicar la necesidad de la práctica basada en evidencia. Describir a grandes rasgos las tendencias históricas y las direcciones futuras de la investigación en enfermería. Identificar fuentes alternativas de evidencia para la práctica de la enfermería. Describir las principales características de los paradigmas positivista y constructivista. Comparar el método científico tradicional (investigación cuantitativa) con los métodos constructivistas (investigación cualitativa). Identificar los propósitos de la investigación cuantitativa y cualitativa. Definir nuevos términos en el capítulo. Términos clave Club de lectura de revistas Estudio exploratorio Evidencia empírica Generalizabilidad 37 Investigación Investigación cualitativa Investigación cuantitativa Investigación en enfermería Investigación en enfermería clínica Método científico Métodos de investigación Paradigma Paradigma constructivista Paradigma positivista Práctica basada en evidencia (PBE) Relevancia clínica Revisión sistemática Suposición PERSPECTIVAS DE LA INVESTIGACIÓN EN ENFERMERÍA Sabemos que muchos de los lectores no toman este curso porque planeen convertirse en investigadores en enfermería. No obstante, confiamos en que muchos de ustedes participarán en actividades relacionadas con la investigación durante sus carreras y se espera que todos tengan conocimientos básicos de investigación. Aunque tal vez aún no sea evidente la relevancia de la investigación en la carrera de profesional de enfermería, esperamos que identifique el valor de la investigación en enfermería durante este curso y sea inspirado por los esfuerzos de miles de investigadores en enfermería que ahora trabajan en todo el mundo para mejorar la atención de los pacientes. Está embarcándose en una jornada de por vida en la que la investigación tendrá una función. Esperamos prepararlo para disfrutar el viaje. ¿Qué es la investigación en enfermería? Ya sea que lo sepa o no, usted ya ha realizado mucha investigación. Cuando utiliza Internet para encontrar la “mejor ganga” en la compra de una computadora portátil o un boleto de avión, comienza con una pregunta (p. ej., ¿quién tiene la mejor oferta de lo que quiero?), recolecta información explorando distintas páginas web y luego llega a una conclusión. Esta “investigación cotidiana” tiene mucho en 38 común con la investigación formal, aunque, por supuesto, también existen diferencias importantes. Como una tarea formal, la investigación es la indagación sistemática que utiliza métodos disciplinados para responder preguntas y resolver problemas. El objetivo final de la investigación formal es obtener conocimiento que sea útil para muchas personas. La investigación en enfermería es la indagación sistemática diseñada para desarrollar evidencia confiable sobre aspectos importantes para los profesionales de enfermería y sus pacientes. En este libro se enfatiza la investigación en enfermería clínica, que es la investigación diseñada para guiar la práctica de la enfermería. La investigación en enfermería clínica casi siempre comienza con preguntas derivadas de problemas en la práctica, problemas que quizá ya haya enfrentado. Ejemplos de preguntas en la investigación en enfermería ¿Un proceso de notificación por mensaje de texto ayuda a reducir el tiempo de seguimiento para las mujeres con resultado anormal en la mamografía? (Oakley-Girvan et al., 2016). ¿Cuáles son las experiencias diarias de los pacientes tratados con hemodiálisis por enfermedad renal en etapa terminal? (Chiaranai, 2016). TIP Es posible que tenga la impresión de que la investigación es abstracta e irrelevante para la enfermería clínica. No obstante, la investigación en enfermería se refiere a personas reales con problemas reales, y el estudio de estos problemas ofrece oportunidades para resolverlos o encararlos mediante mejoras en la atención de enfermería. La importancia de la investigación para la enfermería basada en evidencia La enfermería ha experimentado cambios profundos en las últimas décadas. Cada vez se espera más que los profesionales de enfermería comprendan y realicen investigación, y que basen su práctica en evidencia de la investigación; es decir, que adopten una práctica basada en evidencia (PBE). Una definición amplia de la PBE es el uso de la mejor evidencia para tomar decisiones sobre la atención del 39 paciente. Dicha evidencia casi siempre proviene de la investigación realizada por profesionales en enfermería y otras áreas de la salud. Los líderes en enfermería reconocen la necesidad de basar las decisiones específicas de enfermería en evidencia empírica de que las decisiones son apropiadas y rentables, y que conducen a resultados positivos para los pacientes. En algunos países, la investigación tiene un papel importante en la acreditación y la certificación en la enfermería. Por ejemplo, el American Nurses Credentialing Center, una rama de la American Nurses Association, desarrolló el Magnet Recognition Program para reconocer a las organizaciones de atención a la salud que brindan atención de enfermería de alta calidad. Para lograr el estatus de hospital magnético, los ambientes de práctica deben demostrar un compromiso continuo con la PBE y la investigación en enfermería. Los cambios en la práctica de la enfermería ocurren todos los días gracias a los esfuerzos de la práctica basada en evidencia. Ejemplo de práctica basada en evidencia Muchos cambios en la práctica clínica reflejan el efecto de la investigación. Por ejemplo, el modelo de cuidado canguro, que permite el contacto piel a piel de los lactantes prematuros vestidos solo con un pañal, pecho a pecho con sus padres, ahora se practica mucho en las unidades de cuidados intensivos neonatales (UCIN), pero a principios de la década de 1990 solo una minoría de las UCIN ofrecía la opción del cuidado canguro. La adopción de esta práctica es reflejo de la evidencia adecuada de que el contacto temprano piel con piel tiene beneficios clínicos y carece de efectos secundarios negativos (Ludington-Hoe, 2011; Moore et al., 2012). Parte de esta evidencia proviene de rigurosos estudios por parte de investigadores en enfermería (p. ej., Campbell-Yeo et al., 2013; Cong et al., 2009; Cong et al., 2011; Holditch-Davis et al., 2014; Lowson et al., 2015). Funciones de la investigación en enfermería En el ambiente de PBE actual, es probable que todo el personal de enfermería realice una o más actividades en un continuo de participación en la investigación. En un extremo del continuo están los usuarios o consumidores de investigación en enfermería, profesionales de enfermería que leen informes de investigación para mantenerse al día sobre los hallazgos que pueden influir en su 40 práctica. La PBE depende de consumidores de investigación en enfermería bien informados. En el otro extremo del continuo están los productores de investigación en enfermería: personal de enfermería que diseña y realiza de manera activa los estudios. En una época, la mayoría de los investigadores en enfermería eran profesores que impartían clases en escuelas de enfermería, pero cada vez más la investigación es conducida por profesionales de enfermería clínica que desean saber qué funciona mejor para sus pacientes. Entre estos dos extremos del continuo están diversas actividades de investigación en las que el personal de enfermería participa. Incluso si usted no conduce un estudio, es probable que haya hecho algo de lo siguiente: 1. Aportar una idea para una indagación clínica. 2. Ayudar a recolectar datos para investigación. 3. Ofrecer asesoría a los pacientes acerca de su participación en un estudio. 4. Buscar evidencia científica. 5. Discutir las implicaciones de un estudio en un club de lectura de revistas en su centro de trabajo, lo que implica reuniones para discutir artículos de investigación. En todas las actividades relacionadas con la investigación, los profesionales de enfermería que tienen algunas habilidades para la investigación son más capaces que quienes no las tienen para contribuir a la enfermería y la PBE. Por lo tanto, con las habilidades para la investigación que se obtienen con este libro, usted estará preparado para contribuir al avance de la enfermería. Investigación en enfermería: pasado y presente La mayoría de las personas concuerda en que la investigación en enfermería comenzó con Florence Nightingale a mediados del siglo XIX. Con base en su acertado análisis de los factores que influyeron en la mortalidad y morbilidad de los soldados durante la guerra de Crimea, introdujo cambios en la atención de enfermería y en la salud pública. Sin embargo, durante muchos años después del trabajo de Nightingale la investigación estuvo ausente de la bibliografía de enfermería. Los estudios empezaron a aparecer a principios del siglo XX, aunque la mayor parte se vinculaba con la educación de las 41 enfermeras. En la década de 1950 empezó a florecer la investigación en enfermería. Un aumento del número de profesionales de enfermería con habilidades y grados avanzados, un incremento de la disponibilidad del patrocinio para la investigación y el establecimiento de la revista Nursing Research ayudaron a impulsar la investigación en enfermería. Durante la década de 1960 empezó a surgir la investigación orientada a la práctica y comenzó la publicación de revistas orientadas a la investigación en varios países. Durante los años 70 del siglo pasado hubo un cambio en el énfasis de la investigación: de áreas como la enseñanza y las características del profesional de enfermería a las mejoras en la atención al paciente. También se empezó a prestar atención al uso de los hallazgos de la investigación en la práctica de enfermería. Los años de 1980 llevaron a la investigación en enfermería a un nuevo nivel de desarrollo. Muy importante en Estados Unidos fue el establecimiento del National Center for Nursing Research (NCNR) en los National Institutes of Health (NIH) en 1986. El propósito del NCNR era promover y dar apoyo financiero a los proyectos de investigación y entrenamiento relativos a la atención del paciente. La investigación en enfermería se fortaleció y se hizo más visible cuando el NCNR alcanzó el estado total de instituto dentro de los NIH: en 1993 se estableció el National Institute of Nursing Research (NINR). El nacimiento y la expansión del NINR ayudaron a poner la investigación en enfermería en el campo de las actividades de investigación que ocupan otras disciplinas de la salud. Las oportunidades de patrocinio se extendieron también en otros países. La década de 1990 fue testigo del nacimiento de varias revistas más para investigadores en enfermería y las revistas especializadas publicaron artículos de investigación cada vez con mayor frecuencia. La cooperación internacional para integrar la PBE a la enfermería también empezó a desarrollarse en los años de 1990. Por ejemplo, Sigma Theta Tau International, junto con la facultad de la University of Toronto, patrocinó la primera conferencia internacional de uso de investigación en 1998. TIP Para los interesados en aprender más de la historia de la investigación en enfermería, se encuentra disponible un amplio suplemento en inglés en 42 Direcciones futuras de la investigación en enfermería La investigación en enfermería continúa su desarrollo a paso rápido y no hay duda de que florecerá en el siglo XXI. En 1986, el NCNR tenía un presupuesto de 16 millones de dólares, mientras que el patrocinio del NINR en el año fiscal 2016 fue un poco menor de 150 millones de dólares. Entre las tendencias que se prevén para el futuro próximo están las siguientes: Enfoque continuado en la PBE. Es seguro que persista el fomento para que los profesionales de la enfermería utilicen los hallazgos de la investigación en la práctica. Esto significa que se necesitarán mejoras en la calidad de los estudios de enfermería y en las habilidades del personal de enfermería para localizar, comprender, analizar y usar los resultados relevantes de los estudios. También existe un interés emergente en la investigación de traducción, la investigación que permite transferir el conocimiento obtenido en los estudios a la práctica. Evidencia más sólida mediante estrategias confirmatorias. Los profesionales de enfermería clínica rara vez adoptan una innovación con base en estudios mal diseñados o aislados. Los diseños de investigación sólidos son esenciales y suele requerirse una confirmación a través de la replicación (es decir, repetición) de estudios en instalaciones clínicas diferentes para asegurar que los resultados sean robustos. Énfasis continuado en las revisiones sistemáticas. Las revisiones sistemáticas son una piedra angular de la PBE y han adquirido cada vez más importancia en todas las disciplinas de la salud. Las revisiones sistemáticas integran de manera rigurosa información de investigación de un tema para poder llegar a conclusiones sobre el estado de la evidencia. Investigación local ampliada en instalaciones de atención a la salud. Es probable que los estudios pequeños diseñados para resolver problemas locales aumenten. Esta tendencia se reforzará conforme más hospitales soliciten la acreditación de magnéticos en Estados Unidos y otros países. Mayor divulgación de los resultados de la investigación. Internet y otros avances tecnológicos han tenido un gran impacto en la divulgación de la información obtenida mediante la investigación, lo 43 que a su vez ayuda a fomentar la práctica basada en evidencia. Mayor enfoque en aspectos culturales y en disparidades en la salud. Este problema de disparidad en la salud ha surgido como problema central y a su vez aumentó la consciencia acerca de la sensibilidad cultural de las intervenciones para la salud. La investigación debe ser sensible a las creencias, los comportamientos, la epidemiología y los valores de las poblaciones cultural y lingüísticamente diversas. Relevancia clínica y aportación del paciente. Cada vez más, los hallazgos de la investigación deben pasar la prueba de la relevancia clínica y los pacientes han asumido un papel central en los esfuerzos para definir la relevancia clínica. Una dificultad sustancial para los próximos años será incorporar la evidencia de la investigación y las preferencias de los pacientes en las decisiones clínicas. ¿Qué es probable que el profesional en enfermería investigador estudie en el futuro? Aunque existe una enorme diversidad en los intereses de la investigación, el NINR, la Sigma Theta Tau International y otras organizaciones de enfermería expresaron las prioridades para la investigación. Por ejemplo, el plan estratégico del NINR, lanzado en 2011 y actualizado en 2013, describe cinco áreas de enfoque: promoción de la salud y prevención de la enfermedad, control de síntomas y autotratamiento, atención al final de la vida y cuidados paliativos, innovación, y desarrollo de profesionales de enfermería investigadores y científicos (http://www.ninr.nih.gov). TIP Todos los sitios web citados en este capítulo, y los sitios web adicionales con contenido útil relacionado con los fundamentos de la investigación en enfermería, están en los Recursos en Internet del sitio . Esto le permitirá usar la característica “Control/clic” para ir directamente al sitio web, sin tener que teclear el URL con el riesgo de cometer un error tipográfico. Las páginas electrónicas correspondientes al contenido de todos los capítulos del libro también están disponibles en inglés en . FUENTES DE EVIDENCIA PARA LA PRÁCTICA DE LA ENFERMERÍA El profesional en enfermería toma decisiones clínicas con base en un extenso repertorio de conocimiento. Como estudiante de enfermería, 44 usted obtiene habilidades de sus profesores, libros e instalaciones clínicas sobre cómo ejercer la enfermería. Cuando se convierta en un(a) enfermero(a) certificado(a) (EC), continuará aprendiendo de otros profesionales de enfermería y de la salud. Como la evidencia cambia de manera constante, el aprendizaje de la mejor evidencia disponible para la práctica se realiza durante toda la vida profesional. Parte de lo que ha aprendido hasta ahora se basa en la investigación sistemática, pero gran parte, no. ¿Cuáles son las fuentes de evidencia para la práctica de la enfermería? ¿De dónde proviene el conocimiento para la práctica? Hasta hace muy poco el conocimiento se transmitía sobre todo de una generación a la siguiente con base en experiencia clínica, prueba y error, tradición y opinión experta. Estas fuentes alternativas de conocimiento son diferentes a la información basada en la investigación. Tradición y autoridad Algunas intervenciones de enfermería se basan en tradiciones no comprobadas, costumbres y “cultura de unidad”, más que en evidencia sólida. En realidad, un análisis reciente sugiere que algunas “vacas sagradas” (hábitos tradicionales inefectivos) persisten incluso en un centro de atención médica reconocido como líder en PBE (Hanrahan et al., 2015). Otra fuente habitual de conocimiento es una autoridad, una persona con experiencia especializada. La confianza en las autoridades (como un docente de enfermería o los autores de un libro) es inevitable. Sin embargo, las autoridades no son infalibles, en especial si su pericia se basa sobre todo en la experiencia personal; sin embargo, no suele cuestionarse su conocimiento. Ejemplo de “mitos” en los libros de enfermería Un estudio sugiere que los libros de enfermería pueden contener muchos “mitos”. En su análisis de 23 libros de enfermería psiquiátrica de pregrado usados con frecuencia, Holman y sus colaboradores (2010) encontraron que todos los libros contenían al menos una suposición no fundamentada (mito) acerca de la pérdida y el duelo; es decir, suposiciones no respaldadas por la evidencia de la investigación actual. Además, muchos hallazgos basados en evidencia sobre el duelo y la pérdida no estaban incluidos en los libros. TIP Las consecuencias de no usar la evidencia basada en 45 investigación pueden ser devastadoras. Por ejemplo, desde 1956 hasta la década de 1980, el doctor Benjamin Spock publicó varias ediciones de Child and Baby Care, una guía para padres de la cual se vendieron más de 19 millones de copias en todo el mundo. Como figura de autoridad, escribió el siguiente consejo: “Creo que es preferible acostumbrar a un bebé a dormir sobre su abdomen desde el principio, si así lo acepta” (Spock, 1979, p. 164). La investigación demostró con certeza que esta posición para dormir se relaciona con un mayor riesgo de síndrome de muerte súbita infantil (SMSI). En su revisión sistemática de evidencia, Gilbert y sus colaboradores (2005) escribieron “La recomendación de colocar a los lactantes a dormir sobre su abdomen durante casi medio siglo fue contraria a la evidencia desde 1970, la cual señala que esto puede ser nocivo” (p. 874). Calcularon que si la asesoría médica se hubiera guiado por la evidencia de investigación, se habrían podido prevenir más de 60 000 muertes infantiles. Experiencia clínica y prueba y error La experiencia clínica es una fuente funcional de conocimiento. Aún así, la experiencia personal tiene limitaciones como fuente de evidencia para la práctica porque la experiencia de cada profesional de enfermería es demasiado limitada para tener utilidad general, y las experiencias personales por lo regular están matizadas por sesgos. El procedimiento de prueba y error implica intentar alternativas de manera sucesiva hasta encontrar una solución a un problema. La estrategia de prueba y error puede ser práctica, pero el método tiende a ser aleatorio y las soluciones pueden ser idiosincrásicas. Información recolectada Para tomar decisiones clínicas, los profesionales de la salud también dependen de información reunida con varios propósitos. Por ejemplo, los datos de referencia locales, nacionales e internacionales brindan información de aspectos como las tasas de uso de varios procedimientos (p. ej., tasas de operación cesárea) o tasas de problemas clínicos (p. ej., infecciones intrahospitalarias). Los datos de mejora de calidad y los de riesgo, como los reportes de errores en la medicación, pueden usarse para valorar prácticas y establecer la 46 necesidad de cambios en la práctica. Estas fuentes ofrecen información útil, pero no un mecanismo para guiar en realidad las mejoras. Investigación sistematizada La investigación sistematizada se considera el mejor método para adquirir conocimiento confiable desarrollado por los seres humanos. La atención de salud basada en evidencia impulsa al personal de enfermería a basar su práctica clínica, en la medida de lo posible, en hallazgos de la investigación rigurosa y no en una tradición, autoridad o experiencia personal. Sin embargo, la enfermería siempre será una rica mezcla de arte y ciencia. PARADIGMAS Y MÉTODOS PARA LA INVESTIGACIÓN EN ENFERMERÍA Las preguntas que los investigadores en enfermería hacen y los métodos que usan para responderlas derivan de la visión que tienen acerca de cómo “funciona” el mundo. Un paradigma es una visión del mundo, una perspectiva general de las complejidades del mundo. La indagación disciplinada en enfermería se ha realizado sobre todo dentro de dos paradigmas generales. Esta sección describe los dos paradigmas y esboza los métodos de investigación relacionados con estos. El paradigma positivista El paradigma que dominó la investigación en enfermería durante décadas se llama positivismo. El positivismo se basa en un pensamiento del siglo XIX guiado por filósofos como Newton y Locke. El positivismo es reflejo de un amplio movimiento cultural (modernismo) que hace énfasis en lo racional y lo científico. Como se muestra en la tabla 1-1 en la siguiente página, una suposición fundamental de los positivistas es que existe una relación allá afuera que puede ser estudiada y conocida. Una suposición es un principio que se considera verdadero sin verificación. Los seguidores del positivismo asumen que la naturaleza es ordenada y regular, y que existe de manera independiente a la observación humana. En otras 47 palabras, se asume que el mundo no es solo una creación de la mente humana. La suposición del determinismo se refiere a la creencia de los positivistas de que los fenómenos no son aleatorios, sino que tienen causas precedentes. Si una persona tiene una enfermedad vascular cerebral, un científico de tradición positivista asume que debe haber una o más razones que es posible identificar. Dentro del paradigma positivista, la actividad de la investigación por lo regular se en foca en comprender las causas subyacentes de los fenómenos naturales. TABLA 1-1 Principales suposiciones de los paradigmas positivista y constructivista Tipo de suposición La naturaleza de la realidad Relación entre el investigador y los investigados El papel de los valores en la indagación Mejores métodos para obtener evidencia Paradigma positivista Paradigma constructivista La realidad existe; existe un mundo real impulsado por causas reales naturales. La realidad es múltiple y subjetiva, construida mentalmente por los individuos. El investigador es independiente de aquellos que investiga. El investigador interactúa con los que investiga; los hallazgos son la creación del proceso interactivo. Los valores y sesgos deben mantenerse controlados; se busca la objetividad. La subjetividad y los valores son inevitables y deseables. Procesos deductivos → prueba de hipótesis Énfasis en conceptos distintivos y específicos Enfoque en lo objetivo y cuantificable Corroboración de las predicciones de los investigadores Diseño fijo predeterminado Controles sobre el contexto Procesos inductivos → generación de hipótesis Énfasis en la totalidad Enfoque en lo subjetivo y no cuantificable Información emergente basada en las experiencias de los participantes Diseño flexible, emergente Unido al contexto, contextualizado 48 Información medida, cuantitativa Análisis estadístico Busca generalizaciones Información narrativa Análisis cualitativo Busca la comprensión a profundidad TIP ¿A qué nos referimos con fenómenos? En el contexto de la investigación, los fenómenos son las cosas en las que los investigadores están interesados, como un incidente de salud (p. ej., la caída de un paciente), un resultado de salud (p. ej., dolor) o una experiencia de salud (p. ej., vivir con dolor crónico). Debido a su creencia en la realidad objetiva, los positivistas valoran la objetividad. Su enfoque implica el uso de procedimientos ordenados y disciplinados, con controles estrictos sobre la situación de la investigación para poner a prueba las suposiciones acerca de la naturaleza de los fenómenos en estudio y las relaciones entre ellos. El pensamiento positivista estricto se ha puesto a prueba y pocos investigadores se apegan a los principios del positivismo puro. Los pospositivistas aún creen en la realidad y buscan comprenderla, pero reconocen la imposibilidad de la objetividad total. Sin embargo, consideran la objetividad como un objetivo y buscan tener los menores sesgos posibles. Los pospositivistas también consideran las barreras para conocer la realidad con certeza, por lo que buscan evidencia probabilística; es decir, aprender cuál es el estado real probable de un fenómeno. Esta posición positivista modificada es una fuerza dominante en la investigación en enfermería. En favor de la sencillez, se referirá como positivismo. El paradigma constructivista El paradigma constructivista (a veces llamado paradigma naturalista) comenzó como una contracorriente al positivismo con pensadores como Weber y Kant. El paradigma constructivista es un gran sistema alternativo para conducir la investigación en enfermería. La tabla 1-1 compara cuatro suposiciones principales de los paradigmas positivista y constructivista. Para el investigador naturalista, la realidad no es una entidad fija sino una construcción de las personas que participan en la investigación; la realidad existe dentro de un contexto y hay muchas construcciones posibles. Los naturalistas asumen la posición del 49 relativismo: si hay múltiples interpretaciones de la realidad que existe en la mente de las personas, no hay un proceso por el cual pueda determinarse la verdad o falsedad final de las construcciones. El paradigma constructivista asume que el conocimiento se maximiza cuando la distancia entre el investigador y los participantes en el estudio se minimiza. Las voces e interpretaciones de los que están en estudio son cruciales para comprender el fenómeno de interés y las interacciones subjetivas son la mejor forma de acceder a ellas. Los hallazgos de una investigación constructivista son producto de la interacción entre el investigador y los participantes. Paradigmas y métodos: investigación cuantitativa y cualitativa Los métodos de investigación son técnicas que los investigadores usan para estructurar un estudio y para reunir y analizar información relevante. Los dos paradigmas corresponden a diferentes métodos cuyo propósito es generar evidencia. Una distinción metodológica clave es entre la investigación cuantitativa, que se vincula más con el positivismo, y la investigación cualitativa, que se relaciona con la indagación constructivista, aunque los positivistas a veces realizan estudios cualitativos y los investigadores constructivistas en ocasiones recolectan datos cuantitativos. Esta sección presenta las generalidades de los métodos relacionados con los dos paradigmas alternativos. El método científico y la investigación cuantitativa El método científico positivista tradicional implica el uso de un conjunto de procedimientos ordenados para recolectar información. Por lo general, los investigadores cuantitativos se mueven de forma sistemática de la definición a la solución de un problema. Por sistemática se entiende que los investigadores avanzan por una serie de pasos, de acuerdo con un plan predeterminado. Los investigadores cuantitativos emplean métodos objetivos diseñados para controlar la situación que se investiga con la finalidad de minimizar los sesgos y maximizar la validez. Los investigadores cuantitativos recopilan evidencia empírica, evidencia originada en la realidad objetiva y recolectada de manera directa o indirecta mediante los sentidos, más que por creencias 50 personales o intuición. En un estudio cuantitativo, la evidencia se recopila de modo sistemático, con instrumentos formales para obtener la información necesaria. Por lo general (aunque no siempre), la información es cuantitativa; es decir, datos numéricos obtenidos con algún tipo de medición formal y que se someten a un análisis estadístico. Los investigadores cuantitativos se esfuerzan por ir más allá de los elementos específicos de una situación de investigación; la capacidad para generalizar los hallazgos de la investigación a individuos distintos a los que participaron en el estudio (conocida como generalizabilidad) es un objetivo importante. El método científico tradicional ha sido productivo para los investigadores en enfermería que estudian una gran variedad de preguntas. Sin embargo, existen limitaciones importantes. Por ejemplo, los investigadores cuantitativos deben enfrentar problemas de medición. Para estudiar un fenómeno, los científicos deben medirlo; es decir, asignar valores numéricos que expresen cantidad. Por ejemplo, si el fenómeno de interés fuera el estrés de los pacientes, los investigadores desearían valorar si el estrés es intenso o leve, o si es más intenso en ciertas condiciones o para ciertas personas. Los fenómenos fisiológicos como la presión sanguínea y la temperatura pueden medirse con exactitud y precisión, pero no puede decirse lo mismo de la mayoría de los fenómenos psicológicos, como el estrés o la adaptación. Otro problema es que la investigación en enfermería se enfoca en seres humanos, que son inherentemente complicados y diversos. El método científico tradicional casi siempre se enfoca en un conjunto pequeño de fenómenos (p. ej., aumento de peso, depresión) en un estudio. Las complejidades tienden a controlarse y, si es posible, se eliminan en lugar de estudiarse de manera directa; esta reducción del enfoque a veces dificulta la percepción. Por consiguiente, en ocasiones se acusa a la investigación cuantitativa con el paradigma positivista de una visión limitada que no permite capturar la totalidad de la experiencia humana. TIP Los estudiantes suelen considerar más intimidantes y difíciles los estudios cuantitativos que los cualitativos. Intente no preocuparse demasiado por la terminología al inicio: recuerde que cada estudio tiene una historia que contar, y la comprensión del punto principal de la historia es lo importante en un principio. 51 Métodos constructivistas e investigación cualitativa Los investigadores de corrientes constructivistas hacen énfasis en la complejidad inherente de los seres humanos, su capacidad para delinear y crear sus propias experiencias y la idea de que la verdad es un conjunto de realidades. Por consiguiente, los estudios de los constructivistas están muy enfocados en comprender la experiencia humana tal como se vive, mediante la recolección cuidadosa y el análisis de materiales cualitativos que son narrativos y subjetivos. Los investigadores que rechazan el método científico tradicional creen que su mayor limitación es que es reduccionista; es decir, que reduce la experiencia humana a solo unos cuantos conceptos en investigación, y los investigadores definen esos conceptos por anticipado en lugar de que surjan de las experiencias de los sujetos en estudio. Los investigadores constructivistas tienden a enfatizar los aspectos dinámicos, holísticos e individuales de la vida humana, e intentan capturar esos aspectos en su totalidad dentro del contexto de los individuos que los experimentan. Se usan procedimientos flexibles y cambiantes para capitalizar los hallazgos obtenidos durante el estudio, que casi siempre se realiza en contextos naturales. La recolección de datos y su análisis suelen transcurrir al mismo tiempo. Conforme los investigadores seleccionan la información, se obtienen conocimientos, surgen nuevas preguntas y se busca más evidencia para confirmar el conocimiento. Mediante un proceso inductivo (que va de lo específico a lo general), los investigadores integran la información para desarrollar una teoría o descripción que aclare los fenómenos en observación. Los estudios constructivistas aportan información rica y profunda que puede aclarar las diversas dimensiones (o temas) de un fenómeno complicado. Los hallazgos de la investigación cualitativa casi siempre derivan de experiencias de la vida real de personas con conocimiento de primera mano sobre un fenómeno. No obstante, el enfoque tiene varias limitaciones. Los seres humanos se utilizan de manera directa como el instrumento mediante el cual se obtiene información y los humanos son herramientas muy inteligentes, pero falibles. Otra posible limitación es la subjetividad de la indagación constructivista, que a veces genera preocupaciones acerca de la naturaleza idiosincrásica de las conclusiones. ¿Llegarían a conclusiones similares dos investigadores constructivistas que estudian el mismo fenómeno en instalaciones semejantes? La 52 situación se magnifica por el hecho de que la mayoría de los estudios constructivistas incluye un grupo pequeño de participantes. Por lo tanto, la generalizabilidad de los hallazgos de las investigaciones constructivistas es un problema potencial. TIP Por lo general, los investigadores no discuten, ni siquiera mencionan, el paradigma subyacente de sus estudios en sus reportes. El paradigma proporciona un contexto sin ser señalado de manera explícita. Múltiples paradigmas y la investigación en enfermería Los paradigmas son lentes que ayudan a mejorar el enfoque de los investigadores sobre los fenómenos de interés, no anteojeras que limitan la curiosidad. Se cree que el surgimiento de paradigmas alternativos para estudiar los problemas de enfermería es una tendencia deseable que puede maximizar la amplitud de la nueva evidencia para la práctica. El conocimiento de enfermería sería escaso si no fuera un conjunto rico de métodos, que por lo regular son complementarios en sus fortalezas y limitaciones. Ya se subrayaron las diferencias entre los dos paradigmas y los métodos relacionados, por lo que sería fácil comprender las diferencias. Sin embargo, es igual de importante señalar que los dos paradigmas tienen muchas características en común, algunas de las cuales se mencionan aquí: Objetivos finales. El objetivo final de la investigación sistematizada, al margen del paradigma, es responder preguntas y resolver problemas. Tanto los investigadores cuantitativos como los cualitativos buscan la verdad con respecto a los fenómenos en los que están interesados. Evidencia externa. El término empirismo suele relacionarse con el método científico, pero los investigadores de ambas tradiciones recolectan y analizan evidencia obtenida de manera empírica; es decir, mediante sus sentidos. Dependencia de la cooperación humana. La cooperación humana es esencial para la investigación cuantitativa y cualitativa. Para comprender las características y experiencias de las personas, los investigadores deben alentar a los individuos a participar en el 53 estudio y hablar con franqueza. Restricciones éticas. La investigación con seres humanos está guiada por principios éticos que a veces interfieren con los objetivos de la investigación. Los dilemas éticos a menudo confrontan a los investigadores, sin importar cuáles sean los paradigmas o métodos. Falibilidad. Todos los estudios tienen limitaciones. Toda pregunta de investigación puede abordarse de distintas formas y siempre existen soluciones intermedias. Con frecuencia las limitaciones financieras son un problema, pero existen limitaciones incluso en la investigación con patrocinio apropiado. Esto significa que ningún estudio individual puede responder de manera definitiva una pregunta de investigación. La falibilidad de cualquier estudio individual hace importante comprender y criticar los métodos de los investigadores cuando evalúan la calidad de la evidencia. Por lo tanto, a pesar de las diferencias filosóficas y metodológicas, los investigadores que usan el método científico tradicional o métodos constructivistas comparten objetivos básicos y enfrentan muchas dificultades similares. La selección de un método apropiado depende no solo de la filosofía y visión del mundo de los investigadores, también de la pregunta de la investigación. Si un investigador pregunta “¿cuáles son los efectos de la crioterapia en la náusea y la mucositis bucal en pacientes que reciben quimioterapia?”, necesita examinar los efectos mediante una valoración cuantitativa cuidadosa de los pacientes. Por otro lado, si el investigador pregunta “¿cuál es el proceso por el que los padres aprenden a enfrentar la muerte de un hijo?”, tendría dificultades para cuantificar ese proceso. Las visiones personales del mundo de los investigadores ayudan a delinear sus preguntas. Al leer sobre los paradigmas alternativos es probable que usted se sienta más atraído por uno de los dos paradigmas, el que corresponde mejor a su visión del mundo. Sin embargo, es importante aprender y valorar ambas estrategias para la indagación disciplinada y reconocer sus fortalezas y debilidades respectivas. TIP CÓMO SABER ¿Cómo puede saberse si un estudio es cuantitativo o cualitativo? Conforme avance en este libro, debe ser capaz de identificar la mayoría de los estudios como cuantitativos o cualitativos con base solo en el título o en los términos contenidos en el resumen al principio de un artículo. No obstante, en este punto quizá sea más fácil distinguir los dos 54 tipos de estudios de acuerdo con la cantidad de números que aparecen en el artículo, sobre todo en las tablas. Los estudios cuantitativos por lo general tienen varias tablas con números e información estadística. Es posible que los estudios cualitativos no tengan tablas con información cuantitativa o que solo incluyan una tabla numérica que describa las características de los participantes (p. ej., el porcentaje de hombres o mujeres). Los estudios cualitativos suelen tener “tablas de texto” o diagramas y figuras que ilustran procesos inferidos a partir de la información narrativa reunida. LOS PROPÓSITOS DE LA INVESTIGACIÓN EN ENFERMERÍA ¿Por qué realizan investigación los profesionales de enfermería? Se han diseñado varios sistemas distintos para clasificar diferentes objetivos de investigación. Se describen dos de estos sistemas de clasificación, no porque sea importante para usted clasificar un estudio con base en uno u otro propósito, sino porque esto ayuda a ilustrar la amplia variedad de preguntas que han intrigado al personal de enfermería y a demostrar diferencias entre la investigación cuantitativa y la cualitativa. TIP A veces se distingue entre la investigación básica y la aplicada. La investigación básica es apropiada para descubrir principios generales del comportamiento humano y procesos biofisiológicos. La investigación aplicada se diseña para examinar cómo pueden usarse estos principios para resolver problemas en la práctica de la enfermería. Investigación para alcanzar diversos niveles de explicación Una manera de clasificar los objetivos de la investigación es por el grado en que los estudios se diseñan para proporcionar explicaciones. Una distinción fundamental muy relevante en la investigación cuantitativa es entre estudios cuyo objetivo principal es describir fenómenos y los estudios exploratorios; es decir, los diseñados para descubrir las causas subyacentes de los fenómenos. 55 En un marco descriptivo/exploratorio, los objetivos específicos de la investigación en enfermería incluyen identificación, descripción, exploración, explicación y predicción/control. Cuando los investigadores exponen su objetivo, por lo regular usan estos términos (p. ej., “El objetivo de este estudio fue explorar...”). Para cada objetivo se presentan varios tipos de preguntas, algunas más susceptibles a la indagación cuantitativa que a la cualitativa y viceversa. Identificación y descripción En la investigación cuantitativa, los investigadores comienzan con un fenómeno que ya se estudió o definió antes. En contraste, los investigadores cualitativos en ocasiones estudian fenómenos sobre los que se sabe poco. En algunos casos, se sabe tan poco que el fenómeno aún tiene que identificarse con claridad o nombrarse, o está mal definido. La naturaleza exploratoria profunda de la investigación cualitativa es adecuada para responder preguntas como “¿Qué es este fenómeno?” y “¿Cómo se llama?” (tabla 1-2). Ejemplo cuantitativo de descripción Palese y sus colaboradores (2015) condujeron un estudio para describir el tiempo de cicatrización promedio de las úlceras por presión en etapa II. Encontraron que tardaban alrededor de 23 días para alcanzar la reepitelización completa. TABLA 1-2 Propósitos del continuo descriptivo-explicativo y tipos de preguntas de investigación para la investigación cuantitativa y cualitativa Propósito Tipos de preguntas: investigación cuantitativa ¿Cuál es el fenómeno? ¿Cómo se llama? Identificación Descripción Tipos de preguntas: investigación cualitativa ¿Qué tan frecuente es el fenómeno? ¿Con qué frecuencia ocurre? 56 ¿Cuáles son las dimensiones o características del fenómeno? ¿Cuál es la importancia del fenómeno? Exploración ¿Qué factores se relacionan con el fenómeno? ¿Cuáles son los antecedentes del fenómeno? ¿Cuál es la naturaleza integral del fenómeno? ¿Qué sucede en realidad? ¿Cuál es el proceso por el que evoluciona el fenómeno? Si el fenómeno X ocurre, ¿seguirá el Predicción y control fenómeno Y? ¿Es posible prevenir o controlar el fenómeno? Explicación ¿Cuál es la causa subyacente del fenómeno? ¿La teoría explica el fenómeno? ¿Por qué existe el fenómeno? ¿Qué significa el fenómeno? ¿Cómo ocurrió el fenómeno? Ejemplo cualitativo de identificación Stapleton y Pattison (2015) estudiaron la experiencia de hombres con cáncer avanzado en relación con sus percepciones de la masculinidad. Mediante entrevistas detalladas, los investigadores identificaron un nuevo aspecto de la masculinidad al que llamaron ambición frustrada. La descripción de los fenómenos es un objetivo importante de la investigación. En estudios descriptivos, los investigadores cuentan, delinean y clasifican. Los investigadores en enfermería han detallado una amplia variedad de fenómenos, como el estrés de los pacientes, las creencias sobre la salud, etcétera. La descripción cuantitativa se enfoca en la prevalencia, el tamaño y los aspectos mensurables de los fenómenos. Los investigadores cualitativos describen la naturaleza, las dimensiones y la prominencia de los fenómenos, como se muestra en la tabla 1-2. Exploración La investigación exploratoria comienza con un fenómeno de interés; 57 pero en lugar de simplemente describirlo, los investigadores exploratorios examinan la naturaleza del fenómeno, la forma en que se manifiesta y otros factores con los que se relaciona, incluso factores que podrían causarlo. Por ejemplo, un estudio cuantitativo descriptivo del estrés preoperatorio de los pacientes podría documentar cuánto estrés experimentan los sujetos. Un estudio exploratorio podría preguntar: ¿Qué factores aumentan o disminuyen el estrés del paciente? Pueden usarse métodos cualitativos para explorar la naturaleza de los fenómenos poco comprendidos y para aclarar las maneras en las que se expresa un fenómeno. Ejemplo cualitativo de exploración Wazneh y sus colaboradores (2016) usaron entrevistas detalladas para explorar el grado en el que el contenido de una mochila especial llamada “Paquete para animarse” (“Venturing Out Pack”) cubría las necesidades prácticas, psicosociales y de información de los adultos jóvenes en tratamiento por cáncer. Explicación La investigación exploratoria busca comprender las causas subyacentes o la naturaleza completa de un fenómeno. En la investigación cuantitativa se usan las teorías o hallazgos previos de manera deductiva para generar explicaciones hipotéticas que se someten a prueba estadística. Los investigadores cualitativos buscan explicaciones acerca de cómo o por qué ocurre un fenómeno, o qué significa el fenómeno como base para desarrollar una teoría fundamentada en evidencia vasta, profunda y empírica. Ejemplo cuantitativo de explicación Golfenshtein y Drach-Zahavy (2015) pusieron a prueba un modelo teórico para explicar el papel de las atribuciones de los pacientes en el control de las emociones de los profesionales de enfermería en pabellones pediátricos de los hospitales. Predicción y control Muchos fenómenos son imposibles de explicar, pero con frecuencia es factible predecirlos o controlarlos de acuerdo con la evidencia de la 58 investigación. Por ejemplo, la investigación mostró que la incidencia de síndrome de Down en los bebés aumenta con la edad materna. Puede predecirse que una mujer de 40 años de edad tiene un mayor riesgo de dar a luz un hijo con síndrome de Down que una de 25 años. Es posible influir en el resultado mediante la educación de las mujeres sobre los riesgos y ofreciendo la amniocentesis a mujeres mayores de 35 años de edad. La capacidad para predecir y controlar en este ejemplo no depende de una explicación de lo que causa el mayor riesgo en las mujeres de más edad. En muchos estudios cuantitativos, la predicción y el control son los objetivos clave. Aunque los estudios explicativos son influyentes, los estudios cuyo propósito es la predicción y el control también son cruciales para la práctica basada en evidencia. Ejemplo cuantitativo de predicción Jain y sus colaboradores (2016) condujeron un estudio para valorar si las calificaciones de una medición de daño neurológico al ingresar al hospital entre los pacientes con ataque isquémico transitorio o enfermedad vascular cerebral predicen sus resultados funcionales, como el estado ambulatorio al salir del hospital. Propósitos de la investigación vinculados con la práctica basada en evidencia Surgió otro sistema para clasificar los estudios como un esfuerzo para comunicar los propósitos relacionados con la PBE (p. ej., DiCenso et al., 2005; Guyatt et al., 2008; Melnyk y Fineout-Overholt, 2015). La tabla 1-3 identifica algunas de las preguntas relevantes para cada propósito de PBE y ofrece un ejemplo real de investigación en enfermería. En este esquema de clasificación, los diversos propósitos pueden examinarse mejor con la investigación cuantitativa, excepto por la última categoría (significado/proceso), que requiere investigación cualitativa. TABLA 1-3 Propósitos de la investigación relacionados con la práctica basada en evidencia (PBE) y preguntas clave de la investigación Pregunta clave de 59 Ejemplo de Propósito de la PBE Pregunta clave de investigación en la investigación enfermería ¿Qué tratamiento o intervención tendrá mejores resultados de salud o prevendrá Tratamiento/intervención un resultado de salud adverso? Diagnóstico/valoración Pronóstico Kwon y cols. (2016) evaluaron los efectos de una muñequera de acupresión para la náusea y el vómito posoperatorios entre pacientes sometidos a tiroidectomía. ¿Qué prueba o procedimiento de valoración indicará diagnósticos o valoraciones exactos de las condiciones y resultados críticos del paciente? Sitzer (2016) desarrolló y evaluó un cuestionario automatizado de autovaloración para evaluar el riesgo de caídas entre los pacientes hospitalizados. ¿La exposición a una enfermedad o un problema de salud aumenta el riesgo de consecuencias adversas? Storey y Von Ah (2015) estudiaron la prevalencia y el efecto de la hiperglucemia en pacientes con leucemia hospitalizados, en términos de resultados como neutropenia, infección y duración de la estancia en el hospital. ¿Qué factores causan o contribuyen al riesgo de un problema de salud o enfermedad? Hagerty y cols. (2015) realizaron un estudio para identificar los factores de riesgo para infecciones urinarias relacionadas con catéter en 60 hemorragia subaracnoidea. Los factores de riesgo examinados incluyeron valores de glucemia, edad y grado de anemia que ameritara transfusión. Significado/proceso ¿Cuál es el significado de las experiencias y cuál es el proceso por el que se desarrollan? Pieters (2016) estudió la adaptación como un proceso multidimensional entre mujeres de edad avanzada que poco antes habían completado el tratamiento para cáncer de mama en etapa temprana. Terapia, tratamiento o intervención Los estudios con un propósito de terapia buscan identificar tratamientos efectivos para mejorar o prevenir problemas de salud. Tales estudios varían desde evaluaciones de tratamientos muy específicos (p. ej., comparar dos tipos de cobertores de enfriamiento para pacientes febriles) hasta intervenciones complejas de múltiples componentes diseñadas para efectuar cambios conductuales (p. ej., intervenciones para suspender el tabaquismo conducidas por el profesional de enfermería). La investigación con intervención tiene un papel crucial en la práctica basada en evidencia. Diagnóstico y valoración Muchos estudios de enfermería se refieren al desarrollo y prueba rigurosos de herramientas formales para detectar, diagnosticar y valorar pacientes, y para medir los resultados clínicos. Las herramientas de alta calidad con exactitud documentada son esenciales para la práctica clínica y la investigación. Pronóstico 61 Pronóstico Los estudios de pronóstico examinan las consecuencias de una enfermedad o problema de salud, exploran factores que pueden modificar el pronóstico y examinan cuándo (y para qué tipos de personas) son más probables las consecuencias. Tales estudios facilitan el desarrollo de los planes de atención de largo plazo para los pacientes. También aportan información valiosa para guiar a los pacientes con el fin de que hagan elecciones de estilo de vida provechosas o para que se mantengan vigilantes ante los síntomas clave. Etiología (causa) y daño Es difícil prevenir el daño o tratar problemas de salud si no se sabe qué los causa. Por ejemplo, no habría programas para eliminar el tabaquismo si la investigación no hubiera aportado evidencia firme de que fumar cigarrillos causa muchos problemas de salud o contribuye a ellos. Por lo tanto, la identificación de los factores y exposiciones que influyen o causan la enfermedad, mortalidad o morbilidad es un propósito importante de muchos estudios. Significado y procesos Muchas actividades de atención a la salud (p. ej., motivar a las personas a cumplir los tratamientos, proporcionar asesoría sensible a los pacientes, diseñar intervenciones atractivas) pueden mejorarse mucho si se comprenden las perspectivas de los pacientes. La investigación que aporta evidencia sobre lo que la salud y la enfermedad significan para los pacientes, las barreras que enfrentan para aplicar prácticas de salud positivas y los procesos que experimentan al transitar por una crisis de atención a la salud es importante para la práctica de la enfermería basada en evidencia. TIP La mayoría de los propósitos relacionados con la PBE (excepto el diagnóstico y el significado) implica investigación de la exploración de causas. Por ejemplo, la investigación de las intervenciones se enfoca en saber si una intervención produce mejoras en los resultados clave. La investigación del pronóstico examina si una enfermedad o trastorno en la salud tiene consecuencias adversas. La investigación de la etiología busca 62 ASISTENCIA PARA LOS CONSUMIDORES DE LA INVESTIGACIÓN EN ENFERMERÍA Esperamos que este libro le ayude a desarrollar habilidades que le permitan leer, examinar y usar estudios de enfermería, y a comprender la investigación en enfermería. En cada capítulo se presenta información de los métodos usados por investigadores en enfermería y se proporcionan varias formas de guías. Primero, ofrecemos tips acerca de lo que puede esperar en artículos de investigación reales, identificados por el icono . También hay tips especiales acerca de “cómo saber” (identificados con el icono ) que ayudan en ciertos aspectos de los artículos de investigación que pudieran ser confusos. Segundo, se incluyen lineamientos para analizar varios aspectos de un estudio. Las preguntas guía del recuadro 1-1 están diseñadas para ayudarle a usar la información de este capítulo en una valoración preliminar de un artículo de investigación. Y tercero, se ofrecen oportunidades para aplicar sus nuevas habilidades. Los ejercicios de pensamiento crítico al final de cada capítulo lo guían en el examen de ejemplos reales de investigación en estudios cuantitativos y cualitativos. Estas actividades también lo impulsan a pensar en la manera en que los hallazgos de estos estudios pueden usarse en la práctica de enfermería. Las respuestas a muchas de estas preguntas están están en inglés en el sitio web . Varios de estos ejemplos se incluyen en la sección Critical Thinking Activity en el sitio web . Algunos de los artículos de investigación se encuentran en los apéndices. Los artículos de investigación completos de los estudios identificados con ** en la lista de referencias de cada capítulo están disponibles en inglés en el sitio web . Recuadro 1-1 Preguntas para la revisión preliminar de un reporte de investigación 1. ¿Qué tan relevante es el problema de investigación para la práctica de enfermería real? 2. ¿El estudio fue cuantitativo o cualitativo? 3. ¿Cuál fue el propósito (o propósitos) subyacente(s) del estudio: identificación, descripción, exploración, explicación o 63 predicción/control? ¿El propósito corresponde a un enfoque de PBE tal como terapia/tratamiento, diagnóstico, pronóstico, etiología/daño o significado? 4. ¿Cuáles podrían ser algunas implicaciones clínicas de esta investigación? ¿Para qué tipo de personas e instituciones es más relevante la investigación? Si los hallazgos fueron exactos, ¿cómo podría usar los resultados de este estudio en mi práctica clínica? EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO Esta sección presenta ejemplos de estudios con distintos objetivos. Lea los resúmenes de investigación de los ejemplos 1 y 2, y luego responda las preguntas de pensamiento crítico que siguen; de ser necesario, consulte los reportes de investigación completos. Las preguntas de pensamiento crítico para los ejemplos 3 y 4 se basan en los estudios que aparecen íntegros en los apéndices A y B de este libro. TIP Los ejemplos en inglés 1 y 2 también se encuentran en la sección Critical Thinking Activity de , donde usted puede registrar, imprimir y enviar por correo electrónico sus respuestas a su instructor. Los comentarios en inglés de las autoras a las preguntas de los ejemplos 3 y 4 están en la sección Student Resources de . EJEMPLO 1: INVESTIGACIÓN CUANTITATIVA Estudio. Resultados psicológicos de la intervención con un video después de un ataque sexual: un estudio aleatorizado (Miller et al., 2015) Objetivo. El objetivo del estudio fue evaluar si una intervención basada en un breve video tenía efectos positivos en la salud mental de víctimas de ataque sexual. La intervención proporcionaba educación psicológica e información de estrategias para enfrentar la situación a las sobrevivientes durante la exploración de enfermería por un ataque sexual. Métodos de estudio. Las víctimas femeninas de ataque sexual que se 64 ataque sexual. La intervención proporcionaba educación psicológica e información de estrategias para enfrentar la situación a las sobrevivientes durante la exploración de enfermería por un ataque sexual. Métodos de estudio. Las víctimas femeninas de ataque sexual que se sometieron a exámenes forenses en las 72 horas siguientes al ataque se asignaron a dos grupos: (1) las que recibieron atención estándar más la intervención del video y (2) las que recibieron la atención usual sin el video. Un total de 164 mujeres participaron en el estudio. Completaron valoraciones de salud mental 2 semanas y 2 meses después del examen forense. Hallazgos clave. Los investigadores encontraron que las mujeres de ambos grupos tenían menor ansiedad en las valoraciones de seguimiento. Sin embargo, en ambos puntos de seguimiento, las mujeres del grupo de intervención especial tenían niveles significativamente menores de síntomas de ansiedad que las del grupo de atención estándar. Conclusiones. Miller y sus colaboradores (2015) concluyeron que los profesionales de enfermería forense tienen la oportunidad de intervenir de inmediato después de un ataque sexual mediante una intervención efectiva y de bajo costo. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 1-1 sobre este estudio. 2. Considere también las siguientes preguntas enfocadas, que podrían ayudarle a valorar aspectos del mérito del estudio: a. ¿Por qué cree que los niveles de ansiedad mejoraron con el tiempo en los grupos de intervención y con atención estándar? b. ¿Se podría haber realizado este estudio como un estudio cualitativo? ¿Por qué sí o por qué no? EJEMPLO 2: INVESTIGACIÓN CUALITATIVA Estudio. La experiencia de dolor en pacientes hospitalizados con enfermedad intestinal inflamatoria: un estudio fenomenológico (Bernhofer et al., 2015). Objetivo. El objetivo de este estudio era comprender la experiencia única del dolor en pacientes hospitalizados con diagnóstico de ingreso de enfermedad intestinal inflamatoria (EII). Métodos de estudio. Se incluyeron 16 hombres y mujeres con antecedentes diversos (p. ej., edad, duración del diagnóstico de EII) de dos unidades de atención colorrectal de un centro médico académico grande. 65 Hallazgos clave. Surgieron cinco temas recurrentes en el análisis de los datos de la entrevista: (1) sensación de descrédito e incomprensión, (2) deseo de desvanecer el estigma, (3) frustración con el dolor constante, (4) necesidad de conocimiento y comprensión por parte del cuidador, y (5) los profesionales de enfermería como conexión entre el paciente y los médicos. Este es un extracto de una entrevista que ilustra el segundo tema sobre el estigma: “En muchas ocasiones me han juzgado, piensan que solo busco algún tipo de medicamento para el dolor, cuando lo que en realidad busco es sentirme mejor, hacer que el dolor desaparezca” (p. 5). Conclusiones. Los investigadores concluyeron que los profesionales de enfermería que atienden a pacientes hospitalizados con EII podrían brindar un mejor tratamiento para el dolor si comprendieran los problemas resaltados en estos temas. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 1-1 sobre este estudio. 2. Considere también las siguientes preguntas enfocadas, que podrían ayudarle a valorar aspectos del mérito del estudio: a. ¿Por qué cree que los investigadores grabaron el audio y transcribieron las entrevistas detalladas con los participantes en el estudio? b. ¿Cree que hubiera sido apropiado que los investigadores realizaran este estudio con métodos de investigación cuantitativos? ¿Por qué sí o por qué no? EJEMPLO 3: INVESTIGACIÓN CUANTITATIVA EN EL APÉNDICE A • Lea el resumen y la introducción del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 1-1 sobre este estudio. 2. Considere también las siguientes preguntas enfocadas: a. ¿Podría haberse realizado este estudio con enfoque cualitativo? ¿Por qué sí o por qué no? b. ¿Quién proporcionó el apoyo financiero para esta investigación? (Esta información aparece en la primera página del reporte.) 66 a. ¿Podría haberse realizado este estudio con enfoque cualitativo? ¿Por qué sí o por qué no? b. ¿Quién proporcionó el apoyo financiero para esta investigación? (Esta información aparece en la primera página del reporte.) EJEMPLO 4: INVESTIGACIÓN CUALITATIVA EN EL APÉNDICE B • Lea el resumen y la introducción del estudio de Beck y Watson (2010) (“Parto posterior a un parto traumático”) en el apéndice B de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 1-1 sobre este estudio. 2. Considere también las siguientes preguntas enfocadas: a. ¿Qué brecha existía en la investigación que el diseño del estudio buscaba llenar? b. ¿El estudio de Beck y Watson se condujo en el marco del paradigma positivista o en el constructivista? Justifique su elección. ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre The History of Nursing Research. Respuestas a los ejercicios de pensamiento crítico para los ejemplos 3 y 4. Recursos en Internet con sitios web útiles para el capítulo 1. Un artículo de investigación de una revista de Wolters Kluwer: el estudio descrito como ejemplo 1 en las pp. 15 y 16. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. 67 La investigación en enfermería es la indagación sistemática realizada para generar evidencia sobre problemas importantes para el profesional de enfermería. Los profesionales de enfermería en varias instalaciones están adoptando una práctica basada en evidencia (PBE) que incorpora hallazgos de la investigación en las decisiones e interacciones con los pacientes. El conocimiento de la investigación en enfermería mejora la práctica profesional del personal de enfermería, incluidos los consumidores de la investigación (que leen y evalúan los estudios) y los productores de investigación (quienes diseñan y llevan a cabo los estudios). La investigación en enfermería comenzó con Florence Nightingale, pero se desarrolló lentamente hasta su marcada aceleración en la década de 1950. Desde la década de 1980, el enfoque se ha puesto en la investigación en enfermería clínica; es decir, en problemas relacionados con la práctica clínica. El National Institute of Nursing Research (NINR), establecido como parte de los U.S. National Institutes of Health en 1993, afirma la magnitud de la investigación en enfermería en Estados Unidos. Es probable que en el futuro, el énfasis de la investigación en enfermería incluya proyectos de PBE, replicaciones de investigación, integración de investigación mediante revisiones sistemáticas, mayores esfuerzos de divulgación, mayor enfoque en las disparidades de salud y un enfoque en la relevancia clínica de los resultados de la investigación. La investigación sistematizada contrasta con otras fuentes de conocimiento para la práctica de la enfermería, como la tradición, la autoridad, la experiencia personal y el proceso de prueba y error. La investigación sistematizada en enfermería se conduce sobre todo dentro de dos paradigmas amplios (visiones del mundo con suposiciones subyacentes sobre la realidad): el paradigma positivista y el paradigma constructivista. En el paradigma positivista se asume que existe una realidad 68 objetiva y que los fenómenos naturales son regulares y ordenados. La suposición relacionada del determinismo se refiere a la creencia de que los fenómenos tienen causas y no son aleatorios. En el paradigma constructivista se asume que la realidad no es una entidad fija, sino una construcción de las mentes humanas y, por lo tanto, la “verdad” es un compuesto de múltiples construcciones de la realidad. La investigación cuantitativa (relacionada con el positivismo) implica recolección y análisis de información numérica. Por lo general, la investigación cuantitativa se conduce según el método científico tradicional, que es sistemático y controlado. Los investigadores cuantitativos basan sus hallazgos en la evidencia empírica (evidencia recopilada por medio de los sentidos humanos) y buscan la generalizabilidad que trasciende una institución o situación individuales. Los investigadores constructivistas hacen énfasis en la comprensión de la experiencia humana tal como se vive, mediante la recolección y el análisis de materiales narrativos subjetivos, para lo que usan procedimientos flexibles; este paradigma se relaciona con la investigación cualitativa. Una diferencia fundamental de relevancia particular en la investigación cuantitativa radica entre los estudios cuya intención principal es describir fenómenos y aquellos exploratorios; es decir, que se diseñaron para aclarar las causas de los fenómenos. Los propósitos específicos del continuo de des cripción/explicación incluyen identificación, descripción, exploración, explicación y predicción/control. Muchos estudios de enfermería también pueden clasificarse en términos de un objetivo relacionado con la PBE: terapia/tratamiento/intervención, diagnóstico y valoración, pronóstico, etiología y daño, y significado y proceso. R E F E R E N C I A S PA R A E L C A P Í T U L O 1 Bernhofer, E., Masina, V., Sorrell, J., & Modic, M. (2015). The pain experience of patients hospitalized with inflammatory bowel disease: A phenomenological study. Gastroenterology Nursing. Publicación 69 R E F E R E N C I A S PA R A E L C A P Í T U L O 1 Bernhofer, E., Masina, V., Sorrell, J., & Modic, M. (2015). The pain experience of patients hospitalized with inflammatory bowel disease: A phenomenological study. Gastroenterology Nursing. Publicación anticipada en línea. *Campbell-Yeo, M., Johnston, C., Benoit, B., Latimer, M., Vincer, M., Walker, C., . . . Caddell, K. (2013). Trial of repeated analgesia with kangaroo mother care (TRAKC trial). BMC Pediatrics, 13, 182. Chiaranai, C. (2016). The lived experience of patients receiving hemodialysis treatment for end-stage renal disease: A qualitative study. The Journal of Nursing Research, 24, 101–108. *Cong, X., Ludington-Hoe, S., McCain, G., & Fu, P. (2009). Kangaroo care modifies preterm infant heart rate variability in response to heel stick pain: Pilot study. Early Human Development, 85, 561–567. Cong, X., Ludington-Hoe, S., & Walsh, S. (2011). Randomized crossover trial of kangaroo care to reduce biobehavioral pain responses in preterm infants: A pilot study. Biological Research for Nursing, 13, 204–216. DiCenso, A., Guyatt, G., & Ciliska, D. (2005). Evidence-based nursing: A guide to clinical practice. St. Louis, MO: Elsevier Mosby. *Gilbert, R., Salanti, G., Harden, M., & See, S. (2005). Infant sleeping position and the sudden infant death syndrome: Systematic review of observational studies and historical review of recommendations from 1940 to 2002. International Journal of Epidemiology, 34, 874–887. Golfenshtein, N., & Drach-Zahavy, A. (2015). An attribution theory perspective on emotional labour in nurse-patient encounters: A nested cross-sectional study in paediatric settings. Journal of Advanced Nursing, 71, 1123–1134. Guyatt, G., Rennie, D., Meade, M., & Cook, D. (2008). Users’ guides to the medical literature: Essentials of evidence-based clinical practice (2nd ed.). New York, NY: McGraw Hill. Hagerty, T., Kertesz, L., Schmidt, J., Agarwal, S., Claassen, J., Mayer, S., . . . Shang, J. (2015). Risk factors for catheter-associated uri-nary tract infections in critically ill patients with subarachnoid hemorrhage. Journal of Neuroscience Nursing, 47, 51–54. Hanrahan, K., Wagner, M., Matthews, G., Stewart, S., Dawson, C., Greiner, J., . . . Williamson, A. (2015). Sacred cow gone to pasture: A systematic evaluation and integration of evidence-based practice. Worldviews on Evidence-Based Nursing, 12, 3–11. *Holditch-Davis, D., White-Traut, R., Levy, J., O’Shea, T., Geraldo, V., & David, R. (2014). Maternally administered interventions for preterm infants in the NICU: Effects on maternal psychological distress and 70 after stroke. Journal of Cardiovascular Nursing, 31, 69–72. Kwon, J. H., Shin, Y., & Juon, H. (2016). Effects of Nei-Guan (P6) acupressure wristband: On nausea, vomiting, and retching in women after thyroidectomy. Cancer Nursing, 39, 61–66. *Lowson, K., Offer, C., Watson, J., McGuire, B., & Renfrew, M. (2015). The economic benefits of increasing kangaroo skin-to-skin care and breastfeeding in neonatal units: Analysis of a pragmatic intervention in clinical practice. International Breastfeeding Journal, 10, 11. Ludington-Hoe, S. M. (2011). Thirty years of Kangaroo Care science and practice. Neonatal Network, 30, 357–362. Melnyk, B. M., & Fineout-Overholt, E. (2015). Evidence-based practice in nursing & healthcare: A guide to best practice (3rd ed.). Philadelphia, PA: Lippincott Williams & Wilkins. **Miller, K., Cranston, C., Davis, J., Newman, E., & Resnick, H. (2015). Psychological outcomes after a sexual assault video intervention: A randomized trial. Journal of Forensic Nursing, 11, 129–136. *Moore, E., Anderson, G., Bergman, N., & Dowswell, T. (2012). Early skinto-skin contact for mothers and their healthy newborn infants. Cochrane Database of Systematic Reviews, (5), CD003519. Oakley-Girvan, I., Londono, C., Canchola, A., & Watkins Davis, S. (2016). Text messaging may improve abnormal mammogram follow-up in Latinas. Oncology Nursing Forum, 43, 36–43. Palese, A., Luisa, S., Ilenia, P., Laquintana, D., Stinco, G., & Di Giulio, P. (2015). What is the healing time of stage II pressure ulcers? Findings from a secondary analysis. Advances in Skin & Wound Care, 28, 69–75. Pieters, H. C. (2016). “I’m still here”: Resilience among older survivors of breast cancer. Cancer Nursing, 39, E20–E28. Sitzer, V. (2016). Development of an automated self-assessment of Fall Risk Questionnaire for hospitalized patients. Journal of Nursing Care Quality, 31, 46–53. Spock, B. (1979). Baby and child care. New York, NY: Dutton. Stapleton, S., & Pattison, N. (2015). The lived experience of men with advanced cancer in relation to their perceptions of masculinity: A qualitative phenomenological study. Journal of Clinical Nursing, 24, 1069–1078. Storey, S., & Von Ah, D. (2015). Prevalence and impact of hyperglycemia on hospitalized leukemia patients. European Journal of Oncology Nursing, 19, 13–17. Wazneh, L., Tsimicalis, A., & Loiselle, C. (2016). Young adults’ perceptions of the Venturing Out Pack program as a tangible cancer support service. Oncology Nursing Forum, 43, E34–E42. 71 19, 13–17. Wazneh, L., Tsimicalis, A., & Loiselle, C. (2016). Young adults’ perceptions of the Venturing Out Pack program as a tangible cancer support service. Oncology Nursing Forum, 43, E34–E42. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en para este capítulo. 72 Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Distinguir la utilización de la investigación y la práctica basada en evidencia (PBE), y discutir su estado actual en la enfermería. Identificar diversos recursos disponibles para facilitar la PBE en la práctica de enfermería. Listar varios modelos para implementar la práctica basada en evidencia. Discutir los cinco pasos principales para que los profesionales de enfermería individuales realicen un esfuerzo de práctica basada en evidencia. Identificar los componentes de una pregunta clínica bien redactada y ser capaz de contextualizar tal pregunta. Discutir las estrategias generales para realizar un proyecto de PBE en una organización. Distinguir la PBE y los esfuerzos de mejora de calidad (MC). Definir los nuevos términos del capítulo. Términos clave Cochrane Collaboration Jerarquía de evidencia Lineamientos para la práctica clínica Mejora de calidad (MC) Metaanálisis Metasíntesis Potencial de implementación 73 Práctica basada en evidencia Prueba piloto Revisión sistemática Uso de la investigación (UI) El aprendizaje de los métodos de investigación proporciona una base para la práctica basada en evidencia (PBE) en la enfermería. Este libro le ayudará a desarrollar las habilidades metodológicas para leer artículos de investigación y evaluar la evidencia de la investigación. Antes de profundizar en las técnicas metodológicas, se explican los aspectos clave de la PBE para ayudarle a comprender el papel clave que la investigación tiene ahora en la enfermería. ANTECEDENTES DE LA PRÁCTICA BASADA EN EVIDENCIA EN LA ENFERMERÍA Esta sección provee un contexto para comprender la práctica basada en evidencia en la enfermería y dos conceptos muy relacionados: uso de la investigación y traducción del conocimiento. Definición de la práctica basada en evidencia Pioneer Sackett y sus colaboradores (2000) definieron la práctica basada en evidencia como “la integración de la mejor evidencia de investigación con la experiencia clínica y los valores de los pacientes” (p. 1). La definición propuesta por Sigma Theta Tau International (2008) es la siguiente: “El proceso de toma de decisiones compartido entre el médico, el paciente y otras personas importantes para ellos con base en la evidencia de la investigación, las experiencias y preferencias del paciente, la pericia clínica y el conocimiento, y otras fuentes sólidas de información disponibles” (p. 57). Un elemento clave de la PBE es el esfuerzo para personalizar la “mejor evidencia” a las necesidades específicas del paciente dentro de un contexto clínico particular. Una característica básica de la PBE como estrategia para resolver problemas clínicos es que quita el énfasis de las decisiones basadas en la costumbre, la autoridad o en rituales. Un aspecto central de la PBE es la identificación de la mejor evidencia de investigación disponible 74 para integrarla con otros factores en la toma de decisiones clínicas. Los defensores de la PBE no minimizan la importancia de la experiencia clínica. Por el contrario, argumentan que la decisión basada en evidencia debe integrar la mejor evidencia de la investigación con la experiencia clínica, las preferencias del paciente y las circunstancias locales. La PBE implica esfuerzos para personalizar la evidencia con el fin de ajustarla a las necesidades de un paciente específico y una situación clínica particular. Como la evidencia de la investigación puede aportar información valiosa de la salud y la enfermedad humanas, los profesionales de enfermería deben ser estudiantes perennes y tener las habilidades para buscar, comprender y evaluar nueva información sobre la atención del paciente y con capacidad de adaptarse al cambio. Uso de la investigación El uso de la investigación (UI) es el empleo de los hallazgos de los estudios en una aplicación práctica no relacionada con la investigación original. En el UI, el énfasis se encuentra en la traducción del nuevo conocimiento en aplicaciones de la vida real. La PBE es un concepto más amplio que el UI porque integra los hallazgos de la investigación con otros factores, como se indicó. Además, mientras el UI comienza con la investigación misma (p. ej., ¿cómo puedo aplicar bien este nuevo conocimiento en mi institución clínica?), el punto inicial de la PBE casi siempre es una pregunta clínica (p. ej., ¿cuál dice la evidencia que es el mejor enfoque para resolver este problema clínico?). Durante la década de 1980, el UI surgió como un tema importante. En la educación, las escuelas de enfermería empezaron a incluir cursos de métodos de investigación para que los estudiantes se convirtieran en consumidores de investigación hábiles. En la investigación hubo un cambio en el enfoque hacia los problemas de la enfermería clínica. Aun así, las preocupaciones respecto al empleo limitado de la evidencia de la investigación en la práctica de la enfermería continuaron en aumento. La necesidad de reducir la brecha entre la investigación y la práctica condujo a proyectos formales de UI, incluido el pionero Conduct and Utilization of Research in Nursing (CURN) Project, un proyecto de 5 años realizado por la Michigan Nurses Association en los años 1970. Los objetivos del Proyecto CURN eran aumentar el 75 uso de los hallazgos de la investigación en la práctica diaria de la enfermería mediante la difusión de los hallazgos vigentes y la facilitación de los cambios organizacionales necesarios para implementar las innovaciones (Horsley et al., 1978). El equipo del Proyecto CURN concluyó que el UI por parte de los profesionales de enfermería era factible, pero solo si la investigación es relevante para la práctica y los resultados tienen una difusión amplia. Durante las décadas de 1980 y 1990, muchos hospitales y organizaciones realizaron proyectos de UI. Sin embargo, durante los años de 1990 la llamada al UI empezó a ser rebasada por el impulso de la práctica basada en evidencia. El movimiento de la práctica basada en evidencia Una clave fundamental del movimiento de la PBE es la Cochrane Collaboration, fundada en el Reino Unido con base en el trabajo del epidemiólogo británico Archie Cochrane. La publicación de un libro de Cochrane en la década de 1970 atrajo la atención a la escasez de evidencia sólida sobre los efectos de la atención a la salud. En dicho texto llamó a realizar esfuerzos para hacer resúmenes de investigación de las intervenciones disponibles para los profesionales de salud. Esto condujo al desarrollo del Cochrane Center en Oxford en 1993 y a la Cochrane Collaboration internacional, con centros ya establecidos en todo el mundo. Su objetivo es ayudar a los profesionales a tomar buenas decisiones mediante la preparación y la difusión de revisiones sistemáticas de los efectos de las intervenciones para atención a la salud. Casi al mismo tiempo que inició la Cochrane Collaboration, un grupo de la McMaster Medical School en Canadá desarrolló una estrategia de aprendizaje a la que llamaron medicina basada en evidencia. El movimiento de la medicina basada en evidencia, liderado por el doctor David Sackett, se extendió al uso de la mejor evidencia por parte de todos los profesionales de la salud. La PBE se considera un cambio mayor de paradigma en la educación y la práctica de la atención a la salud. Con la PBE, los clínicos expertos ya no pueden depender de un conjunto de información memorizada, sino que deben ser diestros en el acceso, la evaluación y el uso de nueva evidencia de la investigación. El movimiento de la PBE tiene defensores y críticos. Los que la apoyan argumentan que la PBE es un enfoque racional para 76 proporcionar la mejor atención posible con el empleo más rentable de los recursos. Los defensores también señalan que la PBE provee un marco para el aprendizaje autodirigido de por vida que es esencial en una era de rápidos avances clínicos y explosión de información. Los críticos se preocupan de que se exageren las ventajas de la PBE y de que los juicios clínicos individuales y las aportaciones de los pacientes estén devaluados. También les preocupa que se ponga atención insuficiente al papel de la investigación cualitativa. Aunque es necesario un escrutinio más cercano de la evolución de la PBE, lo más seguro es que los profesionales de la salud sigan la vía de la PBE en los próximos años. TIP Surgió un debate acerca de si el término práctica basada en evidencia debe sustituirse por práctica informada por evidencia (PIE). Los que abogan por un término diferente argumentan que el término “basada” sugiere una posición en la que los valores y preferencias del paciente no se consideran lo suficiente en las decisiones clínicas de la PBE (p. ej., Glasziou, 2005). No obstante, como señaló Melnyk (2014), todos los modelos actuales de PBE incorporan la pericia de los médicos y las preferencias de los pacientes. Ella argumenta que “el cambio de términos ahora… solo generará confusión en un momento crucial en el que se progresa para acelerar la PBE” (p. 348). Coincidimos y se usa el término PBE en todo este libro. Traducción del conocimiento El UI y la PBE implican actividades realizadas por profesionales de enfermería individuales o en un plano organizacional más alto (p. ej., administradores de enfermería), como se describe más adelante en este capítulo. Surgió un movimiento relacionado que se enfoca sobre todo en los esfuerzos del sistema completo para cubrir la brecha entre la generación y el uso del conocimiento. Traducción del conocimiento (TC) es un término que a menudo se relaciona con los esfuerzos para impulsar el cambio sistemático en la práctica clínica. La Organización Mundial de la Salud (OMS) (2005) definió la TC como “la síntesis, el intercambio y la aplicación del conocimiento que hacen las partes interesadas para acelerar los beneficios de la innovación global y local con el fin de fortalecer los sistemas de salud y mejorar la salud de las personas”. 77 TIP La ciencia de la traducción (o ciencia de implementación) es una nueva disciplina dedicada a promover la TC. En la enfermería, la necesidad de la investigación acerca de la traducción del conocimiento fue un estímulo importante para el desarrollo del grado de Doctor en Práctica de la Enfermería. Han surgido varias revistas dedicadas a este campo (p. ej., Implementation Science). PRÁCTICA DE ENFERMERÍA BASADA EN EVIDENCIA Antes de describir los procedimientos relacionados con la PBE en la enfermería se presenta una breve discusión de algunos aspectos importantes, incluidos la naturaleza de la “evidencia”, las dificultades para aplicar la PBE y los recursos disponibles para resolver algunas de esas dificultades. Tipos de evidencia y jerarquías de evidencia No existe un consenso acerca de lo que constituye la evidencia utilizable para la PBE, pero hay un acuerdo en que los hallazgos de la investigación rigurosa son primordiales. No obstante, subsiste cierto debate sobre lo que constituye la investigación “rigurosa” y lo que califica como “mejor” evidencia. En una fase temprana del movimiento de PBE había una marcada tendencia a favorecer la evidencia de un tipo de estudio llamado estudio controlado aleatorizado (ECA). Esta tendencia reflejó el enfoque inicial de la Cochrane Collaboration en la evidencia de la efectividad de los tratamientos en lugar de preguntas más amplias sobre la atención a la salud. Los ECA son muy adecuados para obtener conclusiones de los efectos de las intervenciones para la atención a la salud (véase el capítulo 9). La tendencia a la clasificación de los enfoques de investigación en términos de preguntas sobre tratamientos efectivos generó cierta resistencia a la PBE por parte de los profesionales de enfermería, que consideraban que se ignoraba la evidencia de estudios cualitativos y no controlados aleatorizados. Las posiciones sobre la contribución de varios tipos de evidencia son menos rígidas que antes. Sin embargo, muchas jerarquías de 78 evidencia publicadas clasifican las fuentes de evidencia con base en la fuerza de la evidencia que aportan y, en la mayoría de los casos, los controlados aleatorizados están cerca de lo más alto de estas jerarquías. Aquí se ofrece una jerarquía de evidencia modificada que parece similar a otras, pero es única porque ilustra que el ordenamiento de las estrategias productoras de evidencia depende del tipo de pregunta que se formule. La figura 2-1 muestra que las revisiones sistemáticas son el pináculo de la jerarquía (nivel I) porque la evidencia más fuerte proviene de las síntesis cuidadosas de múltiples estudios. El siguiente nivel más alto (nivel II) depende de la naturaleza del cuestionamiento. Para las preguntas sobre la eficacia de un tratamiento o intervención (¿qué funciona más para mejorar los resultados de salud?), los ECA individuales constituyen una evidencia de nivel II (las revisiones sistemáticas de múltiples ECA son el nivel I). Al descender por los “peldaños” de la jerarquía de la evidencia para preguntas acerca del tratamiento se obtiene evidencia menos confiable. Por ejemplo, el nivel III de evidencia proviene de un tipo de estudio llamado cuasi experimental. Los estudios cualitativos profundos están cerca del fondo en términos de evidencia sobre la efectividad de una intervención. (Los términos de la figura 2-1 se analizarán en capítulos posteriores.) 79 Figura 2-1 Jerarquía de evidencia: niveles de evidencia para distintas preguntas de práctica basada en evidencia. En contraste, para una pregunta de pronóstico, la evidencia de nivel II proviene de un solo estudio prospectivo de cohorte y el nivel III de un tipo de estudio llamado de casos y controles (el nivel I de evidencia deriva de la revisión sistemática de estudios de cohorte). Por lo tanto, contrario a lo que se implica a menudo en las discusiones respecto a jerarquías de evidencia, en realidad existen múltiples jerarquías. Si uno está interesado en la mejor evidencia para preguntas sobre significado, un ECA sería una fuente deficiente de evidencia, por ejemplo. La figura 2-1 ilustra estas múltiples jerarquías; la información a la derecha indica el tipo de estudio individual que ofrecería la mejor evidencia (nivel II) para distintas preguntas. En todos los casos, las revisiones sistemáticas apropiadas están en lo más alto. Por supuesto que dentro de cualquier nivel en una jerarquía de evidencia la calidad de esta varía de manera considerable. Por 80 ejemplo, un ECA individual podría estar bien diseñado, con aporte de evidencia sólida de nivel II para preguntas acerca del tratamiento o podría tener tantos defectos que la evidencia sería débil. Por ello, en enfermería mejor evidencia se refiere a los hallazgos de la investigación con una metodología apropiada, rigurosa y clínicamente relevante para responder las preguntas apremiantes. Estas preguntas no solo cubren eficacia, seguridad y rentabilidad de las intervenciones de enfermería, sino también la confiabilidad de las pruebas de valoración de enfermería, las causas y consecuencias de los problemas de salud y el significado y la naturaleza de las experiencias de los pacientes. La confianza en la evidencia mejora cuando los métodos de investigación son contundentes, cuando se han hecho múltiples estudios confirmatorios y cuando la evidencia se evaluó y sintetizó de forma cuidadosa. Dificultades de la práctica basada en evidencia Los estudios que exploran las barreras para la enfermería basada en evidencia han proporcionado resultados similares en muchos países. La mayoría de las barreras caen en una de tres categorías: (1) calidad y naturaleza de la investigación, (2) características de los profesionales de enfermería y (3) factores organizacionales. Con respecto a la investigación misma, un problema es la disponibilidad limitada de evidencia de investigación para algunas áreas prácticas. La necesidad de investigación que explora de modo directo problemas clínicos apremiantes y replica estudios en diversas instalaciones se mantiene como un desafío. Además, los investigadores en enfermería necesitan mejorar su capacidad para comunicar la evidencia a los profesionales de enfermería clínica. En países que no hablan inglés, otro impedimento es que la mayoría de los estudios se publica en ese idioma. Las actitudes y la educación de los profesionales de enfermería también son barreras potenciales para la PBE. Los estudios han encontrado que algunos de ellos no valoran o no comprenden la investigación y otros simplemente se resisten al cambio. Además, entre los profesionales de enfermería que sí aprecian la investigación, muchos no tienen las habilidades para acceder a la evidencia de la investigación o para evaluarla con el fin de decidir su uso posible en la toma de decisiones clínicas. Por último, muchas dificultades para usar la investigación en la 81 práctica son organizacionales. La “cultura de la unidad” puede minar el uso de la investigación y las barreras administrativas u organizacionales también tienen un papel sustancial. Aunque muchas organizaciones respaldan la idea de la PBE en teoría, no siempre proporcionan los apoyos necesarios en términos de liberación de tiempo del personal y provisión de recursos. El liderazgo fuerte en las organizaciones de atención a la salud es esencial para que la PBE tenga lugar. RECURSOS PARA LA PRÁCTICA BASADA EN EVIDENCIA En esta sección se describen algunos de los recursos disponibles para sustentar la práctica basada en evidencia en la enfermería y para resolver algunas de las dificultades. Evidencia ya examinada La evidencia de la investigación asume varias formas, la más básica de las cuales es la de estudios individuales. Los estudios primarios publicados en revistas no están evaluados con anterioridad respecto a su calidad y uso en la práctica. La evidencia ya procesada (evaluada) es la que se eligió de estudios primarios y fue evaluada por médicos para su uso. DiCenso y sus colaboradores (2005) describieron una jerarquía de evidencia ya procesada. En el primer peldaño arriba de los estudios primarios están las sinopsis de estudios individuales, seguidas por revisiones sistemáticas y luego por sinopsis de revisiones sistemáticas. Los lineamientos para la práctica clínica están en lo más alto de la jerarquía. En cada escalón sucesivo en la jerarquía aumenta la facilidad para aplicar la evidencia a la práctica clínica. En esta sección se describen varios tipos de fuentes de evidencia ya evaluada. Revisiones sistemáticas La PBE depende de la integración meticulosa de toda la evidencia clave sobre un tema para poder extraer conclusiones bien fundamentadas acerca de las preguntas de la propia PBE. Una revisión sistemática es una indagación metódica académica que sigue muchos de los mismos pasos que los de otros estudios. 82 Las revisiones sistemáticas pueden asumir varias formas. Una es la integración narrativa (cualitativa) que fusiona y sintetiza los hallazgos, de manera muy semejante a una revisión bibliográfica rigurosa. Para integrar evidencia de estudios cuantitativos, las revisiones narrativas son sustituidas cada vez más por un tipo de revisión sistemática conocida como metaanálisis. El metaanálisis es una técnica para hacer una integración estadística de los hallazgos de la investigación cuantitativa. En esencia, el metaanálisis trata los hallazgos de un estudio como una pieza de información. Los hallazgos de múltiples estudios sobre el mismo tema se combinan y luego toda la información se somete a un análisis estadístico de modo similar a un estudio usual. Por lo tanto, en lugar de que los participantes del estudio sean las unidades de análisis (la entidad más básica en la que se enfoca el análisis), en el metaanálisis los estudios individuales son la unidad de análisis. El metaanálisis provee un método objetivo para integrar un conjunto de hallazgos y observar patrones que podrían haber pasado inadvertidos. Ejemplo de metaanálisis Shah y sus colaboradores (2016) condujeron un metaanálisis de la evidencia sobre el efecto en pacientes de la unidad de cuidados intensivos (UCI) del baño con gluconato de clorhexidina a 2% en la infección sanguínea relacionada con un catéter central. Al integrar los resultados de cuatro estudios de intervención, los investigadores concluyeron que el gluconato de clorhexidina a 2% es efectivo para reducir las infecciones. Notaron que “la enfermería ejerce una influencia significativa en la prevención de infecciones sanguíneas relacionadas con catéteres centrales en los cuidados críticos mediante las mejores prácticas basadas en evidencia” (p. 42). Para los estudios cualitativos, la integración puede asumir la forma de una metasíntesis. Una metasíntesis es distinta a un metaanálisis cuantitativo: una metasíntesis se enfoca menos en reducir información y más en interpretarla. Ejemplo de metasíntesis Magid y sus colaboradores (2016) realizaron una metasíntesis de estudios que exploran las percepciones de elementos clave de la atención entre pacientes que usan un dispositivo de asistencia 83 ventricular izquierda. Su metasíntesis de ocho estudios cualitativos condujo a la identificación de ocho temas importantes. Cada vez hay más revisiones sistemáticas accesibles. Tales revisiones se publican en revistas profesionales a las que puede accederse con procedimientos de búsqueda bibliográfica estándar (véase el capítulo 7) y también están disponibles en bases de datos dedicadas a tales revisiones. En particular, la Cochrane Database of Systematic Reviews (CDSR) contiene miles de revisiones sistemáticas relativas a las intervenciones de atención a la salud. TIP Los sitios web con contenido útil relativo a la PBE, incluidos aquellos para localizar revisiones sistemáticas, están en Internet Resources para el capítulo 2 en el sitio web para que ingrese de manera sencilla con la función “Control/clic”. Lineamientos para la práctica clínica y protocolos de cuidado Los lineamientos para la práctica clínica o guías clínicas basadas en evidencia transforman un conjunto de evidencia en una forma utilizable. A diferencia de las revisiones sistemáticas, los lineamientos para la práctica clínica (que con frecuencia se basan en revisiones sistemáticas) presentan recomendaciones específicas para la toma de decisiones basada en evidencia. Por lo general, el desarrollo de lineamientos implica el consenso de un grupo de investigadores, expertos y médicos. La implementación o adaptación de un lineamiento para la práctica clínica a menudo es un enfoque ideal para un proyecto de PBE organizacional. Por otra parte, las organizaciones desarrollan y adoptan protocolos de cuidado, un concepto desarrollado por el Institute for Healthcare Improvement, que comprenden un conjunto de intervenciones para tratar o prevenir un grupo específico de síntomas (www.ihi.org). Cada vez hay más evidencia de que una combinación o paquete de estrategias produce mejores resultados que una sola intervención. Ejemplo de un proyecto de protocolo de cuidado Tayyib et al. (2015) estudiaron la efectividad de un protocolo de 84 cuidado para profilaxis de las úlceras de presión en la reducción de la incidencia de las mismas úlceras en pacientes graves. Los resultados del estudio indicaron que los pacientes que recibieron intervenciones en paquete tuvieron una incidencia significativamente menor de úlceras por presión que los sujetos que no las recibieron. La búsqueda de protocolos de cuidado y lineamientos para la práctica clínica puede ser difícil porque no existe un único banco de lineamientos. Una búsqueda estándar en una base de datos bibliográfica como MEDLINE (véase el capítulo 7) aportará muchas referencias, pero es probable que los resultados no solo incluyan lineamientos reales sino también comentarios, estudios de implementación, etcétera. Una estrategia recomendada es buscar en tales bases de datos o a través de organizaciones especializadas que tienen un desarrollo patrocinado de lineamientos. Algunas de las múltiples fuentes posibles ameritan una mención. En Estados Unidos, los lineamientos de enfermería y atención a la salud son mantenidos por la National Guideline Clearinghouse (www.guideline.gov). En Canadá, la Registered Nurses’ Association of Ontario (RNAO) (www.rnao.org/bestpractices) mantiene información sobre los lineamientos para la práctica clínica. Dos fuentes en el Reino Unido son la base de datos Translating Research Into Practice (TRIP) y el National Institute for Health and Care Excellence (NICE). Hay muchos temas para los que no se han desarrollado lineamientos para la práctica, pero también existe el problema contrario: a veces los lineamientos sobre el mismo tema son muchos. Peor aún, debido a las diferencias en el rigor del desarrollo de lineamientos y la interpretación de la evidencia, en ocasiones distintos lineamientos ofrecen recomendaciones diferentes, incluso contradictorias (Lewis, 2001). Por lo tanto, los que desean adoptar lineamientos para la práctica clínica deben examinarlos para identificar los que se basan en la evidencia más sólida, que se desarrollaron de manera meticulosa, que son fáciles de usar y apropiados para el uso o la adaptación locales. Hay varios instrumentos de evaluación para examinar los lineamientos para la práctica clínica. Uno con soporte amplio es el instrumento Appraisal of Guidelines Research and Evaluation (AGREE), ahora en su segunda versión (Brouwers et al., 2010). El instrumento AGREE II tiene calificaciones para 23 dimensiones en 85 seis dominios (p. ej., alcance y propósito, rigor del desarrollo, presentación). Como ejemplos, una dimensión en el dominio de alcance y propósito es: “Se describe de manera específica la población (pacientes, público, etcétera) a la que el lineamiento debe aplicarse”, y uno del dominio de rigor de desarrollo es: “El lineamiento fue sometido a revisión externa de expertos antes de su publicación”. Dos a cuatro examinadores deben aplicar la herramienta AGREE al lineamiento. Ejemplo de uso de AGREE II Homer y sus colaboradores (2014) evaluaron los lineamientos en lengua inglesa para la detección y el tratamiento de la colonización por estreptococo del grupo B (EGB) en mujeres embarazadas y para la prevención de la enfermedad por EGB de inicio temprano en recién nacidos. Se examinaron cuatro lineamientos con el instrumento AGREE II. TIP Para los interesados en aprender más sobre el instrumento AGREE II, se ofrece más información en el suplemento en inglés de este capítulo en el sitio web . Modelos del proceso de la práctica basada en evidencia Los modelos de PBE ofrecen marcos para diseñar e implementar proyectos de PBE en situaciones prácticas. Algunos modelos se enfocan en el uso de la investigación por parte de médicos individuales (p. ej., el modelo de Stetler, uno de los modelos más antiguos que originaron un modelo de UI), pero la mayoría se enfoca en los esfuerzos institucionales de PBE (p. ej., el modelo Iowa). Los múltiples modelos de PBE valiosos son demasiado numerosos para listarlos todos, pero incluyen los siguientes: Modelo Advancing Research and Clinical Practice Through Close Collaboration (ARCC) (Melnyk y Fineout-Overholt, 2015) Modelo de la difusión de innovaciones (Rogers, 1995) Modelo Iowa de práctica basada en evidencia para fomentar la atención de calidad (Titler, 2010) Modelo Johns Hopkins Nursing Evidence-Based Practice (Dearholt 86 y Dang, 2012) Modelo Promoting Action on Research Implementation in Health Services (PARiHS) (Rycroft-Malone, 2010; Rycroft-Malone et al., 2013) Stetler Model of Research Utilization (Stetler, 2010) Los que desean seguir un modelo formal de PBE deben consultar las referencias citadas. Algunas están bien sintetizadas por Melnyk y Fineout-Overholt (2015). Cada modelo ofrece perspectivas diferentes acerca de cómo traducir los hallazgos de la investigación en la práctica, pero varios pasos y procedimientos son similares entre los modelos. En una sección posterior de este capítulo se presenta una revisión de las actividades y los procesos clave en los esfuerzos de PBE basada en una selección de elementos comunes de los diversos modelos. Se basa en gran medida en el modelo Iowa y se muestra en la figura 2-2. TIP Gawlinski y Rutledge (2008) ofrecen sugerencias para seleccionar un modelo de PBE. PRÁCTICA BASADA EN EVIDENCIA EN EL EJERCICIO INDIVIDUAL DE LA ENFERMERÍA Esta sección y la siguiente presentan una revisión de cómo puede usarse la investigación en instalaciones clínicas. Primero se discuten las estrategias y pasos para los profesionales individuales y luego se describen actividades usadas por organizaciones o equipos de enfermería. 87 Figura 2-2 Modelo Iowa de práctica basada en evidencia para fomentar la atención de calidad. (Adaptada con autorización de Titler, M. G., Kleiber, C., Steelman, V., Rakel, B., Budreau, G., Everett, L. Q.,... Goode, C. (2001). The Iowa Model of Evidence-Based Practice to Promote Quality Care. Critical Care Nursing Clinics of North America, 13, 497-509.) 88 Situaciones clínicas y la necesidad de evidencia Los profesionales de enfermería individuales toman muchas decisiones y se les solicita para que brinden asesoría sobre la atención a la salud, por lo que tienen una amplia oportunidad de poner en práctica la investigación. Aquí se muestran cuatro situaciones con ejemplos de tales oportunidades: Situación clínica 1. Usted trabaja en una UCI y nota que la infección por Clostridium difficile se ha vuelto más frecuente entre pacientes quirúrgicos en su hospital. Quiere saber si existe una herramienta de detección confiable con el fin de valorar el riesgo de infección e iniciar medidas preventivas de manera más oportuna y efectiva. Situación clínica 2. Usted trabaja en una clínica de alergias y nota qué difícil es para muchos niños someterse a pruebas de alergia por escarificación. Se pregunta si una intervención distractora ayudaría a disminuir el dolor de los niños cuando se someten a la prueba de alérgenos. Situación clínica 3. Usted trabaja en un hospital de rehabilitación y uno de sus pacientes geriátricos, que se sometió a remplazo total de cadera, le informa que planea un largo viaje en avión. Usted sabe que un viaje aéreo prolongado aumentará su riesgo de trombosis venosa profunda y se pregunta si las medias compresivas son un tratamiento efectivo durante el vuelo. Decide buscar la mejor evidencia posible para responder esta pregunta. Situación clínica 4. Usted atiende a un paciente cardiópata hospitalizado y él le informa que tiene apnea obstructiva durante el sueño. Le confía que está renuente a someterse al tratamiento con presión positiva continua en la vía aérea porque le preocupa que afecte la intimidad con su esposa. Usted se pregunta si existe evidencia sobre cómo es someterse a este tratamiento para comprender mejor cómo aliviar las preocupaciones de su paciente. En estas y en miles de situaciones clínicas más, la evidencia de la investigación puede aprovecharse para mejorar la atención de enfermería. Algunas situaciones podrían conducir a un escrutinio por unidad o por institución de las prácticas vigentes, pero en otras los profesionales de enfermería individuales pueden examinar por sí mismos la evidencia para ayudar a resolver problemas específicos. Para los esfuerzos individuales de PBE, los principales pasos de la PBE incluyen los siguientes: 89 1. Formulación de preguntas clínicas que pueden responderse con evidencia de la investigación. 2. Búsqueda y recuperación de evidencia relevante. 3. Examen y síntesis de la evidencia. 4. Integración de la evidencia con su propia experiencia clínica, las preferencias del paciente y el contexto local. 5. Valoración de la efectividad de la decisión, intervención o asesoría. Formular preguntas clínicas bien redactadas: PIO y PICO Un primer paso crucial en la PBE es hacer preguntas clínicas relevantes que reflejen incertidumbres en la práctica clínica. Algunos autores sobre PBE distinguen entre las preguntas de antecedentes y las de primer plano. Las preguntas de antecedentes son interrogantes básicas sobre un problema clínico, como ¿qué es la caquexia oncológica (atrofia corporal progresiva) y cuál es su fisiopatología? Las respuestas a tales preguntas casi siempre se encuentran en los libros. En contraste, las preguntas de primer plano son las que pueden responderse con base en la mejor evidencia de investigación vigente sobre diagnóstico, valoración o tratamiento de pacientes, o con la comprensión del significado o pronóstico de sus problemas de salud. Por ejemplo, podríamos preguntarnos: ¿es efectivo un suplemento nutricional fortificado con aceite de pescado para estabilizar el peso de pacientes con cáncer avanzado? La respuesta a tal pregunta podría ser una guía de la mejor manera de cubrir las necesidades de los pacientes con caquexia. La mayoría de los lineamientos para la PBE usa los acrónimos PIO y PICO para ayudar a los profesionales a desarrollar preguntas bien expresadas que faciliten la búsqueda de evidencia. En la forma más básica de PIO, la pregunta clínica se formula para identificar tres componentes: 1. P: la población o los pacientes (¿cuáles son las características de los pacientes o las personas?). 2. I: la intervención, influencia o exposición (¿cuáles son las intervenciones o tratamientos de interés?, o ¿cuáles son las posibles influencias/exposiciones dañinas de interés?). 3. O: los resultados (outcomes) (¿cuáles son los resultados o consecuencias en los que estamos interesados?). 90 Al aplicar este esquema a la pregunta sobre caquexia, la población (P) son los pacientes con cáncer y caquexia, la intervención (I) es el suplemento nutricional fortificado con aceite de pescado y el resultado (O, outcome) es la estabilización del peso. Como otro ejemplo, en la segunda situación clínica sobre las pruebas de escarificación, citada antes, la población incluye a los niños que se someten a pruebas de alergia, la intervención es la distracción interactiva y el resultado es el dolor. Para preguntas que pueden responderse mejor con información cualitativa (p. ej., sobre el significado de una experiencia o problema de salud), dos componentes son los más relevantes: 1. La población (¿cuáles son las características de los pacientes?). 2. La situación (¿qué condiciones, experiencias o circunstancias interesa comprender?). Por ejemplo, suponiendo que la pregunta fuera: ¿cómo es padecer caquexia? En este caso, la pregunta pide información cualitativa vasta; la población son los pacientes con cáncer avanzado y la situación es la experiencia de caquexia. Además de los componentes básicos de PIO, a veces otros componentes son importantes en una búsqueda de evidencia. En particular, puede requerirse un componente de comparación (C) cuando la intervención o influencia de interés se contrasta con una alternativa específica. Por ejemplo, podríamos estar interesados en saber si los suplementos fortificados con aceite de pescado (I) son mejores que la melatonina (C) para estabilizar el peso (O) en pacientes con cáncer (P). Cuando lo que interesa es una comparación específica, se requiere una pregunta PICO, pero si lo que interesa es descubrir evidencia sobre todas las alternativas a una intervención de interés primario, entonces son suficientes los componentes PIO. (En contraste, cuando se hacen preguntas para realizar un estudio real, la “C” siempre debe especificarse). TIP Otros componentes pueden ser relevantes, como el marco temporal en el que sería apropiada una intervención (la adición de una “T” para preguntas PICOT) o una situación (adición de una “S” para preguntas PICOS). La tabla 2-1 presenta plantillas para hacer preguntas clínicas bien formuladas para distintos tipos de preguntas de primer plano. La 91 columna derecha incluye preguntas con una comparación explícita (PICO), mientras que la columna intermedia no tiene una comparación (PIO). Las preguntas se clasifican de modo similar al descrito en el capítulo 1 (propósito de la PBE), como se muestra en la tabla 1-3. Una excepción es que se agregó la descripción como categoría. Nótese que aunque existen algunas diferencias en los componentes de los tipos de pregunta, siempre hay un componente P. TIP Es fundamental practicar las preguntas clínicas: es el punto inicial para la enfermería basada en evidencia. Tómese cierto tiempo para llenar los espacios en la tabla 2-1 para cada categoría de pregunta. No sea demasiado autocrítico en este punto. Con el tiempo se sentirá más cómodo al formular preguntas. El capítulo 2 de la Study Guide for Essentials of Nursing Research, 9e., en inglés, que que acompaña a este libro ofrece más oportunidades para practicar la formulación de preguntas bien redactadas. 92 Hallazgo de evidencia de investigación Al formular las indagaciones clínicas como preguntas PIO o PICO, se debe hacer una búsqueda bibliográfica para encontrar la información que se requiere. Con las plantillas de la tabla 2-1, la información que se inserta en los espacios en blanco son palabras clave que pueden usarse en una búsqueda electrónica. Para un esfuerzo individual de PBE, el mejor sitio para comenzar es la búsqueda de evidencia en una revisión sistemática, un lineamiento para la práctica clínica u otra fuente procesada con anterioridad porque este enfoque conduce a una respuesta más rápida y si sus habilidades metodológicas son limitadas, quizá también a una 93 respuesta mejor. Los investigadores que preparan revisiones y lineamientos clínicos casi siempre están bien entrenados en métodos de investigación y usan estándares rigurosos para evaluar la evidencia. Además, la evidencia ya procesada por lo regular es preparada por un equipo, lo que significa que las conclusiones se verifican varias veces y son bastante objetivas. Por lo tanto, cuando se tiene evidencia ya examinada para responder una pregunta clínica, quizá no deba buscarse más, a menos que la revisión carezca de vigencia. Cuando no puede localizarse evidencia procesada o esta es obsoleta, será necesario buscar la mejor evidencia en estudios primarios, usando las estrategias que se describen en el capítulo 7. TIP La búsqueda de evidencia de un proyecto PBE se ha simplificado mucho en los últimos años. La guía para hacer una búsqueda de evidencia sobre preguntas clínicas está disponible en el suplemento en inglés del capítulo 7 (el capítulo acerca de revisiones bibliográficas) en el sitio web . Evaluación de la evidencia de la práctica basada en evidencia La evidencia debe examinarse antes de realizar acciones clínicas. El examen clínico de la evidencia para los fines de la PBE puede incluir varios tipos de valoraciones (recuadro 2-1), pero por lo regular se enfoca sobre todo en la calidad de la evidencia. Calidad de la evidencia El problema predominante en el examen es el grado de validez de los hallazgos. Es decir, ¿los métodos de estudio fueron lo bastante rigurosos para confiar en la evidencia? Lo ideal sería encontrar evidencia ya examinada, pero un objetivo de este libro es ayudarle a evaluar por sí mismo la evidencia de la investigación. Si existen varios estudios primarios y no hay una revisión sistemática, es necesario obtener conclusiones del conjunto de evidencia considerado en su totalidad. Está claro que es deseable poner más peso en los estudios que tienen mayor rigor. Magnitud de los efectos 94 También sería necesario valorar si los hallazgos del estudio tienen importancia clínica. Este criterio no considera si los resultados son “reales”, sino qué tan poderosos son. Por ejemplo, considerar la situación clínica 3 mencionada antes, que sugiere esta pregunta: ¿el uso de medias compresivas reduce el riesgo de trombosis venosa profunda relacionada con el vuelo en pacientes de alto riesgo? En la búsqueda se encontró una revisión sistemática relevante en la bibliografía de enfermería, un metaanálisis de nueve ECA (Hsieh y Lee, 2005) y otros en la base de datos Cochrane (Clarke et al., 2006; O’Meara et al., 2012). La conclusión de estas revisiones, con base en evidencia confiable, fue que las medias compresivas son efectivas y que la magnitud del efecto reductor de riesgo es sustancial. En consecuencia, puede ser apropiado recomendar el uso de medias compresivas, en espera del examen de otros factores. La magnitud de los efectos puede cuantificarse y más adelante en este libro se describen varios métodos. La magnitud de los efectos también influye en la relevancia clínica, que también se describe en un capítulo posterior. Recuadro 2-1 Preguntas para evaluar la evidencia 1. ¿Cuál es la calidad de la evidencia; es decir, qué tan rigurosa y confiable es? 2. ¿Cuál es la evidencia, cuál es la magnitud de los efectos? 3. ¿Qué tan preciso es el cálculo de los efectos? 4. ¿Qué evidencia hay sobre cualquier efecto colateral/beneficio colateral? 5. ¿Cuál es el costo financiero de aplicar (y de no aplicar) la evidencia? 6. ¿La evidencia es relevante para mi situación clínica particular? Precisión de los cálculos Cuando la evidencia es cuantitativa, otra consideración consiste en qué tan preciso es el cálculo del efecto. Este tipo de examen requiere cierto conocimiento estadístico, por lo que la discusión de los intervalos de confianza se pospone al capítulo 14. Basta decir que los resultados de la investigación solo proporcionan una estimación de los efectos y es útil comprender no nada más el cálculo exacto sino también el intervalo en el que probablemente se encuentre el efecto 95 real. Efectos periféricos Incluso si la evidencia se considera válida y la magnitud del efecto es mensurable, los beneficios y costos periféricos pueden ser importantes para guiar la decisión. Para enmarcar la pregunta clínica, ya se habrán identificado los resultados (O) de interés; por ejemplo, la estabilización del peso con una intervención para corregir la caquexia en el cáncer. Sin embargo, es probable que la investigación sobre este tema considere otros resultados que deben tomarse en cuenta, como los efectos en la calidad de vida. Costos financieros Otro aspecto se refiere a los costos de la aplicación de la evidencia. Los costos pueden ser pequeños o inexistentes. Por ejemplo, en la situación clínica 4 referente a la experiencia con el tratamiento de presión positiva continua en la vía respiratoria, la acción de enfermería tendría un costo neutro porque la evidencia se usaría para tranquilizar e informar a los pacientes. Sin embargo, cuando las intervenciones y valoraciones son costosas, los recursos necesarios para poner en práctica la mejor evidencia deben considerarse en cualquier decisión. Por supuesto que aunque es preciso considerar el costo de una decisión clínica, el costo de no aplicar una acción también es importante. Relevancia clínica Por último, es importante examinar la evidencia en términos de su relevancia para la situación clínica en cuestión; es decir, para su paciente en una situación clínica específica. La mejor evidencia de la práctica es más fácil de aplicar a un paciente individual si es lo bastante parecido a las personas del estudio o los estudios que se revisan. ¿El paciente estaría calificado para ingresar al estudio o algún factor (p. ej., edad, gravedad de la enfermedad, morbilidad concomitante) lo descalificaría? DiCenso y sus colaboradores (2005), que recomendaban a los profesionales clínicos preguntar si existe una razón contundente para concluir que los resultados no son aplicables en su situación clínica, escribieron algunos consejos útiles sobre la aplicación de la evidencia a pacientes individuales. 96 Acciones basadas en la evaluación de la evidencia Las evaluaciones de la evidencia pueden conducir a distintos cursos de acción. Es posible llegar a este punto y concluir que la base de evidencia no es lo bastante sólida, que el efecto probable es demasiado pequeño o que el costo de la aplicación de la evidencia es muy alto. El examen de la evidencia puede sugerir que la “atención usual” es la mejor estrategia. Sin embargo, si el examen inicial de la evidencia sugiere una acción clínica prometedora, puede procederse al siguiente paso. Integración de la evidencia en la práctica basada en evidencia Es necesario integrar la evidencia de la investigación con otros tipos de información, entre estos la propia pericia clínica y el conocimiento de la institución clínica. Es posible que se conozcan factores que hagan desaconsejable la implementación de la evidencia, sin importar qué tan sólida y prometedora sea. Las preferencias y los valores de los pacientes también son importantes. Una charla con el paciente puede revelar actitudes negativas hacia un curso de acción potencialmente provechoso, contraindicaciones (p. ej., morbilidad concomitante) o posibles impedimentos (p. ej., falta de seguro médico). Un aspecto final es la conveniencia de integrar la evidencia de la investigación cualitativa. La investigación cualitativa puede aportar información valiosa acerca de la manera en que los pacien tes experimentan un problema o de las barreras para el cumplimiento terapéutico. Una intervención potencialmente beneficiosa podría no alcanzar los resultados deseados si no se implementa con consideración de las perspectivas de los pacientes. Como Morse (2005) señaló de modo tan adecuado, la evidencia de un ECA puede informar si una pastilla es efectiva, pero la investigación cualitativa ayuda a comprender por qué los pacientes pueden no deglutir la pastilla. Implementación de la evidencia y evaluación de resultados Después de completar los primeros cuatro pasos del proceso de PBE, 97 puede usarse la información resultante con el fin de tomar una decisión basada en evidencia o brindar asesoría basada en evidencia. Aunque los pasos del proceso descrito pueden parecer complicados, en realidad el proceso puede ser muy eficiente si hay evidencia adecuada y, sobre todo, si se procesó antes de manera apropiada. La PBE es más difícil cuando los hallazgos de la investigación son contradictorios, no concluyentes o “escasos”; es decir, cuando se requiere evidencia de mejor calidad. Un último paso en un esfuerzo para la PBE individual se refiere a la evaluación. Parte del proceso de evaluación es el seguimiento para confirmar si las acciones alcanzaron el resultado deseado. Sin embargo, otra parte se refiere a la evaluación sobre qué tan bien se realiza la PBE. Sackett y sus colaboradores (2000) ofrecen preguntas de autoevaluación relativas a los pasos anteriores de la PBE, como formular preguntas posibles de responder (¿estoy haciendo alguna pregunta clínica?, ¿estoy haciendo preguntas bien formuladas?) y encontrar evidencia externa (¿conozco las mejores fuentes de la evidencia actual?, ¿soy eficiente en mi búsqueda?). Una autoevaluación puede llevar a la conclusión de que al menos algunas de las preguntas clínicas de interés se responden mejor con un esfuerzo grupal. PRÁCTICA BASADA EN EVIDENCIA EN EL CONTEXTO ORGANIZACIONAL En algunas situaciones clínicas, los profesionales de enfermería individuales pueden llevar a cabo estrategias de PBE por sí mismos (p. ej., dar asesoría sobre medias compresivas). Sin embargo, muchas situaciones requieren la toma de decisiones por parte de una organización o por un equipo de enfermería que trabaja para resolver un problema recurrente. Esta sección describe algunos aspectos relevantes para los esfuerzos institucionales para la PBE, esfuerzos diseñados para dar lugar a una política o protocolo formal que influya en la práctica de muchos profesionales de enfermería. Muchos pasos de los proyectos organizacionales de PBE son similares a los descritos en la sección previa. Por ejemplo, la recolección y evaluación de la evidencia son actividades clave en ambos, como se muestra en el modelo Iowa en la figura 2-2 (reunir investigación relevante; analizar y sintetizar la información). Sin 98 embargo, hay otros aspectos relevantes en el plano organizacional que incluyen la selección del problema; valorar si el tema es una prioridad de la organización; decidir si se pone a prueba una innovación de PBE con base en un estudio, y decidir, de acuerdo con un estudio, si la innovación debe adoptarse. A continuación se estudian algunos de estos temas de manera breve. Selección de un problema para un proyecto institucional de práctica basada en evidencia Algunos proyectos de PBE se originan en deliberaciones entre personal clínico que encontró un problema recurrente y busca una solución. Sin embargo, otros son esfuerzos “de arriba abajo” en los que los administradores toman medidas para estimular el uso de la evidencia de la investigación entre el personal clínico. Este último enfoque es cada vez más frecuente en hospitales de Estados Unidos como parte del proceso de certificación como hospitales magnéticos. Varios modelos de PBE, como el modelo Iowa, distinguen dos tipos de estímulos (“desencadenantes”) para una tarea de PBE: (1) desencadenantes enfocados en un problema: la identificación de un problema en la práctica clínica que requiere solución, o (2) desencadenantes enfocados en el conocimiento: lecturas en la bibliografía de investigación. Es probable que la forma de identificación de un problema tenga relevancia clínica y cuente con el apoyo del personal si se trata de un problema que han encontrado muchos profesionales de enfermería. Un segundo catalizador para un proyecto de PBE es un desencadenante enfocado en el conocimiento, que es semejante al UI. El catalizador puede ser un lineamiento clínico nuevo o un artículo de investigación discutido en un club de lectura de revistas. Con los desencadenantes enfocados en conocimiento, quizá sea necesario valorar la relevancia clínica de la investigación. El aspecto central es si un problema relevante para el personal de enfermería en una institución particular se resolverá al introducir una innovación. Valoración del potencial de implementación Con cualquier tipo de desencadenante, es necesario valorar la posibilidad de realizar un proyecto organizacional de PBE. En el modelo Iowa (fig. 2-2), el primer punto de decisión sustancial es 99 determinar si el tema es una prioridad para la organización, luego de considerar los cambios en la práctica. Titler y sus colaboradores (2001) recomendaron considerar los siguientes aspectos antes de finalizar un tema para PBE: adaptación del tema al plan estratégico de la organización, magnitud del problema, número de personas implicadas en el problema, apoyo de los líderes de enfermería y de todas las disciplinas, costos y disponibilidad de recursos, y posibles barreras para el cambio. Algunos modelos de PBE implican una valoración formal del “ajuste” organizacional, a menudo llamado potencial de implementación (o disposición ambiental). Cuando se valora la posibilidad de llevar a cabo una innovación deben considerarse varios aspectos, sobre todo la transferibilidad de la innovación (es decir, el grado en que la innovación pudiera ser apropiada en nuevas instituciones), la posibilidad de ponerla en práctica y su índice costobeneficio. Si la valoración de la implementación sugiere que podría haber problemas para probar la innovación en un ambiente de práctica particular, el equipo puede identificar un nuevo problema y comenzar el proceso de nuevo o desarrollar un plan para mejorar la posibilidad de implementación (p. ej., buscar recursos externos si los costos son prohibitivos). Valoraciones de evidencia y acciones subsiguientes En el modelo Iowa, la segunda decisión mayor radica en la síntesis y valoración de la evidencia de investigación. El punto crucial de la decisión consiste en si la base de investigación es suficiente para justificar un cambio basado en evidencia; por ejemplo, si un nuevo lineamiento para la práctica clínica tiene calidad suficiente para poder usarlo o adaptarlo, o si la evidencia de la investigación es lo bastante rigurosa para recomendar una innovación en la práctica. Las valoraciones de la calidad de la evidencia pueden conducir a varias vías de acción. Si la evidencia de la investigación es débil, el equipo debe recolectar evidencia ajena a la investigación (p. ej., mediante consultas con expertos o encuestas con pacientes) con el fin de determinar el beneficio de un cambio en la práctica. Otra opción es conducir un estudio original para responder la pregunta sobre la práctica, con lo que se recopila nueva evidencia. El curso de acción puede ser impráctico y ocasionar años de retraso. Si, por otra parte, existe una base de investigación sólida o un 100 lineamiento para la práctica clínica de alta calidad, el equipo debe desarrollar planes para implementar una innovación en la práctica. Una actividad clave casi siempre implica el desarrollo o adaptación de un protocolo o lineamiento para la práctica clínica local basado en evidencia. En DiCenso et al. (2005) y Melnyk y Fineout-Over-holt (2015) se sugieren estrategias para desarrollar lineamientos para la práctica clínica. Implementación y evaluación de la innovación Una vez que se desarrolla el producto de PBE, el siguiente paso es someterlo a una prueba piloto (probar el producto o el proyecto) y evaluar el resultado. Según el modelo Iowa, es probable que esta fase del proyecto incluya las siguientes actividades: 1. Desarrollar un plan de evaluación (p. ej., identificar los resultados que deben obtenerse, decidir cuántos pacientes incluir, decidir cuándo y con qué frecuencia medir los resultados). 2. Medir los resultados de los pacientes antes de implementar la innovación para que haya un parámetro con el que puedan compararse los resultados de la innovación. 3. Entrenar al personal relevante en el uso del nuevo lineamiento y, si es necesario, “publicitar” la innovación entre los usuarios. 4. Probar el lineamiento en una o más unidades, o con un grupo de pacientes. 5. Evaluar el proyecto piloto en términos del proceso (p. ej., ¿cómo fue recibida la innovación?, ¿qué problemas se enfrentaron?) y los resultados (p. ej., ¿cómo se modificaron los resultados del paciente?, ¿cuáles fueron los costos?). Puede ser adecuada una evaluación informal, pero suele ser apropiado hacer un esfuerzo de evaluación formal pues da la oportunidad de comunicar los resultados en conferencias o revistas profesionales. TIP Todo profesional de enfermería puede participar en el uso de la evidencia de investigación. Estas son algunas estrategias: Leer mucho y de manera crítica. Acudir a conferencias profesionales. Participar en un club de lectura de revistas. Buscar y participar en proyectos de práctica basada en evidencia. 101 MEJORA DE CALIDAD Se concluye este capítulo con una breve presentación de los proyectos para mejora de calidad (MC), esfuerzos que se mantienen en numerosas instalaciones de atención a la salud y que en ocasiones incluyen al personal de enfermería. En años recientes se ha discutido mucho en revistas médicas acerca de las diferencias y similitudes entre los proyectos de MC y la investigación. En enfermería se han realizado esfuerzos para distinguir la MC, la investigación y los proyectos de PBE (Shirey et al., 2011). Los tres tienen mucho en común, en particular el uso de métodos sistemáticos para resolver problemas de salud con el objetivo general de impulsar mejoras en la atención a la salud. A menudo los métodos de investigación usados se superponen: en los tres se utilizan datos de los pacientes y el análisis estadístico –a veces combinado con análisis de datos cualitativos– también se emplea en los tres. Las definiciones de MC, investigación y actividades de PBE son distintas, pero no siempre es fácil distinguirlas en proyectos reales, lo que genera confusión. Los U.S. Centers for Medicare & Medicaid Services (CMS) definen la MC como “una valoración, realizada por o para una organización de MC, de un problema para la atención de pacientes con la finalidad de mejorar la atención de pacientes mediante el análisis de pares, la intervención, la resolución del problema y el seguimiento” (CMS, 2003). Según el Code of Federal Regulations de Estados Unidos, la investigación se define como una “investigación sistemática que incluye desarrollo, prueba y evaluación, diseñada para generar o contribuir al conocimiento generalizable” (U.S. Code of Federal Regulations, 2009). Los proyectos de PBE, como ya se explicó, son esfuerzos para traducir la “mejor evidencia” en protocolos que guíen las acciones del personal de atención a la salud para maximizar los resultados adecuados en los pacientes. Shirey y sus colaboradores (2011) resumen las diferencias entre los tres de la siguiente manera: “Los tres tienen una relación importante, pero diferente, con el conocimiento: la investigación lo genera, la PBE lo traduce y la MC lo incorpora” (p. 60). En el capítulo 13 se incluye una descripción breve de los proyectos de MC. Aquí se señalan unas cuantas características de la mejora de calidad: 102 En los esfuerzos de MC, la intervención o protocolo puede cambiar a medida que es evaluado para incorporar nuevas ideas o información. El propósito de un proyecto de MC por lo regular es producir una mejora inmediata en la atención a la salud. La MC se diseña con la intención de sustentar una mejora. La MC es una actividad integral necesaria para una institución de atención a la salud, la investigación no. No puede realizarse una revisión bibliográfica en un proyecto de mejora de calidad. Los proyectos de MC no tienen patrocinio externo. Ejemplo de un proyecto de mejora de calidad conducido por profesionales de enfermería McMullen y sus colaboradores (2016) emprendieron un proyecto de MC en un hospital con certificación de hospital magnético para promover los lineamientos de sueño seguro en lactantes hospitalizados con base en las recomendaciones de la American Academy of Pediatrics. El proyecto incluyó una iniciativa educativa para los padres y el personal del hospital. EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO Cientos de proyectos que traducen evidencia de investigación en la práctica de enfermería están en curso en todo el mundo. Los descritos en la bibliografía de enfermería ofrecen información adecuada de la planeación e implementación de tales tareas. En esta sección se resume uno de esos proyectos. Lea el resumen de la investigación para el ejemplo 1 y luego responda las preguntas de pensamiento crítico que le siguen; de ser necesario, consulte el reporte completo de la investigación (este ejemplo se encuentra en la sección Critical Thinking Activity en el sitio web ). Las preguntas de pensamiento crítico de los ejemplos 2 y 3 se basan en los estudios que aparecen en los apéndices A y B de este libro. Los comentarios en inglés sobre los 103 ejercicios están en la sección Student Resources en . EJEMPLO 1: PROYECTO DE PRÁCTICA BASADA EN EVIDENCIA Estudio. Implementación del paquete ABCDE para mejorar los resultados del paciente en la unidad de cuidados intensivos en un hospital comunitario rural (Kram et al., 2015). Objetivo. Un equipo de profesionales de enfermería emprendió un proyecto de PBE para implementar un protocolo de cuidado diseñado para controlar el delirio –el paquete ABCDE– en una UCI comunitaria rural. El paquete incorpora despertar (awakening), respiración (breathing), coordinación (o elección [choice] del sedante), vigilancia y control del delirio y movilidad temprana (early) todos los días. La pregunta de este proyecto de PBE era: ¿la implementación de la atención con el paquete ABCDE, en lugar de la atención usual (ausencia de los componentes del paquete ABCDE), disminuye la incidencia de delirio, acorta la estancia del paciente en la UCI, reduce la estancia hospitalaria total y acorta la duración de la ventilación mecánica, con reducción consecuente de los costos de la UCI? Marco. El proyecto usó el Johns Hopkins Nursing Evidence-Based Practice Model como su marco guía. Estrategia. El equipo comenzó con la revisión de la evidencia actual sobre el paquete ABCDE. También hicieron una valoración organizacional e identificaron los cambios en la práctica que se requerían. Se buscó el apoyo del accionista clave. Se obtuvo la aprobación del comité ejecutivo de enfermería, del director médico y de los médicos con privilegios para ingreso en la UCI. Se llevaron a cabo sesiones educativas con varios métodos instructivos para el personal de los servicios de enfermería, terapia respiratoria y rehabilitación. Se implementó el paquete ABCDE en todos los pacientes adultos que ingresaron a la UCI a partir de octubre de 2014. Evaluación. Para valorar los efectos del paquete ABCDE, el equipo recolectó y organizó la información relevante de dos periodos: de octubre de 2013 a enero de 2014 (antes del paquete) y de octubre de 2014 a enero de 2015 (posterior al paquete). Los resultados de interés incluyeron la tasa de cumplimiento con los elementos del paquete por parte de los profesionales con participación directa, cambios en la duración de la estancia en la UCI entre los dos periodos, cambios en el número de días con ventilador del periodo anterior al posterior al paquete y prevalencia de 104 delirio posterior a la aplicación del paquete. Se obtuvo información de 47 pacientes en el grupo anterior al paquete y de 36 en el grupo posterior al paquete. Hallazgos y conclusiones. El equipo encontró que el cumplimiento con los protocolos del paquete era alto. La estancia promedio en el hospital fue 1.8 días menor después de implementar el paquete. La ventilación mecánica se redujo en 1 día, en promedio, en el grupo posterior al paquete. Se estableció una tasa de prevalencia de delirio de 19% como basal después de implementar el paquete. El equipo de PBE concluyó que el paquete ABCDE “puede implementarse en hospitales comunitarios rurales y es un método seguro y rentable para mejorar los resultados de los pacientes de la UCI” (p. 250). Ejercicios de pensamiento crítico 1. De los propósitos de investigación enfocados en PBE (tabla 1-3), ¿cuál propósito era el punto central de este proyecto? 2. ¿Cuál es la pregunta clínica que el equipo de PBE formuló en este proyecto? Identifique los componentes de la pregunta mediante el marco PICO. 3. Explique cómo este proyecto pudo haberse basado en un desencadenante enfocado en el conocimiento o enfocado en el problema. EJEMPLO 2: INVESTIGACIÓN CUANTITATIVA EN EL APÉNDICE A • Lea el resumen y la introducción del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Identifique una o más preguntas clínicas de primer plano que, de formularse, se habrían resuelto con este estudio. ¿Qué componentes PIO o PICO captura la pregunta? 2. ¿Cómo, si así fuera, podría usarse la evidencia de este estudio en un proyecto de PBE (individual u organizacional)? EJEMPLO 3: INVESTIGACIÓN CUALITATIVA EN EL APÉNDICE B • Lea el resumen y la introducción del estudio de Beck y Watson (2010) 105 (“Parto posterior a un parto traumático”) en el apéndice B de este libro. Ejercicios de pensamiento crítico 1. Identifique una o más preguntas clínicas de primer plano que, de formularse, se habrían resuelto con este estudio. ¿Qué componentes PIO o PICO captura la pregunta? 2. ¿Cómo, si es posible, podría usarse la evidencia de este estudio en un proyecto de PBE (individual u organizacional)? ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Evaluating Clinical Practice Guidelines—AGREE II. Respuestas a los ejercicios de pensamiento crítico para los ejemplos 2 y 3. Recursos en Internet con sitios web útiles para el capítulo 2. Un artículo de investigación de una revista de Wolters Kluwer: el proyecto de PBE descrito como ejemplo 1 en la p. 37. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. La práctica basada en evidencia (PBE) es el uso consciente de la mejor evidencia vigente para tomar decisiones clínicas sobre la atención del paciente; es una estrategia para resolver problemas clínicos que quita el énfasis en la toma de decisiones basada en la costumbre y subraya la integración de la evidencia de la 106 investigación con la pericia clínica y las preferencias del paciente. El uso de la investigación (UI) y la PBE son conceptos superpuestos que dirigen los esfuerzos a utilizar la investigación como base para las decisiones clínicas, pero el UI inicia con una innovación basada en investigación cuya posible aplicación en la práctica se evalúa. Traducción del conocimiento (TC) es un término que se usa sobre todo en esfuerzos sistemáticos para realizar un cambio metódico en la práctica clínica o en políticas. Dos fundamentos del movimiento para la PBE son la Cochrane Collaboration (que se basa en el trabajo del epidemiólogo británico Archie Cochrane) y la estrategia de aprendizaje clínico desarrollada en la McMaster Medical School llamada medicina basada en evidencia. La PBE implica la evaluación de la evidencia para determinar la mejor evidencia. A menudo se usa una jerarquía de evidencia para ordenar los hallazgos de los estudios según la fuerza de la evidencia proporcionada, pero jerarquías diferentes son apropiadas para distintos tipos de preguntas. Sin embargo, en todas las jerarquías de evidencia las revisiones sistemáticas ocupan la cima. Las revisiones sistemáticas son integraciones rigurosas de la evidencia de la investigación de múltiples estudios sobre un tema. Las revisiones sistemáticas pueden incluir métodos cuantitativos (metaanálisis) que integran hallazgos de manera estadística o estrategias narrativas para la integración (incluidos metasíntesis o estudios cualitativos). Los lineamientos para la práctica clínica basados en evidencia combinan la evaluación de la evidencia de investigación con recomendaciones específicas para las decisiones clínicas. Se han desarrollado muchos modelos de PBE, incluidos algunos que proporcionan un marco para profesionales individuales (p. ej., el modelo de Stetler) y otros para organizaciones o equipos de profesionales (p. ej., el modelo Iowa). Los profesionales de enfermería individuales tienen oportunidades para poner en práctica la investigación. Los cinco pasos básicos para la PBE individual son (1) formular una pregunta clínica posible de responder; (2) buscar evidencia 107 relevante basada en investigación; (3) examinar y sintetizar la evidencia; (4) integrar la evidencia con otros factores; y (5) valorar la efectividad de las acciones. Un esquema para formular preguntas clínicas bien redactadas incluye cuatro componentes, cuyo acrónimo es PICO; población (P), intervención o influencia (I), comparación (C) y resultado (O, outcome). Cuando no existe una comparación explícita, el acrónimo es PIO. El examen de la evidencia comprende consideraciones como validez de los hallazgos del estudio, su importancia clínica, la magnitud y precisión de los efectos, los costos y riesgos relacionados, y la utilidad en una situación clínica particular. La PBE en un contexto institucional incluye muchos de los mismos pasos de los esfuerzos para la PBE individual, pero es más formalizada y debe tomar en cuenta factores organizacionales. Los desencadenantes para un proyecto institucional incluyen los problemas clínicos apremiantes (enfocados en un problema) y el conocimiento existente (enfocados en el conocimiento). Antes de poder probar un lineamiento o protocolo basado en PBE, debe valorarse su potencial de implementación, que abarca los aspectos de transferibilidad, factibilidad y cociente costo-beneficio para la implementación de una nueva práctica en una institución clínica. Una vez que se desarrolla un protocolo o lineamiento basado en evidencia y que se considera digno de implementar, el equipo de PBE puede proceder a una prueba piloto de la innovación y una valoración de los resultados antes de su adopción generalizada. El propósito de la mejora de calidad (MC) es optimizar las prácticas y procesos en una organización específica, no generar nuevo conocimiento que pueda generalizarse. La MC no suele implicar la traducción de la “mejor evidencia” en un protocolo. R E F E R E N C I A S PA R A E L C A P Í T U L O 2 *Brouwers, M., Kho, M., Browman, G., Burgers, J., Cluzeau, F., Feder, G., ... Zitzelsberger, L. (2010). AGREE II: Advancing guideline development, 108 reporting and evaluation in health care. Canadian Medical Association Journal, 182, E839–E842. Centers for Medicare & Medicaid Services. (2003). Quality improvement organization manual. Retrieved from http://cms.gov/Regulations-andGuidance/Guidance/Manuals/Internet-Only-Manuals-IOMsItems/CMS019035.html Clarke, M., Hopewell, S., Juszczak, E., Eisinga, A., & Kjeldstrøm, M. (2006). Compression stockings for preventing deep vein thrombosis in airline passengers. Cochrane Database of Systematic Reviews, (2), CD004002. Dearholt, D., & Dang, D. (Eds.). (2012). Johns Hopkins nursing evidencebased practice: Model and guidelines (2nd ed.). Indianapolis, IN: Sigma Theta Tau International. DiCenso, A., Guyatt, G., & Ciliska, D. (2005). Evidence-based nursing: A guide to clinical practice. St. Louis, MO: Elsevier Mosby. Gawlinski, A., & Rutledge, D. (2008). Selecting a model for evidence-based practice changes. AACN Advanced Critical Care, 19, 291–300. Glasziou, P. (2005). Evidence-based medicine: Does it make a difference? Make it evidence informed with a little wisdom. BMJ, 330(7482), 92. Homer, C. S., Scarf, V., Catling, C., & Davis, D. (2014). Culture-based versus risk-based screening for the prevention of group B streptococcal disease in newborns: A review of national guidelines. Women and Birth, 27(1), 46–51. Horsley, J. A., Crane, J., & Bingle, J. D. (1978). Research utilization as an organizational process. Journal of Nursing Administration, 8, 4–6. Hsieh, H. F., & Lee, F. P. (2005). Graduated compression stockings as prophylaxis for flight-related venous thrombosis: Systematic literature review. Journal of Advanced Nursing, 51, 83–98. **Kram, S., DiBartolo, M., Hinderer, K., & Jones, R. (2015). Implementation of the ABCDE bundle to improve patient outcomes in the intensive care unit in a rural community hospital. Dimensions of Critical Care Nursing, 34, 250–258. Lewis, S. (2001). Further disquiet on the guidelines front. Canadian Medical Association Journal, 165, 180–181. Magid, M., Jones, J., Allen, L., McIlvennan, C., Magid, K., Thompson, J., & Matlock, D. (2016). The perceptions of important elements of caregiving for a left ventricular assist device patient: A qualitative meta-synthesis. Journal of Cardiovascular Nursing, 31, 215–225. McMullen, S., Fioravanti, I., Brown, K., & Carey, M. (2016). Safe sleep for hospitalized infants. MCN: American Journal of Maternal Child Nursing, 41, 43–50. Melnyk, B. M. (2014). Evidence-based practice versus evidence-informed practice: A debate that could stall forward momentum in improving healthcare quality, safety, patient outcomes, and costs. Worldviews on 109 Evidence-Based Nursing, 11, 347–349. Melnyk, B. M., & Fineout-Overholt, E. (2015). Evidence-based practice in nursing and healthcare (3rd ed.). Philadelphia, PA: Lippincott Williams & Wilkins. Morse, J. (2005). Beyond the clinical trial: Expanding criteria for evidence. Qualitative Health Research, 15, 3–4. O’Meara, S., Cullum, N., Nelson, E., & Dumville, J. (2012). Compression for venous ulcers. Cochrane Database of Systematic Reviews, (1), CD000265. Rogers, E. M. (1995). Diffusion of innovations (4th ed.). New York, NY: Free Press. Rycroft-Malone, J. (2010). Promoting Action on Research Implementation in Health Services (PARiHS). In J. Rycroft-Malone & T. Bucknall (Eds.), Models and frameworks for implementing evidence-based practice: Linking evidence to action (pp. 109–133). Malden, MA: Wiley-Blackwell. *Rycroft-Malone, J., Seers, K., Chandler, J., Hawkes, C., Crichton, N., Allen, C., ... Strunin, L. (2013). The role of evidence, context, and facilitation in an implementation trial: Implications for the development of the PARIHS framework. Implementation Science, 8, 28. Sackett, D. L., Straus, S. E., Richardson, W. S., Rosenberg, W., & Haynes, R. B. (2000). Evidence-based medicine: How to practice and teach EBM (2nd ed.). Edinburgh, United Kingdom: Churchill Livingstone. Shah, H., Schwartz, J., Luna, G., & Cullen, D. (2016). Bathing with 2% chlorhexidine gluconate: Evidence and costs associated with central lineassociated bloodstream infections. Critical Care Nursing Quarterly, 39, 42–50. Shirey, M., Hauck, S., Embree, J., Kinner, T., Schaar, G., Phillips, L., … McCool, I. (2011). Showcasing differences between quality improvement, evidence-based practice, and research. Journal of Continuing Education in Nursing, 42, 57–68. Sigma Theta Tau International. (2008). Sigma Theta Tau International position statement on evidence-based practice, February 2007 summary. Worldviews of Evidence-Based Nursing, 5, 57–59. Stetler, C. B. (2010). Stetler model. En J. Rycroft-Malone & T. Bucknall (Eds.), Models and frameworks for implementing evidence-based practice: Linking evidence to action (pp. 51–77). Malden, MA: Wiley-Blackwell. Tayyib, N., Coyer, F., & Lewis, P. (2015). A two-arm cluster randomized control trial to determine the effectiveness of a pressure ulcer prevention bundle for critically ill patients. Journal of Nursing Scholarship, 47, 237– 247. Titler, M. (2010). Iowa model of evidence-based practice. In J. RycroftMalone & T. Bucknall (Eds.), Models and frameworks for implementing evidence-based practice: Linking evidence to action (pp. 137–144). Malden, MA: Wiley-Blackwell. 110 Titler, M. G., Kleiber, C., Steelman, V., Rakel, B., Budreau, G., Everett, L., … Goode, C. (2001). The Iowa model of evidence-based practice to promote quality care. Critical Care Nursing Clinics of North America, 13, 497–509. U.S. Code of Federal Regulations, 45 C.F.R. 46.102 (2009). Retrieved from http://www.hhs.gov/ohrp/sites/default/files/ohrp/policy/ohrpregulations.pdf. *World Health Organization. (2005). Bridging the “Know-Do” gap: Meeting on knowledge translation in global health. Retrieved from http://www.who.int/kms/WHO_EIP_KMS_2006_2.pdf. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 111 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Definir los nuevos términos presentados en el capítulo y distinguir los términos relacionados con la investigación cuantitativa y cualitativa. Diferenciar la investigación experimental de la no experimental. Identificar las tres tradiciones disciplinarias principales de la investigación cualitativa en enfermería. Describir el flujo y la secuencia de actividades en la investigación cuantitativa y cualitativa, y explicar en qué difieren. Términos clave Análisis estadístico Concepto Constructo Datos Datos cualitativos Datos cuantitativos Definición conceptual Definición operativa Diseño de investigación Diseño emergente Estudios clínicos Estudios de observación Etnografía Fenomenología Hipótesis 112 Informante Investigación experimental Investigación no experimental Muestra Participante en el estudio Población Protocolo de intervención Relación Relación causal (causa-efecto) Revisión bibliográfica Saturación Sujeto Tema Teoría Teoría fundamentada Variable Variable de resultado Variable dependiente Variable independiente LOS COMPONENTES DE LA INVESTIGACIÓN Como cualquier disciplina, la investigación tiene su propio lenguaje – su propia jerga–, que a veces puede ser intimidante. Hay que admitir que la jerga es abundante y puede ser confusa. Algunos términos usados en la investigación de enfermería tienen su origen en las ciencias sociales, pero en ocasiones se usan términos diferentes en la investigación médica. Además, ciertos términos son empleados por investigadores cuantitativos y cualitativos, pero otros los utilizan principalmente uno u otro grupo. Tenga paciencia mientras se cubren los términos clave que se encontrarán en la bibliografía de investigación. TABLA 3-1 Términos clave en la investigación cuantitativa y cualitativa Concepto Término cuantitativo Término cualitativo Sujeto — 113 Persona que aporta información Participante en el estudio — Participante en el estudio Informante, informante clave Persona que conduce el estudio Investigador Investigador — Conceptos Constructos Variables Fenómenos Conceptos — — Información recolectada Conexiones entre conceptos Datos (valores numéricos) Datos (descripciones narrativas) Relaciones (causaefecto, asociativa) Patrones de asociación Procesos de razonamiento lógico Razonamiento deductivo Razonamiento inductivo Lo que se investiga Las caras y los sitios de la investigación Cuando los investigadores responden una pregunta mediante la investigación sistematizada, realizan un estudio (o una investigación). Los estudios con seres humanos incluyen dos grupos de personas: los que realizan la investigación y los que proporcionan la información. En un estudio cuantitativo, las personas estudiadas se denominan sujetos o participantes en el estudio, como se muestra en la tabla 31. En un estudio cualitativo, las personas que cooperan en este se denominan participantes en el estudio o informantes. Quien conduce la investigación es el investigador. Los estudios por lo regular son realizados por un equipo de investigación, no por un solo investigador. TIP CÓMO SABER ¿Cómo puede saberse si un artículo que aparece en una revista de enfermería es un estudio? En las revistas especializadas en investigación (p. ej., Nursing Research), casi todos los artículos son reportes de investigación, pero en revistas especializadas suele haber una mezcla de artículos de investigación y otros que no lo son. A veces puede saberse por el título, pero no siempre. Sin embargo, los encabezados principales del artículo ayudan. Si no hay un encabezado titulado “Método” o “Diseño de la investigación” (la 114 sección que describe lo que hizo el investigador) y carece de uno de “Hallazgos” o “Resultados” (la sección que describe lo que averiguó el investigador), es probable que no se trate de un estudio. La investigación puede realizarse en diversas instalaciones (los tipos de lugares en los que se recolecta la información), como hospitales, hogares y otras instalaciones comunitarias. Un sitio es la locación específica para la investigación; puede ser una comunidad completa (p. ej., un vecindario haitiano en Miami) o una institución (p. ej., una clínica en una ciudad). Los investigadores a veces realizan estudios multicéntricos porque el uso de múltiples sitios ofrece un grupo más grande y por lo regular más diverso de participantes. Conceptos, constructos y teorías La investigación involucra problemas de la vida real, pero los estudios se conceptualizan en términos abstractos. Por ejemplo, dolor, fatiga y obesidad son abstracciones de características humanas. Estas abstracciones se llaman fenómenos (sobre todo en los estudios cualitativos) o conceptos. En ocasiones los investigadores usan el término constructo, que también se refiere a una abstracción, pero a menudo una inventada de manera deliberada (o construida). Por ejemplo, el cuidado personal en el modelo de Orem para el mantenimiento de la salud es un constructo. Los términos constructo y concepto a veces se emplean de manera indistinta, pero un constructo con frecuencia se refiere a una abstracción más compleja que un concepto. Una teoría es una explicación de algún aspecto de la realidad. En una teoría, los conceptos están entretejidos en un sistema coherente para describir o explicar algún aspecto del mundo. Las teorías desempeñan un papel en la investigación cuantitativa y cualitativa. En un estudio cuantitativo, los investigadores suelen comenzar con una teoría y, mediante el razonamiento deductivo, hacen predicciones acerca de cómo los fenómenos se comportarían en la vida real si la teoría fuera válida. Luego se ponen a prueba las predicciones específicas. En los estudios cualitativos, la teoría por lo regular es el producto de la investigación: los investigadores usan la información de los participantes en el estudio de manera inductiva para desarrollar una teoría basada en las experiencias de los participantes. 115 TIP El proceso de razonamiento para la deducción se relaciona con la investigación cuantitativa y la inducción se vincula con la investigación cualitativa. El suplemento en inglés del capítulo 3 en el sitio web explica e ilustra la diferencia. Variables En los estudios cuantitativos, los conceptos suelen nombrarse variables. Como el nombre lo indica, una variable, es algo que cambia. El peso, la ansiedad y la fatiga son variables, varían de una persona a otra. La mayoría de las características humanas son variables. Si todos pesáramos 68 kg, el peso no sería una variable, sería una constante. Sin embargo, es precisamente porque las personas y las condiciones varían que se realiza la mayor parte de la investigación. Los investigadores cuantitativos buscan comprender cómo o por qué las cosas varían, y aprender cómo las diferencias en una variable se relacionan con las diferencias en otras. Por ejemplo, en la investigación del cáncer pulmonar, este es una variable porque no todas las personas lo tienen. Los investigadores han estudiado factores que podrían vincularse con el cáncer pulmonar, como el tabaquismo. Este también se considera una variable dado que no todos fuman. Por lo tanto, una variable es cualquier cualidad de una persona, grupo o situación que varía o asume valores distintos. Las variables son los componentes principales de los estudios cuantitativos. TIP Todo estudio se enfoca en uno o más fenómenos, conceptos o variables, pero estos términos no se usan per se en los reportes de investigación. Por ejemplo, un reporte podría decir: “El objetivo de este estudio es examinar el efecto de la carga laboral del personal de enfermería en el cumplimiento de la higiene de manos”. Aunque el investigador no señala de modo explícito una variable, las variables en estudio son la carga laboral y el cumplimiento de la higiene de manos. Los conceptos clave o variables suelen indicarse en el título del estudio. Características de las variables Con frecuencia las variables son rasgos humanos inherentes, como la edad o el peso, pero en ocasiones los investigadores crean una 116 variable. Por ejemplo, si un investigador evaluara la efectividad de la analgesia controlada por el paciente en comparación con la analgesia intramuscular para aliviar el dolor después de la cirugía, algunos pacientes recibirían un tipo de analgesia y otros recibirían el otro. En el contexto de este estudio, el método para controlar el dolor es una variable porque distintos pacientes reciben diferentes métodos analgésicos. Ciertas variables asumen una amplia variedad de valores que puede representarse en un continuo (p. ej., la edad o el peso de una persona). Otras variables solo tienen unos cuantos valores; a veces estas variables proporcionan información cuantitativa (p. ej., número de hijos), pero otras solo colocan a las personas en categorías (p. ej., hombre, mujer u otro; o tipo sanguíneo A, B, AB u O). Variables dependientes e independientes Como se indica en el capítulo 1, muchos estudios buscan comprender las causas de los fenómenos. ¿Una intervención de enfermería produce mejorías en los resultados de los pacientes? ¿Fumar causa cáncer pulmonar? La causa supuesta es la variable independiente y el efecto supuesto es la variable dependiente o la variable de resultado. La variable dependiente es el resultado que los investigadores quieren comprender, explicar o predecir. En términos del esquema PICO explicado en el capítulo 2, la variable dependiente corresponde a la “O” (outcome, resultado). La variable independiente corresponde a la “I” (la intervención, influencia o exposición), más la “C” (la comparación). TIP En la búsqueda de evidencia, un profesional de enfermería podría querer aprender acerca de los efectos de una intervención o influencia (I), comparada con cualquier alternativa, en un resultado designado. Sin embargo, en un estudio para examinar una causa, los investigadores siempre especifican cuál es la intervención o influencia comparativa (la “C”). Los términos variable independiente y variable dependiente también pueden usarse para indicar la dirección de la influencia, más que la causa y el efecto. Por ejemplo, suponiendo que se comparan los niveles de depresión entre hombres y mujeres con diagnóstico de cáncer pancreático y se encuentra que los hombres se deprimen más. 117 No podría concluirse que la depresión fue causada por el género. Sin embargo, es claro que la dirección de la influencia va del género a la depresión: no tiene sentido sugerir que la depresión del paciente influyó en su género. En esta situación es apropiado considerar la depresión como la variable de resultado y el género como la variable independiente. TIP Pocos reportes de investigación etiquetan de manera explícita las variables como dependientes e independientes. Además, las variables (sobre todo las independientes) a veces no se describen explícitamente. Considérese la siguiente pregunta de investigación: ¿cuál es el efecto del ejercicio en la frecuencia cardiaca? En este ejemplo, la frecuencia cardiaca es la variable dependiente. Sin embargo, el ejercicio no es en sí mismo una variable. Por el contrario, la variable es el ejercicio frente a algo más (p. ej., la ausencia de ejercicio); “algo más” está implícito, no detallado en la pregunta de investigación. Muchos resultados tienen múltiples causas o influencias. Si se estudian factores que influyen en el índice de masa corporal de las personas, las variables independientes podrían ser la talla, la actividad física y la dieta. Además, dos o más variables de resultado podrían ser de interés. Por ejemplo, un investigador podría comparar dos intervenciones dietéticas alternativas en términos de peso, perfil de lípidos y autoestima de los participantes. Es frecuente diseñar estudios con múltiples variables independientes y dependientes. Las variables no son dependientes o independientes de manera inherente. Una variable dependiente en un estudio podría ser independiente en otro. Por ejemplo, un estudio podría examinar el efecto de una intervención de ejercicio (la variable independiente) en la osteoporosis (la variable dependiente) para responder una pregunta de tratamiento. Otro estudio podría investigar el efecto de la osteoporosis (la variable independiente) en la incidencia de fracturas óseas (la variable dependiente) para responder una pregunta de pronóstico. Así, el que una variable sea independiente o dependiente está en función del papel que tiene en un estudio particular. Ejemplo de variables independientes y dependientes Pregunta de investigación (pregunta de etiología/daño): entre los pacientes con insuficiencia cardiaca, ¿el volumen reducido de la 118 materia gris (medida en imágenes por resonancia magnética) se relaciona con un débil desempeño en las actividades fudamentales de la vida diaria? (Alosco et al., 2016). Variable independiente: volumen de materia gris en el cerebro. Variable dependiente: desempeño en actividades fundamentales de la vida diaria. Definiciones conceptuales y operativas Los conceptos de interés para los investigadores son abstracciones y las visiones del mundo de los investigadores delinean la definición de esos conceptos. Una definición conceptual es el significado teórico de un concepto. Los investigadores necesitan definir desde el punto de vista conceptual incluso los términos en apariencia claros. Un ejemplo típico es el concepto de caring, que en inglés significa atención, pero también interés, cariño. Morse y sus colaboradores (1990) examinaron cómo los investigadores y teóricos definían caring e identificaron cinco categorías de definiciones conceptuales: como un rasgo humano, un imperativo moral, un afecto, una relación interpersonal y una intervención terapéutica. Los investigadores que realizaron estudios sobre la atención (caring) necesitan aclarar cómo lo conceptualizaron. En estudios cualitativos, las definiciones conceptuales de fenómenos clave pueden ser un producto final relevante al reflejar la intención de dar significado a conceptos definidos por los individuos en estudio. Sin embargo, en los estudios cuantitativos los investigadores deben definir los conceptos desde el inicio, ya que tienen que decidir cómo se medirán las variables. Una definición operativa indica de modo específico lo que los investigadores deben hacer para medir el concepto y obtener la información necesaria. Es posible que los lectores de artículos de investigación no concuerden con la forma en que los investigadores conceptualizaron y dieron un concepto operativo a las variables. Sin embargo, la precisión en la definición es importante para comunicar lo que significan los conceptos en el contexto del estudio. Ejemplo de definiciones conceptuales y operativas Stoddard y sus colaboradores (2015) estudiaron la relación entre las expectativas esperanzadas del futuro de los adolescentes jóvenes por 119 una parte y el acoso (bullying) por el otro. Los investigadores definieron el acoso de modo conceptual como “comportamientos agresivos intencionales repetitivos y que imponen un desequilibrio en el poder entre los estudiantes que acosan y los estudiantes que son victimizados” (p. 422). Establecieron la definición operativa del acoso al formular un conjunto de 12 preguntas. Una inquiría acerca de con qué frecuencia en el último mes el participante en el estudio “dijo cosas sobre otro estudiante para hacer reír a los demás” (p. 426). Se pidió a los participantes que respondieran en una escala de 0 (nunca) a 5 (cinco o más veces). Datos Los datos de investigación son las piezas de información recolectada en un estudio. En los estudios cuantitativos, los investigadores identifican y definen sus variables y luego recolectan datos relevantes de los sujetos. Los valores reales de las variables del estudio constituyen los datos. Los investigadores cuantitativos recolectan sobre todo datos cuantitativos, información en forma numérica. Por ejemplo, si se condujera un estudio cuantitativo en el que la variable clave fuera la depresión, sería necesario medir qué tan deprimidos están los participantes. Podría preguntarse: “Durante la semana pasada, ¿qué tan deprimido diría que estuvo en una escala de 0 al 10, donde 0 significa “nada” y 10 significa “mucho”? El recuadro 3-1 presenta datos cuantitativos de tres personas ficticias. Los sujetos proporcionaron un número del continuo de 0 a 10 correspondiente a su grado de depresión: 9 para el sujeto 1 (un alto nivel de depresión), 0 para el sujeto 2 (ninguna depresión) y 4 para el sujeto 3 (depresión leve). En los estudios cualitativos, los investigadores recolectan sobre todo datos cualitativos; es decir, descripciones narrativas. Los datos narrativos pueden obtenerse mediante la conversación con los participantes, por medio de notas sobre su comportamiento en un ambiente natural o con registros narrativos, como los diarios. Suponiendo que se estudia la depresión de manera cualitativa. El recuadro 3-2 presenta datos cualitativos de tres participantes que responden en una conversación a la pregunta: “Dígame cómo se ha sentido últimamente, ¿se ha sentido triste o deprimido, o en general ha estado de buen ánimo?” En este caso los datos consisten en descripciones narrativas de valor del estado emocional de los 120 participantes. En los reportes de estudios cualitativos, los investigadores incluyen extractos de sus datos narrativos para sustentar sus interpretaciones. Recuadro 3-1 Ejemplo de datos cuantitativos Pregunta: Durante la semana pasada, ¿qué tan deprimido diría que estuvo en una escala de 0 a 10, donde 0 significa “nada” y 10 significa “mucho”? Datos: 9 (Sujeto 1) 0 (Sujeto 2) 4 (Sujeto 3) Recuadro 3-2 Ejemplo de datos cualitativos Pregunta: Dígame cómo se ha sentido últimamente, ¿se ha sentido triste o deprimido, o en general ha estado de buen ánimo? Datos: “Bien, en realidad he estado muy deprimido últimamente, a decir verdad. Despierto cada mañana y no puedo pensar en nada que me impulse. Ando triste por la casa todo el día, algo así como desesperado. No puedo sacudirme la tristeza y he empezado a pensar que necesito ir al psiquiatra.” (Participante 1) “No recuerdo haberme sentido mejor en mi vida. Me acaban de ascender a un nuevo puesto que me hace sentir que en realidad puedo avanzar en mi compañía. Además, me acabo de comprometer con un hombre realmente maravilloso que es muy especial.” (Participante 2) “He tenido subidas y bajadas en la semana pasada, pero en general las cosas están bien. No tengo mucho de qué quejarme.” (Participante 3) Relaciones Por lo general, los investigadores estudian fenómenos en relación con 121 otros fenómenos, examinan relaciones. Una relación es una conexión entre fenómenos; por ejemplo, los investigadores encontraron de manera repetida que existe una relación entre la frecuencia en que se gira a los pacientes confinados a la cama y la incidencia de úlceras por presión. Los estudios cuantitativos y cualitativos examinan las relaciones de distintas formas. En los estudios cuantitativos, los investigadores están interesados en la relación entre variables independientes y resultados. Las relaciones a menudo se expresan de modo explícito en términos cuantitativos, como más que o menos que. Considérese por ejemplo el peso de una persona como la variable de resultado. ¿Qué variables se relacionan con el peso de un individuo? Algunas posibilidades incluyen la talla, la ingestión calórica y el ejercicio. Para cada variable independiente puede hacerse una predicción sobre su relación con el resultado: Talla: las personas altas pesan más que las personas de talla baja. Ingestión calórica: las personas que ingieren abundantes calorías serán más pesadas que aquellas que ingieren pocas. Ejercicio: mientras menor sea la cantidad de ejercicio, mayor será el peso de la persona. Cada declaración expresa una relación anticipada entre el peso (el resultado) y una variable independiente mensurable. La mayor parte de la investigación cuantitativa se realiza para valorar si existen relaciones entre las variables y para medir qué tan fuerte es la relación. TIP Las relaciones se expresan de dos formas básicas. Primera, las relaciones pueden expresarse como “a más variable X, más (o menos) variable Y”. Por ejemplo, existe una relación entre la talla y el peso: con una mayor talla tiende a ser mayor el peso; es decir, las personas altas tienden a pesar más que las personas bajas. La segunda forma expresa relaciones como diferencias de grupo. Por ejemplo, existe una relación entre género y talla: los hombres tienden a ser más altos que las mujeres. Las variables pueden relacionarse entre sí de distintas maneras, incluidas las relaciones causales (o causa-efecto). En el paradigma positivista se asume que los fenómenos naturales tienen causas 122 antecedentes que pueden descubrirse. Por ejemplo, podría especularse que existe una relación causal entre la ingestión calórica y el peso: si todo lo demás fuera igual, ingerir más calorías produce mayor peso. Como se indica en el capítulo 1, muchos estudios cuantitativos exploran una causa, buscan aclarar las causas de los fenómenos. Ejemplo de un estudio de relaciones causales Bench y sus colaboradores (2015) estudiaron si un paquete de información para los pacientes dados de alta de cuidados intensivos y sus familias mejoraría el bienestar psicológico (ansiedad y depresión) 5 y 28 días después del egreso. No todas las relaciones pueden interpretarse como causales. Por ejemplo, existe una relación entre las temperaturas en la arteria pulmonar y la timpánica de una persona: los individuos con lecturas altas en una tienden a tener lecturas altas en la otra. Sin embargo, no puede decirse que la temperatura en la arteria pulmonar cause la temperatura timpánica o viceversa. En ocasiones este tipo de relación se refiere como relación asociativa (o funcional), no causal. Ejemplo de un estudio de relaciones asociativas Goh y sus colaboradores (2016) estudiaron los factores relacionados con el grado de satisfacción de los pacientes respecto a la atención de enfermería. Encontraron diferencias significativas en la satisfacción entre distintos subgrupos étnicos. Los investigadores cualitativos no se ocupan de cuantificar relaciones ni de probar y confirmar relaciones causales, sino que buscan patrones de asociación como una manera de aclarar el significado subyacente y las dimensiones de los fenómenos de interés. Los patrones de conceptos interconectados se identifican como una forma de comprender el todo. Ejemplo de estudio cualitativo de patrones Brooten y sus colaboradores (2016) estudiaron los rituales de padres caucásicos, afroamericanos e hispanos después de la muerte de un lactante o un niño en la unidad de cuidados intensivos. Informaron que las experiencias de los padres en duelo diferían en dos factores 123 importantes: (1) si eran inmigrantes recientes o no a Estados Unidos con barreras de idioma y (2) el nivel de los sistemas de apoyo familiar. CLASES PRINCIPALES DE INVESTIGACIÓN CUANTITATIVA Y CUALITATIVA Los investigadores suelen trabajar dentro de un paradigma consistente con su visión del mundo y que da origen a los tipos de preguntas que estimulan su curiosidad. En esta sección se describen brevemente las categorías de la investigación cuantitativa y cualitativa. Investigación cuantitativa: estudios experimentales y no experimentales Una distinción básica en los estudios cuantitativos radica entre la investigación experimental y la no experimental. En la investigación experimental, los investigadores introducen de manera activa una intervención o tratamiento, con más frecuencia para responder preguntas acerca del tratamiento. En la investigación no experimental, los investigadores son testigos, recolectan datos sin introducir los tratamientos (por lo general para responder preguntas sobre etiología, pronóstico o diagnóstico). Por ejemplo, si un investigador diera hojuelas de salvado a un grupo de sujetos y jugo de ciruela a otro para evaluar cuál método facilita más la evacuación, el estudio sería experimental porque el investigador intervino. Por otra parte, si un investigador comparara los patrones de evacuación de dos grupos cuyos patrones alimentarios regulares difieren, el estudio no sería experimental porque no hay intervención. En la investigación médica y epidemiológica, los estudios experimentales casi siempre se llaman estudios clínicos y las indagaciones no experimentales se llaman estudios de observación. Los estudios experimentales se diseñan de manera explícita para evaluar relaciones causales: probar si una intervención causó cambios en el resultado. A veces los estudios no experimentales también exploran relaciones causales, pero las inferencias causales en la investigación no experimental son engañosas y menos concluyentes por razones que se explican en un capítulo posterior. 124 Ejemplo de investigación experimental En su estudio experimental, Demirel y Guler (2015) evaluaron la eficacia de la estimulación uterina y la estimulación del pezón en la duración del parto y la incidencia de inducción artificial entre mujeres que dieron a luz por vía vaginal. Algunas participantes en el estudio recibieron estimulación del pezón, otras recibieron estimulación uterina y algunas no recibieron ninguna. En el ejemplo, los investigadores intervinieron con un diseño en el que algunas mujeres reciben una de dos intervenciones y otras no reciben ninguna intervención especial. En otras palabras, el investigador controló la variable independiente, que en este caso eran las intervenciones de estimulación. Ejemplo de investigación no experimental Lai y sus colaboradores (2015) compararon a mujeres que tuvieron parto vaginal y las que se sometieron a operación cesárea en términos de fatiga posparto y vínculo materno infantil. Las mujeres que parieron por cesárea tuvieron mayor fatiga, lo que a su vez se relacionó con un vínculo materno infantil más débil. En este estudio no experimental para resolver una pregunta de pronóstico, los investigadores no intervinieron de ningún modo. Estaban interesados en una población similar, como en el ejemplo anterior (mujeres que dan a luz), pero su intención era explorar las relaciones entre las condiciones existentes más que probar una posible solución a un problema. Investigación cualitativa: tradiciones disciplinarias Muchos estudios de enfermería están arraigados en tradiciones de investigación originadas en la antropología, la sociología y la psicología. Aquí se describen tres de estas tradiciones. El capítulo 11 presenta una discusión más completa de estas y otras tradiciones, y los métodos relacionados con las mismas. La tradición de la teoría fundamentada busca describir y comprender procesos psicológicos sociales clave. La teoría fundamentada fue desarrollada en la década de 1960 por dos sociólogos, Glaser y Strauss (1967). El centro de la mayoría de los 125 estudios de teoría fundamentada está en una experiencia social en desarrollo: las fases social y psicológica que caracterizan un evento o episodio particular. Un componente principal de la teoría fundamentada es el descubrimiento de una variable nuclear que resulta crucial para explicar lo que ocurre en esa escena social. Los investigadores de la teoría fundamentada buscan generar explicaciones de fenómenos que se originan en la realidad. Ejemplo de estudio por teoría fundamentada Keogh y sus colaboradores (2015) usaron métodos de teoría fundamentada para comprender cómo los usuarios de servicios de salud mental hacían la transición de su casa a una estancia en el hospital. Los investigadores encontraron que la variable central era el manejo que hacían los pacientes de las expectativas preconcebidas. La fenomenología se encarga de las experiencias humanas; es una estrategia para pensar en cómo son las experiencias de vida de las personas y lo que significan. El investigador fenomenológico hace las preguntas: ¿cuál es la esencia de este fenómeno tal como lo experimentan estas personas? o ¿cuál es el significado del fenómeno para quienes lo experimentan? Ejemplo de un estudio fenomenológico Tornøe y colaboradores (2015) usaron una estrategia fenomenológica en su estudio de experiencias de profesionales de enfermería acerca de la atención espiritual y existencial para pacientes moribundos en un hospital general. La etnografía, la principal tradición de investigación en la antropología, proporciona un marco para estudiar de manera holística los patrones y formas de vida de un grupo cultural definido. Por lo general, los etnógrafos realizan un extenso trabajo de campo y a menudo participan en lo posible en la vida de la cultura que estudian. Los etnógrafos buscan aprender de los miembros de un grupo cultural, comprender su visión del mundo y describir sus costumbres y normas. Ejemplo de un estudio etnográfico 126 Sandvoll y sus colaboradores (2015) usaron métodos etnográficos para explorar cómo los miembros del personal enfrentaban los comportamientos desagradables de los residentes en dos asilos públicos en Noruega. PASOS PRINCIPALES EN UN ESTUDIO CUANTITATIVO En los estudios cuantitativos, los investigadores van del punto inicial de un estudio (presentación de una pregunta) al punto final (obtención de una respuesta) en una secuencia más bien lineal de pasos muy similar en todos los estudios (véase la fig. 3-1 en la siguiente página). Esta sección describe este flujo y la siguiente describe en qué difieren los estudios cualitativos. Fase 1: la fase conceptual Los primeros pasos de un estudio cuantitativo suelen implicar actividades con un fuerte elemento conceptual. Durante esta fase, los investigadores recurren a habilidades como la creatividad, el razonamiento deductivo y un fundamento en evidencia de investigación sobre el tema de interés. Paso 1: formulación y delimitación del problema Los investigadores cuantitativos comienzan con la identificación de un problema de investigación interesante y formulan preguntas de investigación. Éstas identifican cuáles son las variables del estudio. Para desarrollar preguntas, los profesionales de enfermería investigadores deben considerar aspectos básicos (¿es importante este problema?), aspectos teóricos (¿existe un marco conceptual para este problema?), aspectos metodológicos (¿cómo puede responderse esta pregunta para obtener evidencia de alta calidad?) y aspectos éticos (¿hay posibilidades de responder esta pregunta de una manera ética?). Paso 2: revisión de la bibliografía relacionada La investigación cuantitativa se conduce dentro del contexto del conocimiento previo. Por lo general los investigadores cuantitativos buscan comprender lo que ya se sabe de un tema mediante una 127 revisión bibliográfica minuciosa antes de obtener cualquier dato. Figura 3-1 Flujo de pasos en un estudio cuantitativo. Paso 3: realización del trabajo de campo clínico Los investigadores que realizan un estudio clínico suelen beneficiarse del tiempo que pasan en instalaciones clínicas relevantes (en el 128 campo), de discusiones del tema con profesionales clínicos y de la observación de las prácticas vigentes. Este trabajo de campo clínico puede proporcionar perspectivas sobre los puntos de vista de los profesionales clínicos y los pacientes. Paso 4: definición del marco y desarrollo de definiciones conceptuales Cuando la investigación clínica se realiza dentro del contexto de un marco teórico, los hallazgos pueden tener una relevancia y utilidad mayores. Incluso cuando la pregunta de investigación no está embebida en una teoría, los investigadores deben tener una justificación racional y una visión clara de los conceptos que estudian. Paso 5: formulación de hipótesis Las hipótesis señalan las expectativas de los investigadores sobre las relaciones entre las variables de estudio. Las hipótesis son predicciones de las relaciones que los investigadores esperan observar en sus datos del estudio. La pregunta de investigación identifica los conceptos de interés y pregunta cómo los conceptos podrían estar relacionados; una hipótesis es una respuesta anticipada. La mayoría de los estudios cuantitativos se diseña para probar hipótesis mediante el análisis estadístico. Fase 2: la fase de diseño y planeación En la segunda fase principal de un estudio cuantitativo, los investigadores deciden los métodos que usarán para responder la pregunta de investigación. Los investigadores toman muchas decisiones metodológicas que tienen implicaciones cruciales para la calidad de la evidencia del estudio. Paso 6: selección de un diseño de investigación El diseño de investigación es el plan general para obtener respuestas a las preguntas de investigación. Los diseños cuantitativos tienden a ser estructurados y controlados, con la finalidad de minimizar las tendencias. Los diseños de investigación también indican la frecuencia con la que se obtendrán los datos y los tipos de 129 comparaciones que se harán. El diseño de investigación es la columna estructural del estudio. Paso 7: desarrollo de los protocolos de intervención En la investigación experimental, los investigadores crean la variable independiente, lo que significa que los participantes se exponen a distintos tratamientos. Debe desarrollarse un protocolo de intervención para el estudio en el que se especifica de modo exacto lo que conlleva la intervención (p. ej., quién la administrará, cuánto tiempo durará el periodo terapéutico, etc.) y cuál será la condición alternativa. Este paso no es necesario en la investigación no experimental. Paso 8: identificación de la población Los investigadores cuantitativos deben especificar qué características han de tener los participantes; es decir, deben identificar la población que van a estudiar. Una población incluye a todos los individuos u objetos con características definitorias comunes (el componente “P” de las preguntas PICO). Paso 9: diseño del plan de muestreo Por lo general, los investigadores recolectan datos de una muestra, que es un subconjunto de la población. El plan de muestreo de los investigadores especifica cómo se elegirá la muestra y cuántos sujetos tendrá. El objetivo es tener una muestra que refleje de modo apropiado los rasgos de la población. Paso 10: especificación de métodos para medir las variables de investigación Los investigadores cuantitativos deben encontrar métodos para medir las variables de investigación de forma exacta. Existen diversas estrategias para la recolección de datos cuantitativos; los principales métodos son autorreportes (p. ej., entrevistas y cuestionarios), observaciones (p. ej., vigilar y registrar el comportamiento de las personas) y mediciones biofisiológicas. La tarea de medir las variables de investigación y desarrollar un plan de recolección de datos es compleja y difícil. 130 Paso 11: desarrollo de métodos para salvaguardar los derechos humanos/animales La mayor parte de la investigación de enfermería se realiza en sujetos humanos, aunque alguna incluye animales. En cualquier de los casos, es preciso desarrollar procedimientos para asegurar que el estudio se apegue a principios éticos. Paso 12: revisión y finalización del plan de investigación Antes de recolectar datos, los investigadores por lo regular realizan valoraciones para asegurar que los procedimientos funcionen con fluidez. Por ejemplo, pueden evaluar la legibilidad de los mate-riales escritos para ver si los participantes con habilidades de lectura limitadas logran comprenderlos. Los investigadores casi siempre piden una crítica a su plan de investigación a revisores para obtener una realimentación clínica y metodológica. Los investigadores que buscan apoyo financiero presentan su propuesta a una fuente de patrocinio y usualmente los revisores sugieren mejoras. Fase 3: la fase empírica La tercera fase de los estudios cuantitativos implica la recolección de los datos de investigación. Esta fase suele ser la que más tiempo requiere. Es probable que la recolección de datos demande meses de trabajo. Paso 13: recolección de datos La recolección real de datos en un estudio cuantitativo con frecuencia procede según un plan establecido. Por lo general el plan indica los procedimientos para entrenar al personal que obtendrá los datos, hacer la recolección real de los datos (p. ej., dónde y cuándo se reunirán los datos) y registrar la información. Paso 14: preparación de los datos para su análisis Los datos recolectados en un estudio cuantitativo deben prepararse para su análisis. Por ejemplo, un paso preliminar es la codificación, que implica la traducción de datos verbales a una forma numérica (p. ej., codificar la información sobre el género como “1” para mujeres, 131 “2” para hombres y “3” para otro). Fase 4: la fase analítica Los datos cuantitativos deben someterse a análisis e interpretación, lo que ocurre en la cuarta fase principal de un proyecto. Paso 15: análisis de datos Para responder las preguntas de investigación y probar las hipótesis, los investigadores analizan sus datos de manera sistemática. Los datos cuantitativos se examinan mediante análisis estadísticos, que incluyen algunos procedimientos sencillos (p. ej., cálculo de un promedio) y otros métodos más complejos y sofisticados. Paso 16: interpretación de resultados La interpretación implica dar sentido a los resultados del estudio y examinar sus implicaciones. Los investigadores intentan explicar los hallazgos a la luz de la evidencia previa, de la teoría y la experiencia clínica, y según la adecuación de los métodos que usaron en el estudio. La interpretación también conlleva llegar a conclusiones de la relevancia clínica de la nueva evidencia. Fase 5: la fase de divulgación En la fase analítica, los investigadores cierran el ciclo: se responden las preguntas postuladas al inicio. Sin embargo, el trabajo de los investigadores no se completa hasta que los resultados del estudio se divulguen. Paso 17: comunicación de los hallazgos Un estudio no puede aportar evidencia a la práctica de la enfermería si los resultados no se comunican. Otra tarea, a menudo la última, de un proyecto de investigación es preparar un reporte de investigación que pueda compartirse con otros. En el siguiente capítulo se describen los reportes de investigación. Paso 18: uso de los hallazgos en la práctica 132 Lo ideal es que el paso final de un estudio de alta calidad sea planificar su empleo en contextos prácticos. Aunque los investigadores en enfermería no puedan implementar un plan para usar los hallazgos de la investigación, pueden contribuir al proceso mediante el desarrollo de recomendaciones acerca de cómo podría usarse la evidencia en la práctica, al asegurar que se aporte información adecuada para un metaanálisis y al buscar oportunidades para divulgar los hallazgos a los profesionales de enfermería clínica. ACTIVIDADES EN UN ESTUDIO CUALITATIVO La investigación cuantitativa implica una progresión bastante lineal de tareas: los investigadores planean los pasos a dar y luego los siguen. En contraste, en los estudios cualitativos la progresión se aproxima más a un círculo que a una línea recta. Los investigadores cualitativos examinan e interpretan datos de manera continua, y toman decisiones sobre cómo proceder con base en lo que se descubre (fig. 3-2). Como los investigadores cualitativos tienen un enfoque flexible, no puede mostrarse con exactitud el flujo de actividades; el flujo varía de un estudio a otro y los investigadores mismos no pueden saber con anticipación cómo evolucionará el estudio. Se presenta una noción general de los estudios cualitativos mediante la descripción de las principales actividades y la indicación acerca de cuándo podrían realizarse. 133 Figura 3-2 Flujo de actividades en un estudio cualitativo. Conceptualización y planeación de un estudio cualitativo Identificación del problema de investigación Los investigadores cualitativos suelen comenzar con un tema amplio, a menudo se enfocan en un aspecto del que se sabe poco. Los investigadores cualitativos con frecuencia proceden con una pregunta inicial bastante amplia que permite reducir y delinear el enfoque con más claridad una vez que el estudio está en proceso (en algunos casos se le llama pregunta eje o pregunta de investigación). Realización de una revisión bibliográfica Algunos investigadores cualitativos evitan consultar la bibliografía antes de recolectar datos. Les preocupa que los estudios anteriores influyan en la conceptualización del fenómeno en estudio, que ellos creen debe basarse en los puntos de vista de los participantes más que en los hallazgos previos. Otros consideran que los investigadores deben realizar al menos una revisión bibliográfica breve al principio. En cualquier caso, los investigadores cualitativos casi siempre 134 encuentran un conjunto de trabajo anterior relativamente pequeño por el tipo de preguntas que formulan. Selección de los sitios de investigación y obtención de permiso de entrada Antes de ir al campo, los investigadores cualitativos deben identificar un sitio apropiado. Por ejemplo, si el tema son las creencias de salud en la población urbana pobre, debe identificarse un vecindario urbano con una concentración de residentes con ingresos bajos. En algunos casos, los investigadores pueden ingresar al sitio elegido, pero en otros necesitan negociar para conseguir el acceso. Por lo general esto incluye negociaciones con representantes que tienen autoridad para permitir el ingreso a su mundo. TIP El proceso de conseguir permiso de entrar a un sitio de investigación casi siempre se relaciona con la práctica de trabajo de campo en estudios cualitativos, pero los investigadores cuantitativos también suelen necesitar que se les autorice entrar a sitios para recolectar datos. Desarrollo de la estrategia general Los investigadores cuantitativos no recolectan datos antes de finalizar el diseño de investigación. En contraste, los investigadores cualitativos usan un diseño emergente que se materializa durante la recolección de datos. Ciertas características de diseño están guiadas por la tradición cualitativa del estudio, pero los estudios cualitativos rara vez tienen diseños rígidos que prohíben los cambios durante el trabajo en campo. Consideración de aspectos éticos Los investigadores cualitativos también deben desarrollar planes para resolver problemas éticos; en realidad, existen preocupaciones especiales en los estudios cualitativos por la naturaleza más íntima de la relación que suele desarrollarse entre investigadores y participantes. Conducción de un estudio cualitativo 135 En los estudios cualitativos, las tareas de muestreo, recolección y análisis de datos e interpretación casi siempre son iterativas. Los investigadores cualitativos comienzan hablando con las personas que experimentan de manera directa el fenómeno en estudio. Las discusiones y observaciones tienen una estructura laxa, lo que permite a los participantes expresar un conjunto completo de creencias, sentimientos y comportamientos. El análisis y la interpretación son actividades continuas que guían las elecciones sobre los “siguientes pasos”. El proceso del análisis de datos conlleva la agrupación de la información narrativa relacionada en un esquema coherente. Mediante el razonamiento inductivo, los investigadores identifican temas y categorías que se usan para construir una descripción vasta o teoría del fenómeno. La recolección de datos se vuelve cada vez más intencional: conforme se desarrollan las conceptualizaciones, los investigadores buscan a los participantes que puedan confirmar y enriquecer la compresión teórica, lo mismo que a participantes que puedan ponerla en duda. Los investigadores cuantitativos deciden con anticipación cuántos sujetos incluirán en el estudio, pero las decisiones de los investigadores cualitativos para el muestreo están guiadas por los datos. Muchos investigadores cualitativos usan el principio de saturación, que ocurre cuando los relatos de los participantes sobre sus experiencias se vuelven redundantes, de manera que no puede obtenerse nueva información con la recolección adicional de datos. Los investigadores cuantitativos buscan obtener datos de buena calidad a través de la medición de sus variables con instrumentos de exactitud y validez demostradas. En contraste, los investigadores cualitativos son el principal instrumento de recolección de datos y deben tomar medidas para demostrar la confianza de los mismos. La característica central de estos esfuerzos es confirmar que los hallazgos son un reflejo exacto de los puntos de vista de los participantes más que las percepciones de los investigadores. Por ejemplo, una actividad confirmatoria consiste en regresar con los participantes, compartir con ellos las interpretaciones preliminares y pedirles que evalúen si el análisis temático del investigador es consistente con sus experiencias. Los investigadores cualitativos de enfermería también se esfuerzan en compartir sus hallazgos en conferencias y artículos de revistas especializadas. Los estudios cualitativos ayudan a delinear las 136 percepciones que los profesionales de enfermería tienen de un problema, sus conceptualizaciones de las posibles soluciones y su comprensión de las preocupaciones y experiencias de los pacientes. TIP Una tendencia emergente es que los investigadores diseñen estudios de métodos mixtos que incluyen la recolección, el análisis y la integración de datos cuantitativos y cualitativos. La investigación con métodos mixtos se estudia en el capítulo 13. PREGUNTAS GENERALES EN LA REVISIÓN DE UN ESTUDIO El recuadro 3-3 presenta algunas sugerencias adicionales para realizar una revisión preliminar de un reporte de investigación con base en los conceptos explicados en este capítulo. Estos lineamientos complementan los presentados en el recuadro 1-1 (véase el capítulo 1). Recuadro 3-3 Preguntas adicionales para la revisión preliminar de un estudio 1. ¿Acerca de qué fue el estudio? ¿Cuáles fueron los principales fenómenos, conceptos o constructos en investigación? 2. Si el estudio fue cuantitativo, ¿cuáles fueron las variables independientes y dependientes? 3. ¿El investigador examinó las relaciones o patrones de asociación entre las variables o conceptos? ¿El reporte incluyó la posibilidad de una relación causal? 4. ¿Se definieron los conceptos tanto desde el punto de vista conceptual como del operativo? 5. ¿Qué tipo de estudio parece en términos de los tipos descritos en este capítulo: experimental o no experimental/de observación? ¿Fue de teoría fundamentada, fenomenológico o etnográfico? 6. ¿El reporte aporta información que sugiera cuánto tiempo tardó en completarse el estudio? EJEMPLOS DE INVESTIGACIÓN CON 137 EJERCICIOS DE PENSAMIENTO CRÍTICO En esta sección se ilustra la progresión de las actividades y se discute el esquema temporal de un estudio realizado por la segunda autora de este libro. Lea el resumen de la investigación y luego responda las preguntas de pensamiento crítico que siguen; de ser necesario, consulte el reporte completo de la investigación. El ejemplo 1 se presenta en la sección Critical Thinking Activity en el sitio web . Las preguntas de pensamiento crítico para los ejemplos 2 y 3 se basan en los estudios que aparecen en los apéndices A y B de este libro. Los comentarios en inglés de las autoras a estos ejercicios están en la sección Students Resources en . EJEMPLO 1: ESQUEMA DEL PROYECTO PARA UN ESTUDIO CUANTITATIVO Estudio. Sintomatología depresiva posparto: resultados de una encuesta nacional en dos etapas en Estados Unidos (Beck et al., 2011). Objetivo del estudio. Beck y sus colaboradores (2011) realizaron un estudio para calcular la prevalencia de madres con niveles altos de síntomas de depresión posparto (DPP) en Estados Unidos y los factores relacionados con las diferencias en los niveles sintomáticos. Métodos de estudio. Este estudio se completó en menos de 3 años. Las actividades clave y las decisiones metodológicas incluyeron las siguientes: Fase 1. Fase conceptual: 1 mes. Beck había sido miembro del Listening to Mothers II National Advisory Council. Los datos de su encuesta nacional (the Childbirth Connection: Listening to Mothers II U.S. National Survey) ya se habían recolectado cuando se requirió a Beck para analizar las variables en la encuesta relativas a los síntomas de DPP. La primera fase tardó solo 1 mes porque la recolección de datos ya se había completado, y Beck, una experta mundial en DPP, solo necesitó actualizar una revisión bibliográfica. Fase 2. Fase de diseño y planeación: 3 meses. La fase de diseño incluyó la identificación de las variables de la encuesta nacional en las que los investigadores enfocarían su análisis, entre los cientos de variables. Además, las preguntas de investigación se formalizaron durante esta fase, 138 en la que también se obtuvo la aprobación de un comité de asuntos humanos. Fase 3. Fase empírica: 0 meses. En este estudio ya se habían recolectado los datos de casi 1 000 mujeres en el puerperio. Fase 4. Fase analítica: 12 meses. Se realizaron los análisis estadísticos para (1) calcular el porcentaje de nuevas madres que tenían niveles altos de síntomas de DPP y (2) identificar cuáles variables demográficas, anteparto, intraparto y posparto tenían una relación significativa con los valores sintomáticos altos. Fase 5. Fase de divulgación: 18 meses. Los investigadores prepararon y presentaron su reporte al Journal of Midwifery & Women’s Health para su posible publicación. Fue aceptado en 5 meses y estuvo “en prensa” (en espera de publicación) otros 4 meses antes de ser publicado. El artículo recibió el premio al mejor artículo de investigación de 2012 de Journal of Midwifery & Women’s Health. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 3-3 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿Describiría el método para recolección de datos como autorreporte o como observación? b. ¿Cómo evaluaría el plan de divulgación de Beck y sus colaboradores? c. ¿Cree que se asignó un tiempo apropiado a las diversas fases y pasos de este estudio? d. ¿Habría sido apropiado que los investigadores respondieran la pregunta de investigación con métodos de investigación cualitativa? ¿Por qué? EJEMPLO 2: INVESTIGACIÓN CUANTITATIVA EN EL APÉNDICE A • Lea el resumen y la introducción del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 139 1. Responda las preguntas relevantes del recuadro 3-3 respecto a este estudio. 2. Considere también las siguientes preguntas enfocadas: a. Comente sobre la composición del equipo de investigación. b. ¿Se presentaron datos reales de los participantes del estudio? c. ¿Habría sido posible que los investigadores usaran un diseño experimental? EJEMPLO 3: INVESTIGACIÓN CUALITATIVA EN EL APÉNDICE B • Lea el resumen y la introducción del estudio de Beck y Watson (2010) (“Parto posterior a un parto traumático”) en el apéndice B de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 3-3 respecto a este estudio. 2. Considere también las siguientes preguntas enfocadas: a. Encuentre un ejemplo de datos reales. (Será necesario revisar la sección “Resultados” del estudio.) b. ¿Cuánto tiempo les llevó a Beck y Watson recolectar los datos? (Encontrará esta información en la sección “Procedimiento”.) c. ¿Cuánto tiempo pasó entre la aceptación del documento para su publicación y su publicación real? (Encontrará la información relevante al final del documento.) ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Deductive and Inductive Reasoning. Respuestas a los ejercicios de pensamiento crítico para los ejemplos 2 y 3. Recursos en Internet con sitios web útiles para el capítulo 3. Un artículo de investigación de una revista de Wolters Kluwer: el estudio de Alosco et al., descrito en la p. 44. También están disponibles en inglés más auxiliares de estudio, 140 incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. Las personas que aportan información a los investigadores en un estudio se llaman sujetos o participantes del estudio en la investigación cuantitativa, o participantes del estudio o informantes en la investigación cualitativa; en conjunto, constituyen la muestra. El sitio es la locación para la investigación; los investigadores a veces realizan estudios multi-céntricos. Los investigadores indagan conceptos y fenómenos (o constructos), que son abstracciones inferidas a partir del comportamiento o las características de las personas. Los conceptos son los componentes que conforman las teorías, que son explicaciones sistemáticas de algún aspecto del mundo real. En los estudios cuantitativos, los conceptos se llaman variables. Una variable es una característica o cualidad que asume distintos valores (es decir, varía de una persona u objeto a otro). La variable dependiente (o resultado) es el comportamiento, característica o resultado que el investigador está interesado en explicar, predecir o modificar (la “O” en el esquema PICO). La variable independiente es la causa supuesta o la influencia en la variable dependiente. La variable independiente corresponde a los componentes “I” y “C” del esquema PICO. Una definición conceptual describe el significado abstracto de un concepto que se estudia. Una definición operativa especifica cómo se medirá la variable. Los datos –la información recolectada durante un estudio– 141 pueden asumir la forma de valores numéricos (datos cuantitativos) o información narrativa (datos cualitativos). Una relación es una conexión (o patrón de asociación) entre variables. Los investigadores cuan-titativos estudian la relación entre variables independientes y variables de resultado. Cuando la variable independiente causa o afecta el resultado, se trata de una relación causal (o causa-efecto). En una relación asociativa (o funcional), las variables se relacionan de manera no causal. Una distinción clave en los estudios cuantitativos radica entre la investigación experimental, en la que los investigadores intervienen de manera activa para probar una intervención o un tratamiento, y la investigación no experimental (o de observación), en la que los investigadores recolectan datos sobre fenómenos existentes sin intervenir. La investigación cualitativa por lo regular se origina en tradiciones de investigación que nacen en otras disciplinas. Tres de estas tradiciones son la teoría fundamentada, la fenomenología y la etnografía. La teoría fundamentada busca describir y comprender procesos psicológicos sociales clave que ocurren en un escenario social. La fenomenología se enfoca en las experiencias vividas de los seres humanos y es una estrategia para obtener información acerca de cuáles son las experiencias de vida de las personas y qué significan. La etnografía proporciona un marco para estudiar de forma holística los significados, patrones y formas de vida de una cultura. En un estudio cuantitativo, los investigadores casi siempre avanzan de modo lineal, desde la formulación de preguntas de investigación hasta encontrar su respuesta. Las fases principales de un estudio cuantitativo son la conceptual, de planeación, empírica, analítica y de difusión. La fase conceptual incluye (1) definición del problema a estudiar, (2) una revisión bibliográfica, (3) realización del trabajo de campo clínico para los estudios clínicos, (4) desarrollo de un 142 marco y definiciones conceptuales, y (5) formulación de las hipótesis que van a probarse. La fase de planeación comprende (6) selección de un diseño de investigación, (7) desarrollo de protocolos de intervención si el estudio es experimental, (8) especificación de la población, (9) creación de un plan para seleccionar una muestra, (10) especificación de un plan de recolección de datos y métodos para medir las variables, (11) desarrollo de estrategias para salvaguardar los derechos de los sujetos y (12) finalizar el plan de investigación. La fase empírica implica (13) recolección de datos y (14) preparación de datos para análisis (p. ej., codificación de datos). La fase analítica abarca (15) realización de los análisis estadísticos y (16) interpretación de los resultados. La fase de divulgación incluye (17) comunicación de los hallazgos y (18) promoción del uso de la evidencia del estudio en la práctica de la enfermería. El flujo de actividades en un estudio cuantitativo es más flexible y menos lineal. Los estudios cualitativos casi siempre tienen un diseño emergente que evoluciona durante la recolección de datos. Los investigadores cualitativos comienzan con una pregunta amplia sobre un fenómeno de interés y suelen enfocarse en un aspecto poco estudiado. En la fase temprana de un estudio cualitativo, los investigadores seleccionan un sitio y buscan conseguir permiso de entrar al mismo, lo que por lo general implica contar con la cooperación de quienes lo resguardan. Una vez en el campo, los investigadores seleccionan informantes, recolectan datos y luego los analizan e interpretan de forma iterativa; las experiencias durante la recolección de datos son una ayuda continua para delinear el diseño del estudio. El análisis temprano en la investigación cualitativa conduce a refinamientos en el muestreo y la recolección de datos, hasta alcanzar la saturación (redundancia de información). El análisis casi siempre implica una búsqueda de temas o categorías cruciales. 143 Tanto los investigadores cuantitativos como los cualitativos divulgan sus hallazgos, por lo general mediante la publicación de reportes de investigación en revistas especializadas. REFERENCIAS DEL CAPÍTULO 3 **Alosco, M., Brickman, A., Spitznagel, M., Narkhede, A., Griffith, E., Cohen, R., … Gunstad, J. (2016). Reduced gray matter volume is associated with poorer instrumental activities of daily living performance in heart failure. Journal of Cardiovascular Nursing, 31, 31–41. Beck, C. T., Gable, R. K., Sakala, C., & Declercq, E. R. (2011). Postpartum depressive symptomatology: Results from a two-stage U.S. national survey. Journal of Midwifery & Women’s Health, 56, 427–435. *Bench, S., Day, T., Heelas, K., Hopkins, P., White, C., & Griffiths, P. (2015). Evaluating the feasibility and effectiveness of a critical care discharge information pack for patients and their families: A pilot cluster randomised controlled trial. BMJ Open, 5(11), e006852. Brooten, D., Youngblut, J. M., Charles, D., Roche, R., Hidalgo, I., & Malkawi, F. (2016). Death rituals reported by White, Black, and Hispanic parents following the ICU death of an infant or child. Journal of Pediatric Nursing, 31, 132–140. Demirel, G., & Guler, H. (2015). The effect of uterine and nipple stimulation on induction with oxytocin and the labor process. Worldviews on Evidence-Based Nursing, 12, 273–280. Glaser, B. G., & Strauss, A. L. (1967). The discovery of grounded theory: Strategies for qualitative research. Piscataway, NJ: Aldine. Goh, M. L., Ang, E. N., Chan, Y., He, H. G., & Vehviläinen-Julkunen, K. (2016). A descriptive quantitative study on multi-ethnic patient satisfaction with nursing care as measured by the Revised Humane Caring Scale. Applied Nursing Research, 31, 126–131. Keogh, B., Callaghan, P., & Higgins, A. (2015). Managing preconceived expectations: Mental health service users’ experiences of going home from hospital: A grounded theory study. Journal of Psychiatric and Mental Health Nursing, 22, 715–723. Lai, Y., Hung, C., Stocker, J., Chan, T., & Liu, Y. (2015). Postpartum fatigue, baby-care activities, and maternal-infant attachment of vaginal and cesarean births following rooming-in. Applied Nursing Research, 28, 116– 120. Morse, J. M., Solberg, S. M., Neander, W. L., Bottorff, J. L., & Johnson, J. L. (1990). Concepts of caring and caring as a concept. Advances in Nursing Science, 13, 1–14. *Sandvoll, A., Grov, E., Kristoffersen, K., & Hauge, S. (2015). When care 144 situations evoke difficult emotions in nursing staff members: An ethnographic study in two Norwegian nursing homes. BMC Nursing, 14, 40. Stoddard, S., Varela, J., & Zimmerman, M. (2015). Future expectations, attitude toward violence, and bullying perpetration during early adolescence: A mediation evaluation. Nursing Research, 64, 422–433. *Tornøe, K., Danbolt, L., Kvigne, K., & Sørlie, V. (2015). The challenge of consolation: Nurses’ experiences with spiritual and existential care for the dying—a phenomenological hermeneutical study. BMC Nursing, 14, 62. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 145 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Identificar y describir las principales secciones de un artículo de investigación en una revista. Caracterizar el estilo usado en los reportes de investigación cuantitativa y cualitativa. Leer un artículo de investigación y captar su “historia” a grandes rasgos. Describir los aspectos de una crítica de la investigación. Comprender las múltiples dificultades que enfrentan los investigadores e identificar algunas herramientas para salvar las dificultades metodológicas. Definir los términos nuevos del capítulo. Términos clave Aleatoriedad Artículo de investigación Cegamiento Confiabilidad Confianza Control de la investigación Credibilidad Crítica Formato IMRAD Hallazgos Inferencia 146 Mérito científico Nivel de significancia Placebo Prueba estadística Reflexividad Resumen Sesgo Significancia estadística Transferibilidad Triangulación Validez Valor p Variable de confusión La evidencia de los estudios de enfermería se comunica mediante reportes de investigación que describen lo que se estudió, cómo se estudió y lo que se encontró. Los reportes de investigación suelen ser intimidantes para los lectores sin entrenamiento en investigación. Este capítulo busca hacer más accesibles los reportes de investigación y también presenta cierta guía sobre el análisis crítico de estos. TIPOS DE REPORTES DE INVESTIGACIÓN Lo más probable es que los profesionales de enfermería encuentren evidencia de investigación en revistas o en congresos científicos. Los artículos de investigación son descripciones de los estudios que se publican en revistas especializadas. La competencia por el espacio en las revistas es entusiasta, por lo que los artículos son breves: casi siempre ocupan solo 10 a 20 páginas a doble espacio. Esto significa que los investigadores deben condensar mucha información del estudio en un reporte corto. Por lo general, los manuscritos son revisados por dos o más revisores pares (otros investigadores) que hacen recomendaciones o revisan el manuscrito para aceptarlo. Las revisiones suelen ser ciegas: los revisores desconocen los nombres de los investigadores y a los autores no se les informa quiénes son los revisores. Por lo tanto, los consumidores tienen la seguridad de que los artículos de investigación de las revistas fueron examinados por otros investigadores en enfermería imparciales. No obstante, la publicación 147 no significa que los hallazgos puedan aceptarse sin crítica alguna. Los cursos de métodos de investigación ayudan a los profesionales en enfermería a evaluar la calidad de la evidencia que se informa en los artículos de investigación. En los congresos científicos, los hallazgos de la investigación se presentan como ponencias orales o presentaciones en cartel. En una presentación oral, los investigadores casi siempre cuentan con 10 a 20 minutos para describir a la audiencia las características clave de su estudio. En las presentaciones en cartel, muchos investigadores presentan de modo simultáneo auxiliares visuales que resumen sus estudios y los asistentes recorren la sala y observan las presentaciones. Las presentaciones orales brindan una oportunidad para el diálogo: los asistentes pueden hacer preguntas para entender mejor el significado de los hallazgos; además, pueden ofrecer a los investigadores sugerencias relacionadas con las implicaciones clínicas del estudio. Por consiguiente, los congresos científicos son un foro valioso para las audiencias clínicas. EL CONTENIDO DE LOS ARTÍCULOS DE INVESTIGACIÓN Muchos artículos de investigación siguen una organización llamada formato IMRAD, el cual organiza el contenido en cuatro secciones principales: Introducción, Método, Resultados y (and) Discusión. El documento va precedido por un título y un resumen, y concluye con las referencias bibliográficas. El título y el resumen Los reportes de investigación tienen títulos que transmiten la información clave de manera sucinta. En los estudios cualitativos, el título por lo regular incluye el fenómeno central y el grupo en investigación. En los estudios cuantitativos, el título comunica las variables clave y la población (en otras palabras, los componentes PICO). El resumen es una descripción breve del estudio situada al inicio del artículo (con una extensión entre 150-250 palabras). El resumen responde preguntas como: ¿cuáles son las preguntas de investigación?, ¿qué métodos y materiales se utilizaron para 148 resolverlas?, ¿cuáles son los hallazgos y las conclusiones? y ¿cuáles son las implicaciones para la práctica de la enfermería? Los lectores pueden revisar el resumen para decidir si leen el reporte completo. La introducción La introducción a un artículo de investigación familiariza a los lectores con el problema de investigación y su contexto. Esta sección casi siempre describe lo siguiente: Los fenómenos centrales, conceptos o variables en estudio. El objetivo del estudio y las preguntas de investigación o hipótesis. Una revisión de la bibliografía relacionada. El marco teórico o conceptual. La relevancia y la necesidad del estudio. Así, la introducción permite a los lectores conocer el problema que el investigador busca resolver. Ejemplo de un material introductorio “Se sabe poco acerca de la manera en que la transición del regreso a la escuela después del tratamiento contra el cáncer influye en el desarrollo de la identidad personal y las relaciones sociales de los adolescentes”. Los datos desde la perspectiva del adolescente son muy limitados... El objetivo de este estudio fue describir cómo el regreso a la escuela afecta las nociones de los adolescentes sobre sí mismos, su identidad personal y sus relaciones sociales (Choquette et al., 2015). En este párrafo, los investigadores describieron el concepto central de interés (experiencias de los adolescentes que regresan a la escuela después del tratamiento contra el cáncer), la necesidad del estudio (el hecho de que se sabe poco sobre la experiencia directa de los adolescentes) y el objetivo de este. TIP La sección introductoria de la mayoría de los reportes no se denomina “Introducción” específicamente. La introducción del informe va justo después del resumen. La sección Método Esta sección describe los métodos usados para responder las 149 preguntas de investigación. En un estudio cuantitativo, la sección sobre el método casi siempre describe lo siguiente, que puede presentarse en subsecciones señaladas: Diseño de la investigación. Plan de muestreo. Métodos para medir las variables y recolectar datos. Procedimientos del estudio, incluidos aquellos para proteger los derechos humanos. Métodos para análisis de datos. Los investigadores cualitativos discuten muchos de los mismos aspectos, pero con énfasis diferentes. Por ejemplo, un estudio cualitativo por lo regular aporta más información de los informantes, el sitio de investigación, el contexto y las consideraciones éticas. Los reportes de los estudios cualitativos también describen los esfuerzos del investigador para fortalecer la integridad del estudio. La sección Resultados La sección de resultados en los estudios cuantitativos presenta los hallazgos obtenidos mediante el análisis de los datos del estudio. El texto presenta un resumen narrativo de los hallazgos clave, con frecuencia acompañado de tablas más detalladas. Todas las secciones de resultados contienen información descriptiva, incluida una descripción de los participantes (p. ej., edad promedio, porcentaje de hombres, mujeres y otros). También aporta la siguiente información relacionada con las pruebas estadísticas realizadas: Los nombres de las pruebas estadísticas usadas. Los investigadores prueban sus hipótesis y valoran la probabilidad de que los resultados sean correctos mediante pruebas estadísticas. Por ejemplo, si el investigador encuentra que el peso promedio al nacer de los lactantes de la muestra expuestos a drogas es menor que el peso al nacer de los no expuestos a las mismas, ¿qué tan probable es que lo mismo sea cierto para otros lactantes no incluidos en la muestra? Una prueba estadística ayuda a responder la pregunta ¿Es real la relación entre la exposición prenatal a drogas y el peso al nacer del lactante, y sería probable encontrarla en una nueva muestra de la misma población? Las pruebas estadísticas se basan en principios comunes; no es necesario conocer el nombre de todas las pruebas 150 estadísticas para comprender los hallazgos. El valor de la estadística calculada. Se usan computadoras para calcular un valor numérico para la prueba estadística particular empleada. El valor permite a los investigadores llegar a conclusiones sobre sus hipótesis. Sin embargo, el valor real de la estadística no tiene significado inherente y usted no debe preocuparse por eso. Significancia estadística. Un elemento crucial de la información es si las pruebas estadísticas fueron significativas (no debe confundirse con la importancia clínica). Si un investigador informa que los resultados tienen significancia estadística, quiere decir que es probable que los hallazgos sean verdaderos y replicables en una nueva muestra. Los reportes de investigación también indican el nivel de significancia, que es un índice de qué tan probable es que los hallazgos sean confiables. Por ejemplo, si un reporte indica que un hallazgo fue significativo al nivel de probabilidad 0.05 (simbolizado como p), esto significa que solo 5 veces de cada 100 (5 ÷ 100 = 0.05) el resultado obtenido sería falso. En otras palabras, 95 veces de cada 100 se obtendrían resultados similares con una nueva muestra. Así, los lectores pueden tener un alto grado de confianza, pero no la certeza total, de que los resultados son exactos. Ejemplo de la sección de resultados de un estudio cuantitativo Park y sus colaboradores (2015) evaluaron los efectos de un PatientCentered Environment Program (PCEP) de 16 sesiones en diversos resultados de los pacientes con demencia que viven en su casa. Esta es una oración adaptada de los resultados presentados: “Los hallazgos mostraron que la agitación (t = 2.91, p < 0.02) y el dolor (t = 4.51, p < 0.002) mejoraron después de recibir el PCEP” (p. 40). En este ejemplo, los investigadores indicaron que tanto la agitación como el dolor mejoraron de manera significativa después de recibir la intervención PCEP. No es probable que los cambios en la agitación y el dolor hayan sido aleatorios y es probable que se replicaran en una nueva muestra. Estos hallazgos son muy confiables. Por ejemplo, con respecto a la disminución del dolor, se encontró que una mejoría de la magnitud obtenida ocurriría “por casualidad” menos de dos veces en 1 000 (p < 0.002). Note que para comprender 151 este hallazgo no es necesario saber qué es una estadística t, tampoco tiene que ocuparse del valor real de la estadística t, 4.51. TIP Los resultados son más confiables si el valor p es más pequeño. Por ejemplo, existe una mayor probabilidad de que los resultados sean exactos cuando p = 0.01 (probabilidad de 1 en 100 de un resultado falso) que cuando p = 0.05 (probabilidad de 5 en 100 de un resultado falso). En ocasiones, los investigadores informan una probabilidad exacta (p. ej., p = 0.03) o una probabilidad menor a los umbrales convencionales (p. ej., p < 0.05, menor de 5 en 100). En los reportes cuantitativos, los investigadores por lo general organizan los hallazgos con base en los temas, procesos o categorías principales que se identificaron en los datos. La sección de resultados de los reportes cualitativos a veces tiene varias subsecciones, cuyos encabezados corresponden a las etiquetas que da el investigador a los temas. Se presentan extractos de los datos sin procesar (las palabras reales de los participantes) para sustentar y proporcionar una descripción detallada del análisis temático. La sección de resultados de los estudios cualitativos también puede presentar la teoría emergente del investigador acera del fenómeno en estudio. Ejemplo de la sección de resultados de un estudio cualitativo Larimer y sus colaboradores (2015) estudiaron las experiencias, dificultades y comportamientos para enfrentar situaciones de adultos jóvenes con marcapasos o desfibriladores cardioversores implantables. Los participantes describieron cuatro categorías de dificultades, una de las cuales se llamó “Apoyo limitado”. Este es un extracto que ilustra esa categoría: “Si visito médicos pediatras, sus salas de espera tienen bloques para armar y elefantes rosados. Sin embargo, en la rehabilitación cardiopulmonar soy el más joven por 60 años. Me siento como en tierra de nadie, atorado en el medio” (p. 3). La sección Discusión En la discusión, el investigador presenta conclusiones sobre el significado y las implicaciones de los hallazgos; es decir, lo que significan los resultados, por qué las cosas resultaron de la manera en que lo hicieron, cómo los hallazgos se adaptan a otra evidencia y 152 cómo pueden usarse los resultados en la práctica. La discusión de los reportes cuantitativos y cualitativos puede incluir los elementos que se mencionan en seguida: Una interpretación de los resultados. Implicaciones clínicas y de investigación. Limitaciones del estudio y ramificaciones de la credibilidad de los resultados. Los investigadores están en la mejor posición para señalar las deficiencias de sus estudios. Una sección de discusión que presenta el conocimiento del investigador en relación con las limitaciones del estudio demuestra a los lectores que los autores están conscientes de tales restricciones y que es probable que las consideren en la interpretación de los hallazgos. Referencias bibliográficas Los artículos de investigación concluyen con una lista de los libros y artículos referidos. Si el lector está interesado en leer más sobre un tema, la lista de referencias de un estudio reciente es un buen sitio para comenzar. EL ESTILO DE LOS ARTÍCULOS DE INVESTIGACIÓN EN REVISTAS Los reportes de investigación cuentan una historia. Sin embargo, el estilo en el que se escriben muchos artículos de investigación en revistas, sobre todo de estudios cuantitativos, dificulta que algunos lectores los comprendan o se interesen en tal historia. ¿Por qué los artículos de investigación son tan difíciles de leer? Para el público no acostumbrado, los reportes de investigación pueden parecer intimidantes. Cuatro factores contribuyen a esta impresión: 1. Concisión. El espacio en una revista es limitado, por lo que los autores comprimen mucha información en un espacio pequeño. Un aspecto interesante es que no pueden informarse aspectos 153 personalizados de la investigación y, en los estudios cualitativos solo es posible incluir unas pocas de las citas de sustento. 2. Lenguaje especializado. Los autores de los artículos de investigación usan términos que pueden parecer enigmáticos. 3. Objetividad. Los investigadores cuantitativos tienden a evitar cualquier impresión de subjetividad, por lo que relatan sus historias de investigación de una forma que suenan impersonales. La mayoría de los artículos de investigación cuantitativa se escribe en voz pasiva, lo que tiende a hacer el artículo menos atractivo y vivaz. En contraste, los reportes cualitativos suelen escribirse en un estilo más coloquial. 4. Información estadística. En los reportes cuantitativos, las cifras y los símbolos estadísticos pueden intimidar a los lectores que no tienen entrenamiento estadístico. Un objetivo de este libro es ayudar al lector a comprender el contenido de los reportes de investigación y a salvar las preocupaciones sobre el lenguaje especializado y la información estadística. TIP CÓMO SABER ¿Cómo puede decirse si la voz es activa o pasiva? En la voz activa, el artículo diría lo que los investigadores hicieron (p. ej., “Usamos esfigmomanómetro de mercurio para medir la presión sanguínea”). En la voz pasiva, el artículo indica lo que se hizo, sin indicar quién lo llevó a cabo, aunque está implícito que los investigadores fueron los agentes (p. ej., “Se usó un esfigmomanómetro de mercurio para medir la presión sanguínea”). Consejos para la lectura de artículos de investigación Conforme avance en este libro adquirirá habilidades para evaluar los artículos de investigación, pero las habilidades implícitas en la apreciación crítica tardan en desarrollarse. El primer paso es comprender los artículos de investigación. Estos son algunos consejos para entenderlos. Acostúmbrese al estilo de los artículos de investigación leyéndolos con frecuencia, aunque no comprenda los aspectos técnicos. Lea los artículos de investigación despacio. Puede ser útil hacer 154 primero una lectura superficial para captar los puntos principales y luego leer el artículo con atención una segunda vez. Entrénese a sí mismo para volverse un lector activo al leer el texto por segunda vez. Una lectura activa significa que el lector se cuestiona a sí mismo de modo constante para verificar que comprendió lo leído. Si tiene dificultades, puede pedir ayuda a alguien. En la mayoría de los casos, ese “alguien” será su profesor, aunque también puede considerar comunicarse con los propios investigadores. Tenga a la mano este libro como referencia cuando lea artículos para poder buscar términos desconocidos en el glosario o el índice. Intente no enredarse (ni asustarse) con la información estadística. Trate de captar el punto esencial de la historia sin permitir que los símbolos y las cifras lo frustren. ANÁLISIS CRÍTICO DE LOS REPORTES DE INVESTIGACIÓN Una lectura crítica de un artículo de investigación incluye una evaluación cuidadosa de las principales decisiones conceptuales y metodológicas del investigador. Será difícil criticar tales decisiones en este punto, pero sus habilidades mejorarán conforme avance en este libro. ¿Qué es una crítica de la investigación? Una crítica de la investigación es una valoración objetiva de las fortalezas y limitaciones que tiene un estudio. Por lo general, las críticas concluyen con el resumen que hace el revisor de los méritos del estudio, recomendaciones sobre el valor de la evidencia y sugerencias para mejorar el estudio o el reporte. Las críticas de la investigación de estudios individuales se preparan por varias razones y su alcance también es diverso. Los revisores pares a los que se pide que preparen una crítica escrita para una revista que considera publicar un manuscrito pueden evaluar las fortalezas y debilidades en términos de aspectos sustanciales (¿el problema de investigación es significativo para la enfermería?), aspectos teóricos (¿fueron sólidos los fundamentos conceptuales?), decisiones metodológicas (¿fueron rigurosos los métodos, aportaron 155 evidencia creíble?), aspectos interpretativos (¿el investigador llegó a conclusiones defendibles?), ética (¿se protegieron los derechos de los participantes?) y estilo (¿es claro el reporte, con gramática correcta y bien organizado?). En resumen, los revisores pares realizan una revisión integral para proporcionar realimentación a los investigadores y los editores de la revista acerca del mérito del estudio y del reporte, y por lo general ofrecen sugerencias para las revisiones. Las críticas diseñadas para informar la práctica de la enfermería basada en evidencia pocas veces son integrales. Por ejemplo, tiene poca relevancia para la práctica basada en evidencia (PBE) que un artículo tenga errores gramaticales. Una crítica de la utilidad clínica de un estudio se enfoca en señalar si la evidencia es exacta, creíble y relevante para la clínica. Estas críticas más estrechas están enfocadas en evaluar los métodos de la investigación y en los hallazgos mismos. También puede pedirse a los estudiantes que toman el curso de métodos de investigación que hagan la crítica de un estudio. Por lo regular, la intención de tales análisis es fomentar el pensamiento crítico e inducir a los estudiantes a aplicar las habilidades recién adquiridas en los métodos de investigación. Apoyo al análisis crítico en este libro Aquí se proporcionan varios tipos de apoyo para los análisis críticos a la investigación. Primero, al final de la mayoría de los capítulos se incluyen sugerencias de críticas a detalle relacionadas con el contenido de estos. Segundo, siempre es instructivo tener un modelo adecuado, por lo que se preparó la crítica de dos estudios. Los estudios y sus críticas están en los apéndices C y D. Tercero, se ofrece un conjunto de lineamientos para la crítica de reportes cuantitativos y cualitativos en este capítulo, en las tablas 4-1 y 4-2, respectivamente. Las preguntas de los lineamientos se refieren al rigor con que los investigadores enfrentan las dificultades cruciales de la investigación, algunas de las cuales se describen en la siguiente sección. TIP Para quienes realizan una crítica integral, se ofrecen lineamientos más incluyentes para la crítica en el suplemento en inglés de este capítulo en . 156 TABLA 4-1 Guía para una crítica enfocada de la calidad de la evidencia en un reporte de investigación cuantitativa Aspecto del reporte Preguntas de análisis crítico Lineamientos detallados para la crítica Método Diseño de la investigación Recuadro 9-1, p. 155 ¿Se usó el diseño más riguroso posible, dado el objetivo de la investigación? ¿Se hicieron las comparaciones apropiadas para mejorar la posibilidad de interpretación de los hallazgos? ¿Fue adecuado el número de lugares para recolectar datos? ¿El diseño minimizó los sesgos y amenazas a la validez del estudio (p. ej., se usó el cegamiento, se minimizó el desgaste)? Población y muestra ¿Se identificó y describió Recuadro 10-1, p. la población? ¿La muestra 167 se describió con detalle suficiente? ¿Se usó el mejor diseño de muestreo posible para aumentar la representatividad de la muestra? ¿Se minimizaron los sesgos de la muestra? ¿Fue representativo el tamaño de la muestra? ¿Se usó un análisis de poder para calcular el tamaño necesario de la muestra? ¿Se volvieron operativas las variables clave con el mejor método posible (p. ej., entrevistas, 157 Recuadro 10-2, p. 178 Recolección de datos y medición observaciones, etcétera)? ¿Se describen de manera adecuada los instrumentos específicos y fueron buenas elecciones, dado el objetivo y la población del estudio? ¿El reporte proporcionó evidencia de que los métodos para recolección de datos produjeron datos confiables y válidos? Procedimientos Si hubo una intervención, Recuadro 9-1, p. 155 ¿se describió de modo adecuado y se implementó correctamente? ¿La mayoría de los participantes asignados al grupo de intervención la recibió en realidad? ¿Los datos se recolectaron de una forma que minimizara los sesgos? ¿El personal que recolectó los datos estaba bien entrenado? Recuadro 14-1, p. 254 Resultados Análisis de datos ¿Se usaron los métodos estadísticos apropiados? ¿Se empleó el método analítico más poderoso (p. ej., el análisis controló las variables de confusión)? ¿Se evitaron o minimizaron los errores tipo I y II? ¿Se presentó información de la significancia estadística? ¿Se presentó información del tamaño del efecto y la precisión de los cálculos (intervalos de confianza)? Recuadro 15-1, p. 272 Hallazgos e interpretación 158 ¿Se discutió la relevancia clínica de los hallazgos? Resumen de valoración A pesar de las limitaciones, ¿los hallazgos del estudio parecen válidos, tiene usted confianza en el valor real de los resultados)? ¿El estudio aporta alguna evidencia significativa que pueda usarse en la práctica de la enfermería o que sea útil para esta disciplina? TABLA 4-2 Guía para una crítica enfocada de la calidad de la evidencia en un reporte de investigación cualitativa Aspecto del reporte Preguntas de análisis crítico Lineamientos detallados para la crítica Método Diseño de la investigación y tradición de investigación Recuadro 11-1, p. ¿Es congruente la tradición de investigación identificada (si la 193 hay) con los métodos usados para recolectar y analizar los datos? ¿Se destinó tiempo al trabajo en campo o con los participantes del estudio? ¿Hubo evidencia de reflexividad en el diseño? Muestra y sitio Recuadro 12-1, p. ¿Se describió de manera 203 adecuada el grupo o la población de interés? ¿El sitio y la muestra se describieron con detalle suficiente? ¿Se usó el mejor método de muestreo posible para aumentar la riqueza de información? ¿Fue adecuado el tamaño de la muestra? ¿Se alcanzó la saturación? 159 Recolección de datos ¿Fueron apropiados los métodos Recuadro 12-2, p. para recolección de datos? ¿Se 208 obtuvieron los datos mediante dos o más métodos de triangulación? ¿El investigador hizo las preguntas o las observaciones correctas? ¿Se obtuvieron datos suficientes? ¿Tenían la profundidad y el detalle adecuados? Procedimientos ¿Los procedimientos para recolección y registro de datos parecen apropiados? ¿Los datos se obtuvieron de manera que se minimizaran los sesgos? ¿Las personas que recolectaron los datos tenían el entrenamiento apropiado? Aumento de confianza Recuadro 17-1, p. ¿Los investigadores usaron 305 estrategias para mejorar la confianza/integridad del estudio y tales estrategias fueron apropiadas? ¿Las calificaciones y la experiencia clínicas y metodológicas de los investigadores mejoran la confianza en los hallazgos y su interpretación? Resultados Análisis de datos Recuadro 12-2, p. 208 ¿La estrategia para el análisis de Recuadro 16-2, p. 290 datos fue compatible con la tradición de investigación y con la naturaleza y el tipo de los datos reunidos? ¿El análisis generó un “producto” apropiado (p. ej., teoría, taxonomía, patrón temático)? ¿Los procedimientos analíticos sugieren la posibilidad de 160 sesgos? Hallazgos Resumen de valoración ¿Los hallazgos se resumieron de Recuadro 16-2, p. 290 manera efectiva, con buen uso de los extractos de los datos y argumentos de apoyo sólidos? ¿Los temas en realidad capturaron el significado de los datos? ¿El investigador conceptualizó de forma satisfactoria los temas o patrones de los datos? ¿El análisis generó una descripción informativa, interesante, auténtica y significativa del fenómeno en investigación? ¿Los hallazgos del estudio parecen confiables; tiene usted la confianza en el valor verdadero de los resultados? ¿El estudio aporta alguna evidencia significativa que pueda usarse en la práctica de enfermería o que sea útil para la disciplina de la enfermería? Las segundas columnas de las tablas 4-1 y 4-2 listan algunas preguntas fundamentales y la tercera columna incluye las referencias a los lineamientos más detallados en los diversos capítulos del libro. Sabemos que es demasiado difícil de responder casi todas las preguntas de crítica por el momento, pero sus habilidades metodológicas y críticas se desarrollarán conforme avance en el libro. La redacción de la pregunta en estos lineamientos requiere una respuesta sí o no (aunque también es factible que en ocasiones sea “Sí, pero…”). En todos los casos, la respuesta deseable es sí; es decir, una respuesta no sugiere una posible limitación y un sí sugiere una fortaleza. Por lo tanto, mientras más respuestas afirmativas tenga un estudio, es mayor la probilidad de que sea más sólido. En conjunto estos lineamientos pueden sugerir una valoración global: es probable que un reporte con 10 respuestas sí sea superior a uno que solo tiene dos. Sin embargo, estos lineamientos no pretenden generar una 161 “calificación” de calidad formal. Se reconoce que estos lineamientos para la crítica tienen limitaciones. En particular, son genéricos aun cuando la crítica no puede usar una lista de preguntas útiles en todos los casos. Las preguntas de crítica que son relevantes para ciertos estudios (p. ej., los que tienen un objetivo de tratamiento) no tienen sitio en un conjunto de preguntas generales para todos los estudios cuantitativos. Por lo tanto, es necesario aplicar cierto juicio sobre cuáles lineamientos son lo bastante integrales para el tipo de estudio que se analiza. También hay que señalar que en estos lineamientos hay preguntas para las que no hay respuestas del todo objetivas. Incluso los expertos a veces están en desacuerdo acerca de las estrategias metodológicas. TIP Tal como un profesional clínico cuidadoso busca evidencia de la efectividad o no efectividad de ciertas prácticas, usted como lector debe demandar evidencia de que las decisiones metodológicas de los investigadores fueron sólidas. Críticar con las dificultades clave de la investigación en mente Cuando se critica un estudio, es útil estar consciente de las dificultades que enfrentan los investigadores. Por ejemplo, enfrentan dificultades éticas (¿puede este estudio alcanzar sus objetivos sin violar los derechos humanos?), prácticas (¿será posible incluir pacientes suficientes?) y metodológicas (¿los métodos usados aportarán resultados confiables?). La mayor parte de este libro proporciona una guía relativa a la última pregunta y esta sección resalta las dificultades metodológicas y ofrece una oportunidad de introducir términos y conceptos primordiales que son relevantes en una crítica. El valor de la evidencia de un estudio para la práctica de enfermería suele depender de lo bien que los investigadores enfrenten estas dificultades. Inferencia La inferencia es una parte integral de la práctica y la crítica a la investigación. Una inferencia es una conclusión obtenida a partir de la evidencia del estudio mediante el razonamiento lógico y la consideración de los métodos usados para generar tal evidencia. 162 La inferencia es necesaria porque los investigadores utilizan representaciones que “significan” cosas de interés fundamental. Una muestra de participantes es una representación de una población completa. Un grupo control que no recibe una intervención es una representación de lo que ocurriría a las mismas personas si al mismo tiempo recibieran y no recibieran la intervención. Los investigadores enfrentan la dificultad de usar métodos que aporten evidencia adecuada y persuasiva como apoyo a las inferencias que desean hacer. Los lectores deben obtener sus propias inferencias con base en una crítica de las decisiones metodológicas. Confiabilidad, validez y confianza Los investigadores desean que sus inferencias correspondan a la verdad. La investigación no puede aportar evidencia para guiar la práctica clínica si los hallazgos son inexactos, sesgados o no representan las experiencias del grupo de interés. Los investigadores cuantitativos usan varios criterios para valorar la calidad de un estudio, a veces referida como mérito científico. Dos criterios de importancia particular son la confiabilidad y la validez. Confiabilidad se refiere a la exactitud y consistencia de la información obtenida en un estudio. El término suele relacionarse con los métodos usados para medir las variables. Por ejemplo, si un termómetro midió una temperatura de 36.7 °C en un paciente y al minuto siguiente indica 39.1 °C, el termómetro no es confiable. Validez es un concepto más complejo que en términos amplios se refiere a la solidez de la evidencia del estudio. Lo mismo que la confiabilidad, la validez es un criterio importante para evaluar los métodos que miden variables. En este contexto, la pregunta de validez es si los métodos en realidad miden los conceptos que pretenden medir. ¿Una medición por escrito de la depresión en realidad mide la depresión? O ¿mide algo más, como la soledad o el estrés? Los investigadores buscan definiciones conceptuales sólidas de las variables de investigación y métodos válidos para volverlas operativas. Otro aspecto de la validez se refiere a la calidad de evidencia sobre la relación entre la variable independiente y la variable dependiente. ¿Una intervención de enfermería en realidad mejoró los resultados de los pacientes o hubo otros factores causantes de su progreso? Los investigadores toman muchas decisiones metodológicas que influyen 163 en este tipo de validez del estudio. Los investigadores cualitativos usan distintos criterios y terminología para evaluar la integridad de un estudio. En general, los investigadores cualitativos discuten métodos para mejorar la confianza de los datos y hallazgos del estudio (Lincoln y Guba, 1985). La confianza abarca varias dimensiones distintas – credibilidad, transferibilidad, posibilidad de confirmación, fiabilidad y autenticidad– las cuales se describen en el capítulo 17. La credibilidad es un aspecto muy importante de la confianza. La credibilidad se alcanza en la medida en que los métodos de investigación inspiren confianza de que los resultados son verdaderos y exactos. La credibilidad de un estudio cualitativo puede mejorarse de varias maneras, pero es necesaria la discusión temprana de una estrategia porque tiene implicaciones para el diseño de todos los estudios, incluidos los cuantitativos. La triangulación es el uso de múltiples fuentes o referentes para extraer conclusiones sobre lo que constituye la verdad. En un estudio cuantitativo, esto podría significar que se tienen dos formas de medir un resultado para valorar si los resultados son consistentes. En un estudio cualitativo, la triangulación podría incluir esfuerzos para comprender la complejidad de un fenómeno mediante el uso de métodos para recolectar múltiples datos con el fin de converger en la verdad (p. ej., tener discusiones profundas con los participantes además de observar su comportamiento en situaciones naturales). Los investigadores en enfermería también empiezan a triangular entre paradigmas; es decir, a integrar datos cuantitativos y cualitativos en un solo estudio para aumentar la validez de las conclusiones. Esta investigación de métodos mixtos se discute en el capítulo 13. Ejemplo de triangulación Montreuil y sus colaboradores (2015) examinaron la utilidad de la atención de enfermería desde la perspectiva de niños con factores de riesgo para suicidio y sus padres. Los investigadores triangularon datos de observaciones de los niños, sesiones informativas con ellos y entrevistas con los padres. Los investigadores en enfermería necesitan diseñar sus estudios de modo que minimicen las amenazas a la confiabilidad, la validez y la confianza de sus estudios, y los usuarios de la investigación deben 164 evaluar el grado de éxito que tuvieron al hacerlo. TIP En la lectura y crítica de artículos de investigación, es apropiado tener una actitud de “demuéstralo”; es decir, esperar que los investigadores construyan y presenten un caso sólido sobre el mérito de sus inferencias. Lo hacen al proporcionar evidencia de que los hallazgos son confiables y válidos o fiables. Sesgo Los sesgos pueden poner en riesgo la validez y la confianza de un estudio. Un sesgo es una distorsión o influencia que genera un error en la inferencia. Los sesgos pueden deberse a varios factores, como falta de honestidad de los participantes, ideas preconcebidas del investigador o métodos defectuosos para recolectar datos. Algunos sesgos son aleatorios y afectan solo un pequeño segmento de los datos. Por ejemplo, unos cuantos participantes en el estudio podrían proporcionar información inexacta porque estaban cansados al momento de recolectar los datos. El sesgo sistemático se produce cuando el sesgo es consistente o uniforme. Por ejemplo, si una báscula indicó de manera constante 900 g más que el peso real de las personas, habría un sesgo sistemático en los datos del peso. Los métodos de investigación rigurosos buscan eliminar o minimizar el sesgo. Los investigadores adoptan diversas estrategias para corregir los sesgos. La triangulación es una de estas; la idea es que múltiples fuentes de información o puntos de vista ofrezcan vías para identificar los sesgos. En la investigación cuantitativa, los métodos para corregir los sesgos suelen implicar un control de la investigación. Control de la investigación Una característica central de la mayoría de los estudios cuantitativos es que incluyen esfuerzos que buscan controlar aspectos de la investigación. El control de la investigación casi siempre implica mantener constantes las influencias en la variable de resultado para poder comprender la relación real entre las variables independientes y de resultado. En otras palabras, el control de la investigación intenta eliminar los factores contaminantes que pudieran enturbiar la relación entre las variables de interés primordial. 165 Los factores contaminantes, por lo regular llamados variables de confusión (o variables extrañas), pueden ilustrarse mejor con un ejemplo. Supóngase que se estudia si la incontinencia urinaria (IU) conduce a la depresión. La evidencia previa lo sugiere, pero los estudios anteriores no aclararon si es la IU por sí misma u otros factores lo que contribuye al riesgo de depresión. La pregunta es si la IU (la variable independiente) contribuye a los niveles más altos de depresión o si existen otros factores que pueden explicar la relación entre la IU y la depresión. Es necesario diseñar un estudio que controle otros determinantes del resultado, determinantes que también se relacionan con la variable independiente, incontinencia urinaria. Una variable de confusión en este caso es la edad. Los niveles de depresión tienden a ser mayores en las personas de edad avanzada y las que tienen IU tienden a tener mayor edad que aquellas sin este problema. En otras palabras, quizá la edad es la causa real del aumento de la depresión de personas con IU. Si la edad no se controla, la relación observada entre la IU y la depresión podría deberse a la IU o a la edad. Tres explicaciones posibles podrían representarse de manera esquemática así: 1. IU → depresión 2. Edad → IU → depresión 3. La flecha simboliza un mecanismo causal o influencia. En el modelo 1, la IU influye de manera directa en la depresión, al margen de otros factores. En el modelo 2, la IU es una variable mediadora, el efecto de la edad en la depresión está mediado por la IU. Según esta representación, la edad influye en la depresión a través del efecto que tiene la edad en la IU. En el modelo 3, tanto la edad como la IU tienen efectos separados en la depresión, y la edad también eleva el riesgo de IU. Cierta investigación está diseñada de forma específica para probar las vías de mediación y las causas múltiples, pero en el presente ejemplo la edad es extraña a la pregunta de investigación. Se desea diseñar un estudio que examine la primera explicación. La edad debe controlarse si el objetivo es explorar la validez del modelo 1, el 166 cual señala que sin importar la edad de la persona, la presencia de IU la vuelve más vulnerable a la depresión. ¿Cómo puede imponerse tal control? Existen varias formas, como se explica en el capítulo 9, pero el principio general subyacente a cada alternativa es que la variable de confusión debe mantenerse constante. La variable de confusión debe manejarse de algún modo para que, en el contexto del estudio, no esté relacionada con la variable independiente o el resultado. Como ejemplo, dígase que se deseaban comparar las calificaciones promedio en una escala de depresión para personas con y sin IU. Se buscaría diseñar un estudio de tal forma que las edades de los individuos de los grupos con IU y sin IU fueran comparables, aunque en general los grupos no son comparables en términos de edad. Al ejercer el control en la edad, se daría un paso hacia la comprensión del vínculo entre la IU y la depresión. El mundo es complejo y muchas variables se interrelacionan de maneras complicadas. El valor de la evidencia en los estudios cuantitativos por lo regular se relaciona con lo bien que los investigadores controlan las influencias de confusión. La investigación basada en el paradigma constructivista no impone controles. Con su énfasis en el holismo y la experiencia humana individual, los investigadores cualitativos casi siempre creen que la imposición de controles elimina parte del significado de la realidad. Reducción de sesgos: aleatoriedad y cegamiento Para los investigadores cuantitativos, una herramienta poderosa para eliminar sesgos es la aleatoriedad, el que ciertas características del estudio se establezcan al azar y no por preferencia del investigador. Cuando las personas se seleccionan al azar para participar en un estudio, por ejemplo, cada persona en el conjunto inicial tiene la misma probabilidad de ser seleccionada. A su vez esto significa que no hay sesgos sistemáticos en la conformación de la muestra. Los hombres y las mujeres tienen la misma probabilidad de ser seleccionados, por ejemplo. De igual manera, si los participantes se distribuyen de manera aleatoria en los grupos que se compararán (p. ej., un grupo con una intervención especial y otro con “atención usual”), no existen sesgos sistemáticos en la composición de los grupos. La aleatoriedad es un método contundente para controlar las variables de confusión y reducir los sesgos. 167 Otra estrategia para reducir los sesgos es el cegamiento (o enmascaramiento), que se usa en algunos estudios cuantitativos para prevenir los sesgos derivados del conocimiento de las personas. El cegamiento se refiere a encubrir información a los participantes, recolectores de datos o cuidadores para aumentar la objetividad. Por ejemplo, si los participantes en un estudio saben si reciben un fármaco experimental o un fármaco falso (placebo), es posible que sus resultados estén influidos por su expectativa sobre la eficacia del nuevo fármaco. El cegamiento incluye el encubrimiento u omisión de información del estado de los participantes en el estudio (p. ej., si están en cierto grupo) o de las hipótesis del estudio. Ejemplo de aleatoriedad y cegamiento Da Silva y sus colaboradores (2015) estudiaron el efecto de la reflexología podal en la integridad del tejido y la afección de los pies entre personas con diabetes mellitus tipo 2. Su muestra de 45 personas con diabetes se distribuyó al azar en dos grupos; uno recibió lineamientos para el cuidado de los pies más 12 sesiones de reflexología podal y el otro recibió solo los lineamientos. La persona que valoró la afección de los pies desconocía en qué grupo estaban los participantes. Los investigadores cualitativos no consideran la aleatoriedad y el cegamiento como herramientas deseables para comprender fenómenos. El juicio de un investigador se considera un vehículo indispensable para descubrir las complejidades de los fenómenos de interés. Reflexividad Los investigadores cualitativos también están interesados en descubrir la verdad sobre la experiencia humana. A menudo confían en la reflexividad para defenderse de los sesgos personales. La reflexividad es el proceso de reflexionar de manera crítica en sí mismo y de analizar y notar valores personales que podrían afectar la recolección e interpretación de datos. Los investigadores cualitativos están entrenados para explorar estos aspectos, reflexionar sobre las decisiones tomadas durante la indagación y registrar sus pensamientos en diarios personales y memorandos. 168 Ejemplo de reflexividad Sanon y sus colaboradores (2016) examinaron el papel del transnacionalismo (mantenimiento de relaciones y actividades que trascienden fronteras entre países) entre inmigrantes haitianos en términos del autocontrol de la hipertensión. Mediante la reflexividad, la investigadora principal “consideró su contexto y posición históricos, sociales y políticos como influencia en sus reflexiones y los significados que asignó a los relatos de los participantes” (p. 150). La investigadora también reflexionó acerca de la inequidad en la relación de poder entre los participantes y ella misma. TIP La reflexividad puede ser una herramienta útil en la investigación cuantitativa y cualitativa: la autoconsciencia y la introspección pueden mejorar la calidad de cualquier estudio. Generalizabilidad y transferibilidad Los profesionales de enfermería dependen cada vez más de la evidencia de la investigación sistematizada como guía en su práctica clínica. La PBE se basa en la suposición de que los hallazgos de un estudio no son únicos para las personas, lugares o circunstancias de la investigación original. Como se indica en el capítulo 1, la generalizabilidad es el criterio usado en estudios cuantitativos para valorar el grado en que los hallazgos pueden aplicarse a otros grupos y situaciones. ¿Cómo aumentan los investigadores la generalizabilidad de un estudio? Primero y lo más importante, deben diseñar estudios con confiabilidad y validez sólidas. No vale la pena preguntarse si los resultados son generalizables si no son exactos o válidos. Para seleccionar a los participantes, los investigadores también deben pensar en los tipos de personas a los que podrían generalizarse los resultados y luego elegir a los sujetos en consecuencia. Si se pretende que un estudio tenga implicaciones para pacientes masculinos y femeninos, deben incluirse hombres y mujeres como participantes. Los investigadores cualitativos no buscan la generalizabilidad de manera específica, pero quieren generar conocimiento que sea útil en otras situaciones. En su trascendental libro sobre la indagación naturalista, Lincoln y Guba (1985) discuten el concepto de transferibilidad –el grado en que los hallazgos cualitativos pueden 169 transferirse a otras situaciones– como otro aspecto de la confianza. Un mecanismo importante para promover la transferibilidad es la cantidad de información descriptiva valiosa que los investigadores cualitativos proporcionan sobre los contextos del estudio. EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO En las siguientes secciones se presentan resúmenes de un estudio de enfermería cuantitativo y otro cualitativo. Lea los resúmenes para los ejemplos 1 y 2, y luego responda las preguntas de pensamiento crítico que les siguen. Los ejemplos 1 y 2 se presentan en la sección Critical Thinking Activity del sitio web . Las preguntas de pensamiento crítico para los ejemplos 3 y 4 se basan en los estudios que aparecen en los apéndices A y B de este libro. Los comentarios en inglés de las autoras sobre estos ejercicios están en la sección Student Resources en el sitio web . EJEMPLO 1: INVESTIGACIÓN CUANTITATIVA Estudio. Relaciones entre siestas diurnas y fatiga, calidad del sueño y calidad de vida en pacientes con cáncer (Sun y Lin, 2016). Antecedentes. No se comprenden del todo las relaciones entre las siestas y la calidad del sueño, la fatiga y la calidad de vida (CdV) en pacientes con cáncer. Objetivo. La finalidad del estudio era determinar si las siestas diurnas se relacionan con el sueño nocturno, la fatiga y la CdV en pacientes con cáncer. Métodos. En total se incluyeron 187 pacientes con cáncer. Se valoraron las siestas diurnas, el sueño nocturno informado por el sujeto mismo, la fatiga y la CdV mediante un cuestionario. Se recolectaron datos de los parámetros objetivos del sueño con un actígrafo de muñeca. Resultados. Según las mediciones de despertar después del inicio del sueño, los pacientes que tomaron siestas durante el día tuvieron sueño nocturno más deficiente que los que no durmieron en el día (t = –2.44, p = 0.02). La duración de la siesta diurna tuvo una correlación negativa 170 significativa con la CdV. Los pacientes que tomaron una siesta después de las 4:00 pm tuvieron menor calidad de sueño (t = –1.93, p = 0.05) y peor calificación del componente mental en la Short-Form Health Survey (Forma Corta de Encuesta de Salud) (t = 2.06, p = 0.04) que los pacientes que no lo hicieron. La fatiga, la duración de la siesta diurna y la calidad del sueño fueron factores predictivos significativos de las calificaciones del componente mental y del componente físico; representaron 45.7% y 39.3% de la varianza, respectivamente. Conclusiones. La duración de la siesta diurna tuvo una relación negativa con la CdV. Deben evitarse las siestas después de las 4:00 pm. Implicaciones para la práctica. Las siestas diurnas afectan la CdV de los pacientes con cáncer. La investigación futura puede determinar el papel de las siestas en la higiene del sueño de pacientes oncológicos. Ejercicios de pensamiento crítico 1. Considere las siguientes preguntas enfocadas: a. ¿Cuáles son las variables independientes y dependientes de este estudio? ¿Cuáles son los componentes PICO? b. ¿Este estudio fue experimental o no experimental? c. ¿Cómo se usó, si así fue, la aleatoriedad en este estudio? d. ¿Cómo se usó, si así fue, el cegamiento en este estudio? e. ¿Los investigadores utilizaron alguna prueba estadística? Si es así, ¿alguno de los resultados tuvo significancia estadística? 2. Si los resultados de este estudio son válidos y generalizables, ¿cuáles serían algunos usos que podrían tener los hallazgos en la práctica clínica? EJEMPLO 2: INVESTIGACIÓN CUALITATIVA Estudio. Experiencias de adolescentes mientras estuvieron hospitalizados después de cirugía por colitis ulcerativa (Olsen et al., 2016). Resumen. Los adolescentes están en una fase transicional de la vida caracterizada por desafíos físicos, emocionales y psicológicos. Vivir con colitis ulcerativa se experimenta como un deterioro de la calidad de vida. El tratamiento inicial de la colitis ulcerativa es clínico, pero la cirugía puede ser necesaria cuando los medicamentos ya no tienen efecto. No existen estudios de investigación de la experiencia de los adolescentes durante el periodo intrahospitalario inicial después de una cirugía para colitis ulcerativa. El objetivo del estudio era identificar y describir las experiencias de los adolescentes mientras estaban hospitalizados después de una intervención quirúrgica para colitis ulcerativa. Este estudio 171 cualitativo se basó en entrevistas con ocho adolescentes. El análisis y la interpretación se basaron en una interpretación hermenéutica del significado. Se identificaron tres temas: “Cuerpo: descompuesto”, “Visto y comprendido” y “¿Dónde están todos los demás?”. Los adolescentes experimentan un periodo posoperatorio caracterizado por alteraciones físicas y mentales. Al carecer de preparación mental para tales desafíos, evitan la comunicación y la interacción. Los hallazgos demuestran la importancia de la atención de enfermería individualizada con base en la edad, la madurez y las necesidades individuales del adolescente. Se necesita más estudio sobre la estancia de los pacientes en el hospital, con enfoque en las implicaciones de ser joven y enfermo al mismo tiempo. Ejercicios de pensamiento crítico 1. Considere las siguientes preguntas enfocadas: a. ¿En qué tradición de investigación cualitativa, si la hay, se basó este estudio? b. ¿Este estudio fue experimental o no experimental? c. ¿Cómo se usó, si así fue, la aleatoriedad en este estudio? d. ¿Existe alguna indicación en el resumen de que se usara la triangulación o la reflexividad? 2. Si los resultados de este estudio son confiables y transferibles, ¿cuáles podrían ser algunos usos en los que podrían aplicarse los hallazgos en la práctica? 3. Compare los dos resúmenes en los ejemplos 1 y 2. El primero es estructurado, con encabezados específicos, mientras que el segundo es un formato más “tradicional” consistente en un solo párrafo. ¿Cuál prefiere? ¿Por qué? EJEMPLO 3: INVESTIGACIÓN CUANTITATIVA EN EL APÉNDICE A • Lea el resumen y la introducción del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Responda las siguientes preguntas dirigidas: a. ¿Este artículo siguió un formato IMRAD tradicional? ¿Dónde comienza y termina la introducción de este artículo? b. ¿Cómo se usó, si así fue, la aleatoriedad en este estudio? 172 c. ¿Cómo se usó, si así fue, el cegamiento en este estudio? d. Comente sobre la posible generalizabilidad de los hallazgos del estudio. EJEMPLO 4: INVESTIGACIÓN CUALITATIVA EN EL APÉNDICE B • Lea el resumen y la introducción del estudio de Beck y Watson (2010) (“Parto posterior a un parto traumático”) en el apéndice B de este libro. Ejercicios de pensamiento crítico 1. Responda las siguientes preguntas dirigidas, que pueden ayudarlo a valorar aspectos del mérito del estudio: a. ¿Dónde comienza y termina la introducción de este artículo? b. ¿Cómo se usó, si así fue, la aleatoriedad en este estudio? c. ¿Hay alguna indicación en el resumen de que se empleara la triangulación o la reflexividad ? d. Comente sobre la posible transferibilidad de los hallazgos del estudio. ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Guides to Overall Critiques of Research Reports. Respuestas a los ejercicios de pensamiento crítico para los ejemplos 3 y 4. Recursos en Internet con sitios web útiles para el capítulo 4. Un artículo de investigación de una revista de Wolters Kluwer, el estudio descrito como ejemplo 1 en la p. 73. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. 173 Tanto la investigación cuantitativa como la cualitativa difunden sus hallazgos por lo general mediante la publicación de reportes como artículos de investigación en revistas, que describen de manera concisa lo que el investigador hizo y encontró. Los artículos de investigación de revistas por lo regular consisten en un resumen (una sinopsis del estudio) y cuatro secciones principales que suelen seguir el formato IMRAD: una Introducción (el problema de investigación y su contexto), la sección Método (estrategias usadas para responder las preguntas), Resultados (hallazgos del estudio) y (and) Discusión (interpretación e implicaciones de los hallazgos). Los reportes de investigación suelen resultar difíciles de leer porque son densos, concisos y contienen un lenguaje especializado. Los reportes de investigación cuantitativa pueden ser intimidantes al principio porque, en comparación con los reportes cualitativos, son más impersonales e informan sobre pruebas estadísticas. Las pruebas estadísticas se usan para probar hipótesis y evaluar la confiabilidad de los hallazgos. Los hallazgos que son estadísticamente significativos tienen una alta probabilidad de ser “reales”. Un objetivo de este libro es ayudar a los estudiantes a preparar una crítica de una investigación, que es una evaluación analítica de las fortalezas y limitaciones de un estudio, por lo regular para conocer el valor de la evidencia para la práctica de enfermería. Los investigadores enfrentan muchas dificultades, cuyas soluciones deben considerarse cuando se hace la crítica del estudio porque influyen en la inferencia que puede realizarse. Una inferencia es una conclusión establecida a partir de la evidencia del estudio, con consideración de los métodos usados para generar esa evidencia. Los investigadores se esfuerzan por 174 hacer que sus inferencias correspondan con la verdad. La confiabilidad (una dificultad clave en la investigación cuantitativa) se refiere a la exactitud de la información obtenida del estudio. La validez se refiere en términos amplios a la solidez de la evidencia del estudio; es decir, si los hallazgos son convincentes y bien fundamentados. La confianza en la investigación cualitativa abarca varias dimensiones distintas: credibilidad, fiabilidad, posibilidad de confirmación, transferibilidad y autenticidad. La credibilidad se alcanza en la medida en que los métodos generen confianza en la veracidad de los datos y las interpretaciones de los investigadores. La triangulación, el uso de múltiples fuentes para hacer conclusiones sobre la verdad, es una estrategia para aumentar la credibilidad. Un sesgo es una influencia que produce una distorsión en los resultados del estudio. En los estudios cuantitativos, el control de la investigación es una estrategia para corregir los sesgos. El control de la investigación se usa para mantener constantes las influencias externas en la variable dependiente con el fin de que la relación entre las variables independientes y dependientes pueda comprenderse mejor. Los investigadores buscan controlar las variables de confusión (o variables extrañas); es decir las variables ajenas al objetivo de un estudio específico. Para los investigadores cuantitativos, la aleatoriedad (el que ciertas características del estudio se establezcan al azar), es una herramienta sólida para eliminar los sesgos. El cegamiento (o enmascaramiento) se utiliza en ocasiones para evitar los sesgos derivados del conocimiento de los participantes o los agentes de la investigación sobre las hipótesis del estudio o el estado de la investigación. La reflexividad es el proceso de reflexionar de manera crítica acerca de uno mismo y examinar los valores personales que podrían afectar la recolección e interpretación de datos; es una herramienta importante en la investigación cualitativa. La generalizabilidad en un estudio cuantitativo se refiere al 175 grado en que los hallazgos pueden aplicarse a otros grupos y situaciones. Un concepto similar en los estudios cualitativos es la transferibilidad, el grado en el que los hallazgos cualitativos pueden transferirse a otras situaciones. Un mecanismo para mejorar la transferibilidad es una descripción detallada y minuciosa del contexto de investigación de modo que otros puedan hacer inferencias sobre las similitudes contextuales. R E F E R E N C I A S PA R A E L C A P Í T U L O 4 Choquette, A., Rennick, J., & Lee, V. (2015). Back to school after cancer treatment: Making sense of the adolescent experience. Cancer Nursing. Publicación anticipada en línea. *da Silva, N., Chaves, É., de Carvalho, E., Carvalho, L., & Iunes, D. (2015). Foot reflexology in feet impairment of people with type 2 diabetes mellitus: Randomized trial. Revista Latino-Americana de Enfermagem, 23, 603–610. Larimer, K., Durmus, J., & Florez, E. (2015). Experiences of young adults with pacemakers and/or implantable cardioverter defibrillators. Journal of Cardiovascular Nursing. Publicación anticipada en línea. Lincoln, Y. S., & Guba, E. G. (1985). Naturalistic inquiry. Newbury Park, CA: Sage. Montreuil, M., Butler, K., Stachura, M., & Pugnaire-Gros, C. (2015). Exploring helpful nursing care in pediatric mental health settings: The perceptions of children with suicide risk factors and their parents. Issues in Mental Health Nursing, 36, 849–859. Olsen, I., Jensen, S., Larsen, L., & Sørensen, E. (2016). Adolescents’ lived experiences while hospitalized after surgery for ulcerative colitis. Gastroenterology Nursing, 39, 287–296. Park, H., Chun, Y., & Gang, M. (2015). Effects of the Patient-Centered Environment Program on behavioral and emotional problems in homedwelling patients with dementia. Journal of Gerontological Nursing, 41, 40–48. Sanon, M. A., Spigner, C., & McCullagh, M. C. (2016). Transnationalism and hypertension self-management among Haitian immigrants. Journal of Transcultural Nursing, 27, 147–156. **Sun, J. L., & Lin, C. C. (2016). Relationships among daytime napping and fatigue, sleep quality, and quality of life in cancer patients. Cancer Nursing. Publicación anticipada en línea. 176 *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 177 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Explicar los antecedentes históricos que condujeron a la creación de varios códigos de ética. Comprender la posibilidad de dilemas éticos derivados de conflictos entre la ética y las demandas de la investigación. Identificar los tres principios éticos fundamentales expresados en el Informe Belmont y las dimensiones importantes que abarca cada uno. Identificar los procedimientos para apegarse a principios éticos y proteger a los participantes de un estudio. Con base en la información suficiente, evaluar las dimensiones éticas de un reporte de investigación. Definir los términos nuevos del capítulo. Términos clave Anonimato Asentimiento Beneficencia Certificado de confidencialidad Códigos de ética Confidencialidad Consejo de Revisión Institucional (CRI) Consentimiento informado Dilemas éticos Estipendio Formato de consentimiento informado 178 Grupos vulnerables Informe Belmont Revelación completa Riesgo mínimo Sesiones informativas Valoración de riesgo/beneficio ÉTICA E INVESTIGACIÓN En toda investigación con seres humanos o animales, los investigadores deben resolver los problemas éticos. Las preocupaciones éticas son muy prominentes en la investigación porque la línea entre lo que constituye la práctica esperada de la enfermería y la recolección de datos para investigación a veces es imprecisa. Este capítulo explica los principios éticos que deben tenerse presentes cuando se lee un estudio. Antecedentes históricos Podría gustarnos pensar que las violaciones a los principios morales entre los investigadores ocurrieron hace siglos y no en años recientes, pero no es así. Los experimentos médicos de los nazis en las décadas de 1930 y 1940 son el ejemplo más famoso del desprecio hacia la conducta ética. El programa nazi de investigación incluía el uso de prisioneros de guerra y “enemigos raciales” en experimentos médicos. Los estudios fueron antiéticos no solo porque exponían a las personas al daño, sino también porque los sujetos no podían rehusarse a participar. Existen ejemplos más recientes. Por ejemplo, entre 1932 y 1972, el Tuskegee Syphilis Study, patrocinado por el U.S. Public Health Service, investigó los efectos de la sífilis entre 400 hombres afroamericanos pobres. El tratamiento médico se omitió de manera deliberada para estudiar la evolución de la enfermedad no tratada. En 1993 se reveló que las agencias federales estadounidenses habían patrocinado experimentos con radiación desde la década de 1940 en cientos de individuos, muchos de ellos prisioneros o pacientes adultos mayores en hospitales. Y en 2010 se reveló que un médico en Estados Unidos que trabajó en el estudio de Tuskegee inoculó a prisioneros en Guatemala con sífilis en los años de 1940. Han surgido otros ejemplos de estudios con trasgresiones éticas que aportan a las 179 preocupaciones en este campo la gran visibilidad que tienen ahora. Códigos de ética Como respuesta a las violaciones a los derechos humanos se han desarrollado varios códigos de ética. Los estándares éticos conocidos como el Código de Núremberg se crearon en 1949 como respuesta a las atrocidades nazis. Se han desarrollado varios estándares internacionales, como la Declaración de Helsinki, adoptada en 1964 por la World Medical Association y cuya revisión más reciente se hizo en 2013. La mayoría de las disciplinas, como la medicina y la enfermería, establecieron su propio código de ética. En Estados Unidos, la American Nurses Association (ANA) publicó los Ethical Guidelines in the Conduct, Dissemination, and Implementation of Nursing Research en 1995 (Silva, 1995). La ANA, que declaró 2015 como el Año de la Ética, publicó el Code of Ethics for Nurses with Interpretive Statements revisado, un documento que no solo cubre aspectos éticos para profesionales de la enfermería clínica, sino que también incluye principios para aplicar a los investigadores en enfermería. En Canadá, la Canadian Nurses Association publicó la tercera edición de sus Ethical Research Guidelines for Registered Nurses en 2002 y el International Council of Nurses (ICN) desarrolló el ICN Code of Ethics for Nurses, que se actualizó en 2012. TIP Muchos sitios web están dedicados a la ética y la investigación; los enlaces para algunos de ellos se listan en la sección Internet Resources para este capítulo en el sitio web . Regulaciones gubernamentales para proteger a los participantes en un estudio Los gobiernos de todo el mundo patrocinan investigación y establecen reglas para apegarse a los principios éticos. En Estados Unidos, la National Commission for the Protection of Human Subjects of Biomedical and Behavioral Research adoptó un código de ética importante. La comisión publicó en 1978 un documento conocido como el Informe Belmont, que presentó un modelo para 180 muchos lineamientos adoptados por organizaciones disciplinarias en ese país. El Informe Belmont también sirvió como base para las regulaciones que afectaban la investigación patrocinada por el gobierno de Estados Unidos, incluidos los estudios apoyados por el National Institute of Nursing Research (NINR). Las regulaciones éticas se codificaron en el Título 45 Parte 46 del Code of Federal Regulations y su revisión más reciente se hizo en 2005. Dilemas éticos en la práctica de la investigación La investigación que viola los principios éticos casi siempre tiene lugar porque el investigador cree que el conocimiento es potencialmente provechoso en el largo plazo. Para los problemas de investigación, los derechos de los participantes y la calidad del estudio se ponen en conflicto directo, lo que impone dilemas éticos para los investigadores. Estos son ejemplos de problemas de investigación en los que el deseo de mantener el rigor entra en conflicto con las consideraciones éticas: 1. Pregunta de investigación: ¿un nuevo medicamento prolonga la vida de los pacientes con sida? Dilema ético: la mejor forma de poner a prueba la efectividad de una intervención es aplicarla a algunos participantes, pero omitirla en otros para ver si los grupos tienen resultados diferentes. Sin embargo, si la intervención no está probada (p. ej., un fármaco nuevo), el grupo que recibe la intervención puede exponerse a efectos colaterales peligrosos. Por otra parte, es posible que al grupo que no recibe el fármaco se le niegue un tratamiento beneficioso. 2. Pregunta de investigación: ¿los profesionales de enfermería mantienen la misma empatía en su trato con pacientes masculinos y femeninos en la unidad de cuidados intensivos (UCI)? Dilema ético: la ética requiere que los participantes estén conscientes de su papel en un estudio. Aun así, si el investigador informa a los participantes que se examinará su empatía al tratar a pacientes masculinos y femeninos en la UCI, ¿será “normal” su comportamiento? Si el comportamiento usual de los profesionales de enfermería se modifica por la presencia conocida de los observadores de la investigación, los hallazgos serán inexactos. 3. Pregunta de investigación: ¿cómo enfrentan los padres la situación cuando sus hijos tienen una enfermedad terminal? 181 Dilema ético: para responder esta pregunta el investigador necesitaría examinar el estado psicológico de los padres en un momento vulnerable, pero el conocimiento de los mecanismos de los padres para hacer frente a la situación podría ayudar a diseñar formas efectivas para aliviar el duelo y estrés de los padres. 4. Pregunta de investigación: ¿cuál es el proceso por el que los hijos adultos se adaptan al estrés cotidiano de atender a uno de sus padres con enfermedad de Alzheimer? Dilema ético: a veces, sobre todo en estudios cualitativos, un investigador puede aproximarse tanto a los participantes que estos están dispuestos a compartir “secretos” e información privilegiada. Las entrevistas pueden convertirse en confesiones, incluso de un comportamiento inapropiado o ilegal. En este ejemplo, supóngase que una mujer admite que maltrató físicamente a su madre, ¿cómo responde el investigador a esa información sin minar un compromiso de confidencialidad? Y si el investigador divulga la información a las autoridades, ¿cómo puede prometer confidencialidad de buena fe a otros participantes? Como sugieren estos ejemplos, en ocasiones los investigadores se encuentran en un embrollo. Su objetivo es desarrollar evidencia de alta calidad para la práctica, pero también deben apegarse a reglas para proteger los derechos humanos. Puede surgir otro tipo de dilema si los investigadores en enfermería afrontan situaciones de conflicto de intereses en los que su comportamiento esperado como profesionales de enfermería discrepa del comportamiento estándar en la investigación (p. ej., desviarse de un protocolo de investigación para ayudar a un paciente). Es justo por tales dilemas que se necesitan códigos de ética para dirigir los esfuerzos de los investigadores. PRINCIPIOS ÉTICOS PARA PROTEGER A LOS PARTICIPANTES EN LOS ESTUDIOS El Informe Belmont articuló tres principios éticos principales sobre los que se basa la conducción de la investigación ética: beneficencia, respeto por la dignidad humana y justicia. Se describen de modo breve estos principios y los métodos que usan los investigadores para cumplirlos. 182 Beneficencia La beneficencia impone a los investigadores el deber de minimizar el daño y maximizar los beneficios. La investigación humana debe intentar producir beneficios para los participantes o, con más frecuencia, para otros. Este principio cubre múltiples aspectos. El derecho a la ausencia de daño e incomodidad Los investigadores tienen la obligación de prevenir o minimizar el daño en los estudios con seres humanos. Los participantes no deben someterse a riesgos innecesarios de daño o incomodidad, y su participación en la investigación debe ser necesaria para alcanzar objetivos importantes para la sociedad. En la investigación con seres humanos, el daño y la incomodidad pueden ser físicos (p. ej., una lesión), emocionales (p. ej., estrés), sociales (p. ej., pérdida de apoyo social) o financieros (p. ej., pérdida de salarios). Los investigadores éticos deben usar estrategias que minimicen todos los tipos de daños y molestias, incluso los temporales. La protección de los seres humanos contra el daño físico por lo regular es directa, pero suele ser más difícil resolver problemas psicológicos. Por ejemplo, puede preguntarse a los participantes sobre su vida personal. Estas indagaciones pueden llevar a las personas a revelar información muy personal. Es probable que se requiera mayor sensibilidad en los estudios cualitativos, que con frecuencia implican la exploración profunda de áreas muy personales. Es preciso que los investigadores estén conscientes de la naturaleza de la intrusión en la psique de las personas. El derecho a la protección contra la explotación La participación en un estudio no debe poner a los participantes en desventaja. Los participantes deben estar seguros de que su participación o la información que proporcionan no se usarán contra ellos. Por ejemplo, las personas que describen su situación económica no deben estar en riesgo de perder los beneficios de la salud pública; las personas que refieren abuso de drogas no deben temer una demanda por un crimen. Los participantes de un estudio establecen una relación especial con los investigadores, y esta relación no debe explotarse. Como los investigadores en enfermería pueden tener una relación profesional de 183 enfermería-paciente (además de investigador-participante), debe ponerse atención especial para no explotar ese vínculo. El consentimiento de los pacientes a participar en un estudio puede derivar de su comprensión del papel del investigador como profesional de enfermería, no como investigador. En la investigación cualitativa, la distancia psicológica entre los investigadores y los participantes suele reducirse conforme el estudio avanza. Es común que surja una relación seudoterapéutica, lo que podría generar riesgos adicionales de que haya explotación inadvertida. Por otra parte, los investigadores cualitativos suelen estar en mejor posición que los investigadores cuantitativos para hacer el bien, y no solo evitar el daño, debido a las relaciones cercanas que desarrollan con los participantes. Ejemplo de experiencias de investigación terapéuticas Beck et al. (2015) encontraron que algunos participantes de su estudio sobre estrés traumático secundario entre enfermeras parteras certificadas decían a los investigadores que escri bir sobre los partos traumáticos que habían atendido era terapéutico para ellas. Una participante escribió: “Creo que es de llamar la atención cuán poco respeto dan nuestros pacientes y compañeros de trabajo a las experiencias traumáticas que sufrimos. Resulta curativo poder escribir mis experiencias en este estudio y en verdad hacer que los investigadores se interesen en estudiar este tema”. Respeto por la dignidad humana El respeto por la dignidad humana es el segundo principio ético del Informe Belmont. Este principio incluye el derecho a la autodeterminación y el derecho a la revelación completa. El derecho a la autodeterminación El principio de la autodeterminación significa que los participantes potenciales tienen el derecho de decidir voluntariamente si participan en un estudio, sin arriesgarse a un trato perjudicial. También significa que las personas tienen derecho a hacer preguntas, rehusarse a responder preguntas y abandonar el estudio. El derecho de una persona a la autodeterminación incluye la ausencia de coerción. Coerción se refiere a amenazas explícitas o 184 implícitas de penalizaciones por no participar en un estudio, o recompensas excesivas por aceptar la participación. El problema de la coerción requiere una consideración cuidadosa cuando los investigadores están en una posición de autoridad o influencia sobre los participantes potenciales, como podría ocurrir en una relación entre profesional de enfermería-paciente. La coerción puede ser sutil. Por ejemplo, un incentivo monetario generoso (o estipendio) para alentar la participación de un grupo con ingresos bajos (p. ej., indigentes) podría considerarse ligeramente coercitivo porque tales incentivos pueden ser vistos como una forma de presión. El derecho a la revelación completa El respeto a la dignidad humana incluye el derecho de las personas a tomar decisiones informadas sobre la participación en un estudio, lo que requiere revelación completa. El significado de la revelación completa indica que el investigador describió el estudio en su totalidad, el derecho de la persona a rehusarse a participar y los riesgos y beneficios potenciales. El derecho a la autodeterminación y el derecho a la información completa son dos elementos en los que se basa el consentimiento informado (que se describe más adelante en este capítulo). La revelación completa no siempre es directa porque puede generar sesgos y problemas para el reclutamiento de la muestra. Supóngase que se pone a prueba la hipótesis de que los estudiantes de preparatoria con una tasa elevada de ausentismo tienen más probabilidad de ser drogadictos que aquellos con asistencia adecuada. Si el investigador se aproxima a los posibles participantes y les explica por completo el objetivo del estudio, algunos podrían rehusarse a participar y la falta de participación sería selectiva; los estudiantes que abusan de sustancias, el grupo de interés principal, tendría menor probabilidad de participar. Además, al conocer el objetivo del estudio, los participantes podrían no dar respuestas honestas. En tal situación, la revelación completa podría minar el estudio. En casos como el anterior, los investigadores a veces usan la recolección de datos encubierta (encubrimiento), que es la recolección de datos sin el conocimiento de los participantes y por lo tanto sin su consentimiento. Esto podría ocurrir si un investigador quisiera observar el comportamiento de las personas y se preocupara 185 de que al hacerlo de manera abierta cambiaría el comportamiento de interés. Los investigadores podrían optar por obtener la información necesaria con métodos encubiertos, como la observación mientras pretenden realizar otras actividades. Una técnica más controversial es el uso del engaño, que puede implicar la omisión deliberada de información del estudio o la provisión de información falsa a los participantes. Por ejemplo, al evaluar el consumo de drogas entre los estudiantes de preparatoria, podría describirse la investigación como un estudio de las prácticas de salud de los estudiantes, que es una forma leve de desinformación. El engaño y el encubrimiento representan un problema ético porque interfieren con el derecho de las personas a tomar decisiones bien informadas acerca de los costos y beneficios personales de la participación. Algunas personas creen que el engaño nunca está justificado, pero otros consideran que si el estudio conlleva un riesgo mínimo y ofrece beneficios a la sociedad, el engaño puede ser aceptable. La revelación completa ha emergido como un asunto relacionado con la recolección de datos del Internet (p. ej., el análisis del contenido de mensajes publicados en blogs o sitios de redes sociales). El problema es si tales mensajes pueden usarse como datos sin el consentimiento de los autores. Algunos investigadores creen que cualquier cosa publicada por medios electrónicos es de dominio público, pero otros consideran que deben aplicarse los mismos estándares éticos a la investigación en el ciberespacio y que los investigadores deben proteger con cuidado los derechos de las personas que son participantes en comunidades “virtuales”. Justicia El tercer principio expresado en el Informe Belmont se refiere a la justicia, que incluye el derecho de los participantes al trato justo y su derecho a la privacidad. El derecho al trato justo Un aspecto de la justicia se refiere a la distribución equitativa de los beneficios y las cargas de la investigación. La selección de los participantes debe basarse en los requerimientos de la investigación y no en las vulnerabilidades de las personas. Por ejemplo, algunas 186 ocasiones se eligieron grupos con una posición social más baja (p. ej., prisioneros) como participantes en estudios, lo que genera preocupaciones éticas. La discriminación potencial es otro aspecto de la justicia distributiva. Durante la década de 1990, se encontró que las mujeres y las minorías eran excluidas de muchos estudios clínicos. En Estados Unidos, esto dio lugar a regulaciones que obligaban a los investigadores que buscaban un patrocinio de los National Institutes of Health (aun el NINR) a incluir a mujeres y minorías como participantes en el estudio. El derecho al trato justo abarca otras obligaciones. Por ejemplo, los investigadores deben tratar sin prejuicios a las personas que declinan participar en un estudio, honrar todos los acuerdos hechos con los participantes, mostrar respeto por las creencias de las personas con distintos antecedentes y tratar a los participantes con cortesía y tacto en todo momento. El derecho a la privacidad La investigación con seres humanos implica intrusiones en la vida de las personas. Los investigadores deben asegurar que su investigación no sea más intrusiva de lo necesario y que se mantenga la privacidad. Los participantes tienen el derecho a esperar que cualquier dato que proporcionen se mantenga estrictamente confidencial. Los problemas de privacidad se han vuelto más notorios en la comunidad de atención a la salud de Estados Unidos desde la emisión de la Health Insurance Portability and Accountability Act de 1996 (HIPAA), que expresa los estándares federales para proteger los expedientes médicos y la información de salud de los pacientes. Los profesionales de la salud que transmiten información de salud por vía electrónica están obligados a cumplir las regulaciones del HIPAA (la Regla de Privacidad) desde 2003. PROCEDIMIENTOS PARA PROTEGER A LOS PARTICIPANTES EN UN ESTUDIO Ahora que está familiarizado con los principios éticos para la investigación, necesita comprender los procedimientos que los investigadores usan para apegarse a estos. Tales procedimientos 187 deben evaluarse en una crítica sobre los aspectos éticos de un estudio. TIP La información acerca de las consideraciones éticas casi siempre se presenta en la sección sobre el método, por lo regular en una subsección llamada “Procedimientos”. Valoraciones de riesgo/beneficio Una estrategia que usan los investigadores para proteger a los participantes es conducir una valoración de riesgo/beneficio. Tal valoración está diseñada para evaluar si los beneficios de participar en un estudio concuerdan con los costos; es decir, si el cociente riesgo/beneficio es aceptable. El recuadro 5-1 resume los principales costos y beneficios para los participantes en una investigación. También deben tomarse en cuenta los beneficios para la sociedad y para la enfermería. La selección de un tema significativo que puede mejorar la atención a los pacientes es el primer paso para asegurar que la investigación es ética. Recuadro 5-1 Beneficios y riesgos potenciales de la investigación para los participantes Principales beneficios potenciales para los participantes Acceso a una intervención potencialmente beneficiosa que de otra manera no estaría disponible. Confianza en poder discutir su situación o problema con una persona amigable y objetiva. Aumentar su conocimiento sobre ellos mismos y sus enfermedades. Escapar de la rutina normal. Satisfacción de que la información que proporcionen puede ayudar a otros con problemas similares. Ganancias directas por estipendios u otros incentivos. Principales riesgos potenciales para los participantes Daño físico, incluidos efectos colaterales inesperados. Molestia física, fatiga o aburrimiento. Sufrimiento emocional por hacer revelaciones, incomodidad con extraños, vergüenza por las preguntas formuladas. 188 Riesgos sociales, como el riesgo de un estigma, efectos negativos en las relaciones personales. Pérdida de la privacidad. Pérdida de tiempo. Costos monetarios (p. ej., para transporte, cuidado infantil, tiempo perdido del trabajo). TIP Para evaluar el cociente riesgo/beneficio de un estudio, podría considerarse qué tan cómodo se sentiría usted al ser participante en ese estudio. En algunos casos, los riesgos son insignificantes. El riesgo mínimo es un riesgo anticipado que no es mayor que los que se enfrentan de manera ordinaria en la vida cotidiana o durante los procedimientos de rutina. Cuando los riesgos no son mínimos, los investigadores deben proceder con cautela, con todas las medidas posibles para reducir los riesgos y maximizar los beneficios. Consentimiento informado Un procedimiento importante para salvaguardar a los participantes es la obtención de su consentimiento informado. Consentimiento informado significa que los participantes tienen información suficiente acerca del estudio, la comprenden y tienen el poder de realizar una elección libre, lo que les permite aceptar o rechazar la participación voluntaria. Por lo general, los investigadores documentan el consentimiento informado al hacer que los participantes firmen un formato de consentimiento informado. Este formato incluye información del objetivo del estudio, las expectativas específicas sobre la participación (p. ej., cuánto tiempo requerirá), la naturaleza voluntaria de la participación, los costos y beneficios potenciales. El suplemento en inglés del capítulo en el sitio web incluye información adicional del contenido de los formatos de consentimiento informado, así como un ejemplo real de un estudio a cargo de una de las autoras del libro (Beck). TIP Ejemplo de consentimiento informado 189 Kelley y sus colaboradores (2015) estudiaron la evolución de los servicios de gestión de casos para los miembros del servicio estadounidense lesionados en Irak y Afganistán. Se entrevistó a un total de 235 profesionales de enfermería sobre las experiencias de atención a los pacientes. Se obtuvo el consentimiento informado escrito de los participantes en el estudio. Dicho formato incluía información sobre la divulgación de actividades ilegales. Antes de cada entrevista, los investigadores recordaron a los participantes que no divulgaran información que pudiera interpretarse como sensible o clasificada. Es posible que los investigadores no obtengan un consentimiento informado escrito cuando la recolección de datos se hace mediante cuestionarios respondidos por los participantes. Los investigadores suelen asumir un consentimiento implícito (es decir, la entrega de un cuestionario respondido implica el consentimiento de la persona para participar). En los estudios cualitativos que implican la recolección recurrente de datos puede ser difícil obtener un consentimiento significativo al principio. Como el diseño surge durante el estudio, es posible que los investigadores desconozcan cuáles serán los riesgos y beneficios. En tales situaciones, el consentimiento puede ser un proceso continuo, llamado consentimiento en proceso, en el que el consentimiento se renegocia continuamente. Procedimientos de confidencialidad Los participantes en un estudio tienen el derecho de esperar que los datos que proporcionan se mantengan confidenciales. El derecho a la privacidad de los participantes se protege mediante procedimientos de confidencialidad. Anonimato El anonimato, el medio más seguro para proteger la confidencialidad, se produce cuando el investigador no puede vincular a los participantes con sus datos. Por ejemplo, si los cuestionarios se distribuyen a un grupo de residentes de asilos y se devuelven sin datos de identificación, las respuestas serían anónimas. Ejemplo de anonimato 190 Melnyk y sus colaboradores (2016) condujeron un estudio para identificar los factores clave que influyeron en comportamientos de estilo de vida saludables en 3 959 miembros de la facultad y personal de una universidad grande. Los participantes completaron una encuesta anónima en línea que incluía preguntas sobre las creencias y comportamientos de estilo de vida saludable de los participantes, así como sus percepciones sobre la cultura de bienestar. Confidencialidad en ausencia de anonimato Cuando el anonimato no es posible, deben implementarse otros procedimientos de confidencialidad. Una promesa de confidencialidad es un compromiso de que cualquier información que proporcione el participante no se publicará de alguna forma que permita identificarlo y no estará accesible a otros. Los investigadores pueden tomar varias medidas para asegurar que no exista una falla en la confidencialidad. Incluyen mantener los datos de identificación en archivos bajo llave, sustituir los nombres en los expedientes por números de identificación e informar solo datos acumulados para grupos de participantes. La confidencialidad es muy importante en los estudios cualitativos por su naturaleza profunda, aunque rara vez es posible el anonimato. Los investigadores cualitativos también enfrentan la dificultad de ocultar adecuadamente la identidad de los participantes en sus reportes. Como el número de sujetos que responde es pequeño y se presenta información descriptiva detallada, los investigadores cualitativos utilizan seudónimos para salvaguardar la identidad de los participantes. TIP Como una forma de mejorar la privacidad individual e institucional, los artículos de investigación por lo regular evitan dar información de la localización del estudio. Por ejemplo, un estudio podría decir que los datos se obtuvieron en un asilo privado de 200 camas, sin mencionar su nombre o ubicación. En ocasiones, la confidencialidad genera tensión entre los investigadores y las autoridades legales, sobre todo si los participantes realizan alguna actividad criminal, como el abuso de sustancias. Para evitar la divulgación forzada de información (p. ej., por una orden judicial), los investigadores en Estados Unidos pueden 191 solicitar un certificado de confidencialidad de los National Institutes of Health. El certificado permite a los investigadores rehusarse a divulgar información de los participantes del estudio en cualquier procedimiento legal. Ejemplo de procedimientos de confidencialidad Hayes (2015) estudió los patrones de vida de mujeres encarceladas. Las 18 mujeres que participaron eligieron seudónimos para sí mismas. Las entrevistas fueron conducidas en habitaciones privadas de la prisión. El investigador confirmó que las habitaciones no tuvieran cámaras ni micrófonos y que no hubiera cerca personal de la institución. Sesiones informativas y referencias Los investigadores deben mostrar respeto por los participantes durante las interacciones que tengan con ellos. Por ejemplo, los investigadores deben ser corteses y hacer evidente su tolerancia a la diversidad cultural, lingüística y de estilo de vida. También existen estrategias formales para transmitir respeto por el bienestar de los participantes. Por ejemplo, en ocasiones es recomendable ofrecer sesiones informativas después de recolectar los datos para que los participantes puedan hacer preguntas o compartir preocupaciones. Los investigadores también pueden demostrar su interés en los participantes al ofrecerse a compartir los hallazgos de los estudios con ellos después del análisis de los datos. Por último, quizá los investigadores necesitan ayudar a los participantes mediante referencias a los servicios apropiados de salud, sociales o psicológicos. Ejemplo de referencias Holmes y sus colaboradores (2015) estudiaron la experiencia de reclusión en una institución psiquiátrica forense. El estudio incluyó entrevistas detalladas con 13 internos psiquiátricos que habían estado recluidos durante los 6 meses anteriores a la entrevista. Los investigadores, conscientes de la naturaleza sensible de la investigación, hicieron los arreglos para referir a cualquier paciente perturbado al jefe de enfermería de la unidad. 192 Trato de grupos vulnerables El cumplimiento de los estándares éticos por lo regular es claro. Sin embargo, los derechos de los grupos vulnerables especiales pueden requerir protecciones adicionales. Es posible que las poblaciones vulnerables sean incapaces de dar un consentimiento informado del todo (p. ej., personas con alteración cognitiva) o que tengan riesgo alto de efectos colaterales no intencionales (p. ej., mujeres embarazadas). Hay que prestar atención particular a las dimensiones éticas de un estudio cuando se incluyen personas vulnerables. Entre los grupos que deben considerarse vulnerables están los siguientes: Niños. Desde el punto de vista legal y ético, los niños no tienen competencia para dar su consentimiento informado, por lo que debe obtenerse el consentimiento de sus padres o tutores. Sin embargo, es apropiado, sobre todo si el niño tiene por lo menos 7 años de edad, obtener también su asentimiento. Asentimiento se refiere al acuerdo afirmativo del niño para participar. Personas con discapacidad mental o emocional. Las personas cuya discapacidad las imposibilite para tomar decisiones informadas (p. ej., personas en coma) tampoco pueden otorgar su consentimiento informado legal. En tales casos, los investigadores deben obtener el consentimiento de un representante legal. Personas con enfermedad o discapacidad física graves. Para pacientes graves o que reciben ciertos tratamientos (p. ej., ventilación mecánica), podría ser necesario valorar su capacidad para tomar decisiones razonadas sobre la participación en el estudio. Pacientes terminales. Las personas en etapa terminal pocas veces pueden esperar obtener un beneficio personal de la investigación, por lo que es preciso valorar con cuidado el cociente riesgo/ beneficio. Personas internadas en instituciones. Los profesionales de enfermería suelen realizar estudios en personas hospitalizadas o internadas en instituciones (p. ej., prisioneros), que podrían sentir que su atención estaría en peligro si no cooperaran. Los investigadores que estudian a grupos internados en instituciones deben hacer énfasis en la naturaleza voluntaria de la participación. Mujeres embarazadas. El gobierno estadounidense publicó requerimientos adicionales para regular la investigación en mujeres embarazadas y fetos. Estos requerimientos reflejan un deseo de salvaguardar a la mujer, que podría estar en un mayor riesgo físico o 193 psicológico, y al feto, que no puede dar su consentimiento informado. Ejemplo de investigación con un grupo vulnerable Knutsson y Bergbom (2016) estudiaron las ideas y sentimientos de 28 niños con respecto a la visita a familiares graves en una UCI para adultos. Los guardianes de los niños firmaron un formato de consentimiento informado. Además, antes de iniciar las entrevistas con los niños, el investigador les preguntó si deseaban participar. Revisión externa y protección de los derechos humanos Es posible que los investigadores no sean objetivos al desarrollar procedimientos para proteger los derechos de los participantes. Los sesgos pueden originarse debido a su compromiso con un área del conocimiento y su deseo de conducir un estudio riguroso. Debido al riesgo de una evaluación sesgada, las dimensiones éticas de un estudio casi siempre se someten a una revisión externa. La mayoría de los hospitales, universidades y otras instituciones en las que se conduce investigación tiene comités formales establecidos para revisar los planes de esta. Tales comités a veces se llaman comité de investigación y ética o (en Canadá) Consejo de Ética en Investigación. En Estados Unidos, el comité suele denominarse Consejo de Revisión Institucional (CRI). Previo al inicio del estudio, los investigadores deben presentar los planes de investigación al CRI y también deben recibir entrenamiento formal del mismo. Un CRI puede aprobar los planes propuestos, solicitar modificaciones o desaprobarlos. Ejemplo de aprobación del CRI Fishering y sus colaboradores (2016) estudiaron la experiencia de enfermeras de la unidad de cuidados intensivos neonatales (UCIN) que se convirtieron en madres con hijos en la UCIN. Los procedimientos y protocolos para el estudio fueron aprobados por el CRI de la Washington’s University Medical School. Aspectos éticos para el uso de animales en la 194 investigación Algunos investigadores en enfermería que se enfocan en fenómenos biofisiológicos usan animales como sujetos. Está claro que las consideraciones éticas son diferentes para animales y seres humanos; por ejemplo, el consentimiento informado no es relevante para los animales. En Estados Unidos, el Public Health Service publicó una declaración de política sobre el cuidado y uso humanitario de animales. Los lineamientos expresan los principios para el cuidado y trato apropiados de los animales que se utilizan en la investigación; cubre aspectos como el transporte de los animales de investigación, el dolor y sufrimiento de estos, y el uso de la anestesia apropiada y la eutanasia en ciertas condiciones durante o después del estudio. Ejemplo de investigación con animales Moes y Holden (2014) estudiaron los cambios en la actividad espontánea y la masa muscular esquelética en ratas que se habían sometido a una cirugía de lesión con constricción crónica. El Committee for the Use and Care of Animals de la University of Michigan aprobó todos los procedimientos y el estudio cumplió los lineamientos de la Association for Assessment and Accreditation of Laboratory Animal Care. CRÍTICA DE LOS ASPECTOS ÉTICOS DE UN ESTUDIO Los lineamientos para criticar los aspectos éticos de un estudio se presentan en el recuadro 5-2. Los miembros de un CRI o un comité de investigación y ética tienen información suficiente para responder todas estas preguntas, pero los artículos de investigación no siempre incluyen información detallada sobre la ética por restricciones del espacio en las revistas. Por lo tanto, puede ser difícil criticar el cumplimiento de los lineamientos éticos por parte de los investigadores. No obstante, se presentan algunas sugerencias para considerar los aspectos éticos. Muchos reportes de investigación indican que los procedimientos del estudio fueron revisados por un CRI o un comité de investigación y ética. Cuando un reporte menciona una revisión formal, casi siempre es seguro asumir que un panel de personas interesadas revisó 195 de manera minuciosa los problemas éticos generados por el estudio. También es posible llegar a algunas conclusiones con base en la descripción de los métodos del estudio. Quizá haya información suficiente para juzgar, por ejemplo, si los participantes en el estudio sufrieron daño o molestias. Los reportes no siempre señalan si se obtuvo el consentimiento informado, pero usted debe mantenerse alerta para detectar situaciones en las que los datos no pudieron obtenerse de la forma en que se describe si la participación fue del todo voluntaria (p. ej., si los datos se obtuvieron de manera sutil). Recuadro 5-2 Lineamientos para la crítica a los aspectos éticos de un estudio 1. ¿El estudio fue aprobado y vigilado por un Consejo de Revisión Institucional, un comité de investigación y ética u otro comité de revisión de ética similar? 2. ¿Los participantes fueron sujetos de cualquier daño físico, molestia o sufrimiento psicológico? ¿Los investigadores tomaron las medidas apropiadas para eliminar o prevenir el daño? 3. ¿Los beneficios para los participantes rebasaron cualquier riesgo potencial o molestia real que experimentaron? ¿Los beneficios para la sociedad exceden los costos para los participantes? 4. ¿Hubo algún tipo de coerción o se usó alguna influencia indebida para incluir a los participantes? ¿Tuvieron el derecho de rehusarse a participar o a retirarse sin penalizaciones? 5. ¿Fueron engañados los participantes de alguna manera? ¿Estaban conscientes de su participación en un estudio y comprendieron el propósito y la naturaleza de la investigación? 6. ¿Se usaron los procedimientos apropiados de consentimiento informado con todos los participantes? Si no fue así, ¿hubo razones válidas y justificables? 7. ¿Se tomaron las medidas apropiadas para salvaguardar la privacidad de los participantes? ¿Cómo se mantuvo la confidencialidad? ¿Se obtuvo un certificado de confidencialidad o, de no ser así, debió obtenerse uno? 8. ¿Se incluyeron grupos vulnerables en la investigación? Si así fue, ¿se instituyeron precauciones especiales por su estado de vulnerabilidad? 9. ¿Se omitieron grupos de la investigación sin una razón justificable, como mujeres (u hombres) o minorías? 196 Cuando se piensa en los aspectos éticos de un estudio, debe considerarse quiénes son los participantes. Por ejemplo, debe haber más información sobre procedimientos de protección si el estudio incluye grupos vulnerables. Quizá también sea necesario poner atención en quiénes no son participantes. Por ejemplo, hay una preocupación considerable acerca de la omisión de ciertos grupos (como las minorías) en la investigación clínica. EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO En las siguientes secciones se presentan resúmenes breves de un estudio de enfermería cuantitativo y otro cualitativo. Lea los resúmenes y luego responda las preguntas de pensamiento crítico que les siguen sobre los aspectos éticos de los estudios; de ser necesario, consulte el reporte de investigación completo. Los ejemplos 1 y 2 se presentan en la sección Critical Thinking Activity del sitio web . Las preguntas de pensamiento crítico para los ejemplos 3 y 4 se basan en los estudios que aparecen en los apéndices A y B de este libro. Los comentarios en inglés de las autoras sobre estos ejercicios están en la sección Student Resources en . EJEMPLO 1: INVESTIGACIÓN CUANTITATIVA Estudio. Tipología familiar y evaluación del comportamiento de los preescolares por parte de mujeres cuidadoras (Coke y Moore, 2015). Objetivo. La finalidad del estudio era explorar los factores familiares relacionados con la evaluación del comportamiento de un niño por parte de una cuidadora femenina, el grado en que se distorsiona la evaluación de la cuidadora y el riesgo del niño de tener un problema de comportamiento. Métodos de investigación. Los datos se obtuvieron mediante un cuestionario respondido por las cuidadoras femeninas familiares de 117 preescolares que acudían a un programa preescolar rural de educación inicial para familias de ingresos bajos. Los cuestionarios, que requerían 30 minutos para responderse, incluyeron preguntas sobre estrés de la 197 cuidadora, evaluación y calificaciones de los comportamientos de los niños y apoyo social. Ninguna participante necesitó ayuda para completar el cuestionario debido a problemas de lectura o idioma. Los investigadores decidieron enfocarse en cuidadoras femeninas “porque el reclutamiento de cuidadores masculinos de niños pequeños es problemático” (p. 446). La muestra de cuidadoras incluyó a mujeres afroamericanas (83%), caucásicas (15%), hispanas (2%) y nativas norteamericanas (1%). Procedimientos relacionados con la ética. Las cuidadoras fueron reclutadas durante un día de campo de padres e hijos y una sesión de orientación de padres y maestros en el programa de educación inicial. El investigador principal se reunió con todas las cuidadoras que decidieron participar. A cada participante se asignó un número de identificación único para proteger su identidad y la lista que vinculaba a la participante con ese número se mantuvo separada de los cuestionarios bajo llave. Después de completar el cuestionario, cada participante recibió una bolsa de obsequio con una tarjeta de regalo de 5 dólares canjeable en una tienda local y materiales educativos relacionados con la salud para los niños. El estudio fue aprobado por el County Board of Education y el CRI de la universidad de los investigadores antes de la inclusión de participantes. Hallazgos clave. La distorsión de la calificación acerca del comportamiento de sus hijos que hicieron las cuidadoras se relacionó con un mayor riesgo de tener un niño con problemas de comportamiento. Las familias vulnerables tuvieron una probabilidad mucho mayor de tener un niño con riesgo alto de problemas de comportamiento que las familias clasificadas como seguras. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 5-2 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿Podrían haberse recolectado de manera anónima los datos de este estudio? b. Comente acerca de lo apropiado del estipendio para las participantes en este estudio. 3. Si los resultados de este estudio son válidos y generalizables, ¿cuáles podrían ser algunos usos en los que podrían aplicarse los hallazgos en la práctica clínica? EJEMPLO 2: INVESTIGACIÓN CUALITATIVA Estudio. Duelo interrumpido: la experiencia de la pérdida entre mujeres encarceladas (Harner et al., 2011). 198 Objetivo. El objetivo del estudio era explorar las experiencias de duelo entre las mujeres encarceladas después de la pérdida de un ser querido. Métodos de estudio. Los investigadores usaron métodos fenomenológicos. Incluyeron a 15 mujeres encarceladas que habían experimentado la pérdida de un ser querido durante su confinamiento. Las entrevistas detalladas acerca de la experiencia de pérdida de las mujeres duraron de 1 a 2 horas. Procedimientos relacionados con la ética. Los investigadores reclutaron a las mujeres mediante la colocación de volantes en la sala común de la prisión. Los volantes fueron escritos con vocabulario sencillo. Como el autor principal era un profesional de enfermería de la prisión, los investigadores usaron varias estrategias para “suavizar cualquier coerción percibida” (p. 457), por ejemplo no colocar volantes cerca de la unidad de servicios médicos y no ofrecer ningún incentivo monetario o de liberación de trabajo a las participantes. Se obtuvo el consentimiento informado escrito, pero debido a las tasas elevadas de analfabetismo, el documento correspondiente se leyó en voz alta a todas las participantes potenciales. Durante el proceso de consentimiento y las entrevistas, las mujeres tuvieron la oportunidad de hacer preguntas. Se les informó que su participación no tendría efecto en la duración de su sentencia, la estructura de la misma, libertad condicional o acceso a los servicios médicos. También se les advirtió que podían terminar la entrevista en cualquier momento sin temor a represalias. Además, se les señaló que el investigador era una persona obligada a reportar cualquier indicio de ideación suicida u homicida. No era necesario que las participantes dieran su nombre al equipo de investigación. Durante la entrevista se hicieron esfuerzos para crear un ambiente amable y no amenazador. El equipo de investigación recibió la aprobación para su estudio del CRI de la universidad y de la Department of Corrections Research Division. Hallazgos clave. Los investigadores revelaron cuatro temas a los que se refirieron como mundos existenciales: temporalidad: congelada en el tiempo; espacialidad: sin lugar, sin espacio para practicar el duelo; corporalidad: emociones ocultas, y ser relacional: nunca estar sola, pero sentirse muy sola. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 5-2 sobre este estudio. 2. Considere también las siguientes preguntas dirigidas: a. Los investigadores no ofrecieron estipendio alguno, ¿fue apropiado desde el punto de vista ético? b. ¿Podrían los investigadores haberse beneficiado al obtener un 199 certificado de confidencialidad para esta investigación? 3. Si los resultados de este estudio son confiables y transferibles, ¿cuáles podrían ser algunos de los usos a los que podrían aplicarse los hallazgos en la práctica clínica? EJEMPLO 3: INVESTIGACIÓN CUANTITATIVA EN EL APÉNDICE A • Lea la sección de métodos del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 5-2 sobre este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿Dónde se localiza la información sobre problemas éticos en este reporte? b. ¿Qué información adicional de los aspectos éticos de su estudio pudieron haber incluido los investigadores en este artículo? EJEMPLO 4: INVESTIGACIÓN CUALITATIVA EN EL APÉNDICE B • Lea la sección de métodos del estudio de Beck y Watson (2010) (“Parto posterior a un parto traumático”) en el apéndice B de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 5-2 sobre este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿Dónde se localiza la información sobre problemas éticos en este reporte? b. ¿Qué información adicional de los aspectos éticos del estudio de Beck y Watson pudieron haber incluido las investigadoras en este artículo? ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. 200 Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Informed Consent. Respuestas a los ejercicios de pensamiento crítico para los ejemplos 3 y 4. Recursos en Internet con sitios web útiles para el capítulo 5. Un artículo de investigación de una revista de Wolters Kluwer, el estudio descrito como ejemplo 1 en las pp. 87-88. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. Como la investigación no siempre se ha realizado de manera ética y debido a los dilemas éticos genuinos que enfrentan los investigadores para diseñar estudios que sean éticos y rigurosos, se desarrollaron códigos de ética para guiar a estos profesionales. Tres principios fundamentales del Informe Belmont se incorporan en muchos lineamientos: beneficencia, respeto por la dignidad humana y justicia. La beneficencia implica la práctica de algún bien y la protección de los participantes contra explotación y daño físico y psicológico. Respecto a la dignidad humana, se refiere al derecho de los participantes a la autodeterminación, que incluye el derecho de participar en un estudio de manera voluntaria. Revelación completa significa que los investigadores describen por completo a los participantes potenciales sus derechos y los costos y beneficios del estudio. Cuando la revelación completa conlleva el riesgo de resultados sesgados, los investigadores a veces usan el encubrimiento (la recolección de información sin el conocimiento de los participantes) o el engaño (omitir 201 información o proporcionar información falsa). La justicia incluye el derecho a un trato justo y el derecho a la privacidad. En Estados Unidos, la privacidad se convirtió en un problema sustancial por las regulaciones de la Regla de Privacidad derivadas de la Health Insurance Portability and Accountability Act (HIPAA). Se han desarrollado procedimientos para salvaguardar los derechos de los participantes en el estudio, incluida la valoración de riesgo/beneficio, la implementación de procedimientos para el consentimiento informado y la toma de medidas para salvaguardar la confidencialidad de los participantes. En una valoración de riesgo/beneficio, los beneficios potenciales del estudio para los participantes individuales y para la sociedad se sopesan contra los costos para los individuos. Los procedimientos de consentimiento informado, que proporcionan a los participantes potenciales la información necesaria para tomar una decisión razonada sobre su participación, por lo general incluyen la firma de un formato de consentimiento para documentar la participación voluntaria e informada. La privacidad puede mantenerse mediante el anonimato (en el que ni siquiera los investigadores conocen la identidad de los participantes) o mediante procedimientos de confidencialidad formales que protegen los datos de los participantes. Algunos investigadores de Estados Unidos obtienen un certificado de confidencialidad que los protege contra la divulgación forzada de información confidencial mediante una orden judicial. En ocasiones, los investigadores ofrecen sesiones informativas después de la recolección de datos para proporcionar a los participantes más información o una oportunidad para expresar quejas. Los grupos vulnerables requieren protección adicional. Estas personas pueden ser vulnerables porque no son capaces de tomar una decisión informada acerca de la participación en el estudio (p. ej., niños), porque su autonomía está disminuida (p. ej., prisioneros) o porque sus circunstancias aumentan su riesgo de 202 sufrir un daño (p. ej., mujeres embarazadas, enfermos terminales). La revisión externa de los aspectos éticos de un estudio por parte de un comité de investigación y ética o un Consejo de Revisión Institucional (CRI) es muy deseable y por lo regular un requisito de las universidades y organizaciones en las que se incluyen los participantes. REFERENCIAS DEL CAPÍTULO 5 American Nurses Association. (2015). Code of ethics for nurses with interpretive statements (2nd ed.). Silver Spring, MD: Author. Beck, C. T., LoGiudice, J., & Gable, R. K. (2015). A mixed-methods study of secondary traumatic stress in certified nurse-midwives: Shaken belief in the birth process. Journal of Midwifery & Women’s Health, 60, 16–23. Canadian Nurses Association. (2002). Ethical research guidelines for registered nurses (3rd ed.). Ottawa, Canada: Author. **Coke, S. P., & Moore, L. (2015). Family typology and appraisal of preschoolers’ behavior by female caregivers. Nursing Research, 64, 444– 451. Fishering, R., Broeder, J., & Donze, A. (2016). A qualitative study: NICU nurses as NICU parents. Advances in Neonatal Care, 16, 74–86. *Harner, H., Hentz, P., & Evangelista, M. (2011). Grief interrupted: The experience of loss among incarcerated women. Qualitative Health Research, 21, 454–464. Hayes, M. O. (2015). The life pattern of incarcerated women: The complex and interwoven lives of trauma, mental illness, and substance abuse. Journal of Forensic Nursing, 11, 214–222. Holmes, D., Murray, S., & Knack, N. (2015). Experiencing seclusion in a forensic psychiatric setting: A phenomenological study. Journal of Forensic Nursing, 11, 200–213. Kelley, P. W., Kenny, D., Gordon, D., & Benner, P. (2015). The evolution of case management for service members injured in Iraq and Afghanistan. Qualitative Health Research, 25, 426–439. Knutsson, S., & Bergbom, I. (2016). Children’s thoughts and feelings related to visiting critically ill relatives in an adult ICU: A qualitative study. Intensive and Critical Care Nursing, 32, 33–41. Melnyk, B. M., Amaya, M., Szalacha, L. A., & Hoying, J. (2016). Relationships among perceived wellness culture, healthy lifestyle beliefs, and healthy behaviors in university faculty and staff: Implications for practice and future research. Western Journal of Nursing Research, 38, 308–324. 203 Moes, J., & Holden, J. (2014). Characterizing activity and muscle atrophy changes in rats with neuropathic pain: A pilot study. Biological Research for Nursing, 16, 16–22. Silva, M. C. (1995). Ethical guidelines in the conduct, dissemination, and implementation of nursing research. Washington, DC: American Nurses Association. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 204 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Describir el proceso para desarrollar y refinar un problema de investigación. Distinguir las funciones y las formas de plantear el objetivo y las preguntas de investigación para estudios cuantitativos y cualitativos. Describir la función y las características de las hipótesis de investigación. Criticar los objetivos, las preguntas de investigación y las hipótesis en los reportes de investigación con respecto a su situación, claridad, redacción y relevancia. Definir los nuevos términos del capítulo. Términos clave Hipótesis Hipótesis de investigación Hipótesis direccional Hipótesis no direccional Hipótesis nula Objetivo de investigación Planteamiento del problema Pregunta de investigación 205 Problema de investigación GENERALIDADES DE LOS PROBLEMAS DE INVESTIGACIÓN Los estudios comienzan de la misma manera que un esfuerzo de práctica basada en evidencia (PBE): como problemas que es necesario resolver o preguntas que requieren una respuesta. Este capítulo analiza los problemas y las preguntas de investigación, e inicia con la aclaración de algunos términos. Terminología básica Los investigadores comienzan con un tema en el que se enfocan. Ejemplos de temas de investigación son la claustrofobia durante la toma de imágenes por resonancia magnética (IRM) y el tratamiento del dolor en la drepanocitosis. Dentro de los temas amplios existen muchos problemas de investigación posibles. En esta sección se ilustran varios términos con el tema efectos colaterales de la quimioterapia. TABLA 6-1 Términos relativos a los problemas de investigación con ejemplos Término Ejemplo Tema Efectos colaterales de la quimioterapia La náusea y el vómito son efectos colaterales comunes entre los pacientes que reciben quimioterapia y hasta ahora las intervenciones solo han tenido éxito moderado para disminuir estos efectos. Es necesario identificar nuevas intervenciones que ayuden a reducir o prevenir estos efectos colaterales. El objetivo del estudio es comparar la efectividad del tratamiento antiemético controlado por el paciente con la del administrado por el profesional de enfermería para controlar la náusea y el Problema de investigación (planteamiento del problema) Objetivo de investigación 206 Pregunta de investigación Hipótesis vómito en pacientes que se someten a quimioterapia. ¿Cuál es la efectividad relativa del tratamiento antiemético controlado por el paciente frente al controlado por el profesional de enfermería con respecto a (1) el consumo de medicamento y (2) el control de la náusea y el vómito en pacientes que reciben quimioterapia? Los sujetos que reciben tratamiento antiemético mediante una bomba controlada por el paciente (1) tendrán menos náusea, (2) vomitarán menos y (3) consumirán menos medicamento que los sujetos que reciben tratamiento administrado por el profesional de enfermería. Un problema de investigación es una situación enigmática o problemática. El propósito de la investigación es “resolver” el problema –o contribuir a su solución– mediante la recolección de datos relevantes. Un planteamiento del problema articula el problema y es un argumento que explica la necesidad de un estudio. La tabla 6-1 presenta un planteamiento del problema simplificado en relación con el tema de efectos colaterales de la quimioterapia. Muchos reportes presentan un objetivo de investigación (o simplemente objetivo), que es un resumen del objetivo general. A veces, las palabras finalidad o propósito se usan en lugar de objetivo. Las preguntas de investigación son las interrogantes específicas que los investigadores desean responder. Los investigadores que hacen predicciones específicas sobre las respuestas a las preguntas de investigación presentan hipótesis que luego ponen a prueba. Estos términos no siempre se definen de modo consistente en los libros de investigación. La tabla 6-1 ilustra las interrelaciones entre los términos conforme se definen. Problemas y paradigmas de investigación Algunos problemas de investigación son más adecuados para las indagaciones cualitativas frente a las cuantitativas. Por lo general, los 207 estudios cuantitativos implican conceptos bien desarrollados y para los que se generan (o pueden generarse) métodos de medición. Por ejemplo, podría realizarse un estudio cuantitativo con el fin de valorar si las personas con enfermedades crónicas se deprimen más que las personas sin esos padecimientos. Existen mediciones relativamente adecuadas de la depresión que aportarían datos cuantitativos sobre el grado de depresión en sujetos con o sin una enfermedad crónica. Los estudios cualitativos se realizan porque un investigador desea desarrollar una comprensión detallada y contextualizada de un fenómeno poco comprendido. Los métodos cualitativos no serían adecuados para comparar grados de depresión entre personas con y sin una enfermedad crónica, pero serían ideales en la exploración del significado de la depresión entre los enfermos crónicos. Al evaluar un reporte de investigación hay que considerar si el problema de investigación es apropiado para el paradigma elegido. Fuentes de problemas de investigación ¿De dónde provienen las ideas para los problemas de investigación? En el plano más básico, los temas de investigación se originan en los intereses de los investigadores. Debido a que la investigación es una tarea que requiere mucho tiempo, la curiosidad y el interés en un tema son esenciales para el éxito de un proyecto. Los reportes de investigación rara vez indican la fuente de la inspiración de los investigadores para un estudio, pero diversas fuentes explícitas pueden estimular su curiosidad, como la experiencia clínica de los profesionales de enfermería y las lecturas en la bibliografía de enfermería. Además, a veces los temas son sugeridos por problemas sociales o políticos globales relevantes para la comunidad de atención a la salud y de profesionales de la salud (p. ej., disparidades en la salud). Las teorías de la enfermería y las de otras disciplinas en ocasiones sugieren un problema de investigación. Asimismo, los investigadores que desarrollaron un proyecto de investigación pueden obtener la inspiración para los “pasos siguientes” de sus propios hallazgos o de una discusión de esos hallazgos con otros. Ejemplo de la fuente de un problema para un estudio cuantitativo Beck, una de las autoras de este libro, desarrolló un sólido programa de 208 investigación sobre la depresión posparto (DP). La doctora Carol Lammi-Keefe, profesora de ciencias de la nutrición, y su estudiante de doctorado, Michelle Judge, que había estado estudiando el efecto del ácido docosahexaenoico (DHA, un lípido encontrado en peces de agua fría) en el desarrollo fetal, se aproximaron a Beck. La bibliografía sugería que el DHA podría participar en la reducción de la gravedad de la DP, por lo que estas investigadoras colaboraron en un proyecto para probar la efectividad de los suplementos dietéticos de DHA durante el embarazo en la incidencia y gravedad de la DP. Las investigadoras encontraron que las mujeres del grupo experimental con DHA tenían menos síntomas de DP que las que no recibieron la intervención con DHA (Judge et al., 2014). Desarrollo y refinamiento de los problemas de investigación El desarrollo de un problema de investigación es un proceso creativo. Los investigadores suelen comenzar con intereses en un tema amplio y luego desarrollan un problema más específico susceptible de investigación. Por ejemplo, supóngase que un profesional de enfermería en un hospital comienza a preguntarse por qué algunos pacientes se quejan de tener que esperar un medicamento para el dolor cuando hay ciertos profesionales de enfermería asignados a ellos. El tema general son las diferencias en las quejas de los pacientes sobre los medicamentos para controlar el dolor. El profesional de enfermería podría preguntar: ¿qué explica esta discrepancia? Esta pregunta amplia tal vez conduzca a otras preguntas, como: ¿de qué manera difieren los profesionales de enfermería? o ¿qué características comparten los pacientes con quejas? Entonces, el profesional de enfermería podría observar que el origen étnico de los pacientes y los profesionales de enfermería es relevante. Esto quizá conduzca a una búsqueda en la bibliografía de los comportamientos y el origen étnico de los profesionales de enfermería o puede dar lugar a una discusión con los compañeros. Es posible que tales esfuerzos deriven en varias preguntas de investigación, como las siguientes: ¿Cuál es la naturaleza de las quejas entre los pacientes de distintos orígenes étnicos? ¿El origen étnico del profesional de enfermería se relaciona con la 209 frecuencia con la que suministra medicamentos para el dolor? ¿El número de quejas de los pacientes aumenta cuando estos son de un origen étnico distinto a diferencia de cuando son del mismo origen étnico que los profesionales de enfermería? Estas preguntas surgen del mismo problema, pero se estudiarían de manera distinta; por ejemplo, algunas sugieren una estrategia cualitativa y otras, una cuantitativa. Tanto el origen étnico como los comportamientos de atención de enfermería son variables que pueden medirse de forma confiable. Un investigador cualitativo estaría más interesado en comprender la esencia de las quejas de los pacientes, la experiencia de frustración de los pacientes o el proceso por el cual se resolvió el problema. Estos aspectos del problema serían difíciles de medir. Los investigadores eligen un problema para estudiar con base en el interés inherente para ellos y en su adaptación al paradigma que prefieran. COMUNICACIÓN DE LOS PROBLEMAS Y PREGUNTAS DE INVESTIGACIÓN Todo estudio necesita un planteamiento del problema que explique cuál es la situación y qué es lo que debe resolverse. La mayoría de los investigadores presenta también un objetivo, preguntas de investigación o hipótesis, y por lo regular se incluyen combinaciones de estos tres elementos. Muchos estudiantes no comprenden con claridad el planteamiento del problema y pueden tener cierta dificultad para identificarlo en un artículo de investigación. El planteamiento del problema se presenta al inicio y suele comenzar con la primera oración después del resumen. Las preguntas de investigación, los objetivos o las hipótesis aparecen más adelante en la introducción. Planteamiento del problema Un buen planteamiento del problema es una declaración de lo que resulta problemático, qué es lo que “necesita corrección” o qué es lo que se comprende poco. Los planteamientos de problemas, sobre todo en los estudios cuantitativos, con frecuencia tienen la mayor parte de los siguientes seis componentes: 210 1. Identificación del problema: ¿qué ocurre con la situación actual? 2. Antecedentes: ¿cuál es la naturaleza del problema, o el contexto de la situación, qué es necesario que comprendan los lectores? 3. Alcance del problema: ¿qué tan grande es el problema y a cuántas personas afecta? 4. Consecuencias del problema: ¿cuál es el costo de no resolver el problema? 5. Lagunas en el conocimiento: ¿qué información falta acerca del problema? 6. Solución propuesta: ¿cómo contribuirá el nuevo estudio a la solución del problema? Supóngase que el tema fuera el humor como terapia complementaria para aliviar el estrés en pacientes hospitalizados con cáncer. Una pregunta de investigación (discutida más adelante en esta sección) podría ser: “¿cuál es el efecto del uso del humor por parte de los profesionales de enfermería en el estrés y en la actividad de los linfocitos citolíticos naturales en pacientes con cáncer hospitalizados? El recuadro 6-1 presenta un borrador general de un planteamiento del problema para tal estudio. Se trata de un bosquejo razonable, pero podría mejorarse. El recuadro 6-2 ilustra cómo puede fortalecerse el planteamiento del problema al agregar información del alcance (componente 3), las consecuencias de largo plazo (componente 4) y las posibles soluciones (componente 6). Este segundo borrador establece un argumento más decisivo para una nueva investigación: millones de personas padecen cáncer y la enfermedad tiene consecuencias adversas, no solo para los pacientes y sus familias, también para la sociedad. El planteamiento del problema revisado también sugiere una base para el nuevo estudio, ya que describe una posible solución sobre la cual podría construirse la nueva investigación. TIP CÓMO SABER ¿Cómo puede identificarse un planteamiento del problema? Este rara vez se señala de manera explícita. Con frecuencia, la primera oración de un reporte de investigación es el punto inicial del planteamiento del problema. Por lo general, se entrelaza con los hallazgos de la búsqueda bibliográfica. Los hallazgos anteriores proporcionan evidencia que apoya las afirmaciones en el planteamiento del problema y sugiere faltantes en el conocimiento. En muchos artículos es difícil separar el planteamiento del problema de la revisión 211 bibliográfica, a menos que haya una sección llamada específicamente “Revisión bibliográfica” o algo similar. Recuadro 6-1 Borrador del planteamiento del problema sobre el humor y el estrés Un diagnóstico de cáncer se relaciona con niveles altos de estrés. Cantidades considerables de pacientes con diagnóstico de cáncer describen sentimientos de incertidumbre, temor, enojo y pérdida de control. Las relaciones interpersonales, el funcionamiento psicológico y el desempeño de roles se alteran después del diagnóstico y el tratamiento del cáncer. Se han desarrollado diversas terapias alternativas/complementarias en un esfuerzo por disminuir los efectos nocivos del estrés relacionado con el cáncer en el funcionamiento psicológico y fisiológico, y los recursos dedicados a estas terapias (dinero y personal) han aumentado en años recientes. Sin embargo, muchas de estas terapias no se han evaluado con cuidado para conocer su eficacia, seguridad y rentabilidad. Por ejemplo, el uso del humor se ha recomendado como herramienta terapéutica para mejorar la calidad de vida, disminuir el estrés y quizá mejorar el funcionamiento inmunitario, pero la evidencia que justifique su defensa es escasa. Recuadro 6-2 Algunas posibles mejoras al planteamiento del problema sobre el humor y el estrés Cada año, más de un millón de personas recibe un diagnóstico de cáncer, que se mantiene como una de las principales causas de muerte en hombres y mujeres (citas de referencia)*. Numerosos estudios han documentado que un diagnóstico de cáncer se relaciona con niveles altos de estrés. Cantidades considerables de pacientes con diagnóstico de cáncer describen sentimientos de incertidumbre, temor, enojo y pérdida de control (referencias). Las relaciones interpersonales, el funcionamiento psicológico y el desempeño de roles se alteran después del diagnóstico y tratamiento del cáncer (referencias). Estos resultados del estrés pueden afectar la salud, el pronóstico de largo plazo y los costos médicos entre los sobrevivientes de 212 cáncer (referencias). Se han desarrollado diversas terapias alternativas/complementarias en un esfuerzo por disminuir los efectos nocivos del estrés relacionado con el cáncer en el funcionamiento psicológico y fisiológico, y los recursos dedicados a estas terapias (dinero y personal) han aumentado en años recientes (referencias). Sin embargo, muchas de estas terapias no se han evaluado con cuidado para conocer su eficacia, seguridad y rentabilidad. Por ejemplo, el uso del humor se ha recomendado como herramienta terapéutica para mejorar la calidad de vida, disminuir el estrés y quizá mejorar el funcionamiento inmunitario (referencias) , pero la evidencia que justifique su defensa es escasa. Sin embargo, los hallazgos preliminares de un estudio reciente de endocrinología en pequeña escala con una muestra saludable expuesta a una intervención humorística (referencia) parecen alentadores para realizar una investigación adicional en poblaciones inmunodeprimidas. *Deben insertarse las referencias para sustentar las afirmaciones. El planteamiento del problema para un estudio cualitativo también expresa la naturaleza del problema, su contexto, su alcance y la información necesaria para resolverlo. Los estudios cualitativos que pertenecen a una tradición de investigación por lo regular incorporan términos y conceptos que la anuncian en sus planteamientos del problema. Por ejemplo, el de un estudio fenomenológico podría señalar la necesidad de saber más sobre las experiencias de las personas o los significados que atribuyen a esas experiencias. Objetivo de investigación Muchos investigadores explican sus propósitos al plantear el objetivo de investigación, el cual establece la dirección general de la indagación y captura la sustancia del estudio. Por lo general es fácil identificarlo porque se señala la palabra explícita objetivo: “el objetivo de este estudio era...”, aunque a veces se usan en su lugar los términos finalidad, objeto o propósito, como en “la finalidad de este estudio era...”. En un estudio cuantitativo, el objetivo identifica las variables clave del estudio y sus posibles interrelaciones, así como la población de 213 interés (es decir, todos los elementos PICO). Ejemplo del objetivo de investigación de un estudio cuantitativo El objetivo de este estudio era examinar los efectos de brindar una intervención de educación-apoyo en su hogar a personas con insuficiencia cardiaca crónica, en términos de su estado funcional, autoeficacia, calidad de vida y capacidad para el autocuidado (Clark et al., 2015). Este objetivo de investigación identifica la población (P) de interés como los pacientes con insuficiencia cardiaca que viven en su casa. Las variables clave del estudio fueron la exposición o no exposición a la intervención especial (la variable independiente que abarca los componentes I y C) y el estado funcional del paciente, su autoeficacia, calidad de vida y capacidad para el autocuidado (las variables dependientes, u O). En los estudios cualitativos, el objetivo de investigación indica la naturaleza de la indagación; el concepto clave o fenómeno, y el grupo, comunidad o sitio en estudio. Ejemplo del objetivo de investigación de un estudio cualitativo El objetivo de este estudio era explorar la influencia de la religiosidad y la espiritualidad en la decisión de los padres de zonas rurales para vacunar a sus hijas de 9 a 13 años de edad contra el virus del papiloma humano (Thomas et al., 2015). Este objetivo indica que el grupo de estudio son los padres de zonas rurales con hijas de 9 a 13 años de edad y el fenómeno central es la toma de decisión acerca de las vacunaciones en el contexto de su espiritualidad o creencias religiosas. Los investigadores suelen dar información de su enfoque mediante su elección de verbos. Es probable que un estudio cuyo propósito es explorar o describir algún fenómeno sea una investigación de un tema poco estudiado, a menudo con un enfoque cualitativo como la fenomenología o etnografía. Un objetivo de investigación para un estudio cualitativo, en particular un estudio de teoría fundamentada, también podría usar verbos como comprender, descubrir o generar. 214 Los objetivos en los estudios cualitativos también pueden “codificar” la tradición de la indagación mediante términos o “expresiones de moda” relacionadas con dichas tradiciones, de esta manera: Teoría fundamentada: procesos, estructuras sociales, interacciones sociales. Estudios fenomenológicos: experiencia, experiencia vivida, significado, esencia. Estudios etnográficos: cultura, roles, estilos de vida, comportamiento cultural. Los investigadores cuantitativos también usan verbos para comunicar la naturaleza de la indagación. Por ejemplo, un objetivo que indica que el propósito del estudio es probar o evaluar algo (p. ej., una intervención) sugiere un diseño experimental. Es más probable que un estudio cuyo propósito es examinar o explorar la relación entre dos variables tenga un diseño no experimental. A veces el verbo es ambiguo: si un objetivo indica que la intención del investigador es comparar dos cosas, la comparación podría implicar tratamientos alternativos (con un diseño experimental) o dos grupos preexistentes, como fumadores y no fumadores (con un diseño no experimental). En cualquier caso, verbos como examinar, evaluar y comparar sugieren variables cuantificables y diseños con controles científicos. Los verbos en los objetivos deben indicar objetividad. Un objetivo de investigación que indique que el fin del estudio era probar, demostrar o mostrar algo sugiere un sesgo. Preguntas de investigación En algunos casos, las preguntas de investigación son una forma distinta de redactar los objetivos, presentadas como interrogantes y no como planteamiento, como se muestra en el siguiente ejemplo: Objetivo: el propósito de este estudio es valorar la relación entre el grado de dependencia funcional de los receptores de trasplante renal y su ritmo de recuperación. Pregunta: ¿tiene relación el nivel de dependencia funcional (I) de los receptores de trasplante renal (P) con su ritmo de recuperación (O)? Ciertos artículos de investigación omiten declarar de manera 215 expresa los objetivos y plantean solo las preguntas de investigación, pero en muchos casos los investigadores usan estas preguntas para aumentar la especificidad del objetivo general. Preguntas de investigación en los estudios cuantitativos En el capítulo 2 se discutieron las preguntas clínicas de primer plano que guían una indagación de práctica basada en evidencia. Las plantillas para preguntas de PBE de la tabla 2-1 (véase el capítulo 2) generan preguntas para guiar también un proyecto de investigación, pero los investigadores tienden a conceptualizar sus preguntas en términos de las variables. Considérese, por ejemplo, la primera pregunta de la tabla 2-1. “En (población), ¿cuál es el efecto de (intervención) en (resultado)?”. Es más probable que un investigador pensara la pregunta en estos términos: “en (población), ¿cuál es el efecto de (variable independiente) en (variable dependiente)?”. Pensar en términos de variables ayuda a guiar las decisiones de los investigadores acerca de cómo volverlas operativas. Por lo tanto, en los estudios cuantitativos, las preguntas de investigación identifican a la población (P) en estudio, las variables clave del estudio (componentes I, C y O) y las relaciones entre las variables. La mayoría de las preguntas de investigación se refiere a relaciones entre las variables, por lo que muchas preguntas de investigación cuantitativa pueden expresarse con una plantilla de pregunta general: “en (población), ¿cuál es la relación entre (variable independiente o VI) y (variable dependiente o VD)?”. Los ejemplos de las variaciones incluyen los siguientes: Terapia/tratamiento/intervención: en (población), ¿cuál es el efecto de (VI: intervención vs. una alternativa) en (VD)? Pronóstico: en (población), ¿(VI; enfermedad vs. su ausencia) afecta o aumenta el riesgo de (VD)? Etiología/daño: ¿en (población), (VI: exposición vs. ausencia de exposición) causa o aumenta el riesgo de (VD)? No todas las preguntas se refieren a relaciones, algunas son descriptivas. Como ejemplos se presentan dos preguntas descriptivas que podrían responderse en un estudio cuantitativo sobre el uso del humor por parte de los profesionales de enfermería: ¿Cuál es la frecuencia con la que los profesionales de enfermería utilizan el humor como terapia complementaria con pacientes con 216 cáncer hospitalizados? ¿Cuáles son las características de los profesionales de enfermería que usan el humor como terapia complementaria con pacientes con cáncer hospitalizados? Responder tales preguntas podría ser útil para desarrollar una terapia complementaria que aliviara el estrés en pacientes con cáncer. Ejemplo de una pregunta de investigación de un estudio cuantitativo Chang y sus colaboradores (2015) realizaron un estudio que responde la siguiente pregunta: entre los adultos de 65 años o más que viven en una residencia comunitaria, ¿el ejercicio regular tiene relación con los síntomas depresivos? En este ejemplo, la pregunta se refiere a la relación entre una variable independiente (práctica regular de ejercicio) y una variable dependiente (síntomas depresivos) en una población de adultos mayores que viven en una residencia comunitaria. Preguntas de investigación en estudios cualitativos Las preguntas de investigación en estudios cualitativos estipulan el fenómeno y la población de interés. Mientras que es probable que los investigadores por teoría fundamentada formulen preguntas del proceso, los fenomenólogos tienden a hacer preguntas acerca del significado y los etnógrafos casi siempre hacen preguntas descriptivas sobre las culturas. Quizá los términos relacionados con las distintas tradiciones, descritos antes en relación con los objetivos, se incorporen en las preguntas de investigación. Ejemplo de una pregunta de investigación de un estudio fenomenológico ¿Cuál es la importancia de la experiencia vivida por personas con enfermedad de Alzheimer al encontrarse con un perro de terapia? (Swall et al., 2015). No todos los estudios cualitativos están arraigados en una tradición de investigación específica. Muchos investigadores usan métodos constructivistas para describir o explorar fenómenos sin enfocarse en 217 las culturas, significados o procesos sociales. Ejemplo de una pregunta de investigación de un estudio cualitativo descriptivo En su estudio cualitativo descriptivo, Yeager y sus colaboradores (2016) preguntaron: “¿Qué hacen los adultos afroamericanos que padecen cáncer avanzado y perciben ingresos bajos para aliviar y tratar los síntomas a diario?”. En los estudios cualitativos, las preguntas de investigación en ocasiones evolucionan durante el estudio. Los investigadores comienzan con un enfoque que define límites amplios de la indagación, pero los límites no son inamovibles. Los constructivistas suelen ser lo bastante flexibles para modificar la pregunta cuando la información nueva indica que es relevante hacerlo. TIP Por lo general, los investigadores plantean su objetivo o sus preguntas de investigación al final de la introducción o justo después de la revisión bibliográfica. A veces, una sección separada de un artículo de investigación se dedica a planteamientos formales sobre el problema de investigación y podría titularse “Objetivo”, “Preguntas de investigación” o, en los estudios cuantitativos, “Hipótesis”. HIPÓTESIS DE INVESTIGACIÓN Una hipótesis de investigación es una predicción que casi siempre implica una relación prevista entre dos o más variables. Los investigadores cualitativos no tienen hipótesis formales porque desean que la indagación esté guiada por los puntos de vista de los participantes y no por sus propias sospechas. Por lo tanto, la siguiente explicación se enfoca en hipótesis en la investigación cuantitativa. Función de las hipótesis en la investigación cuantitativa Muchas preguntas de investigación se refieren a las relaciones entre las variables y las hipótesis son respuestas previstas a estas preguntas. Por ejemplo, la pregunta de investigación podría ser “¿El abuso 218 sexual en la infancia influye en el desarrollo de síndrome de intestino irritable en las mujeres?”. El investigador podría predecir lo siguiente: las mujeres (P) que fueron víctimas de abuso sexual en su infancia (I) tienen mayor incidencia de síndrome de intestino irritable (O) que aquellas que no padecieron tal abuso (C). Algunas ocasiones, las hipótesis emergen de una teoría. Los científicos razonan de teorías a hipótesis y ponen a prueba esas hipótesis en la vida real (véase el capítulo 8). Incluso en ausencia de una teoría, las hipótesis ofrecen dirección y sugieren explicaciones. Por ejemplo, supóngase que la hipótesis señala que la incidencia de pérdida de saturación en los lactantes con peso bajo al nacer que se someten a intubación y ventilación sería menor si se usa el sistema de succión traqueal cerrado (SSTC) que la succión endotraqueal con ventilación parcial (SETVP). La hipótesis podría basarse en estudios anteriores o en observaciones clínicas. Supóngase ahora que la hipótesis no se confirma en un estudio; es decir, se encuentra que las tasas de pérdida de la saturación son similares con los métodos SSTC y SETPV. La falta de apoyo de los datos a la predicción obliga a los investigadores a analizar de manera crítica la teoría o la investigación previa, a revisar las limitaciones del estudio y a explorar explicaciones alternativas para los hallazgos. El uso de hipótesis tiende a favorecer el pensamiento crítico. Supóngase esta vez que se realiza el estudio solo con la guía de la pregunta: ¿existe una relación entre el método de succión y las tasas de descenso en la saturación? Sin una hipótesis, el investigador parece preparado para aceptar cualquier resultado. El problema es que casi siempre es posible explicar algo superficialmente después de un hecho, sin importar cuáles sean los hallazgos. Las hipótesis reducen la posibilidad de que los resultados falsos sean malinterpretados. TIP Algunos artículos de investigación cuantitativa señalan de forma explícita las hipótesis que guiaron el estudio, pero muchos no. La ausencia de hipótesis podría indicar que los investigadores no hicieron una consideración crítica de la evidencia o la teoría existentes, o que obviaron exponer sus suposiciones. Características de hipótesis comprobables Las hipótesis de investigación suelen señalar la relación esperada 219 entre la variable independiente (la causa o influencia supuesta) y la variable dependiente (el resultado o efecto anticipado) en una población. Ejemplo de una hipótesis de investigación Forbes y sus colaboradores (2015) estudiaron la participación de los sobrevivientes de cáncer en la práctica de ejercicios de fuerza. Postularon la hipótesis de que los sobrevivientes de cáncer prostático tendrían una mayor tasa de participación en ejercicios de fuerza que los sobrevivientes de cáncer mamario o de colon. En este ejemplo, la población abarca a los sobrevivientes de cáncer. La VI es el tipo de cáncer y la variable de resultado es la participación en el ejercicio de fuerza. La hipótesis predice que, en la población, el tipo de cáncer se relaciona con las tasas de participación en ejercicios de fuerza. Las hipótesis que no hacen una declaración de relación son difíciles de probar. Considérese el siguiente ejemplo: no es probable que las mujeres embarazadas que reciben instrucción prenatal sobre las experiencias posteriores al parto experimenten depresión posparto. Esta declaración expresa la falta anticipada de relación y no puede probarse con los procedimientos estadísticos estándar. En este ejemplo, ¿cómo se decidiría si se acepta o rechaza la hipótesis? Sin embargo, podría modificarse la hipótesis de la siguiente manera: las mujeres embarazadas que reciben instrucción prenatal tienen menor probabilidad de experimentar depresión posparto que aquellas que no la reciben. En este caso, la variable de resultado (O) es la depresión posparto y la VI es la recepción (I) o no recepción (C) de instrucción prenatal. El aspecto relacional de la predicción se incluye en la frase menor que. Si la hipótesis carece de una frase como más que, menor que, diferente de, relacionado con, o alguna similar, no es comprobable. Para poner a prueba la hipótesis revisada, podría pedirse a dos grupos de mujeres con distintas experiencias de instrucción prenatal que respondieran preguntas sobre la depresión y luego se compararían las respuestas de los grupos. TIP Las hipótesis casi siempre son bastante fáciles de identificar porque los investigadores hacen declaraciones como: “el estudio probó la hipótesis de que...” o “se esperaba que...” 220 Redacción de las hipótesis Las hipótesis pueden redactarse de varias formas, como en el siguiente ejemplo: 1. Los pacientes de edad avanzada tienen mayor probabilidad de sufrir caídas que los más jóvenes. 2. Existe una relación entre la edad de un paciente y la probabilidad de sufrir caídas. 3. El riesgo de sufrir caídas aumenta con la edad del paciente. 4. Los pacientes de edad avanzada difieren de los más jóvenes con respecto a su riesgo de sufrir caídas. En cada ejemplo, la hipótesis señala la población (pacientes), la VI (edad), la variable de resultado (sufrir caídas) y la relación anticipada entre estas. Las hipótesis pueden ser direccionales o no direccionales. Una hipótesis direccional especifica la dirección esperada de la relación entre las variables. En las cuatro versiones de la hipótesis, las versiones 1 y 3 son direccionales porque predicen que los pacientes de edad avanzada tienen mayor probabilidad de sufrir caídas que los jóvenes. Una hipótesis no direccional no estipula la dirección de la relación (versiones 2 y 4). Estas versiones predicen que la edad de un paciente y las caídas se relacionan, pero no especifican si se anticipa que los pacientes de mayor edad o los más jóvenes tengan mayor riesgo. TIP Las hipótesis pueden ser hipótesis simples (con una sola variable independiente y una dependiente) o complejas (múltiples variables independientes y dependientes). La información sobre esta diferencia se encuentra en el suplemento en inglés de este capítulo en el sitio web . Otra distinción radica entre las hipótesis de investigación y la nula. Las hipótesis de investigación son declaraciones de las relaciones esperadas entre las variables. Todas las hipótesis presentadas hasta ahora son hipótesis de investigación que indican expectativas reales. La inferencia estadística opera en una lógica que puede ser confusa. Esta lógica requiere que las hipótesis se expresen como la ausencia esperada de una relación. La hipótesis nula declara que no 221 hay relación entre las variables independiente y dependiente. La forma nula de la hipótesis en el ejemplo precedente sería: “los pacientes de edad avanzada tienen la misma probabilidad de sufrir caídas que los más jóvenes”. La hipótesis nula puede compararse con la asunción de inocencia en muchos sistemas de justicia criminal: se asume que las variables son “inocentes” de una relación hasta que se demuestre que son “culpables” mediante pruebas estadísticas. Por lo general, los artículos de investigación señalan una hipótesis de investigación, no una nula. En las pruebas estadísticas se asumen hipótesis nulas subyacentes, sin declararlas. TIP Si un investigador usa pruebas estadísticas (lo que ocurre en la mayoría de los estudios cuantitativos), significa que existen hipótesis subyacentes, al margen de que el investigador las declare de manera explícita, ya que las pruebas estadísticas están diseñadas para probar hipótesis. Evaluación y prueba de la hipótesis Las hipótesis se evalúan de manera formal mediante análisis estadístico. Los investigadores usan estadísticas para examinar si sus hipótesis tienen una alta probabilidad de ser correctas (es decir, una probabilidad < 0.05). El análisis estadístico no ofrece prueba, solo apoya las inferencias de que una hipótesis sea probablemente correcta (o no). Las hipótesis no se comprueban o demuestran, sino que se verifican o rechazan. Las hipótesis se apoyan cada vez más con evidencia de múltiples estudios. Para ilustrar las razones de lo anterior, supóngase que se postula la hipótesis de que la talla y el peso están relacionados. Se predice que, en promedio, las personas altas pesan más que las personas de talla baja. Supóngase que por casualidad se reúne una muestra de personas de talla baja robustas y de personas altas delgadas. Los resultados indicarían que no existe relación entre la talla y el peso de una persona. Sin embargo, no habría justificación para concluir que el estudio comprobó o demostró que la talla y el peso no están relacionados. Este ejemplo ilustra la dificultad de usar observaciones de una muestra para generalizarlas a una población. Otros aspectos como la exactitud de las mediciones y los efectos de las variables no controladas impiden que los investigadores concluyan que las 222 hipótesis están demostradas. ANÁLISIS CRÍTICO DE LOS PROBLEMAS DE INVESTIGACIÓN, LAS PREGUNTAS DE INVESTIGACIÓN Y LAS HIPÓTESIS En una crítica integral de un artículo de investigación, se tendría que evaluar si los investigadores comunicaron de manera adecuada su problema de investigación. El planteamiento del problema, el objetivo de investigación, las preguntas de investigación y las hipótesis establecen las bases para describir qué se hizo y qué se aprendió. No debe ser necesario explorar a profundidad para conocer el problema de investigación o descubrir las preguntas. Una crítica al problema de investigación tiene muchas dimensiones. En particular, es necesario considerar si el problema tiene relevancia para la enfermería. Los estudios que se construyen sobre la evidencia existente pueden hacer contribuciones significativas a la PBE. Además, los problemas de investigación derivados de prioridades de investigación (véase el capítulo 1) tienen una alta probabilidad de generar evidencia importante para los profesionales de enfermería. Otra dimensión de la crítica al problema de investigación se refiere a los aspectos metodológicos, en particular si dicho problema es compatible con el paradigma de investigación elegido y sus métodos relacionados. También debe evaluarse si el objetivo o las preguntas de investigación se prestan a esta. Recuadro 6-3 Lineamientos para el análisis crítico de problemas de investigación, preguntas de investigación e hipótesis 1. ¿Cuál es el problema de investigación? ¿El planteamiento del problema fue fácil de localizar y se indicó con claridad? ¿El planteamiento del problema construyó un argumento convincente y persuasivo para el nuevo estudio? 2. ¿El problema tiene relevancia para la enfermería? 3. ¿Hubo una concordancia adecuada entre el problema de investigación y el paradigma (y tradición) en que se condujo la investigación? 223 4. ¿El reporte presentó de manera formal un objetivo, una pregunta de investigación o hipótesis? ¿Se transmitió esta comunicación de forma clara y concisa y se situó en una ubicación lógica y útil? 5. ¿Los objetivos o preguntas de investigación se redactaron de modo adecuado (por ejemplo, se identificaron los conceptos/variables clave y se especificó la población)? 6. Si no había hipótesis formales, ¿estaba justificada su ausencia? ¿Se usaron pruebas estadísticas para analizar los datos a pesar de la ausencia de hipótesis declaradas? 7. ¿Se redactaron de forma apropiada las hipótesis (si las había), señalaron una relación anticipada entre dos o más variables? ¿Se presentaron como hipótesis de investigación o como hipótesis nulas? Si un artículo de investigación que describe un estudio cuantitativo no señala las hipótesis, debe considerarse si tal ausencia está justificada. Si existen hipótesis, debe evaluarse si son sensibles y consistentes con la evidencia existente o la teoría relevante. Además, las hipótesis son guías válidas en la indagación científica solo si son verificables. Para serlo, las hipótesis deben predecir una relación entre dos o más variables mensurables. Los lineamientos específicos para la crítica de los problemas de investigación, las preguntas de investigación y las hipótesis se presentan en el recuadro 6-3. EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO Esta sección describe cómo se comunican el problema de investigación y las preguntas de investigación en dos estudios de enfermería, uno cuantitativo y otro cualitativo. Lea los resúmenes y luego responda las preguntas de pensamiento crítico que les siguen; de ser necesario, consulte el reporte de investigación completo. Los ejemplos 1 y 2 se presentan en la sección Critical Thinking Activity del sitio web . Las preguntas de pensamiento crítico para los ejemplos 3 y 4 se basan en los estudios que aparecen en los apéndices A y B de este libro. Los comentarios en inglés de las 224 autoras sobre estos ejercicios están en la sección Student Resources en. EJEMPLO 1: INVESTIGACIÓN CUANTITATIVA Estudio. Relación de la testosterona y el cortisol salivales maternos e infantiles y el género del lactante con la interacción materno-infantil en lactantes de peso muy bajo al nacer (Cho et al., 2015). Planteamiento del problema (extracto). “La salud relacionada con la prematuridad y los problemas del desarrollo son más frecuentes en lactantes masculinos con peso muy bajo al nacer (PMBN, menor de 1 500 g) que en los femeninos… Además, los lactantes masculinos con PMBN tienen menos interacciones materno-infantiles positivas que los lactantes femeninos. Estas relaciones generan preguntas destacadas sobre la posibilidad de que la vulnerabilidad de los lactantes masculinos con PMBN a las interacciones materno-infantiles subóptimas se deban a factores más allá de la socialización de género… Con base en la relación de la testosterona elevada en los lactantes… con resultados cognitivos y conductuales negativos y del valor alto o bajo de cortisol con la salud y desarrollo infantiles, ambas hormonas podrían afectar las interacciones materno-infantiles” (pp. 357-359) (se omitieron las citas para simplificar la presentación). Objetivo. “El objetivo de este… estudio era examinar las posibles relaciones entre los valores de estas hormonas esteroideas y las interacciones entre la madre y el lactante con PMBN, así como su importancia potencial para las diferencias genéricas” (p. 359). Preguntas de investigación. Una de las preguntas de investigación para este estudio fue: “¿Los valores elevados de testosterona y cortisol salivales tienen una relación negativa con la calidad de las interacciones entre la madre y el lactante con PMBN a los 3 y los 6 meses?” (p. 359). Hipótesis. “Se postuló la hipótesis de que los valores de testosterona y cortisol en lactantes con PMBN tendría una relación negativa con las interacciones materno-infantiles, sobre todo entre los lactantes masculinos” (p. 359). Métodos de estudio. Los participantes en el estudio fueron 62 pares de madre-lactante con PMBN captados en una unidad de cuidados intensivos neonatales de nivel IV. Los datos se recolectaron mediante la revisión del expediente infantil, entrevistas con las madres, pruebas bioquímicas de las madres y los lactantes, y observación de las interacciones maternoinfantiles a las 40 semanas de edad posmenstrual, y a los 3 y 6 meses de 225 edad corregida. Hallazgos clave. Los valores más altos de testosterona materna y cortisol infantil se relacionaron con comportamientos interactivos maternos más positivos y frecuentes. Las madres interactuaron con sus lactantes con mayor frecuencia cuando estos tenían valores más bajos de testosterona. Ejercicios de pensamiento crítico 1. Responda las siguientes preguntas relevantes del recuadro 6-3 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿En qué parte del reporte de investigación cree que los investigadores presentaron las hipótesis? ¿En qué parte del reporte deben incluirse los resultados de las pruebas de la hipótesis? b. ¿La hipótesis declarada era direccional o no direccional? c. ¿La hipótesis de los investigadores se respaldó en el análisis estadístico? 3. Si los resultados del estudio son válidos y generalizables, ¿cuáles son algunos de los usos que podrían darse a los hallazgos en la práctica clínica? EJEMPLO 2: INVESTIGACIÓN CUALITATIVA Estudio. Sobrevivientes adolescentes y adultos jóvenes de tumores cerebrales en la infancia: la vida después del tratamiento en sus propias palabras (Hobbie et al., 2016). Planteamiento del problema (extracto). “Aunque las tasas de supervivencia a 5 años para niños con diagnóstico de tumores cerebrales han mejorado hasta 75%, los sobrevivientes refieren efectos tardíos que pueden ser agudos o de largo plazo, episódicos o progresivos… Hay faltantes en la evidencia respecto a las perspectivas de los adolescentes y adultos jóvenes sobre su calidad de vida relacionada con la salud… A la fecha existen unos cuantos estudios que examinan las perspectivas de los adolescentes y adultos jóvenes sobrevivientes de tumores cerebrales de la infancia en términos de su percepción de sí mismos y su papel en sus familias” (p. 135) (las citas se omitieron para simplificar la presentación). Objetivo. “El objetivo de este estudio era describir cómo los sobrevivientes adolescentes y adultos jóvenes de tumores cerebrales en la infancia describen su calidad de vida relacionada con la salud; es decir, su funcionamiento físico, emocional y social” (p. 134). Pregunta de investigación. “Se preguntó específicamente: ¿cómo 226 describen su calidad de vida relacionada con la salud (funcionamiento físico, emocional y social) los adolescentes y adultos jóvenes sobrevivientes de tumores cerebrales en la infancia?” (p. 135). Método. Los investigadores incluyeron una muestra de 41 adolescentes y adultos jóvenes sobrevivientes de un tumor cerebral en la infancia que vivían con sus familias. Se realizaron entrevistas a profundidad en una habitación privada en las casas de los participantes en el estudio. Se les hicieron varias preguntas conversacionales, como “cuéntame sobre ti mismo” y “¿qué partes de tu vida son más difíciles?”. Hallazgos clave. Los investigadores encontraron que los sobrevivientes se esfuerzan por mantener la normalidad en vista del cambio funcional debido al tumor y a los efectos tardíos del tratamiento. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 6-3 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿En qué parte del reporte de investigación cree que los investigadores presentaron el objetivo y las preguntas de investigación? b. ¿Parece que este estudio se realizó dentro de una de las tres principales tradiciones cualitativas? De ser así, ¿en cuál? 3. Si los resultados de este estudio son confiables, ¿cuáles son algunos de los usos en los que podrían aplicarse los hallazgos en la práctica clínica? EJEMPLO 3: INVESTIGACIÓN CUANTITATIVA EN EL APÉNDICE A • Leer el resumen y la introducción del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 6-3 para este estudio. 2. Responda también la siguiente pregunta: ¿cuál podría ser una hipótesis para este estudio? Redáctela como una hipótesis de investigación y como una hipótesis nula. 227 EJEMPLO 4: INVESTIGACIÓN CUALITATIVA EN EL APÉNDICE B • Lea el resumen y la introducción del estudio de Beck y Watson (2010) (“Parto posterior a un parto traumático”) en el apéndice B de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 6-3 para este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿Cree usted que Beck y Watson presentaron una justificación suficiente sobre la relevancia de su problema de investigación? b. En su justificación del estudio, ¿Beck y Watson dicen algo acerca del cuarto elemento de un argumento identificado en el libro: las consecuencias del problema? ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Simple and Complex Hypotheses. Respuestas a los ejercicios de pensamiento crítico para los ejemplos 3 y 4. Recursos en Internet con sitios web útiles para el capítulo 6. Un artículo de investigación de una revista de Wolters Kluwer, el estudio de Hobbie y colaboradores descrito como ejemplo 2 en las pp. 103 y 104. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. 228 Un problema de investigación es una situación desconcertante o problemática que un investigador desea resolver mediante una indagación disciplinada. Por lo general, los investigadores identifican un tema amplio, reducen el alcance del problema y luego identifican preguntas específicas consistentes con un paradigma de elección. Los investigadores comunican sus objetivos en artículos de investigación como planteamiento del problema, preguntas de investigación o hipótesis. El planteamiento del problema explica la naturaleza, el contexto y la relevancia de un problema a estudiar. Casi siempre incluyen varios componentes: identificación del problema; antecedentes, alcances y consecuencias del problema; faltantes en el conocimiento, y posibles soluciones. El objetivo de investigación resume el objetivo general del estudio, identifica los conceptos (variables) clave y el grupo de estudio o población. Los objetivos suelen comunicar, mediante la elección de verbos y otras palabras clave, aspectos del diseño del estudio o la tradición de investigación. Las preguntas de investigación son las interrogantes específicas que los investigadores quieren responder para resolver el problema de investigación. Una hipótesis señala las relaciones previstas entre dos o más variables; es decir, la relación anticipada entre las variables independiente y dependiente. Las hipótesis direccionales predicen la dirección de una relación; las hipótesis no direccionales predicen la existencia de las relaciones, no su dirección. Las hipótesis de investigación predicen la existencia de relaciones; las hipótesis nulas, que expresan la ausencia de una relación, son las que se someten a pruebas estadísticas. Las hipótesis no se comprueban o demuestran, sino que se verifican o rechazan, se apoyan o no se sustentan con los datos. R E F E R E N C I A S PA R A E L C A P Í T U L O 1 229 Chang, S., Chien, N., & Chen, M. (2015). Regular exercise and depressive symptoms in community-dwelling elders in northern Taiwan. Journal of Nursing Research. Publicación anticipada en línea. Cho, J., Su, X., Phillips, V., & Holditch-Davis, D. (2015). Association of maternal and infant salivary testosterone and cortisol and infant gender with mother–infant interaction in very-low-birthweight infants. Research in Nursing & Health, 38, 357–368. *Clark, A., McDougall, G., Riegel, B., Joiner-Rogers, G., Innerarity, S., Meraviglia, M., ... Davila, A. (2015). Health status and self-care outcomes after an education-support intervention for people with chronic heart failure. Journal of Cardiovascular Nursing, 30, S3–S13. *Forbes, C., Blanchard, C., Mummery, W., & Courneya, K. (2015). Prevalence and correlates of strength exercise among breast, prostate, and colorectal cancer survivors. Oncology Nursing Forum, 42, 118–127. **Hobbie, W., Ogle, S., Reilly, M., Barakat, L., Lucas, M., Ginsberg, J., ... Deatrick, J. (2016). Adolescent and young adult survivors of childhood brain tumors: Life after treatment in their own words. Cancer Nursing, 39, 134–143. Judge, M., Beck, C. T., Durham, H., McKelvey, M., & Lammi-Keefe, C. (2014). Pilot trial evaluating maternal docosahexaenoic acid consumption during pregnancy: Decreased postpartum depressive symptomatology. International Journal of Nursing Sciences, 1, 339–345. *Swall, A., Ebbeskog, B., Lundh Hagelin, C., & Fagerberg, I. (2015). Can therapy dogs evoke awareness of one’s past and present life in persons with Alzheimer’s disease? International Journal of Older People Nursing, 10, 84–93. *Thomas, T., Blumling, A., & Delaney, A. (2015). The influence of religiosity and spirituality on rural parents’ health decision-making and human papillomavirus vaccine choices. Advances in Nursing Science, 38, E1–E12. Yeager, K., Sterk, C., Quest, T., Dilorio, C., Vena, C., & Bauer-Wu, S. (2016). Managing one’s symptoms: A qualitative study of low-income African Americans with advanced cancer. Cancer Nursing, 39(4), 303– 312. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 230 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Comprender los pasos que implica una revisión bibliográfica. Identificar las ayudas bibliográficas para recuperar reportes de investigación de enfermería y localizar referencias para un tema de investigación. Comprender el proceso de selección, resumen, crítica y organización de la evidencia bibliográfica. Evaluar el estilo, el contenido y la organización de una revisión bibliográfica. Definir los nuevos términos del capítulo. Términos clave Base de datos bibliográfica CINAHL Fuente primaria Fuente secundaria Google Académico MEDLINE MeSH Palabra clave PubMed Revisión bibliográfica Una revisión bibliográfica es un resumen escrito del estado de la evidencia sobre un problema de investigación. Es útil para que los consumidores de investigación de enfermería adquieran las habilidades de leer, criticar y preparar resúmenes escritos de la 231 evidencia. ASPECTOS BÁSICOS DE LAS REVISIONES BIBLIOGRÁFICAS Antes de discutir las actividades implicadas en una revisión bibliográfica basada en la investigación, se explican brevemente algunos aspectos generales. El primero se refiere a los objetivos al realizar una revisión bibliográfica. Propósitos de las revisiones bibliográficas de investigación El propósito principal de las revisiones bibliográficas es resumir la evidencia sobre un tema, lo que se sabe y lo que no se sabe. En ocasiones, las revisiones bibliográficas son reportes independientes que pretenden comunicar el estado de la evidencia a otros, pero las revisiones también se usan para establecer las bases de nuevos estudios y ayudar a los investigadores a interpretar sus hallazgos. En la investigación cualitativa, las opiniones acerca de las revisiones bibliográficas varían. Los investigadores de teoría fundamentada casi siempre comienzan a recolectar datos antes de examinar la bibliografía. Conforme se esboza una teoría, los investigadores recurren a la bibliografía y buscan los hallazgos previos relacionados con esta. Los fenomenólogos y los etnógrafos por lo regular realizan una búsqueda bibliográfica al inicio de un estudio. Al margen de cuándo realicen la revisión, los investigadores casi siempre incluyen un resumen breve de la bibliografía relevante en sus introducciones. La revisión bibliográfica resume la evidencia actual de un tema y aclara la relevancia del nuevo estudio. Las revisiones bibliográficas suelen estar entrelazadas con el planteamiento del problema como parte del argumento para el estudio. Tipos de información por buscar en una revisión bibliográfica Los hallazgos de estudios anteriores son los “datos” para una revisión bibliográfica. Si se prepara una revisión bibliográfica, debe confiarse 232 sobre todo en fuentes primarias, que son las descripciones de estudios escritas por los investigadores que las realizaron. Los documentos de investigación en fuentes secundarias son descripciones de estudios preparados por alguien más. Las revisiones bibliográficas son fuentes secundarias. Las revisiones recientes son un buen sitio para comenzar porque ofrecen revisiones y bibliografía valiosas. Sin embargo, si usted lleva a cabo su propia revisión bibliográfica, las fuentes secundarias no deben considerarse sustitutos de las fuentes primarias, ya que no tienen los detalles suficientes y es posible que no sean del todo objetivas. TIP Para un proyecto de práctica basada en evidencia (PBE), una revisión sistemática reciente y de alta calidad puede ser suficiente para obtener la información necesaria acerca de la base de la evidencia, aunque casi siempre es buena idea buscar estudios publicados después de la revisión. Se incluye una guía más explícita de la búsqueda de evidencia para una indagación de PBE en el suplemento en inglés del capítulo en el sitio . Una revisión bibliográfica puede aportar referencias que no son de investigación, como artículos de opinión, informes de casos y anécdotas clínicas. Tales materiales pueden ampliar la comprensión de un problema o demostrar la necesidad de investigarlo. Sin embargo, es posible que estos documentos tengan utilidad limitada en las revisiones de investigación porque no responden la pregunta central: ¿cuál es el estado actual de la evidencia sobre este problema de investigación? Principales pasos y estrategias para hacer una revisión bibliográfica Efectuar una revisión bibliográfica se parece un poco a la realización de un estudio: un revisor comienza con una pregunta y luego debe reunir, analizar e interpretar la información. La figura 7-1 presenta el proceso de revisión bibliográfica y muestra que hay posibles ciclos de realimentación, con oportunidades de regresar a pasos anteriores en busca de más información. Las revisiones deben ser imparciales, minuciosas y actualizadas. Además, las revisiones de alta calidad son sistemáticas. Las reglas 233 para decidir la inclusión de un estudio tienen que ser explícitas porque una buena revisión ha de ser reproducible. Esto significa que otro revisor diligente debería poder aplicar las mismas reglas de decisión y llegar a conclusiones similares sobre el estado de la evidencia del tema. Figura 7-1. Diagrama de flujo de las tareas en una revisión bibliográfica. TIP La localización de toda la información relevante sobre una pregunta de investigación se parece al trabajo de un detective. Las herramientas para recuperar bibliografía que se describen en este capítulo son útiles, pero es inevitable tener que buscar y filtrar los indicios de evidencia de un tema. ¡Prepárese para hacer de detective! En cierta forma, una revisión bibliográfica es similar a emprender un estudio cualitativo. Es útil mantener un enfoque flexible para la “colecta de datos” y pensar de manera creativa en las oportunidades de encontrar nuevas fuentes de información. LOCALIZACIÓN DE BIBLIOGRAFÍA RELEVANTE PARA UNA REVISIÓN BIBLIOGRÁFICA Un paso temprano en una revisión bibliográfica es diseñar una estrategia para localizar estudios relevantes. La capacidad para ubicar evidencia sobre un tema es una habilidad importante que requiere adaptabilidad: los rápidos cambios tecnológicos hacen que todo el tiempo se introduzcan nuevos métodos para buscar bibliografía. Lo instamos a consultar con los bibliotecarios y profesores de su institución para obtener sugerencias 234 actualizadas. Desarrollo de una estrategia de búsqueda Es importante tener buenas habilidades para la búsqueda. Un enfoque muy productivo es buscar evidencia en las bases de datos bibliográficas, que se describen en seguida. Los revisores usan la estrategia de dar seguimiento a las notas al pie, de modo que usan las citas de estudios relevantes para rastrear la investigación previa en la que se basaron los estudios. Otra estrategia es encontrar un estudio fundamental inicial y avanzar en el tiempo para encontrar estudios más recientes que citaron el estudio clave. TIP Usted podría sentirse tentado a comenzar una búsqueda bibliográfica mediante un buscador en Internet, como Yahoo, Google o Bing. Es probable que este tipo de búsqueda arroje muchos “resultados” sobre el tema, pero es improbable que le proporcione toda la información sobre bibliografía de investigación acerca del tema. También deben tomarse decisiones con respecto al límite de la búsqueda. Por ejemplo, los revisores pueden restringir la búsqueda a reportes escritos en un idioma. También podrían decidir limitar la búsqueda a estudios realizados dentro de cierto marco temporal (p. ej., los últimos 10 años). Búsqueda en bases de datos bibliográficas El ingreso a las bases de datos bibliográficas se hace por computadora. El acceso a la mayoría de las bases de datos se realiza mediante software fácil de usar con sistemas dirigidos por un menú y apoyo en pantalla para que sea posible recuperar artículos dando instrucciones mínimas. Es probable que su biblioteca universitaria u hospitalaria esté suscrita a estos servicios. Inicio de una búsqueda electrónica Antes de buscar una base de datos bibliográfica por medios electrónicos, debe familiarizarse con las características del software que usa para tener acceso a esta. El software tiene opciones para limitar o ampliar la búsqueda, para combinar dos búsquedas, guardar la búsqueda, etcétera. La mayoría de los programas tiene tutoriales y casi todos tienen botones de 235 Ayuda (Help). Una primera tarea en una búsqueda electrónica es determinar las palabras clave (aunque también es posible hacer una búsqueda por autor para identificar investigadores prominentes en un campo). Una palabra clave es un término o frase que captura los conceptos centrales de la pregunta. Para los estudios cuantitativos, las palabras clave casi siempre son las variables independientes y dependientes (es decir, por lo menos, los componentes “I” y “O” [intervención y outcome o resultado] del marco PICO) y quizá la población. Para los estudios cualitativos, las palabras clave son el fenómeno central y la población. Si se usan las plantillas de preguntas para formular las preguntas clínicas que se encuentran en la tabla 2-1 (véase el capítulo 2) es probable que las palabras que se colocan en los espacios en blanco sean buenos términos clave. TIP Si quiere identificar todos los reportes de investigación de un tema, es necesario ser flexible y pensar en términos amplios en relación con las palabras clave. Por ejemplo, si está interesado en anorexia, podría buscar anorexia, trastornos de la alimentación y pérdida de peso, y quizás apetito, comportamiento alimentario, hábitos alimentarios, bulimia y cambios en el peso corporal. Existen varias estrategias para realizar una búsqueda bibliográfica. Todas las citas en una base de datos tienen que estar codificadas para ser recuperables, y las bases de datos y los programas usan su propio sistema o entradas de clasificación. Los sistemas de indexación tienen encabezados de tema específicos (códigos de tema). Puede realizarse una búsqueda de tema si se ingresa un encabezado de tema en el campo de búsqueda. No hay que preocuparse por conocer los códigos de tema porque la mayoría de los programas tiene capacidades de mapeo. El mapeo es una característica que permite buscar temas utilizando las propias palabras clave en lugar del encabezado de tema exacto usado en la base de datos. El software traduce (“mapea”) sus palabras clave en el encabezado de tema más factible y luego recupera los registros de citas que están codificados con ese encabezado de tema. Cuando se introduce una palabra clave en el campo de búsqueda, es posible que el programa inicie una búsqueda de tema y una búsqueda de palabra en el texto. Una búsqueda de palabra en el texto explora para encontrar la palabra clave en los campos de texto de los registros; es decir, en el título y el resumen. Por lo tanto, si se buscó cáncer pulmonar en la base de datos MEDLINE (que se describe más adelante), la búsqueda 236 producirá citas codificadas con el código del tema de neoplasias pulmonares (el encabezado de tema en MEDLINE que se emplea para codificar entradas) y también cualquier entrada en la que aparezcan las palabras cáncer pulmonar, incluso si no está codificada con el encabezado de tema neoplasia pulmonar. Algunas características de una búsqueda bibliográfica son similares en todas las bases de datos. Una característica es que por lo general se usan operadores booleanos para ampliar o delimitar la búsqueda. Tres operadores booleanos de uso muy frecuente son Y, O y NO (AND, OR y NOT en inglés, todas en mayúsculas). El operador Y delimita una búsqueda. Si se busca dolor Y niños, el software recuperará solo registros que tengan ambos términos. El operador O amplía la búsqueda: dolor O niños podría usarse en una indagación para recuperar registros con cualquiera de esos términos. Por último, NO estrecha una búsqueda: dolor NO niños recuperaría todos los registros con dolor que no incluyeran el término niños. Los símbolos de comodín y truncamiento son otras herramientas útiles. Un símbolo de truncamiento (por lo regular un asterisco, *) amplía un término de búsqueda para incluir todas las formas de una raíz. Por ejemplo, una búsqueda de infan* instruiría a la computadora para buscar cualquier palabra que empiece con “infan”, como infancia, infante o infantil. En algunas bases de datos, los símbolos comodín (a menudo ? o *) insertados a la mitad de un término de búsqueda permiten indagar sobre ortografías distintas. Por ejemplo, una búsqueda de qu* produciría registros con que o qué. En cada base de datos es importante aprender cuáles son estos símbolos especiales y cómo funcionan. Nótese que aunque el uso de símbolos especiales es útil, puede desactivar una característica de mapeo del software. Una manera de forzar la búsqueda de palabra en el texto es usar comillas en los extremos de una frase, lo que genera citas en las que aparece la frase exacta en los campos de texto. En otras palabras, cáncer pulmonar y “cáncer pulmonar” podrían generar distintos resultados. Una estrategia de búsqueda minuciosa podría implicar la indagación con y sin caracteres comodín, y con y sin comillas. Dos bases electrónicas muy útiles para los profesionales de enfermería son CINAHL (Cumulative Index to Nursing and Allied Health Literature) y MEDLINE (Medical Literature On-Line), que se describen en las siguientes secciones. También se incluye una descripción breve de Google Académico. Otras bases de datos bibliográficas útiles para profesionales de enfermería incluyen Cochrane Database of Systematic Reviews (CDSR), 237 Web of Knowledge, Scopus y EMBASE (la base de datos de Excerpta Medica). La base de datos Web of Knowledge es útil para una estrategia de búsqueda de estudios recientes, por sus grandes índices de citas. TIP Si su objetivo es realizar una búsqueda sistemática, necesitará establecer un plan formal explícito sobre la estrategia de búsqueda y las palabras clave, como se explica con detalle en el capítulo 18. La base de datos CINAHL CINAHL es una importante base de datos electrónica para profesionales de enfermería. Incluye referencias de cientos de revistas de enfermería y salud, así como libros y disertaciones. Contiene cerca de tres millones de registros. CINAHL proporciona información para localizar referencias (es decir, autor, título, revista, año de publicación, volumen y números de página) y resúmenes de la mayoría de las citas. Por lo regular se proporcionan los enlaces a los artículos reales. Se ilustran aquí las características de CINAHL, pero nótese que algunas podrían ser distintas en su institución y que se introducen cambios de manera periódica. Una “búsqueda básica” en CINAHL implica el ingreso de palabras clave en el campo de búsqueda (hay más opciones para ampliar y limitar la búsqueda en el modo “Advanced Search” [“Búsqueda Avanzada”]). Puede limitarse la búsqueda a registros con ciertas características (p. ej., solo los que tengan resumen), a fechas específicas de publicación (p. ej., las posteriores a 2010), a las publicadas en idioma inglés o a las codificadas en un cierto subgrupo (p. ej., enfermería). La pantalla de búsqueda básica también permite ampliar la búsqueda si se activa la opción “Apply related words” (“Aplicar palabras relacionadas”). Para ilustrar con un ejemplo concreto, suponga que está interesado en la investigación del efecto de la música en la agitación en personas con demencia. Se ingresan los términos mostrados en la imagen [música Y agitación* Y (demencia O Alzheimer)] en el campo de búsqueda y se aplica un límite a la investigación: solo registros con resumen: 238 Al activar el botón Search (búsqueda), se obtienen docenas de “resultados” (citas). Nótese que se utilizaron dos operadores booleanos. El uso de “AND” (y) asegura que los registros recuperados incluyan las tres palabras clave y el de “OR” (o) permite que la tercera palabra clave sea “dementia” (demencia) o “Alzheimer”. Además, se empleó un símbolo de truncamiento * en la segunda palabra clave. Esto instruye a la computadora para buscar cualquier palabra que comience con “agitat”, como agitated (agitado) o agitation (agitación). Al activar el botón de búsqueda, todas las referencias identificadas se presentan en el monitor y puede verse e imprimirse la información completa de los que parecen prometedores. La figura 7-2 en la siguiente página presenta el ejemplo de una entrada de registro completa en CINAHL para un reporte identificado con esta búsqueda (publicado en inglés). Se presentan el título del artículo y la información del autor, seguida por la información de la fuente. La fuente indica lo siguiente: Nombre de la revista (Geriatric Nursing) Año y mes de publicación (enero/febrero de 2016) Volumen (37) Número (1) Número de páginas (25-29) 239 Figura 7-2. Ejemplo de una impresión de una búsqueda en CINAHL (Cumulative Index to Nursing and Allied Health Literature). La figura 7-2 también muestra los encabezados de tema mayor y menor de CINAHL que se codificaron para este estudio particular. Cualquiera de estos encabezados pudo haberse usado en una búsqueda de encabezado de tema para recuperar esta referencia. Nótese que los encabezados de tema incluyen encabezados sustantivos, como Agitation-Therapy-In Old Age (Agitación-Tratamiento- En la vejez), así como encabezados de características metodológicas y de muestra (p. ej., Aged, Inpatients [de Edad avanzada, Pacientes internados]). Los términos del tema tienen hipervínculos para poder ampliar la búsqueda al activarlos (también puede “darse clic” en el nombre del autor o de la revista). Luego se presenta el resumen del artículo, con los términos de búsqueda en negritas. A continuación se presentan los nombres de cualquier instrumento formal usado en el estudio, en “Instrumentation” (“Instrumentación”). Con base en el resumen, se decide si esta referencia es pertinente para la indagación. 240 Nótese que también hay un enlace en la barra lateral de cada registro llamado Times Citated in this Database (Número de veces citado en esta base de datos). La base de datos MEDLINE La base de datos MEDLINE, desarrollada por la U.S. National Library of Medicine, es la fuente primordial de cobertura de la bibliografía biomédica. MEDLINE cubre casi 5 600 revistas médicas, de enfermería y salud, y tiene más de 24 millones de registros. Puede ingresarse a MEDLINE sin costo en Internet, en el sitio de PubMed. El sitio web PubMed es un recurso de por vida, al margen del acceso de su institución a las bases de datos bibliográficas. MEDLINE usa un vocabulario controlado llamado MeSH (Medical Subject Headings, Encabezados de Temas Médicos) para indexar los artículos. La terminología MeSH proporciona una forma consistente de recuperar información que puede usar distinta terminología para los mismos conceptos. Una vez que se comenzó una búsqueda, un campo en el lado derecho de la pantalla llamado “Search Details” (Detalles de búsqueda) permite ver cómo las palabras clave que se ingresan se derivan a términos MeSH, lo que podría conducirlo a seguir otras pistas. Las búsquedas pueden hacerse en español en BabelMeSH. Cuando se realizó una búsqueda en PubMed de MEDLINE análoga a la que se describió antes para CINAHL, con las mismas palabras clave y restricciones, se recuperaron 90 registros. La lista de registros de las búsquedas en PubMed y CINAHL mostró superposiciones sustanciales, pero en ambas se encontraron referencias nuevas. Sin embargo, las dos búsquedas recuperaron el estudio de Davidson, el registro de CINAHL que se muestra en la figura 7-2. El registro de PubMed para la misma referencia se presenta en la figura 7-3 (en inglés). Como puede verse, los términos MeSH en la figura 7-3 son distintos a los encabezados de tema en CINAHL en la figura 7-2. TIP Después de encontrar un estudio que es un buen ejemplo de lo que se busca, pueden buscarse otros estudios similares en la base de datos. En PubMed, luego de identificar un estudio clave, puede pulsar “Similar articles” (“Artículos similares”) a la derecha de la pantalla para localizar estudios parecidos. En CINAHL, puede pulsar “Find Similar Results” (“Encontrar resultados similares”). 241 Figura 7-3. Ejemplo de una impresión de una búsqueda en PubMed (términos MeSH preliminares). Google Académico Google Académico (GA) es un buscador bibliográfico popular que se lanzó en 2004. GA incluye artículos en revistas de editores académicos en todas las disciplinas y también libros, reportes técnicos y otros documentos (en Google Académico puede realizarse la búsqueda de artículos en inglés). Una ventaja de GA es que es accesible sin costo en Internet. Como otros buscadores bibliográficos, GA permite a los usuarios buscar por tema, por título y por autor, y emplea operadores booleanos y otras convenciones de búsqueda. Además, como PubMed y CINAHL, GA tiene una característica de Citado por para una búsqueda por descendencia y una característica Artículos relacionados para localizar otras fuentes con contenido relevante para un artículo identificado. Debido a su cobertura 242 ampliada de material, GA puede dar mayor acceso al texto completo de publicaciones sin costo. En el campo de la medicina, GA ha generado controversia: algunos argumentan que su utilidad y calidad es similar a las bases de datos médicas de uso frecuente y otros sugieren cautela para confiar solo en GA. Las capacidades y características de este buscador bibliográfico pueden mejorar en los próximos años, pero por ahora sería arriesgado depender solamente de GA. Para hacer una revisión bibliográfica completa, las autoras consideran que es mejor combinar las búsquedas en GA con indagatorias en otras bases de datos. Ejemplo de búsqueda bibliográfica Zuckerman (2016) hizo una revisión bibliográfica acerca del uso de clorhexidina oral para prevenir la neumonía relacionada con el ventilador. La autora buscó estudios relevantes en cuatro bases de datos bibliográficas: CINAHL, PubMed, Scopus y EMBASE. Al principio identificó un total de 47 artículos, solo 16 eran duplicados. (Este artículo está disponible en .) Selección, documentación y resumen Después de buscar y recuperar las referencias hay varios pasos importantes antes de iniciar una síntesis. Selección y recopilación de referencias Las referencias que se identificaron en la búsqueda deben seleccionarse por relevancia. Por lo general, puede suponerse su relevancia al leer el resumen. Cuando se encuentra un artículo relevante se intenta obtener el texto completo, en lugar de confiar solo en la información del resumen. TIP El movimiento revista de acceso abierto obtiene cada vez más impulso en las publicaciones de cuidado de la salud. Las revistas de acceso abierto proporcionan artículos en línea sin costo. Cuando un artículo no está disponible en línea, puede obtenerse comunicándose con el autor principal, ya sea directamente por correo electrónico o a través de un recurso llamado Research Gate (www.researchgate.net). Documentación de la recuperación bibliográfica 243 Las estrategias de búsqueda suelen ser complejas, por lo que es prudente documentar las acciones de búsqueda y sus resultados. Hay que tomar notas de las bases de datos exploradas, las palabras clave usadas, los límites establecidos y cualquier otra información que ayude a tener un registro de lo que se hizo. Parte de la estrategia puede documentarse con la impresión del historial de búsqueda en las bases de datos electrónicas. La documentación favorece la eficiencia, ya que previene la duplicación inadvertida y también ayuda a valorar qué más debe intentarse. Resumen y registro de información Una vez que se recuperan artículos útiles, se necesita una estrategia para organizar la información contenida en estos. Para las revisiones simples, quizá sea suficiente tomar notas de las características clave de los estudios recuperados y basar la revisión en esas notas. Cuando una revisión bibliográfica incluye un gran número de artículos, puede necesitarse un sistema formal para registrar la información de cada estudio. Un mecanismo recomendado por las autoras para revisiones complejas consiste en codificar las características de cada estudio y luego registrar los códigos en un conjunto de matrices; este sistema se describe con detalle en otro trabajo de las autoras (Polit y Beck, 2017). 244 Figura 7-4. Ejemplo de miniprotocolo para una revisión bibliográfica (pregunta acerca de tratamiento). Otra estrategia es “copiar y pegar” cada resumen e información de cita de la base de datos bibliográfica en un documento de un procesador de texto. Así, al final de cada página podría haber un “miniprotocolo” para asentar información importante que desea registrarse de manera consistente con todos los estudios. No hay un formato fijo para tal protocolo, usted debe decidir qué elementos es importante registrar de forma sistemática de modo que sean una ayuda al organizar y analizar la información. En la figura 7-4 (arriba) se presenta un ejemplo de un protocolo de media página, con entradas que serían más adecuadas para preguntas acerca de tratamiento/intervención. Aunque es probable que muchos de los términos de este protocolo no le resulten familiares en este momento, aprenderá sus significados en los siguientes capítulos. EVALUACIÓN Y ANÁLISIS DE LA EVIDENCIA Al establecer conclusiones sobre un conjunto de evidencia, los revisores deben hacer juicios acerca del valor de los estudios. Por lo tanto, una parte importante de una revisión bibliográfica es evaluar el conjunto de los estudios completados e integrar la evidencia de estos. Evaluación de estudios para una revisión Cuando se revisa la bibliografía no debe hacerse una crítica completa de cada estudio, pero sí es necesario valorar la calidad de cada uno para poder hacer conclusiones del conjunto completo de la evidencia y de los faltantes de esta. Las críticas para una revisión bibliográfica tienden a enfocarse en los métodos de estudio, por lo que los lineamientos para la crítica de las tablas 4-1 y 4-2 podrían ser útiles (véase el capítulo 4). En las revisiones bibliográficas, es necesario valorar las características metodológicas de los estudios en revisión al responder una pregunta amplia: ¿en qué medida los hallazgos reflejan la verdad (el estado real de las cosas) o, por el contrario, en qué grado los defectos minan la credibilidad de la evidencia? Lo más probable es que la “verdad” se descubra cuando los investigadores usan diseños sólidos, planes de muestreo adecuados, procedimientos para recolección de datos de alta calidad y análisis apropiados. 245 Análisis y síntesis de evidencia Una vez que se hayan recuperado y criticado los estudios relevantes, es necesario analizar y sintetizar la información. Es útil hacer una analogía entre hacer una revisión bibliográfica y hacer un estudio cualitativo: en ambos casos, el objetivo es la identificación de temas importantes. En esencia, un análisis temático es la detección de patrones y regularidades, así como de inconsistencias. Pueden identificarse varios tipos diferentes de temas en el análisis de una revisión bibliográfica, tres de los cuales son los siguientes: Temas sustantivos. ¿Cuál es el patrón de evidencia: qué hallazgos predominan? ¿Cuánta evidencia hay? ¿Qué tan consistente es el conjunto de evidencia? ¿Qué faltantes existen en la evidencia? Temas metodológicos. ¿Qué métodos se han usado para responder la pregunta? ¿Cuáles son las principales deficiencias y fortalezas metodológicas? Temas de generalizabilidad/transferibilidad. ¿A qué población se aplica la evidencia? ¿Los hallazgos varían para distintos tipos de personas (p. ej., hombres vs. mujeres) o sitio (p. ej., urbano vs. rural)? Cuando se prepara una revisión es necesario determinar qué temas son los más relevantes para el propósito que se tiene. Por lo general, los temas sustantivos son de mayor interés. PREPARACIÓN DE UNA REVISIÓN BIBLIOGRÁFICA ESCRITA La redacción de revisiones bibliográficas puede ser difícil, sobre todo cuando un gran volumen de información y análisis temáticos debe condensarse en unas cuantas páginas. Se ofrecen algunas sugerencias, pero las autoras reconocen que las habilidades para escribir revisiones bibliográficas se desarrollan con el tiempo. Organización de una revisión escrita La organización es crucial para preparar una revisión escrita. Cuando la bibliografía sobre el tema es extensa, resulta útil resumir la información recuperada en una tabla. Esta puede incluir columnas con encabezados como Autor, Características de la muestra, Diseño y Hallazgos clave. Una tabla así presenta una revisión rápida que permite darle sentido a una gran 246 cantidad de información. La mayoría de los autores considera útil un bosquejo. A menos que la revisión sea muy sencilla, es importante tener un plan de organización para que la revisión tenga un flujo significativo y comprensible. Aunque los elementos específicos de la organización difieren de un tema a otro, el objetivo es estructurar la revisión para que conduzca de manera lógica a una conclusión sobre el estado de la evidencia acerca del tema. Después de finalizar la estructura organizacional, debe revisar sus notas o protocolos para decidir en qué parte del bosquejo cabe una referencia particular. Si algunas referencias no parecen ajustar en ningún sitio, quizá deban omitirse. Recuerde que el número de referencias es menos importante que su relevancia. Redacción de una revisión bibliográfica Ofrecer una guía detallada para escribir revisiones bibliográficas escapa al alcance de este libro, pero se exponen algunos comentarios acerca del contenido y estilo. Existe asistencia adicional en libros como los de Fink (2014) y Garrard (2014). Contenido de la revisión bibliográfica escrita Una revisión bibliográfica escrita debe proporcionar a los lectores una síntesis objetiva de la evidencia actual de un tema. Aunque pueden describirse con detalle los estudios clave, no es necesario incluir los elementos particulares de todas las referencias. Los estudios con hallazgos comparables por lo regular pueden resumirse juntos, como se ilustra en el tercer párrafo del ejemplo 1 al final de este capítulo (página 119). Los hallazgos deben resumirse en sus propias palabras. La revisión tiene que demostrar que usted consideró el valor acumulativo del conjunto de investigación. La repetición de citas de los artículos no muestra la asimilación y comprensión de la investigación anterior. La revisión ha de ser lo más imparcial posible; no debe omitir un estudio porque sus hallazgos contradicen los de los demás estudios o están en conflicto con sus propias ideas. Los resultados inconsistentes deben analizarse y la evidencia de apoyo tiene que evaluarse de manera objetiva. Por lo general, una revisión bibliográfica concluye con un resumen de la evidencia actual sobre el tema. El resumen debe recapitular los hallazgos clave, valorar su credibilidad y señalar los faltantes en la evidencia. Cuando la revisión bibliográfica se realiza para un nuevo 247 estudio, el resumen debe demostrar la necesidad de la investigación y aclarar el contexto para cualquier hipótesis. Conforme lea este libro será cada vez más competente en la evaluación crítica de la bibliografía de investigación. Se espera que comprenda la mecánica de hacer una revisión para investigación una vez que complete este capítulo, pero no que esté en posición de escribir una revisión de vanguardia hasta que haya adquirido más habilidades en los métodos de investigación. Estilo de una revisión para investigación Los estudiantes que preparan revisiones para investigación suelen tener dificultad para escribir en un estilo aceptable. Recuérdese que las hipótesis no pueden demostrarse ni desaprobarse con pruebas estadísticas y ninguna pregunta puede responderse de manera definitiva en un solo estudio. El problema es semántico, en parte: las hipótesis no se aprueban o verifican, se respaldan con los hallazgos de la investigación. TIP Las frases que indican el carácter provisional de los resultados de investigación, como las siguientes, son apropiadas: Hasta ahora, los hallazgos sugieren… Los resultados son consistentes con la conclusión de que … Al parecer hay evidencia bastante sólida de que … Además, una revisión bibliográfica debe incluir unas cuantas opiniones y debe hacer referencia explícita a la fuente. Las opiniones propias de los revisores no tienen sitio en una revisión, excepto por las valoraciones de la calidad de un estudio. ANÁLISIS CRÍTICO DE LAS REVISIONES BIBLIOGRÁFICAS Algunos profesionales de enfermería nunca preparan una revisión bibliográfica escrita y quizá nunca sea necesario que usted lo haga. Sin embargo, casi todos los profesionales de enfermería leen revisiones de investigación (incluidas las secciones de revisión bibliográfica de los reportes de investigación) y deben estar preparados para evaluar tales revisiones de manera crítica. Por lo regular es difícil criticar una revisión de investigación si no se conoce el tema. Quizá no sea posible juzgar si el autor incluyó toda la 248 bibliografía relevante y si resumió de forma adecuada el conocimiento sobre ese tema. Sin embargo, algunos aspectos de una revisión bibliográfica son susceptibles de ser evaluados por los lectores que no son expertos en el tema. En el recuadro 7-1 se presentan unas cuantas sugerencias para criticar revisiones de investigación. Otras preguntas más para la crítica son relevantes para las revisiones sistemáticas, como se explica en el capítulo 18. Recuadro 7-1 Lineamientos para la crítica de revisiones bibliográficas 1. ¿La revisión bibliográfica parece minuciosa y actualizada? ¿Incluyó estudios importantes sobre el tema? ¿Incluyó investigación reciente? 2. ¿La revisión se basó sobre todo en reportes de investigación, usó fuentes primarias? 3. ¿La revisión hizo una evaluación crítica de la revisión y comparó estudios clave? ¿Identificó faltantes importantes en la bibliografía? 4. ¿La revisión estaba bien organizada? ¿Es claro el desarrollo de ideas? 5. ¿La revisión utilizó un lenguaje apropiado, sugestivo del carácter provisional de los hallazgos anteriores? ¿Es objetiva? 6. Si la revisión fue la introducción para un nuevo estudio, ¿sustentó la necesidad del estudio? 7. Si la revisión se diseñó para resumir evidencia para la práctica clínica, ¿obtuvo conclusiones apropiadas acerca de las implicaciones para esta práctica? Cuando se valora una revisión bibliográfica, la pregunta global es si resume el estado actual de la evidencia de investigación. Si la revisión se escribió como parte de un reporte de investigación original, una pregunta igual de importante es si la revisión establece una base sólida para el nuevo estudio. TIP Las revisiones bibliográficas en las introducciones de los artículos de investigación casi siempre son muy breves y es improbable que presenten una crítica minuciosa de los estudios existentes. Sin embargo, deben identificarse los faltantes en lo que se ha estudiado. EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO 249 CRÍTICO La mejor forma de aprender acerca del estilo, el contenido y la organización de una revisión bibliográfica de investigación es leer las revisiones que aparecen en la bibliografía de enfermería. Se presenta un resumen de una revisión para un estudio con método mixto (este implica la recolección y análisis de datos cuantitativos y cualitativos). El extracto va seguido de algunas preguntas para guiar el pensamiento crítico; de ser necesario, consulte el artículo de investigación completo. El ejemplo 1 se encuentra en la sección Critical Thinking Activity del sitio web . Las preguntas de pensamiento crítico para los ejemplos 2 y 3 se basan en los estudios que aparecen en los apéndices A y B de este libro. Los comentarios en inglés de las autoras sobre estos ejercicios están en la sección Student Resources en . EJEMPLO 1: REVISIÓN BIBLIOGRÁFICA DE UN ESTUDIO CON MÉTODO MIXTO Estudio. Síntomas en mujeres con miocardiopatía periparto: un estudio con método mixto (Patel et al., 2016) Objetivo. El objetivo de este estudio era explorar y describir las experiencias sintomáticas de las mujeres en la miocardiopatía periparto. Revisión bibliográfica (extracto). “La miocardiopatía periparto (MCPP) es una enfermedad idiopática, rara en países de ingresos altos y un diagnóstico de exclusión. En ocasiones, se relaciona con insuficiencia cardiaca (IC) grave que ocurre hacia el final del embarazo o en los meses siguientes al nacimiento. Es posible que el ventrículo izquierdo no esté dilatado pero la fracción de expulsión ventricular izquierda casi siempre se reduce a menos de 45%. La Heart Failure Association of the European Society of Cardiology Working Group on PPCM la define como: Una miocardiopatía idiopática que se presenta con IC secundaria a disfunción sistólica del ventrículo izquierdo hacia el final del embarazo o en los meses siguientes al parto, en la que no puede encontrarse otra causa de IC. Es un diagnóstico de exclusión. Es posible que el ventrículo izquierdo no esté dilatado, pero la fracción de expulsión casi siempre se reduce a menos de 45% (Sliwa et al., 2010). La incidencia y el pronóstico de la MCPP varía en todo el mundo (Elkayam, 2011). La incidencia real se desconoce, ya que la presentación clínica es variable. Los cálculos actuales varían entre 1:200 (Haití), 1:1 000 (Sudáfrica) y 1:2 500-4 000 nacimientos (EE.UU.) (Sliwa et al., 2006, 2010; Blauwet y Cooper, 2011; Elkayam, 2011). No 250 hay datos de la prevalencia de la enfermedad en Europa (Haghikia et al., 2013). Si se asume una incidencia de 1:3 500 a 1:1 400 nacimientos, la incidencia esperada sería de hasta 300 pacientes por año en Alemania, con insuficiencia cardiaca grave crítica en casi 30 (Hilfiker-Kleiner et al., 2008). La incidencia en Suecia se calculó en 1:9 191 nacimientos (Barasa et al., 2012). Los cambios anatómicos y fisiológicos en la madre relacionados con el embarazo normal son profundos y esto podría causar síntomas y signos que se superponen con los que suelen relacionarse con la enfermedad fuera del embarazo (Germain y Nelson-Piercy, 2011). Los síntomas principales/cardinales de la MCPP son los de la IC e incluyen fatiga, disnea y retención de líquido, por lo que el diagnóstico a menudo pasa inadvertido o se retrasa, ya que los síntomas iniciales son similares a los cambios hemodinámicos del embarazo normal o el puerperio temprano (Groesdonk et al., 2009; Sliwa et al., 2010; Germain y Nelson-Piercy, 2011; Givertz, 2013). Un análisis de las narraciones de Internet de mujeres con MCPP mostró que estos síntomas se superponen con las molestias normales del embarazo, lo que genera un espacio para que los profesionales clínicos no adviertan la gravedad de la situación (Morton et al., 2014). Una encuesta en mujeres con MCPP que participaron en un grupo de apoyo en línea mostró su frustración con el personal de enfermería (Hess et al., 2012) por haber sido ignoradas, desestimadas y descuidadas. Solo 4% de las entradas en el foro describía las interacciones con los profesionales de la salud como positivas. Las causas, los factores de riesgo, la etiología, el tratamiento y el pronóstico de la MCPP ya se describieron en otros estudios (Ferriere et al., 1990; Cenac y Djibo, 1998; Groesdonk et al., 2009; Sliwa et al., 2010; Elkayam, 2011; Germain y Nelson-Piercy, 2011; BachelierWalenta et al., 2013; Givertz, 2013). Sin embargo, existen muchas más preguntas que permanecen sin respuesta y las experiencias sintomáticas de las mujeres con MCPP rara vez se exploran. Como la comprensión de los trastornos específicos desde la perspectiva de las personas afectadas es un punto inicial fundamental para la atención (Watson, 2011), es importante comprender la experiencia subjetiva y el significado de la MCPP desde la perspectiva de la persona afectada. La falta de investigación en esta área apunta a la necesidad de adquirir conocimiento de las pacientes afectadas, para ayudar con el diagnóstico diferencial y temprano de la MCPP” (pp. 14-15). Ejercicios de pensamiento crítico 251 1. Responda las preguntas relevantes del recuadro 7-1 respecto a esta revisión bibliográfica. 2. Considere también las siguientes preguntas dirigidas, que pueden afinar más sus habilidades de pensamiento crítico y ayudarlo a comprender este estudio: a. Cuando se realiza una revisión bibliográfica, ¿qué palabras clave podrían haber usado los investigadores para buscar estudios anteriores? b. Utilizando las palabras clave, realice una búsqueda computarizada para ver si puede encontrar un estudio relevante reciente que aumente la revisión. EJEMPLO 2: INVESTIGACIÓN CUANTITATIVA EN EL APÉNDICE A • Lea la introducción del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/ elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 7-1 sobre este estudio. 2. Considere también las siguientes preguntas dirigidas: a. Cuando se realiza una revisión bibliográfica, ¿qué palabras clave podrían haberse usado para buscar estudios anteriores? b. Con las palabras clave, realice una búsqueda computarizada para ver si puede encontrar un estudio relevante reciente que aumente la revisión. EJEMPLO 3: INVESTIGACIÓN CUALITATIVA EN EL APÉNDICE B • Lea la introducción del estudio de Beck y Watson (2010) (“Parto posterior a un parto traumático”) en el apéndice B de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 7-1 para este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿Cuál es el fenómeno central en este estudio? ¿Se cubrió de manera adecuada el fenómeno en la revisión bibliográfica? b. Cuando realizaron su revisión bibliográfica, ¿qué palabras clave podrían haber usado Beck y Watson para buscar estudios previos? 252 ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Finding Evidence for an EBP Inquiry in PubMed. Respuestas a los ejercicios de pensamiento crítico para los ejemplos 2 y 3. Recursos en Internet con sitios web útiles para el capítulo 7. Un artículo de investigación de una revista de Wolters Kluwer, el estudio de Zuckerman descrito en la p. 114. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. Una revisión bibliográfica de investigación es un resumen escrito del estado de la evidencia de un problema de investigación. Los principales pasos en la preparación de una revisión bibliográfica escrita incluyen formula-ción de una pregunta, diseño de una estrategia de búsqueda, búsqueda y recuperación de fuentes relevantes, resumen y codificación de la información, crítica a los estudios, análisis e integración de la información y preparación de una síntesis escrita. Las revisiones de investigación dependen sobre todo de los hallazgos en los reportes de investigación. La información en referencias que no son de investigación (p. ej., artículos de opinión, reportes de caso) pueden ampliar la comprensión de un problema, pero tiene poca utilidad para resumir evidencia. Una fuente primaria es la descripción original de un estudio 253 preparado por el investigador que lo condujo; una fuente secundaria es una descripción de un estudio realizado por otra persona. Las revisiones bibliográficas deben basarse sobre todo en fuentes primarias. Las estrategias para encontrar estudios sobre un tema no solo incluyen el uso de herramientas bibliográficas, también comprenden el rastreo de estudios anteriores citados en una lista de referencias de un reporte y el uso de un estudio central para buscar estudios posteriores que lo citaron. Los recursos clave para una búsqueda bibliográfica de investigación son las bases de datos bibliográficas que pueden explorarse por medios electrónicos. Para los profesionales de enfermería, son muy útiles las bases de datos CINAHL y MEDLINE. Cuando exploran una base de datos bibliográfica, los usuarios pueden hacer una búsqueda por palabra clave que indaga por términos en los campos de texto de un registro de la base de datos (o que mapea las palabras clave en los códigos de temas de esta) o pueden buscar con base en los códigos de los encabezados por tema. Las referencias recuperadas deben seleccionarse por relevancia y luego la información pertinente puede extraerse y codificarse para su análisis posterior. Los estudios también deben criticarse para valorar la fortaleza de la evidencia en la investigación existente. El análisis de información de una revisión bibliográfica implica la identificación de temas importantes, regularidades y patrones en la información. Cuando se prepara una revisión escrita es importante organizar los materiales de manera coherente. Se recomienda la preparación de un bosquejo. El papel de los revisores es señalar qué se ha estudiado, qué tan adecuados y confiables son los estudios y qué huecos existen en el conjunto de la investigación. REFERENCIAS DEL CAPÍTULO 7 Fink, A. (2014). Conducting research literature reviews: From the Internet to paper (4th ed.). Thousand Oaks, CA: Sage. Garrard, J. (2014). Health sciences literature review made easy: The matrix method (4th ed.). Burlington, MA: Jones & Bartlett Learning. *Patel, H., Berg, M., Barasa, A., Begley, C., & Schaufelberger, M. (2016). 254 Symptoms in women with peripartum cardiomyopathy: A mixed method study. Midwifery, 32, 14–20. Polit, D., & Beck, C. (2017). Nursing research: Generating and assessing evidence for nursing practice (10th ed.). Philadelphia, PA: Wolters Kluwer. **Zuckerman, L. M. (2016). Oral chlorhexidine use to prevent ventilatorassociated pneumonia in adults: Review of the current literature. Dimensions of Critical Care Nursing, 35, 25–36. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en 255 para este capítulo. Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Identificar las características principales de las teorías, los modelos conceptuales y los marcos. Identificar varios modelos conceptuales o teorías que los investigadores en enfermería usan con frecuencia. Describir el modo en que la teoría y la investigación están vinculadas en los estudios cuantitativos y cualitativos. Criticar la adecuación de un marco teórico –o su ausencia– en un estudio. Definir los términos nuevos del capítulo. Términos clave Mapa conceptual Marco Marco conceptual Marco teórico Modelo Modelo conceptual Modelo esquemático Teoría Teoría de rango medio Teoría descriptiva Por lo general, los estudios de gran calidad alcanzan un nivel alto de integración conceptual. Esto sucede cuando las preguntas de investigación se ajustan a los métodos elegidos, cuando las preguntas son consistentes con la evidencia existente y cuando hay una 256 justificación conceptual factible para los resultados esperados, incluida una justificación para cualquier hipótesis o intervención. Por ejemplo, supóngase que un equipo de investigación postuló la hipótesis acerca de que una intervención para dejar de fumar dirigida por el profesional de enfermería reduciría el consumo de cigarrillos entre pacientes con enfermedad cardiovascular. ¿Por qué harían esta predicción: cuál es la “teoría” acerca de cómo la intervención podría cambiar el comportamiento de las personas? ¿Los investigadores predicen que la intervención cambiará el conocimiento, las actitudes y la motivación de los pacientes? La noción de los investigadores sobre cómo “funcionaría” la intervención delinea el diseño de la intervención y el estudio. Los estudios no se desarrollan en el vacío, debe haber una conceptualización subyacente de los comportamientos y las características de las personas. En algunos estudios, la conceptualización subyacente es dudosa o no se indica, pero en la buena investigación, una conceptualización justificable se declara de manera explícita. Este capítulo explica los contextos teóricos y conceptuales para los problemas de investigación en enfermería. TEORÍAS, MODELOS Y MARCOS Muchos términos se usan en conexión con los contextos conceptuales para la investigación, por ejemplo teorías, modelos, marcos, esquemas y mapas. Estos términos se interrelacionan, pero distintos autores los utilizan de modo diferente. A continuación se presenta una guía para distinguir estos términos tal como se definen en este libro. Teorías En la educación de la enfermería, el término teoría se usa para referirse al contenido que se cubre en las aulas, a diferencia de la práctica real de la enfermería. Tanto en el lenguaje lego como en el científico, teoría conlleva una abstracción. En ocasiones, la teoría se define como una generalización abstracta que explica cómo se interrelacionan los fenómenos. Según la definición clásica, las teorías consisten en dos o más conceptos y un conjunto de proposiciones que forman un sistema lógicamente interrelacionado, lo que proporciona un mecanismo para deducir hipótesis. Como ejemplo, considérese la teoría de reforzamiento, que 257 postula que el comportamiento que se refuerza (es decir, se recompensa) tiende a repetirse y aprenderse. La proposición se presta a la generalización de la hipótesis. Por ejemplo, de la teoría podría deducirse que los niños hiperactivos que son recompensados cuando participan en un juego tranquilo tendrán menos comportamientos malos que los niños sin recompensas. Esta predicción, así como otras basadas en la teoría del reforzamiento, podrían comprobarse en un estudio. El término teoría también se emplea de manera menos restrictiva para referirse a la caracterización amplia de un fenómeno. Una teoría descriptiva explica y describe de forma minuciosa un fenómeno. Las teorías descriptivas son abstracciones inductivas basadas en la observación que describen o clasifican las características de individuos, grupos o situaciones mediante la síntesis de sus aspectos comunes. Tales teorías son importantes en los estudios cualitativos. Las teorías ayudan a interpretar los hallazgos de la investigación. Es probable que las teorías guíen a los investigadores para comprender no solo el “qué” de los fenómenos naturales, también el “por qué” de su presencia. Las teorías también ayudan a estimular la investigación porque aportan dirección e ímpetu. Las teorías tienen distintos niveles de generalizabilidad. Las grandes teorías (o macroteorías) dicen explicar grandes segmentos de la experiencia humana. En la enfermería existen grandes teorías que ofrecen explicaciones de la totalidad de esta disciplina y que caracterizan la naturaleza y la misión de la práctica de enfermería, a diferencia de otras materias. Un ejemplo de una teoría de enfermería que se ha descrito como una gran teoría es el paradigma Humanbecoming de Parse (Parse, 2014). Las teorías relevantes para los investigadores por lo regular son menos abstractas que las grandes teorías. Las teorías de rango medio intentan explicar fenómenos como el estrés, la comodidad y la promoción de la salud. En comparación con las grandes teorías, las teorías de rango medio son más específicas y más susceptibles a la comprobación empírica. Modelos Un modelo conceptual trata con abstracciones (conceptos) que se ensamblan por su relevancia para un tema común. Los modelos conceptuales proporcionan una perspectiva conceptual sobre fenómenos interrelacionados, pero se estructuran de manera más laxa 258 que las teorías y no vinculan conceptos en un sistema deductivo lógico. Un modelo conceptual presenta una comprensión amplia de un fenómeno y refleja las suposiciones del diseñador del modelo. Los modelos conceptuales pueden servir para generar hipótesis. Algunos autores usan el término modelo para designar un método de representación de fenómenos con el uso mínimo de palabras, el cual puede transmitir significados diferentes a personas distintas. Dos tipos de modelos empleados en los contextos de investigación son los modelos esquemáticos y los modelos estadísticos. Los modelos estadísticos, no tratados aquí, son ecuaciones que expresan de manera matemática las relaciones entre un conjunto de variables y que se prueban con métodos estadísticos. Los modelos esquemáticos (o mapas conceptuales) son representaciones visuales de las relaciones entre los fenómenos y se usan en la investigación cuantitativa y cualitativa. Los conceptos y los vínculos entre estos se presentan de forma gráfica con recuadros, flechas y otros símbolos. Como ejemplo de un modelo esquemático, la figura 8-1 en la siguiente página muestra el modelo de promoción de la salud de Pender, que busca explicar y predecir el componente de promoción de la salud en el estilo de vida (Pender et al., 2015). Los modelos esquemáticos son atractivos como resúmenes visuales de ideas complejas. 259 Figura 8-1. El modelo de promoción de la salud (del sitio web de Pender: www.nursing.umich.edu/faculty/pender/chart.gif). Marcos Un marco es el fundamento conceptual de un estudio. No todos los estudios se basan en una teoría o modelo, pero todo estudio tiene un marco. En un estudio basado en una teoría, el marco se llama marco teórico; en un estudio arraigado en un modelo conceptual, el marco puede llamarse marco conceptual. Sin embargo, los términos marco conceptual, modelo conceptual y marco teórico a menudo se usan de 260 manera indistinta. El marco de un estudio con frecuencia está implícito (es decir, no se reconoce o describe de modo formal). Las visiones del mundo moldean el modo en que se definen los conceptos, pero en ocasiones los investigadores no aclaran los fundamentos de sus conceptos. Los investigadores que aclaran las definiciones conceptuales de las variables clave aportan información importante del marco del estudio. Es menos probable que los investigadores cuantitativos identifiquen sus marcos que los investigadores cualitativos. En la investigación cualitativa en una tradición de investigación, el marco es parte de esa tradición. Por ejemplo, los etnógrafos casi siempre inician dentro de una teoría de cultura. Los investigadores de la teoría fundamentada incorporan principios sociológicos en su marco y enfoque. Las preguntas que hacen los investigadores cualitativos suelen reflejar de modo inherente ciertas formulaciones teóricas. En años recientes, el análisis de conceptos se convirtió en una tarea importante entre los estudiantes y académicos de la enfermería. Se han propuesto varios métodos para realizar un análisis de conceptos y aclarar definiciones conceptuales (p. ej., Walker y Avant, 2011). Los esfuerzos para analizar conceptos relevantes para la enfermería deben facilitar la claridad conceptual entre los investigadores de esta disciplina. Ejemplo del desarrollo de una definición conceptual Ramezani y sus colaboradores (2014) usaron los métodos de análisis de concepto de ocho pasos de Walker y Avant (2011) para definir conceptualmente la atención espiritual en la enfermería. Buscaron y analizaron bases de datos estadounidenses e internacionales, y encontraron 151 artículos relevantes y siete libros. Propusieron la siguiente definición: “Los atributos de la atención espiritual son presencia sanadora, uso terapéutico de uno mismo, sentido de intuición, exploración de la perspectiva espiritual, enfoque centrado en el paciente, intervención terapéutica enfocada en el significado y creación de un ambiente espiritualmente nutricio” (p. 211). La naturaleza de las teorías y los modelos conceptuales Las teorías, los marcos conceptuales y los modelos no se descubren, 261 se crean. La construcción de teorías depende no solo de la evidencia observable, también de la ingenuidad del teórico para reunir evidencia y darle sentido. Como las teorías no están “ahí afuera” esperando ser descubiertas, se deduce que son tentativas. Una teoría no puede comprobarse, una teoría representa los mejores esfuerzos del teó-rico para describir y explicar fenómenos. Mediante la investigación, las teorías evolucionan y a veces se desechan. Esto puede ocurrir si la evidencia nueva socava la teoría aceptada antes. O una nueva teoría puede integrar las nuevas observaciones con una teoría existente para aportar una explicación más parca del fenómeno. La teoría y la investigación tienen una relación recíproca. Las teorías se construyen de manera inductiva a partir de observaciones y la investigación es una muy buena fuente de esas observaciones. A su vez, la teoría debe probarse al someter las deducciones derivadas de esta (hipótesis) a una investigación sistemática. Por lo tanto, la investigación tiene un papel doble y continuo en la construcción y prueba de teorías. MODELOS CONCEPTUALES Y TEORÍAS USADOS EN LA INVESTIGACIÓN DE ENFERMERÍA Los investigadores en enfermería han usado marcos de enfermería y marcos ajenos a la enfermería como contextos conceptuales para sus estudios. Esta sección presenta una descripción breve de varios marcos que los investigadores de enfermería han considerado útiles. Modelos conceptuales de la enfermería Varios profesionales de la enfermería han formulado modelos conceptuales que representan explicaciones de qué es la disciplina de la enfermería y lo que implica su proceso. Como señalaron Fawcett y DeSanto-Madeya (2013), hay cuatro conceptos centrales en los modelos de la enfermería: seres humanos, ambiente, salud y enfermería. Los diversos modelos conceptuales definen estos conceptos de manera diferente, los vinculan de distintas formas y subrayan las variadas relaciones entre estos. Además, los modelos hacen énfasis en que distintos procesos son centrales para la enfermería. 262 Los modelos conceptuales no se desarrollaron principalmente como una base para la investigación en enfermería. En realidad, la mayoría de los modelos ha tenido más impacto en la educación de la enfermería y la práctica clínica que en la investigación. No obstante, los investigadores en enfermería recurrieron a estos marcos conceptuales para obtener inspiración para formular preguntas de investigación e hipótesis. El suplemento en inglés del capítulo 8 en el sitio web incluye una tabla que contiene varios modelos conceptuales prominentes en enfermería. La tabla describe las características clave del modelo e identifica un estudio que señaló el modelo como su marco. TIP Considérese un modelo conceptual de enfermería que recibió atención para la investigación, el modelo de adaptación de Roy. En este modelo, los seres humanos se consideran sistemas biopsicosociales adaptables que enfrentan el cambio ambiental mediante el proceso de adaptación (Roy y Andrews, 2009). En el sistema humano existen cuatro subsistemas: fisiológico/físico, concepto personal/identidad de grupo, función de rol e interdependencia. Estos subsistemas constituyen modos de adaptación que proporcionan mecanismos para hacer frente a los estímulos y cambios ambientales. La salud se considera a la vez un estado y un proceso de ser, que se integran y convierten en un todo que refleja la mutualidad entre las personas y el ambiente. Según este modelo, el objetivo de la enfermería es promover la adaptación del paciente. Por lo general, las intervenciones de enfermería asumen la forma de aumentar, disminuir, modificar, eliminar o mantener los estímulos internos y externos que influyen en la adaptación. El modelo de adaptación de Roy ha sido la base de varias teorías de rango medio y docenas de estudios. Ejemplo de investigación con el modelo de adaptación de Roy Alvarado-García y Salazar Maya (2015) usaron el modelo de adaptación de Roy como base para su estudio profundo acerca de cómo los adultos mayores se adaptan al dolor benigno crónico. 263 Teorías de rango medio desarrolladas por profesionales de enfermería Además de los modelos conceptuales que describen y caracterizan el proceso de enfermería, los profesionales de esta rama desarrollaron teorías de rango medio y modelos que se enfocan en fenómenos más específicos de su interés. Los ejemplos de teorías de rango medio que se han usado en la investigación incluyen la teoría de depresión posparto de Beck (2012), la teoría de comodidad de Kolcaba (2003), el modelo de promoción de la salud de Pender y sus colaboradores (2012) y la teoría de incertidumbre ante la enfermedad de Mishel (1990). Aquí se presenta una descripción breve de los dos últimos. El modelo de promoción de la salud (MPS) de Nola Pender (2011) se enfoca en explicar los comportamientos que promueven la salud con una orientación al bienestar. Según el modelo (véase la figura 8-1), la promoción de la salud incluye actividades dirigidas al desarrollo de recursos que mantengan o aumenten el bienestar de la persona. El modelo abarca varias proposiciones que pueden usarse para desarrollar y poner a prueba las intervenciones, y para comprender los comportamientos de salud. Por ejemplo, una proposición del MPS consiste en que las personas participan en comportamientos de los que esperan obtener beneficios valiosos; otra es que la competencia percibida (o autoeficacia) en el comportamiento determinado aumenta la probabilidad de practicarlo. Ejemplo de uso del modelo de promoción de la salud Cole y Gaspar (2015) usaron el MPS como su marco para un proyecto basado en evidencia diseñado para examinar los comportamientos de control de la enfermedad de pacientes con epilepsia y guiar la implementación de un protocolo de autotratamiento para estos pacientes. La teoría de incertidumbre ante la enfermedad de Mishel (Mishel, 1990) se enfoca en el concepto de incertidumbre (la incapacidad de una persona para determinar el significado de los fenómenos relacionados con la enfermedad). Según esta teoría, las personas desarrollan apreciaciones subjetivas que las ayuden a interpretar la experiencia de la enfermedad y el tratamiento, y ocurre cuando las personas no pueden reconocer y clasificar estímulos. Así, 264 conduce a la incapacidad para obtener una concepción clara de la situación, pero una situación considerada como incierta impulsará a los individuos a usar sus recursos para adaptarse. La conceptualización de Mishel sobre la incertidumbre y su escala de incertidumbre en la enfermedad se han usado en muchos estudios de enfermería. Ejemplo del uso de la teoría de incertidumbre ante la enfermedad Cypress (2016) usó la teoría de la incertidumbre ante la enfermedad de Mishel como base para explorar la incertidumbre entre los pacientes con enfermedad crónica en la unidad de cuidados intensivos. Otros modelos usados por investigadores en enfermería Muchos conceptos en los que los investigadores en enfermería están interesados no son exclusivos de esa disciplina, por lo que sus estudios a veces se relacionan con marcos que no son modelos de enfermería. Varios modelos alternativos han alcanzado prominencia en el desarrollo de intervenciones de enfermería para promover comportamientos promotores de la salud y elecciones de vida. Cuatro teorías que no son de enfermería se usan con frecuencia en estudios de esta rama: la teoría cognitiva social de Bandura (2001), el modelo transteórico (etapas de cambio) de Prochaska y colaboradores (2002), el modelo de creencias de salud (Becker, 1974) y la teoría del comportamiento planeado (Ajzen, 2005). La teoría cognitiva social (Bandura, 2001), que a veces se denomina teoría de la autoeficacia, ofrece una explicación del comportamiento humano con base en los conceptos de autoeficacia, expectativas de resultado e incentivos. Autoeficacia se refiere a la creencia de las personas en su propia capacidad para practicar comportamientos particulares (p. ej., dejar de fumar). Las expectativas de la autoeficacia determinan los comportamientos que una persona elige, su grado de perseverancia y la calidad del desempeño. Por ejemplo, C. Lee y sus colaboradores (2016) examinaron si los factores basados en la teoría cognitiva social, incluida la autoeficacia, eran determinantes en el mantenimiento de la actividad física en sobrevivientes de cáncer mamario 6 meses después 265 de una intervención de actividad física. TIP La autoeficacia es un constructo clave en varios modelos descritos en este capítulo. En repetidas ocasiones se ha encontrado que la autoeficacia influye en los comportamientos de las personas y es susceptible de cambiar, por lo que la mejora de la autoeficacia suele ser un objetivo en las intervenciones diseñadas para modificar el comportamiento relacionado con la salud de las personas. En el modelo transteórico (Prochaska et al., 2002), el constructo central son las etapas de cambio, que conceptualizan un continuo de disposición motivacional para cambiar un comportamiento problemático. Las cinco etapas de cambio son precontemplación, contemplación, preparación, acción y mantenimiento. Los estudios muestran que los sujetos que tienen éxito en los cambios personales usan distintos procesos en cada etapa particular, lo que sugiere la conveniencia de intervenciones que se individualizan según la etapa de disposición al cambio de la persona. Por ejemplo, M. K. Lee y sus colaboradores (2014) evaluaron una intervención de autocontrol basada en la web para sobrevivientes de cáncer mamario. El programa de intervención con ejercicio y dieta incorporaba estrategias basadas en el modelo transteórico. El modelo de creencias de salud (MCS) de Becker (1974) es un marco para explicar el comportamiento relacionado con la salud de las personas, como el cumplimiento de un régimen médico. Según el modelo, el comportamiento relacionado con la salud está influido por la percepción de una persona de alguna amenaza impuesta por el problema médico, así como por el valor relacionado con las acciones enfocadas en reducir la amenaza (Becker, 1974). Un MCS revisado incorporó el concepto de autoeficacia (Rosenstock et al., 1988). Los investigadores en enfermería han usado mucho el MCS. Por ejemplo, Jeihooni y sus colaboradores (2015) desarrollaron y evaluaron un programa para prevenir la osteoporosis basado en el MCS. La teoría del comportamiento planeado (TCP; Ajzen, 2005), que es una extensión de otra teoría llamada teoría de la acción razonada, ofrece un marco para comprender el comportamiento de las personas y sus determinantes psicológicos. De esta forma, explica que el comportamiento volitivo depende de la intención de las personas para practicarlo. A su vez, las intenciones son modificadas por 266 actitudes hacia el comportamiento, las normas subjetivas (es decir, la presión social percibida para practicarlo o no) y el control conductual percibido (esto es, la facilidad o dificultad anticipadas para practicar el comportamiento). Por ejemplo, Newham y sus colaboradores (2016) usaron la TCP como marco para su estudio de las intenciones de las mujeres embarazadas hacia el comportamiento de actividad física y reposo. Aunque el uso de teorías y modelos de otras disciplinas como la psicología (teorías prestadas) ha generado cierta controversia, es probable que la investigación en enfermería continúe en su trayecto actual de realizar estudios con una perspectiva multidisciplinaria. Una teoría prestada que se evalúa y se considera empíricamente adecuada en situaciones relevantes para la salud de interés para los profesionales de enfermería se convierte en una teoría compartida. TIP La sección Internet Resources del sitio web incluye enlaces a sitios web dedicados a varias teorías mencionadas en este capítulo. USO DE UNA TEORÍA O MARCO EN LA INVESTIGACIÓN En esta sección se describen las maneras en que los investigadores cuantitativos y cualitativos utilizan una teoría. El término teoría se usa en su sentido más amplio para incluir los modelos conceptuales, las teorías formales y los marcos. Teorías en la investigación cualitativa Casi siempre hay una teoría en los estudios embebidos en la tradición de investigación cualitativa, como la etnografía o la fenomenología. Sin embargo, diferentes tradiciones incluyen la teoría de distintas maneras. Sandelowski (1993) distinguió entre una teoría sustantiva (conceptualizaciones de un fenómeno específico en estudio) y la teoría que refleja una conceptualización de la indagación humana. Algunos investigadores cualitativos insisten en un punto de vista ateórico ante el fenómeno de interés, con la finalidad de suspender las conceptualizaciones previas (teorías sustantivas) que pudieran sesgar 267 la investigación. Por ejemplo, los fenomenólogos están comprometidos con la ingenuidad teórica e intentan mantener controladas las ideas preconcebidas sobre el fenómeno en cuestión. No obstante, los fenomenólogos están guiados por un marco que enfoca su investigación en ciertos aspectos del mundo de una persona; es decir, sus experiencias vividas. Los etnógrafos llevan una perspectiva cultural a sus estudios y esta perspectiva da forma a su trabajo de campo. Las teorías culturales incluyen teorías ideacionales, las cuales sugieren que las condiciones culturales derivan de actividades mentales e ideas, y las teorías materialistas, que consideran las condiciones materiales (p. ej., recursos, producción) como la fuente de los desarrollos culturales (Fetterman, 2010). El fundamento teórico de la teoría fundamentada es una fusión de formulaciones sociológicas, la más prominente de las cuales es la interacción simbólica (o interaccionismo). Tres premisas subyacentes incluyen (1) los seres humanos actúan hacia las cosas con base en los significados que las cosas tienen para ellos (2) el significado de las cosas deriva de las interacciones humanas y (3) los significados se manejan y modifican mediante un proceso interpretativo (Blumer, 1986). Ejemplo de un estudio de teoría fundamentada Babler y Strickland (2015) condujeron un estudio de teoría fundamentada en un marco de interacción simbólica para comprender los esfuerzos de los adolescentes con diabetes mellitus tipo 1 para “normalizarse”. A pesar de esta perspectiva teórica, los investigadores de la teoría fundamentada, como los fenomenólogos, intentan mantener contenida la teoría sustantiva anterior sobre el fenómeno hasta que surja su propia teoría sustantiva. El objetivo de la teoría fundamentada es desarrollar una comprensión conceptualmente profunda de un fenómeno que se basa en observaciones reales. Una vez que la teoría comienza a tomar forma, los teóricos de esta corriente usan la bibliografía anterior para la comparación con las categorías emergentes de la teoría. Los investigadores de la teoría fundamentada que se enfocan en procesos sociales o psicológicos por lo regular desarrollan mapas conceptuales con el fin de ilustrar gráficamente 268 cómo se despliega un concepto. La figura 8-2 ilustra ese mapa conceptual para un estudio de la transición de paciente a sobreviviente entre las sobrevivientes de cáncer mamario afroamericanas (Mollica y Nemeth, 2015); dicho estudio se describe al final de este capítulo. Figura 8-2. Una teoría fundamentada de la experiencia de la transición a la supervivencia entre mujeres afroamericanas con cáncer mamario. (Reimpresa con autorización de Mollica, M., y Nemeth, L. [2015]. Transition from patient to survivor in African American breast cancer survivors. Cancer Nursing, 38, 16-22.) En años recientes, algunos investigadores de enfermería cualitativos han usado una teoría crítica como marco en su investigación. La teoría crítica es un paradigma que implica una crítica de la sociedad y los procesos y estructuras sociales, como se explica en el capítulo 11. Los investigadores cualitativos a veces usan modelos conceptuales de enfermería u otras teorías formales como marcos de interpretación. Por ejemplo, varios investigadores de enfermería cualitativos 269 reconocen que las raíces filosóficas de sus estudios radican en modelos conceptuales de enfermería como los desarrollados por Parse (2014), Roy (Roy y Andrews, 2009), Rogers (1994) o Newman (1997). TIP La revisión sistemática de los estudios cualitativos sobre un tema específico puede conducir al desarrollo de una teoría sustantiva. En las metasíntesis se combinan los estudios cualitativos con el fin de identificar sus elementos esenciales. Luego se usan los hallazgos de distintas fuentes para construir una teoría, como se explica en el capítulo 18. Teorías en la investigación cuantitativa Los investigadores cuantitativos vinculan la investigación con la teoría o los modelos de varias formas. El enfoque típico es poner a prueba hipótesis deducidas a partir de una teoría existente. Por ejemplo, un profesional de enfermería podría leer sobre el MPS de Pender (2011) (figura 8-1) y podría razonar de la siguiente manera: si el MPS es válido, esperaría que los pacientes con osteoporosis que perciben el beneficio de una dieta enriquecida con calcio tuvieran mayor probabilidad de modificar sus patrones de alimentación que aquellos que no perciben beneficios. Esta hipótesis podría verificarse mediante análisis estadístico de los datos sobre las percepciones de los pacientes en relación con sus hábitos alimentarios. La aceptación repetida de las hipótesis derivadas de una teoría proporciona sustento a la teoría. TIP Cuando un estudio cuantitativo se basa en una teoría o modelo, el artículo de investigación casi siempre señala este hecho desde el principio, por lo regular en el resumen o incluso en el título. Algunos reportes también tienen una sección en la introducción llamada “Marco teórico”. El reporte por lo general incluye una revisión breve de la teoría para que todos los lectores comprendan, a grandes rasgos, el contexto conceptual del estudio. Algunos investigadores ponen a prueba intervenciones basadas en la teoría. Las teorías tienen implicaciones para influir en las actitudes o el comportamiento de las personas y por lo tanto en sus resultados 270 de salud. Las intervenciones basadas en una conceptualización explícita del comportamiento humano tienen mayor probabilidad de ser efectivas que las desarrolladas en un vacío conceptual. Las intervenciones rara vez afectan los resultados de manera directa: existen factores mediadores que juegan un papel en la vía entre la intervención y los resultados deseados. Por ejemplo, los investigadores que desarrollan intervenciones basadas en la teoría cognitiva social postulan que las mejoras en la autoeficacia de una persona conducirán a cambios positivos en comportamientos de salud y en consecuencia en los resultados de salud. Ejemplo de prueba de una teoría en un estudio de intervención Smith y sus colaboradores (2015) evaluaron la efectividad de un programa de estilo de vida prenatal basado en una teoría (teoría cognitiva social) para mujeres embarazadas con índice de masa corporal mayor de 30. Muchos investigadores que citan una teoría o modelo como su marco no prueban la teoría de forma directa, sino que la usan para establecer una estructura de organización. En esta estrategia, los investigadores asumen que el modelo que ellos apoyan es válido y usan sus constructos o esquemas para proveer un contexto de interpretación. Los investigadores cuantitativos también usan otra estrategia para crear un contexto conceptual que implica el uso de los hallazgos de la investigación previa para desarrollar un modelo original. En algunos casos, el modelo incorpora elementos o constructos de una teoría existente. Ejemplo del desarrollo de un nuevo modelo Hoffman y sus colaboradores (2014) desarrollaron un programa de rehabilitación para pacientes con cáncer pulmonar y luego lo sometieron a una prueba piloto. La intervención se basó en su propio modelo conceptual que representaba una síntesis de dos teorías, la teoría del control de la atención a los síntomas y el modelo de atención transicional. 271 ANÁLISIS CRÍTICO A LOS MARCOS EN LOS REPORTES DE INVESTIGACIÓN Por lo regular es difícil hacer el análisis crítico del contexto teórico (o su ausencia) de un reporte de investigación publicado, pero se ofrecen algunas sugerencias. Recuadro 8-1 Lineamientos para la crítica de los marcos teóricos y conceptuales 1. ¿El reporte describió un marco teórico o conceptual explícito para el estudio? De no ser así, ¿la ausencia de un marco le resta valor a la integración conceptual del estudio? 2. ¿El reporte describió adecuadamente las principales características de la teoría o modelo de manera que los lectores pudieran comprender las bases conceptuales del estudio? 3. ¿Es la teoría o el modelo apropiado para el problema de investigación? ¿El enlace supuesto entre el problema y el marco parece forzado? 4. ¿Se usó la teoría o el modelo para generar hipótesis o se utilizó como un marco de organización o interpretación? ¿Las hipótesis (si las hay) fluyen de manera natural desde el marco? 5. ¿Se definieron los conceptos de forma que fueran consistentes con la teoría? Si hubo una intervención, ¿los componentes de la intervención fueron consistentes con la teoría? 6. ¿El marco guió los métodos del estudio? Por ejemplo, ¿se usó la tradición de investigación apropiada si el estudio era cualitativo? Si era cuantitativo, ¿las definiciones operativas corresponden con las definiciones conceptuales? 7. ¿El investigador vinculó de nuevo los hallazgos del estudio con el marco al final del reporte? ¿Los hallazgos se interpretaron dentro del contexto del marco? ¿La discusión incorporó los elementos del marco? En un estudio cualitativo en el que se desarrolla la teoría fundamentada, es posible que no se proporcione suficiente información para refutar la teoría propuesta porque solo se presenta evidencia que la apoya. Sin embargo, puede valorarse si las conceptualizaciones son informativas y si la evidencia es convincente. En un estudio fenomenológico debe buscarse una 272 discusión de los fundamentos filosóficos del estudio, es decir, la filosofía de la fenomenología. Para los estudios cuantitativos, la primera tarea es comprobar si el estudio tiene un marco conceptual explícito. Si no se menciona una teoría, modelo o marco (y a menudo así es), debe considerarse si esta ausencia disminuye el valor del estudio. La investigación suele beneficiarse de un contexto conceptual explícito, pero algunos estudios son tan pragmáticos que la falta de una teoría no tiene efecto en su utilidad. Sin embargo, si el estudio incluye la prueba de una hipótesis o una intervención compleja, la ausencia de un marco formal sugiere imprecisión. Si el estudio tiene un marco explícito, puede reflexionarse acerca de si es apropiado. Es posible que no sea capaz de poner en duda el uso del investigador de una teoría particular, pero puede valorar si la relación entre el problema y la teoría es genuina. ¿El investigador presentó una justificación convincente para el marco usado? En los estudios cuantitativos, ¿las hipótesis fluyen de la teoría? ¿El investigador interpretó los hallazgos dentro del contexto del marco? Si la respuesta a tales preguntas es no, es probable que tenga bases para criticar el marco del estudio, aunque no pueda sugerir mane - ras de mejorar la base conceptual. En el recuadro 8-1 se ofrecen algunas sugerencias para evaluar la base conceptual de un estudio cuantitativo. TIP Algunos estudios sostienen relaciones teóricas que son forzadas. Lo más probable es que esto ocurra cuando los investigadores primero formulan el problema de investigación y más tarde encuentran un contexto teórico para ajustarlo. Un vínculo a posteriori de la teoría con una pregunta de investigación por lo regular es artificial. Si un problema de investigación en verdad está relacionado con un marco conceptual, el diseño del estudio, la medición de los constructos clave, y el análisis y la interpretación de los datos fluirán a partir de esa conceptualización. EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO 273 Esta sección presenta dos ejemplos de estudios que tienen fuertes vínculos teóricos. Lea los resúmenes y luego responda las preguntas de pensamiento crítico; de ser necesario, consulte el reporte de investigación completo. Los ejemplos 1 y 2 se encuentran en la sección interactiva Critical Thinking Activity del sitio web . Las preguntas de pensamiento crítico para los ejemplos 3 y 4 se basan en los estudios que aparecen en los apéndices A y B de este libro. Los comentarios en inglés de las autoras sobre estos ejercicios están en la sección Student Resources en . EJEMPLO 1: EL MODELO DE PROMOCIÓN DE LA SALUD EN UN ESTUDIO CUANTITATIVO Estudio. Los efectos de las habilidades para enfrentar situaciones entre los adolescentes con asma (Srof et al., 2012). Objetivo. El objetivo del estudio era evaluar los efectos de una intervención con base escolarizada (entrenamiento en habilidades para enfrentar situaciones [EHES]), para adolescentes con asma. Marco teórico. El MPS, mostrado en la figura 8-1, fue el marco guía para la intervención. Los autores notaron que en el MPS, varias nociones específicas del comportamiento (p. ej., barreras percibidas al comportamiento, autoeficacia percibida) influyen en el comportamiento promotor de la salud y son modificables mediante una intervención. En este estudio, el comportamiento general de interés era el autocontrol del asma. La intervención EHES fue una estrategia de cinco sesiones con un grupo pequeño diseñada para promover la solución de problemas, la modificación cognitiva-conductual y la resolución de conflictos con estrategias para mejorar la autoeficacia y reducir las barreras percibidas. Los investigadores postularon la hipótesis de que la participación en el EHES mejoraría los resultados en la autoeficacia del asma, la calidad de vida relacionada con el asma, el apoyo social y la velocidad máxima de flujo espiratorio. Método. En este estudio piloto 39 adolescentes con asma se asignaron al azar a uno de dos grupos: uno participó en la intervención y el otro no. Los investigadores recolectaron datos de los resultados de todos los participantes en dos puntos temporales: antes de iniciar la intervención y 6 semanas después. Hallazgos clave. Los adolescentes del grupo terapéutico tuvieron 274 calificaciones significativamente mayores al final del estudio en autoeficacia, calidad de vida relacionada con la actividad y apoyo social, en comparación con los del grupo control. Conclusiones. Los investigadores notaron que los efectos en la autoeficacia y el apoyo social de la intervención fueron consistentes con el MPS. Recomendaron que aunque los resultados fueron alentadores, sería útil replicar el estudio y una extensión para examinar de manera específica el comportamiento de autocontrol del asma. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 8-1 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: a. En el modelo mostrado en la figura 8-1, ¿qué factores predijeron los investigadores que modificarían la intervención, según la descripción abreviada en el texto? b. ¿Existe otro modelo o teoría descritos en este capítulo que pudiera haberse usado para estudiar el efecto de esta intervención? 3. Si los resultados de este estudio son válidos y generalizables, ¿cuáles podrían ser algunos de los usos que podrían darse a los hallazgos en la práctica clínica? EJEMPLO 2: UN ESTUDIO DE TEORÍA FUNDAMENTADA Estudio. Transición de paciente a sobreviviente en las sobrevivientes afroamericanas de cáncer mamario (Mollica y Nemeth, 2015) Objetivo. El objetivo del estudio era examinar la experiencia de las mujeres afroamericanas en su transición de paciente con cáncer mamario a sobreviviente al cáncer mamario. Marco teórico. Se eligió una estrategia de la teoría fundamentada porque los investigadores señalaron como objetivo “el descubrimiento de una teoría a partir de los datos obtenidos y analizados de manera sistemática” (p. 17). Los investigadores señalaron además el uso de la inducción que es inherente al enfoque de la teoría fundamentada: “Se usó una estrategia abierta exploratoria para identificar los conceptos recurrentes significativos mediante el análisis inductivo sistemático del contenido” (p. 17). Método. Los datos se obtuvieron en entrevistas con 15 mujeres 275 afroamericanas que habían completado el tratamiento para cáncer mamario primario entre 6 y 18 meses antes de las entrevistas. Las mujeres se inscribieron en centros comunitarios en dos ciudades estadounidenses y fueron entrevistadas por teléfono. Cada entrevista, que duró alrededor de 45 minutos, fue grabada para poder trascribirlas. El entrevistador hizo preguntas amplias sobre las experiencias de las mujeres después de su tratamiento para cáncer ma-mario. La inclusión y las entrevistas continuaron hasta que no se obtuvo información nueva; es decir, hasta que se alcanzó la saturación de datos. Hallazgos clave. Con base en su análisis de las entrevistas detalladas, los investigadores identificaron cuatro procesos principales: perseverar a través de las dificultades con el sustento de la fe, enfrentar problemas físicos persistentes, necesidad de guía anticipada después del tratamiento y considerar las necesidades emocionales tan importantes como las físicas. En la figura 8-2 se presenta un modelo esquemático de la teoría sustantiva. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 8-1 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿De qué manera fue distinto el uso de la teoría en el estudio de Mollica y Nemeth respecto al estudio anterior de Srof y sus colaboradores? b. Comente sobre la utilidad del modelo esquemático mostrado en la figura 8-2. 3. Si los resultados de este estudio son confiables, ¿cuáles podrían ser algunos de los usos que podrían tener los hallazgos en la práctica clínica? EJEMPLO 3: INVESTIGACIÓN CUANTITATIVA EN EL APÉNDICE A • Lea la introducción del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/ elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 8-1 respecto a este estudio. 2. Considere también la siguiente pregunta: ¿alguna de las teorías o 276 modelos descritos en este capítulo proporciona un contexto conceptual apropiado para este estudio? EJEMPLO 4: INVESTIGACIÓN CUALITATIVA EN EL APÉNDICE B • Lea la introducción del estudio de Beck y Watson (2010) (“Parto posterior a un parto traumático”) en el apéndice B de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 8-1 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿Cree que un modelo esquemático habría ayudado a presentar los hallazgos en este reporte? b. ¿Beck y Watson presentaron evidencia convincente para respaldar su uso de la filosofía de la fenomenología? ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Prominent Conceptual Models of Nursing Used by Nurse Researchers. Respuestas a los ejercicios de pensamiento crítico para los ejemplos 3 y 4. Recursos en Internet con sitios web útiles para el capítulo 8. Un artículo de investigación de una revista de Wolters Kluwer, el estudio de Mollica y Nemeth descrito como ejemplo 2 en la p. 133. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. 277 La investigación de alta calidad requiere integración conceptual, un aspecto para el cual se tiene una justificación teórica defendible para el estudio. Según la definición clásica, una teoría es una generalización abstracta que explica de manera sistemática las relaciones entre fenómenos. La teoría descriptiva detalla un fenómeno de forma minuciosa. Las grandes teorías (o macroteorías) intentan describir grandes segmentos de la experiencia humana. Las teorías de rango medio son específicas para ciertos fenómenos. Los conceptos también son elementos básicos de los modelos conceptuales, pero los conceptos no están relacionados con un orden lógico en un sistema deductivo. En la investigación, los objetivos de las teorías y los modelos son hacer que los hallazgos sean significativos, integrar el conocimiento en sistemas coherentes, estimular la investigación nueva y explicar los fenómenos y las relaciones entre estos. Los modelos esquemáticos (o mapas conceptuales) son representaciones gráficas de fenómenos y sus interrelaciones con símbolos o diagramas y uso mínimo de palabras. Un marco es el fundamento conceptual de un estudio, que incluye una justificación general y las definiciones conceptuales de los conceptos clave. En los estudios cualitativos, el marco por lo regular surge de distintas tradiciones de investigación. Se han usado varios modelos conceptuales en la investigación en enfermería. Los conceptos centrales de los modelos de enfermería son seres humanos, ambiente, salud y enfermería. Un ejemplo de modelo de enfermería usado por los investigadores en enfermería es el modelo de adaptación de Roy. Los modelos ajenos a la enfermería usados por investigadores en 278 enfermería (p. ej., la teoría cognitiva social de Bandura) se refieren como teorías prestadas; cuando se confirma la adecuación de las teorías prestadas para la investigación en enfermería, se convierten en teorías compartidas. En algunas tradiciones de investigación cualitativa (p. ej., la fenomenología), el investigador intenta suspender las teorías sustantivas anteriores de los fenómenos específicos en estudio, pero cada tradición tiene fundamentos teóricos extensos. Algunos investigadores cualitativos buscan desarrollar teorías fundamentadas, explicaciones derivadas de datos para explicar fenómenos en estudio mediante procesos inductivos. En el uso típico de la teoría, los investigadores ponen a prueba las hipótesis deducidas de una teoría existente. Una tendencia emergente es examinar las intervenciones basadas en teorías. Tanto en la investigación cuantitativa como en la cualitativa, los investigadores a veces usan una teoría o modelo como marco de organización o herramienta interpretativa. R E F E R E N C I A S PA R A E L C A P Í T U L O 1 Ajzen, I. (2005). Attitudes, personality, and behavior (2nd ed.). Berkshire, United Kingdom: Open University Press. *Alvarado-García, A., & Salazar Maya, Á. (2015). Adaptation to chronic benign pain in elderly adults. Investigación y Educación en Enfermería, 33, 128–137. Babler, E., & Strickland, C. (2015). Moving the journey towards independence: Adolescents transitioning to successful diabetes selfmanagement. Journal of Pediatric Nursing, 30, 648–660. Bandura, A. (2001). Social cognitive theory: An agentic perspective. Annual Review of Psychology, 52, 1–26. Beck, C. T. (2012). Exemplar: Teetering on the edge: A second grounded theory modification. In P. L. Munhall (Ed.), Nursing research: A qualitative perspective (5th ed., pp. 257–284). Sudbury, MA: Jones & Bartlett Learning. Becker, M. (1974). The health belief model and personal health behavior. Thorofare, NJ: Slack. Blumer, H. (1986). Symbolic interactionism: Perspective and method. Berkeley, CA: University of California Press. Cole, K. A., & Gaspar, P. (2015). Implementation of an epilepsy selfmanagement protocol. Journal of Neuroscience Nursing, 47, 3–9. 279 Cypress, B. S. (2016). Understanding uncertainty among critically ill patients in the intensive care unit using Mishel’s Theory of Uncertainty of Illness. Dimensions of Critical Care Nursing, 35, 42–49. Fawcett, J., & DeSanto-Madeya, S. (2013). Contemporary nursing knowledge: Analysis and evaluation of nursing models and theories (3rd ed.). Philadelphia, PA: F. A. Davis. Fetterman, D. M. (2010). Ethnography: Step-by-step (3rd ed.). Thousand Oaks, CA: Sage. *Hoffman, A., Brintnall, R., von Eye, A., Jones, L., Alderink, G., Patzelt, L., & Brown, J. (2014). A rehabilitation program for lung cancer patients during postthoracotomy chemotherapy. OncoTargets and Therapy, 7, 415– 423. *Jeihooni, A. K., Hidarnia, A., Kaveh, M., Hajizadeh, E., & Askari, A. (2015). Effects of an osteoporosis prevention program based on Health Belief Model among females. Nursing and Midwifery Studies, 4, e26731. Kolcaba, K. (2003). Comfort theory and practice: A vision for holistic health care and research. New York, NY: Springer Publishing. Lee, C., Szuck, B., & Lau, Y. (2016). Determinants of physical activity maintenance in breast cancer survivors after a community-based intervention. Oncology Nursing Forum, 43, 93–102. Lee, M. K., Yun, Y., Park, H., Lee, E., Jung, K., & Noh, D. (2014). A webbased self-management exercise and diet intervention for breast cancer survivors: Pilot randomized controlled trial. International Journal of Nursing Studies, 51, 1557–1567. Mishel, M. H. (1990). Reconceptualization of the uncertainty in illness theory. Image, 22(4), 256–262. **Mollica, M., & Nemeth, L. (2015). Transition from patient to survivor in African American breast cancer survivors. Cancer Nursing, 38, 16–22. Newham, J., Allan, C., Leahy-Warren, P., Carrick-Sen, D., & Alderdice, F. (2016). Intentions toward physical activity and resting behavior in pregnant women: Using the theory of planned behavior framework in a cross-sectional study. Birth, 43, 49–57. Newman, M. (1997). Evolution of the theory of health as expanding consciousness. Nursing Science Quarterly, 10, 22–25. Parse, R. R. (2014). The humanbecoming paradigm: A transformational worldview. Pittsburgh, PA: Discovery International. Pender, N. J., Murdaugh, C., & Parsons, M. A. (2015). Health promotion in nursing practice (7th ed.). Upper Saddle River, NJ: Prentice Hall. Prochaska, J. O., Redding, C. A., & Evers, K. E. (2002). The transtheoretical model and stages of changes. In K. Glanz, B. K. Rimer, & F. M. Lewis (Eds.). Health behavior and health education: Theory, research, and practice (pp. 99–120). San Francisco, CA: Jossey-Bass. Ramezani, M., Ahmadi, F., Mohammadi, E., & Kazemnejad, A. (2014). 280 Spiritual care in nursing: A concept analysis. International Nursing Review, 61, 211–219. Rogers, M. E. (1994). The science of unitary human beings: Current perspectives. Nursing Science Quarterly, 7, 33–35. Rosenstock, I., Strecher, V., & Becker, M. (1988). Social learning theory and the health belief model. Health Education Quarterly, 15, 175–183. Roy, C., & Andrews, H. (2009). The Roy adaptation model (3rd ed.). Upper Saddle River, NJ: Prentice Hall. Sandelowski, M. (1993). Theory unmasked: The uses and guises of theory in qualitative research. Research in Nursing & Health, 16, 213–218. Smith, D. M., Taylor, W., Whitworth, M., Roberts, S., Sibley, C., & Lavender, T. (2015). The feasibility phase of a community antenatal lifestyle programme [The Lifestyle Course (TLC)] for women with a body mass index (BMI) ≤ (greater than or equal to sign) 30 kg/m2. Midwifery, 31, 280–287. Srof, B., Velsor-Friedrich, B., & Penckofer, S. (2012). The effects of coping skills training among teens with asthma. Western Journal of Nursing Research, 34, 1043–1061. Walker, L., & Avant, K. (2011). Strategies for theory construction in nursing (5th ed.). Upper Saddle River, NJ: Prentice Hall. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 281 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Explicar las decisiones clave del diseño de investigación para un estudio cuantitativo. Explicar los conceptos de causalidad e identificar los criterios para las relaciones causales. Describir e identificar los diseños experimental, cuasi experimental y no experimental. Distinguir entre diseños transversal y longitudinal. Identificar y evaluar métodos alternativos para controlar las variables de confusión. Comprender diversas amenazas a la validez de los estudios cuantitativos. Evaluar un estudio cuantitativo en términos de su diseño de investigación y métodos para controlar las variables de confusión. Definir los términos nuevos del capítulo. Términos clave Amenaza de historia Amenaza de maduración Amenaza de mortalidad Amenaza de selección (autoselección) 282 Amenazas a la validez Casos perdidos Causa Cegamiento Correlación Cuasi experimento Datos postest Desgaste Diseño cruzado Diseño de casos y controles Diseño de cohorte Diseño de grupo de control no equivalente Diseño de investigación Diseño de serie temporal Diseño longitudinal Diseño pretest-postest Diseño prospectivo Diseño retrospectivo Diseño transversal Distribución aleatoria (asignación al azar) Efecto Equiparación Estudio controlado aleatorizado (ECA) Estudio no experimental Experimento Grupo de comparación Grupo control Grupo experimental Homogeneidad Intervención Investigación de correlación Investigación descriptiva Placebo Poder estadístico Validez Validez de constructo Validez de la conclusión estadística Validez externa Validez interna Para los estudios cuantitativos, ningún aspecto de los métodos de un 283 estudio tiene un mayor impacto en la validez de los resultados que el diseño del mismo, sobre todo si el objetivo de la investigación es explorar una causa. Este capítulo tiene información acerca de cómo pueden obtenerse conclusiones de aspectos clave de la calidad de la evidencia en un estudio cuantitativo. GENERALIDADES DEL DISEÑO DE INVESTIGACIÓN El diseño de investigación de un estudio señala las estrategias que los investigadores adoptan para responder sus preguntas y examinar sus hipótesis. Esta sección describe algunos aspectos básicos del diseño. Características clave del diseño de investigación La tabla 9-1 describe siete características clave que suelen considerarse en el diseño de un estudio cuantitativo. Las decisiones de diseño que deben tomar los investigadores incluyen las siguientes: ¿Habrá una intervención? Un aspecto básico del diseño es si los investigadores introducirán una intervención y probarán sus efectos: la diferencia entre la investigación experimental y no experimental. ¿Qué tipos de comparaciones se harán? Los investigadores cuantitativos por lo regular hacen comparaciones para establecer un contexto de interpretación. A veces las mismas personas se comparan en distintos puntos del tiempo (p. ej., antes de una operación vs. después de esta), pero con frecuencia se comparan personas diferentes (p. ej., los que reciben una intervención con los que no la reciben). ¿Cómo se controlarán las variables de confusión? En la investigación cuantitativa, a menudo se hacen esfuerzos para controlar los factores extraños a la pregunta de investigación. En este capítulo se estudian las técnicas para controlar las variables de confusión. ¿Se usará el cegamiento? Los investigadores deben decidir si la información relacionada con el estudio (p. ej., quién recibirá la intervención) se encubrirá a los recolectores de datos, los partici pantes del estudio o a otras personas para minimizar el riesgo de un sesgo de expectativa; es decir, el riesgo de que tal conocimiento 284 influya en los resultados del estudio. ¿Con qué frecuencia se recolectarán datos? A veces se recolectan datos de los participantes en un solo punto temporal (transversal), pero otros estudios implican múltiples puntos de recolección de datos (longitudinal). ¿Cuándo se medirán los “efectos” con respecto a las causas potenciales? Algunos estudios recolectan información sobre los resultados y luego hacen un examen retrospectivo en busca de las posibles causas. Otros estudios comienzan con una causa potencial y luego observan el desarrollo de los resultados, en forma prospectiva. ¿Dónde se realizará el estudio? Los datos de los estudios cuantitativos se recolectan en varias instituciones, como en hospitales o las casas de las personas. Otra decisión se refiere a cuántos sitios distintos se incluirán en el estudio, una decisión que podría afectar la posibilidad de generalizar los resultados. Muchas decisiones sobre el diseño son independientes de las otras. Por ejemplo, tanto los estudios experimentales como los no experimentales pueden comparar a distintas personas o a las mismas en diferentes momentos. Este capítulo describe las implicaciones de las decisiones sobre el diseño en el rigor del estudio. 285 TIP En un artículo de investigación, la información relacionada con el diseño de investigación suele aparecer al inicio de la sección acerca del método. Causalidad Muchas preguntas de investigación se refieren a causas y efectos. Por ejemplo, ¿girar a los pacientes reduce las úlceras por presión? ¿El ejercicio produce mejoras en la función cardiaca? La causalidad es un aspecto muy discutido, pero todos comprenden el concepto general de causa. Por ejemplo, se comprende que la falta de sueño causa fatiga y que la ingestión excesiva de calorías causa aumento de peso. La mayoría de los fenómenos tiene origen múltiple. Así, la ganancia ponderal puede ser reflejo de la ingestión calórica elevada o de otros factores. Las causas pocas veces son deterministas, solo aumentan la probabilidad de un efecto. Por ejemplo, el tabaquismo es causa del cáncer pulmonar, pero no todos los que fuman lo desarrollan y no todas las personas con cáncer pulmonar fumaron. Aunque puede ser fácil comprender a qué se refieren los investigadores cuando hablan de una causa, ¿qué es exactamente un efecto? Una manera de comprender un efecto es mediante la conceptualización de un contrafactual (Shadish et al., 2002). Un contrafactual es lo que ocurriría a las personas si se expusieran a una influencia causal y al mismo tiempo no se expusieran a esta. Un efecto representa la diferencia entre lo que ocurrió en realidad con la exposición y lo que habría sucedido sin ella. Está claro que un fenómeno contrafactual nunca puede producirse, pero es un buen modelo para tener presente cuando se piensa en un diseño de investigación. Tres criterios para establecer relaciones causales se atribuyen a John Stuart Mill. 1. Temporal: una causa debe preceder al efecto en el tiempo. Si se pone a prueba la hipótesis que sustenta que el tabaquismo causa cáncer pulmonar, es necesario demostrar que el cáncer ocurrió después de que comenzó el tabaquismo. 2. Relación: debe haber un vínculo entre la causa supuesta y el efecto. En el mismo ejemplo, debe demostrarse una relación entre el tabaquismo y el cáncer; es decir, que un mayor porcentaje de fumadores que de no fumadores desarrolla cáncer pulmonar. 286 3. Factores de confusión: la relación no puede explicarse como consecuencia de una tercera variable. Suponiendo que los fumadores tienden a vivir sobre todo en ambientes urbanos, entonces habría una posibilidad de que la relación entre el tabaquismo y el cáncer pulmonar refleje una conexión causal subyacente entre el ambiente y el cáncer pulmonar. Se han propuesto otros criterios para la causalidad. Un criterio importante en la investigación de la salud es la factibilidad biológica: la evidencia en estudios fisiológicos básicos de que es creíble una vía causal. Los investigadores que indagan relaciones causales deben proporcionar evidencia persuasiva sobre estos criterios mediante su diseño de investigación. Preguntas de investigación y diseño de investigación La investigación cuantitativa se usa para resolver diversos tipos de preguntas de investigación y diseños distintos son apropiados para preguntas diferentes. Este capítulo se enfoca sobre todo en diseños para preguntas de tratamiento, pronóstico, etiología/daño y descripción (las preguntas de significado requieren un enfoque cualitativo y se describen en el capítulo 11). Salvo por la descripción, las preguntas que requieren un enfoque cuantitativo casi siempre se refieren a relaciones causales: ¿Una intervención de asesoría telefónica para pacientes con cáncer prostático causa mejoras en su sufrimiento psicológico? (Pregunta de tratamiento.) ¿El peso al nacer menor de 1 500 g causa retrasos en el desarrollo de los niños? (Pregunta de pronóstico.) ¿El consumo de sal causa presión sanguínea elevada? (Pregunta de etiología/daño.) 287 Algunos diseños son mejores para revelar relaciones causa-efecto que otros. En particular, los diseños experimentales (estudios controlados aleatorizados o ECA) son los mejores posibles para aclarar las relaciones causales, pero no siempre es posible usar tales diseños. La tabla 9-2 resume una “jerarquía” de diseños para responder distintos tipos de preguntas causales y amplía la jerarquía de evidencia presentada en la figura 2-1 (véase el capítulo 2). DISEÑOS EXPERIMENTAL, CUASI EXPERIMENTAL Y NO EXPERIMENTAL Esta sección describe los diseños que difieren respecto a la presencia o ausencia de una intervención. Diseño experimental: estudios controlados aleatorizados Los primeros científicos entendieron que las complejidades que ocurren en la naturaleza pueden dificultar la comprensión de relaciones mediante la observación pura. Este problema se resolvió al aislar los fenómenos y controlar las condiciones en que ocurren. Tales procedimientos experimentales fueron adoptados por investigadores interesados en la fisiología y el comportamiento humanos. Características de los experimentos verdaderos Un experimento real o ECA se distingue por las siguientes propiedades: Intervención. El investigador hace algo a algunos participantes mediante la manipulación de la variable independiente. Control. El investigador introduce controles en el estudio, incluso diseña una aproximación a una situación contrafactual, por lo general un grupo control que no recibe la intervención. Distribución aleatoria. El investigador distribuye al azar a los participantes a la condición de control o experimental. Al introducir una intervención, los investigadores varían de manera consciente la variable independiente y luego observan su efecto en el resultado. Como ejemplo, suponiendo que se investiga el efecto de un masaje suave (I), comparado con la ausencia de masaje 288 (C), sobre el dolor (O) en residentes de asilos (P). Un diseño experimental para esta pregunta es un diseño pre-test-postest que implica la observación del resultado (intensidad del dolor) antes y después de la intervención. Los participantes en el grupo experimental reciben un masaje suave, mientras que los del grupo control no. Este diseño permite ver si los cambios en el dolor fueron causados por el masaje ya que solo algunas personas lo recibieron, lo que permite una comparación sustancial. En dicho ejemplo se cumple el primer criterio de un experimento verdadero al variar la aplicación del masaje, la variable independiente. El ejemplo también cumple el segundo requerimiento de los experimentos, el uso de un grupo control. Las inferencias sobre la causalidad requieren una comparación, pero no todas las comparaciones aportan evidencia igual de concluyente. Por ello, si se complementara la dieta de lactantes prematuros (P) con nutrimentos especiales (I) durante 2 semanas, su peso (O) al final de las 2 semanas no aportaría información alguna sobre la efectividad de la intervención. Como mínimo, sería necesario comparar el peso posterior al tratamiento con el peso anterior a este para ver si aumentó. No obstante, suponiendo que se encuentra un aumento ponderal promedio de medio kilogramo. ¿Este hallazgo respalda una inferencia de alguna conexión causal entre la intervención nutricional (la variable independiente) y el aumento de peso (el resultado)? No, ya que los lactantes normalmente ganan peso conforme maduran. Sin un grupo control, un grupo que no reciba los complementos (C), es imposible separar los efectos de la maduración de aquellos del tratamiento. El término grupo control se refiere a un grupo de participantes cuyo desempeño en un resultado se usa para evaluar el desempeño del grupo experimental (el grupo que recibe la intervención) en el mismo resultado. Los diseños experimentales también implican la distribución al azar de los participantes en grupos. Mediante la distribución aleatoria (también llamada asignación al azar), cada participante tiene la misma probabilidad de ser incluido en cualquier grupo. Si las personas se asignan al azar, no hay un sesgo sistemático en los grupos respecto a los atributos que pudieran afectar la variable dependiente. Se espera que los grupos asignados al azar sean comparables, en promedio, con respecto a un número infinito de rasgos biológicos, psicológicos y sociales al inicio del estudio. Por ello, las diferencias grupales en los resultados observados después de la distribución 289 aleatoria pueden inferirse como consecuencia de la intervención. La asignación aleatoria puede lograrse al lanzar una moneda al aire o sacar los nombres de un sombrero. Por lo general, los investigadores usan computadoras para realizar la distribución aleatoria. TIP Existe mucha confusión con respecto a la asignación aleatoria y el muestreo aleatorio. La asignación aleatoria es la firma de un diseño experimental (ECA). Si los sujetos no se distribuyen al azar a los grupos de intervención, el diseño no es un experimento real. En contraste, muestreo aleatorio se refiere a un método de selección de personas para un estudio, como se explica en el capítulo 10. El muestreo aleatorio no es una firma de un diseño experimental. En realidad, la mayoría de los ECA no incluye muestreo aleatorio. Diseños experimentales El diseño experimental más básico implica la asignación al azar de las personas a distintos grupos para luego medir los resultados. En ocasiones, este diseño se llama diseño postest únicamente. Un diseño usado con mayor frecuencia, descrito antes, es el diseño pretestpostest, en el que se recolectan datos pretest (por lo regular llamados datos basales) sobre el resultado antes de la intervención y datos postest (resultado) luego de la intervención. Ejemplo de diseño pretest-postest Berry y sus colaboradores (2015) evaluaron la efectividad de una intervención para control del peso posparto en mujeres con ingresos bajos. Las mujeres se distribuyeron al azar al grupo con intervención o al grupo control. Se recolectaron datos de peso, adiposidad y comportamientos de salud en la valoración basal y al final de la intervención. TIP Los diseños experimentales pueden ilustrarse de manera gráfica por medio de símbolos para representar sus características. El espacio no permite mostrar aquí esos diagramas, pero pueden verse muchos en el suplemento en inglés de este capítulo en . 290 Las personas que se distribuyen al azar a distintas condiciones casi siempre son diferentes. Por ejemplo, si se tratara de evaluar el efecto de la música en la inquietud (O) de pacientes con demencia (P), podría presentarse la música (I) a algunos pacientes, pero no a otros (C). En contraste, un diseño cruzado implica la exposición de las personas a más de un tratamiento. Estos estudios son experimentos verdaderos solo si las personas se asignan al azar a distintos órdenes del tratamiento. Por ejemplo, si se usara un diseño cruzado para comparar los efectos de la música en pacientes con demencia, algunos se asignarían al azar para recibir música primero, con un periodo posterior sin música, y otros no se expondrían a la música primero. En un estudio así se cumplen las tres condiciones para un experimento: hay intervención, distribución aleatoria y control, y los sujetos funcionan como su propio grupo control. Un diseño cruzado tiene la ventaja de asegurar la mayor equivalencia posible entre las personas expuestas a distintas condiciones. Sin embargo, en ocasiones estos diseños son inapropiados debido a los posibles efectos remanentes. Cuando los sujetos se exponen a dos tratamientos diferentes, es posible que en la segunda condición estén influidos por su experiencia en la primera. Sin embargo, cuando los efectos remanentes son imposibles, como cuando los efectos de la intervención son inmediatos y cortos, un diseño cruzado es poderoso. Ejemplo de un diseño cruzado DiLibero y sus colaboradores (2015) usaron un diseño cruzado para evaluar si la suspensión o la continuación de la alimentación enteral durante el cambio de posición de los pacientes afectaba la incidencia de aspiración. Los pacientes se asignaron al azar a distintos órdenes de la terapia con alimentación enteral. Condiciones experimentales y de control Para hacer una evaluación justa de una intervención, los investigadores necesitan diseñar una que tenga intensidad y duración suficientes para que sea razonable esperar efectos en el resultado. Los investigadores describen la intervención en protocolos formales que estipulan con exactitud cuál es el tratamiento. Los investigadores hacen elecciones sobre qué usar como la condición de control y la decisión afecta la interpretación de los hallazgos. Entre las condiciones de control posibles están las siguientes: 291 “Atención usual”. Se usan los procedimientos estándar o normales para tratar a los pacientes. Un tratamiento alternativo (p. ej., música vs. masaje). Un placebo o intervención falsa sin un valor terapéutico supuesto. Una condición de control con atención (el grupo control recibe atención, pero no los ingredientes activos de la intervención). Tratamiento tardío; es decir, los integrantes del grupo control se mantienen en lista de espera y se exponen a la intervención más adelante. Ejemplo de un grupo control en lista de espera Song y Lindquist (2015) evaluaron la efectividad de una intervención basada en la concientización para reducir el estrés, la ansiedad y la depresión en estudiantes de enfermería en Corea. Los estudiantes se distribuyeron al azar al grupo de intervención o a un grupo control en lista de espera. Desde el punto de vista ético, el diseño de tratamiento tardío es atractivo, pero no siempre es posible. La evaluación de dos intervenciones alternativas también resulta atractiva desde el punto de vista ético, pero el riesgo es que los resultados no sean concluyentes porque quizá sea difícil detectar los efectos distintos de dos tratamientos adecuados. Los investigadores también deben considerar las posibilidades para el cegamiento. Muchas intervenciones de enfermería no se prestan con facilidad a este. Por ejemplo, si la intervención fuera un programa para la eliminación del tabaquismo, los participantes sabrían si reciben la intervención y el profesional que realizara la intervención sabría quién está en el programa. Sin embargo, por lo general es posible y conveniente ocultar el grupo de participantes a las personas que recolectan los datos de resultados. Ejemplo de un experimento con cegamiento (o doble ciego) Kundu y sus colaboradores (2014) estudiaron el efecto de la terapia Reiki en el dolor posoperatorio de niños que se sometían a procedimientos dentales. Los participantes del estudio desconocían el tratamiento: los que estaban en el grupo control recibieron una terapia Reiki falsa. Quienes registraron las calificaciones de dolor de los niños, los profesionales de enfermería que los atendían y los padres también desconocían las asignaciones a los grupos. TIP El término doble ciego se usa mucho cuando más de un grupo 292 desconoce quién recibe la intervención (p. ej., los participantes o los que realizan la intervención). Sin embargo, este término se emplea cada vez menos por su ambigüedad, ahora se favorece la especificación exacta de quién estaba cegado respecto a la intervención y quién no. Ventajas y desventajas de los experimentos Los ECA son el “estándar de referencia” para los estudios con intervención (preguntas de tratamiento) porque aportan la evidencia más concluyente sobre los efectos de una intervención. Mediante la distribución aleatoria en los grupos, los investigadores se aproximan lo más posible a la situación contrafactual “ideal”. La mayor fortaleza de los experimentos radica en la confianza con la que pueden inferirse las relaciones causales. Mediante los controles impuestos con la intervención, la comparación y –sobre todo– la distribución aleatoria, por lo regular pueden descartarse las explicaciones alternativas. Por esta razón, los metaanálisis de ECA, que integran evidencia de múltiples estudios experimentales, ocupan el pináculo de las jerarquías de evidencia para preguntas relativas a las causas (fig. 2-1 del capítulo 2). A pesar de las ventajas de los experimentos, tienen limitaciones. Primera, muchas variables interesantes no son susceptibles a la intervención. Una gran cantidad de rasgos humanos, como la enfermedad o los hábitos de salud, no pueden asignarse al azar. Esa es la razón por la que los ECA no están en la cúspide de la jerarquía de las preguntas de pronóstico (tabla 9-2), que se refieren a las consecuencias de los problemas de salud. Por ejemplo, los lactantes no podrían asignarse al azar a tener fibrosis quística para ver si esta enfermedad causa un ajuste psicosocial deficiente. Segunda, muchas variables podrían modificarse de manera experimental desde el punto de vista técnico, pero no ético. Por ejemplo, no se han realizado ECA para evaluar el efecto del tabaquismo en el cáncer pulmonar. Un estudio así requeriría que las personas fueran asignadas al azar a un grupo fumador (personas forzadas a fumar) o a un grupo no fumador (personas con prohibición de fumar). Así pues, aunque desde el punto de vista técnico los ECA están en la cumbre de la jerarquía de las preguntas de etiología/daño (tabla 9-2), muchas preguntas de etiología no pueden responderse con un diseño experimental. En ocasiones, los ECA no son factibles por aspectos prácticos. Por 293 ejemplo, sería imposible asegurar una aprobación administrativa para distribuir al azar a las personas a grupos. En resumen, los diseños experimentales tienen algunas limitaciones que restringen su uso para algunos problemas de la vida real; no obstante, los ECA tienen una clara superioridad sobre otros diseños para poner a prueba las hipótesis causales. TIP CÓMO SABER ¿Cómo puede saberse si un estudio es experimental? Los investigadores casi siempre indican en sus reportes, en la sección acerca del método, que usaron un diseño experimental o aleatorizado. Si no se incluyen tales términos, puede concluirse que un estudio es experimental si el artículo de investigación dice que el objetivo del estudio era evaluar los efectos de una intervención Y si los participantes se distribuyeron en grupos de manera aleatoria. Cuasi experimentos Los cuasi experimentos (llamados estudios sin distribución aleatoria en la bibliografía médica) también incluyen una intervención, pero los diseños cuasi experimentales carecen de asignación al azar, la firma de un experimento real. A algunos cuasi experimentos incluso les falta un grupo control. La firma del diseño cuasi experimental es la implementación y prueba de una intervención sin distribución aleatoria. Diseños cuasi experimentales Un diseño cuasi experimental usado con frecuencia es el diseño pretestpostest con grupo control no equivalente, que implica la comparación de dos o más grupos de personas antes y después de llevar a cabo una intervención. Por ejemplo, supóngase que se desea estudiar el efecto de una intervención de practicar yoga en silla (I) sobre la calidad de vida (O) en personas de edad avanzada (P). La intervención se ofrece a todos en un centro comunitario para adultos mayores y la distribución aleatoria no es posible. Con fines comparativos se recolectan datos de resultados en un centro para adultos mayores diferente en el que no se instituye la intervención (C). Se obtienen datos de la calidad de vida (CdV) de ambos grupos en la valoración basal y 10 semanas después. El diseño cuasi experimental es idéntico a un diseño experimental pretest-postest, excepto que las personas no se distribuyen al azar en grupos. El diseño cuasi experimental es más débil porque, sin la 294 distribución aleatoria, no puede asumirse que los grupos experimental y de comparación son equivalentes al principio. No obstante, este diseño es fuerte porque los datos basales permiten valorar si los ancianos de los dos centros tenían calificaciones promedio similares de CdV antes de la intervención. Si los grupos son comparables en la valoración basal, podría tenerse una confianza relativa al inferir que las diferencias postest en la CdV son resultado de la intervención de yoga. Sin embargo, si las calificaciones de CdV son distintas al principio, las diferencias posteriores a la intervención son más difíciles de interpretar. Nótese que en los cuasi experimentos, a veces se usa el término grupo de comparación en lugar de grupo control para referirse al grupo contra el cual se evalúan los resultados del grupo terapéutico. Supóngase ahora que no fue posible obtener datos basales. Este diseño (postest únicamente con grupo control no equivalente) tiene un defecto difícil de remediar. No se cuenta con información sobre la equivalencia inicial. Si la CdV del grupo experimental es más alta que la del grupo control postest, ¿puede concluirse que la intervención causó la mejora en la CdV? Podría haber otras explicaciones para las diferencias. En particular, la CdV en los dos centros pudo haber sido diferente desde el inicio. La característica distintiva de los cuasi experimentos sólidos es el esfuerzo para introducir algunos controles, como las mediciones basales. Ejemplo de un diseño de grupo control no equivalente Hsu y sus colaboradores (2015) usaron un diseño pretest-postest con grupo control no equivalente para evaluar el efecto de un currículo de atención en línea para mejorar el comportamiento de atención de profesionales de enfermería. Los profesionales de enfermería de un hospital recibieron la intervención, mientras que los de otro hospital no la recibieron. Se recolectaron datos de los comportamientos de atención de los profesionales de enfermería de ambos grupos antes y después de la intervención. Algunos cuasi experimentos no incluyen distribución aleatoria ni un grupo de comparación. Supóngase que un hospital implementó equipos de respuesta rápida (ERR) en sus unidades de cuidados intensivos y quería conocer los efectos en los resultados de los pacientes (p. ej., mortalidad). Para los fines de este ejemplo, se asume que ningún otro hospital sería una buena comparación, por lo que la única comparación posible es el contraste de antes y después. Si los ERR se implementaron en enero, podría compararse la tasa de mortalidad, por ejemplo, durante los 3 meses 295 anteriores a los ERR con la tasa de mortalidad de los 3 meses subsiguientes. Este diseño pretest-postest de un grupo parece lógico, pero tiene debilidades. ¿Qué ocurre si uno de los periodos de 3 meses es atípico, al margen de los ERR? ¿Qué pasa con el efecto de otros cambios instituidos durante el mismo periodo? ¿Qué hay en relación con los efectos de factores externos, como la morbilidad estacional? El diseño en cuestión no ofrece una manera de controlar estos factores. Sin embargo, el diseño podría modificarse de tal modo que pudieran descartarse algunas explicaciones alternativas a los cambios en la mortalidad. Por ejemplo, el diseño de serie temporal implica la recolección de datos durante un periodo prolongado con introducción del tratamiento durante ese periodo. El estudio mencionado podría diseñarse con cuatro observaciones antes de introducir los ERR (p. ej., datos de mortalidad de cuatro trimestres del año anterior) y cuatro observaciones posteriores a los ERR (mortalidad en los siguientes cuatro trimestres). Aunque un diseño de serie temporal no elimina todos los problemas de interpretación, la perspectiva de un tiempo prolongado fortalece la capacidad para atribuir las mejoras a la intervención. Ejemplo de un diseño de serie temporal Burston y sus colaboradores (2015) usaron un diseño de serie temporal para estudiar el efecto de una iniciativa de “cuidado transformador” en dos resultados de los pacientes: caídas de pacientes internados y úlceras por presión adquiridas en el hospital. La muestra estuvo formada por pacientes que salieron de unidades quirúrgicas de un hospital para atención aguda en un periodo de 29 meses. Ventajas y desventajas de los cuasi experimentos Una de las fortalezas de los cuasi experimentos es su carácter práctico. La investigación en enfermería suele realizarse en sitios naturales, donde es difícil suministrar un tratamiento innovador de manera aleatoria a algunas personas pero no a otras. Los diseños cuasi experimentales sólidos introducen cierto control de la investigación cuando no es posible mantener el rigor experimental pleno. Otro problema es que las personas no siempre están dispuestas a ser distribuidas al azar. Como los diseños cuasi experimentales no implican una asignación aleatoria, es probable que sean aceptables para más 296 personas. Esto, a su vez, tiene implicaciones para la generalizabilidad de los resultados, pero el problema es que los resultados son menos concluyentes. La principal desventaja de los cuasi experimentos es que las inferencias causales no pueden hacerse con tanta facilidad como con los ECA. Las explicaciones alternativas para los resultados abundan con los cuasi experimentos. Por ejemplo, supóngase que se administró una dieta especial a un grupo de residentes delicados de un asilo para valorar su efecto en la ganancia de peso. Si se usa un grupo control no equivalente y luego se observa un aumento de peso, debe preguntarse: ¿es factible que algún otro factor causara el incremento? ¿Es posible que las diferencias anteriores al tratamiento entre los grupos con intervención y de comparación produjeran la ganancia diferencial? ¿Es probable que hubiera un aumento promedio de peso solo porque los más delicados murieron o fueron trasladados a un hospital? Si la respuesta a cualquiera de estas hipótesis rivales es sí, las inferencias sobre el efecto causal de la intervención se debilitan. Con los cuasi experimentos, casi siempre existe al menos una explicación factible. TIP CÓMO SABER ¿Cómo puede decirse si un estudio es cuasi experimental? Los investigadores no siempre identifican sus diseños como cuasi experimentales. Si en un estudio se pone a prueba una intervención y si el reporte no menciona de manera explícita una asignación al azar, probablemente se puede concluir que el diseño es cuasi experimental. Estudios no experimentales Muchas preguntas de investigación que exploran la causa no pueden responderse con un ECA o un cuasi experimento. Por ejemplo, considérese esta pregunta de pronóstico: ¿el peso al nacer menor de 1 500 g causa retrasos del desarrollo en los niños? Está claro que no puede manipularse el peso al nacer, la variable independiente. Cuando los investigadores no intervienen mediante el control de la variable independiente, el estudio es no experimental o, en la bibliografía médica, observacional. Existen varias razones para hacer un estudio no experimental, incluidas situaciones en las que no es posible manipular la variable independiente (preguntas de pronóstico) o en las que no sería ético manipular la variable independiente (algunas preguntas de etiología). Los diseños experimentales tampoco son apropiados para preguntas descriptivas. 297 Tipos de estudios no experimentales/observacionales Cuando los investigadores estudian el efecto de una causa que no pueden manipular, realizan una investigación de correlación para examinar las relaciones entre las variables. Una correlación es un vínculo entre dos variables; es decir, una tendencia del cambio en una variable a relacionarse con el cambio en otra (p. ej., talla y peso de las personas). Pueden detectarse correlaciones mediante análisis estadísticos. Es riesgoso inferir relaciones causales en la investigación de correlación. En los ECA, los investigadores predicen que la variación deliberada de la variable independiente generará un cambio en la variable de resultado. En la investigación de correlación, los investigadores no controlan la variable independiente, que por lo regular ya ocurrió. Un famoso dicho sobre la investigación es relevante: la correlación no prueba la causalidad. La mera existencia de un vínculo entre las variables no es suficiente para concluir que una variable causó la otra, incluso si la relación es fuerte. Los estudios de correlación son más débiles que los ECA para preguntas que exploran las causas, pero los diversos diseños ofrecen grados variables de evidencia de apoyo. El diseño más sólido para preguntas de pronóstico y para preguntas de etiología cuando es imposible la distribución aleatoria es un diseño de cohorte (tabla 9-2). Los estudios observacionales con un diseño de cohorte (también llamado diseño prospectivo) inician con una supuesta causa y luego avanzan al supuesto efecto. Por ejemplo, en estudios prospectivos de cáncer pulmonar, los investigadores comienzan con una cohorte de adultos (P) que incluye fumadores (I) y no fumadores (C), y luego comparan la incidencia poste rior de cáncer pulmonar (O) en los dos grupos. Ejemplo de un diseño de cohorte (prospectivo) Giurgescu y sus colaboradores (2015) estudiaron una relación entre los niveles de síntomas de depresión en mujeres afroamericanas durante el embarazo y los resultados del parto, como el peso del bebé al nacer y la incidencia de parto prematuro. TIP Los estudios experimentales son inherentemente prospectivos porque el investigador establece la intervención y luego examina su efecto. En los estudios de correlación con diseño retrospectivo, un efecto 298 observado en el presente se relaciona con una posible causa ocurrida en el pasado. Por ejemplo, en una investigación retrospectiva de cáncer pulmonar, los investigadores empiezan con algunas personas que tienen cáncer pulmonar y otras que no, y luego buscan diferencias en los comportamientos o condiciones precedentes, como los hábitos de tabaquismo. Un estudio así emplea un diseño de casos y controles; es decir, los casos con una cierta condición como cáncer pulmonar se comparan con los controles sin esta. Cuando se diseña un estudio de casos y controles, los investigadores intentan identificar controles lo más semejantes posibles a los casos con respecto a las variables de confusión (p. ej., edad, género). Sin embargo, la dificultad es que los dos grupos casi nunca son comparables con respecto a todos los factores que influyen en el resultado. Ejemplo de un diseño de casos y controles Delmore y sus colaboradores (2015) realizaron un estudio de los factores de riesgo relacionados con las úlceras por presión en los talones de pacientes hospitalizados. Los individuos con úlceras por presión desarrolladas en el hospital se compararon con otros sin úlceras en términos de las características del paciente (p. ej., inmovilidad o presencia de enfermedad vascular). Los estudios prospectivos son más costosos, pero más sólidos, que los retrospectivos. Para empezar, cualquier ambigüedad sobre la secuencia temporal de los fenómenos está resuelta en la investigación prospectiva (p. ej., se sabe que el tabaquismo precede al cáncer pulmonar). Además, es más probable que las muestras sean representativas de fumadores y no fumadores. Una segunda clase amplia de estudios no experimentales es la investigación descriptiva. El propósito de los estudios descriptivos es observar, describir y documentar aspectos de una situación. Por ejemplo, un investigador podría intentar descubrir el porcentaje de adolescentes que fuma; es decir, la prevalencia de ciertos comportamientos. En ocasiones, un diseño de estudio es descriptivo de correlación, lo que significa que los investigadores buscan describir relaciones entre las variables, sin inferir relaciones causales. Por ejemplo, los investigadores podrían estar interesados en describir la relación entre la fatiga y el sufrimiento fisiológico en pacientes con VIH. En tales situaciones es apropiado un diseño descriptivo no experimental. 299 Ejemplo de un estudio descriptivo de correlación Cullum y sus colaboradores (2016) realizaron un estudio descriptivo de correlación en adolescentes con diabetes tipo 2 para examinar las relaciones entre los síntomas de depresión, el apoyo social percibido y los meses transcurridos desde el diagnóstico. TIP Para las preguntas descriptivas, el diseño más sólido es un estudio no experimental que se base en el muestreo aleatorio de los participantes. El muestreo aleatorio se describe en el capítulo 10. Ventajas y desventajas de la investigación no experimental La principal desventaja de los estudios no experimentales es que no aportan evidencia concluyente de las inferencias causales. Esto no es un problema cuando el objetivo es la descripción, pero los estudios de correlación por lo regular se realizan para descubrir las causas. Sin embargo, los estudios de correlación son susceptibles a la interpretación incorrecta porque los grupos que se comparan se forman por autoselección. Un investigador que realiza un estudio de correlación no puede asumir que los grupos que se comparan eran similares antes de que ocurriera la variable independiente. Como ejemplo de tales problemas de interpretación, supongamos que se estudian las diferencias en la depresión (O) de pacientes con cáncer (P) que tienen o carecen de apoyo social adecuado (I y C) y que se encuentra una correlación; es decir, que los pacientes sin apoyo social estaban más deprimidos que aquellos con apoyo social. Podría interpretarse que esto significa que el estado emocional de los pacientes se modifica según la calidad de su apoyo social, como se muestra en el diagrama de la figura 91A. Sin embargo, existen interpretaciones alternativas. Quizá una tercera variable influya en ambos, el apoyo social y la depresión, como el hecho de que los pacientes estén casados. El contar con un cónyuge puede influir en la depresión de los pacientes y en la calidad de su apoyo social (fig. 91B). Una tercera posibilidad es la causalidad invertida (fig. 9-1C). Es posible que los pacientes con cáncer deprimidos tengan mayor dificultad para obtener apoyo social que los pacientes animados. En esta interpretación, la depresión de la persona causa la cantidad de apoyo social recibido, no a la inversa. El punto es que los resultados de correlación deben interpretarse con cautela. 300 Figura 9-1. Explicaciones alternativas para la correlación entre depresión y apoyo social en pacientes con cáncer. TIP Prepárese para pensar de manera crítica cuando un investigador afirme que estu - dia los “efectos” de una variable en otra en un estudio no experimental. Por ejemplo, si el título del reporte fuera “Los efectos de los trastornos de la alimentación en la depresión”, el estu dio sería no experimental (es decir, los participantes no se distribuyen al azar a un trastorno de la alimentación). En esta situación podría preguntarse: ¿el trastorno de la alimentación tiene un efecto en la depresión o la depresión tuvo un efecto en los patrones de alimentación? o ¿una tercera variable (p. ej., el maltrato infantil) tuvo efecto en ambos? Sin embargo, los estudios no experimentales tienen un papel relevante en la enfermería porque muchos problemas interesantes no se prestan a la intervención. Un ejemplo es si el tabaquismo causa cáncer pulmonar. A pesar de la ausencia de cualquier ECA en seres humanos, pocas personas dudan de que exista esta relación causal. Hay mucha evidencia de una relación entre el tabaquismo y el cáncer pulmonar, y los estudios prospectivos muestran que el tabaquismo precede al cáncer pulmonar. En muchas réplicas, los investigadores han podido controlar, y por lo tanto descartar, otras posibles “causas” del cáncer pulmonar. La investigación de correlación es una forma eficiente de recolectar 301 grandes cantidades de datos sobre un problema. Por ejemplo, sería posible obtener información de los problemas de salud y los hábitos alimentarios de las personas. Los investigadores podrían examinar entonces cuáles problemas se relacionan con los patrones de alimentación. Al hacerlo podrían descubrirse muchas relaciones en poco tiempo. En contraste, un investigador revisa solo unas cuantas variables en cada ocasión. Así, un ECA podría controlar el colesterol, mientras que en otro se controla la proteína. Con frecuencia es necesario el trabajo no experimental antes de poder justificar las intervenciones. LA DIMENSIÓN TEMPORAL EN EL DISEÑO DE INVESTIGACIÓN Los diseños de investigación incorporan decisiones acerca de cuándo y con qué frecuencia se recolectarán datos, y los estudios pueden clasificarse en términos de cómo consideran el tiempo. La principal diferencia radica entre los diseños transversal y longitudinal. Diseños transversales En los diseños transversales, los datos se obtienen en un punto temporal. Por ejemplo, el investigador podría estudiar si los síntomas psicológicos en mujeres menopáusicas se relacionan al mismo tiempo con síntomas fisiológicos. Por lo general, los estudios retrospectivos son transversales: los datos de las variables independiente y de resultado se recolectan al mismo tiempo (p. ej., estado de cáncer pulmonar y hábitos de tabaquismo en los participantes), pero la variable independiente casi siempre se refiere a eventos o comportamientos ocurridos en el pasado. Los diseños transversales pueden usarse para estudiar fenómenos relacionados con el tiempo, pero son menos concluyentes que los diseños longitudinales. Suponiendo que se estudian los cambios en las actividades de promoción de la salud en niños de 8 a 10 años de edad. Una manera de investigarlos sería entrevistar a los niños a los 8 años de edad y luego 2 años más tarde, cuando tuvieran 10 años de edad: un diseño longitudinal. También podría cuestionarse a dos grupos de niños de 8 y 10 años de edad, en un solo punto en el tiempo y luego comparar las respuestas: un diseño transversal. Si los niños de 10 años de edad participaran en más actividades para promover la salud que los de 8 años, podría inferirse que los niños toman decisiones más saludables conforme crecen. Para hacer 302 esta inferencia tendría que asumirse que los niños mayores habrían respondido como lo hicieron los más jóvenes si se les hubiera cuestionado 2 años antes o, por el contrario, que los niños de 8 años informarían más prácticas para promover la salud si se les cuestionara 2 años después. Los diseños transversales son económicos, pero generan problemas para inferir cambios con el paso del tiempo. La magnitud del cambio social y tecnológico que caracteriza a la sociedad pone en duda la suposición de que las diferencias en los comportamientos o características de distintos grupos de edad son resultado del paso del tiempo y no de diferencias en las cohortes. Ejemplo de un estudio transversal Brito y sus colaboradores (2105) estudiaron la relación entre la discapacidad funcional y factores demográficos, incluida la edad, en los adultos mayores. Se compararon tres grupos de edad: los de 60 a 69 años, los de 70 a 79 años y los de 80 años o más. Diseños longitudinales Los diseños longitudinales incluyen la recolección de datos múltiples veces durante un periodo prolongado. Estos diseños son útiles para estudiar cambios con el tiempo y para establecer la secuencia de fenómenos, que es un criterio para inferir la causalidad. En la investigación de enfermería, los estudios longitudinales por lo regular son estudios de seguimiento de una población clínica, que se realizan para valorar el estado subsiguiente de las personas con una condición especificada o que recibieron una intervención. Por ejemplo, podría seguirse a los pacientes que se sometieron a una intervención para eliminar el tabaquismo con el fin de valorar la efectividad de largo plazo. Un ejemplo no experimental sería dar seguimiento a muestras de lactantes prematuros para valorar su desarrollo motor subsiguiente. Ejemplo de un estudio de seguimiento Pien y sus colaboradores (2015) examinaron la calidad de vida entre 96 individuos suicidas que fueron vigilados hasta 3 meses después de un intento de suicidio. En los estudios longitudinales, los investigadores deben decidir el 303 número de puntos de recolección de datos y los intervalos temporales entre ellos. Cuando el cambio es rápido, es probable que se requieran múltiples puntos de recolección de datos a intervalos relativamente cortos para comprender las transiciones. Sin embargo, por convención el término longitudinal implica múltiples puntos de recolección de datos durante un periodo prolongado. Una dificultad de los estudios es la pérdida de participantes (casos perdidos o desgaste) con el tiempo. Los casos perdidos son problemáticos porque los que abandonan el estudio casi siempre difieren de maneras importantes de los que continúan su participación, lo que genera posibles sesgos y problemas para la generalizabilidad. TIP No todos los estudios longitudinales son prospectivos porque en ocasiones la variable independiente ocurrió incluso antes de la primera recolección de datos y no todos los estudios prospectivos son longitudinales en el sentido clásico. Por ejemplo, un estudio experimental que recolecta datos 1, 2 y 4 horas después de una intervención sería pros-pectivo, pero no longitudinal (es decir, no se recolectan datos por un periodo prolongado). TÉCNICAS DE CONTROL DE LA INVESTIGACIÓN Un objetivo importante del diseño de investigación en los estudios cuantitativos es maximizar el control de los investigadores sobre las variables de confusión. Es necesario controlar dos categorías amplias de factores de confusión: las intrínsecas a los participantes y las situacionales. Control del contexto del estudio Los factores externos, como el contexto de la investigación, pueden afectar los resultados. En la investigación cuantitativa bien controlada se toman medidas para alcanzar la constancia de condiciones, de modo que los investigadores puedan confiar en que los resultados reflejan el efecto de la variable independiente y no del contexto del estudio. Los investigadores no pueden controlar por completo los contextos del estudio, pero tienen muchas oportunidades. Por ejemplo, el cegamiento es una forma de controlar los sesgos. Al mantener a los recolectores de datos y otros implicados sin conocer la asignación del grupo, los investigadores 304 minimizan el riesgo de que otras personas implicadas en el estudio influyan en los resultados. La mayoría de los estudios cuantitativos también estandariza sus comunicaciones con los participantes. Con frecuencia se preparan guiones formales para informar a los participantes el objetivo y los métodos del estudio. En los estudios con intervención, los investigadores desarrollan protocolos de intervención formal. Los investigadores cuidadosos ponen atención en la fidelidad de la intervención; es decir, vigilan si una intervención se aplica fielmente de acuerdo con el plan y si en realidad se recibió el tratamiento planeado. Ejemplo de atención a la fidelidad de la intervención McCarthy y sus colaboradores (2015) describieron sus esfuerzos para vigilar la fidelidad de la intervención; esta última consistía en la implementación de una consultoría para realizar ejercicio que utilizó una entrevista motivacional. Entre otros aspectos, los investigadores examinaron si los consultores usaban de manera constante la entrevista motivacional. Control de los factores del participante Los resultados de interés para los investigadores en enfermería se modifican por docenas de atributos, la mayoría irrelevante para la pregunta de investigación. Por ejemplo, suponiendo que se investigan los efectos de un programa de acondicionamiento físico en la actividad de residentes de asilos. En este estudio, variables como edad, género y antecedente de tabaquismo de los participantes serían las variables de confusión; es probable que cada una se relacione con la variable de resultado (actividad física), al margen del programa. En otras palabras, los efectos que estas variables tienen en el resultado son ajenos al estudio. En esta sección se revisan las estrategias que los investigadores pueden usar para controlar las variables de confusión. Distribución aleatoria La distribución aleatoria es el modo más efectivo de controlar las características de los pacientes. Una ventaja crucial de la asignación aleatoria, comparada con otras estrategias de control, es que controla todas las posibles fuentes de variación ajena, sin una decisión consciente acerca de cuáles variables deben controlarse. En el ejemplo de la intervención de acondicionamiento físico, la asignación aleatoria de los adultos mayores a 305 un grupo con intervención o uno de control generaría grupos comparables en términos de edad, género, antecedentes de tabaquismo y docenas de otras características que podrían influir en el resultado. La distribución aleatoria en distintos órdenes terapéuticos en un diseño cruzado es muy poderosa: los participantes sirven como sus propios controles, lo que controla todas las características de confusión. Homogeneidad Cuando no es posible la distribución aleatoria, pueden usarse otros métodos para controlar características ajenas. Una alternativa es la homogeneidad, en la que solo se incluyen en el estudio las personas similares con respecto a las variables de confusión. En el ejemplo de acondicionamiento físico, si el género fuera una variable de confusión, se incluiría solo a hombres (o mujeres) como participantes. Si la edad se considerara un factor de confusión, la participación se limitaría a un intervalo de edad específico. El empleo de una muestra homogénea es sencillo, pero un problema es que su generalizabilidad es limitada. Ejemplo de control mediante la homogeneidad Bowles y sus colaboradores (2014) usaron un diseño cuasi experimental para examinar el efecto que tiene el apoyo al planear la decisión del egreso en el tiempo que pasa hasta el reingreso entre pacientes hospitalizados de edad avanzada. Se controlaron diversas variables mediante la homogeneidad, incluida la edad (todos de 55 años o más), condición (ninguno se sometía a diálisis) e ingreso (ninguno provenía de alguna institución). Equiparación Un tercer método para controlar las variables de confusión es la equiparación, que implica la formación deliberada de grupos comparables. Por ejemplo, supóngase que se inicia con un grupo de residentes de asilos que aceptan participar en el programa de acondicionamiento físico. Podría crearse un grupo de comparación de residentes no participantes mediante la equiparación de los participantes con base en variables de confusión importantes (p. ej., edad y género). Este procedimiento genera grupos similares respecto a variables de confusión específicas. La equiparación se usa a menudo para formar grupos comparables en los diseños de casos y controles. 306 Sin embargo, la equiparación tiene algunas limitaciones. Para lograr la concordancia efectiva, los investigadores deben saber cuáles son los factores de confusión relevantes. Además, después de dos o tres variables se vuelve difícil obtener la concordancia. Suponiendo que se desea controlar edad, gé-nero y duración de la estancia en el asilo. En esta situación, si un participante en el programa era una mujer de 80 años de edad que había estado en el asilo por 5 años, habría que buscar otra mujer con estas características como su contraparte para el grupo de comparación. Con más de tres variables, la equiparación puede ser imposible. Por ello, este es un método de control que se utiliza sobre todo cuando no es posible recurrir a procedimientos más poderosos. Ejemplo de control por equiparación Stavrinos y sus colaboradores (2015) compararon a adolescentes con y sin trastorno por déficit de atención/hiperactividad (TDAH) en términos de la tendencia a la distracción mien-tras conducían, la cual se evaluó en un simulador mientras se comunicaban por un teléfono móvil o por mensajes de texto. Los grupos con y sin TDAH estaban equiparados por género, grupo étnico y meses de experiencia como conductores. Control estadístico Los investigadores también pueden controlar variables de confusión por medios estadísticos. Los métodos de control estadístico son complejos, por lo que no se intentará la descripción detallada de los mecanismos de control estadísticos importantes, como el análisis de covarianza. Sin embargo, debe reconocerse que los investigadores en enfermería usan cada vez más las técnicas estadísticas para controlar variables de confusión. En el capítulo 14 se presenta una breve descripción de los métodos de control estadístico. Evaluación de los métodos de control La asignación aleatoria es la estrategia más efectiva para controlar variables de confusión porque tiende a controlar la variación individual en todos estos. Los diseños transversales son muy poderosos, pero no pueden usarse en muchas situaciones por la posibilidad de efectos remanentes. Las alternativas descritas aquí comparten dos desventajas. Primera, los investigadores deben decidir por anticipado qué variables controlar. Para seleccionar muestras homogéneas, equiparar o usar el control estadístico, 307 los investigadores tienen que identificar cuáles variables controlar. Segunda, estos métodos solo controlan las características especificadas y dejan otras sin controlar. Aunque la distribución aleatoria es una herramienta excelente, no siempre es factible. Es mejor usar la equiparación o el control estadístico que ignorar el problema de las variables de confusión. CARACTERÍSTICAS DE UN BUEN DISEÑO Una pregunta crucial para hacer la crítica de un estudio cuantitativo es si el diseño de investigación aportó evidencia válida. Cuatro preguntas clave sobre el diseño de la investigación, sobre todo en estudios que exploran la causa, son las siguientes: 1. ¿Qué tan sólida es la evidencia de que en realidad existe una relación entre las variables? 2. Si existe una relación, ¿cuál es la solidez de la evidencia de que la variable independiente (p. ej., una intervención), y no otros factores, fue la causa del resultado? 3. ¿Cuál es la solidez de la evidencia de que las relaciones observadas son generalizables entre personas, instituciones y tiempo? 4. ¿Cuáles son los constructos teóricos subyacentes a las variables del estudio? ¿Se capturaron de manera adecuada esos constructos? Estas preguntas corresponden respectivamente a cuatro aspectos de la validez de un estudio: (1) validez de la conclusión estadística, (2) validez interna, (3) validez externa y (4) validez de constructo (Shadish et al., 2002). Validez de la conclusión estadística Como se indicó antes, un criterio para establecer la causalidad es una relación demostrada entre la variable independiente y la dependiente. Las pruebas estadísticas se usan para respaldar las inferencias sobre la existencia de tal relación. Aquí se señalan unas cuantas amenazas que pueden afectar la validez de la conclusión estadística de un estudio. El poder estadístico –la capacidad para detectar relaciones verdaderas– afecta la validez de la conclusión estadística. La manera más directa de alcanzar el poder estadístico es utilizar una muestra de tamaño suficiente. Con muestras pequeñas, es posible que los análisis no evidencien que la 308 variable independiente y el resultado están relacionados, incluso si lo están. El poder y el tamaño de la muestra se describen en el capítulo 10. Los investigadores también pueden aumentar el poder si incrementan las diferencias en las variables independientes (es decir, si hacen la causa poderosa) para maximizar las diferencias en el resultado (el efecto). Si los grupos o tratamientos no son muy diferentes, es posible que el análisis estadístico no sea lo bastante sensible para detectar los efectos que en verdad existen. La fidelidad de la intervención puede mejorar el poder de una intervención. Por lo tanto, si se realiza la crítica de un estudio en el que los resultados de los grupos que se comparan no tienen diferencias significativas, existe la posibilidad de que el estudio tenga poca validez de conclusión estadística. Es probable que el reporte señale indicios de esta posibilidad (p. ej., muestra demasiado pequeña o desgaste sustancial) que debe tomarse en cuenta al interpretar el significado de los resultados. Validez interna La validez interna es el grado en el que puede inferirse que la variable independiente causa el resultado. Los ECA tienden a tener alta validez interna porque la distribución aleatoria permite a los investigadores descartar las explicaciones alternativas para las diferencias entre los grupos. Con los cuasi experimentos y los estudios de correlación existen explicaciones alternativas acerca de lo que causa el resultado, que también se llaman amenazas a la validez interna. Las jerarquías de evidencia ordenan los diseños de estudios según su validez interna. Amenazas a la validez interna Ambigüedad temporal En una relación causal, la causa precede al efecto. En los ECA, los investigadores crean la variable independiente y luego observan el resultado, por lo que nunca hay problema para establecer una secuencia temporal. Sin embargo, en los estudios de correlación, sobre todo los que tienen un diseño transversal, quizá no quede claro si la variable independiente precedió a la variable dependiente o viceversa, como se ilustra en la figura 9-1. Selección 309 La amenaza de selección (autoselección) refleja sesgos derivados de diferencias preexistentes entre los grupos. Cuando las personas no se asignan al azar a los grupos, los grupos que se comparan no son equivalentes; las diferencias grupales en el resultado pueden deberse a factores ajenos, no a la variable independiente. El sesgo por selección es la amenaza más grande a la validez interna de los estudios que no emplean un diseño experimental, pero puede corregirse en parte con las estrategias de control descritas en la sección anterior. Historia La amenaza de historia es la presencia de eventos concurrentes con la variable independiente que pueden afectar el resultado. Por ejemplo, supóngase que se estudia la efectividad de un programa en un centro para adultos mayores que alienta la vacunación contra influenza entre los ancianos. Supóngase ahora que se informa sobre una epidemia de influenza en los medios nacionales casi al mismo tiempo. La variable de resultado, el número de vacunas contra influenza aplicadas, está influida al menos por dos fuerzas y sería difícil diferenciar los dos efectos. En los ECA, la historia no suele ser una amenaza porque es tan probable que haya eventos externos en un grupo aleatoriza - do como en el otro. Los diseños con mayor probabilidad de alterarse por la historia son los pretest y postest y los diseños de serie temporal. Maduración La amenaza de maduración surge de procesos que ocurren como resultado del tiempo (p. ej., crecimiento, fatiga) y no de la variable independiente. Por ejemplo, si se estudia el efecto de una inter-vención en niños con retraso del desarrollo, el diseño tendría que considerar el hecho de que habría progreso sin intervención. La maduración no se refiere solo a los cambios del desarrollo, también a cualquier cambio que tenga lugar en función del tiempo. Fenómenos como la cicatrización de heridas o la recuperación posoperatoria se producen con poca intervención, por lo que la maduración puede ser una explicación alternativa para los resultados favorables posteriores al tratamiento si el diseño no incluye un grupo comparativo. Los diseños pretest y postest son muy vulnerables a la amenaza por maduración. Mortalidad/desgaste 310 La amenaza de mortalidad surge del desgaste (o casos perdidos) en los grupos que se comparan. Si distintos tipos de personas permanecen en el estudio en un grupo con respecto al otro, estas diferencias, y no la variable independiente, podrían explicar las diferencias en los resultados entre los grupos. Es posible que los pacientes más graves abandonen una condición experimental porque es demasiado demandante, por ejemplo. En esencia el sesgo por desgaste es un sesgo de selección que ocurre cuando el estudio evoluciona: los grupos equivalentes al inicio pueden perder comparabilidad por el desgaste, y la composición diferencial –más que la variable independiente– podría ser la “causa” de cualquier diferencia en los resultados entre los grupos. TIP Si el desgaste es aleatorio (es decir, los que abandonan el estudio son similares a los que permanecen en este), no se genera un sesgo. Sin embargo, el desgaste rara vez es aleatorio. En general, mientras mayor sea la tasa de desgaste, mayor es el riesgo de sesgo. Los sesgos suelen ser preocupantes si la tasa rebasa 10 a 15%. Validez interna y diseño de investigación Los estudios cuasi experimentales y de correlación son muy susceptibles a las amenazas a la validez interna. Estas amenazas compiten con la variable independiente como causa del resultado. El objetivo de un buen diseño de investigación cuantitativa es descartar estas explicaciones alternativas. Los mecanismos de control descritos antes son estrategias para mejorar la validez interna y por lo tanto fortalecer la calidad de la evidencia que generan los estudios. Aunque no siempre, por lo regular un diseño experimental elimina las explicaciones alternativas. La mortalidad experimental es una amenaza sobresaliente. Como los investigadores hacen distintas cosas con los grupos, es posible que los integrantes abandonen el estudio por distintas razones. Esto es más probable si la intervención es estresante o requiere mucho tiempo, o si la condición de control es aburrida o decepcionante. Los participantes que permanecen en un estudio pueden diferir de los que lo abandonan, lo que anula la equivalencia inicial de los grupos. Debe considerarse con cuidado las explicaciones alternativas a los resultados del estudio, sobre todo en aquellos que no son ECA. Cuando los investigadores no tienen el control sobre las variables de confusión cruciales, es conveniente ser cauteloso al establecer conclusiones acerca de la evidencia. 311 Validez externa Validez externa se refiere a las inferencias sobre el hecho de que las relaciones observadas en los participantes del estudio sean verdaderas para distintas personas e instituciones. La validez externa es fundamental para la práctica basada en evidencia porque es importante generalizar la evidencia de situaciones de investigación controladas a la práctica en la vida real. Las preguntas de validez externa pueden asumir diversas formas. Podría preguntarse si las relaciones observadas en una muestra de estudio pueden generalizarse a una población más grande; por ejemplo, si los resultados sobre las tasas de depresión posparto en una cuidad del noroeste de un país pueden generalizarse a madres de toda la región noreste. Por lo tanto, un aspecto de la validez externa de un estudio es el muestreo. Si la muestra es representativa de la población, la generalización de los resultados a la población es más segura (capítulo 10). Otras preguntas de validez externa se refieren a la generalización a distintos tipos de personas, instituciones o situaciones. Por ejemplo, ¿los hallazgos sobre un tratamiento para reducir el dolor en Noruega pueden generalizarse a las personas de Estados Unidos? Por lo regular se requieren nuevos estudios para responder preguntas relacionadas con la generalizabilidad. Un concepto importante en tal aspecto es la replicación. Los estudios en varios sitios son sólidos porque la generalizabilidad de los resultados se incrementa si los resultados se replicaron en varios centros, sobre todo si estos difieren en aspectos importantes (como el tamaño). En estudios con una muestra diversa de participantes, los investigadores pueden valorar si los resultados se replican en varios subgrupos; por ejemplo, si una intervención beneficia a los hombres y a las mujeres. Las revisiones sistemáticas son una ayuda crucial para la validez externa, justo porque exploran la consistencia en los resultados con base en réplicas en tiempo, espacio, personas e instituciones. Las demandas de validez interna y externa pueden estar en conflicto. Si un investigador ejerce un control estricto para maximizar la validez interna, es posible que la situación se vuelva demasiado artificial para generalizar a ambientes más naturales. Con frecuencia es necesario hacer concesiones. Validez de constructo La investigación implica constructos. Los investigadores conducen un 312 estudio con ejemplares específicos de tratamientos, resultados, instituciones y personas, pero todos estos son sustitutos de constructos más amplios. La validez de constructo implica inferencias de aspectos particulares del estudio a los constructos de orden más alto a los que representan. Si los estudios contienen errores de constructo, la evidencia podría ser engañosa. Un aspecto de la validez de constructo se refiere al grado en que la intervención es una buena representación del constructo que en la teoría se consideró con capacidad para producir resultados provechosos. La falta de cegamiento puede ser una amenaza a la validez de constructo: ¿es una intervención, o la consciencia de la intervención, lo que produjo los beneficios? Otro aspecto es saber si las mediciones de las variables de investigación son formas operativas adecuadas de los constructos. Este aspecto de la validez de constructo se explica en el capítulo 10. CRÍTICA DE DISEÑOS DE INVESTIGACIÓN CUANTITATIVA Una pregunta evaluadora clave es si el diseño de investigación permitió a los investigadores obtener respuestas adecuadas a la pregunta de investigación. Esta interrogante tiene facetas sustantivas y metodológicas. Desde el punto de vista sustantivo, el problema es si el diseño concuerda con los objetivos de la investigación. Si el propósito de la investigación es descriptivo o exploratorio, un diseño experimental no resulta adecuado. Si el investigador busca comprender la naturaleza integral de un fenómeno del que se sabe poco, un diseño estructurado que permite poca flexibilidad podría bloquear la información (los diseños flexibles se estudian en el capítulo 11). El control de la investigación se explicó como una estrategia para reducir los sesgos, pero un control excesivo puede introducir sesgos; por ejemplo, cuando un investigador controla de manera rígida la forma en que pueden manifestarse los fenómenos en estudio, con lo que oscurece su naturaleza real. Desde el punto de vista metodológico, el principal problema del diseño en los estudios cuantitativos es si el diseño de investigación proporciona la evidencia más válida, imparcial e interpretable posible. En realidad no suele haber otro aspecto de un estudio cuantitativo que afecte tanto la calidad de la evidencia como el diseño de investigación. El recuadro 9-1 señala preguntas que le ayudarán a evaluar los diseños de investigación. 313 Recuadro 9-1 Lineamientos para la crítica del diseño de investigación en un estudio cuantitativo 1. ¿El diseño fue experimental, cuasi experimental o no experimental? ¿Qué diseño específico se usó? ¿Fue un estudio para explorar la causa? Dado el tipo de pregunta (de tratamiento, pronóstico, etc.), ¿se usó el diseño más riguroso posible? 2. ¿Qué tipo de comparación requería el diseño de investigación? ¿La estrategia de comparación fue efectiva para esclarecer relaciones clave? 3. Si el estudio incluía una intervención, ¿se describieron de manera adecuada la inter-vención y las condiciones del control? ¿Se recurrió al cegamiento? De ser así, ¿a quién se le ocultó información? En caso negativo, ¿existe una buena razón para no recurrir al cegamiento? 4. Si el estudio fue no experimental, ¿por qué el investigador optó por no intervenir? Si el estudio exploraba la causa, ¿qué criterios para inferir la causalidad se pusieron en riesgo? ¿Se utilizó un diseño retrospectivo o prospectivo y fue adecuado tal diseño? 5. ¿El estudio fue longitudinal o transversal? ¿Fueron adecuados el número y el momento de la recolección de datos? 6. ¿Qué hicieron los investigadores para controlar las características de confusión de los participantes? ¿Fueron efectivos esos procedimientos? ¿Cuáles son las amenazas a la validez interna del estudio? ¿El diseño permitió al investigador hacer inferencias causales sobre la relación entre la variable independiente y el resultado? 7. ¿Cuáles son las principales limitaciones del diseño usado? ¿Las limitaciones fueron reconocidas por el investigador y tomadas en cuenta para interpretar los resultados? ¿Qué puede decirse de la validez externa del estudio? EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO Esta sección presenta ejemplos de estudios con distintos diseños de investigación. Lea estos resúmenes y luego responda las preguntas de pensamiento crítico; consulte el reporte de investigación completo de ser necesario. Los ejemplos 1 y 2 se presentan en la sección Interactive Critical Thinking Activity del sitio web . Las preguntas de 314 pensamiento crítico para el ejemplo 3 se basan en el estudio que aparece en el apéndice A de este libro. Los comentarios en inglés de las autoras sobre estos ejercicios están en la sección Student Resources en . EJEMPLO 1: UN ESTUDIO CRUZADO CONTROLADO Estudio. Crema de hidrocortisona para reducir el dolor perineal después de parto vaginal: un estudio controlado aleatorizado (Manfre et al., 2015). Objetivo. El objetivo del estudio era evaluar si la aplicación de hidrocortisona en crema reduce el dolor perineal en el periodo posparto inmediato. Diseño y condiciones del tratamiento. Los investigadores usaron un diseño cruzado aleatorizado en el que las participantes recibieron tres métodos diferentes para controlar el dolor en tres tratamientos secuenciales después del parto: dos cremas tópicas (corticoesteroides y placebo) y un tratamiento de control (sin aplicación de crema). La crema placebo era una crema similar basada en alcohol cetílico. Método. Una muestra de 29 madres que parieron por vía vaginal se distribuyó al azar a distintos órdenes de las tres condiciones. El tamaño de la muestra se basó en un análisis realizado para asegurar el poder estadístico adecuado. Primero se pidió a las madres que calificaran el dolor en las 2 horas siguientes al ingreso a la unidad de posparto. Después de la calificación, el investigador aplicó el primer tratamiento asignado al azar en un apósito con hamamelis aplicado sobre el perineo. Las participantes calificaron el dolor de nuevo 30 a 60 minutos después. Luego de la aplicación inicial, el proceso se repitió cada 6 horas para el segundo y tercer tratamientos perineales asignados al azar. La variable dependiente fue el cambio en la intensidad de dolor perineal antes y 30 a 60 minutos después de la aplicación del tratamiento. Tanto las participantes como los investigadores desconocían el tipo de crema: un farmacéutico preparó los tratamientos del estudio y los empacó en tubos estériles. Se incluyó un total de 29 participantes en el estudio y 27 completaron todos los tratamientos en un periodo de 12 horas. Hallazgos clave. Se observó una reducción significativa del dolor después de la aplicación de ambas cremas tópicas. La aplicación de cremas de hidrocortisona o placebo produjo un alivio del dolor significativamente mejor que la ausencia de crema. El descenso promedio del dolor fue similar en los dos grupos con crema, 6.7 puntos con la crema placebo y 4.8 con la crema de hidrocortisona. Ejercicios de pensamiento crítico 315 1. Responda las siguientes preguntas relevantes del recuadro 9-1 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿Podría haberse usado un diseño de tres grupos (es decir, tres grupos distintos de madres) en este estudio? b. ¿Cuál es una posible razón por la que se observó efectividad comparable de ambas cremas para reducir el dolor? 3. Si los resultados de este estudio son válidos, ¿cuáles son algunos de los usos a los que podrían aplicarse los hallazgos en la práctica clínica? EJEMPLO 2: UN DISEÑO CUASI EXPERIMENTAL Estudio. Un estudio para promover el amamantamiento en el área metropolitana de Helsinki en Finlandia (Hannula et al., 2014). Objetivo. El objetivo del estudio era probar el efecto de un apoyo intensificado para la lactancia materna durante el periodo perinatal en el comportamiento de amamantamiento de las mujeres en Finlandia. Grupos terapéuticos. A las mujeres del grupo con intervención se les ofreció un servicio gratuito no comercial en línea que proporcionaba apoyo intensificado sobre temas de parentalidad, cuidado infantil y amamantamiento desde la 20ª semana de gestación hasta que el lactante tenía 1 año de edad. Las madres fueron atendidas por personal con entrenamiento especializado que también proporcionó apoyo individualizado. Las mujeres del grupo de comparación recibieron la atención usual de profesionales en partería y enfermería. Método. El estudio se condujo en tres hospitales públicos de maternidad en Helsinki. Como no era posible la distribución aleatoria, dos de los hospitales implementaron los servicios de apoyo intensificado y el tercero funcionó como control. Se incluyeron en el grupo de intervención mujeres con 18 a 21 semanas de gestación si se esperaba el nacimiento de un solo feto. En total, 705 mujeres participaron en el estudio, 431 en el grupo con intervención y 274 en el grupo de comparación. Las participantes en el estudio completaron cuestionarios al salir del hospital o poco después. El resultado primario en el estudio fue si la madre alimentó a su hijo solo por amamantamiento en el hospital. Los resultados secundarios incluyeron la confianza de las madres para amamantar, las actitudes ante el amamantamiento y la capacidad para afrontar el amamantamiento. Hallazgos clave. Las integrantes de los grupos con intervención y de comparación tenían características demográficas similares en algunos respectos (p. ej., educación, estado civil), pero se encontraron varias diferencias en los grupos antes de la intervención. Por ejemplo, las pacientes del grupo con intervención tuvieron mayor probabilidad de ser primíparas y de haber 316 participado en capacitación sobre la crianza que las mujeres del grupo de comparación. Para corregir este problema por sesgo de selección, estas características se controlaron con recursos estadísticos. Las mujeres del grupo con intervención tuvieron una probabilidad mucho mayor de alimentar a su hijo solo por amamantamiento al momento del seguimiento (76%) que las mujeres del grupo de comparación (66%). Los autores concluyeron que el apoyo intensivo ayudaba a las madres a alimentar a sus hijos de manera exclusiva por amamantamiento. Ejercicios de pensamiento crítico 1. Responda las siguientes preguntas relevantes del recuadro 9-1 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿Este estudio es prospectivo o retrospectivo? b. ¿Qué otros diseños cuasi experimentales podrían haberse empleado en este estudio? 3. Si los resultados de este estudio son válidos, ¿cuáles son algunos de los usos que podrían darse a los hallazgos en la práctica clínica? EJEMPLO 3: INVESTIGACIÓN CUANTITATIVA EN EL APÉNDICE A • Lea la sección de métodos del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 9-1 para este estudio. 2. Sugiera modificaciones al diseño de este estudio que podrían mejorar su validez externa. ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Selected Experimental and Quasi-Experimental Designs: Diagrams, Uses, and Drawbacks. 317 Respuestas a los ejercicios de pensamiento crítico para el ejemplo 3. Recursos en Internet con sitios web útiles para el capítulo 9. Un artículo de investigación de una revista de Wolters Kluwer, el estudio de Manfre et al. descrito en el ejemplo 1 de la p. 156. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. El diseño de investigación es el plan general para responder las preguntas de investigación. En los estudios cuantitativos, el diseño señala si existe una intervención, la naturaleza de cualquier comparación, los métodos para controlar las variables de confusión, si se recurrirá al cegamiento y el momento y la localización de la recolección de datos. Las preguntas de tratamiento, pronóstico y etiología exploran las causas y existe una jerarquía de diseños con el fin de obtener la mejor evidencia para estas preguntas. Los criterios clave para inferir la causalidad incluyen los siguientes: (1) una causa (variable independiente) debe preceder a un efecto (resultado), (2) debe haber una relación detectable entre una causa y un efecto, y (3) la relación entre los dos no refleja la influencia de una tercera variable (de confusión). Un fenómeno contrafactual es lo que habría ocurrido a las mismas personas si al mismo tiempo se expusieran y no se expusieran a un factor causal. El efecto es la diferencia entre ambos. Un buen diseño de investigación para preguntas que exploran la causa incluye el hallazgo de una aproximación apropiada al contrafactual idealizado. Los experimentos (o estudios controlados aleatorizados [ECA]) implican una intervención (el investigador manipula la variable independiente al introducir una intervención), un control (al incluir el 318 uso de un grupo control que no recibe la intervención) y una distribución aleatoria/asignación al azar (con participantes distribuidos a los grupos experimental y de control de forma aleatoria para que los grupos sean comparables al inicio). Los ECA se consideran el estándar de referencia porque se aproximan más que cualquier otro diseño a los criterios para inferir relaciones causales. En los diseños pretest y postest, los datos se recolectan antes de la intervención (en la valoración basal) y después de esta. En los diseños cruzados, las personas se exponen a más de una condición experimental en orden aleatorio y sirven como sus propios controles. Los diseños cruzados son inadecuados si existe un riesgo de efectos remanentes. El grupo control puede someterse a varias condiciones, incluido un tratamiento alternativo, un placebo o intervención falsa, el tratamiento estándar (“cuidado usual”) o una condición de lista de espera (tratamiento tardío). Los cuasi experimentos (estudios sin aleatorización) implican una intervención pero sin grupo comparativo ni distribución aleatoria. Los diseños cuasi experimentales sólidos introducen El diseño pretest-postest con grupo control no equivalente incluye un grupo de comparación que no se generó por distribución aleatoria y la recolección de datos previos al tratamiento de ambos grupos para valorar la equivalencia inicial entre estos. En un diseño de serie temporal, los datos del resultado se recolectan durante un periodo previo y posterior a la intervención, casi siempre de un solo grupo. Los estudios no experimentales (observacionales) incluyen investigación descriptiva –estudios que resumen el estado de los fenómenos– y estudios de correlación, que examinan relaciones entre las variables pero no incluyen intervención. En los diseños prospectivos (de cohorte), los investigadores comienzan con una posible causa y luego recolectan datos sobre los resultados. Los diseños retrospectivos (diseños de casos y controles) incluyen la recolección de datos sobre un resultado en el presente y luego 319 examinan el pasado en busca de posibles causas. El hacer inferencias causales en los estudios de correlación es riesgoso; un dicho en la investigación básica es que la correlación no prueba la causalidad. Los diseños transversales implican la recolección de datos en un punto temporal, mientras que los diseños longitudinales requieren recolección de datos en dos o más momentos durante un periodo prolongado. En la enfermería, los estudios longitudinales por lo regular son estudios de seguimiento de poblaciones clínicas. Los estudios longitudinales casi siempre son costosos, requieren mucho tiempo y están sujetos al riesgo de desgaste (pérdida de participantes con el tiempo), pero aportan información valiosa de fenómenos relacionados con la temporalidad. Los investigadores cuantitativos se esfuerzan por controlar los factores externos que podrían afectar los resultados del estudio y las características del sujeto que son ajenas a la pregunta de investigación. Los investigadores delinean la intervención en protocolos formales que estipulan exactamente cuál es el tratamiento. Los investigadores cuidadosos cuidan la fidelidad de la intervención: que la intervención se implemente de manera apropiada y que en realidad se reciba. Las técnicas para controlar las características del sujeto incluyen homogeneidad (restringir los participantes para disminuir la variabilidad en las variables de confusión), equiparación (formación deliberada de grupos comparables respecto a algunas variables ajenas), procedimientos estadísticos y distribución aleatoria; esta última es el método más efectivo porque controla todas las posibles variables de confusión sin que los investigadores tengan que identificarlas. La validez del estudio se refiere al grado en el que pueden hacerse inferencias apropiadas. Las amenazas a la validez son razones por las que una inferencia podría estar equivocada. Una función clave del diseño de investigación cuantitativa es descartar las amenazas a la validez. Validez de la conclusión estadística se refiere a la fuerza de la evidencia de que existe una relación entre dos variables. Una amenaza a la validez de la conclusión estadística es un poder estadístico (la capacidad para detectar relaciones verdaderas entre las variables) bajo. 320 Validez interna se refiere a las inferencias de que los resultados fueron causados por la variable independiente, no por factores ajenos. Las amenazas a la validez interna incluyen ambigüedad temporal (incertidumbre acerca de si la causa supuesta precedió al resultado), selección (diferencias preexistentes en el grupo), historia (eventos externos que podrían afectar los resultados), maduración (cambios debidos al paso del tiempo) y mortalidad (efectos atribuibles al desgaste). Validez externa se refiere a inferencias sobre la generalizabilidad: si los hallazgos son verdaderos a pesar de las variaciones en las personas, condiciones e instituciones. REFERENCIAS DEL CAPÍTULO 9 Berry, D., Verbiest, S., Hall, E., Dawson, I., Norton, D., Willis, S., ... Stuebe, A. (2015). A postpartum community-based weight management intervention designed for low-income women: Feasibility and initial efficacy testing. Journal of National Black Nurses’ Association, 26, 29–39. *Bowles, K., Hanlon, A., Holland, D., Potashnik, S., & Topaz, M. (2014). Impact of discharge planning decision support on time to readmission among older adult medical patients. Professional Case Management, 19, 29–38. *Brito, K., de Menezes, T., & de Olinda, R. (2015). Functional disability and socioeconomic and demographic factors in elderly. Revista Brasileira de Enfermagem, 68, 548–555. Burston, S., Chaboyer, W., Gillespie, B., & Carroll, R. (2015). The effect of a transforming care initiative on patient outcomes in acute surgical units: A time series study. Journal of Advanced Nursing, 71, 417–429. Cullum, K., Howland, L., & Instone, S. (2016). Depressive symptoms and social support in adolescents with type 2 diabetes. Journal of Pediatric Health Care, 30, 57–64. Delmore, B., Lebovits, S., Suggs, B., Rolnitzky, L., & Ayello, E. (2015). Risk factors associated with heel pressure ulcers in hospitalized patients. Journal of Wound, Ostomy, and Continence Nursing, 42, 242–248. DiLibero, J., Lavieri, M., O’Donoghue, S., & DeSanto-Madeya, S. (2015). Withholding or continuing enteral feedings during repositioning and the incidence of aspiration. American Journal of Critical Care, 24, 258–261. Giurgescu, C., Engeland, C., & Templin, T. (2015). Symptoms of depression predict negative birth outcomes in African American women: A pilot study. Journal of Midwifery & Women’s Health, 60, 570–577. Hannula, L. S., Kaunonen, M., & Puukka, P. (2014). A study to promote breast feeding in the Helsinki Metropolitan area in Finland. Midwifery, 30, 696–704. 321 Hsu, T., Chiang-Hanisko, L., Lee-Hsieh, J., Lee, G., Turton, M., & Tseng, Y. (2015). Effectiveness of an online caring curriculum in enhancing nurses’ caring behavior. Journal of Continuing Education in Nursing, 46, 416–424. *Kundu, A., Lin, Y., Oron, A., & Doorenbos, A. (2014). Reiki therapy for postoperative oral pain in pediatric patients: Pilot data from a double-blind, randomized clinical trial. Complementary Therapies in Clinical Practice, 20, 21–25. **Manfre, M., Adams, D., Callahan, G., Gould, P., Lang, S., McCubbins, H., ... Chulay, M. (2015). Hydrocortisone cream to reduce perineal pain after vaginal birth: A randomized controlled trial. MCN: The American Journal of Maternal/Child Nursing, 40, 306–312. McCarthy, M., Dickson, V., Katz, S., Sciacca, K., & Chyun, D. (2015). Process evaluation of an exercise counseling intervention using motivational interviewing. Applied Nursing Research, 28, 156–162. Pien, F., Chang, Y., Feng, H., Hung, P., Huang, S., & Tzeng, W. (2015). Changes in quality of life after a suicide attempt. Western Journal of Nursing Research, 38(6), 721–737. Shadish, W. R., Cook, T. D., & Campbell, D. T. (2002). Experimental and quasiexperimental designs for generalized causal inference. Boston, MA: Houghton Mifflin. Song, Y., & Lindquist, R. (2015). Effects of mindfulness-based stress reduction on depression, anxiety, stress and mindfulness in Korean nursing students. Nurse Education Today, 35, 86–90. *Stavrinos, D., Garner, A., Franklin, C., Johnson, H., Welburn, S., Griffin, R., ... Fine, P. (2015). Distracted driving in teens with and without attentiondeficit/hyperactivity disorder. Journal of Pediatric Nursing, 30, e183–e191. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en 322 para este capítulo. Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Distinguir entre las muestras no probabilística y probabilística, y comparar sus ventajas y desventajas. Identificar y describir varios tipos de diseños de muestreo en estudios cuantitativos. Evaluar si el método de muestreo y el tamaño de la muestra usados en un estudio son adecuados. Identificar fenómenos que se prestan al autorreporte, la observación y la medición fisiológica. Describir varias estrategias para recolectar datos de autorreporte (p. ej., entrevistas, cuestionarios, escalas compuestas). Describir métodos para recolectar y registrar datos de observación. Describir las principales características y ventajas de las mediciones fisiológicas. Hacer la crítica de las decisiones del investigador con respecto al plan de recolección de datos. Describir los enfoques para valorar la confiabilidad y la validez de las mediciones. Definir los términos nuevos del capítulo. Términos clave Análisis de poder Autorreporte Confiabilidad Confiabilidad entre calificadores Confiabilidad test-retest 323 Consistencia interna Criterios de elegibilidad Cuestionario Escala Escala análoga visual Escala de calificación Escala de Likert Esquema de entrevista Estratos Lista de verificación Medición Medición biofisiológica Muestra Muestreo aleatorio estratificado Muestreo aleatorio simple Muestreo consecutivo Muestreo intencional Muestreo no probabilístico Muestreo por conveniencia Muestreo por cuota Muestreo probabilístico Muestreo sistemático Observación Opciones de respuesta Plan de muestreo Población Pregunta abierta Pregunta cerrada Propiedad de medición Resultado informado por el paciente Sesgo de muestreo Sesgos de respuesta Sistema de categorías Tamaño de la muestra Tasa de respuesta Validez Validez de constructo Validez de contenido Validez de criterio Validez frontal 324 Valoración psicométrica Este capítulo cubre dos temas de investigación importantes: cómo seleccionan los investigadores cuantitativos a sus participantes para un estudio y cómo obtienen datos de ellos. MUESTREO EN LA INVESTIGACIÓN CUANTITATIVA Los investigadores responden preguntas de investigación usando una muestra de participantes. Al probar los efectos de una intervención para mujeres embarazadas, los investigadores en enfermería llegan a conclusiones sin probarla en todas las mujeres embarazadas. Los investigadores cuantitativos desarrollan un plan de muestreo que especifica por anticipado cómo seleccionarán a los participantes y cuántos incluirán. Conceptos de muestreo básico Primero se considerarán algunos términos relacionados con el muestreo. Poblaciones Una población (“P” en las preguntas PICO) es el grupo completo de interés. Por ejemplo, si un investigador estudiara a los profesionales de enfermería con grados doctorales, la población podría definirse como todos los profesionales de enfermería certificados con un grado a nivel doctoral. Otras poblaciones podrían ser todos los pacientes que se sometan a cirugía cardiaca en cierto hospital en 2017 o todos los niños australianos menores de 10 años con fibrosis quística. Las poblaciones no se limitan a las personas. Una población podría comprender todos los expedientes de pacientes de un gran hospital. Una población es un agregado completo de elementos. Los investigadores especifican las características de la población mediante los criterios de elegibilidad. Por ejemplo, si se considerara la población de estudiantes de enfermería estadounidenses, ¿la población comprende a los estudiantes de medio tiempo? ¿Se incluyen los profesionales de enfermería certificados que regresan a la escuela para cursar un grado de licenciatura? Los investigadores 325 establecen criterios para determinar si una persona califica como miembro de la población (criterios de inclusión) o debe excluirse (criterios de exclusión), por ejemplo, la exclusión de los pacientes con enfermedades graves. Ejemplo de los criterios de inclusión y exclusión Joseph y sus colaboradores (2016) estudiaron la sensibilidad de los niños a la detección de sacarosa (sabor dulce). Para ser elegibles, los niños debían estar sanos y tener entre 7 y 14 años de edad. Los niños se excluyeron si tenían alguna enfermedad médica importante como diabetes, cardiopatía o asma. Los investigadores cuantitativos obtienen su muestra de una población accesible con la esperanza de generalizar a una población deseada. La población blanco es la población de interés completa. La población accesible es la parte de la población blanco que es asequible al investigador. Por ejemplo, la población blanco de un investigador podrían ser todos los pacientes diabéticos en un país, pero, en realidad, la población accesible podrían ser los pacientes diabéticos de un hospital particular. Muestras y muestreo El muestreo implica la selección de una parte de la población para representar a la totalidad. Una muestra es un subgrupo de elementos de la población. En la investigación de enfermería, los elementos (unidades básicas) casi siempre son seres humanos. Los investigadores trabajan con muestras, no con poblaciones, por razones prácticas. Sin embargo, la información de las muestras puede conducir a conclusiones erróneas. En los estudios cuantitativos, un criterio para juzgar una muestra es su representatividad. Una muestra representativa es una cuyas características se aproximan mucho a las de la población. Algunos planes de muestreo tienen mayor probabilidad que otros de generar muestras sesgadas. El sesgo de muestreo es la representación sistemática excesiva o insuficiente de un segmento de la población en cuanto a sus características clave. Estratos 326 Las poblaciones consisten en subpoblaciones o estratos, segmentos excluyentes entre sí de una población con base en características específicas. Por ejemplo, una población consistente en todos los profesionales de enfermería certificados de un país podría dividirse en dos estratos con base en el género. Los estratos pueden usarse en la selección de la muestra para mejorar su representatividad. TIP El plan de muestreo suele describirse en la sección del reporte de investigación que expone el método, en ocasiones en una subsección llamada “Muestra” o “Participantes en el estudio”. Las características de la muestra (p. ej., edad promedio) suelen describirse en la sección de resultados. Diseños de muestreo en estudios cuantitativos Las dos grandes clases de diseños de muestreo en la investigación cuantitativa son el muestreo probabilístico y el muestreo no probabilístico. Muestreo no probabilístico En el muestreo no probabilístico, los investigadores eligen los elementos por métodos no aleatorios en los que no todos los elementos tienen probabilidad de ser elegidos. Es menos probable que el muestreo no probabilístico genere muestras representativas y aun así, la mayoría de las muestras de investigación en enfermería y otras disciplinas son muestras no probabilísticas. El muestreo por conveniencia implica la selección de las personas con la disponibilidad más conveniente como participantes. Por ejemplo, un profesional de enfermería que distribuye cuestionarios sobre el uso de vitaminas a estudiantes universitarios que salen de la biblioteca realiza un muestreo por conveniencia. El problema con el muestreo por conveniencia es que las personas que están disponibles podrían ser atípicas de la población. El precio de la conveniencia es el riesgo de sesgos. Aunque el muestreo por conveniencia es la forma más débil de muestreo, también es el método más usual. Ejemplo de una muestra por conveniencia Huang y sus colaboradores (2016) estudiaron los efectos de los factores 327 de riesgo y el estilo para enfrentar las situaciones en la calidad de vida y los síntomas de depresión de adultos con diabetes tipo 2. Se captó una muestra por conveniencia de 241 adultos en el departamento metabólico ambulatorio de un hospital. En el muestreo por cuota, los investigadores identifican estratos de población y averiguan cuántas personas se requieren en cada estrato. Al usar información sobre la población, los investigadores pueden asegurar que los diversos segmentos están representados en la muestra. Por ejemplo, si se sabe que la población tiene 50% de hombres y 50% de mujeres, la muestra debe tener porcentajes similares. En cuanto el procedimiento, el muestreo por cuota es similar al muestreo por conveniencia: los participantes son una muestra por conveniencia de cada estrato. Debido a esto, el muestreo por cuota comparte algunas debilidades con el muestreo por conveniencia. Sin embargo, el primero es mejor que el segundo y no requiere habilidades sofisticadas ni mucho esfuerzo. Aunque resulta sorprendente, pocos investigadores usan esta estrategia. Ejemplo de una muestra por cuota Wang y sus colaboradores (2015) describieron el protocolo para un estudio de los efectos de un programa de salud que se implementa en una universidad de Singapur. Los investigadores planean usar una muestra por cuota, con estratificación de los participantes según el tipo de trabajo que realizan (académico, administrativo, de soporte). El muestreo consecutivo es un muestreo no probabilístico que implica la inclusión de todas las personas de una población accesible en un intervalo temporal específico o para alcanzar un tamaño específico de muestra. Por ejemplo, en un estudio de neumonía relacionada con el ventilador en pacientes de la unidad de cuidados intensivos (UCI), una muestra consecutiva podría consistir en todos los pacientes elegibles que fueron admitidos en una UCI durante un periodo de 6 meses. También podrían ser los primeros 250 pacientes elegibles que ingresen a la UCI, si 250 es el tamaño deseado de muestra. El muestreo consecutivo por lo regular es la mejor opción disponible cuando hay “inclusión escalonada” a una población accesible. 328 Ejemplo de una muestra consecutiva Bryant y sus colaboradores (2015) compararon los reportes radiográficos de la colocación de sondas de alimentación con imágenes generadas por un dispositivo electromagnético para la colocación de estas. La muestra consistió en 200 pacientes consecutivos a los que se les colocó una sonda de alimentación. En el muestreo intencional se usa el conocimiento de los investigadores sobre la población para elegir individualmente a los miembros de la muestra. Los investigadores pueden decidir, de manera intencional, elegir a las personas que consideran conocedoras de los problemas en estudio. Este método puede generar sesgos, pero puede ser una estrategia útil cuando los investigadores desean una muestra de expertos. Ejemplo de muestreo intencional Hewitt y Cappiello (2015) invitaron a un panel de expertos conocedores de la provisión de atención a la salud reproductiva seleccionado de modo intencional para presentar sus puntos de vista con el fin de identificar las competencias de enfermería esenciales para la prevención y atención del embarazo no intencional. TIP CÓMO SABER ¿Cómo puede decirse qué tipo de muestreo se usó en un estudio cuantitativo? Si el reporte de investigación no menciona o describe de forma explícita el diseño del muestreo, casi siempre es seguro asumir que se utilizó un muestreo por conveniencia. Muestreo probabilístico El muestreo probabilístico implica la selección aleatoria de elementos de una población. En el muestreo aleatorio, cada elemento de la población tiene una probabilidad igual e independiente de ser seleccionado. La selección aleatoria no debe confundirse (aunque a menudo así es) con la asignación aleatoria, que es una característica de un estudio controlado aleatorizado (ECA) (véase el capítulo 9). La asignación aleatoria a distintas condiciones terapéuticas no tiene injerencia en la manera en que se eligieron los participantes en el estudio controlado aleatorizado. 329 El muestreo aleatorio simple es el muestreo probabilístico más básico. En este caso, los investigadores establecen un marco de muestreo: una lista de elementos de la población. Si los estudiantes de enfermería de una universidad fueran la población, un listado de estudiantes sería el marco de muestreo. Los elementos del marco de muestreo se numeran y luego se usa una tabla de números aleatorios o un distribuidor aleatorio en línea para obtener una muestra aleatoria del tamaño deseado. Es poco probable que las muestras seleccionadas al azar tengan sesgos. No hay garantía de una muestra representativa, pero la selección aleatoria garantiza que las diferencias entre la muestra y la población sean solo resultado de la casualidad. La probabilidad de elegir una muestra muy atípica mediante el muestreo aleatorio es baja y disminuye conforme el tamaño de la muestra aumenta. Ejemplo de una muestra aleatoria simple Neta y sus colaboradores (2015) estudiaron el cumplimiento del autocuidado de los pies en pacientes con diabetes mellitus en Brasil. La población incluyó a 8 709 pacientes con diabetes tipo 2. Los investigadores obtuvieron una muestra al azar de 368 de estos pacientes. En el muestreo aleatorio estratificado, la población se divide primero en dos o más estratos de los cuales se eligen elementos al azar. Como en el muestreo por cuota, el objetivo del muestreo estratificado es mejorar la representatividad. Ejemplo de muestreo aleatorio estratificado Buettner-Schmidt y sus colaboradores (2015) estudiaron el efecto de la legislación sobre tabaquismo en los niveles de contaminación por humo en bares y restaurantes en Dakota del Norte. Se obtuvo una muestra aleatoria de 135 locales de tres estratos: restaurantes, bares en comunidades con ordenanzas más estrictas que la ley estatal y bares fuera de estas comunidades. TIP Muchos estudios nacionales grandes usan el muestreo en etapas múltiples, en el que primero se obtienen muestras aleatorias de las unidades grandes (p. ej., folletos de censos, hospitales) y luego se eligen unidades más pequeñas (p. ej., 330 personas individuales). El muestreo sistemático implica la selección de cada k° caso de una lista, como cada 10.ª persona de una lista de pacientes. El muestreo sistemático puede hacerse de manera que se obtenga una muestra aleatoria. Primero, el tamaño de la población se divide entre el tamaño deseado de la muestra para obtener el intervalo de muestreo (la distancia fija entre los casos seleccionados). Por ejemplo, si se requiere una muestra de 50 de una población de 5 000, el intervalo de muestreo sería de 100 (5 000/50 = 100). Se seleccionaría cada 100° caso en un marco, con designación al azar del primero. Si el número aleatorio fuera 73, las personas correspondientes a los números 73, 173, 273, etc., estarían en la muestra. El muestreo sistemático realizado de esta forma es igual al muestreo aleatorizado simple y por lo regular resulta conveniente. Ejemplo de una muestra sistemática Ridout y sus colaboradores (2014) estudiaron la incidencia de la falta de comunicación de información vital conforme los pacientes pasaban por el proceso perioperatorio. De una población de 1 858 expedientes de pacientes en un sistema de atención a la salud que cumplían los criterios de elegibilidad, los investigadores seleccionaron cada sexto caso para obtener una muestra de 294 casos. Evaluación del muestreo no probabilístico y probabilístico El muestreo probabilístico es el único método viable para obtener muestras representativas. Si todos los elementos de una población tienen la misma probabilidad de ser elegidos, es probable que la muestra resultante sea adecuada para representar a la población. El muestreo probabilístico permite a los investigadores calcular la magnitud del error de muestreo, que es la diferencia entre los valores de la población (p. ej., la edad promedio de la población) y los valores de la muestra (p. ej., la edad promedio de la muestra). Las muestras no probabilísticas rara vez son representativas de la población; es probable que algún segmento de la población esté poco representado. Cuando existe un sesgo de muestreo, quizá los resultados sean engañosos. Entonces, ¿por qué se usan las muestras 331 no probabilísticas en casi todos los estudios? Está claro que la ventaja radica en su rapidez: el muestreo probabilístico suele ser impráctico. Los investigadores cuantitativos que usan muestras no probabilísticas deben tener cautela en relación con las inferencias que hacen a partir de los datos y los consumidores deben mantenerse alerta ante posibles sesgos de muestreo. TIP La calidad del plan de muestreo tiene importancia particular cuando el objetivo de la investigación es obtener información descriptiva de la prevalencia o los valores promedios de una población. Las encuestas nacionales casi siempre usan muestras probabilísticas. Para los estudios cuyo propósito principal es la descripción, los datos de una muestra probabilística están en la cúspide de la jerarquía de evidencia para estudios individuales. Tamaño de la muestra en estudios cuantitativos El tamaño de la muestra –el número de participantes en el estudio– es un aspecto sustancial en la investigación cuantitativa. No hay una fórmula sencilla para determinar qué tan grande debe ser una muestra, pero una de mayor tamaño suele ser mejor que una pequeña. Cuando los investigadores calculan un porcentaje o un promedio con los datos de la muestra, la finalidad es calcular un valor en la población y las muestras más grandes tienen un menor error de muestreo. Los investigadores podrían calcular qué tan grandes deben ser sus muestras para probar las hipótesis mediante un análisis de poder. Un ejemplo puede ilustrar los principios básicos del análisis de poder. Supongamos que se prueba una intervención para ayudar a las personas a abandonar el tabaquismo; los fumadores deben distribuirse al azar para recibir una intervención o estar en el grupo control. ¿Cuántas personas debe haber en la muestra? Cuando usan el análisis de poder, los investigadores deben calcular qué tan grande será la diferencia de grupo (p. ej., diferencias grupales en el número de cigarrillos al día). Es posible basar el cálculo en una investigación previa. Cuando las diferencias anticipadas son mensurables, no se necesita una muestra grande para revelar diferencias grupales por medios estadísticos, pero cuando se anticipan diferencias pequeñas, se requieren muestras grandes. En este ejemplo, si se anticipa una diferencia pequeña a moderada entre los grupos en el tabaquismo 332 posterior a la intervención, el tamaño de la muestra necesario para probar las diferencias en el tabaquismo entre los grupos, con los criterios estadísticos estándar, sería cercano a 250 fumadores (125 por grupo). El riesgo de “equivocarse” (validez de la conclusión estadística) aumenta cuando las muestras son demasiado pequeñas: los investigadores se arriesgan a recolectar datos que no apoyen sus hipótesis incluso cuando sean correctas. Sin embargo, las muestras grandes no garantizan la exactitud: con el muestreo no probabilístico, incluso una muestra grande puede tener sesgos. El ejemplo famoso que ilustra este punto es la encuesta para la presidencia de Estados Unidos de 1936 realizada por la revista Literary Digest, que predijo que Alfred Landon derrotaría a Franklin Roosevelt de manera aplastante. Se encuestó a una muestra de casi 2.5 millones de personas, pero hubo sesgos porque la muestra se obtuvo de los directorios telefónicos y los registros de automóviles durante un año de la Gran Depresión, cuando solo las personas adineradas (que favorecían a Landon) tenían automóvil o teléfono. Una muestra grande no puede corregir un diseño de muestreo defectuoso; no obstante, una muestra grande no probabilística es mejor que una muestra pequeña. Cuando se hace una crítica a estudios cuantitativos, debe valorarse el tamaño de la muestra y el método para seleccionarla con el fin de juzgar qué tan buena era la muestra. TIP El plan de muestreo suele ser uno de los aspectos más débiles de los estudios cuantitativos. La mayoría de los estudios de enfermería usa muestras de conveniencia y muchos se basan en muestras demasiado pequeñas para permitir una verificación adecuada de las hipótesis de investigación. Análisis crítico a los planes de muestreo Para hacer conclusiones acerca de la calidad de la evidencia que un estudio aporta, el plan de muestreo amerita un escrutinio especial. Si la muestra tiene un sesgo marcado o es demasiado pequeña, los hallazgos pueden ser engañosos o del todo equivocados. En la crítica a una descripción de un plan de muestreo debe considerarse si el investigador describió de manera adecuada la estrategia de muestreo. Lo ideal es que los reportes de investigación 333 describan lo siguiente: El tipo de estrategia de muestreo usado (p. ej., conveniencia, consecutiva, aleatoria). La población y los criterios de elegibilidad para seleccionar la muestra. El tamaño de la muestra, con una justificación. Una descripción de las principales características de la muestra (p. ej., edad, género, estado clínico, etcétera). Un segundo aspecto es si el investigador tomó buenas decisiones para el muestreo. Se subrayó que un criterio clave para valorar un plan de muestreo en la investigación cuantitativa es si la muestra es representativa de la población. Por supuesto, nunca se sabrá con certeza, pero hay razón para sospechar algún sesgo si la estrategia de muestreo es débil o si la muestra es demasiado pequeña. Recuadro 10-1 Lineamientos para la crítica de los planes de muestreo cuantitativo 1. ¿Se identificó la población? ¿Se especificaron los criterios de elegibilidad? 2. ¿Qué tipo de diseño de muestreo se usó? ¿El plan de muestreo fue uno del que pudiera esperarse que generara una muestra representativa? 3. ¿Cuántos participantes había en la muestra? ¿El tamaño de la muestra se alteró por tasas elevadas de rechazo o desgaste? ¿El tamaño de la muestra fue suficiente para respaldar la validez de la conclusión estadística? ¿El tamaño de la muestra estaba justificado con base en un análisis de poder o en otra justificación? 4. ¿Se describieron las características clave de la muestra (p. ej., edad media, porcentaje de mujeres)? 5. ¿A quién es razonable generalizar los resultados del estudio? Incluso con un plan de muestreo riguroso, es posible que la muestra esté sesgada si no aceptan participar todas las personas invitadas al estudio. Si ciertos grupos de la población se niegan a participar, puede obtenerse una muestra sesgada aun si se usa un muestreo probabilístico. Lo ideal es que los reportes de investigación proporcionen información de las tasas de respuesta (es decir, el número de personas que participan en un estudio con respecto al 334 número de personas de la muestra) y de los posibles sesgos por falta de respuesta: diferencias entre los participantes y los que se negaron a participar. En un estudio longitudinal, debe informarse el sesgo por desgaste. El trabajo como revisor es llegar a conclusiones sobre lo razonable que es generalizar los hallazgos a partir de la muestra del investigador a una población accesible y a una población blanco más amplia. Si el plan de muestreo es defectuoso, puede ser arriesgado generalizar los hallazgos sin replicar el estudio en otra muestra. El recuadro 10-1 (arriba) presenta algunas preguntas guía para la crítica del plan de muestreo de un reporte de investigación cuantitativa. RECOLECCIÓN DE DATOS EN LA INVESTIGACIÓN CUANTITATIVA Los fenómenos en los que los investigadores están interesados deben traducirse en datos que pueden analizarse. Esta sección explica la difícil tarea de recolectar datos en la investigación cuantitativa. Generalidades de la recolección de datos y fuentes de datos Los métodos para recolección de datos varían en diversas dimensiones. Un aspecto es si el investigador obtiene datos originales o utiliza datos existentes. Por ejemplo, los registros escritos existentes son una fuente importante de datos para los investigadores en enfermería. Numerosos datos clínicos reunidos con fines distintos a la investigación pueden analizarse de manera fructífera para responder las preguntas de esta. Ejemplo de un estudio que usa registros escritos Draughton Moret y sus colaboradores (2016) exploraron los factores relacionados con la aceptación de los pacientes de la profilaxis postexposición no ocupacional para el VIH después de un ataque sexual. Los datos se obtuvieron de expedientes de enfermería forense. Lo más frecuente es que los investigadores recolecten datos 335 nuevos. En el desarrollo del plan para recolección de datos deben decidir el tipo de datos que reúnen. Por lo regular, los investigadores en enfermería usan tres tipos: autorreportes, observaciones y mediciones biofisiológicas. Los datos de los autorreportes, también llamados datos de resultados informados por el paciente, son respuestas de los participantes a las preguntas de los investigadores, como en una entrevista. En los estudios de enfermería, los autorreportes son la técnica más frecuente para recolectar datos. La observación directa de los comportamientos y las características de las personas puede emplearse para ciertas preguntas. Los profesionales de enfermería también usan mediciones biofisiológicas para valorar importantes variables clínicas. Al margen del tipo de datos recolectados en un estudio, los métodos de recolección de datos difieren en varias dimensiones, incluidas la estructura, la objetividad y el carácter cuantificable. Los datos de los estudios cuantitativos tienden a ser cuantificables y estructurados, se obtiene la misma información de todos los participantes de manera comparable, predeterminada. Por lo general, los investigadores cuantitativos buscan métodos lo más objetivos posible. Autorreportes/resultados informados por el paciente Los métodos de autorreporte estructurados se usan cuando los investigadores conocen con anticipación exactamente qué necesitan saber y pueden presentar las preguntas apropiadas para obtener la información requerida. Los datos de los autorreportes estructurados se obtienen con un documento escrito formal: un instrumento. Este se conoce como esquema de entrevista cuando las preguntas se hacen cara a cara o por teléfono o como cuestionario cuando los sujetos lo completan por sí mismos. Forma y redacción de las preguntas En un instrumento bien estructurado, se hacen las mismas preguntas y en el mismo orden a los sujetos de estudio. Las preguntas cerradas (o con alternativas fijas) son aquellas en las que las opciones de respuesta están predeterminadas. Las opciones varían desde un simple sí o no hasta expresiones de opinión complejas. Tales preguntas aseguran que las respuestas sean comparables y facilitan el 336 análisis. La tabla 10-1 presenta algunos ejemplos de preguntas cerradas. Sin embargo, algunos instrumentos estructurados también incluyen preguntas abiertas, que permiten a los participantes responder con sus propias palabras (p. ej., ¿por qué dejó de fumar?). Cuando se incluyen preguntas abiertas en los cuestionarios, los sujetos deben escribir sus respuestas. En las entrevistas, el entrevistador registra las respuestas de forma literal. Las buenas preguntas cerradas son más difíciles de construir que las buenas preguntas abiertas, pero son más fáciles de analizar. Además, cabe la posibilidad de que las personas no estén dispuestas a redactar respuestas largas a las preguntas abiertas en los cuestionarios. Una limitación sustancial de las preguntas cerradas es que los investigadores podrían omitir respuestas que pudieran ser importantes. Si los sujetos que responden son muy expresivos y cooperadores, las preguntas abiertas aportan información más completa que las cerradas. Por último, algunas personas objetan el tener que elegir entre alternativas que no reflejan sus opiniones con exactitud. TABLA 10-1 Ejemplos de preguntas cerradas Tipo de Ejemplo pregunta ¿Alguna vez ha estado embarazada? 1. 1. Sí Pregunta dicotómica 2. No 2. Pregunta de opción múltiple ¿Qué tan importante es para usted evitar un embarazo en este momento? 1. Extremadamente importante 2. Muy importante 3. Algo importante 4. No es importante ¿Qué declaración representa mejor su punto de vista? 3. 1. Lo que me ocurre es consecuencia de mis actos Pregunta de elección 2. A veces siento que no tengo control suficiente sobre mi vida forzada 4. Pregunta En una escala de 0 a 10, en la que 0 significa “extremadamente de insatisfecho” y 10 significa “extremadamente satisfecho”, ¿qué calificación tan satisfecho está con la atención que recibió durante su 337 hospitalización? Al elaborar borradores para un instrumento estructurado, los investigadores deben vigilar con cuidado la redacción de cada pregunta para confirmar que sea clara, libre de sesgos y (en los cuestionarios) que tenga un nivel de lectura apropiado. Las preguntas deben tener un orden psicológicamente significativo que aliente la cooperación y la honestidad. El desarrollo, la valoración preliminar y el refinamiento de un instrumento de autorreporte puede tomar muchos meses. Entrevistas o cuestionarios Los investigadores que usan autorreportes estructurados deben elegir entre entrevistas o cuestionarios respondidos por el sujeto mismo. Los cuestionarios tienen las siguientes ventajas: Son menos costosos y más convenientes para muestras dispersas en la geografía. Los cuestionarios por Internet son muy económicos y son un medio cada vez más importante para recolectar datos de autorreporte, aunque las tasas de respuesta a los cuestionarios en Internet suelen ser bajas. Ofrecen la posibilidad del anonimato, que puede ser crucial para obtener información acerca de ciertas opiniones o rasgos. Ejemplo de cuestionarios por Internet Ratanasiripong (2015) envió un cuestionario por Internet a una muestra por conveniencia de 3 300 estudiantes universitarios masculinos que acudían a una universidad pública. El propósito del estudio era documentar la tasa de vacunación contra el virus del papiloma humano entre hombres universitarios y examinar los factores relacionados con el hecho de estar vacunado. Se recibieron respuestas de 410 estudiantes. Las fortalezas de las entrevistas rebasan las de los cuestionarios. Entre sus ventajas están las siguientes: 338 Las tasas de respuestas de las entrevistas en persona tienden a ser altas. Es menos probable que los sujetos se rehúsen a hablar con un entrevistador que a ignorar un cuestionario. Las tasas de respuesta bajas pueden generar sesgos porque los sujetos que responden rara vez forman un subgrupo aleatorio de la muestra original. En el estudio con cuestionario por Internet en hombres universitarios (Ratanasiripong, 2015), la tasa de respuesta fue menor de 15 por ciento. Algunas personas no pueden completar un cuestionario (p. ej., niños pequeños). Las entrevistas son factibles para la mayoría. Ciertas ventajas de la entrevista personal (cara a cara) también se aplican a las entrevistas telefónicas. Los instrumentos largos o complejos no son adecuados para aplicarlos por teléfono, pero para aquellos más o menos breves, las entrevistas telefónicas combinan costos relativamente bajos con tasas de respuesta altas. Ejemplo de entrevistas telefónicas Oliver y sus colaboradores (2016) condujeron entrevistas telefónicas con una muestra de 1 024 participantes. Las entrevistas incluían preguntas sobre el conocimiento del riesgo de cáncer, con énfasis particular en el conocimiento del riesgo de cáncer colorrectal. Escalas Las escalas psicológicas sociales por lo regular se incorporan en cuestionarios o esquemas de entrevista. Una escala es un dispositivo que asigna una calificación numérica a las personas a lo largo de un continuo, como una báscula para medir el peso. Las escalas psicológicas sociales diferencian a las personas con distintas actitudes, percepciones y rasgos psicológicos. Una técnica es la escala de Likert, que consiste en varias declaraciones afirmativas (ítems) que expresan un punto de vista acerca de un tema. Se pide a los sujetos que indiquen cuánto concuerdan o cuánto no coinciden con la declaración. La tabla 10-2 presenta una escala de Likert de seis ítems para medir actitudes ante el uso del condón. En este ejemplo, la coincidencia con las declaraciones afirmativas recibe una calificación más alta. La primera declaración se redacta en forma positiva; el acuerdo indica una actitud favorable hacia el uso del condón. Como existen cinco alternativas de 339 respuesta, se daría una calificación de 5 a completamente de acuerdo, 4 para de acuerdo, etcétera. Las respuestas de dos participantes hipotéticos se muestran con una marca o una X, y sus calificaciones de los ítems se muestran en la columna derecha. La persona 1, que coincidió con la primera declaración, tuvo una calificación de 4, mientras que la persona 2, que está en franco desacuerdo, tuvo una calificación de 1. La segunda declaración se expresa en forma negativa, por lo que la calificación se invierte: se asigna 1 a completamente de acuerdo y así se continúa. La inversión de ítems asegura que una calificación alta sea un reflejo consistente de las actitudes positivas hacia el uso del condón. La calificación total de una persona es la suma de las calificaciones de los ítems; por lo tanto, estas escalas a veces se llaman escalas de evaluación sumaria o escalas compuestas. En este ejemplo, la persona 1 tiene una actitud más positiva hacia los condones (calificación total = 26) que la persona 2 (calificación total = 11). Las calificaciones sumatorias de ítems permiten discriminar entre personas con distintas opiniones. Las escalas compuestas por lo regular constan de dos o más subescalas que miden diferentes aspectos de un constructo. El desarrollo de escalas de alta calidad 340 requiere mucha habilidad y esfuerzo. Ejemplo de una escala de Likert Ranse y sus colaboradores (2015) estudiaron los factores que influyen en la provisión de cuidados al final de la vida en instituciones de cuidados intensivos y generaron una escala tipo Likert de 58 ítems con ocho subescalas. Los ejemplos de las declaraciones incluyen los siguientes: “Los pacientes al final de la vida requieren poca atención de enfermería” y “Tengo una sensación de falla personal cuando un paciente muere”. Las respuestas tenían una escala de 5 puntos: completamente en desacuerdo, en desacuerdo, neutral, de acuerdo y completamente de acuerdo. Otro tipo de escala es la escala análoga visual (EAV), que puede usarse para medir experiencias subjetivas como el dolor o la fatiga. La EAV es una línea recta y los puntos fijos en los extremos se señalan como los límites posibles de la sensación que se mide (fig. 10-1). Las personas marcan un punto en la línea correspondiente a la magnitud de la sensación que experimentan. Por lo general, la línea de una EAV mide 100 mm de largo, lo que facilita obtener una calificación de 0 a 100 al medir la distancia de un extremo de la escala a la marca en la línea. Figura 10-1 Ejemplo de escala análoga visual. Ejemplo de una escala análoga visual Hu y sus colaboradores (2015) evaluaron los efectos de los tapones para oídos, los antifaces y la música relajante en la calidad del sueño de los pacientes de la UCI. La calidad del sueño se midió con una EAV de 0 a 100. Las escalas permiten a los investigadores cuantificar de forma 341 eficiente grados sutiles en la intensidad de las características individuales. Las escalas pueden aplicarse de manera verbal o por escrito, por lo que pueden usarse en la mayoría de las personas. Sin embargo, las escalas son susceptibles a varios problemas frecuentes, muchos de los cuales se refieren como sesgos de respuesta. Los sesgos más importantes incluyen los siguientes: Sesgo de deseabilidad social: tendencia a representar de modo erróneo actitudes o rasgos al dar respuestas acordes con las visiones sociales prevalentes. Sesgo de respuesta extrema: tendencia a expresar de manera consistente actitudes extremas (p. ej., completamente de acuerdo), lo que causa distorsiones porque es posible que las respuestas extremas no estén relacionadas con el rasgo que se mide. Sesgo de conformidad: tendencia de algunas personas (afirmadores constantes) a concordar con las declaraciones, al margen de su contenido. La tendencia contraria de otras personas (negadores constantes) a estar en desacuerdo con las declaraciones, sin importar el contenido de la pregunta, es menos frecuente. Los investigadores pueden reducir estos sesgos si desarrollan preguntas con redacción sensible, si crean una atmósfera permisiva y sin juicios, y garantizan la confidencialidad de las respuestas. TIP Otras estrategias de autorreporte incluyen viñetas y método Q. Las viñetas son descripciones breves de situaciones a las que se pide a los sujetos que reaccionen. El método Q consiste en presentar a los participantes un conjunto de tarjetas con las declaraciones escritas. Se pide a los participantes que ordenen las tarjetas según una dimensión especificada, como el más útil/menos útil. Las viñetas y el método Q se describen en el suplemento en inglés del capítulo en el sitio web . Evaluación de los métodos de autorreporte Si los investigadores desean saber cómo se sienten o qué creen las personas, la estrategia más directa es preguntarles. Los autorreportes a menudo aportan información que sería difícil o imposible recolectar por otros medios. Los comportamientos pueden observarse solo si las personas están dispuestas a realizarlos en público y al momento de la recolección de datos. 342 No obstante, los autorreportes tienen algunas debilidades. El problema más grave se refiere a su validez y exactitud: ¿cómo puede estar seguro de que los sujetos se sienten o actúan de la manera en que dicen? Por lo general, los investigadores no tienen más opción que asumir que casi todos los sujetos fueron francos. Aun así, todas las personas tienden a presentarse a sí mismas de la mejor forma y esto podría ser contrario a la verdad. Cuando se leen reportes de investigación, debe estarse alerta ante los posibles sesgos en los datos reportados por los sujetos. Métodos observacionales Para algunas preguntas de investigación, la observación directa del comportamiento de las personas es una alternativa a los reportes personales, sobre todo en instituciones clínicas. Los métodos observacionales pueden usarse para reunir información como las condiciones de los pacientes (p. ej., su estado de sueñovigilia), comunicación verbal (p. ej., intercambio de información al momento del alta), comunicación no verbal (p. ej., lenguaje corporal), actividades (p. ej., actividades de arreglo personal de pacientes geriátricos) y condiciones ambientales (p. ej., nivel de ruido). En estudios que emplean la observación, los investigadores tienen la flexibilidad respecto a varias dimensiones importantes. Por ejemplo, el centro de la observación puede estar en eventos definidos de manera general (p. ej., cambios anímicos del paciente) o en pequeños comportamientos específicos (p. ej., expresiones faciales). Las observaciones pueden hacerse mediante los sentidos humanos para luego registrarlas de forma manual, pero también pueden hacerse con equipo, como grabadoras de video. Los investigadores no siempre informan a las personas que están siendo observadas porque esta consciencia puede hacer que su comportamiento sea atípico. Las distorsiones conductuales debidas a la presencia conocida de un observador se llaman reactividad. La observación estructurada implica el uso de herramientas formales y protocolos que dictan qué observar, cuánto tiempo hacerlo y cómo registrar los datos. La observación estructurada no pretende capturar una imagen amplia de la vida, sino documentar comportamientos, acciones y eventos específicos. La observación estructurada requiere la formulación de un sistema para clasificar, registrar y codificar con exactitud las observaciones. 343 TIP Los investigadores por lo regular usan observaciones estructuradas cuando no es posible hacer preguntas a los participantes o no puede esperarse que den respuestas confiables. Muchos instrumentos de observación están diseñados para capturar los comportamientos de lactantes, niños o personas con habilidades para la comunicación dañadas. Métodos de observación estructurada La estrategia más frecuente para hacer observaciones estructuradas consiste en usar un sistema de categorías para clasificar los fenómenos observados. Un sistema de categorías representa un método para registrar de modo sistemático los comportamientos y eventos de interés que ocurren en una institución. Algunos sistemas de categorías requieren la clasificación de todos los comportamientos observados en un dominio específico (p. ej., posiciones corporales). Una técnica contrastante es un sistema en el que solo se clasifican tipos particulares de comportamiento (que pueden ocurrir o no). Por ejemplo, si se estudia el comportamiento agresivo de los niños, podrían desarrollarse categorías como “golpea a otro niño” o “lanza objetos”. En tal sistema de categorías, muchos comportamientos –todos los que no son agresivos–, no se clasificarían; quizás algunos niños no presenten acción agresiva alguna. Ejemplo de categorías no exhaustivas Nilsen y sus colaboradores (2014) realizaron un estudio de calidad de la atención de enfermería que incluyó observaciones de la comunicación entre profesionales de enfermería y pacientes con ventilación mecánica en una UCI. Entre muchos tipos distintos de observaciones realizadas, los observadores registraron los casos de comportamientos positivos y negativos del profesional de enfermería, según criterios definidos con cuidado. Los comportamientos neutrales no se registraron. Los sistemas de categorías deben tener definiciones operativas explícitas cuidadosas de los comportamientos y las características que deben observarse. Cada categoría debe explicarse con criterios claros para que los observadores valoren la presencia del fenómeno. 344 Los sistemas de categorías son la base para construir una lista de verificación: el instrumento que los observadores usan para registrar sus observaciones. Casi siempre tiene una lista de los comportamientos del sistema de categorías a la izquierda y un espacio para marcar la frecuencia o duración a la derecha. La tarea del observador que utiliza un sistema de categorías exhaustivo es colocar todos los comportamientos observados en una categoría por cada “unidad” de comportamiento (p. ej., un intervalo de tiempo). En los sistemas de categorías no exhaustivas se listan las categorías de los comportamientos que pueden o no manifestar los participantes. El observador busca casos de estas conductas y las registra si acontecen. Otra estrategia para las observaciones estructuradas consiste en emplear una escala de calificación, un instrumento con el que los observadores califican los fenómenos en un continuo descriptivo. En ocasiones es necesario que el observador califique a intervalos durante toda la observación o que resuma un evento completo después de terminar la observación. Las escalas de calificación pueden usarse como extensión de listas de verificación, en las que el observador registra no solo la presencia de algún comportamiento sino también algún aspecto cualitativo de este, como su intensidad. Aunque este enfoque aporta mucha información, representa una carga enorme para los observadores. Ejemplo de calificaciones observacionales Burk y sus colaboradores (2014) intentaron identificar factores que predijeran la agitación en adultos con enfermedades graves. El grado de agitación de los pacientes se observó y midió con la escala de agitación-sedación de Richmond, que requiere calificaciones en una escala de 10 puntos, desde +4 (combativo) hasta –5 (imposible de despertar). Muestreo observacional Los investigadores deben decidir cuándo aplicar sus sistemas observacionales. Los métodos de muestreo para observación son medios para obtener ejemplos representativos de los comportamientos que se observan. Un sistema es el muestreo por tiempo, que implica la selección de periodos de tiempo durante los cuales se harán las observaciones. Los marcos temporales pueden elegirse de manera sistemática (p. ej., cada 30 segundos a intervalos de 2 minutos) o al 345 azar. Con el muestreo por evento, los investigadores seleccionan eventos integrales para observar. Se requiere que los investigadores sepan cuándo ocurrirán los eventos (p. ej., cambios de turno de enfermería) o que esperen a que ocurran. Es una buena opción cuando los eventos de interés son poco usuales y pueden pasar inadvertidos si se usara el muestreo por tiempo. Sin embargo, cuando los comportamientos y los eventos son relativamente frecuentes, el muestreo por tiempo aumenta la representatividad de los comportamientos observados. Ejemplo de muestreo por evento y por tiempo En el estudio de observación mencionado antes de la comunicación entre profesional de enfermería y paciente en la UCI (Nilsen et al., 2014), primero se hizo un muestreo por evento (ocasiones de interacción profesional de enfermería-paciente) y posteriormente se grabaron en video segmentos de 3 minutos de interacción en cuatro ocasiones separadas durante un periodo de 2 días, que después se codificaron respecto a un intervalo de resultados (p. ej., hacer contacto visual). Evaluación de los métodos observacionales Ciertas preguntas de investigación son más adecuadas para la observación que los autorreportes, como cuando las personas no pueden describir sus propios comportamientos. Esto puede ocurrir cuando los sujetos no están conscientes de su comportamiento (p. ej., comportamiento inducido por estrés), cuando este tiene carga emocional (p. ej., duelo) o cuando las personas no son capaces de informar sus acciones (p. ej., niños pequeños). Los métodos de observación tienen un atractivo intrínseco para capturar los comportamientos de manera directa. Por lo regular, los profesionales de enfermería están en posición de observar las conductas de las personas y con el entrenamiento pueden convertirse en observadores muy sensibles. Las limitaciones de los métodos observacionales incluyen la posible reactividad cuando el observador es evidente y la vulnerabilidad de las observaciones a los sesgos. Por ejemplo, es posible que los valores y prejuicios del observador den lugar a una inferencia errónea. Es probable que los sesgos por observación no 346 puedan eliminarse, pero pueden minimizarse con el entrenamiento y la valoración cuidadosos del observador. Mediciones biofisiológicas Los estudios de enfermería clínica incluyen instrumentos biofisiológicos tanto para crear variables independientes (p. ej., una intervención por realimentación) como para medir variables dependientes. La discusión se enfoca en el uso de mediciones biofisiológicas como variables dependientes (resultados). Los investigadores en enfermería usan las mediciones biofisiológicas para propósitos muy diversos. Los ejemplos comprenden estudios de procesos biofisiológicos básicos, exploraciones de las maneras en que las acciones y las intervenciones de enfermería afectan los resultados fisiológicos, valoraciones del producto, estudios para evaluar la exactitud de la información biofisiológica obtenida por profesionales de enfermería y estudios de correlaciones de la actividad fisiológica en pacientes con problemas de salud. En la investigación se usan mediciones in vitro e in vivo. Las mediciones in vivo son las realizadas directamente al interior de o en organismos vivos, como la medición de la presión sanguínea y de la temperatura corporal. Los avances tecnológicos mejoran la capacidad para medir fenómenos biofisiológicos de manera exacta y conveniente. Con las mediciones in vitro, los datos se obtienen de los participantes mediante la extracción de material biológico para que técnicos de laboratorio lo analicen. Las mediciones in vitro abarcan valores químicos (p. ej., cuantificación de niveles hormonales), mediciones microbiológicas (p. ej., conteo e identificación de bacterias) y mediciones citológicas o histológicas (p. ej., biopsias de tejido). Los investigadores en enfermería también usan mediciones antropomórficas, como el índice de masa corporal y el perímetro abdominal. Ejemplo de un estudio con mediciones in vivo e in vitro Okoli y sus colaboradores (2016) examinaron las respuestas fisiológicas de los no fumadores a la aplicación de un parche de nicotina. Los investigadores midieron frecuencia cardiaca, presión sanguínea y concentración sérica de nicotina 0.5 horas, 1 hora y 2 horas después de aplicar un parche de nicotina. 347 Las mediciones biofisiológicas ofrecen varias ventajas a los investigadores en enfermería. Son relativamente exactas y precisas, sobre todo en comparación con mediciones psicológicas como las de autorreporte de la ansiedad o dolor. Además, las mediciones biofisiológicas son objetivas. Es probable que dos profesionales de enfermería que leen el mismo espirómetro registren mediciones idénticas del volumen de ventilación y también es probable que dos espirómetros produzcan las mismas lecturas. Los pacientes no pueden distorsionar con facilidad las mediciones biofisiológicas. Por último, los instrumentos biofisiológicos proporcionan medidas válidas de variables específicas: puede confiarse en los termómetros para medir la temperatura y no el volumen sanguíneo, etcétera. Por lo general, con las mediciones no biofisiológicas existe la duda de que un instrumento en realidad mida el concepto en cuestión. Calidad de los datos en la investigación cuantitativa Para desarrollar un plan de recolección de datos, los investigadores deben buscar los de la mayor calidad posible. Un aspecto de la calidad de los datos se refiere a los procedimientos usados para recolectarlos. Por ejemplo, las personas que obtienen y registran los datos deben tener el entrenamiento y la vigilancia adecuados para asegurar el cumplimiento diligente de los procedimientos. Otro aspecto se refiere a las circunstancias en las que se obtuvieron los datos. Así, es importante que los investigadores aseguren la privacidad y generen un ambiente que aliente a los participantes a ser honestos o a actuar de manera natural. Un aspecto crucial sobre la calidad de los datos se refiere a la adecuación de los instrumentos o escalas usados para medir los constructos. Los investigadores buscan mejorar la calidad de sus datos mediante la selección de mediciones excelentes. La medición implica la asignación de números para representar la cantidad de un atributo presente en una persona u objeto. Cuando se desarrolla una nueva medición de un constructo (p. ej., ansiedad), es necesario establecer las reglas para asignar valores numéricos (calificaciones). Por lo tanto, las reglas deben evaluarse para confirmar si son apropiadas: deben asignar números que correspondan de modo real y exacto a distintas magnitudes del rasgo evaluado. Las mediciones que no son del todo exactas producen valores que 348 contienen cierto error. Muchos factores contribuyen al error de medición, como estados personales (p. ej., estado de ánimo, fatiga), sesgos de respuesta y factores situacionales (p. ej., temperatura, iluminación). En las mediciones por autorreporte, los errores de medición pueden derivar de la manera en que se formula la pregunta. Los investigadores cuidadosos eligen las mediciones con solidez psicométrica conocida. La psicometría es la rama de la psicología que se encarga de la teoría y los métodos de las mediciones psicológicas. Cuando se desarrolla una nueva medida, quienes lo hacen realizan una valoración psicométrica, que implica una evaluación de las propiedades de medición del instrumento. En general, los psicometristas (y la mayoría de los investigadores en enfermería) se han enfocado en dos propiedades de medición para valorar la calidad de una medida: confiabilidad y validez. En años recientes, expertos en medición en medicina han sugerido recurrir a más propiedades referentes a la medición del cambio (Polit y Yang, 2016). Aquí se describen las dos propiedades que es más probable encontrar cuando se leen artículos en la bibliografía de enfermería. Los métodos usados para valorar estas propiedades se describen en el capítulo sobre análisis estadístico (véase capítulo 14). Confiabilidad En términos amplios, la confiabilidad es el grado en que las calificaciones están libres de un error de medición. La confiabilidad también puede definirse como el grado en que las calificaciones de las personas que no han cambiado permanecen iguales en mediciones repetidas. En otras palabras, confiabilidad se refiere a la consistencia –ausencia de variación– para medir un atributo estable en un individuo. En todos los tipos de valoraciones, la confiabilidad implica una replicación del instrumento para evaluar el grado de constancia que tienen las calificaciones de un rasgo estable. En la confiabilidad test-retest, replicación se refiere a la aplicación de una medición a las mismas personas en dos ocasiones (p. ej., con 1 semana de diferencia). La suposición es que para los rasgos que no han cambiado, cualquier diferencia en las calificaciones de las personas en dos pruebas son resultado de un error de medición. Cuando las diferencias en la calificación entre ambas mediciones son pequeñas, la confiabilidad es alta. En ocasiones, este tipo de confiabilidad se llama estabilidad o reproducibilidad, el grado en que 349 las calificaciones pueden reproducirse con su aplicación repetida. Salvo por constructos muy volátiles (p. ej., estado de ánimo), puede valorarse la confiabilidad test-retest de la mayoría de las mediciones, incluidas las biofisiológicas. Cuando las mediciones implican el uso de personas que emiten juicios de calificación, existe una fuente clave de error en la medición en la persona que la realiza. Esta es la situación en las mediciones observacionales (p. ej., calificaciones para medir la agitación) y también se aplica a algunas mediciones biofisiológicas (p. ej., medición del pliegue cutáneo). En tales situaciones, es importante evaluar cómo la confiabilidad de las mediciones refleja los atributos de la persona calificada y no los atributos de los calificadores. La técnica más usual es valorar la confiabilidad entre calificadores (o entre observadores), en la que dos o más observadores aplican la medición de manera independiente a las mismas personas para confirmar si las calificaciones son consistentes entre los calificadores. Otro aspecto de la confiabilidad es la consistencia interna. Al responder a un instrumento de autorreporte, las personas son influidas no solo por el constructo subyacente sino también por reacciones idiosincráticas a las palabras. Al combinar múltiples ítems con varias redacciones, se espera que las irrelevancias de los ítems se cancelen entre sí. Se dice que un instrumento tienen consistencia interna en la medida que sus ítems midan el mismo rasgo. Para la consistencia interna, la replicación implica las respuestas de las personas a múltiples ítems durante una misma aplicación. Mientras que otras estimaciones de confiabilidad valoran el grado de consistencia de una medición en el tiempo o entre calificadores, la consistencia interna captura la consistencia entre ítems. Como se explica en el capítulo 14, las valoraciones de confiabilidad proporcionan coeficientes que resumen qué tan confiable es una medida. En condiciones normales, los coeficientes de confiabilidad tienen un valor de 0.0 a 1.0; los valores más altos son lo deseable. Los coeficientes de 0.80 o más se consideran deseables. Los investigadores deben seleccionar herramientas con confiabilidad demostrada y tienen que documentarla en sus reportes. Cuando realizan un estudio, los investigadores no suelen hacer una valoración psicométrica completa de una medida existente, pero a menudo calculan los coeficientes de confiabilidad por consistencia interna con sus datos. 350 Ejemplos de confiabilidad en consistencia interna Kennedy y sus colaboradores (2015) desarrollaron y valoraron una escala para medir la autoeficacia de los estudiantes de enfermería para la práctica competente. La escala de 22 ítems tenía una elevada consistencia interna: el coeficiente de confiabilidad fue de 0.92. Validez La validez en el contexto de una medición es el grado en que un instrumento mide el constructo que dice medir. Cuando los investigadores desarrollan una escala para medir la resiliencia, necesitan asegurarse de que la validez de las calificaciones resultantes refleje este constructo y no algo más, como la autoeficacia o la perseverancia. La evaluación de la validez de los constructos abstractos requiere una conceptualización cuidadosa del constructo, así como una conceptualización de lo que no es el constructo. Como la confiabilidad, la validez tiene distintos aspectos y técnicas de valoración. Cuatro aspectos de la validez de la medición son la validez frontal, de contenido, de criterio y de constructo. La validez frontal se refiere a si el instrumento parece medir el constructo en cuestión. Aunque no se le considera evidencia adecuada de validez, es útil que una medida la tenga si ya se demostraron también otros tipos de validez. Si la resistencia de los pacientes a ser medidos refleja la noción de que la escala no es relevante para sus problemas o situaciones, es que existe un problema con la validez frontal. La validez de contenido puede definirse como el grado en que el contenido de un instrumento captura de manera adecuada el constructo; es decir, si el instrumento compuesto (p. ej., una escala con múltiples ítems) tiene una muestra apropiada de ítems para medir el constructo. Si el contenido de un instrumento es un buen reflejo de un constructo, el instrumento tiene mayor probabilidad de alcanzar sus objetivos de medición. Por lo general, la validez de contenido se evalúa al pedir a un panel de expertos que califique la relevancia de los ítems de la escala respecto al constructo y comenten acerca de la necesidad de ítems adicionales. La validez de criterio es el grado en que las calificaciones de una medición son un reflejo adecuado de un “estándar de referencia”; es decir, un criterio considerado una medida ideal del constructo. No en 351 todas las medidas puede evaluarse la validez de criterio porque no siempre existe un “estándar de referencia”. Hay dos tipos de validez de criterio. La validez concurrente es el tipo de validez de criterio que se valora cuando las mediciones del criterio y el instrumento focal ocurren al mismo tiempo. En tal situación, la hipótesis implícita es que la medición focal es un sustituto adecuado para un criterio contemporáneo. Por ejemplo, las calificaciones en una escala para medir el estrés podrían compararse con la concentración de cortisol libre salival al despertar (el criterio). En la validez predictiva, la medición focal se prueba contra un criterio que se mide en el futuro. Las escalas de detección a menudo se prueban contra algún criterio futuro; es decir, la presencia del fenómeno para el cual se busca un instrumento de detección (p. ej., una caída del paciente). Para muchos atributos humanos abstractos no observables (constructos), no existe un criterio que sea el estándar de referencia, por lo que deben buscarse otras vías de validación. La validez de constructo es el grado en que la evidencia sobre las calificaciones de una medición en relación con otras variables sustenta la inferencia de que el constructo estuvo bien representado. Casi siempre implica la prueba de una hipótesis, que sigue un trayecto similar: las hipótesis se desarrollan alrededor de una relación entre calificaciones sobre la medida focal y los valores de otros constructos, se recolectan datos para probar las hipótesis y luego se llega a las conclusiones de validez con base en los resultados de las pruebas de la hipótesis. Una estrategia para probar una hipótesis sobre la validez de constructo muy usual a veces se llama validez de grupos conocidos, la cual evalúa las hipótesis sobre la capacidad de una medición para discriminar entre dos o más grupos con diferencias conocidas (o anticipadas) respecto al constructo de interés. Por ejemplo, para validar una medida de ansiedad sobre la experiencia del trabajo de parto pueden contrastarse las calificaciones de las primíparas con las de las multíparas. En promedio, es probable que las mujeres que nunca han dado a luz experimenten más ansiedad que las que ya tuvieron hijos; podría cuestionarse la validez del instrumento si no surgieran tales diferencias. Ejemplo de validez de grupos conocidos Peters y sus colaboradores (2014) evaluaron la validez de una escala existente, la escala de confianza en el profesional, para una nueva 352 población: las mujeres afroamericanas embarazadas. Consistente con las hipótesis, las mujeres que habían experimentado racismo en la atención a la salud tuvieron calificaciones significativamente menores en la escala de confianza que las que no lo habían padecido. TIP Otro aspecto de la validez de constructo se llama validez transcultural, que es relevante para las mediciones que se traducen o adaptan para usarlas en un grupo cultural distinto al del instrumento original. La validez transcultural es el grado en que los componentes (p. ej., ítems) de una medición traducida o adaptada a una cultura funcionan de manera adecuada y equivalente respecto a su desempeño en el instrumento original. Un instrumento no tiene o carece de validez; es cuestión de grado. La validez de un instrumento no se comprueba, establece, demuestra o verifica, sino que se sustenta en mayor o menor medida mediante la evidencia. Los investigadores que realizan un estudio deben seleccionar las mediciones para las que existe información de validez adecuada. ANÁLISIS CRÍTICO A LOS MÉTODOS DE RECOLECCIÓN DE DATOS El objetivo del plan de recolección de datos es generar datos de excelente calidad. Toda decisión que tomen los investigadores sobre los métodos y procedimientos para recolectar datos puede afectar la calidad de los datos y, por lo tanto, la calidad general del estudio. Sin embargo, puede ser difícil analizar en forma crítica los métodos para la recolección de datos en estudios reportados en revistas porque las descripciones de los investigadores pocas veces son detalladas. No obstante, los investigadores tienen la responsabilidad de transmitir la información básica de su técnica para que los lectores puedan valorar la calidad de la evidencia que el estudio presenta. Un aspecto importante es la mezcla de técnicas para la recolección de datos. Por lo regular es conveniente la triangulación de métodos (p. ej., autorreporte y observación). La información sobre la calidad de los datos (confiabilidad y validez de las mediciones) debe incluirse en todo reporte de investigación cuantitativa. Lo ideal, sobre todo para escalas 353 compuestas, es que el reporte presente los coeficientes de consistencia interna con base en los datos del estudio mismo, no solo de la investigación previa. La confiabilidad entre calificadores o entre observadores es crucial para valorar la calidad de los datos en estudios que recurren a la observación. Los valores de los coeficientes de confiabilidad deben ser lo bastante altos para respaldar la confianza de los hallazgos. La validez es más difícil de documentar que la confiabilidad. Como mínimo, los investigadores deben defender su elección de las mediciones con base en información de validez de los desarrolladores y deben citar la publicación relevante. Los lineamientos para hacer el análisis crítico de los métodos para la recolección de datos se presentan en el recuadro 10-2. Recuadro 10-2 Lineamientos para la crítica de los planes de recolección de datos cuantitativos 1. ¿Los investigadores usaron el mejor método para capturar los fenómenos del estudio (es decir, autorreportes, observación, mediciones biofisiológicas)? ¿Se aprovechó la triangulación de métodos? 2. Si se usaron métodos de autorreporte, ¿los investigadores tomaron buenas decisiones sobre los métodos específicos usados para obtener información (p. ej., entrevistas en persona, cuestionarios por Internet, etcétera)? ¿Se utilizaron escalas compuestas? De no ser así, ¿debían haberse empleado? 3. Si se usaron métodos de observación, ¿el reporte describe de manera adecuada qué implicaron las observaciones y cómo se hizo el muestreo de observaciones? ¿Se corrigieron los riesgos de sesgo por observación? ¿Se utilizaron mediciones biofisiológicas en el estudio y ello fue apropiado? 4. ¿El reporte incluye información suficiente sobre los procedimientos para la recolección de datos? ¿Los recolectores de datos tuvieron el entrenamiento apropiado? 5. ¿El reporte ofrece evidencia de la confiabilidad de las mediciones? ¿La evidencia provino de la muestra de investigación misma o se basó en otros estudios? Si se informó la confiabilidad, ¿qué método se usó para calcularla? ¿La confiabilidad fue lo bastante alta? 6. ¿El reporte incluyó evidencia de la validez de las mediciones? Si se incluyó información sobre la validez, ¿qué técnica de validez se 354 usó? 7. Si no había información de la confiabilidad o validez, ¿a qué conclusión puede llegarse sobre la calidad de los datos del estudio? EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO En esta sección se describe el plan de muestreo y recolección de datos de un estudio cuantitativo de enfermería. Lea el resumen y luego responda las preguntas de pensamiento crítico; de ser necesario, consulte el reporte de investigación completo. El ejemplo 1 se encuentra en la sección Critical Thinking Activity del sitio web . Las preguntas de pensamiento crítico para el ejemplo 2 se basan en el estudio que aparece en el apéndice A de este libro. Los comentarios en inglés de las autoras sobre estos ejercicios están en la sección Student Resources en . EJEMPLO 1: MUESTREO Y RECOLECCIÓN DE DATOS EN UN ESTUDIO CUANTITATIVO Estudio. Los síntomas de insomnio se relacionan con función endotelial anormal (Routledge et al., 2015) (parte de la información sobre este estudio fue proporcionada en Rask et al., 2011). Objetivo. El objetivo de este estudio era probar la hipótesis de que los síntomas de insomnio se relacionan con decremento en la función endotelial en adultos que trabajan. Diseño. Los investigadores usaron los datos basales transversales de un estudio longitudinal que implicaba la recolección de datos extensos de personas incluidas en un estudio del Emory-Georgia Tech Predictive Health Institute. El diseño del estudio publicado por Routledge y sus colaboradores fue descriptivo de correlación. Muestreo. La cohorte inicial del estudio fue una muestra de empleados de tiempo completo de una universidad grande. La población de empleados elegibles se estratificó por tres tipos de empleo. A partir del marco de muestreo estratificado, cada 10.° empleado fue invitado a participar en la investigación. Cerca de 30% de los empleados solicitados aceptó ser 355 contactado y al final alrededor de 10% fue enrolado. Además, casi 10% de la muestra se obtuvo mediante muestreo por conveniencia de trabajadores por referencia propia o referencia de un profesional de salud. Los criterios específicos para el reclutamiento incluyeron empleados de 18 años de edad o más, sin hospitalización en el año precedente, salvo por accidentes. Los criterios de exclusión comprendieron antecedente de trastorno psicosocial grave en el año anterior, abuso de sustancias/fármacos o alcoholismo, neoplasia maligna activa vigente y cualquier enfermedad aguda en las 2 semanas anteriores a la recolección de datos basales. Para el propósito del estudio de Routledge y sus colaboradores, los participantes se excluyeron si tenían diagnóstico de apnea durante el sueño o síntomas de la misma. La muestra para este estudio fue de 496 adultos de 19 a 82 años. Recolección de datos. El estudio general implicó dos valoraciones basales, una valoración a los 6 meses y cuatro valoraciones anuales. Las mediciones basales usadas en el estudio de Routledge et al. incluyeron mediciones por autorreporte y biofisiológicas. En términos de los autorreportes, los participantes completaron un cuestionario en línea que contenía preguntas de sus antecedentes (p. ej., edad, género, estado de tabaquismo). El cuestionario también incluía varias escalas compuestas para medir la calidad del sueño (Pittsburgh Sleep Quality Index), depresión (Beck Depression Inventory) y somnolencia (Epworth Sleepiness Scale). La información de las escalas de sueño se usó para clasificar a los participantes en un grupo con insomnio o en un grupo con “mejor sueño”. Se hicieron mediciones antropomórficas (talla y peso, índice de masa corporal), se midió la presión sanguínea y se extrajo una muestra de sangre en la que se analizaron los lípidos. Por último, se determinó la función endotelial con mediciones de la dilatación mediada por flujo (DMF) de la arteria braquial. Las mediciones de DMF las realizaron dos técnicos en ultrasonido. No se proporcionó información de la confiabilidad y la validez de las diversas mediciones. Hallazgos clave. En esta muestra se informaron síntomas de insomnio en 40% de los participantes. Después del control estadístico para edad y otras variables, los investigadores encontraron que los participantes que referían síntomas de insomnio tenían DMF más baja que los participantes con mejor sueño. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 10-1 respecto a este estudio. 2. Responda las preguntas relevantes del recuadro 10-2 respecto a este estudio. 3. ¿Existen variables en este estudio que pudieron haberse medido 356 mediante observación pero no se hizo así? 4. Si los resultados de este estudio son válidos y confiables, ¿cuáles podrían ser algunos usos a los que podrían aplicarse los hallazgos en la práctica clínica? EJEMPLO 2: MUESTREO Y RECOLECCIÓN DE DATOS EN EL ESTUDIO DEL APÉNDICE A Lea la sección de métodos del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 10-1 para este estudio. 2. Responda las preguntas relevantes del recuadro 10-2 para este estudio. ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Vignettes and Q-Sorts. Respuestas a los ejercicios de pensamiento crítico para el ejemplo 2. Recursos en Internet con sitios web útiles para el capítulo 10. Un artículo de investigación de una revista de Wolters Kluwer, el estudio de Routledge et al. descrito en el ejemplo 1 en las pp. 178-179. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. 357 El muestreo es el proceso de selección de elementos de una población, que es un conjunto completo de casos. Un elemento es la unidad básica de una población, casi siempre seres humanos en la investigación en enfermería. Los criterios de elegibilidad (incluidos criterios de inclusión y criterios de exclusión) se usan para definir las características de la población. Un criterio clave para valorar una muestra en un estudio cuantitativo es su representatividad: el grado en que la muestra es similar a la población y en que evita sesgos. El sesgo de muestreo es la representación sistemática excesiva o insuficiente de algún segmento de la población. El muestreo no probabilístico (en el que los elementos se seleccionan por métodos no aleatorios) incluye el muestreo por conveniencia, por cuota, consecutivo e intencional. El muestreo no probabilístico es conveniente y económico; una desventaja sustancial es su tendencia a los sesgos. El muestreo por conveniencia usa a las personas más accesibles o convenientes. El muestreo por cuota divide a la población en estratos homogéneos (subpoblaciones) para asegurar la representación de los subgrupos en la muestra; en cada estrado, el muestreo de personas se hace por conveniencia. El muestreo consecutivo es la inclusión de todas las personas de una población accesible que cumplan los criterios de elegibilidad en un intervalo temporal específico o para alcanzar un tamaño de la muestra especificado. En el muestreo intencional, los participantes se eligen de forma manual para incluirlos en la muestra con base en el conocimiento del investigador sobre la población. 358 Los diseños con muestreo probabilístico, que implica la selección aleatoria de elementos de la población, generan muestras más representativas que los diseños no probabilísticos y permiten calcular la magnitud del error de muestreo. El muestreo aleatorio simple es la selección de elementos en un marco de muestreo que enumera todos los elementos; el muestreo aleatorio estratificado divide a la población en subgrupos homogéneos de los cuales se eligen los elementos al azar. El muestreo sistemático es la selección de cada k.° caso de una lista. Al dividir el tamaño de la población entre el tamaño deseado de la muestra, el investigador establece el intervalo de muestreo, que es la distancia estándar entre los elementos seleccionados. En los estudios cuantitativos, los investigadores pueden usar un análisis de poder para calcular el tamaño de la muestra necesario. Las muestras grandes son preferibles porque aumentan la validez de conclusión estadística y tienden a ser más representativas, pero incluso las muestras grandes no garantizan la representatividad. Los tres principales métodos para recolección de datos entre los investigadores de enfermería son los autorreportes, las observaciones y las mediciones biofisiológicas. Los autorreportes, también llamados resultados informados por el paciente, implican el cuestionamiento directo a los participantes del estudio y son el método más usual para obtener datos en los estudios de enfermería. Los autorreportes estructurados para los estudios cuantitativos requieren un instrumento formal –un cuestionario o un esquema de entrevista– que puede contener preguntas abiertas (que permiten a los sujetos responder con sus propias palabras) y preguntas cerradas (que ofrecen opciones de respuesta para que los sujetos elijan). Los cuestionarios son menos costosos que las entrevistas y ofrecen la posibilidad del anonimato, pero las entrevistas alcanzan tasas de respuesta más altas y son adecuadas para una mayor variedad de personas. 359 Las escalas psicológicas sociales son herramientas de autorreporte para medir características como las actitudes y los atributos psicológicos. Las escalas de Likert (escalas de calificación sumatoria) presentan a los sujetos una serie de ítems; cada uno recibe una calificación (p. ej., en un continuo desde completamente de acuerdo hasta completamente en desacuerdo) y luego se suman en una calificación compuesta. Una escala análoga visual (EAV) se usa para medir experiencias subjetivas (p. ej., dolor, fatiga) en una línea de 100 mm que designa un continuo bipolar. Las escalas son versátiles y poderosas, pero son susceptibles a sesgos de respuesta –la tendencia de algunas personas a responder a los ítems de maneras características, al margen del contenido de estos. Los métodos observacionales son técnicas para adquirir datos mediante la observación directa de los fenómenos. Las observaciones estructuradas dictan lo que el observador debe observar; por lo regular incluyen listas de verificación – instrumentos basados en sistemas de categorías para registrar la apariencia, frecuencia o duración de comportamientos o eventos–. Los observadores también pueden usar escalas de calificación para evaluar fenómenos en una dimensión de interés (p. ej., letárgico/energético). Las observaciones estructuradas suelen incluir un plan de muestreo (como muestreo por tiempo o muestreo por evento) para elegir los comportamientos, eventos y condiciones que van a observarse. Las técnicas de observación con frecuencia son esenciales, pero los sesgos por observación pueden reducir la calidad de los datos. Los datos también pueden obtenerse de mediciones biofisiológicas, que incluyen mediciones in vivo (las realizadas dentro o sobre los organismos vivos) y mediciones in vitro (las realizadas fuera del organismo, como las pruebas sanguíneas). Las mediciones biofisiológicas tienen la ventaja de ser objetivas, exactas y precisas. Para desarrollar un plan de recoleccion de datos, los investigadores deben decidir quién obtendrá los datos, cómo se 360 entrenará a los recolectores de datos y cuáles serán las circunstancias para recolectar los datos. En los estudios cuantitativos, las variables se miden. La medición implica la asignación de números para representar la cantidad de un atributo presente en una persona, con base en un conjunto de reglas; los investigadores se esfuerzan en usar mediciones que tengan reglas adecuadas con el fin de minimizar los errores de medición. Las medidas (y la calidad de los datos que aportan) pueden evaluarse en una valoración psicométrica en términos de varias propiedades de medición, por lo general confiabilidad y validez. La confiabilidad es el grado en el que las calificaciones para las personas que no cambiaron son las mismas en mediciones repetidas. Una medida confiable minimiza el error de medición. Los métodos para valorar la confiabilidad incluyen la confiabilidad test-retest (aplicar una medida dos veces en un periodo corto para ver si proporciona calificaciones consistentes), la confiabilidad entre calificadores (valorar si dos calificadores y observadores independientes asignan calificaciones similares) y la consistencia interna (valorar si existe consistencia entre los ítems de una escala compuesta que mide un rasgo). La confiabilidad se valora de manera estadística mediante el cálculo de coeficientes que van de 0.00 a 1.00; los valores más altos indican mayor confiabilidad. La validez es el grado en el que un instrumento mide lo que se supone que mide. Los aspectos de la validez incluyen validez frontal (el grado en que una medida parece medir el constructo en cuestión), validez de contenido (en las escalas compuestas, el grado en que el contenido de un instrumento captura adecuadamente el constructo), validez de criterio (el grado en que las calificaciones de una medida son un reflejo adecuado de un “estándar de referencia”) y validez de constructo (el grado en que un instrumento mide de manera adecuada el constructo deseado, valorado sobre todo mediante la verificación de las hipótesis). La validez de una medida no se comprueba ni se establece, sino 361 que se respalda en mayor o menor grado por la evidencia. REFERENCIAS DEL CAPÍTULO 10 Bryant, V., Phang, J., & Abrams, K. (2015). Verifying placement of smallbore feeding tubes: Electromagnetic device images versus abdominal radiographs. American Journal of Critical Care, 24, 525–530. Buettner-Schmidt, K., Lobo, M., Travers, M., & Boursaw, B. (2015). Tobacco smoke exposure and impact of smoking legislation on rural and non-rural hospitality venues in North Dakota. Research in Nursing & Health, 38, 268–277. *Burk, R., Grap, M., Munro, C., Schubert, C., & Sessler, C. (2014). Predictors of agitation in the adult critically ill. American Journal of Critical Care, 23, 414–423. Draughton Moret, J., Hauda, W., II, Price, B., & Sheridan, D. (2016). Nonoccupational postexposure human immunodeficiency virus prophylaxis: Acceptance following sexual assault. Nursing Research, 65, 47–54. Hewitt, C., & Cappiello, J. (2015). Essential competencies in nursing education for prevention and care related to unintended pregnancy. Journal of Obstetric, Gynecologic, & Neonatal Nursing, 44, 69–76. *Hu, R., Jiang, X., Hegadoren, K., & Zhang, Y. (2015). Effects of earplugs and eye masks combined with relaxing music on sleep, melatonin and cortisol levels in ICU patients: A randomized controlled trial. Critical Care, 19, 115. Huang, C. Y., Lai, H., Lu, Y., Chen, W., Chi, S., Lu, C., & Chen, C. (2016). Risk factors and coping style affect health outcomes in adults with type 2 diabetes. Biological Research for Nursing, 18, 82–89. *Joseph, P. V., Reed, D., & Mennella, J. (2016). Individual differences among children in sucrose detection thresholds. Nursing Research, 65, 3– 12. Kennedy, E., Murphy, G., Misener, R., & Alder, E. (2015). Development and psychometric assessment of the Nursing Competence Self-Efficacy Scale. Journal of Nursing Education, 54, 550–558. *Neta, D., DaSilva, A., & DaSilva, G. (2015). Adherence to foot self-care in diabetes mellitus patients. Revista Brasileira de Enfermagem, 68, 103–108. *Nilsen, M., Sereika, S., Hoffman, L., Barnato, A., Donovan, H., & Happ, M. (2014). Nurse and patient interaction behaviors’ effects on nursing care quality for mechanically ventilated older adults in the ICU. Research in Gerontological Nursing, 7, 113–125. Okoli, C., Kodet, J., & Robertson, H. (2016). Behavioral and physiological responses to nicotine patch administration among nonsmokers based on acute and chronic secondhand tobacco smoke exposure. Biological 362 Research for Nursing, 18, 60–67. Oliver, J., Ewell, P., Nicholls, K., Chapman, K., & Ford, S. (2016). Differences in colorectal cancer risk knowledge among Alabamians. Oncology Nursing Forum, 43, 77–85. Peters, R. M., Benkert, R., Templin, T., & Cassidy-Bushrow, A. (2014). Measuring African American women’s trust in provider during pregnancy. Research in Nursing & Health, 37, 144–154. Polit, D. F., & Yang, F. M. (2016). Measurement and the measurement of change: A primer for health professionals. Philadelphia, PA: Wolters Kluwer. Ranse, K., Yates, P., & Coyer, F. (2015). Factors influencing the provision of end-of-life care in critical care settings: Development and testing of a survey instrument. Journal of Advanced Nursing, 71, 697–709. Rask, K., Brigham, K., & Johns, M. (2011). Integrating comparative effectiveness research programs into predictive health: A unique role for academic health centers. Academic Medicine, 86, 718–723. Ratanasiripong, N. T. (2015). Factors related to human papillomavirus (HPV) vaccination in college men. Public Health Nursing, 32, 645–653. Ridout, J., Aucoin, J., Browning, A., Piedra, K., & Weeks, S. (2014). Does perioperative documentation transfer reliably? Computers, Informatics, Nursing, 32, 37–42. **Routledge, F., Dunbar, S., Higgins, M., Rogers, A., Feeley, C., Ioachimescu, O., ... Quyyumi, A. (2015). Insomnia symptoms are associated with abnormal endothelial function. Journal of Cardiovascular Nursing. Publicación anticipada en línea. Wang, W., Zhang, H., Lopez, V., Wu, V., Poo, D., & Kowitlawakul, Y. (2015). Improving awareness, knowledge and heart-related lifestyle of coronary heart disease among working population through a mHealth programme: Study protocol. Journal of Advanced Nursing, 71, 2200–2207. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 363 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Explicar la justificación para un diseño emergente en la investigación cualitativa y describir las características del diseño cualitativo. Identificar las principales tradiciones de investigación para la investigación cualitativa y describir el dominio de indagación de cada una. Describir las características y los métodos principales relacionados con estudios etnográficos, fenomenológicos y de teoría fundamentada. Describir las características clave de la investigación histórica, los estudios de casos, el análisis narrativo y los estudios cualitativos descriptivos. Explicar los objetivos y las características de la investigación con una perspectiva ideológica. Definir los términos nuevos del capítulo. Términos clave Análisis narrativo Comparación constante Datos en suspenso Diario reflexivo Diseño emergente Estudio cualitativo descriptivo Estudio de caso Etnografía crítica 364 Fenomenología descriptiva Fenomenología interpretativa Hermenéutica Investigación con enfoque de género Investigación de acción participativa (IAP) Investigación de etnoenfermería Investigación histórica Observación participante Proceso social básico (PSB) Teoría crítica Teoría fundamentada Teoría fundamentada constructivista Variable central EL DISEÑO DE ESTUDIOS CUALITATIVOS Los investigadores cuantitativos desarrollan un diseño de investigación antes de obtener los datos y rara vez se alejan de ese diseño cuando el estudio está en proceso: diseñan y luego hacen. En contraste, en la investigación cualitativa el diseño del estudio por lo regular evoluciona durante el proyecto: los investigadores cualitativos diseñan mientras hacen. Los estudios cualitativos usan un diseño emergente que evoluciona conforme los investigadores toman decisiones continuas sobre sus necesidades de datos con base en lo que ya aprendieron. Un diseño emergente respalda el deseo de los investigadores de que la indagación refleje las realidades y puntos de vista –que no se conocen al principio– de los sujetos en estudio. Características del diseño de investigación cualitativo La indagación cualitativa ha estado guiada por distintas disciplinas con diferentes métodos y enfoques. Sin embargo, algunas características del diseño de investigación cualitativa se aplican comúnmente. En general, el diseño cualitativo: Es flexible, capaz de ajustarse a lo que se aprende durante la recolección de datos. Implica la triangulación de varias estrategias de recolección de 365 datos. Tiende a ser holístico, se esfuerza por comprender el todo. Requiere que los investigadores participen de manera intensa y ref lexiva, y puede demandar mucho tiempo. Se beneficia del análisis continuo de los datos para guiar las estrategias subsiguientes. Aunque las decisiones del diseño no se finalizan con anticipación, los investigadores cualitativos suelen hacer planes que permiten su f lexibilidad. Por ejemplo, toman decisiones acerca de la tradición de investigación, el sitio de estudio, la estrategia general para la obtención de datos y el equipo que necesitarán en el campo. Estos investigadores planean una variedad de circunstancias, pero las decisiones acerca de cómo enfrentarlas se toman cuando se comprende mejor el contexto social. Características del diseño cualitativo Algunas de las características del diseño descritas en el capítulo 9 se aplican a los estudios cualitativos. Para contrastar el diseño cuantitativo y el cualitativo se consideran los elementos identificados en la tabla 9-1 de dicho capítulo. Intervención, control y cegamiento La investigación cualitativa casi nunca es experimental, aunque puede incluirse un subestudio cualitativo en un experimento (véase el capítulo 13). Los investigadores cualitativos no conceptualizan sus estudios en términos de variables independientes y dependientes, y rara vez controlan a las personas o el ambiente en estudio. También es raro que usen el cegamiento. El objetivo es desarrollar una comprensión detallada de un fenómeno tal como existe y como lo construyen individuos en su propio contexto. Comparaciones Por lo general, los investigadores cualitativos no planean hacer comparaciones grupales porque la intención es realizar una descripción minuciosa o explicar un fenómeno. Sin embargo, a veces los patrones que surgen en los datos sugieren comparaciones ilustrativas. En realidad, como señaló Morse (2004) en un editorial en 366 la revista Qualitative Health Research, “toda descripción requiere comparaciones” (p. 1323). Para analizar los datos cualitativos y determinar si las categorías están saturadas, es necesario comparar “esto” con “aquello”. Ejemplo de comparaciones cualitativas Olsson y sus colaboradores (2015) estudiaron las decisiones que los pacientes toman acerca de someterse a la implantación de válvula aórtica transcatéter para corregir la estenosis aórtica grave. Identificaron tres patrones distintivos de toma de decisión en su muestra de 24 pacientes, quienes eran ya sea ambivalentes con respecto al tratamiento, obedientes y dispuestos a permitir que otros decidieran, o conciliadores y tolerantes al tratamiento. Sitios de la investigación Los investigadores cualitativos casi siempre obtienen sus datos en sitios naturales. Mientras los investigadores cuantitativos por lo general se esfuerzan en obtener los datos en un tipo de sitio para mantener la constancia de condiciones (p. ej., conducir todas las entrevistas en las casas de los participantes), los investigadores cualitativos pueden estudiar los fenómenos de manera deliberada en varios contextos naturales, sobre todo en la investigación etnográfica. Marcos temporales Como la investigación cuantitativa, la cualitativa puede ser transversal, con un punto de recolección de datos, o longitudinal, con múltiples puntos para la obtención de datos y diseñada para observar la evolución de un fenómeno. Ejemplo de un estudio cualitativo longitudinal Hansen y sus colaboradores (2015) estudiaron las experiencias de enfermedad de pacientes con carcinoma hepatocelular cerca del final de su vida. Los datos se obtuvieron en entrevistas detalladas con 14 pacientes una vez al mes hasta por 6 meses. Causalidad e investigación cualitativa 367 En las jerarquías de evidencia que ordenan esta en términos del apoyo a las inferencias causales (p. ej., la mostrada en la fig. 2-1 del capítulo 2), la investigación cualitativa por lo regular está cerca de la base, lo que ha llevado a algunos a criticar las iniciativas basadas en la evidencia. El aspecto de la causalidad, que ha sido controvertido durante toda la historia de la ciencia, es polémico en la investigación cualitativa. Algunos creen que la causalidad es un constructo inapropiado en el paradigma naturalista. Por ejemplo, Lincoln y Guba (1985) dedicaron un capítulo completo de su libro a hacer una crítica de la causalidad y argumentaron que debe sustituirse por un concepto que llamaron moldeado mutuo. Según su punto de vista, “todo influye en todo lo demás, en el aquí y ahora” (p. 151). Sin embargo, otros creen que los métodos cualitativos son muy adecuados para comprender las relaciones causales. Por ejemplo, Huberman y Miles (1994) argumentaron que los estudios cualitativos “pueden examinar de manera directa y longitudinal los procesos locales subyacentes a una serie temporal de eventos y estados, muestran cómo estos condujeron a resultados específicos y descartan las hipótesis rivales” (p. 434). En un intento no solo de describir sino también de explicar los fenómenos, es inevitable que los investigadores cualitativos que realizan estudios a profundidad revelen patrones y procesos sugestivos de interpretaciones causales. Estas interpretaciones pueden ser (y a menudo lo son) sujetas a pruebas más sistemáticas con métodos de investigación más controlados. TRADICIONES DE INVESTIGACIÓN CUALITATIVA Hay una gran variedad de enfoques cualitativos. Un sistema de clasificación categoriza la investigación cualitativa con base en tradiciones disciplinarias, las cuales varían en su conceptualización de los tipos de preguntas que es importante formular y en los métodos que consideran apropiados para responderlas. La tabla 11-1 presenta las generalidades de varias de estas tradiciones, algunas de las cuales ya se presentaron antes. Esta sección describe las que han sido prominentes en la investigación en enfermería. 368 Etnografía La etnografía es la descripción e interpretación de una cultura y el comportamiento cultural. Cultura se refiere a la manera en que vive un grupo de personas: los patrones de actividad humana y los valores y normas que dan significado a la actividad. Por lo general, la etnografía implica un extenso trabajo de campo, el proceso por el cual el etnógrafo comprende una cultura. Como la cultura no es visible o tangible por sí misma, debe inferirse a partir de las palabras, las acciones y los productos de los miembros de un grupo. En ocasiones, la investigación etnográfica se ocupa de culturas definidas de manera amplia (p. ej., la cultura maorí de Nueva Zelanda) en lo que se conoce como macroetnografía. Sin embargo, a veces los etnógrafos se enfocan en culturas definidas de modo más estrecho en la etnografía enfocada. Esta se refiere a estudios de pequeñas unidades en un grupo o cultura (p. ej., la cultura de una unidad de cuidados intensivos). Una suposición subyacente del etnógrafo es que, al final, todo grupo humano desarrolla una cultura que guía la visión que sus miembros tienen del mundo y el modo en que estructuran sus experiencias. Ejemplo de etnografía enfocada Taylor y sus colaboradores (2015) usaron un enfoque etnográfico enfocado para estudiar las experiencias de los profesionales en enfermería en la atención de adultos de edad avanzada en la sala de urgencias. 369 Los etnógrafos buscan aprender (más que estudiar) sobre los miembros de un grupo cultural para comprender su visión del mundo. Los etnógrafos distinguen las perspectivas “emic” y “etic”. Una perspectiva emic se refiere a la forma en que los miembros de una cultura consideran su mundo, la visión “desde dentro”. Emic es el conjunto de conceptos locales o medios de expresión usados por los miembros del grupo en estudio para caracterizar sus experiencias. En contraste, la perspectiva etic es la interpretación de los extraños acerca de las experiencias de la cultura –las palabras y los conceptos que usan para referirse al mismo fenómeno–. Los etnógrafos se esfuerzan en adquirir una perspectiva emic de una cultura y revelar el conocimiento tácito, la información sobre la cultura que está tan embebida en las experiencias culturales que los miembros no hablan al respecto, tal vez ni siquiera estén conscientes de esta. Los etnógrafos casi siempre buscan tres tipos generales de información: comportamiento cultural (qué hacen los integrantes de la cultura), artefactos culturales (qué elaboran y usan los miembros) y lenguaje cultural (qué dicen). Los etnógrafos dependen de una variedad muy amplia de fuentes de datos, incluidos observaciones, entrevistas detalladas, registros y otros tipos de evidencia física (p. ej., fotografías, diarios). Por lo general, los etnógrafos usan una estrategia llamada observación participante en la que hacen observaciones de la cultura en estudio mientras participan en sus actividades. Los etnógrafos también aprovechan la colaboración de informantes clave para ayudarlos a comprender e interpretar los sucesos y actividades que observan. La investigación etnográfica consume mucho tiempo: es probable que se requieran meses y aun años de trabajo de campo para aprender de una cultura. La etnografía requiere cierto nivel de intimidad con los miembros del grupo cultural y tal intimidad solo puede desarrollarse con el tiempo y al trabajar con los miembros como participantes activos. Los productos de las etnografías son descripciones e interpretaciones ricas e integrales de la cultura en estudio. Entre los investigadores de atención a la salud, la etnografía permite acceder a las creencias con respecto a la salud y las prácticas de salud de una cultura. La investigación etnográfica ayuda a comprender los comportamientos que influyen en la salud y la enfermedad. Leininger (1985) acuñó la frase investigación de etnoenfermería, que definió como “el estudio y análisis de los puntos de vista de las personas 370 locales o indígenas, sus creencias y prácticas sobre el comportamiento y los procesos de la atención de enfermería de las culturas designadas” (p. 38). Ejemplo de un estudio de etnoenfermería López Entrambasaguas y sus colaboradores (2015) realizaron un estudio de etnoenfermería para describir y comprender los patrones culturales relacionados con el riesgo de contraer VIH entre las mujeres ayoreo (indígenas de Bolivia) que son trabajadoras sexuales. Aunque no siempre, los etnógrafos por lo regular son “extranjeros” para la cultura que estudian. Un tipo de etnografía que implica autoescrutinio (incluye escrutinio de los grupos o culturas a los que los investigadores pertenecen) se conoce como autoetnografía o investigación interna. La autoetnografía tiene varias ventajas, como la facilidad de reclutamiento y la capacidad para obtener datos honestos derivados de una confianza prestablecida. La limitación es que un “observador interno” puede tener sesgos sobre ciertos aspectos o puede estar tan embebido en la cultura que le pasen inadvertidos datos valiosos. Fenomenología La fenomenología es una estrategia para comprender las experiencias de la vida cotidiana de las personas. Los investigadores fenomenológicos preguntan: ¿cuál es la esencia de este fenómeno según lo experimentan estas personas y qué significa? Los fenomenólogos asumen que hay una esencia –una estructura fundamental– que puede comprenderse, tal como los etnógrafos asumen que existen las culturas. La esencia es lo que hace que un fenómeno sea lo que es y sin lo cual no lo sería. Los fenomenólogos investigan fenómenos subjetivos con la creencia de que las verdades críticas sobre la realidad están fundamentadas en las experiencias de vida de las personas. Los temas apropiados para la fenomenología son los fundamentales para las experiencias de los humanos, como el significado del sufrimiento o la calidad de vida con dolor crónico. En los estudios fenomenológicos, la principal fuente de datos es la conversación profunda. Mediante estas conversaciones, los investigadores buscan ingresar al mundo del informante y tener 371 acceso a sus experiencias tal como las vive. Los estudios fenomenológicos casi siempre incluyen un número pequeño de participantes, por lo regular 10 o menos. Para algunos investigadores fenomenológicos, la investigación incluye no solo la recolección de datos de los informantes, también esfuerzos para experimentar el fenómeno, a través de la participación, observación y reflexión. Los fenomenólogos comparten sus conocimientos en reportes detallados y vívidos que describen temas clave. La sección de resultados en un reporte fenomenológico debe ayudar a los lectores a “ver” algo de una manera distinta que enriquezca su comprensión de las experiencias. La fenomenología tiene diversas variantes e interpretaciones. Las dos escuelas principales de pensamiento son la fenomenología descriptiva y la fenomenología interpretativa (hermenéutica). Fenomenología descriptiva La fenomenología descriptiva fue desarrollada por Husserl, quien estaba interesado sobre todo en una pregunta: ¿qué sabemos como personas? Los fenomenólogos descriptivos insisten en la presentación cuidadosa de la experiencia consciente ordinaria de la vida diaria: una presentación de las “cosas” tal como las experimentan las personas. Estas “cosas” incluyen oír, ver, creer, sentir, recordar, decidir y evaluar. Los estudios fenomenológicos descriptivos a menudo incluyen estos cuatro pasos: datos en suspenso, intuición, análisis y descripción. Los datos en suspenso se refieren al proceso de identificar y mantener en suspenso las creencias preconcebidas y las opiniones sobre el fenómeno en estudio. Los investigadores buscan dejar en suspenso sus suposiciones previas en un esfuerzo por confrontar los datos en forma pura. Los investigadores fenomenológicos (así como otros investigadores cualitativos) suelen llevar un diario reflexivo en sus esfuerzos por mantener los datos en suspenso. La intuición, el segundo paso en la fenomenología descriptiva, ocurre cuando los investigadores se mantienen abiertos ante los significados atribuidos al fenómeno por aquellos que lo experimentaron. Los investigadores fenomenológicos proceden luego al análisis (es decir, a extraer declaraciones significativas, clasificar y dar sentido a los significados esenciales). Por último, la fase 372 descriptiva ocurre cuando los investigadores comprenden y definen el fenómeno. Ejemplo de estudio fenomenológico descriptivo Meyer y sus colaboradores (2016) usaron un enfoque fenomenológico descriptivo en su estudio de experiencias de cónyuges que viven con una pareja afectada por demencia. Fenomenología interpretativa Heidegger, un discípulo de Husserl, es el fundador de la fenomenología interpretativa o hermenéutica. Heidegger hizo énfasis en la interpretación y comprensión, no solo en la descripción, de la experiencia humana. Él creía que la experiencia vivida es en sí un proceso interpretativo y argumentaba que la hermenéutica (“comprensión”) es una característica básica de la existencia humana. (El término hermenéutica se refiere al arte y la filosofía de interpretar el significado de un objeto, como un texto o una obra de arte.) Los objetivos de la investigación fenomenológica interpretativa son ingresar al mundo de otro y descubrir los entendimientos que ahí se encuentren. Gadamer, otro fenomenólogo interpretativo, describió el proceso interpretativo como una relación circular –el círculo hermenéutico– en la que uno comprende la totalidad de un texto (p. ej., la transcripción de una entrevista) en términos de sus partes y las partes en términos del todo. Los investigadores cuestionan continuamente los significados del texto. Heidegger creía que es imposible evitar el “estar en el mundo” personal, por lo que los datos en suspenso no se incluyen en la fenomenología interpretativa. La hermenéutica presupone la comprensión previa por parte del investigador. Lo ideal es que los fenomenólogos interpretativos aborden el texto de cada entrevista con apertura; deben estar abiertos a escuchar lo que el texto dice. Como los fenomenólogos descriptivos, los interpretativos dependen sobre todo de entrevistas detalladas con individuos que experimentaron el fenómeno de interés, pero pueden rebasar un enfoque tradicional para reunir y analizar datos. Por ejemplo, los fenomenólogos interpretativos a veces mejoran su comprensión del fenómeno mediante el análisis de textos complementarios, como 373 novelas, poemas u otras expresiones artísticas, o usan tales materiales en sus conversaciones con los participantes en el estudio. Ejemplo de un estudio fenomenológico interpretativo LaDonna y sus colaboradores (2016) usaron un enfoque fenomenológico interpretativo en su exploración de la experiencia de atender a personas con disfagia y distrofia miotónica. TIP CÓMO SABER ¿Cómo puede decirse si un estudio fenomenológico es descriptivo o interpretativo? Los fenomenólogos por lo regular usan términos que ayudan a saberlo. En un estudio fenomenológico descriptivo, esos términos pueden ser datos en suspenso, descripción, esencia y Husserl. Los nombres Colaizzi, van Kaam o Giorgi pueden mencionarse en la sección de métodos. En un estudio fenomenológico interpretativo, los términos clave pueden incluir estar en el mundo, hermenéutica, comprensión y Heidegger. Los nombres van Manen o Benner pueden aparecer en la sección del método, como se explica en el capítulo 16 relativo al análisis de datos cualitativos. Teoría fundamentada La teoría fundamentada ha contribuido al desarrollo de muchas teorías de rango intermedio de fenómenos relevantes para los profesionales de enfermería. Fue desarrollada en los años 1960 por dos sociólogos, Glaser y Strauss (1967), cuyas raíces teóricas estaban en la interacción simbólica, que se enfoca en la manera en que las personas dan sentido a sus interacciones sociales. La teoría fundamentada intenta explicar las acciones de las personas desde la perspectiva de los implicados. Los investigadores de la teoría fundamentada buscan identificar una preocupación o problema principal y luego comprender el comportamiento diseñado para resolverlo: la variable central. Un tipo de variable central es un proceso social básico (PSB). Los investigadores de la teoría fundamentada generan categorías conceptuales y las integran en una teoría sustantiva, basada en los datos. Métodos de la teoría fundamentada 374 Los métodos de la teoría fundamentada constituyen un enfoque completo para la conducción de la investigación de campo. Un estudio que siga realmente los preceptos de Glaser y Strauss (1967) no comienza con un problema de investigación enfocado. El problema y el proceso usado para resolverlo surgen de los datos y se descubren durante el estudio. En la investigación por teoría fundamentada, la recolección de datos, el análisis de datos y el muestreo de participantes ocurren al mismo tiempo. El proceso de la teoría fundamentada es repetitivo: los investigadores reúnen datos, los clasifican, describen el fenómeno central que surge y luego reciclan sus pasos anteriores. Se utiliza un procedimiento llamado comparación constante para desarrollar y refinar los conceptos y categorías teóricamente relevantes. Las categorías derivadas de los datos se comparan de manera constante con los datos obtenidos con anterioridad para poder detectar los puntos comunes y las variaciones. Conforme la recolección de datos continúa, la indagación se enfoca cada vez más en la teoría emergente. Las entrevistas detalladas y la observación participante son fuentes frecuentes de datos en los estudios por teoría fundamentada, aunque también pueden usarse documentos existentes y otros datos. Por lo general, un estudio de teoría fundamentada incluye entrevistas con una muestra de 20 a 30 personas. Visiones alternativas de la teoría fundamentada En 1990, Strauss y Corbin publicaron un libro controversial, Basics of Qualitative Research: Techniques and Procedures for Developing Grounded Theory. El propósito declarado del libro era proporcionar a los investigadores de la teoría fundamentada principiantes los procedimientos básicos para construir una teoría fundamentada. Ese libro se encuentra en su cuarta edición (Corbin y Strauss, 2015). Sin embargo, Glaser estuvo en desacuerdo con algunos procedimientos defendidos por Strauss (su coautor original) y Corbin (un investigador en enfermería). Glaser (1992) creía que Strauss y Corbin (1990) desarrollaron un método que no es una teoría fundamentada, sino lo que él llamó “una descripción conceptual completa”. Según Glaser, el propósito de la teoría fundamentada es generar conceptos y teorías que expliquen y consideren la variación en el comportamiento en el área sustantiva de estudio. En contraste, la 375 descripción conceptual se enfoca en describir el conjunto completo de comportamiento de lo que ocurre en el área sustantiva. Los investigadores en enfermería han realizado estudios de teoría fundamentada con el enfoque original de Glaser y Strauss (1967) y con el de Corbin y Strauss (2015). También emplean un planteamiento llamado teoría fundamentada constructivista (Charmaz, 2014). Charmaz (2014) considera que la teoría fundamentada de Glaser y Strauss tiene raíces positivistas. En el enfoque de Charmaz, la teoría fundamentada se considera como una interpretación. Los datos obtenidos y analizados se reconocen como construcciones a partir de las experiencias compartidas y las relaciones entre el investigador y los participantes. Los datos y análisis se consideran como construcciones sociales. Ejemplo de un estudio de teoría fundamentada Johansson y sus colaboradores (2015) usaron métodos de la teoría fundamentada constructivista para explorar la autorreorientación en la fase de recuperación temprana después del tratamiento de cáncer colorrectal. Los datos se reunieron mediante entrevistas detalladas con 17 pacientes 3 a 9 meses después de la cirugía. Investigación histórica La investigación histórica es la recolección sistemática y la evaluación crítica de datos relativos a hechos pasados. La investigación histórica depende sobre todo de datos cualitativos (narrativos), aunque a veces puede implicar el análisis estadístico de datos cuantitativos. Los profesionales de enfermería han usado métodos de investigación histórica para examinar una gran variedad de fenómenos tanto del pasado reciente como del pasado más distante. Los datos de la investigación histórica casi siempre están en forma de registros escritos: diarios, cartas, periódicos, documentos médicos, etcétera. Los materiales no escritos, como fotografías y películas, pueden considerarse formas de datos históricos. En algunos casos es posible realizar entrevistas con personas que participaron en eventos históricos (p. ej., profesionales de enfermería que prestaron servicio en guerras recientes). La investigación histórica suele ser interpretativa. Los 376 investigadores históricos intentan describir qué ocurrió y también cómo y por qué sucedió. Las relaciones entre los eventos y las ideas, entre personas y organizaciones, se exploran e interpretan dentro de su contexto histórico y dentro del contexto de nuevos puntos de vista acerca de lo que tiene relevancia histórica. Ejemplo de investigación histórica Irwin (2016) condujo un estudio histórico sobre el papel de las enfermeras en las relaciones entre Estados Unidos y Europa después de la Primera Guerra Mundial. El análisis se basó en cartas, diarios, reportes oficiales y artículos publicados del papel de las enfermeras de la American Red Cross. OTROS TIPOS DE INVESTIGACIÓN CUALITATIVA Los estudios cualitativos por lo regular pueden caracterizarse y describirse en términos de las tradiciones de investigación disciplinarias descritas en la sección anterior. Sin embargo, también ameritan una mención otros tipos importantes de investigación cualitativa no relacionados con una disciplina particular. Estudios de casos Los estudios de casos son investigaciones profundas de una sola entidad o un pequeño número de entidades. Puede considerarse como entidad un individuo, una familia, institución u otra unidad social. Los investigadores que realizan estudios de casos intentan comprender aspectos importantes para las circunstancias de la entidad focal. En la mayoría de los estudios, cuantitativos o cualitativos, ciertos fenómenos o variables son el centro de la indagación. En un estudio de caso, el caso mismo está en “el escenario central”. Por lo general, los estudios de casos se enfocan en comprender por qué un individuo piensa, se comporta o se desarrolla de una forma particular, no en cuáles son su estado o sus acciones. La investigación de este tipo puede requerir estudio por un tiempo considerable. Con frecuencia no solo se obtienen datos del estado actual de la persona, sino también de experiencias pasadas relevantes para el problema que se examina. 377 La mayor fortaleza de los estudios de casos es la profundidad que es posible alcanzar cuando se investiga un pequeño número de entidades. Los investigadores que realizan estudios de casos pueden adquirir un conocimiento íntimo de los sentimientos, las acciones y las intenciones de una persona. Aun así, esta misma fortaleza es una debilidad potencial: la familiaridad de los investigadores con el caso puede dificultar más la objetividad. Otra limitación de los estudios de casos se refiere a la generalizabilidad. Si los investigadores descubren relaciones importantes, resulta difícil saber si las mismas relaciones ocurrirían con otros. Sin embargo, los estudios de casos pueden tener sitio en las generalizaciones difíciles de otros tipos de investigación. Ejemplo de un estudio de caso Graneheim y sus colaboradores (2015) realizaron un estudio detallado de casos que se enfocó en las interacciones entre los cuidadores profesionales y una mujer con esquizofrenia y demencia. Los datos se obtuvieron mediante observaciones y entrevistas en la casa de la mujer. Análisis narrativo El análisis narrativo se enfoca en la historia como objeto de investigación para comprender cómo los individuos dan sentido a los eventos de su vida. La premisa subyacente de la investigación narrativa es que las personas dan sentido de manera más efectiva a su mundo, y comunican estos significados, mediante la narración de historias. Las personas construyen historias cuando desean comprender eventos y situaciones específicos que requieren la vinculación con un mundo interior de necesidades con un mundo exterior de acciones observables. El análisis de historias abre formas de relatar la experiencia y es más que solo contenido. Los analistas narrativos preguntan: ¿por qué la historia se relató de esa manera? Pueden usarse varios enfoques estructurales para analizar historias, incluidos los basados en el análisis literario y la lingüística. Ejemplo de análisis narrativo Tobin y sus colaboradores (incluida Beck, autora de este libro) (2014) condujeron un análisis narrativo de la experiencia del parto de mujeres que buscan asilo en Irlanda. Veintidós madres relataron sus historias en entrevistas detalladas que duraron entre 40 y 90 minutos. En sus 378 narraciones resaltaron la falta de comunicación, conexión y atención culturalmente competente. Estudios cualitativos descriptivos Muchos estudios cualitativos no declaran raíces disciplinarias o metodológicas particulares. Los investigadores pueden indicar solo que condujeron un estudio cualitativo, una investigación naturalista o un análisis de contenido de datos cualitativos (es decir, un análisis de temas y patrones que surgen en el contenido narrativo). Por lo tanto, algunos estudios cualitativos no tienen un nombre formal o no se adaptan a la tipología que se presentó en este capítulo. Las autoras se refieren a estos como estudios cualitativos descriptivos. Los estudios cualitativos descriptivos tienden a ser eclécticos en su diseño y métodos, y se basan en las premisas generales de la investigación constructivista. Estos estudios pocas veces se describen en los libros de métodos de investigación. El suplemento en inglés de este capítulo en el sitio web presenta información de los estudios cualitativos descriptivos y los estudios que la investigadora en enfermería Sally Thorne (2013) llamó descripción interpretativa. Ejemplo de un estudio cualitativo descriptivo Cal y Bahar (2015) realizaron un estudio cualitativo descriptivo para explorar las barreras de las mujeres para la prevención del linfedema después de la cirugía por cáncer mamario. Los investigadores condujeron entrevistas detalladas con 14 mujeres que tenían linfedema. Investigación con perspectivas ideológicas Algunos investigadores cualitativos conducen indagaciones en un marco ideológico, por lo general para llamar la atención hacia ciertos problemas sociales o hacia las necesidades de ciertos grupos, y para inducir un cambio. Estos enfoques representan vías de investigación importantes. Teoría crítica La teoría crítica se originó con un grupo de académicos alemanes con orientación marxista en la década de 1920. En esencia, un 379 investigador crítico se encarga de criticar a la sociedad y vislumbrar nuevas posibilidades. La ciencia social crítica está orientada a la acción. Su objetivo es concientizar a las personas sobre las contradicciones y disparidades en las prácticas sociales e inspirarlas al cambio. La teoría crítica conlleva investigaciones que promueven un mayor autoconocimiento y la acción sociopolítica. Los investigadores críticos por lo regular triangulan métodos y hacen énfasis en múltiples perspectivas (p. ej., perspectivas alternativas raciales o de clases sociales) para los problemas. Los investigadores críticos casi siempre interactúan con los participantes de maneras que subrayan la pericia de estos últimos. La teoría crítica se ha aplicado en varias disciplinas, pero ha tenido un papel de importancia particular en la etnografía. La etnografía crítica se enfoca en generar consciencia con la esperanza de inducir un cambio social. Los etnógrafos críticos intentan aumentar las dimensiones políticas de la investigación cultural y minar los sistemas opresores. Ejemplo de una etnografía crítica Speechley y sus colaboradores (2015) desarrollaron un “etnodrama” para catalizar el diálogo en la atención a la demencia en casa. El guion se basó en un estudio etnográfico crítico que siguió durante 18 meses a personas que vivían con demencia y sus cuidadores. El texto estaba diseñado para difundir sus hallazgos en la investigación “de manera que catalice y fomente el diálogo crítico (procesable)” (p. 1551). Investigación con enfoque de género La investigación con enfoque de género es similar a la investigación con teoría crítica, pero se enfoca en el domino de género y la discriminación dentro de las sociedades patriarcales. Como los investigadores críticos, los investigadores con enfoque de género buscan establecer relaciones de colaboración y no exploratorias con sus informantes y conducir una investigación transformadora. También buscan comprender cómo el género y un orden social de généro han delineado las vidas de las mujeres. El objetivo es facilitar el cambio para terminar con la posición social desigual de las mujeres. Si bien surgió en el marco del movimiento feminista, en la actualidad este enfoque teórico tiende a la equidad entre hombres y 380 mujeres. Los métodos de investigación con enfoque de género casi siempre incluyen entrevistas detalladas, interactivas y colaborativas individuales o grupales que ofrecen la posibilidad de tener encuentros que permitan la educación recíproca. Por lo general, los investigadores con enfoque de género buscan negociar los significados de los resultados con los que participan en el estudio y ser autorreflexivos sobre lo que aprenden. Ejemplo de investigación con enfoque de género Sutherland y sus colaboradores (2016) usaron una lente con enfoque de género crítica en su estudio de los procesos que moldean las desigualdades de género en la atención en asilos e instituciones de cuidados paliativos para adultos mayores con cáncer. Investigación de acción participativa La investigación de acción participativa (IAP), también llamada investigación acción, se basa en la idea de que la generación de conocimiento puede usarse para ejercer el poder. Los investigadores de IAP suelen trabajar con grupos o comunidades vulnerables al control u opresión de un grupo dominante. La tradición de IAP se origina en una preocupación por la impotencia del grupo de estudio. En la IAP, los investigadores y los participantes colaboran para definir el problema, seleccionar métodos de investigación, analizar los datos y decidir cómo se usarán los hallazgos. El objetivo de la IAP no es solo producir conocimiento, sino también iniciar la acción, el empoderamiento y la generación de conciencia. En la IAP, los métodos de investigación se diseñan para facilitar los procesos de colaboración que pueden motivar y generar la solidaridad comunitaria. Por lo tanto, las estrategias para “recolección de datos” no nada más son los métodos habituales de entrevista y observación, sino también el relato de historias, el sociodrama, la fotografía y otras actividades diseñadas para alentar a las personas a encontrar formas creativas para explorar sus vidas, contar sus historias y reconocer sus propias fortalezas. Ejemplo de investigación de acción participativa 381 Baird y sus colaboradores (2015) usaron la investigación de acción basada en la comunidad para explorar la sociedad entre investigadores, estudiantes y mujeres refugiadas de Sudán del Sur para corregir los problemas de salud derivados del reasentamiento de las mujeres en Estados Unidos. ANÁLISIS CRÍTICO A LOS DISEÑOS CUALITATIVOS Por lo regular es difícil hacer un análisis crítico a un diseño cualitativo. Los investigadores cualitativos no siempre documentan sus decisiones de diseño ni describen el proceso por el que se tomaron las decisiones. Sin embargo, los investigadores suelen indicar si el estudio se realizó dentro de una tradición cualitativa específica. Esta información puede usarse para llegar a algunas conclusiones acerca del diseño del estudio. Por ejemplo, si un reporte indica que el investigador realizó 2 meses de trabajo de campo para un estudio etnográfico, podría sospecharse que el tiempo en el campo no fue suficiente para obtener una perspectiva emic de la cultura en estudio. Los estudios etnográficos también pueden criticarse si su única fuente de información fue la entrevista en lugar de usar una mayor variedad de fuentes, en particular observaciones. En un estudio de teoría fundamentada, se busca evidencia sobre cuándo se obtuvieron y analizaron los datos. Si el investigador obtuvo todos los datos antes de analizarlos, podría cuestionarse si el método de comparación constante se usó de manera correcta. En el análisis crítico de un estudio fenomenológico, primero debe determinarse si el estudio es descriptivo o interpretativo. Esto ayudará a valorar la cercanía que mantuvo el investigador a los principios básicos de esa tradición de investigación cualitativa. Por ejemplo, en un estudio fenomenológico descriptivo, ¿el investigador recurrió a los datos en suspenso? Cuando se hace el análisis crítico de un estudio fenomenológico, además de criticar la metodología también debe valorarse su poder para capturar el significado de los fenómenos que se estudian. Sin importar el diseño cualitativo que se identifique en un estudio, hay que buscar si los investigadores se mantuvieron apegados a una sola tradición cualitativa durante todo el estudio o si combinaron tradiciones cualitativas. Por ejemplo, ¿el investigador declaró que se 382 utilizó la teoría fundamentada pero luego presentó resultados que describen temas en lugar de una teoría sustantiva? Los lineamientos del recuadro 11-1 se diseñaron como ayuda para el análisis crítico de los diseños de estudios cualitativos. Recuadro 11-1 Lineamientos para el análisis crítico de diseños cualitativos 1. ¿Se identificó la tradición de investigación del estudio cualitativo? Si no se identificó, ¿puede inferirse alguna? 2. ¿La pregunta de investigación es congruente con un enfoque cualitativo y con la tradición de investigación específica? ¿Las fuentes de datos y los métodos de investigación son congruentes con la tradición de investigación? 3. ¿Qué tan bien se describió el diseño de investigación? ¿Se explican y justifican las decisiones del diseño? ¿Parece que el diseño surgió durante la recolección de datos para permitir a los investigadores capitalizar la información inicial? 4. ¿Se prestó el diseño a un examen minucioso y profundo del fenómeno principal? ¿Hubo evidencia de reflexividad? ¿Qué elementos del diseño pudieron fortalecerse en el estudio (p. ej., una perspectiva longitudinal en lugar de una transversal)? 5. ¿Se realizó el estudio con una perspectiva ideológica? De ser así, ¿hay evidencia del logro de los objetivos ideológicos (¿hubo colaboración completa entre los investigadores y los participantes?, ¿el investigador tuvo el poder de inducir una transformación?)? EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO Esta sección presenta ejemplos de estudios cualitativos. Lea estos resúmenes y luego responda las preguntas de pensamiento crítico; de ser necesario, consulte el reporte de investigación completo. El ejemplo 1 se presenta en la sección Critical Thinking Activity del sitio web . Las preguntas de pensamiento crítico para el ejemplo 2 se basan en el estudio que aparece en el apéndice B de este libro. Los comentarios en inglés de las autoras sobre estos 383 ejercicios están en la sección Student Resources en . EJEMPLO 1: UN ESTUDIO DE TEORÍA FUNDAMENTADA Estudio. El proceso psicológico de las pacientes con cáncer mamario que reciben la quimioterapia inicial (Chen et al., 2015). Objetivo. El objetivo del estudio era generar una teoría para describir las etapas psicológicas de pacientes de Taiwán con cáncer mamario que se someten a la quimioterapia inicial. Método. Los investigadores usaron el enfoque de Glaser (1992) para la teoría fundamentada con el fin de comprender los procesos psicológicos de las mujeres. Las mujeres se captaron en un hospital académico en el sur de Taiwán. Se invitó a participar en el estudio a 20 mujeres que habían terminado su primera ronda de quimioterapia y ninguna se rehusó. Las participantes se eligieron hacia el final del estudio con base en las categorías que surgieron del análisis de los datos iniciales. Se realizaron entrevistas detalladas, de 30 a 60 minutos de duración, en una habitación privada tranquila en el hospital; las llevó a cabo un profesional de enfermería con conocimiento amplio en la quimioterapia para cáncer mamario. El entrevistador hizo preguntas abiertas, como: “¿qué pasaba por su mente antes de recibir la quimioterapia?” y “¿cómo afectó la quimioterapia su vida?”. El entrevistador se guió por las respuestas de las mujeres para hacer más preguntas exploratorias que pudieran vincularse con los conceptos emergentes para llegar a la saturación teórica. Se grabaron los audios de las entrevistas y luego se transcribieron para su análisis. Se usó la comparación constante en el análisis. El investigador principal mantuvo un diario reflexivo “para ayudar a mantener la autoconciencia”. Hallazgos clave. El principal interés en este estudio eran los aspectos psicológicos de la quimioterapia. El análisis reveló una categoría central que los investigadores llamaron “surgir de las cenizas”. Las cuatro etapas del proceso psicológico fueron (1) la etapa de temor, (2) la etapa de dificultad, (3) la etapa de ajuste y (4) la etapa de relajación, cuando las pacientes aceptaron los cambios en su vida derivados de la enfermedad. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 11-1 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: 384 a. ¿Este estudio fue transversal o longitudinal? b. ¿Este estudio pudo haberse realizado como una etnografía o como una investigación fenomenológica? 3. Si los resultados de este estudio son confiables, ¿cuáles son algunos de los usos en los que pueden aplicarse los hallazgos en la práctica clínica? EJEMPLO 2: ESTUDIO FENOMENOLÓGICO EN EL APÉNDICE B Lea la sección de métodos del estudio de Beck y Watson (2010) (“Parto posterior a un parto traumático”) en el apéndice B de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 11-1 para este estudio. 2. Considere también las siguientes preguntas dirigidas: a. ¿Fue un estudio de fenomenología descriptiva o interpretativa? b. ¿Pudo haberse conducido como estudio de teoría fundamentada o como estudio etnográfico? ¿Por qué? c. ¿Pudo haberse conducido el estudio como una investigación con enfoque de género? De ser así, ¿qué podría haber hecho la autora de manera diferente? ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Qualitative Descriptive Studies. Respuestas a los ejercicios de pensamiento crítico para el ejemplo 2. Recursos en Internet con sitios web útiles para el capítulo 11. Un artículo de investigación de una revista de Wolters Kluwer, el estudio de Chen et al. descrito como ejemplo 1 en la p. 194. También están disponibles en inglés más auxiliares de estudio, 385 incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. La investigación cualitativa implica un diseño emergente que se desarrolla en el campo conforme el estudio evoluciona. Los estudios cualitativos pueden ser transversales o longitudinales. La etnografía se enfoca en la cultura de un grupo de personas y se basa en el trabajo de campo extenso que por lo general incluye observación participante y entrevistas detalladas con los informantes clave. Los etnógrafos buscan asumir una perspectiva emic (desde el interior) de una cultura, en lugar de una perspectiva etic (desde el exterior). En ocasiones los profesionales de enfermería se refieren a sus estudios etnográficos como investigación de etnoenfermería. Los fenomenólogos buscan descubrir la esencia y el significado de un fenómeno tal como lo experimentan las personas, sobre todo mediante entrevistas detalladas con quienes tuvieron la experiencia relevante. En la fenomenología descriptiva, que busca describir las experiencias vividas, los investigadores buscan dejar en suspenso sus ideas preconcebidas e intuir la esencia del fenómeno al mantenerse abiertos a los significados que le atribuyen los individuos que lo experimentan. La fenomenología interpretativa (hermenéutica) se enfoca en la interpretación del significado de las experiencias, no solo en su descripción. Los investigadores de teoría fundamentada intentan explicar las acciones de las personas al enfocarse en la preocupación principal que el comportamiento pretende resolver. La manera en que las 386 personas resuelven esta preocupación principal es la variable central. Un tipo prominente de variable central se conoce como proceso social básico (PSB) que explica los procesos para resolver el problema. La teoría fundamentada usa la comparación constante: las categorías derivadas de los datos se comparan todo el tiempo con los datos obtenidos antes. Una controversia de la teoría fundamentada deriva de la decisión de seguir los procedimientos originales de Glaser y Strauss (1967) o usar los procedimientos adaptados por Strauss y Corbin (2015). Glaser argumentó que este último enfoque no genera teorías fundamentadas, sino descripciones conceptuales. En fecha más reciente surgió la teoría fundamentada constructivista de Charmaz, que hace énfasis en los aspectos interpretativos sobre los que se construye la teoría fundamentada a partir de relaciones entre el investigador y los participantes. Los estudios de casos son investigaciones intensivas de una sola entidad o un pequeño número de entidades, como individuos, grupos, familias o comunidades. El análisis narrativo se enfoca en la historia, en estudios cuyo propósito es determinar cómo los individuos dan sentido a los eventos de su vida. Los estudios cualitativos descriptivos no están embebidos en una tradición disciplinaria. Tales estudios pueden referirse como estudios cualitativos, investigaciones naturalistas o análisis del contenido cualitativo. En ocasiones la investigación se realiza dentro una perspectiva ideológica. La teoría crítica se enfoca en la crítica a las estructuras sociales existentes; los investigadores críticos conducen estudios en colaboración con los participantes en un esfuerzo por fomentar el autoconocimiento y la transformación. La etnografía crítica usa los principios de la teoría crítica en el estudio de las culturas. Como la investigación crítica, la investigación con enfoque de género intenta inducir una transformación, pero el centro está en cómo la dominación de género y la discriminación moldean las vidas de las mujeres. 387 La investigación de acción participativa (IAP) produce conocimiento mediante la colaboración estrecha con grupos vulnerables al control o la opresión por parte de una cultura dominante; en la IAP, un objetivo es desarrollar procesos que pueden motivar a las personas y generar la solidaridad de la comunidad. R E F E R E N C I A S D E L C A P Í T U L O 11 Baird, M., Domian, E., Mulcahy, E., Mabior, R., Jemutai-Tanui, G., & Filippi, M. (2015). Creating a bridge of understanding between two worlds: Community-based collaborativeaction research with Sudanese refugee women. Public Health Nursing, 32, 388–396. Cal, A., & Bahar, Z. (2015). Women’s barriers to prevention of lymphedema after breast surgery and home care needs: A qualitative study. Cancer Nursing. Publicación anticipada en línea. Charmaz, K. (2014). Constructing grounded theory (2nd ed.). Thousand Oaks, CA: Sage. **Chen, Y. C., Huang, H., Kao, C., Sun, C., Chiang, C., & Sun, F. (2015). The psychological process of breast cancer patients receiving initial chemotherapy. Cancer Nursing. Publicación anticipada en línea. Corbin, J., & Strauss, A. (2015). Basics of qualitative research: Techniques and procedures for developing grounded theory (4th ed.). Thousand Oaks, CA: Sage. Glaser, B. G. (1992). Basics of grounded theory analysis: Emergence vs. forcing. Mill Valley, CA: Sociology Press. Glaser, B. G., & Strauss, A. L. (1967). The discovery of grounded theory: Strategies for qualitative research. Chicago, IL: Aldine. Graneheim, U., Jansson, L., & Lindgren, B. (2015). Hovering between heaven and hell: An observational study focusing on the interactions between one woman with schizophrenia, dementia, and challenging behaviour and her care providers. Issues in Mental Health Nursing, 36, 543–550. Hansen, L., Rosenkranz, S., Vaccaro, G., & Chang, M. (2015). Patients with hepatocellular carcinoma near the end of life: A longitudinal qualitative study of their illness experiences. Cancer Nursing, 38, E19–E27. Huberman, A. M., & Miles, M. (1994). Data management and analysis methods. In N. K. Denzin & Y. S. Lincoln (Eds.), Handbook of qualitative research (pp. 428–444). Thousand Oaks, CA: Sage. Irwin, J. F. (2016). Beyond Versailles: Recovering the voices of-nurses in post-World War I U.S.-European relations. Nursing History Review, 24, 12–40. 388 *Johansson, A., Axelsson, M., Berndtsson, I., & Brink, E. (2015). Selforientation following colorectal cancer treatment—a grounded theory study. The Open Nursing Journal, 9, 25–31. LaDonna, K., Koopman, W., Ray, S., & Venance, S. (2016). Hard to swallow: A phenomenological exploration of the experience of caring for individuals with myotomic dystrophy and dysphagia. Journal of Neuroscience Nursing, 48, 42–51. Leininger, M. M. (Ed.). (1985). Qualitative research methods in nursing. New York, NY: Grune & Stratton. Lincoln, Y. S., & Guba, E. G. (1985). Naturalistic inquiry. Newbury Park, CA: Sage. López Entrambasaguas, O., Granero-Molina, J., Hernández-Padilla, J., & Fernández-Sola, C. (2015). Understanding sociocultural factors contributing to HIV risk among Ayoreo Bolivian sex workers. Journal of the Association of Nurses in AIDS Care, 26, 781–793. Meyer, J., McCullough, J., & Berggren, I. (2016). A phenomenological study of living with a partner affected with dementia. British Journal of Community Nursing, 21, 24–30. Morse, J. M. (2004). Qualitative comparison: Appropriateness, equivalence, and fit. Qualitative Health Research, 14(10), 1323–1325. Olsson, K., Näslund, U., Nillson, J., & Hörnsten, Å. (2015). Patients’ decision making about undergoing transcatheter aortic valve implantation for severe aortic stenosis. Journal of Cardiovascular Nursing. Publicación anticipada en línea. Speechley, M., DeForge, R., Ward-Griffin, C., Marlatt, N., & Gutmanis, I. (2015). Creating an ethnodrama to catalyze dialogue in home-based dementia care. Qualitative Health Research, 25, 1551–1559. Strauss, A., & Corbin, J. (1990). Basics of qualitative research: Grounded theory procedures and techniques. Thousand Oaks, CA: Sage. Sutherland, N., Ward-Griffin, C., McWilliam, C., & Stajduhar, K. (2016). Gendered processes in hospice and palliative home care for seniors with cancer and their family caregivers. Qualitative Health Research, 26(7), 907–920. Taylor, B., Rush, K., & Robinson, C. (2015). Nurses’ experiences of caring for the older adult in the emergency department: A focused ethnography. International Emergency Nursing, 23, 185–189. Thorne, S. (2013). Interpretive description. In C. T. Beck (Ed.), Routledge international handbook of qualitative nursing research (pp. 295–306). New York, NY: Routledge. Tobin, C., Murphy-Lawless, J., & Beck, C. T. (2014). Childbirth in exile: Asylum seeking women’s experience of childbirth in Ireland. Midwifery, 30, 831–838. 389 *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 390 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Describir la lógica del muestreo para los estudios cualitativos. Identificar y describir varios tipos de muestreo en estudios cualitativos. Evaluar la adecuación del método de muestreo y el tamaño de la muestra usados en el estudio cualitativo. Identificar y describir los métodos para obtener datos de autorreporte no estructurados. Identificar y describir los métodos para obtener y registrar datos observacionales no estructurados. Realizar un análisis crítico de las decisiones del investigador en relación con el plan para la recolección de datos. Definir los términos nuevos del capítulo. Términos clave Bitácora Diario Entrevista a grupos focales Entrevista no estructurada Entrevista semiestructurada Fotovoz Guía temática Informante clave Interpretación de imágenes fotográficas Muestreo de variación máxima Muestreo en bola de nieve 391 Muestreo intencional Muestreo teórico Notas de campo Observación participativa Saturación de datos Este capítulo abarca dos aspectos importantes de los estudios cualitativos: el muestreo (selección de los participantes informantes para el estudio) y la recolección de datos (reunión de los tipos y la cantidad correctos de información para responder la pregunta de investigación). MUESTREO EN LA INVESTIGACIÓN CUALITATIVA Los estudios cualitativos casi siempre se basan en pequeñas muestras no probabilísticas. Los investigadores cualitativos están tan preocupados por la calidad de sus muestras como los investigadores cuantitativos, pero usan distintas consideraciones para seleccionar a los participantes del estudio. La lógica del muestreo cualitativo Los investigadores cuantitativos miden atributos e identifican relaciones en una población; desean una muestra representativa para poder generalizar los hallazgos. El objetivo de la mayoría de los estudios cualitativos es descubrir el significado y revelar múltiples realidades, no generalizar a una población. Los investigadores cualitativos hacen preguntas de muestreo como: ¿quién sería una fuente de información abundante para mi estudio?, ¿con quién debo hablar o qué debo observar para maximizar mi comprensión del fenómeno? Un primer paso en el muestreo cualitativo es seleccionar los sitios con posible riqueza de información. Conforme el estudio progresa, surgen nuevas preguntas de muestreo, como: ¿con quién puedo hablar o a quién puedo observar que me confirme, ponga en duda o enriquezca mis percepciones? Como con el diseño en general, el diseño del muestreo en los estudios cualitativos es emergente y capitaliza la información inicial para guiar la acción subsiguiente. 392 TIP Como los investigadores cuantitativos, los cualitativos suelen identificar criterios de elegibilidad para sus estudios. Aunque no especifican una población explícita a la que podrían generalizarse los resultados, establecen los tipos de personas que son elegibles para participar en su investigación. Tipos de muestreo cualitativo Los investigadores cualitativos evitan las muestras aleatorias porque no son el mejor método de seleccionar personas conocedoras, elocuentes, reflexivas y dispuestas a tener una plática prolongada con los investigadores. Los investigadores cualitativos usan varios diseños de muestreo no probabilísticos. Muestreo por conveniencia y en bola de nieve Los investigadores cualitativos por lo regular comienzan con una muestra voluntaria (por conveniencia). A menudo las muestras voluntarias se usan cuando los investigadores quieren participantes que se presenten e identifiquen por sí mismos. Por ejemplo, si se quisiera estudiar las experiencias de las personas con pesadillas frecuentes, podría captarse a las personas mediante un anuncio en un tablero de avisos o en Internet. Habría menos interés en obtener una muestra representativa de personas con pesadillas que en atraer a un grupo con experiencias diversas con pesadillas. El muestreo por conveniencia es eficiente, pero no es la técnica preferida. El objetivo en los estudios cualitativos es extraer la mayor información posible de un pequeño número de personas y una muestra por conveniencia podría no incluir las fuentes con mayor valía de información. Sin embargo, la muestra por conveniencia puede ser una manera moderada de iniciar un proceso de muestreo. Ejemplo de una muestra por conveniencia Wise (2015) exploró las creencias de las adolescentes embarazadas sobre la alimentación saludable y las elecciones alimentarias. Se obtuvo una muestra por conveniencia de 14 adolescentes de programas de maternidad adolescente. Los investigadores cualitativos también usan el muestreo en bola 393 de nieve (o muestreo en red) al pedir a los primeros informantes que hagan referencias. Un punto débil de esta estrategia es que la muestra final podría limitarse a una pequeña red de conocidos. Además, la calidad de las referencias depende de que el miembro de la muestra que hace la referencia confíe en el investigador y en realidad quiera cooperar. Ejemplo de una muestra en bola de nieve En una etnografía enfocada, Martin y sus colaboradores (2016) estudiaron las preocupaciones de salud familiar desde la perspectiva de miembros adultos de una tribu que vive en una reserva de nativos norteamericanos. Se usó un proceso en bola de nieve para captar miembros de la tribu. Muestreo intencional El muestreo cualitativo puede comenzar con informantes voluntarios y complementarse con nuevos participantes por medio del proceso en bola de nieve. Sin embargo, muchos estudios cualitativos evolucionan a una estrategia de muestreo intencional en la que los investigadores eligen de manera deliberada los casos o tipos de casos que contribuyan mejor al estudio. Se han identificado docenas de estrategias de muestreo intencional (Patton, 2002), de las que aquí se mencionan solo algunas. Los investigadores no siempre se refieren a sus planes de muestreo con las etiquetas de Patton; su clasificación muestra las diversas estrategias que adoptan los investigadores cualitativos para cubrir las necesidades conceptuales de su investigación: El muestreo de variación máxima implica la selección intencional de casos con una variación amplia en las dimensiones de interés. El muestreo de casos extremos (desviaciones) aporta oportunidades para aprender de los informantes más inusuales y extremos (p. ej., éxitos sobresalientes y fracasos notables). El muestreo de casos típicos implica la selección de participantes que ilustran o resaltan lo que es típico o promedio. El muestreo por criterio se refiere al estudio de casos que cumplen un criterio importante predeterminado. El muestreo de variación máxima por lo regular es el modo de elección en la investigación cualitativa porque permite aclarar el 394 alcance del fenómeno e identificar patrones importantes que persisten a pesar de las variaciones. Sin embargo, también pueden aprovecharse otras estrategias según la naturaleza de la pregunta de investigación. Ejemplo de muestreo de variación máxima Tobiano y sus colaboradores (2016) estudiaron las percepciones de los pacientes al recibir atención de enfermería en pabellones médicos. Se usó el muestreo de variación máxima para captar a pacientes con diversidad de edad, género y estado de movilidad. El muestreo de casos confirmatorios y no contradictorios es otra estrategia intencional para recolectar datos. Conforme los investigadores analizan sus datos, a veces es preciso verificar las conceptualizaciones emergentes. Los casos confirmatorios son los casos adicionales que se ajustan a las conceptualizaciones de los investigadores y fortalecen la credibilidad. Los casos contradictorios son casos nuevos que no se adaptan y sirven para poner a prueba las interpretaciones de los investigadores. Los casos “negativos” pueden ofrecer información de la manera en que debe revisarse la conceptualización original. TIP Algunos investigadores cualitativos pueden nombrar a su muestra intencional solo porque seleccionaron “intencionalmente” a las personas que experimentan el fenómeno de interés. Sin embargo, la exposición al fenómeno es un criterio de elegibilidad. Si el investigador incluye a cualquier persona con la experiencia deseada, la muestra se selecciona por conveniencia, no de manera intencional. El muestreo intencional implica el propósito de elegir ejemplares particulares o tipos de personas que mejor aumenten la comprensión del investigador acerca del fenómeno. Muestreo teórico El muestreo teórico es un método usado en los estudios de teoría fundamentada. El muestreo teórico implica decisiones sobre dónde encontrar datos para desarrollar de manera óptima una teoría emergente. La pregunta básica en el muestreo teórico es: ¿a qué tipos de personas debe recurrir el investigador cada vez para ir más lejos en 395 el desarrollo de la conceptualización emergente? Los participantes se seleccionan conforme se requieren por su relevancia teórica en el desarrollo de categorías emergentes. Ejemplo de un muestreo teórico Slatyer y sus colaboradores (2015) usaron un método de muestreo teórico en su estudio de teoría fundamentada con respecto a la perspectiva de los profesionales de enfermería en el hospital al atender a pacientes con dolor intenso. Las entrevistas y observaciones iniciales en una unidad de nefrología y hepatología aportaron datos de la atención de pacientes con problemas para tolerar los medicamentos analgésicos. La categoría emergente, denominada “inefectividad farmacológica”, condujo a los investigadores a observar en un pabellón de ortopedia donde el personal de enfermería atendía a pacientes de edad avanzada que experimentaban dolor intenso durante meses después de una cirugía de cadera. Este muestreo teórico condujo a los investigadores a notar diferencias en las respuestas de los profesionales de enfermería a los pacientes con trastornos dolorosos agudos y crónicos. Esto a su vez los llevó a realizar un muestreo en el pabellón de oftalmología, otología y cirugía plástica en el que los pacientes recibían tratamiento por dolor crónico. Tamaño de la muestra en la investigación cualitativa El tamaño de la muestra en la investigación cualitativa casi siempre se basa en las necesidades de información. Saturación de datos se refiere al muestreo hasta que no se obtenga información nueva y se alcance la redundancia. El número de participantes necesarios para llegar a la saturación depende de varios factores. Por ejemplo, mientras más amplio sea el campo de la pregunta de investigación, más participantes es probable que se necesiten. La calidad de los datos influye en el tamaño de la muestra: si los participantes son perspicaces y pueden comunicarse de modo efectivo, la saturación puede alcanzarse con una muestra relativamente pequeña. Además, es probable que se requiera una muestra más grande con el muestreo de variación máxima que con el muestreo de casos típicos. Ejemplo de saturación Van Rompaey y sus colegas (2016) estudiaron la percepción de los 396 pacientes de delirium en una unidad de cuidados intensivos (UCI) en Bélgica. Los pacientes adultos de la UCI fueron entrevistados al menos 48 horas después de la última calificación positiva para el delirium. La recolección de datos continuó hasta que “se alcanzó la saturación de datos después de entrevistar a 30 pacientes” (p. 68). TIP La adecuación del tamaño de la muestra en un estudio cualitativo es difícil de evaluar porque el criterio principal es la redundancia de la información, que los consumidores no pueden juzgar. Algunos reportes mencionan de manera explícita que se alcanzó la saturación. Muestreo en las tres principales tradiciones cualitativas Existen similitudes entre las principales tradiciones cualitativas con respecto al muestreo: las muestras son pequeñas, se usan métodos no aleatorios y las decisiones finales del muestreo se toman durante la recolección de datos. Sin embargo, también existen diferencias. Muestreo en la etnografía Los etnógrafos por lo regular comienzan con una técnica de “red grande”: conviven y conversan con muchos miembros de la cultura. Sin embargo, casi siempre dependen mucho de un número menor de informantes clave que son conocedores de la cultura y sirven como vínculo principal entre el investigador y el “interior”. Los etnógrafos pueden usar un marco inicial para desarrollar un conjunto de informantes clave potenciales. Por ejemplo, un etnógrafo podría decidir incluir distintos tipos de informantes clave con base en sus roles (p. ej., profesionales de enfermería, defensores). Una vez que se identifican los informantes clave, las consideraciones centrales para su selección final son su nivel de conocimiento de la cultura y la disposición a colaborar con el etnógrafo para revelar e interpretar la cultura. Por lo general, el muestreo en la etnografía implica obtener una muestra de cosas además de personas. Por ejemplo, los etnógrafos toman decisiones acerca de la observación de eventos y actividades, del examen de registros y artefactos, y de la exploración de lugares que aportan indicios sobre la cultura. Los informantes clave a menudo 397 ayudan a los etnógrafos a decidir qué incluir en una muestra. Ejemplo de muestreo etnográfico En su estudio etnográfico, Michel y sus colaboradores (2015) estudiaron los significados asignados a la atención a la salud por parte de los profesionales de enfermería y los adultos mayores veteranos en una institución de atención a la salud en Brasil. La recolección de datos, que incluyó observaciones y entrevistas, se basó en la asistencia de 20 informantes clave: 10 profesionales de enfermería y 10 adultos mayores. Muestreo en estudios fenomenológicos Los fenomenólogos tienden a depender de muestras muy pequeñas de participantes, por lo regular 10 o menos. Dos principios guían la selección de una muestra para un estudio fenomenológico: (1) todos los participantes deben haber experimentado el fenómeno y (2) deben ser capaces de expresar cómo es vivir con esa experiencia. Con frecuencia los investigadores fenomenológicos desean explorar la diversidad de experiencias individuales, por lo que buscan específicamente a personas con diferencias demográficas o de otro tipo que compartieron una experiencia común. Ejemplo de una muestra en un estudio fenomenológico Pedersen y sus colegas (2016) estudiaron el significado de los cambios ponderales entre las mujeres tratadas por cáncer mamario. Se realizó un muestreo intencional de 12 mujeres en tratamiento por cáncer mamario en un hospital universitario danés. “Se buscaron variaciones respecto a edad, tratamiento oncológico inicial, tipo de cirugía y cambios en el peso y la cintura” (p. 18). Además de obtener una muestra de personas, los fenomenólogos interpretativos pueden hacer un muestreo de fuentes artísticas o literarias. Es posible seleccionar descripciones personales de un fenómeno en la literatura, como en poemas, novelas o autobiografías. Estas fuentes ayudan a aumentar el conocimiento de los fenomenólogos sobre los asuntos que estudian. Muestreo en los estudios de teoría fundamentada 398 Por lo general, la investigación por teoría fundamentada se realiza con muestras de 20 a 30 personas, seleccionadas mediante muestreo teórico. El objetivo en un estudio de teoría fundamentada es seleccionar a los informantes que contribuyan mejor a la teoría en evolución. El muestreo, la recolección de datos, el análisis de datos y la construcción de la teoría ocurren al mismo tiempo, por lo que los participantes se seleccionan de manera seriada y contingente (es decir, contingente en la conceptualización emergente). El muestreo podría evolucionar de la siguiente manera: 1. El investigador inicia con una idea general de dónde y con quién comenzar. Los primeros casos pueden solicitarse por conveniencia. 2. En seguida puede usarse el muestreo de variación máxima para obtener información del alcance y la complejidad del fenómeno. 3. La muestra se ajusta de forma continua: las conceptualizaciones emergentes informan el proceso de muestreo teórico. 4. El muestreo continúa hasta alcanzar la saturación. 5. El muestreo final puede incluir una búsqueda de casos confirmatorios y contradictorios para probar, refinar y fortalecer la teoría. Recuadro 12-1 Lineamientos para la crítica de los planes de muestreo cualitativo 1. ¿Fue adecuado el ambiente para responder la pregunta de investigación y se describió de manera adecuada? 2. ¿Qué tipo de estrategia de muestreo se usó? 3. ¿Se especificaron los criterios de elegibilidad para el estudio? ¿Cómo se captaron los participantes para el estudio? 4. Dadas las necesidades de información del estudio –y, si es aplicable, su tradición cualitativa–, ¿fue efectiva la técnica de muestreo? 5. ¿El tamaño de la muestra fue suficiente y apropiado? ¿El investigador indicó que se había alcanzado la saturación? ¿Los hallazgos sugieren un conjunto diverso y completo de datos sin “lagunas” aparentes ni áreas débiles? 6. ¿Se describieron las características clave de la muestra (p. ej., edad, género)? ¿Se presentó una descripción detallada de los participantes y el contexto que permitiera valorar la transferibilidad de los hallazgos? 399 Análisis crítico a los planes de muestreo cualitativo Los planes de muestreo cualitativo pueden evaluarse en términos de su adecuación y propiedad (Morse, 1991). Adecuación se refiere a la suficiencia y calidad de los datos que la muestra aporta. Una muestra adecuada proporciona datos sin puntos “débiles”. Cuando los investigadores alcanzan la saturación real, es que se logró la adecuación de la información y la descripción resultante de la teoría tiene muchos matices y es completa. La pertinencia alude a los métodos usados para seleccionar la muestra. Una muestra apropiada resulta de la selección de los participantes que mejor pueden aportar información que cumple los requerimientos conceptuales del estudio. La estrategia de muestreo debe aportar una comprensión completa del fenómeno de interés. Es probable que un tipo de muestreo que excluya los casos negativos o que no incluya personas con experiencias inusuales no cumpla por completo las necesidades de información del estudio. Otro aspecto importante se refiere a la posibilidad de transferir los hallazgos. La transferibilidad de los hallazgos del estudio está en función de la similitud entre la muestra del estudio y otras personas a las que podrían aplicarse los hallazgos. Por esto, para hacer el análisis crítico de un reporte debe valorarse si el investigador proveyó una descripción sólida adecuada de la muestra y el contexto del estudio, con el fin de que alguien interesado en transferir los hallazgos pueda tomar una decisión informada. El recuadro 12-1 presenta una guía adicional para el análisis crítico de las decisiones de muestreo cualitativo. TIP El aspecto de la transferibilidad dentro del contexto de modelos más amplios de generalizabilidad se discute en el suplemento en inglés de este capítulo en . RECOLECCIÓN DE DATOS EN LOS ESTUDIOS CUALITATIVOS Las entrevistas detalladas son el método más frecuente para obtener datos cualitativos. También se utiliza la observación en algunos estudios cualitativos. Los datos fisiológicos rara vez se obtienen en una investigación constructivista. La tabla 12-1 de la siguiente página 400 compara los tipos de datos y los aspectos de la recolección de datos usados por los investigadores en las tres tradiciones cualitativas principales. Los etnógrafos casi siempre obtienen una gran variedad de datos, sus métodos principales son la observación y las entrevistas; también reúnen o examinan productos de la cultura en estudio, como documentos, registros, artefactos, fotografías, etcétera. Los fenomenólogos y los investigadores de teoría fundamentada se basan sobre todo en entrevistas a profundidad, aunque la observación también tiene un papel en los estudios de teoría fundamentada. Técnicas cualitativas de autorreporte Los investigadores cualitativos no tienen un conjunto de preguntas que deben hacer en un orden específico ni redactadas de manera determinada. En lugar de eso, comienzan con preguntas generales y permiten que los sujetos relaten sus narrativas de modo natural. Las entrevistas cualitativas tienden a ser conversacionales. Los entrevistadores alientan a los sujetos a definir las dimensiones importantes de un fenómeno y a elaborar sobre lo que es relevante para ellos. Tipos de autorreportes cualitativos 401 Los investigadores usan entrevistas no estructuradas cuando no tienen una visión preconcebida de la información que van a reunir. Comienzan con la formulación de una pregunta generadora, como: “¿qué ocurrió cuando supo que tenía sida?” Las preguntas posteriores están guiadas por las respuestas iniciales. Los estudios etnográficos y fenomenológicos por lo regular se basan en entrevistas no estructuradas. Las entrevistas semiestructuradas (o enfocadas) se usan cuando los investigadores tienen una lista de temas o preguntas amplias que deben cubrir en una entrevista. Los entrevistadores usan una guía temática escrita para asegurarse de cubrir todas las áreas de preguntas. La función del entrevistador es alentar a los participantes a hablar con libertad de todos los temas en la guía. Ejemplo de entrevista semiestructurada Duck y sus colaboradores (2015) estudiaron las percepciones y experiencias de los pacientes con fibrosis pulmonar idiopática. Realizaron entrevistas semiestructuradas con duración aproximada de una hora a 17 pacientes. La guía temática cubría temas sugeridos en la bibliografía y de un grupo de apoyo a pacientes y cuidadores. El investigador formuló preguntas abiertas amplias que “daban la oportunidad a los participantes de relatar su historia” (p. 1057). Las entrevistas a grupos focales se hacen en grupos de 5 a 10 personas a las que se solicitan sus opiniones y experiencias al mismo tiempo. El entrevistador (o moderador) orienta la discusión con una guía temática. Un formato grupal es eficiente y puede generar un diálogo extenso, pero no todas las personas se sienten cómodas al compartir sus puntos de vista o experiencias frente a un grupo. Ejemplo de entrevistas a grupos focales Neville y sus colaboradores (2015) exploraron las percepciones del personal que trabaja en asilos residenciales hacia las personas lesbianas, homosexuales y bisexuales de edad avanzada. Un total de 47 trabajadores de siete residencias participaron en siete grupos focales. La guía temática incluía dos viñetas que resaltaban las historias de dos personas homosexuales/ lesbianas hipotéticas de edad avanzada. Los diarios personales son una fuente estándar de datos en la 402 investigación histórica. También es posible generar datos nuevos para un estudio si se pide a los participantes que lleven un diario durante un periodo determinado. Los diarios pueden ser útiles para obtener una descripción íntima de la vida cotidiana de una persona. Los diarios pueden carecer por completo de una estructura; por ejemplo, puede pedirse a las personas que recibieron un trasplante de órganos que dediquen 15 minutos al día a anotar sus pensamientos. Sin embargo, con frecuencia se les solicita que registren entradas en los diarios acerca de un aspecto específico de su vida. Ejemplo de diarios Curtis y sus colaboradores (2014) exploraron las respuestas al estrés entre mujeres irlandesas con cáncer mamario. Treinta mujeres con cáncer mamario recién diagnosticado llevaron diarios durante su participación en un estudio clínico. Se les pidió que escribieran con regularidad sobre sus experiencias y sus sentimientos. Un facilitador les recordaba cada semana acerca de los diarios durante un periodo de 5 semanas, pero no dio más instrucciones. La interpretación de imágenes fotográficas es una entrevista guiada por fotografías. Este procedimiento, usado con más frecuencia en etnografías e investigación de acción participativa, puede ayudar a promover una discusión colaborativa. Las fotografías a veces son las que los investigadores han tomado del ambiente de los participantes, pero la interpretación fotográfica también puede hacerse con fotografías en las casas de los últimos. Los investigadores también usan la técnica de pedir a los participantes que tomen ellos mismos fotografías y luego las interpreten, un método que a veces se llama fotovoz. Ejemplo de un estudio con fotovoz Evans-Agnew (2016) utilizó la fotovoz para explorar las disparidades en el tratamiento del asma entre jóvenes afroamericanos. Los adolescentes participaron en un proyecto de fotovoz de tres sesiones; sus fototextos fueron analizados y comparados con las políticas sobre el asma relacionadas con los jóvenes en el estado de Washington. Recolección de datos cualitativos por autorreporte 403 Los investigadores recolectan datos narrativos de autorreportes para desarrollar una construcción de un fenómeno consistente con el de los participantes. Este objetivo requiere que los investigadores venzan barreras de comunicación y mejoren el flujo de la información. Aunque las entrevistas cualitativas son conversacionales, las conversaciones tienen un propósito que requiere preparación. Por ejemplo, la redacción de las preguntas debe reflejar la visión del mundo y el lenguaje de los participantes. Además de saber interrogar bien, los investigadores deben ser buenos escuchas. Solo al atender con cuidado lo que dicen los sujetos, los entrevistadores en profundidad pueden desarrollar preguntas de seguimiento útiles. Por lo general, las entrevistas no estructuradas son largas, a veces duran una hora o más, por lo que es importante la forma de registrar información tan abundante. Algunos investigadores toman notas durante la entrevista, pero esto es riesgoso en términos de exactitud. La mayoría graba las entrevistas para transcribirlas después. Aunque ciertos entrevistados se inhiben cuando su conversación es grabada, casi siempre se olvidan de la presencia del equipo de grabación después de unos minutos. TIP Aunque los datos cualitativos por autorreporte por lo regular se recolectan en entrevistas personales, también pueden obtenerse por escrito. Las “entrevistas” por Internet son cada vez más frecuentes. Evaluación de los métodos cualitativos de autorreporte Las entrevistas detalladas son una técnica flexible para reunir datos y, en muchos contextos de investigación, ofrecen ventajas distintivas. Por ejemplo, en situaciones clínicas a menudo es apropiado dejar que las personas hablen con libertad de sus problemas y preocupaciones, permitir que tomen la iniciativa para dirigir el flujo de la conversación. Los autorreportes no estructurados posibilitan que los investigadores confirmen cuáles son los aspectos o problemas básicos, qué tan sensible o controversial es el tema, cómo conceptualizan y hablan de los problemas los individuos y cuál es el conjunto de opiniones o comportamientos relevantes para el tema. Las entrevistas detalladas también ayudan a aclarar el significado subyacente de una relación observada de manera repetida en la investigación más estructurada. Por otra parte, los métodos 404 cualitativos consumen mucho tiempo y demandan habilidades de los investigadores para la recolección, el análisis y la interpretación de los datos. Métodos cualitativos observacionales En ocasiones, los investigadores cualitativos reúnen datos por observación poco estructurados, por lo regular como complemento de los datos del autorreporte. El objetivo de la observación cualitativa es comprender los comportamientos y las experiencias de las personas en su ambiente natural. La observación hábil permite a los investigadores ver el mundo como lo perciben los participantes, desarrollar una comprensión profunda de los fenómenos locales y captar las sutilezas de la variación cultural. Los datos de la observación no estructurada con frecuencia se obtienen mediante la observación participativa. Los observadores participantes forman parte del funcionamiento del grupo en estudio y se esfuerzan en observar, hacer preguntas y registrar información en los contextos y estructuras que son relevantes para los miembros del grupo. La observación participativa se caracteriza por periodos prolongados de interacción social entre investigadores y participantes. Al asumir un papel participativo, los observadores a menudo tienen información que habría escapado a observadores más pasivos u ocultos. TIP No toda la investigación cualitativa observacional es participativa (es decir, con observaciones desde dentro del grupo). Algunas observaciones no estructuradas implican la observación y el registro de comportamientos sin la participación activa de los observadores en las actividades. Manténgase alerta ante el uso erróneo del término “observación participativa”. Algunos investigadores lo utilizan de manera inadecuada para referirse a todas las observaciones no estructuradas que se realizan en el campo. El papel del participante-observador en la observación participativa En la observación participativa, el papel que tienen los observadores en el grupo es importante porque su posición social determina lo que 405 es probable que vean. Es mejor considerar la magnitud de la participación real de los observadores en un grupo en un continuo. En un extremo está la inmersión completa en el ambiente, en la que los investigadores asumen un estado total de participante; en el otro extremo está la separación completa, con los investigadores como observadores. En algunos casos asumen una posición fija en este continuo durante todo el estudio, pero en ocasiones su función evoluciona hacia la mayor participación durante el trabajo de campo. Los observadores deben salvar dos obstáculos para asumir un papel satisfactorio en relación con los participantes. El primero es obtener el ingreso al grupo social que se estudia; el segundo es establecer una relación de entendimiento y confianza dentro de ese grupo. Sin lograr el ingreso, el estudio no puede realizarse, pero sin la confianza del grupo el investigador estará limitado a un conocimiento “de escenario”: información distorsionada por las fachadas protectoras del grupo. El objetivo de los observadores participativos es estar “tras bambalinas”: aprender sobre las experiencias reales del grupo. Por otra parte, ser un miembro participante total no siempre ofrece la mejor perspectiva para estudiar un fenómeno, de la misma manera que ser actor en una obra no provee la visión más ventajosa de la actuación. Ejemplo de los papeles del observador participativo Michaelsen (2012) estudió las relaciones de los profesionales de enfermería con pacientes que consideraban difíciles. Los datos se obtuvieron mediante observación participativa y entrevistas detalladas durante un periodo de 18 meses. Michaelsen realizó 18 sesiones de observación, con duración de 3 a 4 horas, de profesionales de enfermería que interactuaban con pacientes durante las visitas domiciliarias. Mantuvo “un balance entre el papel de ‘infiltrado’ y el de ‘extraño’, entre la participación y la observación” (p. 92). Recolección de datos por observación participativa Los observadores participativos casi siempre imponen pocas restricciones a la naturaleza de los datos obtenidos, pero por lo regular tienen un plan amplio para los tipos de información que buscan. Los siguientes son algunos aspectos de una actividad observada que probablemente se consideren relevantes: 406 1. La locación física: preguntas sobre “dónde”. ¿Cuáles son las principales características de la locación? 2. Los participantes: preguntas acerca de “quién”. ¿Quién está presente y cuáles son sus características? 3. Actividades: preguntas sobre “qué”. ¿Qué ocurre? ¿Qué hacen los participantes? 4. Frecuencia y duración: preguntas sobre “cuándo”. ¿Cuándo comenzó y terminó la actividad? ¿La actividad es recurrente? 5. Proceso: preguntas sobre “cómo”. ¿Cómo se organiza la actividad? ¿Cómo transcurre? 6. Resultados: preguntas acerca de “por qué”. ¿Por qué ocurre la actividad? ¿Qué no ocurrió (sobre todo si debía haber ocurrido) o por qué? Los observadores participativos deben decidir cómo obtener muestras de eventos y seleccionar las locaciones para la observación. A menudo usan una combinación de estrategias de posicionamiento: permanecen en un solo sitio para observar actividades en esa locación (posición única), se mueven para observar comportamientos en distintas locaciones (posición múltiple) o siguen a una persona (posición móvil). La observación directa suele complementarse con información de entrevistas. Por ejemplo, puede pedirse a los informantes clave que describan lo ocurrido en una reunión a la que el observador no pudo acudir o que describan un evento que sucedió antes de que iniciara el estudio. En tales casos, el informante funciona como el que observa al observador. Registro de observaciones Las formas más comunes para mantener un registro de la observación participativa son bitácoras y notas de campo, pero también pueden usarse fotografías y videograbaciones. Una bitácora (o diario de campo) es un registro diario de los eventos y conversaciones. Las notas de campo son más amplias e interpretativas. Las notas de campo representan los esfuerzos del observador para registrar información y sintetizar y comprender los datos. Las notas de campo tienen múltiples propósitos. Las notas descriptivas son descripciones objetivas de eventos y conversaciones observadas. Las notas reflexivas documentan las experiencias 407 personales de los investigadores, sus reflexiones y el progreso en el campo. Por ejemplo, algunas notas documentan los esfuerzos interpretativos de los observadores mientras que otras son recordatorios sobre cómo deben hacerse las observaciones subsiguientes. Los observadores suelen tomar notas personales, que son comentarios acerca de sus propios sentimientos durante el proceso de investigación. El éxito de la observación participativa depende de la calidad de las bitácoras y las notas de campo. Es indispensable registrar las observaciones lo más pronto posible, pero por lo general los observadores participativos no pueden registrar la información portando un sujetapapeles o un dispositivo de grabación abiertamente, ya que esto socava su papel como participantes ordinarios. Los observadores deben desarrollar habilidades para tomar notas mentales detalladas que más tarde puedan escribir o registrar. Evaluación de los métodos de observación no estructurados Los métodos de observación cualitativos, y en particular la observación participativa, proveen una comprensión más profunda de los comportamientos humanos y las situaciones sociales de lo que es posible lograr con métodos estructurados. La observación participativa es valiosa por su capacidad para “entrar” a una situación y aclarar sus complejidades. La observación participativa es un buen método para responder preguntas sobre fenómenos difíciles de explicar para los participantes mismos porque los dan por sentados. Sin embargo, como todos los métodos de investigación, la observación participativa enfrenta problemas potenciales. Los observadores pueden perder objetividad en el muestreo, la visualización y el registro de observaciones. Una vez que empiezan a participar en las actividades de un grupo, la posibilidad de un involucramiento emocional se convierte en un problema. En su papel de miembros, los investigadores pueden dejar de atender aspectos clave de la situación o desarrollar una visión miope de temas importantes para el grupo. Por último, el éxito de la observación participativa depende de las habilidades de observación e interpersonales del observador, destrezas que pueden ser difíciles de cultivar. 408 Análisis crítico de la recolección no estructurada de datos Por lo regular es difícil hacer un análisis crítico de las decisiones que se toman para obtener datos cualitativos, ya que los detalles sobre esas decisiones pocas veces se especifican. En particular, con frecuencia hay poca información de la observación participativa. No es raro que un reporte solo señale que el observador realizó una observación participativa, sin describir cuánto tiempo pasó en el campo, qué observó exactamente, cómo se registraron las observaciones y qué nivel de participación hubo. Por lo tanto, es probable que un aspecto de la crítica implique una apreciación acerca de cuánta información de la metodología para recolección de datos incluye el artículo. Aunque las limitaciones de espacio en las revistas hacen imposible que los investigadores describan sus métodos con detalle, tienen la responsabilidad de comunicar información básica de su estrategia para que los lectores puedan valorar la calidad de la evidencia que aporta el estudio. La triangulación de métodos brinda oportunidades sustanciales a los investigadores cualitativos para mejorar la integridad de sus datos. Por lo tanto, un aspecto importante a considerar en la evaluación de los datos no estructurados es si los tipos y la cantidad de datos obtenidos son detallados lo suficiente para sustentar la comprensión profunda y holística de los fenómenos en estudio. El recuadro 12-2 presenta lineamientos para la crítica de la recolección de datos no estructurados. Recuadro 12-2 Lineamientos para la crítica de los métodos de recolección de datos en estudios cualitativos 1. Dada la pregunta de investigación y las características de los participantes en el estudio, ¿el investigador usó el mejor método para capturar los fenómenos del estudio (es decir, autorreportes, observación)? ¿Debieron emplearse métodos complementarios para enriquecer los datos disponibles para el análisis? 2. Si se utilizaron métodos de autorreporte, ¿el investigador tomó buenas decisiones en cuanto al método específico usado para obtener información (p. ej., entrevistas no estructuradas, entrevistas a grupos focales, etcétera)? 3. Si se recurrió a una guía temática, ¿el reporte presentó ejemplos de 409 preguntas específicas? ¿Las preguntas fueron apropiadas e integrales?, ¿la redacción favoreció respuestas detalladas? 4. ¿Se registraron y transcribieron las entrevistas? Si las entrevistas no se registraron, ¿qué medidas se tomaron para asegurar la exactitud de los datos? 5. Si se usaron métodos de observación, ¿el reporte describe de manera adecuada qué implicaron las observaciones? ¿Qué observó en realidad el investigador, en qué tipo de ambientes ocurrieron las observaciones y con qué frecuencia y duración se hicieron? 6. ¿Qué papel asumió el investigador en términos de ser observador y participante? ¿Fue apropiado este papel? 7. ¿Cómo se registraron los datos de la observación? ¿El método de registro maximiza la calidad de los datos? EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO En esta sección se describen los planes de muestreo y las estrategias para recolección de datos usados en un estudio cualitativo de enfermería. Lea el resumen y luego responda las preguntas de pensamiento crítico; consulte el reporte de investigación completo de ser necesario. El ejemplo 1 se presenta en la sección Critical Thinking Activity del sitio web . Las preguntas de pensamiento crítico para el ejemplo 2 se basan en el estudio que aparece en el apéndice B de este libro. Los comentarios en inglés de las autoras sobre estos ejercicios están en la sección Student Resources en . EJEMPLO 1: MUESTREO Y RECOLECCIÓN DE DATOS EN UN ESTUDIO CUALITATIVO Estudio. Perspectivas de los adolescentes canadienses del riesgo de cáncer: un estudio cualitativo (Woodgate et al., 2015) Objetivo. El objetivo de este estudio era comprender las perspectivas de los adolescentes canadienses respecto al cáncer y su prevención, incluida la manera en que conceptualizan y comprenden el riesgo de cáncer. 410 Diseño. Los investigadores describieron su enfoque como etnográfico: “La exploración de la comprensión y las percepciones compartidas de los adolescentes ante el cáncer y el riesgo de este se presta a un diseño etnográfico con múltiples métodos para recolección de datos” (p. 686). Los datos se obtuvieron durante un periodo de 3 años. Estrategia de muestreo. Se incluyó una muestra intencional de 75 adolescentes de cuatro escuelas en una provincia occidental de Canadá, con esfuerzos para “maximizar las variaciones demográficas (p. ej., edad, género, estado socioeconómico, residencia urbana o rural) y experiencias con el cáncer” (p. 686). La captación y el análisis se dieron al mismo tiempo y el reclutamiento terminó cuando se alcanzó la saturación. El estudio se llevó a cabo durante un lapso de 3 años. La muestra incluyó a hombres (27%) y mujeres (73%) con edades de 11 a 19 años; 56% vivía en una zona urbana y cerca de 30% tenía un familiar con antecedente de cáncer. La mayoría se describió como de “ingresos medios” (72%) y de ascendencia europea (63%). Recolección de datos. La recolección de datos se hizo en las escuelas de los jóvenes incluidos. Se planearon dos entrevistas personales con cada adolescente, la segunda programada 4 a 5 semanas después de la primera. La segunda entrevista intentaba asegurar una “descripción sólida” y dar una oportunidad para realizar preguntas de seguimiento que ayudaran a aclarar problemas identificados en la entrevista inicial. Cada entrevista duró entre 60 y 90 minutos, se registró en formato digital y se transcribió. Para la primera entrevista, la guía temática incluyó preguntas generales del riesgo y la prevención del cáncer (p. ej., “¿cómo desarrolla cáncer la gente?”). También se introdujeron métodos de fotovoz. Los participantes recibieron cámaras y se les pidió que tomaran fotografías durante un periodo de 4 semanas de lo que ellos consideraban que mostrara el cáncer, los riesgos de cáncer y la prevención del cáncer. Luego, en la segunda entrevista se les pidió que describieran lo que las fotografías significaban para ellos. Se les guió con preguntas como: “¿de qué manera [esta fotografía] se relaciona con el cáncer?” (p. 687). Por último, se realizaron cuatro entrevistas grupales enfocadas con los adolescentes entrevistados antes “para complementar los hallazgos anteriores y recolectar nuevo conocimiento grupal sobre los riesgos de cáncer” (p. 687). Las notas de campo se conservaron para 411 describir los comportamientos verbales y no verbales de los participantes después de las entrevistas individuales y a grupos focales. Hallazgos clave. Los adolescentes conceptualizaron el riesgo de cáncer en términos de factores de riesgo específicos; destacaron los factores de estilo de vida (p. ej., tabaquismo). Racionalizaron los comportamientos riesgosos para la salud mediante diversas estrategias cognitivas que les ayudaron a hacer que los riesgos de cáncer fueran más aceptables para ellos. Sin embargo, creían que era posible que las personas retrasaran el desarrollo del cáncer al hacer las elecciones adecuadas. Ejercicios de pensamiento crítico 1. Responda las preguntas de los recuadros 12-1 y 12-2 relevantes para este estudio. 2. Considere también las siguientes preguntas dirigidas: a. Comente la variación que el investigador logró en el tipo de participantes en el estudio. b. Comente sobre el plan general de recolección de datos en términos de la cantidad de información reunida. 3. Si los resultados de este estudio son válidos y confiables, ¿cuáles son algunos de los usos en los que pueden aplicarse los hallazgos en la práctica clínica? EJEMPLO 2: MUESTREO Y RECOLECCIÓN DE DATOS EN EL ESTUDIO DEL APÉNDICE B Lea la sección de métodos del estudio de Beck y Watson (2010) (“Parto posterior a un parto traumático”) en el apéndice B de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas de los recuadros 12-1 y 12-2 relevantes para este estudio. 2. Considere también las siguientes preguntas dirigidas, que pueden aguzar sus habilidades de pensamiento crítico y ayudarlo a valorar aspectos del mérito del estudio: a. Comente sobre las características de los participantes, dado el objetivo del estudio. b. ¿Cree usted que Beck y Watson debían haber limitado su muestra a mujeres solo de un país? Presente una justificación a su respuesta. 412 c. ¿Alguno de los conceptos de este estudio se capturó mediante observación? ¿Debía haberse hecho así? d. ¿El estudio de Beck y Watson incluyó una pregunta generadora? ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Transferability and Generalizability. Respuestas a los ejercicios de pensamiento crítico para el ejemplo 2. Recursos en Internet con sitios web útiles para el capítulo 12. Un artículo de investigación de una revista de Wolters Kluwer, el estudio de Curtis y colaboradores descrito en la p. 205. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionados en la Study Guide for Essentials of Nursing Research, 9e. Los investigadores cualitativos casi siempre seleccionan informantes elocuentes y reflexivos con ciertos tipos de experiencia de manera emergente, y capitalizan el aprendizaje inicial para guiar las decisiones de muestreo subsiguientes. Los investigadores pueden iniciar con muestreo en bola de nieve o por conveniencia, pero casi siempre se basan por último en el muestreo intencional para guiarlos en la selección de fuentes de datos que maximicen la abundancia de información. Una estrategia intencional es el muestreo de variación máxima, 413 que implica la selección intencionada de diversos casos con rasgos clave. Otra estrategia importante es el muestreo de casos confirmatorios y contradictorios; es decir, la elección de casos que enriquecen y ponen a prueba las conceptualizaciones de los investigadores. Por lo general, las muestras de los estudios cualitativos son pequeñas y se basan en las necesidades de información. Un principio guía es la saturación de datos, que es el muestreo hasta que ya no se obtenga nueva información y se alcance la redundancia. Los etnógrafos toman muchas decisiones sobre el muestreo que no solo abarcan a quién incluir, sino qué incluir (p. ej., actividades, eventos, documentos, artefactos); la toma de decisiones por lo regular es auxiliada por informantes clave, que sirven como guías e intérpretes de la cultura. Los fenomenólogos suelen trabajar con una pequeña muestra de personas (a menudo 10 o menos) que cumplen el criterio de haber vivido la experiencia en estudio. Los investigadores de teoría fundamentada casi siempre usan el muestreo teórico, en el que las decisiones para formar la muestra son dirigidas de forma continua por la teoría emergente. Son típicas las muestras de 20 a 30 personas. Las entrevistas detalladas son el método usado con más frecuencia para obtener datos en los estudios cualitativos. Los autorreportes en los estudios cualitativos incluyen entrevistas no estructuradas, que son conversaciones sobre el tema de interés; entrevistas semiestructuradas (o enfocadas) que emplean una guía temática amplia; entrevistas a grupos focales, que implican discusiones con grupos pequeños; diarios, en los que se pide a los participantes que hagan registros cotidianos de algunos aspectos de su vida; y las entrevistas con interpretación de imágenes fotográficas, que son guiadas y estimuladas por medio de fotografías, que a veces los propios participantes tomaron (fotovoz). En la investigación cualitativa, los autorreportes suelen complementarse con la observación directa en ambientes naturales. Un tipo de observación no estructurada es la 414 observación participativa, en la que el investigador obtiene el ingreso a un grupo social y participa en grados variables en su funcionamiento, al tiempo que hace observaciones detalladas de las actividades y eventos. Los principales métodos para recolección de datos son las bitácoras de los eventos cotidianos y las notas de campo de las experiencias e interpretaciones. REFERENCIAS DEL CAPÍTULO 12 **Curtis, R., Groarke, A., McSharry, J., & Kerin, M. (2014). Experience of breast cancer: Burden, benefit, or both? Cancer Nursing, 37, E21–E30. *Duck, A., Spencer, L., Bailey, S., Leonard, C., Ormes, J., & Caress, A. (2015). Perceptions, experiences and needs of patients with idiopathic pulmonary fibrosis. Journal of Advanced Nursing, 71, 1055–1065. Evans-Agnew, R. (2016). Asthma management disparities: A photovoice investigation with African American youth. The Journal of School Nursing, 32, 99–111. Martin, D., Yurkovich, E., & Anderson, K. (2016). American Indians’ family health concern on a Northern Plains reservation: “Diabetes runs rampant here.” Public Health Nursing, 33, 73–81. Michaelsen, J. J. (2012). Emotional distance to so-called difficult patients. Scandinavian Journal of Caring Sciences, 26, 90–97. *Michel, T., Lenardt, M., Willig, M., & Alvarez, A. (2015). From real to ideal—the health (un)care of long-lived elders. Revista Brasileira de Enfermagem, 68, 343–349. Morse, J. M. (1991). Strategies for sampling. In J. M. Morse Ed.), Qualitative nursing research: A contemporary dialogue (Rev. ed., pp. 127–145). Newbury Park, CA: Sage. *Neville, S., Adams, J., Bellamy, G., Boyd, M., & George, N. (2015). Perceptions towards lesbian, gay and bisexual people in residential care facilities: A qualitative study. International Journal of Older People Nursing, 10, 73–81. Patton, M. Q. (2002). Qualitative research & evaluation methods (3rd ed.). Thousand Oaks, CA: Sage. Pedersen, B., Groenkjaer, M., Falkmer, U., Mark, E., & Delmar, C. (2016). “The ambiguous transforming body”—a phenomenological study of the meaning of weight changes among women treated for breast cancer. International Journal of Nursing Studies, 55, 15–25. Slatyer, S., Williams, A. M., & Michael, R. (2015). Seeking empowerment to comfort patients in severe pain: A grounded theory study of the nurse’s perspective. International Journal of Nursing Studies, 52, 229–239. Tobiano, G., Bucknall, T., Marshall, A., Guinane, J., & Chaboyer, W. (2016). 415 Patients’ perceptions of participation in nursing care on medical wards. Scandinavian Journal of Caring Sciences, 30(2), 260–270. Van Rompaey, B., Van Hoof, A., van Bogaert, P., Timmermans, O., & Dilles, T. (2016). The patient’s perception of a delirium: A qualitative research in a Belgian intensive care unit. Intensive and Critical Care Nursing, 32, 66–74. Wise, N. J. (2015). Pregnant adolescents, beliefs about healthy eating, factors that influence food choices, and nutrition education preferences. Journal of Midwifery & Women’s Health, 60, 410–418. *Woodgate, R. L., Safipour, J., & Tailor, K. (2015). Canadian adolescents’ perspectives of cancer risk: A qualitative study. Health Promotion International, 30, 684–694. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 416 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Identificar las ventajas de la investigación con métodos mixtos y describir las aplicaciones específicas. Describir las estrategias y diseños para realizar investigación con métodos mixtos. Identificar los propósitos y algunas de las características distintivas de los tipos específicos de investigación (p. ej., estudios clínicos, evaluaciones, investigación de resultados, encuestas). Definir los términos nuevos del capítulo. Términos clave Análisis de proceso Análisis económico (de costos) Análisis secundario Diseño concurrente Diseño de triangulación Diseño explicativo Diseño exploratorio Diseño secuencial Encuesta Encuesta Delphi Estudio clínico Estudio metodológico Investigación con intervención Investigación con métodos mixtos Investigación de resultados 417 Investigación de servicios de salud Investigación evaluativa Mejora de calidad Pragmatismo Resultado de enfermería Teoría de intervención En este capítulo final de los diseños de investigación se explican varios tipos especiales de investigación. Se comienza con la discusión de la investigación con métodos mixtos que combina enfoques cuantitativos y cualitativos. INVESTIGACIÓN CON MÉTODOS MIXTOS Una tendencia creciente en la investigación de enfermería es la recolección e integración planeada de datos cuantitativos y cualitativos en un solo estudio o grupos coordinados de estudios. Esta sección explica la justificación para tal investigación con métodos mixtos y presenta unas cuantas aplicaciones. Justificación para la investigación con métodos mixtos La dicotomía entre los datos cuantitativos y cualitativos constituye una distinción metodológica clave. Algunos argumentan que los paradigmas que sustentan la investigación cuantitativa y la cualitativa son incompatibles. Sin embargo, la mayoría de las personas ahora cree que muchas áreas de investigación pueden enriquecerse si se triangulan los datos cuantitativos y cualitativos. Las ventajas de un diseño con métodos mixtos (MM) incluyen las siguientes: Complementariedad. Los enfoques cuantitativos y cualitativos son complementarios. Cuando usan métodos mixtos, los investigadores pueden evitar las limitaciones de un enfoque individual. Practicidad. Dada la complejidad de los fenómenos, resulta práctico usar las herramientas metodológicas más adecuadas para responder las preguntas de investigación apremiantes. Aumento de validez. Cuando una hipótesis o un modelo se respalda con tipos de datos múltiples y complementarios, los investigadores 418 pueden tener más confianza en sus inferencias. Sin embargo, quizá el argumento más fuerte para la investigación con MM es que algunas preguntas requieren MM. El pragmatismo, un paradigma por lo regular relacionado con la investigación con MM, proporciona una base para una postura que se ha señalado como “la dictadura de la pregunta de investigación” (Tashakkori y Teddlie, 2003, p. 21). Los investigadores pragmáticos consideran que la pregunta de investigación es la que debe impulsar el diseño del estudio. Rechazan una elección forzada entre los enfoques tradicionales pospositivista y constructivista para la investigación. Propósitos y aplicaciones de la investigación con métodos mixtos En la investigación con MM, por lo general existe un objetivo global, pero siempre hay al menos dos preguntas de investigación, cada una de las cuales requiere un distinto tipo de enfoque. Por ejemplo, los investigadores que usan MM pueden hacer al mismo tiempo preguntas exploratorias (cualitativas) y confirmatorias (cuantitativas). En un estudio con MM, los investigadores pueden examinar los efectos causales en un componente cuantitativo, pero pueden aclarar los mecanismos causales en un componente cualitativo. Creswell y Plano Clark (2011) identificaron seis tipos de situaciones de investigación que son muy propicias para la investigación con métodos mixtos: 1. Los conceptos son nuevos y se comprenden poco, y es necesaria una exploración cualitativa antes de poder usar métodos más formales y estructurados. 2. Por sí mismos, ni el enfoque cualitativo ni el cuantitativo son adecuados para resolver la complejidad del problema de investigación. 3. Los hallazgos de un enfoque pueden mejorarse mucho con una segunda fuente de datos. 4. Los resultados cuantitativos son confusos y difíciles de interpretar, y los datos cualitativos pueden ayudar a explicar los resultados. 5. Una perspectiva teórica particular podría requerir datos cuantitativos y cualitativos. 6. Se requiere un proyecto en varias fases para alcanzar los objetivos clave, como el desarrollo y la valoración de una intervención. 419 Como esta lista sugiere, la investigación con MM puede usarse en varias situaciones. Algunas de las principales aplicaciones incluyen las siguientes: Desarrollo de un instrumento. En ocasiones, los investigadores en enfermería recolectan datos cualitativos como base para desarrollar instrumentos formales; es decir, para generar y redactar las preguntas relacionadas con escalas cuantitativas que luego se someten a una prueba rigurosa. Desarrollo de una intervención. La investigación cualitativa también tiene un papel importante en el desarrollo de intervenciones de enfermería prometedoras que después son objeto de una prueba rigurosa para evaluar su eficacia. Generación de hipótesis. Los estudios cualitativos profundos suelen generar información abundante de los constructos y las relaciones entre estos. Dicha información puede evaluarse luego y confirmarse con muestras más grandes en estudios cuantitativos. Construcción y verificación de teorías. Una teoría obtiene aceptación a medida que escapa a la no confirmación, y el uso de múltiples métodos brinda la oportunidad de no confirmar una teoría. Si la teoría sobrevive a estas embestidas, puede proveer un contexto más fuerte para organizar el trabajo clínico e intelectual. Explicación. Los datos cualitativos se utilizan en ocasiones para explicar el significado de las descripciones o relaciones cuantitativas. Los métodos cuantitativos pueden demostrar que las variables tienen una relación sistemática, pero no pueden explicar por qué están relacionadas. Ejemplo de explicación con datos cualitativos Edinburgh y sus colaboradores (2015) realizaron un estudio con MM de las experiencias de abuso de 62 adolescentes explotados sexualmente que huyeron de casa atendidos en el Child Advocacy Center. Los datos cuantitativos provinieron de las exploraciones físicas y las respuestas de las escalas psicológicas. Los datos cualitativos de entrevistas forenses se analizaron para explorar la experiencia de la explotación sexual. En una escala para medir el trastorno por estrés postraumático (TEPT), casi 80% de los jóvenes tenía síntomas lo bastante graves para cumplir con los criterios del Diagnostic and Statistical Manual of Mental Disorders (DSM-IV, 4.ª ed.) para TEPT. Las entrevistas detalladas revelaron cómo fueron reclutados y 420 sometidos a abuso los jóvenes explotados. Diseños y estrategias del método mixto Para diseñar estudios MM, los investigadores toman muchas decisiones importantes. Se describen brevemente algunas. Decisiones sobre el diseño y notación Dos decisiones del diseño con MM se refieren a la secuenciación y la priorización. Existen tres opciones para ordenar en secuencia los componentes de un estudio con MM: primero se obtienen los datos cualitativos, se obtienen primero los datos cuantitativos o se consiguen ambos tipos al mismo tiempo. Cuando los datos se recolectan de manera simultánea, la estrategia es concurrente. El diseño es secuencial cuando los dos tipos de datos se obtienen en fases. En los diseños secuenciales bien concebidos, el análisis y la interpretación en una fase informan la recolección de datos en la segunda. En términos de priorización, los investigadores casi siempre deciden cuál enfoque resaltar: el cuantitativo o el cualitativo. Una opción es dar un peso igual o casi igual a los dos componentes (facetas). Sin embargo, casi siempre se da prioridad a una estrategia. En ocasiones, la distinción se denomina estado igual contra estado dominante. Janice Morse (1991), una sobresaliente enfermera investigadora, hizo una contribución sustancial a la investigación con MM al proponer un sistema de notación muy usado para la secuenciación y priorización. En esta notación para el diseño la prioridad se designa con letras mayúsculas y minúsculas: diseño CUAL/cuan designa un estudio con MM en el que la estrategia dominante es la cualitativa, mientras que CUAN/cual se refiere a lo contrario. Si ninguna de las dos estrategias es dominante (ambas son iguales), la notación es CUAL/CUAN. La secuenciación está indicada por los símbolos + o →. La flecha indica una estrategia secuencial. Por ejemplo, CUAN → cual es la notación para un estudio con MM con predominio cuantitativo en el que los datos cualitativos se obtienen en la fase 2. Cuando ambas estrategias ocurren al mismo tiempo, se usa un signo de suma (p. ej., CUAL + cuan). 421 Diseños de métodos mixtos específicos Distintos metodólogos que usan MM han propuesto numerosas tipologías de diseños. A continuación se ilustran unos cuantos diseños básicos descritos por Creswell (2015). El propósito del diseño de triangulación (a veces llamado diseño convergente) es obtener datos diferentes, pero complementarios, sobre el fenómeno central en estudio; es decir, triangular las fuentes de datos. El objetivo de este diseño es converger en “la verdad” acerca de un problema o fenómeno al permitir que las limitaciones de una estrategia sean contrarrestadas con las fortalezas de la otra. En este diseño, los datos cuantitativos y cualitativos se obtienen al mismo tiempo, con la misma prioridad (CUAL + CUAN). Ejemplo de un diseño convergente Wittenberg-Lyles y sus colaboradores (2015) usaron un diseño CUAL + CUAN en su estudio MM que valoró los beneficios potenciales de un grupo secreto de Facebook conformado por cuidadores que trabajan en hospitales de pacientes terminales. Los datos se obtuvieron al mismo tiempo mediante publicaciones y comentarios en el grupo secreto de Facebook y con escalas estandarizadas de ansiedad y depresión. Los diseños explicativos son secuenciales, con recolección de datos cuantitativos en la primera fase seguida por la obtención de datos cualitativos en la segunda fase. Se puede dar prioridad al aspecto cuantitativo o el cualitativo: el diseño puede ser CUAN → cual o cuan → CUAL. En los diseños explicativos, los datos cualitativos de la segunda fase se usan para construir o explicar los datos cuantitativos de la fase inicial. Este diseño es muy adecuado cuando los resultados son complejos y difíciles de interpretar. Ejemplo de un diseño explicativo Polivka y sus colaboradores (2015) estudiaron la salud ambiental y los riesgos de seguridad que experimentan los proveedores de atención a la salud domiciliarios. Una muestra de 68 profesionales de enfermería, auxiliares y otros profesionales de la salud domiciliarios completaron un cuestionario estructurado que preguntaba acerca de las tareas de atención realizadas y las lesiones o resultados adversos experimentados. Después, los miembros de la muestra participaron en entrevistas de grupos focales detalladas. Los datos de grupos focales 422 permitieron a los investigadores realizar un análisis de riesgos habitación por habitación. Los diseños exploratorios son diseños con MM secuenciales en los que los datos cualitativos se obtienen primero. La premisa central del diseño es la necesidad de una exploración profunda inicial de un concepto. Por lo general, la primera fase se enfoca en la exploración de un fenómeno poco comprendido y la segunda, en su medición o clasificación. En un diseño exploratorio pueden dominar la fase cualitativa (CUAL → cuan) o la fase cuantitativa (cual → CUAN). Ejemplo de un diseño exploratorio Yang y sus colaboradores (2016) desarrollaron una lista de verificación para valorar la sed en pacientes con demencia avanzada. Los elementos de la lista de verificación se desarrollaron por medio de entrevistas detalladas con profesionales de enfermería que atienden a pacientes con demencia avanzada. Luego, la lista de verificación se sometió a una prueba cuantitativa (p. ej., para confirmar la confiabilidad) con cuidadores de ocho instituciones. TIP Creswell y Plano Clark (2011) describieron un diseño llamado diseño incrustado, un término que en ocasiones se usa en estudios de enfermería. Sin embargo, Creswell (2015) dejó de referir este diseño. Un diseño incrustado es aquel en el que un segundo tipo de datos está supeditado a otro tipo de datos. Ahora, Creswell considera esta incrustación como una estrategia analítica, no como un tipo de diseño. Muestreo y recolección de datos en la investigación con métodos mixtos El muestreo y la recolección de datos en estudios con MM por lo regular son una mezcla de estrategias descritas en los capítulos anteriores. Unos cuantos aspectos especiales de un estudio con MM ameritan una discusión breve. Los investigadores que usan MM pueden combinar los diseños de muestreo de varias maneras. Es probable que el componente cuantitativo dependa de una estrategia de muestreo que aumenta la capacidad del investigador para generalizar una población a partir de 423 la muestra. Para el componente cualitativo, estos investigadores casi siempre adoptan métodos de muestreo intencional para seleccionar casos vastos en información que sean buenos informantes sobre el fenómeno de interés. También es probable que el tamaño de las muestras sea distinto en las fases cuantitativa y cualitativa de maneras que podrían esperarse: muestras más grandes para el componente cuantitativo. Un aspecto único del muestreo en los estudios con MM se refiere a si las mismas personas estarán en las fases cuantitativa y cualitativa. La mejor estrategia depende del propósito del estudio y el diseño de investigación, pero el uso de muestras superpuestas puede ser ventajoso. En realidad, una estrategia muy popular es un enfoque anidado en el que un subgrupo de participantes de la fase cuantitativa se usa en la fase cualitativa. Ejemplo de muestreo anidado Nguyen y sus colaboradores (2016) estudiaron las razones médicas, relacionadas con el servicio y razones emocionales de las visitas a la sala de urgencias de ancianos con cáncer. Realizaron un análisis estadístico de las bases de datos administrativos de 792 pacientes oncológicos de 70 años de edad o más. Llevaron a cabo entrevistas semiestructuradas con un subgrupo de la muestra de 11 individuos para comprender mejor las experiencias desde la perspectiva de los pacientes. En términos de recolección de datos, todos los métodos para tal fin descritos antes pueden combinarse de modo creativo y triangularse en un estudio con MM. Por ello, las fuentes posibles de datos incluyen entrevistas grupales e individuales, escalas psicosociales, observaciones, mediciones biofisiológicas, registros, diarios, etc. Los estudios con MM pueden incluir mezcla intramétodos (p. ej., autorreportes estructurados y no estructurados) y mezcla entre métodos (p. ej., mediciones biofisiológicas y observación no estructurada). Un aspecto fundamental se refiere a la complementariedad de los métodos: esto es, balancear y contrarrestar las limitaciones de un método con las fortalezas del otro. TIP Una dificultad para realizar investigación con MM es decidir cuál es la mejor forma de analizar los datos cuantitativos y cualitativos. Los beneficios de la investigación con MM precisan un esfuerzo para unir los resultados de las dos fases y 424 desarrollar interpretaciones y recomendaciones basadas en el entendimiento integrado. OTROS TIPOS ESPECIALES DE INVESTIGACIÓN En el resto de este capítulo se describen brevemente los tipos de investigación que varían según el objetivo del estudio y no con base en el diseño o tradición de investigación. Investigación con intervención En el capítulo 9 se describieron los estudios controlados aleatorizados (ECA) y otros diseños experimentales y cuasi experimentales para evaluar los efectos de las intervenciones. En realidad, la investigación con intervención por lo regular es más compleja que una simple comparación de los resultados de un grupo experimental y uno de control; de hecho, la investigación con intervención se basa en MM para desarrollar, refinar, evaluar y comprender la intervención. Distintas disciplinas han desarrollado sus propias estrategias y terminología para sus esfuerzos de intervención. Los estudios clínicos se relacionan con investigación médica, la investigación evaluativa se vincula con los campos de la educación y la política pública, y los profesionales de enfermería están desarrollando su propia tradición de investigación con intervención. Aquí se describe en forma breve estas tres estrategias. Estudios clínicos Los estudios clínicos evalúan las intervenciones clínicas. Se realizan para evaluar un tratamiento o fármaco innovador y suelen diseñarse en varias fases: La fase I del estudio se destina a establecer la seguridad, la tolerancia y la dosis con un diseño sencillo (p. ej., de un solo grupo antes y después de la prueba). El enfoque está en desarrollar el mejor tratamiento. La fase II es una prueba piloto de la efectividad del tratamiento. Los investigadores valoran si la intervención es factible y aceptable, y si parece prometedora. Esta fase se diseña como un experimento o un 425 cuasi experimento a pequeña escala. La fase III es una prueba experimental completa de la intervención, un ECA con asignación aleatoria a las condiciones terapéuticas. El objetivo es desarrollar evidencia de la eficacia del tratamiento; es decir, si la intervención es más eficaz que la atención usual u otra alternativa. Cuando se usa el término estudio clínico, a menudo se refiere a un ensayo de fase III. La fase IV de los estudios clínicos implica la evaluación de la efectividad de una intervención en la población general. El énfasis en los estudios de efectividad está en la validez externa de una intervención con eficacia demostrada en condiciones controladas (pero artificiales). Investigación evaluativa La investigación evaluativa se enfoca en desarrollar información útil sobre un programa o política, la cual necesitan quienes toman decisiones con respecto a la adopción, modificación o abandono del programa. Las evaluaciones se realizan para responder diversas preguntas. Las preguntas sobre la efectividad del programa se basan en diseños experimentales o cuasi experimentales, pero otras preguntas no. Muchas evaluaciones son estudios con MM con componentes distintivos. Por ejemplo, con frecuencia se realiza un análisis de proceso para obtener información descriptiva del proceso mediante el cual se implementa el programa y si este en verdad funciona. Un análisis de proceso responde preguntas como las siguientes: ¿cuál es exactamente el tratamiento y en qué difiere de las prácticas tradicionales? ¿Cuáles son las barreras para programar con éxito su implementación? ¿Cómo se sienten el personal y los clientes acerca de la intervención? Los datos cualitativos tienen un papel relevante en los análisis de proceso. Las evaluaciones también pueden incluir un análisis económico (o de costos) para valorar si los beneficios del programa exceden sus costos. Los administradores toman decisiones acerca de la asignación de recursos a los servicios de salud, no solo con base en si algo “funciona”, sino también en su viabilidad económica. Por lo regular se realizan análisis de costos cuando los investigadores evalúan también la eficacia del programa. 426 Ejemplo de un análisis económico Sahlen y sus colaboradores (2016) valoraron la rentabilidad de la atención integrada para insuficiencia cardiaca centrada en la persona y la atención domiciliaria paliativa, con base en los datos reunidos en un ECA de la eficacia de la intervención. El análisis mostró reducciones significativas de los costos en comparación con la atención usual. Investigación con intervención de enfermería Tanto los estudios clínicos como las evaluaciones implican intervenciones. Sin embargo, los investigadores en enfermería usan cada vez más el término investigación con intervención para describir un enfoque que se distingue por un proceso específico de planeación, desarrollo y prueba de las intervenciones, sobre todo intervenciones complejas. Los que proponen el proceso critican la estrategia simplista y carente de teoría que se usa por lo regular para diseñar y evaluar las intervenciones. El proceso recomendado implica la comprensión detallada del problema y la población blanco; la planeación cuidadosa y colaborativa con un equipo diverso, y el desarrollo o adopción de una teoría para guiar la investigación. Como ocurre con los estudios clínicos, la investigación con intervención de enfermería que implica el desarrollo de una intervención compleja tiene varias fases: 1. Investigación del desarrollo básica. 2. Investigación piloto. 3. Estudio de eficacia. 4. Estudio de efectividad. La conceptualización, un enfoque sustancial de la fase de desarrollo, se sustenta con discusiones colaborativas, consultas con expertos, revisiones de bibliografía crítica e investigación cualitativa detallada para comprender el problema. La validez del constructo de la intervención se incrementa con los esfuerzos para desarrollar una teoría de intervención que articule con claridad lo que debe hacerse para lograr los resultados deseados. El diseño de la intervención, que surge de la teoría de intervención, especifica cuáles deben ser las aportaciones clínicas. Durante la fase de desarrollo suelen identificarse los participantes clave –personas que tienen una participación en la intervención– y se “incluyen en el equipo”. Los 427 participantes abarcan a los beneficiarios potenciales de la intervención y sus familias, los defensores y líderes de la comunidad, y el personal de salud. La segunda fase de la investigación con intervención en enfermería es una prueba piloto de la intervención. Las actividades centrales durante la prueba piloto consisten en asegurar la evidencia preliminar de los beneficios de la intervención, valorar la factibilidad de una prueba rigurosa y refinar la teoría de intervención y los protocolos de la misma. La valoración de factibilidad debe incluir un análisis de los factores que afectaron la implementación durante el piloto (p. ej., problemas de reclutamiento, retención y observancia). Puede usarse la investigación cualitativa para obtener información acerca de cómo debe refinarse la intervención. Como en un estudio clínico típico, la tercera fase implica una prueba experimental completa de la intervención; la fase final se enfoca en la efectividad y utilidad en instalaciones clínicas reales. En este momento, el modelo completo de investigación con intervención es un ideal, más que una realidad. Por ejemplo, los estudios de efectividad en investigación en enfermería son raros. Unos cuantos equipos de investigación han empezado a implementar partes del modelo y es probable que los esfuerzos se expandan. Ejemplo de investigación con intervención en enfermería Rossen y sus colaboradores (2016) desarrollaron una prueba piloto que evaluó una compleja intervención psicoeducativa dirigida por un profesional de enfermería para cubrir las necesidades físicas y psicológicas de mujeres que reciben radioterapia para cáncer ginecológico. Los investigadores desarrollaron la intervención con base en la teoría relevante y en consultas con el consumidor de la investigación y un experto. Dos perspectivas teóricas aportaron información para el desarrollo de la intervención: la teoría de la autodeterminación y una teoría de apoyo entre iguales. La intervención se sometió a una prueba piloto en seis pacientes. Las voluntarias y el profesional de enfermería que realizaron la intervención mantuvieron diarios reflexivos sobre la factibilidad y aceptabilidad. La intervención se encuentra en pruebas formales en un estudio controlado aleatorizado. Servicios de salud e investigación de resultados 428 La investigación de servicios de salud es el amplio campo interdisciplinario que estudia cómo las estructuras y los procesos organizacionales, las tecnologías de salud, los factores sociales y los comportamientos personales afectan el acceso a la atención a la salud, el costo y la calidad de la misma y, al final, la salud y el bienestar de las personas. La investigación de resultados, un subgrupo de la investigación de servicios de salud, realiza esfuerzos para comprender los resultados finales de prácticas de atención a la salud particulares y para valorar la efectividad de los servicios de salud. La investigación de resultados es una respuesta a la creciente demanda de los creadores de políticas y del público para justificar las prácticas de atención en términos de mejorar los resultados para los pacientes y los costos. Muchos estudios de enfermería evalúan los resultados del paciente, pero los esfuerzos para evaluar la calidad y el efecto de la atención de enfermería –en contraste con la atención que proporciona el sistema de salud en general– son menos frecuentes. Un obstáculo sustancial es la atribución: esto es, vincular los resultados del paciente con acciones de enfermería específicas, a diferencia de otros miembros del equipo de atención médica. A menudo también es difícil confirmar una relación causal entre los resultados y las intervenciones de atención a la salud porque factores ajenos al sistema de salud (p. ej., características del paciente) afectan los resultados de maneras complejas. Donabedian (1987), cuyos primeros esfuerzos generaron un marco para la investigación de resultados, subrayó tres factores para valorar la calidad de los servicios de salud: estructura, proceso y resultados. La estructura de la atención se refiere a las características organizacionales y administrativas generales. Por ejemplo, la combinación de habilidades de enfermería es una variable estructural que está relacionada con los resultados en los pacientes. Los procesos implican aspectos de gestión clínica y toma de decisiones. Los resultados se refieren a consecuencias finales clínicas específicas de la atención al paciente. Se ha progresado mucho en la identificación de los resultados de enfermería: resultados en los pacientes que mejoran si la cantidad o calidad de la atención del personal de enfermería aumentan. Se han propuesto varias modificaciones al marco de Donabedian (1987) para evaluar la calidad de la atención a la salud; la más notable es el Modelo de resultados de salud de calidad (Quality Health Outcomes Model) desarrollado por la American Academy of Nursing 429 (Mitchell et al., 1998). Este modelo es menos lineal y más dinámico que el marco original de Donabedian y toma en cuenta las características del paciente (p. ej., la gravedad de la enfermedad) y del sistema. La investigación de resultados casi siempre se concentra en estudiar los vínculos dentro de tales modelos, no en poner a prueba el modelo en general. Por ejemplo, algunos estudios examinaron el efecto de las estructuras de atención a la salud en los procesos o resultados de dicha atención. La investigación de resultados en la enfermería suele enfocarse en el nexo proceso-paciente-resultados. Los ejemplos de las variables del proceso de enfermería incluyen acciones de enfermería, habilidades para solucionar problemas y tomar decisiones de los profesionales de enfermería, competencia y liderazgo clínicos, y actividades o intervenciones específicas (p. ej., comunicación, contacto). Ejemplo de investigación de resultados Pitkäaho y sus colaboradores (2015) estudiaron la relación entre el personal de enfermería (porcentaje de profesionales en enfermería certificados y mezcla de habilidades) por una parte y los resultados de los pacientes (p. ej., duración de la estancia en el hospital) por la otra en 35 306 episodios de pacientes en unidades de cuidados intensivos de un hospital finlandés. Investigación por encuesta Una encuesta obtiene información cuantitativa de prevalencia, distribución e interrelaciones de las variables dentro de una población. Los sondeos de opinión política son ejemplos de encuestas. Los datos de las encuestas se usan sobre todo en estudios de correlación y con frecuencia se emplean para reunir información en poblaciones no clínicas (p. ej., estudiantes universitarios, profesionales de enfermería). Las encuestas obtienen información de las acciones, el conocimiento, las intenciones y las opiniones de las personas declaradas por ellas mismas. Las encuestas aportan sobre todo datos cuantitativos y pueden ser transversales o longitudinales. Cualquier información que pueda obtenerse de manera confiable con preguntas directas puede reunirse en una encuesta, aunque las encuestas 430 incluyen sobre todo preguntas cerradas. Los datos de la encuesta pueden recolectarse de varias formas, pero el método más valorado es mediante entrevistas personales en las que los entrevistadores se reúnen con los individuos que responden para hacerles preguntas. Las entrevistas personales son costosas porque requieren mucho tiempo del personal, pero aportan datos de alta calidad y la tasa de rechazo tiende a ser baja. Las entrevistas telefónicas son menos costosas, pero cuando las personas no conocen al entrevistador pueden ser poco cooperadoras por teléfono. Los cuestionarios respondidos por los sujetos mismos (sobre todo los enviados por Internet) son una técnica económica para hacer una encuesta, pero no son apropiados para examinar a ciertas poblaciones (p. ej., ancianos, niños) y tienden a tener bajas tasas de respuesta. La mayor ventaja de las encuestas es su flexibilidad y amplitud de alcance. Las encuestas pueden usarse con muchas poblaciones, enfocarse en una amplia variedad de temas y utilizarse para muchos fines. Sin embargo, la información obtenida en la mayoría de las encuestas tiende a ser relativamente superficial: las encuestas rara vez exploran a profundidad las complejidades del comportamiento y sentimientos humanos. La investigación por encuesta es más adecuada para el análisis extenso que para el intensivo. Ejemplo de una encuesta Kleinpell y sus colaboradores (2016) condujeron una encuesta comparativa de mercado nacional entre los profesionales de enfermería que trabajan en instituciones de cuidados intensivos con telemedicina en Estados Unidos. La encuesta se enfocó en los beneficios percibidos de la telemedicina y las barreras para su uso. Más de 1 200 profesionales de enfermería completaron una encuesta en línea. Estudios para mejora de calidad Un tipo más de tarea semejante a la investigación son los proyectos de mejora de calidad (MC). Como se explica en el capítulo 2, el propósito de la MC es el avance de las prácticas y procesos dentro de una organización específica, no generar conocimiento que pueda generalizarse fuera del contexto específico del estudio. No obstante, existen similitudes entre la MC, la investigación de atención a la 431 salud y los proyectos de práctica basada en evidencia (PBE). Los tres tienen mucho en común (p. ej., el uso de métodos sistemáticos para obtener y analizar datos con el fin de resolver un problema), pero también tienen diferencias. Shirey y sus colaboradores (2011) prepararon una gráfica comparativa que describe las similitudes y diferencias de los tres tipos de esfuerzos en 20 dimensiones. Una dimensión es “expectativas para la divulgación del conocimiento”. En la MC, la principal expectativa es la divulgación interna de los resultados, casi nunca se considera necesaria la publicación en una revista especializada. En los proyectos de PBE, la divulgación de conocimiento “es cada vez más una expectativa dentro de la institución en la que se realizó el proyecto de PBE y fuera de ese ambiente” (Shirey et al., 2011, p. 63). Para la investigación, la norma es la divulgación amplia en publicaciones accesibles y por lo regular se concibe como una obligación. Hace 10 años, muchos consideraban la publicación en una revista especializada como un criterio para clasificar algo como una “investigación” en lugar de MC o PBE, pero esto ya no es así. Muchos proyectos de MC se describen en revistas especializadas. El problema de qué tan “generalizable” es el conocimiento obtenido del proyecto es otro aspecto. La gráfica de Shirey y sus colaboradores (2011) señala que el conocimiento de la MC no es generalizable, es específico de la organización en la que se realizó la MC. Sin embargo, algunos proyectos de MC evalúan mejoras que podrían implementarse de manera efectiva en otras instituciones. Aunque se supone que la investigación sea generalizable, a menudo no es tan susceptible a la generalización como se quisiera. Muchos estudios de enfermería y salud se efectúan en instalaciones locales que emplean muestras por conveniencia y tienen poca base para la generalización sin réplicas. Por ello, no siempre puede distinguirse la MC de la investigación con base en que los pacientes provengan de un microsistema clínico específico. El campo de la MC ha desarrollado algunas metodologías y modelos distintivos para realizar investigaciones. Un modelo mencionado con frecuencia es Planear-Hacer-Estudiar-Actuar (PHEA), que también se denomina Planear-Hacer-Verificar-Actuar (PHVA). El ciclo PHEA, parte del Institute for Healthcare Improvement’s Model for Improvement, fue diseñado como una herramienta para acelerar la MC. Los pasos del ciclo son los siguientes: 432 1. Planear: proyectar un cambio y desarrollar una prueba u observación, incluido un plan de recolección de datos. 2. Hacer: aplicar el cambio a pequeña escala. 3. Estudiar: revisar y analizar los datos, evaluar los resultados e identificar lo que se aprendió. 4. Actuar: refinar el cambio y tomar medidas con base en las lecciones aprendidas de la prueba. Ejemplo de un estudio de mejora de calidad Zimnicki (2015) usó el modelo PHEA en un proyecto de MC que implicaba el desarrollo de un diagrama de flujo para atender a los pacientes que se someten a un estoma programado y una intervención educativa para ayudar al personal de enfermería a realizar la marca preoperatoria para el sitio del estoma y la instrucción del paciente. Otros tipos de investigación La mayoría de los estudios cuantitativos que los investigadores en enfermería han realizado es de los tipos descritos en este capítulo y los anteriores. Sin embargo, los investigadores en enfermería han efectuado otros tipos específicos de investigación que se describen brevemente en la siguiente página. El suplemento en inglés de este capítulo en presenta más detalles de cada tipo de investigación. Análisis secundario. Los análisis secundarios incluyen el uso de los datos existentes de un estudio previo o en curso para evaluar nuevas hipótesis o responder preguntas que no se consideraban al principio. Los análisis secundarios por lo regular se basan en datos cuantitativos de un conjunto de datos más grande (p. ej., de encuestas nacionales), aunque también se realizan análisis secundarios de datos de estudios cualitativos. El estudio del apéndice A de este libro es un análisis secundario. Encuestas Delphi. Las encuestas Delphi se desarrollaron como una herramienta para hacer predicciones de corto plazo. Las técnicas requieren un panel de expertos a los que se pide que completen varias rondas de cuestionarios que se enfocan en sus criterios sobre un tema de interés. Se usan múltiples repeticiones para alcanzar un consenso. 433 Estudios metodológicos. Los investigadores en enfermería realizan muchos estudios metodológicos que se enfocan en el desarrollo, la validación y la valoración de herramientas o estrategias metodológicas (p. ej., la prueba psicométrica de una nueva escala). CRÍTICA A LOS ESTUDIOS DESCRITOS EN ESTE CAPÍTULO Es difícil proporcionar orientación acerca del análisis crítico de los tipos de estudios descritos en este capítulo porque son muy variados y porque muchos aspectos metodológicos fundamentales requieren una crítica del diseño general. Los lineamientos para hacer una crítica a los aspectos relacionados con el diseño se presentaron en los capítulos anteriores. Sin embargo, debe considerarse si los investigadores aprovecharon de manera adecuada las posibilidades del diseño con MM. La obtención de datos cuantitativos y cualitativos no siempre es necesaria ni práctica, pero para hacer la crítica de los estudios puede considerarse si el estudio se habría fortalecido con la triangulación de distintos tipos de datos. En estudios en los que se usan MM, debe considerarse con cuidado si la inclusión de ambos tipos de datos está justificada y si el investigador en realidad los utilizó para aumentar el conocimiento del tema en investigación. El recuadro 13-1 presenta unas cuantas preguntas específicas para el análisis crítico de los tipos de estudios incluidos en este capítulo. Recuadro 13-1 Lineamientos para la crítica de los estudios descritos en el capítulo 13 1. ¿El estudio fue solamente cuantitativo o cualitativo? De ser así, ¿pudo haberse fortalecido con la incorporación de ambas estrategias? 2. Si el estudio usó un diseño con MM, ¿la inclusión de ambas estrategias contribuyó a aumentar la validez? ¿De qué otras formas (si las hay) la inclusión de ambos tipos de datos fortaleció el estudio y ayudó a lograr los objetivos de la investigación? 3. Si el estudio utilizó una estrategia con MM, ¿cuál fue el diseño, cómo se ordenaron los componentes y cuál tuvo prioridad? ¿Fue adecuada esta estrategia? 434 4. Si la investigación fue un estudio clínico o un estudio de intervención, ¿se prestó suficiente atención al desarrollo de una intervención apropiada? ¿Hubo una teoría de intervención bien concebida que guiara la tarea? ¿Hubo una prueba piloto apropiada de la intervención? 5. Si la investigación fue un estudio clínico, evaluativa o con intervención, ¿se realizó un esfuerzo para comprender cómo se implementó la intervención (es decir, un análisis del tipo de proceso)? ¿Se valoraron los costos financieros y los beneficios? De no ser así, ¿debieron haberse valorado? 6. Si el estudio fue una investigación de resultados, ¿qué segmentos del modelo estructura-proceso-resultados se examinaron? ¿Habría sido conveniente (y factible) ampliar el estudio para incluir otros aspectos? ¿Los hallazgos sugieren posibles mejoras a las estructuras o procesos que habrían sido benéficas para los resultados de los pacientes? 7. SI el estudio fue una encuesta, ¿se empleó el método más apropiado para obtener los datos (es decir, entrevistas personales, entrevistas telefónicas, cuestionarios por correo o por Internet)? EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO En la bibliografía de enfermería abundan los estudios de los tipos descritos en este capítulo. Aquí se presenta un ejemplo importante. Lea el resumen y luego responda las preguntas de pensamiento crítico; consulte el reporte de investigación completo de ser necesario. El ejemplo 1 se presenta en la Critical Thinking interactiva del sitio web . Las preguntas de pensamiento crítico para el ejemplo 2 se basan en el estudio que aparece en el apéndice D de este libro. Los comentarios en inglés de las autoras sobre estos ejercicios están en la sección Student Resources en . EJEMPLO 1: ESTUDIO DE MÉTODOS MIXTOS CON UNA ENCUESTA 435 Estudio. Un estudio de métodos mixtos sobre estrés traumático secundario en enfermeras-parteras certificadas: quebrantamiento de creencias sobre el proceso del nacimiento (Beck et al., 2015). Objetivo. El objetivo de este estudio era examinar el estrés traumático secundario (ETS) entre las enfermeras-parteras certificadas (EPC) expuestas a pacientes traumatizadas durante el parto. Las preguntas de investigación fueron (1) ¿cuáles son la prevalencia y gravedad del ETS entre las EPC expuestas a un parto traumático?, (2) ¿las características demográficas de las EPC se relacionan con el ETS?, (3) ¿cuáles son las experiencias de las EPC que atienden partos traumáticos?, y (4) ¿de qué manera los conjuntos cuantitativos y cualitativos de resultados desarrollan un cuadro más completo del ETS en las enfermeras-parteras certificadas? Métodos. Se usó un diseño convergente (CUAL + CUAN), es decir, se obtuvieron tipos independientes de datos en una sola fase. Las EPC que habían atendido al menos un parto traumático fueron invitadas a participar en una encuesta. Un total de 473 EPC completaron la parte cuantitativa, un cuestionario que incluía preguntas de antecedentes y la escala de ETS de 17 elementos. Los datos de la parte cualitativa, obtenidos de una muestra anidada de 246 participantes, provinieron de las respuestas a lo siguiente: “Por favor, describa con los mayores detalles que pueda recordar su experiencia al atender uno o más partos traumáticos. Por favor, describa todos sus pensamientos, sentimientos y percepciones hasta que no tenga más que escribir. Si la atención de partos traumáticos influyó en su práctica de asistencia en el parto, por favor describa este efecto” (p. 17). Análisis e integración de datos. Se usaron métodos estadísticos para responder las preguntas de investigación 1 y 2. La pregunta 3 se respondió mediante un análisis del contenido de los datos cualitativos sobre las experiencias reales de las EPC. Los temas se cruzaron con información de las características de las EPC y los síntomas informados. Luego, los resultados fusionados se integraron en una interpretación general. Hallazgos clave. En esta muestra, 29% de las EPC informó ETS alto a grave; 36% tuvo resultado positivo en la detección de trastorno por estrés postraumático debido a la atención de partos traumáticos. Se identificaron seis temas en el análisis de los datos cualitativos (p. ej., proteger a mis pacientes: sensación intolerable de impotencia e indefensión; quebrantamiento de creencias sobre el proceso del parto: impacto en la práctica de comadrona). Más de la mitad de las participantes dijeron que habían experimentado un impacto en su práctica. Contar con datos cuantitativos y cualitativos proporcionó una imagen más valiosa y completa del ETS en las EPC. Los resultados cuantitativos revelaron el elevado porcentaje desconocido hasta ahora de EPC que experimentan 436 estrés traumático secundario. Sin embargo, los resultados cualitativos proporcionaron una idea desde el interior de cómo es que las EPC lo enfrentan. Por ejemplo, un elemento con calificaciones altas en la escala de ETS fue “tengo problemas para dormir”. Esta es una síntesis de los datos cualitativos que revelaron este elemento de la escala: “La bebé debe haber estado muerta desde hacía unos 5 días, por lo que tenía vesículas en la piel y esta se desprendía. Entre la viscosidad del meconio y los problemas de la piel, se me dificultó sujetar la cabeza para ayudar a la salida del resto del cuerpo. Sentí que estaba desprendiendo la piel y me preocupaba desprender la cabeza. Durante semanas no pude quitarme de la cabeza la imagen de esa pequeña muerta. Tuve problemas para dormir debido a las pesadillas” (p. 21). Ejercicios de pensamiento crítico 1. Responda las siguientes preguntas relevantes del recuadro 13-1 respecto a este estudio. 2. Considere también las siguientes preguntas dirigidas: a. Comente sobre el diseño de muestreo en este estudio. b. ¿Cuál podría haber sido la ventaja de usar un diseño secuencial en lugar de uno concurrente en este estudio? 3. Si los resultados de este estudio son válidos, ¿cuáles son algunos de los usos en los que podrían aplicarse los hallazgos en la práctica clínica? EJEMPLO 2: ESTUDIO DE MÉTODOS MIXTOS EN EL APÉNDICE D Lea el reporte del estudio con MM (“Diferencias en las percepciones del diagnóstico y el tratamiento de la apnea obstructiva en el sueño y la terapia de presión positiva continua en la vía aérea entre sujetos observantes e inobservantes”) de Sawyer y sus colaboradores (2010) en el apéndice D y luego realice las siguientes actividades sugeridas. Ejercicios de pensamiento crítico 1. Responda las preguntas 1 a 3 del recuadro 13-1 en relación con este estudio. 2. Suponga que Sawyer y sus colaboradores solo hubieran obtenido los datos cualitativos. Comente cómo habría afectado esto los resultados y la calidad general de la evidencia. Suponga luego que hubieran obtenido todos sus datos de una manera estructurada cuantitativa. ¿Cómo podría haber cambiado esto los resultados y cómo habría afectado la calidad de 437 la evidencia? 3. Si los resultados de este estudio son válidos, ¿cuáles son algunos de los usos a los que podrían aplicarse los hallazgos en la práctica clínica? ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Other Specific Types of Research. Respuestas a los ejercicios de pensamiento crítico para el ejemplo 2. Recursos en Internet con sitios web útiles para el capítulo 13. Un artículo de investigación de una revista de Wolters Kluwer, el estudio de Rossen et al. descrito como ejemplo en la p. 219. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. Para muchos propósitos de la investigación, los estudios de métodos mixtos tienen ventajas. La investigación con métodos mixtos implica la recolección, el análisis y la integración de datos cuantitativos y cualitativos en un estudio o una serie de estudios, por lo regular con un objetivo global de alcanzar un descubrimiento y una verificación. La investigación con métodos mixtos (MM) tiene muchas ventajas, incluida la complementariedad de los datos cuantitativos 438 y cualitativos, y la practicidad de usar los métodos que mejor respondan una pregunta. La investigación con MM tiene muchas aplicaciones, entre estas el desarrollo y la evaluación de instrumentos, teorías e intervenciones. El paradigma que con mayor frecuencia se relaciona con la investigación con MM es el pragmatismo, que tiene como su fundamento principal: “la dictadura de la pregunta de investigación”. Las decisiones clave en el diseño de un estudio con MM implican cómo ordenar los componentes y qué faceta tendrá prioridad (si alguna la tendrá). En términos de la secuencia, los diseños con MM son concurrentes (ambas facetas ocurren en una sola fase) o secuenciales (una faceta tiene lugar antes y aporta información a la siguiente). La notación para la investigación con MM por lo regular designa la prioridad –letras mayúsculas para la faceta dominante y minúsculas para la no dominante– y la secuencia. Se usa una flecha para los diseños secuenciales y un “+” para los diseños concurrentes. Por ejemplo, CUAL → cuan es un diseño secuencial con dominio cualitativo. Los diseños con MM específicos incluyen el diseño de triangulación (CUAL + CUAN), el diseño explicativo (p. ej., CUAN → cual) y el diseño exploratorio (p. ej., CUAL → cuan). El muestreo en los estudios con MM puede incluir a las mismas personas o a distintas para los diversos componentes. El anidamiento es una técnica de muestreo común en la que un subgrupo de la muestra de una faceta también participa en la otra faceta. Distintas disciplinas han desarrollado diferentes estrategias (y términos) para evaluar las intervenciones. Los estudios clínicos, que son investigaciones diseñadas para valorar la efectividad de intervenciones clínicas, por lo regular abarcan una serie de fases. De esta forma, la fase I se diseña para finalizar las características de la intervención. La fase II implica la búsqueda de evidencia preliminar de la eficacia y oportunidades para refinar la intervención. La fase III es una prueba experimental completa de la eficacia del tratamiento. En la fase IV, el investigador se enfoca 439 sobre todo en la efectividad generalizada y la evidencia de costos y beneficios. La investigación evaluativa examina la efectividad de un programa, política o procedimiento para ayudar a quienes toman las decisiones a elegir un curso de acción. Las evaluaciones pueden responder diversas preguntas. Los análisis de proceso describen el proceso por el cual se implementa un programa y cómo funciona en la práctica. Los análisis económicos (de costos) buscan determinar si los costos monetarios de un programa son rebasados por los beneficios. Investigación con intervención es un término que se usa a veces para referirse a un proceso distintivo de planeación, desarrollo, prueba y divulgación de intervenciones. La validez del constructo de una intervención emergente mejora con los esfuerzos para desarrollar una teoría de intervención que articule lo que debe hacerse para obtener los resultados deseados. La investigación de resultados (un subgrupo de la investigación de servicios de salud) se realiza para documentar la calidad y efectividad de la atención a la salud y los servicios de enfermería. Un modelo de calidad en la atención a la salud comprende varios conceptos amplios que incluyen estructura (p. ej., mezcla de habilidades de enfermería), proceso (intervenciones y acciones de enfermería) y resultados (los resultados finales específicos de la atención al paciente en términos de funcionamiento del paciente). Se han hecho esfuerzos para identificar los resultados de enfermería. La investigación por encuesta examina características, comportamientos, intenciones y opiniones de las personas mediante sus respuestas a preguntas. Las encuestas pueden aplicarse en entrevistas personales (cara a cara), entrevistas telefónicas o cuestionarios respondidos por las personas mismas. Los proyectos de mejora de calidad (MC) se diseñan para optimizar prácticas en una organización específica; por lo regular usan un modelo llamado Planear-Hacer-Estudiar-Actuar (PHEA) o Planear-Hacer-Verificar-Actuar (PHVA). REFERENCIAS DEL CAPÍTULO 13 440 Beck, C. T., LoGiudice, J., & Gable, R. (2015). A mixed-methods study of secondary traumatic stress in certified nurse-midwives: Shaken belief in the birth process. Journal of Midwifery & Women’s Health, 60, 16–23. Creswell, J. W. (2015). A concise introduction to mixed methods research. Thousand Oaks, CA: Sage. Creswell, J. W., & Plano Clark, V. L. (2011). Designing and conducting mixed methods research (2nd ed.). Thousand Oaks, CA: Sage. Donabedian, A. (1987). Some basic issues in evaluating the quality of health care. In L. T. Rinke (Ed.), Outcome measures in home care (Vol. 1, pp. 3– 28). New York, NY: National League for Nursing. *Edinburgh, L., Pape-Blabolil, J., Harpin, S., & Saewyc, E. (2015). Assessing exploitation experiences of girls and boys seen at a Child Advocacy Center. Child Abuse & Neglect, 46, 47–59. Kleinpell, R., Barden, C., Rincon, T., McCarthy, M., & Zapatochny Rufo, R. (2016). Assessing the impact of tele-medicine on nursing care in intensive care units. American Journal of Critical Care, 25, e14–e20. Mitchell, P., Ferketich, S., & Jennings, B. (1998). Quality health outcomes model. Image: The Journal of Nursing Scholarship, 30, 43–46. Morse, J. M. (1991). Approaches to qualitative-quantitative methodological triangulation. Nursing Research, 40, 120–123. Nguyen, B., Tremblay, D., Mathieu, L., & Groleau, D. (2016). Mixed method exploration of the medical, service-related, and emotional reasons for emergency room visits of older cancer patients. Supportive Care in Cancer, 24, 2549–2556. Pitkäaho, T., Partanen, P., Miettinen, M., & Vehviläinen-Julkunen, K. (2015). Non-linear relationships between nurse staffing and patients’ length of stay in acute care units: Bayesian dependence modelling. Journal of Advanced Nursing, 71, 458–473. *Polivka, B., Wills, C., Darragh, A., Lavender, S., Sommerich, C., & Stredney, D. (2015). Environmental health and safety hazards experienced by home health care providers: A room-by-room analysis. Workplace Health & Safety, 63, 512–522. **Rossen, S., Hansen-Nord, N., Kayser, L., Borre, M., Borre, M., Larsen, R., ... Hansen, R. (2016). The impact of husbands’ prostate cancer diagnosis and participation in a behavioral lifestyle intervention on spouses’ lives and relationships with their partners. Cancer Nursing, 39, E1–E9. Sahlen, K., Boman, K., & Brännström, M. (2016). A cost-effectiveness study of person-centered integrated heart failure and palliative home care: Based on randomized controlled trial. Palliative Medicine, 30, 296–302. Shirey, M., Hauck, S., Embree, J., Kinner, T., Schaar, G., Phillips, L., ... McCool, I. (2011). Showcasing differences between quality improvement, evidence-based practice, and research. The Journal of Continuing Education in Nursing, 42, 57–68. 441 Tashakkori, A., & Teddlie, C. (2003). Handbook of mixed methods in social & behavioral research (2nd ed.). Thousand Oaks, CA: Sage. Wittenberg-Lyles, E., Washington, K., Oliver, D. P., Shaunfield, S., Gage, L. A., Mooney, M., & Lewis, A. (2015). “It is the ‘starting over’ part that is so hard”: Using an online group to support hospice bereavement. Palliative & Supportive Care, 13, 351–357. Yang, Y. P., Wang, C., & Wang, J. (2016). The initial development of a checklist for assessing thirst in patients with advanced dementia. The Journal of Nursing Research, 24, 224–230. Zimnicki, K. M. (2015). Preoperative teaching and stoma marking in an inpatient population: A quality improvement process using a FOCUS-PlanDo-Check-Act model. Journal of Wound, Ostomy, and Continence Nursing, 42, 165–169. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 442 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Describir los cuatro niveles de medición e identificar cuál se usó para medir variables específicas. Describir las características de las distribuciones por frecuencia e identificar e interpretar varias estadísticas descriptivas. Describir la lógica y el propósito del cálculo de un parámetro e interpretar los intervalos de confianza. Describir la lógica y el propósito de la prueba de hipótesis e interpretar los valores p. Especificar las aplicaciones apropiadas para las pruebas t, el análisis de varianza, las pruebas de χ2 y los coeficientes de correlación, e interpretar el significado de las estadísticas calculadas. Comprender los resultados de los procedimientos estadísticos simples descritos en un reporte de investigación. Identificar diversos tipos de estadísticas de variables múltiples y describir situaciones en las que pueden emplearse. Identificar los índices usados en las valoraciones de confiabilidad y validez. Definir los términos nuevos del capítulo. Términos clave 443 Alfa (α) Análisis de covarianza (ANCOVA) Análisis de varianza (ANOVA) ANOVA de mediciones repetidas Cálculo de parámetro Cociente F Coeficiente alfa Coeficiente de correlación Coeficiente de correlación intraclase (CCI) Coeficiente de correlación múltiple Correlación Desviación estándar Distribución desviada Distribución normal Distribución por frecuencia Distribución simétrica Error tipo I Error tipo II Especificidad Estadística Estadística d Estadística de prueba Estadísticas de variables múltiples Estadísticas descriptivas Estadísticas inferenciales Intervalo Intervalo de confianza (IC) Kappa de Cohen Matriz de correlación Media Mediana Medición de intervalo Medición de proporción Medición nominal Medición ordinal Moda N Nivel de medición Nivel de significancia Número necesario a tratar (NNT) 444 Parámetro Prueba de hipótesis Prueba de ji cuadrada (χ2) Prueba estadística Prueba t r R2 r de Pearson r de Spearman Razón de probabilidades (OR) Reducción de riesgo absoluto (RRA) Regresión logística Regresión múltiple Relación negativa Relación positiva Resultado no significativo (NS) Riesgo absoluto (RA) Sensibilidad Significancia estadística Tabla de contingencia Tamaño del efecto Tendencia central Valor p Variabilidad Variable continua Variable predictiva El análisis estadístico se usa en la investigación cuantitativa con tres propósitos principales: describir los datos (p. ej., las características de la muestra), verificar hipótesis y proporcionar evidencia de las propiedades de la medición de las variables cuantificadas (véase el capítulo 10). Este capítulo presenta una revisión breve de los procedimientos estadísticos para lograr estos fines. Sin embargo, se comienza por explicar los niveles de medición. Cabe mencionar que el análisis estadístico de los datos se facilitan con programas como el SPSS y el Stata. TIP Aunque la idea de aprender estadística puede causar ansiedad, considérese la visión de Florence Nightingale sobre la estadística: “Para comprender los pensamientos de Dios debemos estudiar estadística, ya que es la medida de Su 445 propósito”. NIVELES DE MEDICIÓN Las operaciones estadísticas dependen del nivel de medición de una variable. Existen cuatro niveles de medición principales. La medición nominal, el nivel más bajo, implica el uso de números tan solo para clasificar atributos. El género es un ejemplo de una variable con medición nominal (p. ej., mujeres = 1, hombres = 2). Los números que se utilizan en la medición nominal no tienen un significado cuantitativo y no puede dárseles un tratamiento matemático. No tiene sentido calcular el género promedio de una muestra. La medición ordinal clasifica a las personas respecto a un atributo. Por ejemplo, el siguiente esquema ordinal que mide la capacidad para realizar las actividades de la vida diaria (AVD): 1 = completamente dependiente, 2 = necesita ayuda de otra persona, 3 = necesita asistencia mecánica y 4 = completamente independiente. Los números indican capacidad creciente para realizar las AVD de manera independiente, pero no informan cuánto mayor es un nivel sobre otro. Como con las mediciones nominales, las operaciones matemáticas con los datos de nivel ordinal son limitadas. La medición de intervalo se realiza cuando los investigadores pueden ordenar a las personas según un atributo y especifican la distancia entre ellas. La mayoría de las escalas y pruebas psicológicas produce mediciones de nivel intervalo. Por ejemplo, la prueba de Inteligencia Stanford-Binet (IQ) es una medición de intervalo. La diferencia entre una calificación de 140 y una de 120 es equivalente a la diferencia entre 120 y 100. Muchos procedimientos estadísticos requieren datos de intervalo. La medición de proporción es el nivel más alto. A diferencia de las escalas de intervalo, las de proporción tienen un cero significativo y aportan información de la magnitud absoluta del atributo. Muchas mediciones físicas, como el peso de una persona, son mediciones de proporción. Tiene sentido decir que alguien que pesa 90 kg es dos veces más pesado que alguien que pesa 45 kg. Los procedimientos estadísticos adecuados para los datos de intervalo también son apropiados para los datos de nivel de proporción. Las variables con mediciones de intervalo y proporción por lo regular se llaman 446 variables continuas. Ejemplo de distintos niveles de medición Grønning y sus colaboradores (2014) evaluaron el efecto de un programa educativo dirigido por un profesional de enfermería para pacientes con poliartritis inflamatoria crónica. El género y el diagnóstico se midieron como variables de nivel nominal. La educación (10 años, 11 a 12 años, 13 y más años) fue una medición ordinal. Muchos resultados (p. ej., autoeficacia, capacidad para enfrentar soluciones) se midieron con escalas de nivel de intervalo. Otras variables se midieron en un nivel de proporción (p. ej., edad, número de ingresos al hospital). Los investigadores casi siempre se esfuerzan en usar los niveles más altos de medición posibles porque dichos niveles aportan más información y son susceptibles a análisis poderosos. TIP CÓMO SABER ¿Cómo puede conocerse el nivel de medición de una variable? Una variable es nominal si el valor puede intercambiarse (p. ej., 1 = masculino, 2 = femenino O 1 = femenino, 2 = masculino). Por lo general, una variable es ordinal si existe un orden cuantitativo de los valores. Y si hay un número pequeño de valores (p. ej., excelente, bueno, regular, malo). Una variable casi siempre se considera intervalo si se mide con una escala o prueba compuesta. Una variable está en el nivel de proporción si tiene sentido decir que un valor es dos veces mayor que otro (p. ej., 100 mg es dos veces mayor que 50 miligramos). ESTADÍSTICAS DESCRIPTIVAS Las estadísticas descriptivas permiten a los investigadores dar sentido a la información numérica. Las estadísticas descriptivas se usan para sintetizar y describir datos. Cuando se calculan índices como los promedios y los porcentajes con los datos de la población, estos son parámetros. Un índice descriptivo de una muestra es una estadística. La mayoría de las preguntas de investigación es acerca de parámetros; los investigadores calculan las estadísticas para estimar los parámetros y usan las estadísticas inferenciales para hacer deducciones sobre la población. 447 Desde el punto de vista descriptivo, los datos de una variable continua pueden presentarse en términos de tres características: la forma de la distribución de los valores, la tendencia central y la variabilidad. Distribuciones por frecuencia Los datos que no están organizados son abrumadores. Consideremos los 60 números de la tabla 14-1. Asuma que son las calificaciones de 60 pacientes preoperatorios en una escala de ansiedad. La inspección visual de estos números aporta poca información de la ansiedad de los pacientes. Las distribuciones por frecuencia imponen un orden a los datos numéricos. Una distribución por frecuencia es un ordenamiento de valores desde el más bajo hasta el más alto y una cuenta o porcentaje de cuántas veces ocurrió cada valor. Una distribución por frecuencia de las 60 calificaciones de ansiedad (tabla 14-2 en la siguiente página) facilita ver las calificaciones más alta y la más baja, dónde se agrupan las calificaciones y cuántos pacientes había en la muestra (el tamaño total de la muestra se designa como N en los reportes de investigación). TABLA 14-2 Distribución por frecuencia de las calificaciones de ansiedad de los pacientes Calificación Frecuencia Porcentaje (%) 15 1 1.7 16 17 18 19 20 2 3.3 2 3.3 3 5.0 2 3.3 4 6.7 448 21 3 5.0 22 23 24 25 26 27 28 29 30 4 6.7 5 8.3 9 15.0 7 11.7 6 10.0 4 6.7 3 5.0 3 5.0 2 3.3 N = 60 100.0% Los datos de frecuencia pueden presentarse gráficamente en un polígono de frecuencia (fig. 14-1). En tales gráficas, las calificaciones casi siempre están en la línea horizontal y las cuentas o porcentajes se encuentran en la vertical. Las distribuciones pueden describirse por sus formas. La distribución simétrica ocurre si cuando se pliega, las dos mitades de un polígono de frecuencia se superponen (fig. 14-2). En una distribución desviada o asimétrica, el pico está fuera del centro y una cola es más larga que la otra. Cuando la cola más larga apunta a la derecha, la distribución tiene una desviación positiva, como en la figura 14-3A. El ingreso personal tiene una desviación positiva: la mayoría de las personas tiene ingresos intermedios, con solo unas cuantas con ingresos altos en el extremo derecho de la distribución. Si la cola más larga apunta a la izquierda, la distribución tiene una desviación negativa (fig. 14-3B). La edad al morir tiene una desviación negativa: la mayoría de las personas está en el extremo derecho de la distribución, menos personas mueren en la juventud. 449 Figura 14-1 Polígono de frecuencia de las calificaciones de ansiedad de los pacientes. Figura 14-2 Ejemplos de distribuciones simétricas. Otro aspecto de una forma de distribución se refiere al número de picos que tiene. Una distribución unimodal tiene un pico (fig. 14-2A), mientras que una distribución multimodal tiene dos o más picos: dos o más valores con frecuencia alta. Una distribución con dos picos es bimodal (fig. 14-2B). Una distribución especial llamada distribución normal (una curva con forma de campana) es simétrica, unimodal y con pico no muy pronunciado (fig. 14-2A). Muchos atributos humanos (p. ej., 450 talla, inteligencia) se aproximan a una distribución normal. Tendencia central Las distribuciones por frecuencia aclaran patrones, pero por lo regular se desea un resumen general. Los investigadores hacen preguntas como: “¿cuál es el promedio de consumo calórico de los residentes de asilos?”. Una pregunta así busca un solo número para resumir una distribución. Los índices de tendencia central indican qué es “típico”. Existen tres índices de tendencia central: la moda, la mediana y la media. Moda: es el número que ocurre con mayor frecuencia en una distribución. En la siguiente distribución, la moda es 53: 50 51 51 52 53 53 53 53 54 55 56 El valor 53 ocurre cuatro veces, más que cualquier otra cifra. La moda de las calificaciones de ansiedad de los pacientes en la tabla 142 fue 24. La moda identifica el valor más “popular”. Figura 14-3 Ejemplos de distribuciones desviadas. Mediana: es el punto en una distribución que divide las calificaciones por la mitad. Consideremos el siguiente conjunto de valores: 2233456789 El valor que divide los casos a la mitad está entre el 4 y el 5; por lo tanto, 4.5 es la mediana. La mediana de la calificación de ansiedad es 24, la misma que la moda. La mediana no toma en cuenta los valores 451 individuales y es insensible a los extremos. En el conjunto de números mencionado, si el valor de 9 se cambiara por 99, la mediana aún sería 4.5. Media: equivale a la suma de todos los valores dividida entre el número de participantes, lo que suele llamarse un promedio. La media de las calificaciones de ansiedad de los pacientes es 23.4 (1 405 ÷ 60). Como otro ejemplo, estos son los pesos de ocho personas: 38 49 54 61 71 80 82 88 En este ejemplo, la media es 65. A diferencia de la mediana, la media es influida por el valor de cada calificación. Si se cambiara a la persona de 88 kg por una que pesara 125 kg, la media aumentaría de 65 a 70 kg. En los artículos de investigación, la media a menudo se simboliza como M o (p. ej., = 66). Para las variables continuas, por lo general se informa la media. De los tres índices, la media es la más estable: si se obtienen muestras repetidas de una población, las medias fluctuarán menos que las modas o las medianas. Debido a su estabilidad, la media suele ser la mejor estimación de la tendencia central de una población. Sin embargo, cuando una distribución está desviada, es preferible la mediana. Por ejemplo, la mediana es un mejor índice para el ingreso “promedio” (típico) que la media, ya que el ingreso tiene una desviación positiva. Variabilidad Dos distribuciones con medias idénticas pueden diferir con respecto a qué tan extendidos están los datos: qué tan distintas son las personas entre ellas respecto a un atributo. Esta sección describe la variabilidad de las distribuciones. Consideremos las distribuciones de la figura 14-4 que representan calificaciones hipotéticas de estudiantes de dos escuelas en una prueba de IQ. Ambas distribuciones tienen una media de 100, pero la escuela A tiene un intervalo más amplio de calificaciones, con algunas por debajo de 70 y otras superiores a 130. En la escuela B hay pocas calificaciones bajas o altas. La escuela A es más heterogénea (es decir, más variada) que la escuela B y la escuela B es más homogénea que la escuela A. Los investigadores calculan un índice de variabilidad para expresar el grado en que difieren entre sí las calificaciones en una distribución. Dos índices de uso frecuente 452 son el intervalo y la desviación estándar. Intervalo: el intervalo es la calificación más alta menos el resultado más bajo en una distribución. En el ejemplo de la calificación de ansiedad, el intervalo es 15 (30–15). En las distribuciones de la figura 14-4, el intervalo de la escuela A es de 80 (140–60), mientras que el intervalo de la escuela B es 50 (125–75). La principal virtud del intervalo es la facilidad de su cálculo. Sin embargo, como se basa solo en dos calificaciones, el intervalo es inestable: puede fluctuar mucho de una muestra obtenida de una población a otra. Figura 14-4 Dos distribuciones con variabilidad diferente. 453 Figura 14-5 Desviaciones estándar en una distribución normal. Desviación estándar: el índice de variabilidad más utilizado es la desviación estándar. Como la media, la desviación estándar se calcula con base en todos los valores en una distribución. La desviación estándar resume la cantidad promedio de la desviación de los valores de la media.* En el ejemplo de las calificaciones de ansiedad de los pacientes (tabla 14-2), la desviación estándar es 3.725. En los reportes de investigación, suele usarse DE para abreviar la desviación estándar. TIP A veces, las desviaciones estándar (DE) se muestran en relación con la media sin una etiqueta. Por ejemplo, las calificaciones de ansiedad podrían mostrarse como M = 23.4 (3.7) o M = 23.4 ± 3.7, donde 23.4 es la media y la DE es 3.7. La DE es más difícil de interpretar que el intervalo. Para la DE de las calificaciones de ansiedad, uno podría preguntarse ¿3.725 qué ? ¿Qué significa el número? Estas preguntas pueden responderse desde varios ángulos. Primero, la DE es un índice de qué tan variables son las calificaciones en una distribución; por ejemplo, si los pacientes masculinos y femeninos tuvieran medias de 23.0 en la escala de ansiedad, pero sus DE fueran 7.0 y 3.0, respectivamente, eso significa que las mujeres son más homogéneas (es decir, sus calificaciones fueron más similares entre sí). La DE representa el promedio de las desviaciones de la media. La media informa el mejor valor para resumir la distribución completa y la DE informa cuánto (en promedio) se desvían las calificaciones de la media. Una DE puede interpretarse como el grado de error cuando se usa una media para describir una muestra completa. En las distribuciones normales o casi normales, existen casi tres DE arriba y debajo de la media y un porcentaje fijo de casos cae dentro de ciertas distancias de la media. Por ejemplo, con una media de 50 y una DE de 10 (fig. 14-5), 68% de los casos cae a una DE arriba o debajo de la media. Por lo tanto, casi 7 de 10 calificaciones están entre 40 y 60. En una distribución normal, 95% de las calificaciones cae a 2 DE de la media. Solo unos cuantos casos, alrededor de 2% a cada extremo, se encuentra a más de 2 DE de la media. Con esta cifra puede verse que una persona con una calificación de 70 obtuvo una calificación más alta que casi 98% de la 454 muestra. ___________ *Las fórmulas para calcular la desviación estándar (DE) y otras estadísticas descritas en este capítulo no se incluyen en el libro. El énfasis se coloca en ayudarle a comprender las aplicaciones estadísticas. Puede consultarse la referencia Polit (2010) para conocer el cálculo. TIP Las estadísticas descriptivas (porcentajes, medias, DE) se usan más a menudo para describir las características de la muestra y las variables clave de la investigación, y no documentan características metodológicas (p. ej., tasas de respuesta). Pocas veces se emplean para responder preguntas de investigación (para ello casi siempre se utilizan las estadísticas inferenciales). Ejemplo de estadísticas descriptivas Awoleke y sus colaboradores (2015) estudiaron los factores que predicen retrasos en la búsqueda de atención para un embarazo tubario roto en Nigeria. Presentaron estadísticas descriptivas de las características de las pacientes. La edad media de las 92 mujeres de la muestra era de 30.3 años (DE = 5.6); 76.9% habitaba en una zona urbana, 74.7% estaba casada y 27.5% no tenía partos anteriores. La duración media de la amenorrea antes de acudir al hospital fue de 5.5 semanas (DE = 4.0). Estadísticas descriptivas bivariables Hasta ahora, la discusión se ha enfocado en estadísticas descriptivas univariables (de una variable). Las estadísticas descriptivas bivariables (de dos variables) describen las relaciones entre dos variables. Tablas de contingencia Una tabla de contingencia es una distribución por frecuencia bidimensional en la que las frecuencias de dos variables se presentan en una tabulación cruzada. Supongamos que se tienen datos del género de los pacientes y si eran no fumadores, fumadores ligeros (< 1 cajetilla al día) o fumadores empederni (≥ 1 cajetilla al día). La pregunta es si los hombres fuman más que las mujeres o viceversa (es decir, si existe una relación entre el tabaquismo y el género). Los 455 datos ficticios de este ejemplo se muestran en la tabla 14-3. Se crean seis celdas al colocar una variable (género) en una dimensión y la otra variable (estado de tabaquismo) en la otra dimensión. Después de distribuir los datos de los sujetos en las celdas apropiadas, se calculan los porcentajes. La tabla de contingencia da cuenta de que las mujeres de esta muestra tienen mayor probabilidad que los hombres de ser no fumadoras (45.4 vs. 27.3%) y menor probabilidad de ser fumadoras empedernidas (18.2 vs. 36.4%). Las tablas de contingencia se usan con datos nominales o datos ordinales con pocos valores. En este ejemplo, tal como se aplicó, el género es nominal y el tabaquismo es ordinal. Correlación Las relaciones entre dos variables pueden describirse por métodos de correlación. La pregunta de correlación es: ¿en qué medida están relacionadas entre sí las dos variables? Por ejemplo, ¿en qué grado se relacionan las calificaciones de ansiedad y los valores de presión sanguínea? Esta pregunta puede responderse si se calcula un coeficiente de correlación, que describe la intensidad y la dirección de una relación. Dos variables que están relacionadas son talla y peso: las personas altas tienden a pesar más que las de talla baja. La relación entre talla y peso sería una relación perfecta si la persona más alta en una población fuera la más pesada, la segunda más alta tuviera el segundo peso más alto, etcétera. Un coeficiente de correlación indica qué tan “perfecta” es una relación. Los valores posibles para un coeficiente de correlación varían desde −1.00 a 0.00 y hasta +1.00. Si la talla y el peso tuvieran una correlación perfecta, el coeficiente de correlación sería 1.00 (el coeficiente de correlación real está próximo a 0.50 o 456 0.60 para una población general). La talla y el peso tienen una relación positiva porque la talla más alta tiende a relacionarse con un peso más alto. Cuando dos variables no están relacionadas, el coeficiente de correlación es cero. Uno podría anticipar que la talla de calzado de las mujeres no tiene relación con su inteligencia. Las mujeres con pies grandes tienen tanta probabilidad de desempeñarse adecuadamente en las pruebas de IQ como las que tienen pies pequeños. El coeficiente de correlación que resume tal relación sería cercano a 0.00. Los coeficientes de correlación entre 0.00 y −1.00 expresan una relación negativa (inversa). Cuando dos variables se relacionan de manera inversa, los valores más altos de una variable se vinculan con los valores más bajos de la segunda. Por ejemplo, existe una correlación negativa entre la depresión y la autoestima. Esto significa que, en promedio, las personas con alta autoestima tienden a ser bajas en depresión. Si la relación fuera perfecta (es decir, si la persona con la calificación de autoestima más alta tuviera la calificación más baja de depresión, etc.), el coeficiente de correlación sería −1.00. En realidad, la relación entre la depresión y la autoestima es moderada, casi siempre cercana a −0.30 o −0.40. Nótese que mientras más alto sea el valor absoluto del coeficiente (es decir, el valor, al margen del signo), es más fuerte la relación. Por ejemplo, una correlación de −0.50 es más fuerte que una de +0.30. La estadística de correlación usada con mayor frecuencia es la r de Pearson (el coeficiente de correlación producto-momento), que se calcula con mediciones continuas. Para las correlaciones entre las variables medidas en una escala ordinal, los investigadores casi siempre usan un coeficiente llamado r de Spearman. No existen lineamientos sobre lo que debe interpretarse como correlaciones fuertes o débiles ya que depende de las variables. Si se mide la temperatura corporal de los pacientes por vía oral y por vía rectal, una r de 0.70 entre las dos mediciones sería baja. Sin embargo, para la mayoría de las variables psicosociales (p. ej., estrés y depresión), una r de 0.70 sería alta. Los coeficientes de correlación por lo regular se presentan en tablas que muestran una matriz de correlación bidimensional en la que cada variable se presenta en una fila y en una columna, y los coeficientes se presentan en las intersecciones. Al final de este capítulo se incluye un ejemplo de una matriz de correlación. 457 Ejemplo de correlaciones Elder y sus colaboradores (2016) investigaron el sueño y la actividad en su relación con el índice de masa corporal y el perímetro abdominal (cintura, PA). Encontraron una modesta correlación positiva entre el PA y el sedentarismo (r = 0.17) y una modesta correlación negativa entre la duración del sueño y el PA (r = −0.11). Descripción del riesgo El movimiento de la práctica basada en evidencia (PBE) ha hecho que la toma de decisiones basada en los hallazgos de la investigación sea un aspecto importante. Pueden usarse varios índices descriptivos para facilitar dicha toma de decisiones. Muchos de estos índices implican cálculo de diferencias de riesgo, como diferencias en el riesgo antes y después de la exposición a una intervención provechosa. Esta descripción se enfoca en resultados dicotómicos (p. ej., tuvo una caída/no tuvo una caída) relacionados con la exposición o no exposición a un tratamiento beneficioso o un factor protector. Esta situación genera una tabla de contingencia de 2 × 2 con cuatro celdas. Las cuatro celdas de la tabla 14-4 están denominadas, por lo que pueden explicarse varios índices. La celda a es el número de casos 458 con un resultado indeseable (p. ej., una caída) en un grupo de intervención/protegido, la celda b es el número con un resultado deseable (p. ej., sin caída) en un grupo de intervención/protegido y las celdas c y d son dos posibilidades de resultado para un grupo no tratado/no protegido. Ahora pueden explicarse el significado y el cálculo de algunos índices de interés para los profesionales clínicos. Riesgo absoluto El riesgo absoluto puede calcularse para los que se exponen a una intervención/factor protector y para los que no se exponen. El riesgo absoluto (RA) es solo la proporción de personas que experimentó un resultado indeseable en cada grupo. Supóngase que 200 fumadores se distribuyen al azar a una intervención para dejar de fumar o a un grupo control (tabla 14-5). El resultado es el estado de tabaquismo 3 meses después. En este caso, el RA de continuar fumando es 0.50 en el grupo de intervención y 0.80 en el grupo control. Sin la intervención, 20% de los del grupo experimental habría dejado de fumar de cualquier manera, pero la intervención impulsó la tasa hasta 50%. Reducción de riesgo absoluto El índice de reducción de riesgo absoluto (RRA), una comparación de los dos riesgos, se calcula al restar el RA del grupo expuesto del RA del grupo no expuesto. Este índice es el resultado de la proporción calculada de personas que no tendrían el resultado indeseable debido a la exposición a una intervención/factor protector. En el ejemplo, el valor de la RRA es 0.30: 30% de los sujetos del grupo control habría dejado de fumar si hubiera recibido la intervención, además de 20% que abandonó el tabaquismo sin la intervención. 459 Razón de probabilidades La razón de probabilidades es un índice de riesgo que se usa con frecuencia. En este contexto, la probabilidad es la proporción de personas con el resultado adverso con respecto a aquellas sin el resultado. En el ejemplo, la probabilidad de continuar fumando en el grupo de intervención es 1.0: 50 (los que mantuvieron el tabaquismo) dividido entre 50 (los que lo abandonaron). La probabilidad para el grupo control es 80 dividido entre 20: 4.0. La razón de probabilidades (OR, por sus siglas en inglés) es el cociente entre estas dos probabilidades, en este caso 0.25. La probabilidad calculada de mantener el tabaquismo entre los integrantes del grupo de intervención es un cuarto de la probabilidad de los sujetos del grupo control. Dicho de otra manera, la probabilidad calculada de continuar el consumo de tabaco es cuatro veces mayor entre los fumadores que no reciben la intervención que entre los que la reciben. Ejemplo de razón de probabilidades Draughon Moret y sus colaboradores (2016) examinaron los factores relacionados con la aceptación de los pacientes de la profilaxis postexposición no ocupacional (PPEn) para VIH después de un ataque sexual; muchos resultados se informaron como OR. Por ejemplo, los pacientes tuvieron una probabilidad casi 13 veces más alta de recibir la oferta de PPEn si habían sido agredidos por más de un atacante (OR = 12.66). 460 Número necesario a tratar El índice número necesario a tratar (NNT) calcula cuántas personas deberían recibir una intervención para prevenir un resultado indeseable. El NNT se calcula al dividir 1 entre la RRA. En el ejemplo, RRA = 0.30, por lo que el NNT es 3.33. Es necesario exponer a cerca de tres fumadores a la intervención para evitar que una persona siga fumando. El NNT es valioso porque puede integrarse con la información financiera para demostrar la probabilidad de que una intervención sea rentable. TIP Otro índice de riesgo es el riesgo relativo (RR). El RR es la proporción calculada del riesgo original de un resultado adverso (en el ejemplo, continuar fumando) que persiste cuando las personas se exponen a la intervención. En el ejemplo, el RR es 0.625 (0.50/0.80): se calcula que el riesgo de continuar fumando es 62.5% de lo que habría sido sin la intervención. INTRODUCCIÓN A LAS ESTADÍSTICAS INFERENCIALES Las estadísticas descriptivas son útiles para resumir datos, pero los investigadores casi siempre hacen más que describir. Las estadísticas inferenciales, basadas en las leyes de probabilidad, son un medio para hacer deducciones sobre una población con base en los datos de una muestra. Las estadísticas inferenciales se usan para probar hipótesis de investigación. Distribuciones de muestreo Las estadísticas inferenciales se basan en la suposición del muestreo aleatorio de casos en las poblaciones, aunque esta suposición casi siempre se ignora. Sin embargo, incluso con el muestreo aleatorio, las características de la muestra pocas veces son idénticas a las de la población. Supongamos que se tiene una población de 100 000 residentes en asilos cuya calificación media en una prueba de función física (FF) fue de 500, con una DE de 100. Como no se conocen estos parámetros, asúmase que deben calcularse con base en las calificaciones de una muestra aleatoria de 100 residentes. Es improbable que se obtenga una media exacta de 500. La media de la 461 muestra podría ser 505, por ejemplo. Si se obtiene una nueva muestra de 100 residentes, la calificación media de FF podría ser 497. Las estadísticas de la muestra fluctúan y no son iguales al parámetro debido al error de muestreo. Los investigadores necesitan una manera de valorar si las estadísticas de la muestra son estimaciones adecuadas de los parámetros de la población. Para comprender la lógica de las estadísticas inferenciales debe realizarse un ejercicio mental. Considérese la obtención de 5 000 muestras consecutivas de 100 residentes por muestra de una población de todos los residentes. Si se calcula una calificación media de FF en cada ocasión, podría graficarse la distribución de estas medias de muestras, como se presenta en la figura 14-6. Esta distribución es una distribución de muestreo de la media. Una distribución de muestreo es teórica: nadie en realidad obtiene muestras consecutivas de una población y grafica sus valores medios. Los estadísticos demostraron que las distribuciones de muestreo de las medias tienen una distribución normal y su media equivale a la media de la población. En el ejemplo, la media de la distribución de muestreo es 500, la misma que la media de la población. Para una distribución de muestreo normal de las medias, hay una probabilidad de 95 en 100 de que la media de una muestra se encuentre entre +2 DE y −2 DE de la media de la población. La DE de la distribución de muestreo –llamada error estándar de la media (o EEM)– puede calcularse con una fórmula que usa dos elementos de información: la DE de la muestra y el tamaño de la muestra. En el ejemplo, el EEM es 10 (fig. 14-6), que es el cálculo del grado de error de muestreo que habría de una media de muestra a otra en un número infinito de muestras de 100 residentes. 462 Figura 14-6 Distribución de muestreo de una media. Ahora puede calcularse la probabilidad de obtener una muestra con una media determinada. Con un tamaño de muestra de 100 y una media de la población de 500, hay 95 probabilidades en 100 de que la media de una muestra caiga entre 480 y 520, 2 DE arriba o abajo de la media. Solo cinco veces de cada 100, la media de una muestra aleatoria de 100 residentes sería mayor de 520 o menor de 480. El EEM depende en parte del tamaño de la muestra, por lo que el aumento de tamaño de la muestra mejora la exactitud de la estimación. Si se usa una muestra de 400 residentes para calcular la media, el EEM solo sería de 5. La probabilidad sería de 95 en 100 de que la media de la muestra estuviera entre 490 y 510. La probabilidad de obtener una muestra con una media muy diferente a la media de la población se reduce conforme aumenta el tamaño de la muestra. El lector podría preguntarse por qué es necesario aprender estas nociones estadísticas abstractas. Considere que se trata de la exactitud de los resultados de los investigadores. Un consumidor inteligente necesita evaluar de manera crítica qué tan creíble es la evidencia de la investigación para poder decidir si la incorpora o no en la práctica de la enfermería. Cálculo de parámetro 463 La inferencia estadística consta de dos técnicas: cálculo de parámetro y prueba de hipótesis. El cálculo de parámetro se usa para estimar el parámetro de una población; por ejemplo, una media, una proporción o una diferencia en las medias de dos grupos (p. ej., fumadores y no fumadores). Estimación puntual se refiere al cálculo de una sola estadística para estimar el parámetro. En el ejemplo, si la calificación media de FF para una muestra de 100 residentes de asilos fuera 510, esta sería la estimación puntual de la media de la población. Las estimaciones puntuales no aportan información del margen de error del cálculo. La estimación de intervalo de un parámetro proporciona un intervalo de valores en los que el parámetro tiene una probabilidad especificada de caer. Con la estimación del intervalo, los investigadores construyen un intervalo de confianza (IC) alrededor de la estimación puntual. El IC alrededor de la media de una muestra establece un intervalo de valores para el valor de la población y la probabilidad de estar en lo correcto. Por convención, los investigadores usan un IC de 95 o 99%. TIP Los IC responden una pregunta clave de la PBE para apreciar la evidencia, como se presenta en el recuadro 2-1 del capítulo 2: ¿qué tan preciso es el cálculo de los efectos? Como se indicó antes, 95% de las calificaciones en una distribución normal cae a casi 2 DE (más exactamente, 1.96 DE) de la media. En el presente ejemplo, si la estimación puntual de las calificaciones medias es 510 con una DE = 100, el EEM para una muestra de 100 sería de 10. Puede construirse un IC de 95% con esta fórmula: IC 95% = ( ± 1.96 × EEM). La confianza es de 95% de que la media de la población esté entre los valores equivalentes a 1.96 veces el EEM, arriba y abajo de la media de la muestra. En el ejemplo, con un EEM de 10, el IC de 95% alrededor de la media de la muestra de 510 estaría entre 490.4 y 529.6. Los IC reflejan la magnitud del riesgo de estar equivocados que los investigadores asumen. Con un IC de 95%, los investigadores se arriesgan a estar equivocados 5 veces de cada 100. Un IC de 99% establece el riesgo en solo 1% al permitir un intervalo más amplio de valores posibles. En el presente ejemplo, el IC de 99% alrededor de 510 es 484.2 a 535.8. Con un riesgo menor de estar equivocado, la precisión se reduce. Para un intervalo de 95%, la amplitud del IC es cercana a 39 puntos; para un intervalo de 99%, la amplitud es de 52 464 puntos. El riesgo de error aceptable depende de la naturaleza del problema, pero para la mayoría de los estudios un IC de 95% es suficiente. Ejemplo de intervalos de confianza alrededor de la razón de probabilidades Steindal y sus colaboradores (2015) compararon los analgésicos administrados en los últimos 3 días de vida a pacientes adultos mayores jóvenes (de 65 a 84 años) y a adultos mayores de edad avanzada (de 85 años y más). Los mayores jóvenes tuvieron una probabilidad más de tres veces mayor que los adultos mayores de edad avanzada de recibir paracetamol con codeína (OR = 3.25, IC 95% [1.02, 10.40]). Prueba de hipótesis Con la pruebas de hipótesis estadística, los investigadores usan criterios objetivos para decidir si las hipótesis deben aceptarse o rechazarse. Supongamos que se postula la hipótesis de que las pacientes de maternidad que recibieron apoyo interactivo en línea para la lactancia amamantarán más tiempo que las madres que no lo recibieron. El número medio de días de amamantamiento es 131.5 para 25 madres del grupo de intervención y 125.1 para 25 madres del grupo control. ¿Debe concluirse que existe apoyo para la hipótesis? Las diferencias grupales tienen la dirección prevista, pero en otra muestra, la media grupal podría ser más similar. Hay dos explicaciones posibles para el resultado observado: (1) la intervención fue efectiva para alentar la lactancia materna o (2) la diferencia media en esta muestra se debió a la casualidad (error de muestreo). La primera explicación es la hipótesis de investigación, la segunda es la hipótesis nula, la cual indica que no hay relación entre la variable independiente (la intervención) y la variable dependiente (la duración del amamantamiento). La prueba de hipótesis estadística es un proceso de desaprobación. No puede demostrarse de manera directa que la hipótesis de investigación sea correcta, pero es posible demostrar que la hipótesis nula tiene una elevada probabilidad de ser incorrecta y tal evidencia apoya la hipótesis de investigación. La prueba de hipótesis ayuda a los investigadores a decidir de manera objetiva si los resultados son un reflejo de diferencias aleatorias o de los efectos declarados en la hipótesis. Los investigadores usan las 465 pruebas estadísticas con la esperanza de rechazar la hipótesis nula. Las hipótesis nulas se aceptan o rechazan con base en los datos de la muestra, pero las hipótesis son sobre valores de la población. El interés en probar las hipótesis, como en toda inferencia estadística, es utilizar una muestra para hacer suposiciones sobre una población. Errores tipo I y tipo II Los investigadores deciden si aceptan o rechazan la hipótesis nula mediante el cálculo de qué tan probable es que las diferencias grupales observadas sean resultado de la casualidad. Sin datos de la población, no puede confirmarse que la hipótesis nula es verdad o no. Los investigadores deben contentarse con decir que las hipótesis son probablemente verdaderas o probablemente falsas. Los investigadores pueden cometer dos tipos de error: rechazar una hipótesis nula verdadera o aceptar una hipótesis nula falsa. La figura 14-7 resume los posibles resultados de sus decisiones. Los investigadores cometen un error tipo I cuando rechazan una hipótesis nula que es verdadera. Por ejemplo, si se decide que el apoyo en línea fomentó de manera efectiva la lactancia cuando en realidad las diferencias grupales se debieron a un error de muestreo, se cometería un error tipo I, una conclusión falsa positiva. Si se decide que las diferencias en el amamantamiento se debieron a fluctuaciones en el muestreo cuando la intervención en realidad tuvo un efecto, se cometería un error tipo II, una conclusión falsa negativa. Figura 14-7 Resultados de la toma de decisión estadística. Nivel de significancia 466 Los investigadores no saben cuándo cometieron un error en la toma de decisiones estadísticas. Sin embargo, controlan el riesgo de error tipo I mediante la selección de un nivel de significancia, que es la probabilidad de cometer un error de tipo I. Los dos niveles de significancia (referida como alfa o α) que se usan con mayor frecuencia son 0.05 y 0.01. Con un nivel de significancia de 0.05 se acepta el riesgo de que en 100 muestras de una población, la hipótesis nula se rechace de manera errónea cinco veces. Sin embargo, en 95 de cada 100 casos, una hipótesis nula verdadera se aceptaría de manera correcta. Con un nivel de significancia de 0.01, el riesgo de error tipo I es menor: solo en 1 muestra de 100 se rechazaría de manera errónea la hipótesis nula. Por convención, el nivel alfa mínimo aceptable es 0.05. TIP Los niveles de significancia son análogos a los valores del IC descritos antes: un valor alfa de 0.05 es análogo al IC de 95% y un alfa de 0.01 es análogo al IC de 99%. Aunque a los investigadores les gustaría disminuir el riesgo de cometer ambos tipos de error, desafortunadamente la reducción del riesgo de error tipo I aumenta el riesgo de error tipo II. Sin embargo, los investigadores pueden disminuir el riesgo de error tipo II si incrementan el tamaño de la muestra. La probabilidad de cometer un error tipo II puede calcularse mediante el análisis de poder, el procedimiento que se mencionó en el capítulo 10 respecto al tamaño de la muestra. El poder es la capacidad de una prueba estadística para detectar relaciones verdaderas. Lo ideal es que los investigadores usen un tamaño de muestra que les dé un poder mínimo de 0.80 y por lo tanto un riesgo de error tipo II no mayor de 0.20 (es decir, un riesgo de 20%). TIP Si un reporte indica que los datos no sustentaron la hipótesis de investigación, considérese si pudo haber ocurrido un error tipo II como resultado del tamaño insuficiente de la muestra. Pruebas de significancia estadística Para probar la hipótesis, los investigadores usan datos del estudio con el fin de calcular una estadística de prueba. Por cada estadística de 467 prueba existe una distribución de muestreo teórica, similar a la distribución de muestreo de la media. La prueba de hipótesis usa distribuciones teóricas para establecer valores probables e improbables para las estadísticas de la prueba, las cuales se usan para aceptar o rechazar la hipótesis nula. Un ejemplo puede ilustrar este proceso. En el ejemplo de una prueba de funcionamiento físico para residentes de asilos, supongamos que existen normas de población, que son los valores derivados de muestras grandes y representativas. Asúmase que en la distribución de muestreo para los datos normativos, la media es 500 con un EEM de 10, como en la figura 14-6. Ahora, digamos que se incluyeron 100 residentes de asilos para participar en una intervención para mejorar el funcionamiento físico. La hipótesis nula es que los que recibieron la intervención tienen calificaciones medias posteriores a la prueba que no son distintas de las obtenidas en la población general (es decir, 500), pero la hipótesis de investigación es que tendrán calificaciones más altas. Después de la intervención, la calificación media de FF para el grupo de intervención es 528. Supongamos ahora que la figura 14-6 muestra la distribución de muestreo para este ejemplo, para una media poblacional de 500 con un EEM de 10. Como puede verse, una calificación media de 528 está más de 2 DE por arriba de la media poblacional, es un valor improbable si la hipótesis nula fuera verdadera. Por lo tanto, se acepta la hipótesis de investigación de que la intervención produjo calificaciones de funcionamiento físico más altas que las de la población.† No estaría justificado decir que se comprobó la hipótesis de investigación porque la posibilidad de un error tipo I persiste, pero la probabilidad es menor de 5 en 100. Los investigadores que informan los resultados de la prueba de hipótesis señalan si sus hallazgos tienen significancia estadística. ___________ †El diseño del ejemplo ficticio es muy defectuoso, con varias amenazas graves a la validez interna. Se usó este ejemplo forzado solo como una manera de ilustrar la prueba de hipótesis La palabra significativo no se refiere a importante o relevante. En estadística, el término significativo indica que no es probable que los resultados se deban a la casualidad en cierto nivel de probabilidad especificado. Un resultado no significativo (NS) indica que cualquier diferencia o relación observada pudo haber sido 468 consecuencia de la casualidad. Generalidades de los procedimientos para prueba de hipótesis En la siguiente sección se describen algunas pruebas estadísticas. Se subrayan las aplicaciones e interpretaciones de las pruebas estadísticas, no los cálculos. Cada prueba estadística puede usarse con tipos específicos de datos, pero el proceso de prueba de hipótesis es similar para todas: 1. Seleccionar una prueba estadística. Los investigadores seleccionan una prueba con base en factores como los niveles de medición de las variables. 2. Especificar el nivel de significancia. Por lo general se elige un nivel alfa de 0.05. 3. Calcular una estadística de prueba. El valor de una estadística de prueba se calcula con los datos del estudio. 4. Determinar los grados de libertad. El término grados de libertad (gl) se refiere al número de observaciones libres para variar acerca de un parámetro. El concepto puede ser confuso, pero calcular grados de libertad es fácil. 5. Comparar la estadística de prueba con un valor teórico. Existen distribuciones teóricas para todas las estadísticas de prueba. El valor calculado de la estadística de prueba se compara con un valor teórico para establecer la significancia o la no significancia. Cuando se emplea una computadora para el análisis, como casi siempre sucede, los investigadores solo siguen el primer paso. La computadora calcula la estadística de prueba, los grados de libertad y la probabilidad real de que la relación evaluada se deba a la casualidad. Por ejemplo, el impreso puede indicar que la probabilidad (p) de que un grupo de intervención tenga un número medio más alto de días de amamantamiento que un grupo control con base en la mera casualidad es 0.025. Esto significa que menos de 3 veces de cada 100 (solo 25 veces en 1 000) se observaría una diferencia grupal de ese tamaño por casualidad. El valor p calculado se compara luego con el valor alfa deseado. En este ejemplo, si el nivel de significancia se estableció en 0.05, los resultados serían significativos porque 0.025 es más estricto que 0.05. Cualquier probabilidad calculada mayor de 469 0.05 (p. ej., 0.15) indica una relación no significativa (es decir, una que pudo haber ocurrido por casualidad en más de 5 de cada 100 muestras). TIP Casi todas las pruebas discutidas en este capítulo son pruebas paramétricas, las que se enfocan en parámetros de la población e implican ciertas suposiciones sobre las variables en el análisis, en particular la suposición de que su distribución en la población es normal. En contraste, las pruebas no paramétricas no calculan parámetros e implican suposiciones menos restrictivas acerca de la forma de la distribución. PRUEBAS ESTADÍSTICAS VARIABLES Los investigadores usan diversas pruebas estadísticas para hacer inferencias sobre sus hipótesis. Se describen e ilustran varias pruebas bivariables empleadas con frecuencia. Pruebas t Los investigadores por lo regular comparan dos grupos de personas respecto a un resultado. Una prueba paramétrica para probar diferencias en dos grupos se llama prueba t. Supongamos que se desea evaluar el efecto del egreso temprano de las pacientes de maternidad en la competencia materna percibida. Se aplica una escala de competencia materna percibida al momento del egreso a 20 primíparas que tuvieron parto vaginal: 10 que permanecieron en el hospital 25 a 48 horas (grupo de egreso regular) y 10 que salieron 24 horas o menos después del parto (grupo de egreso temprano). Los datos de este ejemplo se presentan en la tabla 14-6. Las calificaciones medias para estos dos grupos son 25.0 y 19.0, respectivamente. ¿Son reales estas diferencias (es decir, existen en la población de madres con egreso temprano y regular)?, o ¿las diferencias grupales son reflejo de fluctuaciones aleatorias? Las 20 calificaciones varían de una madre a otra, van desde 13 hasta 30. Cierta variación refleja diferencias individuales en la competencia materna, algunas podrían derivar del estado de ánimo de las participantes cierto día o de otras causas. La pregunta de investigación es si una cantidad significativa de la variación se relaciona con la variable independiente: el tiempo hasta el egreso del 470 hospital. La prueba t permite hacer inferencias objetivas acerca de esta cuestión. La fórmula para calcular la estadística t utiliza las medias grupales, la variabilidad y el tamaño de la muestra. El valor calculado de t para los datos de la tabla 14-6 es 2.86. En este caso, los grados de libertad derivan del tamaño total de la muestra menos 2 (gl = 20 – 2 = 18). Para un nivel a de 0.05, el valor límite de t con 18 grados de libertad es 2.10. Este valor es el límite superior probable si la hipótesis nula es verdadera. Por lo tanto, la t calculada de 2.86, que es mayor que el valor teórico de t, es improbable (es decir, estadísticamente significativa). Las primíparas con egreso temprano tuvieron una competencia materna percibida significativamente menor que aquellas con egreso regular. En menos de 5 de 100 muestras, una diferencia en los valores medios de esta magnitud se habría debido al azar. En realidad, el valor p es 0.011: solo en 1 muestra de 100 este tamaño de diferencia habría sido casual. La situación descrita requiere una prueba t de grupos independientes: las madres de los dos grupos eran personas distintas, independientes entre sí. Hay situaciones en las que este tipo de prueba t no es apropiado. Por ejemplo, si se compararan las medias de un solo grupo de personas evaluadas antes y después de una intervención, los investigadores calcularían una prueba t pareada (también llamada prueba t de grupos dependientes), con una fórmula distinta. Ejemplo de pruebas t 471 Najafi Ghezeljeh y sus colaboradores (2016) evaluaron los efectos de una intervención con música sobre el dolor y la ansiedad de pacientes quemados. Usaron pruebas t de grupos independientes para comparar las calificaciones de dolor y ansiedad en sujetos que recibieron la intervención musical frente a los del grupo control; también usaron pruebas t pareadas para valorar las diferencias antes y después de la intervención en cada grupo. En lugar de las pruebas t, pueden construirse IC alrededor de la diferencia entre dos medias. En el ejemplo de la tabla 14-6, pueden construirse los IC alrededor de la diferencia media de 6.0 en las calificaciones de competencia materna (25.0 – 19.0 = 6.0). Para un IC de 95%, los límites de confianza son 1.6 y 10.4; puede tenerse confianza a 95% de que la diferencia entre las medias de las poblaciones de madres con egreso temprano y regular se encuentra entre estos valores. Con la información del IC también puede verse que la diferencia media es significativa en p < 0.05 porque el intervalo no incluye 0. Existe una probabilidad de 95% de que la diferencia media no sea menor de 1.6, por lo que esto significa que hay una probabilidad menor de 5% de que no exista una diferencia; por lo tanto, la hipótesis nula puede rechazarse. Análisis de varianza El análisis de varianza (ANOVA) se usa para probar las diferencias grupales medias de tres o más grupos. El ANOVA clasifica la variabilidad de una variable de resultado en dos componentes: variabilidad debida a la variable independiente (p. ej., estado del grupo experimental) y variabilidad debida a todas las demás fuentes (p. ej., diferencias individuales). La variación entre grupos contrasta con la variación dentro de grupos para obtener una estadística de cociente F. Suponiendo que se compara la efectividad de intervenciones para ayudar a las personas a dejar de fumar. Los fumadores del grupo A reciben asesoría de enfermería, a los fumadores del grupo B se les aplica un parche de nicotina y un grupo control (grupo C) no recibe intervención alguna. El resultado es el consumo de cigarrillos en 1 día 1 mes después de la intervención. Treinta fumadores se asignan al azar a uno de los tres grupos. La hipótesis nula es que la media de la población para el tabaquismo después del tratamiento es igual para 472 los tres grupos y la hipótesis de investigación es la diferencia en las medias. La tabla 14-7 presenta datos ficticios para los 30 participantes. Las medias de cigarrillos consumidos después del tratamiento son 16.6, 19.2 y 34.0 para los grupo A, B y C, respectivamente. Estas medias son diferentes, pero ¿son significativamente diferentes o las discrepancias reflejan fluctuaciones aleatorias? Un ANOVA aplicado a estos datos genera un cociente F de 4.98. Para α = 0.05 y gl = 2 y 27 (2 gl entre los grupos y 27 gl dentro de los grupos), el valor F teórico es 3.35. Como el valor de F obtenido de 4.98 es mayor que 3.35, se rechaza la hipótesis nula de que las medias poblacionales son iguales. La probabilidad real, calculada con una computadora, es 0.014. Solo en 14 muestras de 1 000 las diferencias grupales de esta magnitud podrían ser resultado de la mera casualidad. Los resultados del ANOVA respaldan la hipótesis de que los distintos tratamientos se relacionaron con diferencias en el tabaquismo, pero con base en estos resultados no puede decirse si el tratamiento A fue significativamente más efectivo que el tratamiento B. Los análisis estadísticos conocidos como pruebas post hoc (o procedimientos de comparación múltiple) se usan para aislar las diferencias entre las medias grupales que condujeron al rechazo de la hipótesis nula general. Puede usarse un tipo de ANOVA conocido como ANOVA de mediciones repetidas (ANOVA-MR) cuando las medias que se comparan se obtuvieron en distintos puntos temporales (p. ej., la presión sanguínea media 2, 4 y 6 horas después de una intervención quirúrgica). Esto es análogo a la prueba t, ampliada a tres o más puntos de recolección de datos. Cuando se miden dos o más grupos varias veces, un ANOVA-MR aporta información acerca de un efecto principal para el tiempo (¿las mediciones tienen cambios significativos con el tiempo, al margen del grupo?), un efecto principal para los grupos (¿las medias grupales difieren de manera significativa, al margen del tiempo?) y un efecto de interacción (¿los grupos difieren más en ciertos tiempos?). 473 Ejemplo de un ANOVA En un estudio transversal, Lester y sus colaboradores (2015) estudiaron los niveles de sufrimiento entre mujeres que sobrevivieron al cáncer mamario, seleccionadas para representar cuatro periodos temporales en la trayectoria del cáncer. Se usó un ANOVA de una vía para comparar los cuatro grupos en términos de calificaciones en una escala de estrés. Se encontraron diferencias significativas entre los grupos (F [3, 96] = 5.3, p = 0.002). Los niveles de estrés fueron menores entre las mujeres tratadas 6 meses antes en comparación con las que habían recibido tratamiento en fecha más reciente. Prueba de ji cuadrada (χ2) La prueba de ji cuadrada (χ2) se usa para probar hipótesis relacionadas con diferencias en las proporciones, como en una tabla de contingencia. Por ejemplo, supongamos que se estudia el efecto de las instrucciones de enfermería en el cumplimiento de la automedicación por parte del paciente. Los profesionales de enfermería implementan una nueva estrategia para dar instrucciones con 50 pacientes, mientras que 50 pacientes del grupo control reciben la atención usual. La hipótesis de investigación es que un mayor porcentaje de personas del grupo de intervención cumplirá el tratamiento con respecto al grupo control. La tabla 14-8 presenta algunos datos ficticios para este ejemplo; muestra que 60% de los sujetos del grupo que recibió la intervención cumplió el régimen, 474 comparado con 40% del grupo control. No obstante, ¿esta diferencia de 20 puntos porcentuales tiene significancia estadística; es decir, es probable que sea “real”? El valor de la estadística de χ2 para los datos de la tabla 14-8 es 4.00, que puede compararse con el valor de una distribución teórica de ji cuadrada. En este ejemplo, el valor teórico que debe rebasarse para establecer la significancia al nivel de 0.05 es 3.84. El valor obtenido de 4.00 es mayor de lo esperado por la casualidad (el valor p real = 0.046). Puede concluirse que un porcentaje significativamente mayor de pacientes con la intervención cumplió su tratamiento en comparación con los del grupo control. Ejemplo de prueba de ji cuadrada Zou y sus colaboradores (2016) realizaron un estudio controlado aleatorizado para valorar si el camote alivia el estreñimiento en pacientes con leucemia que se someten a quimioterapia. Usaron pruebas de ji cuadrada para estudiar las diferencias grupales en varios resultados. Por ejemplo, un mayor porcentaje de pacientes del grupo de intervención (82.5%) que del grupo control (52.4%) defecó primero en las 24 horas siguientes al inicio de la quimioterapia (χ2 = 12.2, gl = 1, p < 0.001). De la misma forma que con las medias, es posible construir IC alrededor de la diferencia entre las dos proporciones. En el ejemplo, la diferencia grupal en el porcentaje de cumplimiento fue 0.20 (0.60 − 0.40 = 0.20). El IC 95% alrededor de 0.20 es 0.06 a 0.34. Puede tenerse una confianza de 95% de que la diferencia poblacional 475 verdadera en las tasas de cumplimiento entre los grupos está entre 6 y 34%. Este intervalo no incluye 0%, por lo que puede tenerse una confianza de 95% de que las diferencias grupales son “reales” en la población. Coeficientes de correlación La r de Pearson es descriptiva e inferencial. En cuanto estadística descriptiva, r resume la magnitud y la dirección de una relación entre dos variables. Como estadística inferencial, r prueba hipótesis sobre correlaciones en la población; la hipótesis nula es que no existe relación entre dos variables, es decir, que la r de la población es = 0.00. Supongamos que se estudia la relación entre el nivel de estrés informado por los pacientes (las calificaciones más altas indican más estrés) y el pH de su saliva. Con una muestra de 50 pacientes, se encuentra que r = −0.29. Este valor indica una tendencia de las personas con estrés intenso a tener valores de pH más bajos que los sujetos con estrés leve. No obstante, ¿el valor r de −0.29 es una fluctuación aleatoria observada solo en esta muestra o la relación es significativa? Los grados de libertad para los coeficientes de correlación equivalen a N menos 2, 48 en este ejemplo. El valor teórico de r con gl = 48 y α = 0.05 es 0.28. Como el valor absoluto de r calculado es 0.29, la hipótesis nula se rechaza: la relación entre el nivel de estrés de los pacientes y la acidez de su saliva es estadísticamente significativa. Ejemplo de r de Pearson Lewis y Cunningham (2016) estudiaron las percepciones del liderazgo en enfermería en relación con el agotamiento y compromiso en una muestra de 120 profesionales de enfermería en funciones. Muchas correlaciones tuvieron significancia estadística. Por ejemplo, las calificaciones en una escala de agotamiento tuvieron una correlación negativa con las percepciones de liderazgo transformacional (r = −0.54, p < 0.05). Índices de tamaño del efecto Los índices del tamaño del efecto son estimaciones de la magnitud 476 de los efectos de un componente “I” en un componente “O” en las preguntas PICO, un aspecto importante de la PBE (véase recuadro 21 en el capítulo 2). La información del tamaño del efecto puede ser crucial porque con muestras grandes incluso los efectos minúsculos pueden tener significancia estadística. Los valores p dicen si es probable que los resultados sean reales, pero el tamaño del efecto sugiere si son importantes. El tamaño del efecto tiene un papel importante en los metaanálisis. Escapa al alcance de este libro explicar con detalle los tamaños del efecto, pero se presenta un ejemplo. Un índice de tamaño del efecto usado con frecuencia es la estadística d, la cual resume la magnitud de las diferencias entre dos medias, como las diferencias entre las medias de un grupo de intervención y un grupo control en un resultado. Por lo tanto, d puede calcularse para estimar el tamaño del efecto cuando se utilizan pruebas t. Cuando d es cero, significa que no hay efecto, las medias de los dos grupos que se comparan son iguales. Por convención, una d de 0.20 o menos se considera pequeña, una d de 0.50 se considera moderada y una d de 0.80 o más se considera grande. Los diferentes índices del tamaño del efecto y las convenciones de interpretación se relacionan con distintas situaciones. Por ejemplo, la estadística r puede interpretarse de manera directa como un índice de tamaño del efecto, igual que la razón de probabilidades. El punto clave es que encapsulan información sobre el poder que tiene el efecto de una variable independiente en un resultado. TIP Los investigadores que realizan un análisis de poder para calcular qué tan grande es la muestra que necesitan para probar sus hipótesis de forma adecuada (es decir, para evitar el error tipo II) deben calcular con anticipación qué tan grande será el efecto, por lo general con base en una investigación previa o un estudio piloto. Ejemplo del tamaño del efecto calculado Hevezi (2015) condujo un estudio piloto de una intervención de meditación para reducir el estrés relacionado con la fatiga por compasión entre profesionales de enfermería; usó un diseño pretest y postest y pruebas t pareadas. También se calcularon los índices del tamaño del efecto. Las calificaciones en una escala de agotamiento disminuyeron de manera significativa después de la intervención (t = 477 3.58), p = 0.003) y el tamaño del efecto fue grande: d = 0.92. Guía para las pruebas estadísticas bivariables La selección de una prueba estadística depende de varios factores, como el número de grupos y los niveles de medición de las variables de investigación. Para ayudar al lector a evaluar si las pruebas estadísticas usadas por investigadores en enfermería son adecuadas, la tabla 14-9 resume las características clave de las pruebas bivariables mencionadas en este capítulo. TIP Cada vez que un reporte presenta información de pruebas estadísticas como las descritas en esta sección, significa que el investigador estaba probando las hipótesis, ya fuera que estas se señalaran de manera formal en la introducción o no. ANÁLISIS ESTADÍSTICO DE VARIABLES MÚLTIPLES Ojalá fuera posible evitar la descripción de métodos estadísticos complejos en este libro de nivel introductorio. Sin embargo, el hecho es que la mayoría de los estudios cuantitativos de enfermería actuales depende de estadísticas de variables múltiples que incluyen el análisis simultáneo de tres o más variables. El incremento del uso de métodos analíticos sofisticados ha derivado en un mayor rigor en los estudios de enfermería, pero puede dificultar la comprensión de los reportes de investigación por aquellos sin entrenamiento estadístico. 478 Dada la naturaleza introductoria de este libro y el hecho de que muchos lectores no son diestros incluso en las pruebas estadísticas básicas, solo se presenta una descripción breve de tres estadísticas de variables múltiples de uso frecuente. El suplemento en inglés de este capítulo en el sitio web amplía esta presentación. Regresión múltiple Las correlaciones permiten a los investigadores realizar algunas predicciones. Por ejemplo, si la correlación entre las calificaciones en la escuela secundaria y las calificaciones en la escuela de enfermería fuera 0.60, los administradores de la escuela de enfermería podrían hacer predicciones, aunque imperfectas, del desempeño de los aspirantes a dicha escuela. Los investigadores pueden mejorar su predicción de un resultado al realizar una regresión múltiple en la que se incluyen diversas variables independientes en el análisis. Por ejemplo, podría predecirse el peso al nacer de un lactante (el resultado) a partir de variables como el tabaquismo de la madre, la cantidad de atención prenatal y el periodo gestacional. En la regresión múltiple, las variables de resultado son variables continuas. Las variables independientes (a menudo llamadas variables predictivas 479 en la regresión) son variables continuas o dicotómicas de nivel nominal, como masculino/femenino. La estadística usada en la regresión múltiple es el coeficiente de correlación múltiple, simbolizado como R. A diferencia de la r de Pearson, R no tiene valores negativos. R varía de 0.00 a 1.00 y muestra la fuerza de la relación entre varios factores predictivos y un resultado, pero no la dirección. Los investigadores pueden probar si R tiene significancia estadística; es decir, si es distinta de 0.00. Cuando R se eleva al cuadrado, puede interpretarse como la proporción de la variabilidad en el resultado que se explica por los factores predictivos. Para predecir el peso al nacer, si se obtiene un R de 0.50 (R2 = 0.25), podría decirse que los factores predictivos explicaron la cuarta parte de la variación en los pesos al nacer. Sin embargo, tres cuartos de la variación se debieron a factores que no están en el análisis. Por lo general, los investigadores informan los resultados de la correlación en términos de R2, en lugar de R. Ejemplo de análisis de regresión múltiple Bhandari y Kim (2015) exploraron los factores que predicen los comportamientos promotores de la salud entre trabajadores migrantes nepaleses. En su análisis de regresión múltiple, encontraron que edad, género, educación y salud percibida no eran factores predictivos significativos de las calificaciones en una escala de comportamiento promotor de la salud, pero que la autoeficacia sí lo era. El R2 total fue modesto (0.06), pero significativo (p < 0.05). Análisis de covarianza El análisis de covarianza (ANCOVA), que combina características del ANOVA y la regresión múltiple, se usa para el control estadístico de las variables de confusión; es decir, para “igualar” los grupos que se comparan. Esta estrategia es valiosa en ciertas situaciones, como cuando se emplea un diseño con grupo control no equivalente. Cuando no se cuenta con el control por distribución aleatoria, el ANCOVA ofrece la posibilidad del control estadístico. En el ANCOVA, las variables de confusión que se controlan se llaman covariables. El ANCOVA prueba la significancia de las diferencias entre las medias grupales en un resultado después de eliminar el efecto de las covariables. El ANCOVA genera estadísticas 480 F para probar la significancia de las diferencias grupales; es una técnica analítica poderosa y útil para controlar las influencias de confusión en los resultados. Ejemplo de ANCOVA Ham (2015) estudió las características socioeconómicas y conductuales relacionadas con el síndrome metabólico entre niños en edad escolar con sobrepeso y obesidad. Los biomarcadores incluyeron resultados como presión sanguínea, cifras de colesterol y perímetro abdominal. En el ANCOVA, los factores conductuales como el consumo de comida chatarra y la práctica de ejercicio regular fueron las variables independientes; la edad y el género fueron las covariables. Regresión logística La regresión logística analiza las relaciones entre múltiples variables independientes y un resultado de nivel nominal (p. ej., observante vs. no observante). Es similar a la regresión múltiple, aunque emplea un procedimiento de cálculo estadístico diferente. La regresión logística transforma la probabilidad de que ocurra un evento (p. ej., que una mujer practique la autoexploración mamaria o no) en sus probabilidades. Después de transformaciones adicionales, el análisis examina la relación de las variables predictivas con la variable de resultado transformada. Para cada factor predictivo, la regresión logística genera una OR, que es el factor por el cual se modifica la probabilidad por un cambio unitario en los factores predictivos después de controlar otros factores de ese mismo tipo. La regresión logística proporciona razones de probabilidades para cada factor predictivo, además de IC alrededor de estos. Ejemplo de regresión logística Miller y sus colaboradores (2016) examinaron la extensión en que las calificaciones de la escala de Braden y otras variables de detección nutricional (p. ej., índice de masa corporal, pérdida de peso) predicen el desarrollo de úlceras por presión (UP) en pacientes hospitalizados. La calificación inicial en la escala de Braden fue un factor predictivo significativo para UP desarrolladas en el hospital en la primera semana de hospitalización (OR = 0.64; p = 0.009). Los resultados indicaron que cada aumento de 5 puntos en la escala de Braden se relaciona con 481 un descenso de 36% en la probabilidad de desarrollar úlceras por presión. ESTADÍSTICAS DE MEDICIÓN En el capítulo 10 se describieron dos propiedades de medición que constituyen aspectos clave de la calidad de medición: confiabilidad y validez. Cuando se desarrolla una nueva medición, los investigadores realizan una valoración psicométrica para calcular su confiabilidad y validez. Tales mediciones psicométricas dependen de análisis estadísticos y usan índices que se describen de modo breve aquí. Los investigadores por lo regular reportan estadísticas de medición cuando describen las mediciones que decidieron usar con el fin de proporcionar evidencia de que sus datos son confiables. Valoración de la confiabilidad La confiabilidad, puede recordarse, es el grado en que las calificaciones de una medición son consistentes en las evaluaciones repetidas si el rasgo no ha cambiado. En el capítulo 10 se mencionaron tres tipos principales de confiabilidad, cada una de las cuales depende de distintos índices estadísticos: confiabilidad testpostest, confiabilidad entre calificadores y confiabilidad de consistencia interna. La confiabilidad test-postest, que se refiere a la estabilidad de una medición, se valora mediante dos determinaciones separadas de las mismas personas, a menudo con 1 o 2 semanas de diferencia, para luego probar el grado de consistencia entre los dos conjuntos de calificaciones. Algunos investigadores usan la r de Pearson para correlacionar las calificaciones del tiempo 1 con las del tiempo 2, pero el índice preferible para la confiabilidad test-postest es el coeficiente de correlación intraclase (CCI), cuyo valor varía entre 0.00 y 1.00. La confiabilidad entre calificadores se usa para valorar el grado en que dos calificadores u observadores independientes asignan la misma calificación al medir un atributo. Cuando las calificaciones son clasificaciones dicotómicas (p. ej., presencia o ausencia de flebitis por infusión), el índice preferido es la kappa de Cohen, cuyos valores también varían entre 0.00 y 1.00. Si las calificaciones 482 son continuas, casi siempre se usa el coeficiente de correlación intraclase. La confiabilidad de consistencia interna se refiere al grado en que los diversos componentes de una medición de componentes múltiples (p. ej., elementos de una escala psicosocial) miden el mismo atributo de manera consistente. La consistencia interna, un aspecto de la confiabilidad que se reporta con frecuencia, se calcula con un índice llamado coeficiente alfa (o alfa de Cronbach). Si una escala psicosocial incluye varias subescalas, suele calcularse el coeficiente alfa para cada subescala por separado. Para todos estos índices de confiabilidad, mientras más cercano a 1.00 sea el valor, más fuerte es la evidencia de confiabilidad adecuada. Aunque las opiniones sobre los valores mínimos aceptables varían, los de 0.80 o más suelen considerarse apropiados. Los investigadores tratan de seleccionar mediciones con niveles altos de confiabilidad ya demostrados, pero si usan una escala con múltiples elementos, casi siempre calculan también el coeficiente alfa con sus propios datos. Valoración de validez La validez es la propiedad de medición que se refiere al grado en que un instrumento mide lo que se supone que mide. Como la confiabilidad, la validez tiene varios aspectos. Sin embargo, a diferencia de la confiabilidad, es difícil establecer la validez de una medición. La validación es un proceso de construcción de evidencia y por lo general se buscan múltiples formas de evidencia. Validez de contenido La validez de contenido es relevante para mediciones compuestas, como las escalas de elementos múltiples. El problema es si el contenido de los elementos es un reflejo adecuado del constructo de interés. La validación de contenido suele depender de calificaciones expertas de cada elemento, y las calificaciones se usan para calcular un índice llamado índice de validez de contenido (IVC). Un valor de 0.90 o más se sugiere como evidencia de validez adecuada de contenido. Validez de criterio 483 La validez de criterio se refiere al grado en que las calificaciones de una medición son consistentes con un criterio “de referencia”. Los métodos usados para evaluar la validez de criterio dependen del nivel de medición de la medida focal y el criterio. Cuando la medida focal y el criterio son continuos, los investigadores aplican las dos medidas a una muestra y luego calculan la r de Pearson entre las dos calificaciones. Son deseables los coeficientes más grandes, pero no hay un valor límite que se considere el mínimo. Por lo general, la significancia estadística es el estándar para concluir que la validez de criterio es adecuada. Si tanto la medición como el estándar de referencia son variables dicotómicas, los investigadores suelen aplicar métodos para valorar la exactitud diagnóstica. Sensibilidad es la capacidad de la medición para identificar de manera correcta un “caso”, esto es, para detectar o diagnosticar un trastorno adecuadamente. La sensibilidad de una medición es su tasa de resultados positivos verdaderos. Especificidad es la capacidad de la medición para identificar de modo correcto los “no casos”; es decir, para detectar a los sujetos sin la condición de interés. La especificidad es la tasa con la que un instrumento produce resultados negativos verdaderos. Para valorar la sensibilidad y la especificidad de un instrumento, los investigadores necesitan un criterio muy confiable y válido de “ejemplaridad” contra el cual puedan compararse las calificaciones del mismo. Por ejemplo, si se quisiera evaluar la validez de los reportes personales de los adolescentes sobre tabaquismo (sí/no en las últimas 24 horas), podría usarse la concentración urinaria de cotinina, con un valor límite de positividad ≥ 200 ng/mL como estándar de referencia. La sensibilidad se calcularía como el porcentaje de adolescentes que dijo haber fumado y que tenía concentraciones altas de cotinina, dividido entre todos los fumadores reales identificados en la prueba urinaria. La especificidad sería el porcentaje de adolescentes que informa con honestidad que no fumó, o los casos negativos verdaderos, dividido entre todos los negativos verdaderos. Tanto la sensibilidad como la especificidad varían desde 0.00 hasta 1.00. Es difícil establecer estándares de aceptabilidad para la sensibilidad y la especificidad, pero ambas deben ser lo más altas posible. Cuando una medición focal es continua y el estándar de referencia es dicotómico, con frecuencia los investigadores usan una herramienta estadística llamada curva de característica operativa del 484 receptor (ROC, receiver operating characteristic). En una curva ROC se grafica cada calificación de la medida focal contra su sensibilidad y especificidad para hacer una clasificación correcta con base en un criterio dicotómico. La discusión de las curvas ROC escapa al alcance de este libro, pero los lectores interesados pueden consultar Polit y Yang (2016). Validez de constructo La validez de constructo se refiere al grado en que una medida en realidad mide el constructo de interés y por lo regular se valora con procedimientos que prueban hipótesis como los descritos en las secciones anteriores de este capítulo. Por ejemplo, un investigador podría postular la hipótesis de que las calificaciones en una nueva medición (p. ej., una escala de agobio del cuidador) se correlacionarían con las calificaciones en otra medición establecida (p. ej., una escala de depresión). La r de Pearson se usaría para probar esta hipótesis y una correlación significativa aportaría cierta evidencia de validez de constructo. Para la validez de grupos conocidos, que implica la prueba de hipótesis sobre las diferencias esperadas entre los grupos respecto a una nueva medida, puede usarse la prueba t de grupos independientes. Tanto las pruebas estadísticas bivariables como las de variables múltiples son apropiadas para evaluar la validez de constructo de una nueva medición. LECTURA Y COMPRENSIÓN DE LA INFORMACIÓN ESTADÍSTICA Lo más probable es que las estadísticas de medición se presenten en la sección de métodos de un reporte y por lo general son estadísticas publicadas antes por el desarrollador del instrumento. Sin embargo, los hallazgos estadísticos se comunican en la sección de resultados. La información estadística se describe en el texto y las tablas (o con menor frecuencia, en figuras). Esta sección ayuda a leer e interpretar la información estadística. Consejos para leer un texto con información estadística 485 Tanto las estadísticas descriptivas como las inferenciales se incluyen en las secciones de resultados. Por lo general, las estadísticas descriptivas resumen características de la muestra. La información de los antecedentes de los participantes ayuda a los lectores a establecer conclusiones sobre las personas a las que pueden aplicarse los hallazgos. Los investigadores pueden proporcionar información estadística para evaluar los sesgos. Por ejemplo, cuando se usó un diseño cuasi experimental o de casos y controles, los investigadores pueden probar la equivalencia de los grupos que se comparan en las variables basales o de fondo con instrumentos como las pruebas t. Para probar la hipótesis, el texto de los artículos de investigación suele proporcionar la siguiente información referente a las pruebas estadísticas: (1) la prueba usada, (2) el valor de la estadística calculada, (3) los grados de libertad y (4) el nivel de significancia estadística. A continuación se muestran ejemplos de cómo podrían informarse los resultados de varias pruebas estadísticas en el texto. 1. 2. 3. 4. Prueba t: t = 1.68, gl = 160, p = 0.09 Ji cuadrada: χ2 = 16.65, gl = 2, p < 0.001 r de Pearson: r = 0.36, gl = 100, p < 0.01 ANOVA: F = 0.18; gl = 1, 69, NS La estrategia preferible es informar la significancia como la probabilidad calculada de que la hipótesis nula sea correcta, como en el ejemplo 1. En este caso, las diferencias medias grupales observadas podían haberse encontrado por casualidad en 9 de 100 muestras. Este resultado no tiene significancia estadística porque la diferencia media tuvo una probabilidad alta inaceptable de ser falsa. A veces se informa el nivel de probabilidad tan solo al indicar que está debajo o arriba de ciertos límites (ejemplos 2 y 3). Estos resultados son significativos porque la probabilidad de obtener tales resultados por casualidad es menor de 1 en 100. Debe tenerse cuidado de leer el símbolo después del valor p: el símbolo < significa menor que; el símbolo > significa mayor que; es decir, que los resultados no son significativos si el valor p es de 0.05 o mayor. Cuando los resultados no alcanzan significancia estadística en el nivel deseado, los investigadores pueden indicar solo que los resultados fueron no significativos (NS), como en el ejemplo 4. La información estadística suele indicarse entre paréntesis en una oración que describe los hallazgos, como “los pacientes del grupo de 486 intervención tuvieron una tasa significativamente menor de infección que los del grupo control (χ2 = 5.41, gl = 1, p = 0.02)”. Al leer reportes de investigación, los valores reales de las estadísticas de pruebas (p. ej., χ2) no tienen interés inherente. Lo que es importante es si las pruebas estadísticas indican que las hipótesis de investigación fueron aceptadas como probablemente verdaderas (demostrado por los resultados significativos) o rechazadas como probablemente falsas (demostrado por la falta de significancia). Consejos para leer tablas estadísticas Las tablas permiten que los investigadores condensen mucha información estadística y minimicen la redundancia. Considérese por ejemplo presentar información de docenas de coeficientes de correlación en el texto. Las tablas son eficientes, pero pueden ser intimidantes para los lectores novatos de reportes, en parte por la ausencia de estandarización. No existe un formato con aceptación universal para presentar los resultados de la prueba t, por ejemplo. Por lo tanto cada tabla puede ofrecer una dificultad nueva que descifrar. Estas son algunas sugerencias para ayudarlo a comprender las tablas estadísticas. Primero, lea el texto y las tablas al mismo tiempo; el texto puede ayudar a aclarar lo que comunica la tabla. Segundo, antes de intentar comprender los números de la tabla, trate de deducir información de las palabras incluidas. Los títulos y las notas al pie de las tablas por lo regular contienen información importante. Los encabezados de la tabla deben examinarse con cuidado porque indican cuáles son las variables del análisis (a menudo listadas como encabezados en las hileras de la primera columna, como en la tabla 14-10 en la página 255) y qué información estadística se incluye (con frecuencia especificada como encabezados en las columnas). Tercero, quizá sea útil consultar el glosario de símbolos en la página 394 para verificar el significado de un símbolo estadístico. No todos los símbolos del glosario se describieron en este capítulo, por lo que a veces es necesario referirse a un libro de estadística, como el de Polit (2010), para obtener más información. TIP En las tablas, los niveles de probabilidad relacionados con las pruebas de significancia a veces se presentan de manera directa en la tabla misma, en una columna denominada “p” (p. 487 ej., p = 0.03). Sin embargo, en ocasiones los investigadores indican los niveles de significancia en tablas con asteriscos situados junto al valor de la estadística de prueba. Por lo general, un asterisco significa p < 0.05, dos asteriscos indican p < 0.01 y tres asteriscos significan p < 0.001 (debe haber una clave en la base de la tabla que señale lo que significan los asteriscos). Por lo tanto, una tabla podría mostrar t = 3.00 en una columna y p < 0.01 en otra. También es posible que la tabla contenga t = 3.00**. La ausencia de un asterisco indicaría un resultado no significativo. CRÍTICA DE ANÁLISIS CUANTITATIVOS Por lo regular es difícil hacer una crítica a los análisis estadísticos. Las autoras esperan que este capítulo haya ayudado a desmitificar la estadística, pero reconocen el alcance limitado del mismo. Sería poco razonable esperar que el lector sea adepto a evaluar los análisis estadísticos, pero puede buscar ciertos elementos cuando revise artículos de investigación. El recuadro 14-1 presenta algunos lineamientos específicos. Recuadro 14-1 Lineamientos para la crítica de los análisis estadísticos 1. ¿Las estadísticas descriptivas del reporte describen lo suficiente las variables principales y las características de fondo de la muestra? ¿Se usaron las estadísticas descriptivas apropiadas; por ejemplo, se presentó una media cuando los porcentajes habrían sido más informativos? 2. ¿Se realizaron análisis estadísticos para valorar las amenazas a la validez del estudio (p. ej., para probar si había sesgo de selección o sesgo por desgaste)? 3. ¿Los investigadores informaron alguna estadística inferencial? Si no se usaron estadísticas inferenciales, ¿debieron haberse usado? 4. ¿Se proporcionó información acerca de la prueba de hipótesis y la estimación del parámetro (es decir, intervalos de confianza)? ¿Se reportaron los tamaños del efecto? En general, ¿las estadísticas presentadas proporcionan a los lectores suficiente información de los resultados del estudio? 5. ¿Se utilizaron procedimientos de variables múltiples? De no ser 488 así, ¿se debieron haber usado: por ejemplo, la validez interna del estudio se habría fortalecido con el control estadístico de las variables de confusión? 6. ¿Fueron apropiadas las pruebas estadísticas seleccionadas dado el nivel de medición de las variables y la naturaleza de las hipótesis? 7. ¿Fueron significativos los resultados de cualquier prueba estadística? ¿Qué dicen las pruebas acera de la factibilidad de las hipótesis de investigación? ¿Fueron mensurables los efectos? 8. ¿Fueron no significativos los resultados de alguna prueba estadística? ¿Es posible que esto refleje errores de tipo II? ¿Qué factores podrían haber minado la validez de la conclusión estadística del estudio? 9. ¿Se presentó la información sobre la confiabilidad y la validez de las mediciones? ¿Los investigadores usaron mediciones con propiedades de medición adecuadas? 10. ¿Hubo una cantidad apropiada de información estadística? ¿Se organizaron los hallazgos de manera clara y lógica? ¿Se usaron tablas y figuras de forma prudente para resumir grandes cantidades de datos estadísticos? ¿Las tablas son claras, con títulos adecuados y encabezados en hileras y columnas? Un aspecto de la crítica debe enfocarse en cuáles análisis se reportaron. Debe valorarse si la información estadística describe de manera adecuada la muestra y reporta los resultados de las pruebas estadísticas de todas las hipótesis. Otro problema de la presentación se refiere al uso prudente que el investigador haga de las tablas para resumir la información estadística. Una crítica minuciosa también considera si los investigadores emplearon las estadísticas apropiadas. La tabla 14-9 muestra los lineamientos para algunas pruebas estadísticas bivariables utilizadas con frecuencia. Los principales aspectos a considerar son el número de variables independientes y dependientes, los niveles de medición de las variables de investigación y el número de grupos (si los hay) que se comparan. Si los investigadores no usaron una técnica de variables múltiples, debe considerarse si el análisis de dos variables prueba de forma adecuada la relación entre las variables independientes y dependientes. Por ejemplo, si se usó una prueba t o un ANOVA, ¿pudo haberse aumentado la validez interna del estudio con el control estadístico de las variables de confusión mediante un ANCOVA? La 489 respuesta a menudo es “sí”. Por último, hay que estar alerta ante las posibles exageraciones o la subjetividad en los resultados informados. Los investigadores nunca deben declarar que los datos probaron, verificaron, confirmaron o demostraron que las hipótesis eran correctas o incorrectas. Las hipótesis deben describirse como sustentadas o no sustentadas, aceptadas o rechazadas. La principal tarea para los consumidores de investigación novatos al leer una sección de resultados de un reporte de investigación es comprender el significado de las pruebas estadísticas. ¿Qué indican los resultados cuantitativos sobre la hipótesis del investigador? ¿Qué tan creíbles son los hallazgos? La respuesta a tales preguntas constituye la base para interpretar los resultados de investigación, un tema que se discute en el capítulo 15. EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO En esta sección se presentan detalles relacionados con el análisis en un estudio de enfermería, seguido por algunas preguntas para guiar el pensamiento crítico. Lea el resumen y luego responda las preguntas de pensamiento crítico. De ser necesario, consulte el reporte de investigación completo. El ejemplo 1 se presenta en la sección Critical Thinking Activity del sitio web . Las preguntas de pensamiento crítico para el ejemplo 2 se basan en el estudio que aparece en el apéndice A de este libro. Los comentarios en inglés de las autoras sobre estos ejercicios están en la sección Student Resources en . EJEMPLO 1: ESTADÍSTICAS DESCRIPTIVAS E INFERENCIALES Estudio. Características psicológicas y rasgos para encontrar un beneficio del cáncer prostático: correlaciones y factores predictivos (Pascoe y Edvardsson, 2015). Objetivo. El objetivo de este estudio era explorar las correlaciones y los 490 factores predictivos del hallazgo de beneficios del cáncer prostático entre hombres que reciben tratamiento de privación androgénica (TPA). Métodos. Los investigadores usaron un diseño de correlación descriptiva. Recolectaron datos de una muestra de 209 hombres que recibieron TPA en una institución ambulatoria de un hospital de tercer nivel en Australia. Los participantes del estudio completaron cuestionarios de autorreporte que contenían preguntas sobre características demográficas y clínicas. El cuestionario también incluyó varias escalas psicológicas, incluidas escalas para medir la capacidad para superar situaciones, la ansiedad, la depresión y la resiliencia. Los investigadores notaron que un modelo teórico del proceso para superar situaciones los condujo a seleccionar variables independientes que comprenden “factores psicológicos que podrían favorecer el fomento o mantenimiento de estados emocionales positivos, incluso la identificación de algún beneficio” (p. 3). Los participantes completaron una escala de hallazgo de beneficios, la cual contiene 17 ítems acerca de los posibles beneficios de haber tenido cáncer prostático (p. ej., “…me ayudó a aceptar las cosas como se presenten”). Los investigadores indicaron que en su muestra de hombres la consistencia interna de esta escala fue alta (α = 0.96). También se halló una buena consistencia interna para la escala de la capacidad para superar situaciones (α = 0.85), la escala de ansiedad (α = 0.85), la escala de depresión (α = 0.79) y la escala de resiliencia (α = 0.90). Estadísticas descriptivas. Los investigadores presentaron estadísticas descriptivas (medias, DE, intervalos y porcentajes) para referir las características de los miembros de la muestra en términos de características demográficas y calificaciones de las escalas psicológicas. La tabla 14-10 presenta información descriptiva de las variables seleccionadas. La edad de los sujetos de la muestra varió entre 53 y 92 años; la edad media fue 72.0 años (± 7.2). El participante típico tenía una relación de pareja (76.6%) y era jubilado (73.2%). Un poco más de la mitad de los hombres tenía educación mayor a la secundaria (53.1%). En cuanto a las calificaciones de los participantes en las escalas psicológicas, hubo un intervalo adecuado de valores, indicativo de variabilidad apropiada. Las calificaciones en la escala de hallazgo de beneficio variaron entre 17 y 85, que corresponde al intervalo completo de las calificaciones posibles. Pruebas de hipótesis. Los investigadores usaron la r de Pearson para probar las hipótesis de que el hallazgo de un beneficio en estos hombres se relacionaba con varias características psicológicas. La tabla 14-11 presenta una matriz de correlación que muestra los valores de r para los pares de las variables seleccionadas (la matriz de correlación de los investigadores fue más completa). Esta tabla lista seis variables a la izquierda: variable 1, 491 calificaciones en la escala de hallazgos de beneficio (la variable dependiente); variable 2, nivel educativo; variable 3, calificaciones en la escala de capacidad para superar situaciones; variable 4, calificaciones en la escala de depresión; variable 5, calificaciones en la escala de ansiedad; y variable 6, edad. En la columna 1, la matriz de correlación muestra el coeficiente de correlación entre las calificaciones del hallazgo de un beneficio y todas las demás variables. En la intersección de la hilera 1columna 1, se encuentra 1.00, indicativo de que las calificaciones tienen una correlación perfecta entre sí. La siguiente entrada en la columna 1 es la r entre las calificaciones de hallazgo de un beneficio y el nivel educativo. El valor de 0.09 indica una relación positiva muy modesta entre estas dos variables, una relación que no tuvo significancia estadística y que podría ser cero. La correlación más fuerte para las calificaciones de hallazgo de un beneficio fue con los puntajes en la escala para superar situaciones, r = 0.59, p < 0.01. Análisis de variables múltiples. Los investigadores encontraron que seis de sus variables independientes tenían una correlación significativa con las calificaciones en la escala de hallazgo de beneficios. Estas seis variables se ingresaron en un análisis de regresión múltiple. El R2 de estas seis variables predictivas fue 0.38, p < 0.001. Estas variables explicaron 38% de la varianza para el hallazgo de beneficios del cáncer prostático. La capacidad para superar situaciones informada por el sujeto mismo tuvo la 492 mayor contribución, lo que sugiere que la ayuda a los pacientes para que identifiquen estrategias para superar situaciones puede ser valiosa. Ejercicios de pensamiento crítico 1. Responda las preguntas del recuadro 14-1 relevantes para este estudio. 2. Considere también las siguientes preguntas enfocadas: a. Con base en la información de la tabla 14-11, ¿con cuál variable tuvo una correlación significativa el nivel educativo de los hombres? ¿Qué indica esta correlación? b. ¿Cuál es la correlación más fuerte en la tabla 14-11? ¿Cuál es la correlación más débil en esta tabla? ¿Qué indican las correlaciones? 3. ¿Cuáles son algunos de los usos en los que podrían aplicarse estos hallazgos en la práctica clínica? EJEMPLO 2: ANÁLISIS ESTADÍSTICO DEL ESTUDIO DEL APÉNDICE A Lea la sección de métodos del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas del recuadro 14-1 relevantes para este estudio. 2. Considere también las siguientes preguntas enfocadas: a. Al observar la tabla 1, ¿qué porcentaje de padres se habían graduado en la universidad? ¿Cuál fue la calificación media (y la DE) de los 493 padres en la escala de depresión CESD-R? b. En la tabla 2, ¿qué porcentaje de padres autorreportó que “casi nunca” elogiaba a su hijo? ¿Qué porcentaje autorreportó que “casi nunca” criticaba a su hijo? c. En la tabla 4, ¿cuál fue el coeficiente de correlación entre el uso de la crítica autorreportada por los padres y su calificación en la escala de síntomas depresivos? ¿Tuvo significancia estadística esta correlación? ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo. Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Multivariate Statistics. Respuestas a los ejercicios de pensamiento crítico para el ejemplo 2. Recursos en Internet con sitios web útiles para el capítulo 14. Un artículo de investigación de una revista de Wolters Kluwer, el estudio de Pascoe y Edvardsson descrito como ejemplo 1 en las pp. 254-256. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. Existen cuatro niveles de medición: (1) medición nominal: clasificación de atributos en categorías excluyentes entre sí; (2) medición ordinal: ordenamiento de las personas con base en su posición relativa respecto a un atributo; (3) medición de intervalo: indica no solo el orden de las personas, también la 494 distancia entre ellas; y (4) medición de proporción: se distingue de la medición de intervalo porque tiene un punto cero racional. Las mediciones de nivel de intervalo y proporción por lo regular se llaman continuas. Las estadísticas descriptivas se usan para resumir y describir los datos cuantitativos. En las distribuciones de frecuencia, los valores numéricos se ordenan del más bajo al más alto, junto con una cuenta del número (o porcentaje) de veces que se obtuvo cada valor. Los datos de una variable continua pueden describirse por completo en términos de forma de la distribución, tendencia central y variabilidad. La forma de la distribución puede ser simétrica o desviada, con una cola más larga que la otra; también puede ser unimodal con un pico (es decir, un valor de alta frecuencia) o multimodal, con más de un pico. Una distribución normal (curva con forma de campana) es simétrica, unimodal y con un pico no muy pronunciado. Los índices de tendencia central representan el valor promedio o típico de un conjunto de calificaciones. La moda es el valor que aparece con más frecuencia, la mediana es el punto por arriba y por abajo del cual está 50% de los casos, y la media es el promedio aritmético de todas las calificaciones. La media es el índice más estable de tendencia central. Los índices de variabilidad (qué tan dispersos están los datos) incluyen el intervalo y la desviación estándar. El intervalo es la distancia entre las calificaciones más baja y más alta. La desviación estándar (DE) indica cuánto (en promedio) se desvían las calificaciones de la media. En una distribución normal, 95% de los valores se encuentra a 2 DE arriba y abajo de la media. Una tabla de contingencia es una distribución bidimensional de frecuencias en la que las frecuencias de dos variables de nivel nominal u ordinal se tabulan una contra la otra. Los coeficientes de correlación describen la dirección y la magnitud de una relación entre dos variables y va desde −1.00 495 (correlación negativa perfecta) a 0.00 y hasta +1.00 (correlación positiva perfecta). El coeficiente de correlación que se emplea con mayor frecuencia es la r de Pearson, usada con variables continuas. Por lo general, la r de Spearman es el coeficiente de correlación que se utiliza cuando las variables se miden en una escala ordinal. Los índices estadísticos que describen los efectos de la exposición a factores de riesgo o intervenciones aportan información útil para las decisiones clínicas. Un índice de riesgo usado con frecuencia es la razón de probabilidades (OR), que es la proporción entre las probabilidades de un grupo expuesto y uno no expuesto, donde las probabilidades reflejan el porcentaje de personas con un resultado adverso en relación con los individuos sin tal resultado. Las estadísticas inferenciales, basadas en leyes de probabilidad, permiten a los investigadores hacer deducciones acerca de los parámetros de la población con base en los datos de una muestra. La distribución de muestreo de la media es una distribución teórica de la media de un número infinito de muestras del mismo tamaño obtenidas de una población. Las distribuciones de muestreo son la base para las estadísticas inferenciales. El error estándar de la media (EEM) —la DE de esta distribución teórica—indica el grado de error promedio de la media de una muestra; mientras menor sea el EEM más exactas son las estimaciones del valor de la población. La inferencia estadística consiste en dos estrategias: prueba de hipótesis y cálculo de parámetro (cálculo de un valor de la población). La estimación puntual provee un solo valor del cálculo para una población (p. ej., una media). La estimación del intervalo proporciona un intervalo de valores, un intervalo de confianza (IC), dentro del cual se espera que caiga el valor de la población con una probabilidad especificada. Por lo general se informa el IC de 95%, que indica que existe una probabilidad de 95% de que el valor verdadero de la población esté entre los límites de confianza superior e inferior. 496 La prueba de hipótesis mediante pruebas estadísticas permite a los investigadores tomar decisiones objetivas sobre las relaciones entre las variables. La hipótesis nula es que no existe relación entre las variables; el rechazo de la hipótesis nula sustenta la hipótesis de investigación. Para probar las hipótesis, los investigadores calculan una estadística de prueba y luego confirman si la estadística cae fuera de una región crítica en la distribución teórica. El valor de la estadística de prueba indica si la hipótesis nula es “improbable”. Un error tipo I ocurre cuando la hipótesis nula se rechaza de manera errónea (resultado positivo falso). Un error tipo II tiene lugar cuando la hipótesis nula se acepta de forma errónea (resultados negativos falsos). Los investigadores controlan el riesgo de cometer un error tipo I mediante la selección de un nivel de significancia (o nivel alfa), que es la probabilidad de que tal error ocurra. El nivel de 0.05 (el estándar convencional) significa que solo en 5 de 100 muestras se rechazaría la hipótesis nula cuando debía haberse aceptado. La probabilidad de cometer un error tipo II se relaciona con el poder, la capacidad de una prueba estadística para detectar relaciones verdaderas. El criterio estándar para un nivel aceptable de poder es 0.80. El poder aumenta conforme el tamaño de la muestra crece. Los resultados de las pruebas de la hipótesis son significativos o no significativos; significancia estadística significa que no es probable que los resultados obtenidos se deban a fluctuaciones casuales con una probabilidad determinada (valor p). Dos pruebas estadísticas frecuentes son la prueba t y el análisis de varianza (ANOVA); ambas pueden usarse para probar la significancia de la diferencia entre las medias de los grupos. El ANOVA se utiliza cuando existen tres o más grupos; el ANOVA de mediciones repetidas (ANOVA-MR) se emplea cuando los datos se obtienen en múltiples puntos temporales. La prueba de ji cuadrada se usa para probar hipótesis sobre las diferencias en proporciones entre los grupos. La r de Pearson puede utilizarse para probar si una correlación es 497 significativamente diferente de cero. Los índices de tamaño del efecto (como la estadística d) resumen la fuerza del efecto de una variable independiente (p. j., una intervención) sobre una variable de resultado. Las estadísticas de variables múltiples se aplican en la investigación en enfermería para desentrañar relaciones complejas entre tres o más variables. El análisis de regresión múltiple es un método para comprender el efecto de dos o más variables predictivas (independientes) en una variable dependiente continua. El coeficiente de correlación múltiple al cuadrado (R2) es un cálculo de la proporción de variabilidad en la variable de resultado generada por las variables predictivas. El análisis de covarianza (ANCOVA) controla las variables de confusión (llamadas covariables) antes de probar si las diferencias en las medias grupales tienen significancia estadística. La regresión logística se usa en lugar de la regresión múltiple cuando el resultado es dicotómico. Las estadísticas también se utilizan en las valoraciones psicométricas para cuantificar la confiabilidad y validez de una medición. Para la confiabilidad test-postest, el índice preferido es el coeficiente de correlación intraclase (CCI). La kappa de Cohen se usa para calcular la confiabilidad entre calificadores cuando las calificaciones de dos calificadores independientes son dicotómicas. El índice para calcular la confiabilidad de la consistencia interna es el coeficiente alfa. Son deseables los coeficientes de confiabilidad de 0.80 o más. En términos de validez del contenido, las calificaciones expertas de los elementos de una escala se usan para calcular un índice de validez del contenido (IVC). La validez de criterio se evalúa con distintos métodos estadísticos, según el nivel de medición de la medición focal y el criterio. Cuando ambos son dicotómicos, casi siempre se calculan la sensibilidad y la especificidad. La sensibilidad es la capacidad del instrumento para identificar un caso de manera correcta (es 498 decir, su tasa de resultados positivos verdaderos). La especificidad es la capacidad del instrumento para identificar de modo correcto los individuos que no son casos (esto es, su tasa de resultados negativos verdaderos). La validez de constructo se evalúa con procedimientos de prueba de hipótesis, por lo que son adecuadas las pruebas estadísticas como las descritas en este capítulo (p. ej., r de Pearson, pruebas t). REFERENCIAS DEL CAPÍTULO 14 *Awoleke, J., Adanikin, A., & Awoleke, A. (2015). Ruptured tubal pregnancy: Predictors of delays in seeking and obtaining care in a Nigerian population. International Journal of Women’s Health, 27, 141–147. Bhandari, P., & Kim, M. (2015). Predictors of the health-promoting behaviors of Nepalese migrant workers. The Journal of Nursing Research, 24, 232–239. Draughon Moret, J., Hauda, W., II, Price, B., & Sheridan, D. (2016). Nonoccupational postexposure human immunodeficiency virus prophylaxis: Acceptance following sexual assault. Nursing Research, 65, 47–54. Elder, B., Ammar, E., & Pile, D. (2016). Sleep duration, activity levels, and measures of obesity in adults. Public Health Nursing, 33(3), 200–205. *Grønning, K., Rannestad, T., Skomsvoll, J., Rygg, L., & Steinsbekk, A. (2014). Long-term effects of a nurse-led group and individual patient education programme for patients with chronic inflammatory polyarthritis —a randomised controlled trial. Journal of Clinical Nursing, 23, 1005– 1017. Ham, O. K. (2015). Socioeconomic and behavioral characteristics associated with metabolic syndrome among overweight/obese school-age children. Journal of Cardiovascular Nursing. Publicación anticipada en línea. Hevezi, J. A. (2015). Evaluation of a meditation intervention to reduce the effects of stressors associated with compassion fatigue among nurses. Journal of Holistic Nursing. Publicación anticipada en línea. *Lester, J., Crosthwaite, K., Stout, R., Jones, R., Holloman, C., Shapiro, C., & Andersen, B. (2015). Women with breast cancer: Self-reported distress in early survivorship. Oncology Nursing Forum, 42, E17–E23. Lewis, H. S., & Cunningham, C. (2016). Linking nurse leadership and work characteristics to nurse burnout and engagement. Nursing Research, 65, 13–23. Miller, N., Frankenfield, D., Lehman, E., Maguire, M., & Schirm, V. (2016). Predicting pressure ulcer development in clinical practice: Evaluation of 499 Braden Scale scores and nutrition parameters. Journal of Wound, Ostomy, and Continence Nursing, 43, 133–139. Najafi Ghezeljeh, T., Mohades Ardebilii, F., Rafii, F., & Haghani, H. (2016). The effects of music intervention on background pain and anxiety in burn patients: Randomized controlled clinical trial. Journal of Burn Care & Research, 37(4), 226–234. **Pascoe, E. C., & Edvardsson, D. (2015). Psychological characteristics and traits for finding benefit from prostate cancer: Correlates and predictors. Cancer Nursing. Publicación anticipada en línea. Polit, D. F. (2010). Statistics and data analysis for nursing research (2nd ed.). Upper Saddle River, NJ: Pearson. Polit, D. F., & Yang, F. (2016). Measurement and the measurement of change. Philadelphia, PA: Wolters Kluwer. Steindal, S., Bredal, I., Ranhoff, A., Sørbye, L., & Lerdal, A. (2015). The last three days of life: A comparison of pain management in the young old and the oldest old hospitalised patients using the Resident Assessment Instrument for Palliative Care. International Journal of Older People Nursing, 10, 263–272. Zou, J., Xu, Y., Wang, X., Jiang, Q., & Zhu, X. (2016). Improvement of constipation in leukemia patients undergoing chemotherapy using sweet potato. Cancer Nursing, 39, 181–186. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 500 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Describir las dimensiones para interpretar los resultados de la investigación cuantitativa. Describir la mentalidad que conduce a la interpretación crítica de los resultados de la investigación. Identificar enfoques para valorar la credibilidad de los resultados cuantitativos y realizar tal valoración. Distinguir la significancia estadística de la relevancia clínica. Identificar algunos métodos para establecer conclusiones acerca de la relevancia clínica en los ámbitos grupal e individual. Hacer una crítica de la interpretación que los investigadores hacen de sus resultados en la sección de discusión de un reporte de investigación. Definir los términos nuevos del capítulo. Términos clave Calificación del cambio Cambio mínimo importante (CMI) Lineamientos CONSORT Punto de referencia Relevancia clínica Resultados En este capítulo se consideran estrategias para interpretar los resultados estadísticos de los investigadores, lo cual requiere considerar las diversas decisiones teóricas, metodológicas y prácticas que ellos tomaron para realizar el estudio. También se discute un 501 tema importante, pero pocas veces tratado: la relevancia clínica. INTERPRETACIÓN DE LOS RESULTADOS CUANTITATIVOS Los resultados estadísticos se resumen en la sección “Resultados” de un artículo de investigación. Los investigadores presentan sus interpretaciones de los resultados en la sección “Discusión”. Sin embargo, pocas veces son del todo objetivos, por lo que el lector debe desarrollar sus propias interpretaciones. Aspectos de la interpretación La interpretación de los resultados del estudio requiere atención a seis consideraciones diferentes pero superpuestas que se intersecan con las “Preguntas para evaluar la evidencia” presentadas en el recuadro 2-1 del capítulo 2: La credibilidad y exactitud de los resultados. La precisión del cálculo de los efectos. La magnitud de los efectos y la importancia de los resultados. Figura 15-1 Inferencias para interpretar los resultados de la investigación. El significado de los resultados, en particular con respecto a la causalidad. La generalizabilidad de los resultados. Las implicaciones de los resultados para la práctica de la enfermería, el desarrollo de una teoría o la investigación adicional. Antes de discutir estas consideraciones, se recuerda el papel de la inferencia en el pensamiento e interpretación de la investigación. Inferencia e interpretación Una inferencia implica el establecimiento de conclusiones con base en información limitada, mediante el razonamiento lógico. La interpretación de los hallazgos de la investigación conlleva hacer 502 múltiples inferencias. En la investigación, casi todo es un “sustituto” de algo más. Una muestra es un sustituto de una población, la calificación de una escala es un sustituto de la magnitud de un atributo abstracto, etcétera. Los hallazgos de la investigación deben reflejar “la verdad en el mundo real”; los hallazgos son “sustitutos” del estado real de las cosas (fig. 15-1). Las inferencias sobre el mundo real son válidas en la medida que los investigadores tomen buenas decisiones para seleccionar los sustitutos y controlar las fuentes de sesgos. Este capítulo presenta varias posiciones ventajosas para valorar si los hallazgos del estudio en realidad reflejan “la verdad del mundo real”. La mentalidad interpretativa La práctica basada en evidencia (PBE) implica la integración de los resultados de la investigación en la toma de decisiones clínicas. La PBE alienta a los profesionales clínicos a pensar de manera crítica acerca de la práctica clínica y poner a prueba el status quo cuando está en conflicto con “la mejor evidencia”. Pensar de manera crítica y demandar evidencia también es parte del trabajo de quien interpreta una investigación. Así como los profesionales clínicos preguntarían: “¿qué evidencia hay de que esta intervención sea provechosa?”, un interpretador pregunta: “¿qué evidencia hay de que los resultados sean reales y verdaderos?” Para ser un buen interpretador de los resultados de una investigación es provechoso comenzar con una actitud crítica (“demuéstrame”) y una hipótesis nula. La hipótesis nula en la interpretación es que los resultados son erróneos y la evidencia es defectuosa. La “hipótesis de investigación” es que la evidencia refleja la verdad. Los intérpretes deciden si la hipótesis nula tiene mérito mediante el examen crítico de la evidencia metodológica. Mientras más evidencia haya de que el diseño y los métodos del investigador son sólidos, es menos factible la hipótesis nula de que la evidencia es inexacta. CREDIBILIDAD DE LOS RESULTADOS CUANTITATIVOS Una tarea interpretativa crítica consiste en valorar si los resultados 503 son correctos. Esto corresponde a la primera pregunta del recuadro 21: “¿Cuál es la calidad de la evidencia; es decir, qué tan rigurosa y confiable es?” Si los resultados no se consideran creíbles, es improbable que los aspectos interpretativos restantes (significado, magnitud, precisión, generalizabilidad e implicación de los resultados) sean relevantes. La valoración de la credibilidad requiere un análisis cuidadoso de las limitaciones y fortalezas metodológicas y conceptuales. Para concluir si los resultados se aproximan a “la verdad del mundo real”, cada aspecto del estudio –su diseño, plan de muestreo, recolección de datos y análisis– debe someterse al escrutinio crítico. Figura 15-2 cualitativa. Análisis e interpretación en la investigación cuantitativa y Existen varias maneras de abordar el tema de la credibilidad, incluido el uso de los lineamientos para la crítica que se presentaron en todo este libro y el protocolo general para la crítica de la tabla 4-1 del capítulo 4. En esta sección se comparten algunas perspectivas adicionales. Sustitutos e interpretación Los investigadores inician con constructos y luego diseñan formas para volverlos operativos. Los constructos se vinculan con estrategias de investigación reales en una serie de aproximaciones; mientras mejor sean los sustitutos, es probable que los resultados sean más creíbles. En esta sección se ilustran los sustitutos sucesivos con base en los conceptos de muestreo para resaltar el potencial de desafíos ilativos. Cuando los investigadores formulan preguntas de investigación, la población de interés suele ser abstracta. Por ejemplo, supongamos que se desea probar la efectividad de una intervención para aumentar la actividad física en mujeres con ingresos bajos. La figura 15-2 muestra la serie de pasos entre el constructo poblacional abstracto 504 (mujeres con ingresos bajos) y las participantes reales en el estudio. Al usar los datos de la muestra real indicada en la extrema derecha, es probable que el investigador haga inferencias sobre la efectividad de la intervención para un grupo más amplio, pero cada sustituto en el proceso representa un problema potencial para lograr la inferencia deseada. Cuando interpretan un estudio, los lectores deben considerar qué tan factible es que la muestra real refleje la muestra reclutada, la población accesible, la población blanco y el constructo de la población. La tabla 15-1 presenta una descripción de una situación hipotética en la que los investigadores pasaron del constructo de la población (mujeres con ingresos bajos) a una muestra de 161 participantes (receptoras recientes de asistencia social de dos vecindarios de Los Ángeles). La tabla identifica preguntas que deben formularse para hacer inferencias sobre los resultados del estudio. Las respuestas a estas preguntas afectarían la interpretación acerca de si la intervención en realidad es efectiva en las mujeres con ingresos bajos o nada más en las receptoras recientes de beneficencia en Los Ángeles que cooperaron con el equipo de investigación. TABLA 15-1 Ejemplo de series sucesivas de sustitutos en el muestreo Elemento Descripción Constructo de población Mujeres con ingresos bajos Población blanco Todas las mujeres que reciben asistencia pública (beneficencia en efectivo) en el estado de California Población accesible Todas las mujeres que reciben asistencia pública en Los Ángeles y que hablan inglés o 505 Posibles dificultades de inferencia ¿Por qué solo las receptoras de beneficencia, por qué no todas las trabajadoras pobres? ¿Por qué no aquellas con discapacidad? ¿Por qué California? ¿Por qué Los Ángeles? ¿Qué ocurre con las que no hablan inglés español Muestra reclutada Muestra real o español? Una muestra consecutiva de 300 mujeres receptoras de asistencia pública (hablantes de inglés o español) que solicitaron la ayuda en enero de 2017 en dos oficinas de beneficencia elegidas al azar en Los Ángeles 161 mujeres de la muestra reclutada con participación completa en el estudio ¿Por qué solo las solicitantes nuevas; qué hay con las mujeres que la reciben desde tiempo antes? ¿Por qué solo dos oficinas? ¿Son representativas? ¿El mes de enero es un mes típico? ¿Quién se rehusó a participar (o estaba demasiado enferma, etcétera)? ¿Quién abandonó el estudio? Los investigadores toman decisiones metodológicas que afectan las inferencias y estas decisiones deben examinarse. Sin embargo, también es necesario considerar el comportamiento prospectivo de los participantes. En este ejemplo, se incluyeron 300 mujeres en el estudio, pero solo 161 aportaron datos. Es casi seguro que la muestra final de 161 difiera en formas importantes de las 139 que declinaron y estas diferencias afectan la evidencia del estudio. Por fortuna, los investigadores cada vez documentan más el flujo de participantes en sus estudios, sobre todo en los que conllevan una intervención. Las principales revistas médicas y de enfermería adoptaron los lineamientos Consolidated Standards of Reporting Trials, o lineamientos CONSORT, para ayudar a los lectores a rastrear a los participantes en el estudio. Cuando están disponibles, los diagramas de flujo CONSORT deben ser examinados para interpretar los resultados del estudio. La figura 15-3 presenta un ejemplo de tales diagramas de flujo para un estudio controlado aleatorizado (ECA). El diagrama muestra que se valoró a 295 mujeres para confirmar su elegibilidad, pero 95 no cumplieron los criterios de elegibilidad o se rehusaron a participar en el estudio. De las 200 que 506 sí participaron, la mitad se asignó al azar al grupo experimental y la otra mitad al grupo control (N = 100 en cada grupo). Sin embargo, solo 83 mujeres del grupo de intervención en realidad recibieron la intervención completa. En el seguimiento a los 3 meses, los investigadores intentaron obtener datos de 96 personas del grupo de intervención (todas las que no se mudaron o murieron). Obtuvieron datos de seguimiento de 92 sujetos del grupo de intervención (y 89 del grupo control) y estas 181 mujeres constituyeron la muestra de análisis. Figura 15-3 Ejemplo de diagrama de flujo de los lineamientos CONSORT: progresión de los participantes en un estudio de intervención. Credibilidad y validez 507 La inferencia y la validez están vinculadas de manera indisoluble. Para ser intérpretes cuidadosos, los lectores deben buscar evidencia de que las inferencias deseadas en realidad son válidas. Parte de este proceso implica considerar hipótesis alternativas competitivas acerca de la credibilidad y el significado de los resultados. En el capítulo 9 se discutieron cuatro tipos de validez que se relacionan con la credibilidad de los resultados del estudio: validez de la conclusión estadística, validez interna, validez externa y validez de constructo. Se usa el ejemplo del muestreo (fig. 15-2 y tabla 15-1) para demostrar la relevancia de las decisiones metodológicas para los cuatro tipos de validez y por lo tanto las inferencias sobre los resultados del estudio. En el ejemplo, el constructo de población es mujeres con ingresos bajos, que se tradujo en los criterios de elegibilidad de la población que estipula a las receptoras de asistencia pública en el estado de California. Aun así, hay formas operativas alternativas del constructo de la población (p. ej., mujeres de California que viven por debajo del nivel oficial de pobreza). Como puede recordarse, la validez del constructo implica inferencias de los aspectos particulares del estudio a los constructos de orden superior. Así que es justo preguntar, ¿los criterios de elegibilidad capturan de manera correcta el constructo de la población, mujeres con ingresos bajos? La validez de la conclusión estadística –el grado en que pueden hacerse inferencias correctas de la existencia de diferencias grupales “reales”– también es afectada por las decisiones del muestreo. Lo ideal es que los investigadores realicen un análisis de poder al inicio para calcular el tamaño de la muestra que necesitan. En este ejemplo, asúmase (con base en la investigación previa) que el tamaño del efecto de la intervención de ejercicio sería pequeño a moderado, con d = 0.40. Para tener un poder de 0.80, con un riesgo de error tipo I establecido en 0.05, se necesitaría una muestra cercana a 200 participantes. La muestra real de 161 conlleva un riesgo cercano a 30% de error tipo II; es decir, de concluir de manera errónea que la intervención no tuvo éxito. La validez externa (la generalizabilidad de los resultados) se modifica por el muestreo. ¿A quién sería seguro generalizar los resultados de este ejemplo, al constructo de población de mujeres con ingresos bajos? ¿A todos los receptores de beneficencia en California? ¿A todos los receptores nuevos de beneficencia en Los Ángeles que hablan inglés o español? Las inferencias del grado en 508 que los resultados del estudio corresponden a “la verdad en el mundo real” deben tomar en cuenta las decisiones del muestreo y los problemas de muestreo (p. ej., dificultades para el reclutamiento). Por último, la validez interna del estudio (el grado en que puede hacerse una inferencia causal) también se modifica según la composición de la muestra. En este ejemplo, el desgaste sería un problema. ¿Era más probable (o menos probable) que las personas del grupo de intervención abandonaran el estudio que las del grupo control? De ser así, cualquier diferencia en los resultados se debería a discrepancias individuales en los grupos (p. ej., diferencias en la motivación para permanecer en el estudio) y no a la intervención misma. Las decisiones metodológicas y la implementación cuidadosa de esas decisiones –ya sean acerca del muestreo, el diseño de la intervención, el diseño de investigación o el análisis– siempre afectan el rigor de un estudio. Todas ellas pueden influir en los cuatro tipos de validez y por lo tanto, en la interpretación de los resultados. Credibilidad y sesgo El trabajo de un investigador es traducir constructos abstractos en sustitutos razonables. Otro trabajo importante se refiere a los esfuerzos por eliminar, reducir o controlar los sesgos, o, como último recurso, detectarlos y comprenderlos. El trabajo del lector de reportes de investigación es detectar los sesgos y considerarlos en su valoración de la credibilidad de los resultados. Los sesgos generan distorsiones y minan los esfuerzos de los investigadores para revelar la “verdad en el mundo real”. Los sesgos son ubicuos y casi inevitables. Es importante considerar qué tipos de 509 sesgos pueden estar presentes y qué tan extensos, mensurables y sistemáticos son. Ya se describieron muchos tipos de sesgos en este libro: algunos reflejan errores en el diseño (p. ej., sesgo de selección), otros reflejan problemas para el reclutamiento (sesgo por respuesta negativa) y otros se relacionan con la medición (deseabilidad social). La tabla 15-2 presenta los sesgos y errores mencionados en este libro. Esta tabla pretende servir como recordatorio de algunos de los problemas que deben considerarse al interpretar los resultados de un estudio. TIP El suplemento en inglés de este capítulo en el sitio web de presenta una lista más larga de sesgos, incluidos algunos no descritos en este libro, y se proveen las definiciones de todos los sesgos listados. Distintas disciplinas y diferentes autores usan nombres diversos para referirse a sesgos iguales o similares. Los nombres reales no son importantes, sí lo es reflexionar acerca de cómo las distintas fuerzas pueden distorsionar los resultados e influir en las inferencias. Credibilidad y comprobación Antes se señaló que los intérpretes de la investigación deben buscar evidencia contraria a la “hipótesis nula” de que los resultados del estudio son erróneos. Parte de la evidencia para desacreditar esta hipótesis nula proviene de la calidad de los sustitutos que ocupan el lugar de las abstracciones. Al descartar los sesgos también se afecta la hipótesis nula. Otra estrategia consiste en buscar la comprobación de los resultados. La corroboración puede provenir de fuentes internas y externas, y el concepto de replicación es importante en ambos casos. Un auxiliar de las interpretaciones es considerar la investigación anterior sobre el tema, por ejemplo. Los investigadores pueden examinar si los resultados del estudio son congruentes con los de otros estudios. La consistencia entre los estudios tiende a desacreditar la “hipótesis nula” de resultados erróneos. Los investigadores tienen oportunidades para replicarse a sí mismos. Por ejemplo, en estudios multicéntricos, la similitud de los resultados entre los centros sugiere que sucede algo “real”. La triangulación puede ser otra forma de replicación. Las autoras son grandes defensoras de los estudios con métodos mixtos (véase 510 capítulo 13). Cuando los hallazgos del análisis de los datos cualitativos son consistentes con los resultados de los análisis estadísticos, la corroboración interna puede ser muy poderosa y persuasiva. OTROS ASPECTOS DE LA INTERPRETACIÓN Si una valoración conduce a aceptar que los resultados de un estudio probablemente sean “reales”, se ha hecho un progreso importante en la interpretación de los hallazgos del estudio. Otras tareas interpretativas dependen de la conclusión de que es probable que los resultados sean creíbles. Precisión de los resultados Los resultados de las pruebas de hipótesis estadística indican la probabilidad de que una relación o diferencia grupal sea “real”. Un valor p en la prueba de la hipótesis aporta información importante (si la hipótesis nula parece ser falsa), pero incompleta. En contraste, los intervalos de confianza (IC) transmiten información de la precisión de los resultados. El Dr. David Sackett, un fundador del movimiento de PBE, y sus colaboradores (2000) declararon esto sobre los IC: “Los valores p por sí solos son [...] no informativos [...]. En contraste, los IC indican la fuerza de la evidencia sobre cantidades de interés directo, como el beneficio del tratamiento. Por lo tanto, tienen relevancia particular para los profesionales de la medicina basada en la evidencia” (p. 232). Parece probable que los investigadores en enfermería publiquen cada vez más información del IC en los próximos años por su valor para interpretar los resultados del estudio y valorar su utilidad para la práctica de la enfermería. Magnitud de los efectos e importancia En los estudios cuantitativos, los resultados que sustentan las hipótesis del investigador se describen como significativos. Un análisis cuidadoso de los resultados del estudio incluye la confirmación de la magnitud y relevancia clínica de los efectos, además de su significancia estadística. 511 La obtención de la significancia estadística no siempre significa que los resultados sean significativos para los profesionales de enfermería y los pacientes. La significancia estadística indica la improbabilidad de que los resultados se deban a la casualidad, no que sean importantes. Con muestras grandes, incluso las relaciones modestas tienen significancia estadística. Por ejemplo con una muestra de 500, un coeficiente de correlación de 0.10 es significativo al nivel de 0.05, pero es posible que una relación tan débil tenga poca relevancia práctica. Este aspecto se aplica a una importante pregunta de la PBE (recuadro 2-1): “¿Cuál es la evidencia, cuál es la magnitud de los efectos?”. La estimación de la magnitud e importancia de los efectos es fundamental para la relevancia clínica, un tema que se discute más adelante en este capítulo. El significado de los resultados cuantitativos En los estudios cuantitativos, los resultados estadísticos están en forma de valores p, tamaños del efecto e IC, a los que los investigadores y los consumidores de investigación deben dar un significado. Las preguntas referentes al significado de los resultados estadísticos a menudo reflejan un deseo de interpretar las conexiones causales. Por lo general, no es difícil interpretar lo que significan los resultados descriptivos. Por ejemplo, supongamos que se encontró que entre los pacientes que se someten a terapia electroconvulsiva (TEC), el porcentaje que experimenta cefalea inducida por la TEC es 59.4% (IC 95% [56.3, 63.1]). Este resultado puede interpretarse de manera directa. Sin embargo, si se encuentra que la prevalencia de cefalea es significativamente menor en un grupo de intervención con crioterapia que entre los que recibieron paracetamol, sería necesario interpretar qué significan los resultados. En particular, es preciso interpretar si es factible que la crioterapia causara el descenso de la prevalencia de cefaleas. En esta sección se explica la interpretación de los resultados de investigación en el contexto de la prueba de una hipótesis, con énfasis en las interpretaciones causales. Interpretación de los resultados hipotéticos La interpretación de resultados estadísticos es más fácil cuando las hipótesis se sustentan; es decir, cuando hay resultados positivos. Los investigadores ya consideraron los hallazgos previos y la teoría para 512 desarrollar las hipótesis. No obstante, deben tenerse en mente algunas advertencias. Es importante evitar la tentación de ir más allá de los datos para explicar qué significan los resultados. Por ejemplo, supóngase que se postula la hipótesis de que el nivel de ansiedad de las mujeres embarazadas sobre el parto se correlaciona con el número de hijos que tienen. Los datos revelan una relación negativa significativa entre el grado de ansiedad y la paridad (r = –0.40). Se interpreta que esto significa que una mayor experiencia de parto disminuye la ansiedad. ¿Está sustentada por los datos esta suposición? La conclusión parece lógica, pero de hecho no hay nada en los datos que conduzca a esta interpretación. Un precepto importante, primordial en realidad, en la investigación es que la correlación no prueba la causa. El hallazgo de que dos variables están relacionadas no ofrece evidencia sugestiva de cuál de las dos variables causó la otra, si es que alguna fue la causa. En el presente ejemplo, es posible que la causalidad trascurra en sentido contrario; es decir, que el grado de ansiedad de una mujer influya en el número de hijos que tiene, o quizá una tercera variable, como la relación de la mujer con su esposo, influye en la ansiedad y el número de hijos. La inferencia de la causalidad es muy difícil en estudios que no usaron un diseño experimental. La evidencia empírica que sustenta las hipótesis de investigación nunca constituye una prueba de su veracidad. La prueba de hipótesis es probabilística. Siempre existe la posibilidad de que las relaciones observadas hayan sido resultado de la casualidad; es decir, que exista un error tipo I. Los investigadores deben tener una actitud tentativa respecto a sus resultados y las interpretaciones que hacen de estos. Por ello, incluso cuando los resultados concuerdan con las expectativas, los investigadores siempre deben ser moderados al presentar conclusiones. Ejemplo de corroboración de una hipótesis Houck y sus colaboradores (2011) estudiaron factores relacionados con el autoconcepto en 145 niños con trastorno por déficit de atención e hiperactividad (TDAH). Postularon la hipótesis de que los problemas de comportamiento en estos niños se relacionaban con un autoconcepto menos favorable y encontraron que la interiorización de los problemas de comportamiento era un elemento predictivo de calificaciones más bajas en el autoconcepto. En su discusión, señalaron que “la edad y la interiorización de comportamientos son una influencia negativa en el 513 autoconcepto del niño” (p. 245). Este estudio es un buen ejemplo de las dificultades para interpretar los hallazgos en estudios de correlación. La interpretación de los investigadores fue que los problemas conductuales influyeron (“causaron”) el bajo autoconcepto. Esta conclusión se respalda con la investigación anterior, aunque no hay nada en los datos que descarte la posibilidad de que el autoconcepto del niño influyera en su comportamiento o que algún otro factor influyera en el comportamiento y el autoconcepto. La interpretación del investigador es factible, pero su diseño transversal dificulta descartar otras explicaciones. Una amenaza sustancial a la validez interna de la inferencia en este estudio es la ambigüedad temporal. Interpretación de resultados no significativos Los resultados no significativos presentan dificultades para la interpretación. Las pruebas estadísticas se orientan a negar la hipótesis nula. La falta de rechazo de la hipótesis nula puede tener muchas razones y tal vez sea difícil encontrar la verdadera. En realidad, la hipótesis nula podría ser verdadera, un reflejo exacto de la ausencia de una relación entre las variables de investigación. Por otra parte, la hipótesis nula podría ser falsa. La relación de una hipótesis nula falsa (un error tipo II) puede provenir de problemas metodológicos como una validez interna deficiente, una muestra anómala, un procedimiento estadístico débil o mediciones poco confiables. En particular, la falta de rechazo de la hipótesis nula suele ser consecuencia del poder insuficiente, casi siempre debido a una muestra demasiado pequeña. Es importante reconocer que una hipótesis nula no rechaza ni confirma la ausencia de relaciones entre las variables. Los resultados no significativos no proveen evidencia de la verdad o falsedad de la hipótesis. Como los procedimientos estadísticos están diseñados para probar el sustento para rechazar las hipótesis nulas, no son adecuados para probar las hipótesis de investigación reales acerca de la ausencia de relaciones ni sobre la equivalencia entre los grupos. Aun así, a veces esto es justo lo que los investigadores quieren hacer, sobre todo en situaciones clínicas en las que el objetivo es probar si una práctica es tan efectiva como otra, pero quizá es menos dolorosa o costosa. 514 Cuando la hipótesis de investigación real es nula (p. ej., una predicción de ninguna diferencia entre los grupos), deben usarse estrategias estrictas adicionales para aportar evidencia de apoyo. Es conveniente calcular los tamaños de los efectos o IC para ilustrar que el riesgo de un error tipo II fue pequeño. Ejemplo de apoyo a un resultado no significativo hipotetizado Lavender y sus colaboradores (2013) realizaron un estudio para probar la hipótesis de que un producto de aseo formulado para el baño del recién nacido no es inferior al baño con agua sola en términos de pérdida transepidérmica de agua (PTEA) y otros resultados secundarios. En su muestra relativamente grande de 307 lactantes sanos, ninguna de las diferencias grupales tuvo significancia estadística. La diferencia en los valores de PTEA fue de solo 0.08 glm2/h, p 0.89, IC 95% [–1.24, 1.07]. Los investigadores concluyeron: “Fuimos incapaces de detectar alguna diferencia entre el producto para aseo del recién nacido y el agua” (p. 203). Interpretación de resultados significativos no hipotetizados Los resultados significativos no hipotetizados pueden producirse en dos situaciones. La primera es la exploración de relaciones que no se consideraron durante el diseño del estudio. Por ejemplo, al examinar las relaciones entre las variables de investigación, un investigador nota que dos variables que no eran centrales para las preguntas de investigación tenían una relación significativa –e interesante. Ejemplo de hallazgo significativo fortuito Latendresse y Ruiz (2011) estudiaron la relación entre el estrés materno crónico y el parto prematuro. Informaron como hallazgo inesperado que el uso materno de inhibidores selectivos de la recaptura de serotonina (ISRS) se relacionaba con un aumento de 12 veces en los partos prematuros. La segunda situación es más desconcertante y ocurre pocas veces: obtener resultados opuestos a los que se postularon en la hipótesis. Por ejemplo, un investigador podría hipotetizar que la enseñanza 515 individualizada sobre los riesgos del sida es más efectiva que la instrucción grupal, pero los resultados podrían indicar que el método grupal fue mucho mejor. Aunque esto podría parecer desconcertante, la investigación no debe realizarse para corroborar predicciones, sino para encontrar la verdad. No existe algo como un estudio cuyos resultados “salieron mal” si reflejan la verdad. Cuando los hallazgos significativos son opuestos a lo que se postuló en la hipótesis, la interpretación debe incluir comparaciones con otras investigaciones, la consideración de teorías alternativas y un escrutinio crítico de los métodos de investigación. Ejemplo de un resultado significativo contrario a la hipótesis Dotson y sus colaboradores (2014), que evaluaron hipótesis acerca de la permanencia de los profesionales de enfermería en una muestra de 861 profesionales de enfermería certificados, predijeron que los grados más altos de altruismo se relacionarían con intenciones más sólidas de permanecer en la enfermería; sin embargo, se encontró lo contrario. Especularon que esto podría significar que algunos profesionales de enfermería “ya no cumplen sus deseos altruistas en el campo de la enfermería” (p. 115). En resumen, la interpretación del significado de los resultados de la investigación es una tarea demandante, pero ofrece la posibilidad de conseguir recompensas intelectuales. Los intérpretes deben asumir la función de detectives científicos e intentar organizar las piezas de un rompecabezas para obtener una imagen coherente. Generalizabilidad de los resultados Por lo regular los investigadores buscan evidencia que puedan usar los demás. Si se encuentra que una nueva intervención de enfermería es exitosa, otros podrían querer adoptarla. Por lo tanto, una pregunta de la interpretación es si la intervención “funcionará” o si las relaciones se “mantendrán” en sitios diferentes, con otras personas. Parte del proceso interpretativo incluye la pregunta: “¿a qué grupos, ambientes y condiciones es razonable aplicar los resultados?”. Para interpretar la generalizabilidad del estudio es útil considerar la discusión anterior sobre sustitutos. ¿Para qué orden superior de constructos, cuáles poblaciones, cuáles sitios o cuáles versiones de una intervención fueron “sustitutos” adecuados para las operaciones 516 del estudio? Implicaciones de los resultados Una vez que se llega a conclusiones acerca de la credibilidad, precisión, importancia, significado y generalizabilidad de los resultados, se está listo para pensar en las implicaciones. Podrían considerarse las implicaciones de los hallazgos con respecto a la investigación futura: ¿qué deben hacer otros investigadores en esta área, cuál es el “siguiente paso” correcto? Lo más probable es que se consideren las implicaciones para la práctica de la enfermería: ¿cómo deben usar los resultados los profesionales de enfermería en su práctica? Todas las dimensiones interpretativas que se discutieron son cruciales en la práctica de la enfermería basada en evidencia. Con respecto a la generalizabilidad, quizá no sea suficiente hacer una pregunta amplia con respecto a quién pueden aplicarse los resultados, es necesario preguntar ¿son estos resultados relevantes para mi situación clínica particular? Por supuesto, si se concluyó que los resultados tienen credibilidad o importancia limitadas, pueden ser de poca utilidad para la práctica. RELEVANCIA CLÍNICA Desde hace mucho se reconoce que la prueba de la hipótesis estadística aporta información limitada para la interpretación. En particular, el logro de la significancia estadística no responde si un hallazgo tiene significado o relevancia clínica. Con una muestra lo bastante grande, una relación trivial puede tener significancia estadística. A grandes rasgos, la relevancia clínica se define como la importancia práctica de los resultados de la investigación en términos de si tienen efectos genuinos y palpables en la vida diaria de los pacientes o en las decisiones de atención a la salud que se toman en su nombre. En campos distintos de la enfermería, en particular en la medicina y la psicoterapia, en fecha reciente se ha puesto atención en definir la relevancia clínica y desarrollar formas de volverla operativa. No existe un consenso en ninguno de estos aspectos, pero con regularidad se usan unas cuantas soluciones conceptuales y estadísticas. En esta sección se hace una revisión breve de los avances recientes en la 517 definición y la conversión operativa de la relevancia clínica; se incluye más información en Polit y Yang (2016). En la prueba de hipótesis estadística, hace décadas que se llegó a un consenso, para bien o para mal, de que un valor p de 0.05 sería el criterio estándar para la significancia estadística. Sin embargo, es improbable que alguna vez se adopte un estándar uniforme para la relevancia clínica debido a su complejidad. Por ejemplo, en algunos casos la ausencia de cambio con el tiempo podría tener relevancia clínica si significa que un grupo con una enfermedad progresiva no se ha deteriorado. En otros casos la relevancia clínica se relaciona con mejoras. Otro aspecto se refiere a de quién es la perspectiva sobre la relevancia clínica. En ocasiones la perspectiva de los profesionales clínicos es clave por las implicaciones para la atención de la salud (p. ej., respecto a la concentración de colesterol). Para otros resultados, la visión del paciente es la que importa (p. ej., calidad de vida). Dos aspectos más se refieren a si la relevancia clínica se aplica a los hallazgos grupales o a pacientes individuales, y si se vincula con resultados en un solo momento en el tiempo o con las calificaciones del cambio. La mayor parte del trabajo reciente es acerca de la relevancia clínica de las calificaciones del cambio para pacientes individuales (p. ej., un cambio de la medición basal a una medición en el seguimiento). Sin embargo, se comienza con una breve discusión de la relevancia clínica para el grupo. Relevancia clínica grupal Muchos estudios realizan comparaciones entre grupos. Por ejemplo, los diseños pretest-postest de un grupo implican la comparación del mismo en dos o más puntos en el tiempo para examinar si hubo o no un cambio en los resultados, en promedio. En los ECA y los estudios de casos y controles, la comparación central es entre diferencias promedio para distintos grupos de personas. La relevancia clínica grupal casi siempre conlleva información estadística aparte de los valores p para establecer conclusiones sobre la utilidad de los hallazgos de la investigación. Las estadísticas usadas con mayor frecuencia para este fin son los índices del tamaño del efecto (TE), IC y el número necesario a tratar (NNT). Los índices TE resumen la magnitud de un cambio o una relación y por lo tanto aportan información sobre cómo un grupo, en promedio, podría beneficiarse con el tratamiento. En la mayoría de 518 los casos, un hallazgo con relevancia clínica para el grupo significa que el TE es lo bastante grande para tener relevancia para los pacientes. Varios autores apoyan los IC como herramientas útiles para comprender la relevancia clínica; los IC proporcionan el intervalo más factible de valores, con un nivel de confianza determinado, para el parámetro desconocido de la población. En ocasiones, el NNT se sugiere como indicador útil de la relevancia clínica porque la información es relativamente fácil de comprender. Por ejemplo, si se calcula que el NNT para obtener un resultado importante es 2.0, solo dos pacientes deben recibir un tratamiento particular para que uno se beneficie. Sin embargo, si el NNT es 10, nueve de 10 personas que reciban el tratamiento no obtendrán beneficio alguno. Con cualquiera de estos índices grupales, los investigadores deben señalar por anticipado lo que constituye la relevancia clínica, tal como establecerían un valor alfa para la significancia estadística. Por ejemplo, ¿un TE de 0.20 (para el índice d descrito en el capítulo 14) se consideraría clínicamente relevante? Un d de 0.20 se ha descrito como un efecto “pequeño”, pero a veces las pequeñas mejorías pueden tener relevancia clínica. Las afirmaciones acerca del logro de la relevancia clínica en los grupos deben fundamentarse en criterios defendibles. Ejemplo de relevancia clínica grupal Despriee y Langeland (2016) probaron el efecto de la sacarosa al 30% comparada con un placebo (agua) para aliviar el dolor durante la inmunización de niños de 15 meses de edad. La diferencia grupal media de 15 segundos menos de llanto entre los lactantes en el grupo de intervención fue estadísticamente significativa. El TE grande llevó a los investigadores a concluir que la mejoría también tenía relevancia clínica. Relevancia clínica individual Los profesionales clínicos no suelen estar interesados en lo que ocurre en un grupo de personas, les preocupan los pacientes individuales. Como se indicó en el capítulo 2, un objetivo clave de la PBE es personalizar la “mejor evidencia” en decisiones para las necesidades de un paciente específico, con un contexto clínico particular. Los esfuerzos para llegar a conclusiones sobre la relevancia clínica 519 individual pueden vincularse directamente con los objetivos de la práctica basada en evidencia. Se han desarrollado docenas de estrategias para definir y operacionalizar la relevancia clínica individual, pero comparten un elemento en común: requieren el establecimiento de un punto de referencia (o límite) que señale el valor de la calificación en una medida (o el valor de una calificación del cambio) que se consideraría de relevancia clínica. Con una referencia establecida para la relevancia clínica, cada persona de un estudio puede clasificarse según tenga o no una calificación o calificación de cambio que es clínicamente relevante. Definiciones conceptuales de la relevancia clínica En la bibliografía médica pueden encontrarse muchas definiciones de relevancia clínica, la mayoría de la cuales se refiere a cambios en mediciones de los resultados del paciente (p. ej., una calificación en el tiempo 1 restada de una calificación en el tiempo 2). Hay un enfoque para conceptualizar la relevancia clínica que domina los campos médicos. En un documento citado cientos de veces en la bibliografía médica, Jaeschke y sus colaboradores (1989) presentaron la siguiente definición: “La diferencia mínima de importancia clínica puede definirse como la discrepancia más pequeña en la calificación del dominio de interés que los pacientes perciben como provechosa y que obligaría, en ausencia de efectos colaterales problemáticos y un costo excesivo, a un cambio en el tratamiento del individuo” (p. 408). Aunque estos investigadores se referían al límite conceptual de la relevancia clínica como una diferencia mínima de importancia clínica (DMIC), las autoras siguen a un grupo influyente de expertos en medición y usan el término cambio mínimo importante (CMI), ya que el enfoque se coloca en el cambio en las calificaciones individuales, no en las diferencias entre los grupos. Operacionalización de la relevancia clínica: establecimiento del punto de referencia del cambio mínimo importante La definición de Jaeschke et al. (1989) de los puntos de referencia de la calificación del cambio inspiró a los investigadores a ir en muchas direcciones distintas para cuantificarlo. En términos generales, el 520 punto de referencia del CMI casi siempre se operacionaliza como el valor para la magnitud de cambio en la calificación de una medida que el paciente debe alcanzar para considerar que tuvo lugar un cambio de relevancia clínica. Una estrategia tradicional para establecer el punto de referencia en los resultados de salud es obtener información de un panel de expertos, en ocasiones llamado panel de consenso. Por ejemplo, un panel de consenso reunido en 2005 para establecer la relevancia clínica de los cambios en la intensidad del dolor informado por el sujeto (p. ej., en una escala análoga visual) estableció el punto de referencia de reducción de 30% del dolor. Otra estrategia consiste en realizar un estudio para determinar cuál piensan los pacientes que es un cambio mínimo importante en una medición focal. Los desarrolladores de muchas nuevas escalas con múltiples ítems ahora usan esta estrategia para calcular el CMI como parte de la valoración psicométrica de su instrumento. Sin embargo, el cálculo del CMI usando las calificaciones del cambio importante requiere mucho trabajo y un diseño de investigación cuidadoso con una muestra grande de personas en las que se espera que ocurra un cambio con el tiempo. Una tercera opción para definir el CMI se basa en las características de la distribución de una medición. Lo más frecuente es que el CMI con esta estrategia se establezca en un límite de 0.5 desviaciones estándar (DE); es decir, la mitad de una desviación estándar en una distribución de calificaciones basales. Por ejemplo, si la DE basal de una escala fuera 6.0, el CMI con el criterio de 0.5 DE sería 3.0. Este valor, como un CMI, puede usarse como referencia para clasificar a los pacientes individuales según tengan un cambio clínicamente relevante o no. Muchos investigadores han usado el CMI para interpretar los hallazgos grupales. Sin embargo, el CMI es un índice de cambio individual, no de diferencias grupales. Los expertos advirtieron que esto es inapropiado para interpretar las diferencias medias en relación con el CMI. Por ejemplo, si el CMI en un resultado importante se estableció en 4.0, este valor no debe emplearse para interpretar la relevancia clínica de la diferencia media entre dos grupos. Por ejemplo, si se obtuviera una diferencia media grupal de 3.0, sería erróneo concluir que los resultados no tuvieron relevancia clínica. Una diferencia media de 3.0 sugiere que un porcentaje considerable de participantes alcanzó un beneficio de relevancia clínica; es decir, 521 una mejoría de 4 puntos o más. Los límites del CMI pueden utilizarse para calcular tasas de relevancia clínica para los participantes individuales en el estudio. Una vez que se conoce el CMI, los investigadores pueden clasificar a todas las personas del estudio según hayan alcanzado o no el límite. Luego pueden comparar el porcentaje de personas que “respondieron” en grados clínicos importantes en los grupos de estudio (p. ej., los del grupo de intervención y los del grupo control). Este análisis de sujetos de estudio es fácil de comprender y tiene implicaciones sustanciales para la práctica basada en evidencia. Ejemplo de un análisis de sujetos de estudio Lima y sus colaboradores (2015) examinaron las respuestas de la presión sanguínea durante la marcha y el ejercicio de resistencia en pacientes con enfermedad vascular periférica. Los investigadores usaron un CMI ya establecido de un descenso de 4 mm Hg en la presión sanguínea diastólica o sistólica para clasificar a los pacientes. Se recurrió al análisis de χ2 y las pruebas t para comparar las características clínicas de los sujetos de estudio (los que se beneficiaron en grado clínicamente relevante con el ejercicio) y los sujetos que no respondieron. CRÍTICA A LAS INTERPRETACIONES Los investigadores ofrecen una interpretación de sus hallazgos y discuten lo que los hallazgos podrían implicar para la enfermería en la sección “Discusión” de los artículos de investigación. Cuando se hace la crítica de un estudio, la interpretación propia puede contrastarse con la de los investigadores. Una buena sección de discusión debe señalar las limitaciones del estudio. Los investigadores están en la mejor posición para detectar y valorar las deficiencias de muestreo, las limitaciones prácticas, los problemas en la calidad de datos, etc., y es responsabilidad del profesional alertar a los lectores con respecto a estas dificultades. Además, cuando los investigadores reconocen las limitaciones metodológicas, los lectores saben que estas limitaciones fueron consideradas en la interpretación de los resultados. Por supuesto que es improbable que los investigadores noten todas las limitaciones relevantes. La tarea del revisor es desarrollar su propia interpretación 522 y valoración de los problemas metodológicos, cuestionar las conclusiones que no parecen justificadas y considerar cómo pudo haberse mejorado la evidencia del estudio. También deben examinarse con cuidado las interpretaciones causales, sobre todo en estudios no experimentales. En ocasiones, incluso los títulos de los reportes sugieren una inferencia causal potencialmente inapropiada. Si el título de un estudio no experimental incluye términos como “el efecto de…” o “el impacto de…”, esto podría señalar la necesidad de un escrutinio crítico de las inferencias del investigador. Además de comparar la interpretación propia con la de los investigadores, la crítica también debe incluir conclusiones sobre las implicaciones del estudio señaladas. Algunos investigadores hacen declaraciones grandiosas u ofrecen recomendaciones infundadas con base en resultados modestos. La relevancia clínica es un tema nuevo en esta edición del libro. La conceptualización y opera-cionalización de la relevancia clínica no han recibido mucha atención en la enfermería, por lo que los estudios que no mencionan la relevancia clínica no deben tacharse por su omisión, pero los que sí la señalan deben elogiarse. Las autoras esperan que los investigadores en enfermería presten más atención a este aspecto en los años próximos. El recuadro 15-1 ofrece algunos lineamientos para evaluar la interpretación de los investigadores. Recuadro 15-1 Lineamientos para la crítica de interpretaciones/discusiones en los reportes de investigación cuantitativa Interpretación de los hallazgos 1. ¿Se discutieron todos los resultados importantes? 2. ¿Los investigadores discutieron alguna limitación del estudio y sus posibles efectos en la credibilidad de los hallazgos? ¿Las interpretaciones tomaron en cuenta las limitaciones? 3. ¿Qué tipos de evidencia se presentaron como respaldo de la interpretación; fue persuasiva esa evidencia? ¿Se interpretaron los resultados a la luz de los hallazgos de otros estudios? 4. ¿Los investigadores hicieron alguna inferencia causal injustificable? ¿Se consideraron las explicaciones alternativas a los 523 hallazgos? ¿Fueron convincentes las razones para rechazar estas alternativas? 5. ¿La interpretación tomó en cuenta la precisión de los resultados y la magnitud de los efectos? 6. ¿Los investigadores extrajeron alguna conclusión no justificada sobre la generalizabilidad de los resultados? Implicaciones de los hallazgos y las recomendaciones 7. ¿Los investigadores discutieron las implicaciones del estudio para la práctica clínica o la investigación futura en enfermería? ¿Hicieron recomendaciones específicas? 8. Si la respuesta es afirmativa, ¿son apropiadas las implicaciones señaladas, dadas las limitaciones del estudio y la magnitud de los efectos, así como la evidencia de otros estudios? ¿Hay implicaciones importantes que el reporte no incluyó? Relevancia clínica 9. ¿Los investigadores mencionaron o valoraron la relevancia clínica? ¿Hicieron alguna distinción entre la significancia estadística y la relevancia clínica? 10. Si se examinó la relevancia clínica, ¿qué se valoró en términos de información grupal (p. ej., tamaño de los efectos) o resultados individuales? Si se valoraron estos últimos, ¿cómo se operacionalizó la relevancia clínica? EJEMPLOS DE INVESTIGACIÓN CON EJERCICIOS DE PENSAMIENTO CRÍTICO En esta sección se presentan detalles de la parte interpretativa de un estudio cuantitativo. Lea el resumen y luego responda las preguntas de pensamiento crítico. De ser necesario, consulte el reporte de investigación completo. El ejemplo 1 se presenta en la Critical Thinking Activity del sitio web . Las preguntas de pensamiento crítico para los ejemplos 2 y 3 se basan en los estudios que aparecen en los apéndices A y C de este libro. Los comentarios en inglés de las autoras sobre estos ejercicios están en la sección Student Resources en . 524 EJEMPLO 1: INTERPRETACIÓN DE UN ESTUDIO CUANTITATIVO Estudio. Efectos neuroconductuales del consumo de aspartame (Lindseth et al., 2014). Objetivo. El objetivo de este estudio era examinar los efectos de consumir dietas con cantidades elevadas de aspartame (25 mg/kg de peso corporal al día) frente a menores cantidades de aspartame (10 mg/kg de peso corporal al día) en los resultados neuroconductuales. Método. Los investigadores usaron un diseño cruzado aleatorizado para valorar los efectos de las cantidades de aspartame. Los participantes en el estudio fueron 28 adultos sanos, estudiantes universitarios, que consumieron dietas preparadas para el estudio. Los participantes se distribuyeron al azar al orden en que se aplicaría el protocolo de aspartame (es decir, algunos recibieron primero la dieta alta en aspartame, otros recibieron primero la dieta con menor cantidad). Los participantes desconocían qué dieta recibían, lo mismo que los recolectores de datos. Consumieron una de las dietas durante un periodo de 8 días, seguidos de un periodo de eliminación de 2 semanas. Luego consumieron la dieta alternativa por 8 días más. Al final de cada periodo de 8 días se midieron los resultados neurocognitivos, que incluyeron función cognitiva (memoria de trabajo y visualización espacial), depresión y estado de ánimo (irritabilidad). Análisis. Las pruebas de cada sujeto (pruebas t pareadas, análisis de varianza de mediciones repetidas) se usaron para probar la significancia estadística de las diferencias en los resultados de los dos protocolos dietéticos, con valor de alfa establecido en 0.05. En términos de relevancia clínica, se consideró que un participante tenía un efecto neuroconductual de relevancia clínica si su calificación estaba 2+ DE fuera de la media para el funcionamiento normal según las normas de cada medida. Por lo tanto, no se calcularon las calificaciones de cambio de los participantes. Se valoró si cada calificación rebasaba el valor de referencia para un estado normativo, un criterio que se ha usado con frecuencia en estudios de intervenciones psicoterapéuticas. Resultados. Se observaron diferencias estadísticamente significativas que favorecían la dieta baja en aspartame en tres resultados neuroconductuales: orientación espacial, depresión e irritabilidad. A pesar de que los participantes eran adultos universitarios sanos, unos cuantos de ellos experimentaron resultados clínicamente relevantes con la dieta alta en aspartame. Por ejemplo, dos tuvieron daño cognitivo de relevancia clínica (dos con deficiencias en la memoria funcional y dos más con trastorno de 525 la orientación espacial) después de 8 días de consumir la dieta alta en aspartame. Tres participantes más (distintos a los cuatro con alteración cognitiva) tuvieron niveles clínicamente relevantes de depresión al final del periodo alto en aspartame. Ninguna de las calificaciones de los participantes tuvo relevancia clínica después de 8 días con la dieta baja en aspartame. Discusión. Los investigadores dedicaron una gran parte de su sección de discusión al tema de la corroboración, que se mencionó en relación con la interpretación de la credibilidad de los resultados del estudio. Señalaron las formas en que sus hallazgos fueron consistentes con (o divergieron de) otros estudios sobre los efectos del aspartame. Acorde con el uso de un diseño experimental sólido, concluyeron que había una relación causal entre el consumo de grandes cantidades de aspartame y los efectos neuroconductuales negativos: “Una dosis alta de aspartame causó más irritabilidad y depresión que una dosis baja consumida por los mismos participantes, lo que apoya los hallazgos del estudio anterior de Walton et al. (1993) (p. 191). Los investigadores también comentaron los hallazgos con relevancia clínica: “Además, tres participantes del presente estudio obtuvieron calificaciones en la categoría de depresión clínica mientras consumían la dieta alta en aspartame, a pesar de no tener antecedentes de depresión” (p. 191). Los investigadores concluyeron su sección de discusión con señalamientos relacionados con las limitaciones de su estudio, que incluyeron problemas para la generalizabilidad: “Las limitaciones del presente estudio incluyeron la muestra pequeña homogénea, lo que puede dificultar la aplicación de las conclusiones a otras poblaciones de estudio. Además, el tamaño de la muestra fue de 28 participantes, lo que genera un poder estadístico de 0.72, inferior al intervalo aceptado. Un periodo de eliminación antes de las valoraciones basales y el uso de diarios dietéticos durante el periodo de eliminación entre los tratamientos para verificar que no se consumía aspartame habría fortalecido el diseño” (p. 191). Ejercicios de pensamiento crítico 1. Responda las preguntas relevantes del recuadro 15-1 respecto a este estudio. (Le sugerimos que lea el reporte completo, en particular la discusión, para contestar estas preguntas.) 2. Considere también las siguientes preguntas dirigidas: a. Comente acerca de la validez de la conclusión estadística de este estudio. b. ¿Se habría beneficiado este estudio con la inclusión de un diagrama de flujo tipo CONSORT? 3. ¿Cuáles podrían ser algunos usos a los que podrían aplicarse los 526 hallazgos en la práctica clínica? EJEMPLO 2: SECCIÓN DE DISCUSIÓN DEL ESTUDIO DEL APÉNDICE A Lea la sección “Discusión” del estudio de Swenson y sus colaboradores (2016) (“Uso de afirmaciones positivas/elogios y afirmaciones negativas/críticas que hacen los padres en una muestra de niños pequeños que requieren servicios de salud mental”) en el apéndice A de este libro. Ejercicios de pensamiento crítico 1. Responda las preguntas del recuadro 15-1 que son relevantes para este estudio. 2. Considere también las siguientes preguntas enfocadas: a. ¿Se usó un diagrama de flujo tipo CONSORT en este estudio? De no ser así, ¿qué información del flujo de participantes se incluyó en el texto? b. ¿Puede pensar en alguna limitación de este estudio que los investigadores no mencionaron? EJEMPLO 3: ESTUDIO CUANTITATIVO EN EL APÉNDICE C Lea el estudio de Wilson y sus colaboradores (2016) (“Estudio controlado aleatorizado de una intervención educativa preoperatoria individualizada para el control de síntomas después de artroplastia total de la rodilla”) en el apéndice C y luego resuelva las siguientes actividades o preguntas sugeridas. Ejercicios de pensamiento crítico 1. Antes de leer la crítica de las autoras que acompaña al reporte completo, escriba su propia crítica o prepare una lista de lo que cree que son las principales fortalezas y debilidades del estudio. Ponga atención especial en las amenazas a la validez y los sesgos. Luego compare su crítica con la de las autoras. Recuerde que usted (o su docente) no siempre tienen que concordar en todos los puntos señalados en la crítica de las autoras y que es posible que identifique fortalezas y debilidades que ellas pasaron por alto. Los lineamientos generales para la crítica que se incluyen en la tabla 4-1 pueden serle de utilidad. 527 2. Escriba un resumen corto de qué tan creíbles, importantes y generalizables considera que son los resultados del estudio. Su resumen debe concluir con su interpretación de lo que significan los resultados y cuáles son sus implicaciones para la práctica de la enfermería. Compare su resumen con la sección de discusión del reporte mismo. 3. Al seleccionar los estudios que se incluyeron en este libro, las autoras eligieron de manera deliberada un estudio con muchas fortalezas. En las preguntas siguientes se presentan algunas situaciones “imaginarias” en las que los investigadores del estudio del apéndice C tomaron decisiones metodológicas diferentes de las que en realidad tomaron. Redacte un párrafo o dos en los que critique estas decisiones “imaginarias”, señale cómo estas alternativas habrían afectado el rigor del estudio y las inferencias que podrían hacerse. a. Imagine que los investigadores no hubieran podido distribuir a los sujetos de manera aleatoria a los tratamientos. En otras palabras, el diseño sería un cuasi experimento con un grupo control no equivalente. b. Imagine que se distribuyeran al azar 143 participantes (esto en realidad ocurrió), pero solo 80 permanecieron en el estudio en el tiempo 3. ¿DESEA SABER MÁS? En se incluye una amplia variedad de recursos en inglés para mejorar el aprendizaje y la comprensión de este capítulo . Interactive Critical Thinking Activity. Suplemento de este capítulo sobre Research Biases. Respuestas a los ejercicios de pensamiento crítico para los ejemplos 2 y 3. Recursos en Internet con sitios web útiles para el capítulo 15. Un artículo de investigación de una revista de Wolters Kluwer, el estudio de Dotson et al. descrito como ejemplo en la p. 268. También están disponibles en inglés más auxiliares de estudio, incluidos ocho artículos de investigación y preguntas relacionadas en la Study Guide for Essentials of Nursing Research, 9e. 528 La interpretación de los resultados de la investigación cuantitativa (los resultados de los análisis estadísticos) por lo general incluye la consideración de (1) la credibilidad de los resultados, (2) la precisión de los cálculos de los efectos, (3) la magnitud de los efectos, (4) el significado subyacente, (5) la generalizabilidad y (6) las implicaciones para la investigación futura y la práctica de la enfermería. Los aspectos particulares del estudio, sobre todo las decisiones metodológicas de los investigadores, afectan las inferencias que pueden hacerse sobre la correspondencia entre los resultados del estudio y la “verdad en el mundo real”. Es adecuado mantener una actitud cautelosa para establecer conclusiones sobre la credibilidad y el significado de los resultados del estudio. La valoración de la credibilidad de un estudio puede incluir varias estrategias, una de las cuales es la evaluación del grado de congruencia entre los constructos abstractos o métodos idealizados por una parte y los sustitutos usados en realidad por la otra. Las valoraciones de la credibilidad también incluyen una valoración del rigor del estudio mediante un análisis de las amenazas a la validez y los sesgos que podrían minar la exactitud de los resultados. La corroboración (replicación) de los resultados en fuentes internas o externas es otra estrategia para valorar la credibilidad. Los investigadores facilitan las interpretaciones mediante la documentación cuidadosa de las decisiones metodológicas y los resultados de esas decisiones (p. ej., al usar los lineamientos CONSORT para documentar el flujo de participantes). En términos generales, relevancia clínica se refiere a la importancia práctica de los resultados de la investigación; es 529 decir, si los efectos son genuinos y palpables en la vida diaria de los pacientes o en el tratamiento de su enfermedad. La relevancia clínica no ha recibido mucha atención en la investigación de enfermería. La relevancia clínica de los resultados grupales a menudo se infiere con base en estadísticas como los índices de tamaño del efecto, intervalos de confianza y número necesario a tratar. Sin embargo, por lo general la relevancia clínica se discute en términos de los efectos para pacientes individuales, en especial si alcanzaron un cambio clínico significativo. Las definiciones y la operacionalización de la relevancia clínica para individuos por lo general implica un punto de referencia o límite para designar una magnitud significativa de cambio. Esta referencia por lo regular se llama cambio mínimo importante (CMI) y es el valor de la cantidad de puntos en la calificación del cambio de una medición que un paciente individual debe alcanzar para ser considerado con un cambio de relevancia clínica. No es legítimo el uso de los CMI para interpretar la media o diferencias en la media de los grupos. Sin embargo, el CMI puede emplearse para confirmar si cada persona de la muestra alcanzó o no un cambio mayor al CMI y así poder realizar un análisis de sujetos de estudio con el fin de comparar el porcentaje de sujetos que alcanzaron el límite en distintos grupos del estudio. Los investigadores deben señalar las limitaciones detectadas en su estudio en sus discusiones de los resultados del estudio; sin embargo, los lectores deben obtener sus propias conclusiones acerca del rigor del estudio y la factibilidad de explicaciones alternativas para los resultados. REFERENCIAS DEL CAPÍTULO 15 Despriee, Å., & Langeland, E. (2016). The effect of sucrose as pain relief/comfort during immunisation of 15-month-old children in health care centres: A randomised controlled trial. Journal of Clinical Nursing, 25, 372–380. **Dotson, M. J., Dave, D., Cazier, J., & Spaulding, T. (2014). An empirical analysis of nurse retention: What keeps RNs in nursing? The Journal of Nursing Administration, 44, 111–116. 530 Houck, G., Kendall, J., Miller, A., Morrell, P., & Wiebe, G. (2011). Selfconcept in children and adolescents with attention deficit hyperactivity disorder. Journal of Pediatric Nursing, 26, 239–247. Jaeschke, R., Singer, J., & Guyatt, G. H. (1989). Measurement of health status: Ascertaining the minimal clinically important difference. Controlled Clinical Trials, 10, 407–415. Latendresse, G., & Ruiz, R. (2011). Maternal corticotropin-releasing hormone and the use of selective serotonin reuptake inhibitors independently predict the occurrence of preterm birth. Journal of Midwifery & Women’s Health, 56, 118–126. *Lavender, T., Bedwell, C., Roberts, S., Hart, A., Turner, M., Carter, L., & Cork, M. (2013). Randomized, controlled trial evaluating a baby wash product on skin barrier function in healthy, term neonates. Journal of Obstetric, Gynecologic, & Neonatal Nursing, 42, 203–214. Lima, A., Miranda, A., Correia, M., Soares, A., Cucato, G., Sobral Filho, D., ... Ritti-Dias, R. (2015). Individual blood pressure responses to walking and resistance exercise in peripheral artery disease patients: Are the mean values describing what is happening? Journal of Vascular Nursing, 33, 150–156. Lindseth, G. N., Coolahan, S., Petros, T., & Lindseth, P. (2014). Neurobehavioral effects of aspartame consumption. Research in Nursing & Health, 37, 185–193. Polit, D. F., & Yang, F. M. (2016). Measurement and the measurement of change. Philadelphia, PA: Wolters Kluwer. Sackett, D. L., Straus, S., Richardson, W., Rosenberg, W., & Haynes, R. (2000). Evidence-based medicine: How to practice and teach EBM (2nd ed.). Edinburgh, United Kingdom: Churchill Livingstone. *Se incluye un enlace a este artículo de acceso abierto en la sección Internet Resources del sitio web . **Este artículo de investigación está disponible en inglés en capítulo. 531 para este Objetivos de aprendizaje Al completar este capítulo, el lector será capaz de: Describir las actividades que los investigadores cualitativos realizan para administrar y organizar sus datos. Explicar los procedimientos que se utilizan para analizar los datos cualitativos, incluidos los procedimientos generales y los que se emplean en investigación etnográfica, fenomenológica y de teoría fundamentada. Valorar la adecuación de las descripciones de los investigadores de sus procedimientos analíticos y evaluar la idoneidad de estos procedimientos. Definir los términos nuevos del capítulo. Términos clave Ajuste emergente Análisis de contenido cualitativo Caso paradigmático Categoría central Categoría nuclear Círculo hermenéutico Codificación abierta Codificación axial Codificación selectiva Códigos sustantivos Códigos teóricos Comparación constante Dominio 532 Metáfora Proceso social básico (PSB) Taxonomía Tema Los datos cualitativos provienen de materiales narrativos, como las transcripciones de entrevistas grabadas o de las notas de campo de los observadores participantes. Este capítulo describe los métodos para analizar los datos cualitativos. INTRODUCCIÓN AL ANÁLISIS CUALITATIVO El análisis de los datos cualitativos es difícil por varias razones. Primera, no hay reglas universales para realizarlo. Una segunda dificultad es la enorme cantidad de trabajo que se requiere. Los analistas cualitativos deben organizar y dar sentido a cientos, incluso miles, de páginas de materiales narrativos. Por lo general, los investigadores cualitativos examinan los datos con cuidado, a menudo los leen una y otra vez para comprenderlos. Además, la realización de un análisis cualitativo requiere creatividad y habilidades inductivas sólidas (inducir de lo universal a lo particular). Un analista cualitativo debe ser competente para discernir patrones y entrelazarlos en un todo integrado. Otra dificultad es la reducción de datos para el reporte. Los resultados cuantitativos con frecuencia pueden resumirse en unas cuantas tablas. En contraste, los investigadores cualitativos deben equilibrar la necesidad de ser concisos con la de mantener la riqueza de sus datos. TIP Los análisis cualitativos son más difíciles de hacer que los cuantitativos, pero los hallazgos cualitativos son más fáciles de comprender que los cuantitativos porque los relatos se cuentan en lenguaje coloquial. Sin embargo, los análisis cualitativos suelen ser difíciles de criticar porque los lectores no pueden saber si los investigadores captaron los patrones temáticos de los datos. ADMINISTRACIÓN Y ORGANIZACIÓN 533 DE DATOS CUALITATIVOS El análisis cualitativo se apoya en diversas tareas que ayudan a organizar y administrar la masa de datos narrativos. Desarrollo de un esquema de codificación Los investigadores cualitativos comienzan su análisis con el desarrollo de un método para clasificar e indexar sus datos. Deben ser capaces de acceder a partes de los datos sin tener que leer de nuevo todo el conjunto. El procedimiento usual es crear un esquema de codificación con base en el escrutinio de los datos reales y luego codificarlos según las categorías del esquema. El desarrollo de un esquema de alta calidad requiere una lectura cuidadosa de los datos, con atención para identificar los conceptos subyacentes. La naturaleza de los códigos puede variar en su nivel de detalle y abstracción. Los investigadores cuyos objetivos son principalmente descriptivos por lo regular usan códigos muy concretos. Los códigos pueden distinguir varios tipos de acciones o eventos, por ejemplo. Para desarrollar un esquema de codificación, los conceptos relacionados se agrupan juntos para facilitar el proceso. Ejemplo de un esquema de codificación descriptivo Ersek y Jablonski (2014) estudiaron la adopción en asilos de prácticas basadas en la evidencia para controlar el dolor. Los datos de las entrevistas con el grupo central del personal se codificaron en categorías amplias de facilitadores y barreras dentro del esquema de Donabedian de estructura, proceso y resultado. Por ejemplo, las categorías de barreras en el grupo del proceso incluyeron desconfianza en el profesional, falta de tiempo, y conocimiento y actitudes del personal y la familia. Muchos estudios, como los diseñados para desarrollar una teoría, tienen mayor probabilidad de incluir el desarrollo de categorías de codificación conceptuales abstractas. Para generar las categorías abstractas, los investigadores separan los datos en segmentos, los examinan y comparan con otros segmentos para descubrir el significado de esos fenómenos. Hacen preguntas del tipo de las 534 siguientes acerca de declaraciones distintivas: ¿qué es? ¿Qué ocurre? ¿Qué más se parece a esto? ¿Cuál es su forma distintiva? Luego se aplica una etiqueta a los conceptos importantes que surgen del examen. Estos nombres son abstracciones, pero las etiquetas suelen ser lo bastante gráficas –y a menudo provocadoras– para que la naturaleza del material al que se refieren sea clara. Ejemplo de un esquema de codificación abstracto El recuadro 16-1 muestra el esquema de categorías desarrollado por Beck y Watson (2010) para codificar los datos de sus entrevistas sobre el parto posterior a un parto traumático (el estudio completo está en el apéndice B). El esquema de codificación incluye categorías temáticas principales con subcódigos. Por ejemplo, un resumen que describe cómo una madre consideraba curativo este parto subsiguiente porque se sintió respetada durante este nuevo trabajo de parto y parto se codificaría como 3A, la categoría de “Ser tratada con respeto”. Recuadro 16-1 Esquema de codificación de Beck y Watson (2010) para el parto posterior a un parto traumático Tema 1. Montar la turbulenta ola de pánico durante el embarazo A. Reacciones al enterarse del embarazo. B. Negación durante el primer trimestre. C. Estado intenso de ansiedad. D. Ataques de pánico conforme se aproxima la fecha del parto. E. Insensibilidad hacia el lactante. Tema 2. Desarrollo de estrategias: intentos de recuperar su cuerpo y completar el trayecto hacia la maternidad A. Dedicar tiempo a nutrirse a sí misma mediante ejercicio, clases de yoga y natación. B. Llevar un diario durante todo el embarazo. C. Recurrir a comadronas para recibir apoyo durante el trabajo de parto. D. Leer con avidez para comprender el proceso del parto. E. Participar en ejercicios artísticos acerca del parto. F. Comunicar abiertamente a los profesionales de salud el parto traumático previo. 535 G. Compartir los temores con la pareja. H. Aprender técnicas de relajación. Tema 3. Veneración por el proceso del nacimiento y empoderamiento de las mujeres A. Ser tratada con respeto. B. Tomar en serio el alivio del dolor. C. Comunicación con el personal de cuidado de la salud durante el trabajo de parto y el parto. D. Reclamar el propio cuerpo. E. Fuerte sensación de control. F. El personal de cuidado de la salud respeta el plan para el trabajo de parto y el parto. G. Proceso de duelo por lo que se perdieron con el parto previo. H. Curación con el parto subsiguiente, pero nunca se puede cambiar el pasado. Tema 4. Aún sin alcanzar: el anhelo de una experiencia de parto curativa A. Falló de nuevo como mujer. B. Mejor que el primer parto traumático, pero no curada. C. Esperanzas frustradas de un parto curativo en casa. Codificación de los datos cualitativos Después de desarrollar el esquema de codificación, los datos se leen completos y se codifican para que correspondan a las categorías, una tarea que pocas veces es sencilla. Por ejemplo, es posible que los investigadores tengan dificultades para decidir el código más apropiado. A veces es necesario leer varias veces el material para captar sus matices. Además, durante la codificación los investigadores suelen descubrir que el sistema inicial estaba incompleto. Es factible que surjan categorías que no se identificaron al principio. Cuando esto pasa, es riesgoso asumir que la categoría no existía en los materiales codificados antes. Es posible que un concepto no se identifique como sobresaliente hasta que se ha presentado varias veces. En tal caso, sería necesario leer de nuevo todo el material ya codificado para confirmar si debe aplicarse el nuevo código. Los materiales narrativos casi nunca son lineales. Por ejemplo, los 536 párrafos de entrevistas transcritas pueden contener elementos relacionados con tres o cuatro categorías diferentes. Figura 16-1 Extracto codificado del estudio de Beck y Watson (2010) sobre el parto después de un parto traumático. Ejemplo de un segmento de múltiples temas La figura 16-1 muestra un ejemplo de un segmento con varios temas de una entrevista del estudio sobre el parto después de un parto traumático de Beck y Watson (2010). Los códigos al margen son los del esquema del recuadro 16-1. Métodos para organizar los datos cualitativos Antes del advenimiento del software para la administración de datos cualitativos, los analistas usaban archivos conceptuales para organizarlos. En esta técnica se crea un archivo físico para cada categoría y luego se cortan e insertan en el expediente todos los materiales relativos a esa categoría. Más tarde, los investigadores revisan el fólder del archivo pertinente para recuperar el contenido de un tema particular. La creación de archivos conceptuales es una tarea engorrosa que requiere mucho trabajo, sobre todo cuando algunas partes de las narraciones tienen múltiples códigos. Por ejemplo, en la figura 16-1 se necesitarían siete copias del párrafo, correspondientes a los siete códigos que se usaron. Los investigadores también deben proporcionar un contexto suficiente para que el material recortado pueda comprenderse, por lo que a menudo deben incluir material precedente o posterior al relevante. El software para análisis cualitativo asistido por computadora 537 (CAQDAS, por sus siglas en inglés) elimina el trabajo de cortar y pegar páginas de material narrativo. Estos programas permiten ingresar el conjunto de datos completo en la computadora para codificarlo; el texto correspondiente a los códigos especificados puede recuperarse luego para su análisis. El software también puede usarse para examinar relaciones entre los códigos. Los programas de cómputo, como Atlas.ti y Etnograph, ofrecen muchas ventajas para administrar los datos cualitativos, pero algunos investigadores prefieren los métodos manuales porque les permiten aproximarse más a los datos. Otros desaprueban la conversión de un proceso cognitivo en una actividad tecnológica. A pesar de las preocupaciones, muchos investigadores cambiaron a la gestión computarizada de los datos porque libera su tiempo y les permite dedicar más atención a aspectos conceptuales. PROCEDIMIENTOS ANALÍTICOS La administración de datos en la investigación cuantitativa es un proceso reduccionista: convierte masas de datos en segmentos más pequeños y manejables. En contraste, el análisis de los datos cualitativos es construccionista: reúne segmentos en patrones conceptuales significativos. Existen varios enfoques para analizar los datos cualitativos, pero tienen algunos elementos en común. Una visión analítica general El análisis de los materiales cualitativos por lo regular inicia con una búsqueda de categorías o temas más amplios. En su revisión acerca de cómo se usa el término tema entre los investigadores cualitativos, DeSantis y Ugarriza (2000) ofrecen esta definición: “Un tema es una entidad abstracta que otorga significado y sentido a una experiencia actual y sus distintas manifestaciones. Por lo tanto, un tema captura y unifica la naturaleza o base de la experiencia en un todo significativo” (p. 362). Los temas surgen de los datos. No solo se desarrollan dentro de las categorías de datos (es decir, en las categorías del esquema de codificación) sino también entre estas. La búsqueda de temas no solo implica el descubrimiento de elementos comunes entre los participantes; además busca la variación. Los temas nunca son universales. Los investigadores deben atender no solo a qué temas 538 surgen, también los patrones que forman. ¿El tema se aplica nada más a ciertos tipos de personas o en contextos específicos? ¿En ciertos periodos? En otras palabras, los analistas cualitativos deben ser sensibles a las relaciones dentro de los datos. TIP Los investigadores cualitativos con frecuencia usan temas principales y subtemas en la sección “Resultados” de sus reportes. Por ejemplo, en su análisis de entrevistas de las experiencias de 14 cuidadores familiares de pacientes con insuficiencia cardiaca, Gusdal y sus colaboradores (2016) identificaron dos temas principales que usaron para organizar sus resultados: “Vivir una existencia que cambió” y “Batallar y cooperar con el cuidado a la salud”. Los subtemas en las dos categorías también tienen encabezados en el reporte. Los investigadores buscan temas y a veces los patrones en los datos son facilitados por dispositivos que permiten seguir la evolución de los comportamientos y procesos. Por ejemplo, para estudios cualitativos que se enfocan en experiencias dinámicas (como toma de decisiones) pueden usarse diagramas de flujo o líneas de tiempo para resaltar las secuencias temporales o los principales puntos de decisión. Algunos investigadores cualitativos usan metáforas como estrategia analítica. Una metáfora es una comparación simbólica que emplea lenguaje figurativo para evocar una analogía visual. Las metáforas pueden ser herramientas expresivas para los analistas cualitativos, pero corren el riesgo de “suplantar la visión creativa con un cliché trillado que oculta la profundidad” (Thorne y Darbyshire, 2005, p. 1111). Ejemplo de metáfora Patel y sus colaboradores (2016) estudiaron las experiencias sintomáticas de mujeres con miocardiopatía periparto. Los investigadores capturaron la naturaleza del tema principal con la metáfora “Estar atrapada en una telaraña”. Un paso analítico más es la validación. En esta fase, la preocupación consiste en si los temas representan con exactitud las perspectivas de los participantes. En el capítulo 17 se explican varios procedimientos de validación. 539 En la etapa de análisis final, los investigadores se esfuerzan por entretejer las piezas temáticas en un todo integrado. Los diversos temas se integran para proporcionar una estructura general (como una teoría o una descripción completa) a los datos. La integración exitosa requiere creatividad y rigor intelectual. TIP Aunque relativamente pocos investigadores hacen esfuerzos formales para cuantificar las características de sus datos, hay que mantenerse alerta a las implicaciones cuantitativas cuando se lee un reporte cualitativo. Los investigadores cualitativos suelen usar palabras como “algunos”, “la mayoría” o “muchos” para caracterizar las experiencias y acciones de los participantes, lo que implica cierto grado de cuantificación. Análisis de contenido cualitativo En el resto de esta sección se discuten los procedimientos analíticos que utilizan los etnógrafos, fenomenólogos e investigadores de la teoría fundamentada. Sin embargo, los investigadores cualitativos que conducen estudios cualitativos pueden decir tan solo que realizaron un análisis de contenido. El análisis de contenido cualitativo se refiere al examen del contenido de los datos narrativos para identificar temas sobresalientes y patrones entre los temas. Implica la separación de los datos en unidades más pequeñas, la codificación y la denominación de las unidades según el contenido que representan y la agrupación del material codificado con base en conceptos compartidos. La bibliografía sobre análisis de contenido a menudo se refiere a unidades de significado. En esencia, una unidad de significado es el segmento más pequeño de un texto que contiene una pieza de información reconocible. Los analistas de contenido con frecuencia distinguen entre contenido manifiesto y latente. El contenido manifiesto es lo que el texto dice en realidad. En estudios descriptivos puros, los investigadores cualitativos pueden enfocarse sobre todo en resumir el contenido manifiesto que el texto comunica. Sin embargo, los analistas de contenido también suelen examinar aquello acerca de lo que habla el texto, lo que requiere interpretar el significado de su contenido latente. La profundidad y el nivel de abstracción de las interpretaciones varían y por lo regular son la base de los temas. 540 Ejemplo de un análisis de contenido Herling y sus colaboradores (2016) realizaron un análisis de contenido de entrevistas semiestructuradas con 12 mujeres con cáncer endometrial en etapa temprana que se habían sometido a histerectomía laparoscópica con asistencia robótica. Surgieron cuatro temas globales: “La cirugía fue sencillísima”, “Recuperación física después de la cirugía”, “Pasar de estar descuidada a estar en guardia” y “Prepararse mediante la búsqueda de información”. Análisis etnográfico Por lo general, el análisis comienza en el momento que los etnógrafos ponen un pie en el campo. Los etnógrafos buscan continuamente patrones en el comportamiento y los pensamientos de los participantes, comparan un patrón con otro y analizan muchos patrones al mismo tiempo. Conforme analizan los patrones de la vida cotidiana, adquieren una comprensión más profunda de la cultura que estudian. Los mapas, diagramas de flujo y gráficas organizacionales también son herramientas útiles que ayudan a concretar e ilustrar los datos que se reúnen. Las matrices (presentaciones bidimensionales) también ayudan a resaltar la comparación de manera gráfica, a hacer referencias cruzadas de las categorías y a descubrir patrones emergentes. En ocasiones se utiliza la secuencia de investigación de Spradley (1979) para los análisis de datos etnográficos. Su secuencia de 12 pasos incluye estrategias para la recolección y el análisis de datos. En el método de Spradley hay cuatro niveles de análisis de datos: análisis de dominio, análisis taxonómico, análisis de componentes y análisis del tema. Los dominios son categorías amplias que representan unidades de conocimiento cultural. Durante este primer nivel de análisis, los etnógrafos identifican patrones de relación entre los términos de los dominios que usaron los miembros de la cultura. El etnógrafo se enfoca en el significado cultural de los términos y símbolos (objetos y eventos) usados en una cultura y sus interrelaciones. En el análisis taxonómico, el segundo nivel del método analítico de datos de Spradley (1979), los etnógrafos deciden cuántos dominios abarcará el análisis. ¿Se analizarán a profundidad solo uno o dos dominios o se estudiarán varios dominios con menor detalle? Después 541 de tomar esta decisión, se desarrolla una taxonomía –un sistema para clasificar y organizar términos– con el fin de ilustrar la organización interna de un dominio. En el análisis de componentes se examinan múltiples relaciones entre los términos de los dominios. El etnógrafo analiza los datos en busca de similitudes y diferencias entre términos culturales en un dominio. Por último, en el análisis del tema, se descubren los temas culturales. Los dominios se conectan en temas culturales, lo que ayuda a proporcionar una visión integral de la cultura que se estudia. El descubrimiento del significado cultural es el resultado. Ejemplo del uso del método de Spradley Michel y sus colaboradores (2015) estudiaron los significados asignados a la atención médica por parte de adultos mayores y profesionales de enfermería en una institución de atención a la salud. Usaron el método de Spradley del análisis etnográfico e identificaron y analizaron seis dominios. El tema cultural global que surgió fue de lo real a lo ideal: la (in)atención a la salud de los adultos mayores más longevos. Se han desarrollado otras estrategias para el análisis etnográfico. Por ejemplo, en el método de investigación de etnoenfermería de Leininger, según lo describen McFarland y Wehbe-Alamah (2015), los etnógrafos siguen una guía para el análisis de datos de etnoenfermería de cuatro fases. En la primera fase, recolectan, describen y registran datos. La segunda fase incluye la identificación y clasificación de los elementos descriptivos. En la fase 3 se analizan los datos para descubrir patrones repetitivos en su contexto. En la cuarta fase, la final, se resumen los temas principales y se presentan los hallazgos. Ejemplo del uso del método de Leininger Raymond y Omeri (2015) estudiaron la atención cultural de las familias con niños inmigrantes de Mauritania que vivían en Australia. Mediante las cuatro fases de Leininger, los investigadores identificaron cinco temas dominantes: atención como familia extendida y apoyo de amigos; atención como las mejores prácticas profesionales o populares; autocuidado como responsabilidad; cuidado como elemento activador y de empoderamiento; y cuidado como mantenimiento de un ambiente 542 higiénico y de apoyo. Análisis fenomenológico Las escuelas fenomenológicas desarrollaron distintos enfoques para el análisis de datos. Tres métodos que se emplean con frecuencia para la fenomenología descriptiva son los de Colaizzi (1978), Giorgi (1985) y van Kaam (1966), los cuales pertenecen a la Escuela de Duquesne de fenomenología, basada en la filosofía de Husserl. El resultado básico de los tres métodos es la descripción de la naturaleza esencial de una experiencia, por lo regular mediante la identificación de temas esenciales. Existen algunas diferencias importantes entre estos enfoques. Por ejemplo, el método de Colaizzi (1978) es el único que requiere una validación de los resultados mediante una consulta con los participantes del estudio. La visión de Giorgi (1985) consiste en que resulta inapropiado regresar con los participantes para validar los hallazgos o usar jueces externos para revisar el análisis. El método de van Kaam (1966) requiere el logro de un acuerdo entre los sujetos con otros jueces expertos. La figura 16-2 presenta una ilustración de los pasos de la estrategia de análisis de Colaizzi (1978), que es la más usada por los investigadores en enfermería. Ejemplo de un estudio que usa el método de Colaizzi Knecht y Fischer (2015) exploraron la experiencia de estudiantes de enfermería de pregrado en el aprendizaje del servicio. Las transcripciones de las entrevistas con 10 estudiantes se analizaron con el método de Colaizzi. Surgieron cinco temas: “romper los estereotipos”, “abrumados con su necesidad”, “transición a cuidador comunitario”, “defensa” y “beneficios recíprocos”. Los fenomenólogos de la Escuela de Utrecht, como van Manen (1997), combinan características de la fenomenología descriptiva e interpretativa. La estrategia de van Manen incluye seis actividades: (1) regresar a la naturaleza de la experiencia vivida, (2) explorar la experiencia tal como se vive, (3) reflexionar en temas esenciales, (4) describir el fenómeno mediante el arte de escribir y reescribir, (5) mantener una fuerte relación con el fenómeno y (6) equilibrar el contexto de la investigación considerando las partes y el todo. Según 543 van Manen, los aspectos temáticos de la experiencia pueden descubrirse a partir de las descripciones de los participantes sobre la experiencia mediante tres métodos: holístico, selectivo y detallado. En el enfoque holístico, los investigadores consideran el texto como un todo e intentan capturar sus significados. En el enfoque selectivo (o resaltado), extraen declaraciones que parecen esenciales para la experiencia en estudio. En el enfoque detallado (o línea por línea), analizan cada oración. Una vez que se identifican los temas, se convierten en objetos de interpretación mediante entrevistas de seguimiento con los participantes. Con este proceso se descubren los temas esenciales. Figura 16-2 Pasos del procedimiento de Colaizzi en el análisis de datos fenomenológicos. (Reimpresa con autorización de Beck, C. T. [2009]. The arm: There is no escaping the reality for mothers of children with obstetric brachial plexus injuries. Nursing Research, 58, 237-245.) Ejemplo de un estudio que usa el método de van Manen Rasmussen y Delmar (2014) presentaron una descripción detallada del modo en que utilizan los métodos de van Manen en el estudio de la dignidad del paciente tal como la perciben los pacientes quirúrgicos en un hospital danés. Realizaron análisis holístico, selectivo y detallado para revelar el tema básico: ser una persona importante. 544 Además de identificar temas a partir de las descripciones de los participantes, van Manen (1997) también exigió la deducción de descripciones temáticas a partir de fuentes artísticas. Van Manen urgió a los investigadores cualitativos a tener presente que la literatura, la pintura y otras formas de arte pueden proporcionar abundantes datos sobre experiencias que aumentan la información del significado esencial de la experiencia que se estudia. Una tercera escuela de fenomenología es una estrategia interpretativa llamada hermenéutica de Heidegger. Un elemento central para el análisis de datos en un estudio hermenéutico es la noción del círculo hermenéutico. El círculo significa el proceso metodológico en el que para llegar a la comprensión existe un movimiento continuo entre las partes y el total del texto que se analiza. Gadamer (1975) subrayó que para interpretar un texto, los investigadores no pueden separarse de los significados del mismo y deben esforzarse por comprender las posibilidades que puede revelar. Benner (1994) ofreció un enfoque analítico del análisis hermenéutico que incluye tres procesos interrelacionados: la búsqueda de casos paradigmáticos, el análisis temático y el análisis de ejemplares. Los casos paradigmáticos son “casos fuertes de preocupaciones o maneras de estar en el mundo” (Benner, 1994, p. 113). Los casos paradigmáticos se usan en una etapa temprana del proceso analítico como estrategia para llegar a la comprensión. El análisis temático se hace para comparar y contrastar las similitudes entre los casos. Por último, los casos paradigmáticos y el análisis temático pueden mejorarse mediante ejemplos que iluminan aspectos de un caso paradigmático o tema. Los casos paradigmáticos y ejemplos presentados en los reportes de investigación permiten a los lectores participar en la validación consensuada de los resultados al decidir si los casos respaldan las conclusiones de los investigadores. Ejemplo de uso del análisis hermenéutico de Benner Solomon y Hansen (2015) condujeron un estudio fenomenológico interpretativo de la experiencia singular de una paciente moribunda y sus familiares. Los investigadores usaron el enfoque de Benner en su análisis, el cual abarcó casos paradigmáticos, análisis temático y de ejemplos. Estos últimos incluyeron “dirigir su propio camino” y “no ser una carga”. 545 Análisis de teoría fundamentada Los métodos de la teoría fundamentada surgieron en la década de 1960 cuando dos sociólogos, Glaser y Strauss, estudiaban la muerte en los hospitales. Los dos coautores al final se separaron y desarrollaron estrategias divergentes, llamadas las versiones glaseriana y straussiana de la teoría fundamentada. También surgió un tercer enfoque analítico de Charmaz (2014), la teoría fundamentada constructivista. Método de teoría fundamentada de Glaser y Strauss La teoría fundamentada en los tres sistemas analíticos usa la comparación constante, un método que implica contrastar los elementos presentes en una fuente de datos (p. ej., una entrevista) con los de otra. El proceso continúa hasta que se compara el contenido de todas las fuentes para poder identificar puntos comunes. El concepto de ajuste es un elemento importante en el análisis de la teoría fundamentada de Glaser. Ajuste se refiere a qué tanto los conceptos emergentes coinciden con los incidentes que representan, lo que depende de la minuciosidad con la que se hace la comparación constante. En el enfoque de Glaser, la codificación se usa para conceptualizar los datos en patrones. La codificación ayuda al investigador a descubrir el problema básico que los participantes deben enfrentar. La sustancia del tema en estudio se conceptualiza mediante códigos sustantivos, de los cuales hay dos tipos: abierto y selectivo. La codificación abierta, usada en la primera etapa de la comparación constante, captura lo que ocurre en los datos. Los códigos abiertos pueden ser las palabras reales que usaron los participantes. Los datos se disgregan mediante la codificación abierta y se examinan sus similitudes y diferencias. Existen tres niveles de codificación abierta que varían en su grado de abstracción. Los códigos de nivel I (o códigos in vivo) se derivan directamente del lenguaje del área sustantiva. Tienen imágenes vivas y “atrapan”. La tabla 16-1 presenta cinco códigos de nivel I e ilustra fragmentos de entrevistas del estudio de la teoría fundamentada de Beck (2002) sobre la maternidad de gemelos. Mientras los investigadores comparan de manera continua nuevos códigos de nivel I con los identificados antes, los condensan en 546 códigos de nivel II más amplios. Por ejemplo, los cinco códigos de nivel I de Beck (2002) de la tabla 16-1 se condensaron en un solo código de nivel II, “cosechando las bendiciones”. Los códigos de nivel III (o constructos teóricos) son los más abstractos. El condensar los códigos de nivel II ayuda a identificar los constructos. TIP El material adicional relacionado con el estudio de gemelos de Beck (2002) se presenta como suplemento en inglés de este capítulo en el sitio web . TABLA 16-1 Códigos de nivel I condensados en el código nivel II de “Cosechar las bendiciones” (Beck, 2002) Código de nivel I Sinopsis Disfruto ver a los gemelos interactuar tanto. Sobre todo ahora que son capaces de desplazarse. No caminan aún, pero gatean. Le diré que ya están jugando. Por ejemplo, uno da vuelta en una esquina y se asoma, luego juegan “a las escondidas”. Gatean uno atrás del otro. Es asombroso con gemelos. Ella estaba enferma y tenía fiebre. Él era el que se comportaba como si estuviera enfermo. Ella no parecía estar enferma, él sí. Lo observamos alrededor de 6 a 8 horas. Le dimos a ella el medicamento y él empezó a tranquilizarse, ¡guau! Eso es muy raro. Uno lee al respecto, pero es como si... ¡oh, vamos! Es algo genial verlo. En esta etapa es genial porque vas a la tienda o sales y la gente te dice: “Oh, son gemelos, qué lindos”. Y yo digo: “Sí, lo son. Mire, mire a mis hijos”. Me siento bendecida de tener dos. Siento que soy doblemente afortunada como mamá que tuvo un bebé. Esa es la mejor parte; en lugar de tener un bebé que observar mientras crece, cambia y se desarrolla y se convierte en un niño más grande y luego en un niño en edad escolar, tienes dos. Disfrutar a los gemelos Es muy emocionante. Es interesante y divertido verlos y notar cómo es en realidad el vínculo de los gemelos. En Vínculo entre gemelos 547 Asombroso Obtener atención Sentirse bendecida verdad existe un enlace entre ellos. Uno lee y escucha al respecto, pero hasta que lo experimentas lo comprendes. En una ocasión ambos estaban llorando y los dos comieron. Tenían pañales limpios y habían eructado. No había nada mal. No podía encontrar qué estaba mal, así que me dije a mí misma: “Los voy a poner juntos y a cerrar la puerta”. Los dejé en mi cama juntos y chocaron las manos entre sí, aproximaron sus narices, se miraron uno al otro y se durmieron de inmediato. La codificación abierta termina cuando se descubre la categoría central y luego comienza la codificación selectiva. La categoría nuclear (o variable nuclear) es un patrón de comportamiento relevante o problemático para los participantes del estudio. En la codificación selectiva, los investigadores codifican solo los datos relacionados con la categoría nuclear. Un tipo de categoría nuclear es un proceso social básico (PSB) que con el tiempo se desarrolla en dos o más fases. Todos los PSB son categorías nucleares, pero no todas las categorías nucleares tienen que ser procesos sociales básicos. Glaser (1978) publicó criterios para ayudar a los investigadores a decidir acerca de una categoría nuclear. Estos son unos cuantos ejemplos: debe ser central, lo que significa que se relaciona con muchas categorías; su aparición debe ser recurrente en los datos; tiene una relación significativa y fácil con otras categorías, y tiene implicaciones claras y atractivas para la teoría formal. Los códigos teóricos proporcionan información de la forma en que los códigos sustantivos se relacionan entre sí. Los códigos teóricos ayudan a los investigadores de la teoría fundamentada a reunir de nuevo los elementos separados de los datos. Glaser (1978) propuso 18 familias de códigos teóricos que los investigadores pueden usar para conceptualizar cómo se relacionan entre sí los códigos sustantivos (aunque expandió las posibilidades en 2005). Los siguientes son cuatro ejemplos de sus familias de códigos teóricos: Proceso: etapas, fases, pasos, transiciones. Estrategia: tácticas, técnicas, maniobras. Punto de corte: límites, uniones fundamentales, puntos de cambio. Las seis C: causas, contextos, contingencias, consecuencias, covarianzas y condiciones. Mediante la codificación y el análisis, los analistas de la teoría 548 fundamentada documentan sus ideas acerca de los datos y el esquema conceptual emergente en memorandos. Los memorandos alientan a los investigadores a reflexionar y describir los patrones de los datos, las relaciones entre las categorías y las conceptualizaciones emergentes. Figura 16-3 Teoría fundamentada de Beck (2002) sobre la maternidad de gemelos: soltar el botón de pausa. El producto de un típico análisis de la teoría fundamentada glaseriana es un modelo teórico que intenta explicar un patrón de comportamiento relevante para los participantes del estudio. Una vez que el problema básico emerge, los investigadores de la teoría fundamentada descubren el proceso que estos participantes experimentan al enfrentar o resolver este problema. Ejemplo de análisis de la teoría fundamentada de Glaser y Strauss La figura 16-3 presenta el modelo de Beck (2002) de un estudio en el que “soltar el botón de pausa” se conceptualizó como la categoría y proceso nuclear por el que pasaron las madres de gemelos cuando intentaron reanudar su vida después del parto. El proceso incluye cuatro fases: agotamiento de la fuerza, pausa en la vida personal, esfuerzo por reiniciar y reanudación de la vida personal. Beck usó 10 549 familias de códigos en su codificación teórica para el estudio. La familia punto de corte ofrece un ejemplo. El punto de cambio para las madres pareció ocurrir a los 3 meses, cuando la vida empezó a ser más controlable. Este es un extracto de una entrevista que Beck codificó como punto de corte: “Pasaron 3 meses, los gemelos empezaron a dormir la noche completa y eso representó una diferencia enorme, enorme”. Glaser y Strauss advirtieron contra la consulta bibliográfica antes de estabilizar un marco, pero también visualizaron el beneficio de examinar otro trabajo. Glaser (1978) discutió la evolución de las teorías fundamentadas mediante el proceso de ajuste emergente para impedir que las teorías sustantivas fueran “pequeñas islas respetadas de conocimiento” (p. 148). Como lo señaló, la generación de la teoría fundamentada no siempre requiere el descubrimiento de nuevas categorías o ignorar las ya identificadas en la bibliografía. Mediante la comparación constante, los investigadores pueden comparar los conceptos que surgen de los datos con los conceptos similares de la teoría o investigación existente para evaluar qué partes tienen ajuste emergente con la teoría que se genera. Enfoque de Strauss y Corbin El enfoque de Strauss y Corbin para el análisis del la teoría fundamentada, descrito más recientemente en Corbin y Strauss, difiere del enfoque original de Glaser y Strauss con respecto al método, los procesos y los resultados. La tabla 16-2 resume las principales diferencias entre ambos métodos de análisis de la teoría fundamentada. TABLA 16-2 Comparación de los métodos de Glaser y de Corbin y Strauss Glaser Análisis inicial de datos Corbin y Strauss La separación y conceptualización de los datos implica comparar incidente con incidente para que surjan patrones 550 La separación y conceptualización de los datos incluye separar una oración, observación e incidente individuales Tipos de codificación Conexiones entre