UNIVERSIDAD DE COSTA RICA FACULTAD DE CIENCIAS SOCIALES ESCUELA DE PSICOLOGIA TRABAJO FINAL DE GRADUACION PARA OPTAR POR EL GRADO DE LICENCIATURA EN PSICOLOGIA Título ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA Sustentante: DENNIS FABIAN REDONDO ALFARO A75253 Comité Asesor: Directora: Dra. Ana María Jurado Solórzano Lector: Dr. Roberto López Core Lector: Msc. Alfonso Villalobos Pérez Tutora externa: Msc. María Elena Murillo 2015 Hoja de aprobación, con el nombre de los miembros del Tribunal y del sustentante Dra. Ana María Jurado Solórzano. Directora '~~ Dr. Roberto López Core. Lector Lic. Bradley Marín Picado. Profesor invitado Lic. Esteban Navarro Díaz. Representante de la Escuela Dermis Redondo Alfaro. Sustentante Dedicatoria Dedico este Trabajo Final de Graduación a las grandes personas que me han acompañado. A mi familia, Víctor, Ligia, Osvaldo e Ignacio. Mi superación personal es dedicada a ellos, como recuerdo de que podemos salir adelante si nos lo proponemos. A mis hermanos, pues, les recuerdo que si yo lo logré, ustedes pueden. Sigan adelante y luchen por sus sueños. A mis papás les dejo esta tesis, como un símbolo de agradecimiento. Es un honor para mí que la vida les recompense por medio de mi esfuerzo. A mi novia Marta, por su motivadora y aliciente escucha. Tu comprensión fue un tesoro para mí. No era tu proyecto, no era tu problema, pero decidiste ayudarme y ser participe por voluntad tuya. Tener alguien cerca que te aliente siempre hace las cosas más livianas. Agradeceré por siempre tu voluntad de apoyarme en la tesis. Ante los problemas, mi abuelo Edgar me enseñó a enfrentarlos con honradez. Mi abuela Rosa a resolverlos con sentido común. Mi abuelo Filiberto el sentido de lucha y no rendirme jamás. Y de mi abuela Luz la importancia de encararlos con una sonrisa. Estas cuatro cualidades fueron más que necesarias en este proyecto. Sin alguna de ellas, nunca lo hubiese terminado. Parece que ellos sabían a lo que me enfrentaría y me dejaron esas herramientas. También les dedico esta tesis. A Leo y Robert, los cuales a través de su amistad han estado presentes, con preocupación genuina e interés en mi propia superación. De adolescentes éramos jóvenes con sueños, ahora los estamos alcanzando. Por último, a Dios mi señor. Cada respiro, cada latido empleado en esta tesis, fue por su colaboración. Gracias por colaborarme, seguiré creciendo profesionalmente, de antemano gracias por el apoyo futuro. iii Reconocimientos Varias personas colaboraron con el desarrollo de esta Tesis. Empiezo por mis lectores Roberto López, Alfonso Villalobos y mi directora Ana María Jurado. Comprendo los sacrificios que implica apoyar trabajos de este tipo. Gracias por su atención. En el caso de Ana María, años atrás siempre me apoyo con libros para fotocopiar, con tiempo para mis preguntas académicas en su oficina, con asistencias para seguir aprendiendo en sus cursos. Reconozco su entrega desde un inicio. A María Elena Murillo, cuyo esfuerzo y dedicación fue vital en el proyecto. Cuesta encontrar personas tan comprometidas sin pedir nada a cambio. Sin su colaboración de no hubiese sido posible contar con población clínica. A todas las personas participantes de la investigación, de Correos de Costa Rica, de la Clínica Integrada de Tibás, de los Parques de San José, estudiantes de Psicología y demás. Siendo imposible nombrarlos a todos, se les reconoce el avance de esta tesis a su disposición en la participación. iv RESUMEN A través de este Trabajo final de Graduación se planteó el objetivo de realizar una adaptación de la Segunda versión del Inventario de Depresión de Beck en el Gran Área Metropolitana de Costa Rica. Para el mismo se contó con la participación de una muestra de población general de 618 personas y de 79 de población clínica con Sintomatología Depresiva. Los resultados indican un alpha de Crombach para la población General de .908 y uno de .885 para la población clínica. La prueba Test Retest a 15 días revela un coeficiente de correlación Pearson de .95entre una aplicación y la otra. Con respecto a las evidencias de Validez, los análisis factoriales, tanto exploratorios como confirmatorios revelan la presencia de 2 factores uno cognitivo-afectivo y otro conductualfisiológico. Análisis de correlaciones de Pearson sugieren correlaciones positivas entre el BDI-II con el Multiscore Depression Inventory(.828 en población general y .675 en población clínica) y la escala de Afecto Negativo del PANAS (.690 en población general y .877 en población clínica) con significancia estadística a dos colas. Mientras que con la escala de Afecto Positivo existe discrepancia ya que correlacionan de forma negativa con un coeficiente de correlación de Pearson de -.278 en población general -.813en población clínica a una significancia estadística de dos colas. El promedio de puntuaciones de la población general fue de 9.52, mientras que en población clínica de 33.00, siendo esta diferencia estadísticamente significativa. Al final se muestra la propuesta adecuada para Costa Rica de puntos de corte del BDI-II. Como conclusiones se confirma la adaptación del BDI-II con buenos indicadores de validez y fiabilidad, siendo recomendable su uso en el contexto nacional. Es necesario por ende, someter el instrumento a estudios de validez a futuro. v Índice deContenidos RESUMEN_____________________________________________________________________ v Índice de Tablas ________________________________________________________________ viii Índice de Figuras ________________________________________________________________ix Índice de Anexos ________________________________________________________________ix INTRODUCCION _________________________________________________________________ 2 MARCO DE REFERENCIA __________________________________________________________ 10 Antecedentes ________________________________________________________________ 10 Antecedentes Nacionales _____________________________________________________ 10 Antecedentes Internacionales _________________________________________________ 13 MARCO CONCEPTUAL ________________________________________________________ 18 El constructo teórico de Depresión _______________________________________________ 18 Evolución histórica del concepto _______________________________________________ 18 Sistemas de Clasificación actuales ______________________________________________ 21 Factores causales de la depresión _______________________________________________ 22 Pruebas Psicométricas _________________________________________________________ 31 Fiabilidad _________________________________________________________________ 32 Validez ___________________________________________________________________ 37 Teorías de Construcción y Validación de Pruebas __________________________________ 43 Pruebas Psicométricas que miden Depresión ________________________________________ 48 Escala para la Evaluación de la Depresión de Hamilton (Ham-D) ______________________ 48 Escala Autoaplicada para la Depresión de Zung (Zung SDS) __________________________ 48 Subescala de Depresión del Cuestionario de 90 Síntomas (SCL-90) ____________________ 49 Subescala de Depresión del Inventario Multifásico de la Personalidad de Minnesota (MMPI-D) _________________________________________________________________________ 49 Multiscore Depression Inventory de David Bernt(MDI)______________________________ 49 Inventario de Depresión de Beck _______________________________________________ 50 PLANTEAMIENTO DEL PROBLEMA DE INVESTIGACION __________________________________ 55 Problema de Investigación ______________________________________________________ 55 Objetivos ___________________________________________________________________ 55 Hipótesis____________________________________________________________________ 56 METODOLOGÍA_________________________________________________________________ 58 vi Tipo de estudio. ______________________________________________________________ 58 Diseño de investigación. _______________________________________________________ 58 Sujetos de investigación ______________________________________________________ 59 Instrumentos y técnicas ________________________________________________________ 61 Procedimientos _______________________________________________________________ 62 Etapa 1: Adaptación del instrumento ____________________________________________ 62 Etapa 2: Pruebas con el instrumento ____________________________________________ 65 Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento ______________ 68 Etapa 4: Promoción del Instrumento Adaptado ____________________________________ 71 Análisis de los datos ___________________________________________________________ 72 Protección a los sujetos ________________________________________________________ 72 RESULTADOS __________________________________________________________________ 74 Etapa 1: Adaptación del instrumento ______________________________________________ 74 Etapa 2: Pruebas con el Instrumento ______________________________________________ 77 Fase de pruebas piloto. _______________________________________________________ 77 Fase de pruebas de campo ____________________________________________________ 78 Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento ________________ 85 Evidencias de Fiabilidad _____________________________________________________ 85 Evidencias de Validez _______________________________________________________ 86 CONCLUSIONES _______________________________________________________________ 105 Conclusiones _______________________________________________________________ 105 Limitaciones ________________________________________________________________ 110 Recomendaciones ___________________________________________________________ 112 REFERENCIAS _________________________________________________________________ 115 ANEXOS ____________________________________________________________________ 128 vii Índice de Tablas Tabla 1: Diferencias entre la Teoría Clásica y la Teoría de Respuesta al Ítem _______________________ 47 Tabla 2: Distribución sociodemográfica de participantes Entrevista Cognitiva ______________________ 64 Tabla 3: Aportes de Participantes de Entrevista Cognitiva con respecto al Instrumento _______________ 75 Tabla 4: Diferencias de Medias por variable Sexo Población General _____________________________ 78 Tabla 5: Pruebas T y Levene de medias para variable sexo. Población General _____________________ 78 Tabla 6: Diferencias de medias por rangos de Edad Población General ____________________________ 79 Tabla 7: Diferencias de medias por Provincia del GAM _________________________________________ 79 Tabla 8: Diferencias de medias por Variable Nivel Educativo ____________________________________ 80 Tabla 9: Diferencias de Medias por variable Sexo Muestra de cuestionarios On line __________________ 80 Tabla 10 Pruebas T y Levene de Medias para variable Sexo. Muestra de cuestionarios On line _________ 81 Tabla 11: Diferencias de medias por rangos de Edad Muestra de cuestionarios On line _______________ 81 Tabla 12 Diferencias de medias por Variable Nivel Educativo Cuestionarios On line _________________ 82 Tabla 13: Media Puntuación BDI población Clínica ____________________________________________ 82 Tabla 14: Diferencias de Medias por variable Sexo Población General ____________________________ 83 Tabla 15 Pruebas T y Levene de medias para variable sexo. Población Clínica______________________ 83 Tabla 16: Diferencias de medias por rangos de Edad Población Clínica____________________________ 83 Tabla 17: Diferencias de medias por Variable Nivel Educativo ___________________________________ 84 Tabla 18: Estadísticos de Fiabilidad Test Retest _______________________________________________ 85 Tabla 19: Alpha de Crombach en las distintas muestras _________________________________________ 85 Tabla 20: Promedio de Puntuaciones dadas por los jueces expertos a cada ítem _____________________ 86 Tabla 21: KMO y Test de Esfericidad Bartlett Población General _________________________________ 87 Tabla 22: Total de la Varianza Explicada por valores Eigenvalue _________________________________ 88 Tabla 23: Matriz Estructural _______________________________________________________________ 89 Tabla 24: Matriz de configuración __________________________________________________________ 89 Tabla 25: Matriz de correlaciones de componentes _____________________________________________ 89 Tabla 26: KMO y Test de Esfericidad Bartlett Población Clínica __________________________________ 90 Tabla 27: Total de la Varianza Explicada por valores Eigenvalue _________________________________ 90 Tabla 28 Matriz de Configuración __________________________________________________________ 91 Tabla 29: Matriz Estructural _______________________________________________________________ 92 Tabla 30: Matriz de correlaciones de componentes _____________________________________________ 92 Tabla 31: Pesos de Regresión por factores ___________________________________________________ 94 Tabla 32: Pesos de Regresión estandarizados _________________________________________________ 95 Tabla 33: Covarianzas entre Factores _______________________________________________________ 95 Tabla 34: Correlaciones entre Factores ______________________________________________________ 95 Tabla 35: Pesos de Regresión por factores ___________________________________________________ 96 Tabla 36: Pesos de Regresión estandarizados _________________________________________________ 97 Tabla 37: Covarianzas entre Factores _______________________________________________________ 97 Tabla 38: Correlaciones entre Factores ______________________________________________________ 97 Tabla 39: Correlaciones entre BDI-II, MDI y PANAS Población General ___________________________ 98 Tabla 40: Correlaciones entre BDI-II, MDI y PANAS Población Clínica ___________________________ 99 Tabla 41: Medias y desviaciones estándares de las puntuaciones del BDI-II por muestra _____________ 100 Tabla 42: Prueba T para muestras independientes medias por muestra ____________________________ 100 Tabla 43: Área bajo la curva _____________________________________________________________ 101 Tabla 44: Porcentajes de Sensibilidad, especificidad para la detección de Depresión Mayor para cada punto de corte del BDI-II ______________________________________________________________________ 102 viii Tabla 45: Propuesta de Puntos de Corte para Costa Rica ______________________________________ 103 Índice de Figuras Figura 1: Catecolaminas y su posible influencia en la Depresión _________________________________ 25 Figura 2: Comprensión de Ítems, Pruebas Piloto ______________________________________________ 77 Figura 3: Dificultades en Lectoescritura Pruebas Piloto ________________________________________ 77 Figura 4: Gráfico de Sedimentación _________________________________________________________ 88 Figura 5: Curva COR ___________________________________________________________________ 101 Índice de Anexos Anexo 1: Lineamientos para la Adaptación de Pruebas según la International Comission Test (ICT) ____ Anexo 2: Antecedentes Psicométricos en TFG en la Universidad de Costa Rica _____________________ Anexo 3: Evidencias de Fiabilidad _________________________________________________________ Anexo 4: Consentimiento informado ________________________________________________________ Anexo 5: Plantilla de Observación Pruebas Piloto con la Prueba ________________________________ Anexo 6: Versión de Traductor Oficial ______________________________________________________ Anexo 7: Traducción del Investigador del Proyecto ___________________________________________ Anexo 8: Unificación de Traducciones ______________________________________________________ Anexo 9: Primer borrador resultante de la primera fase: Traducción del Instrumento ________________ Anexo 10: Guía de Entrevista Cognitiva _____________________________________________________ Anexo 11: Versión final Adaptación Inventario de Depresión de Beck II ___________________________ Anexo 12: Escala MDI___________________________________________________________________ Anexo 13: ESCALA DE AFECTO POSITIVO Y NEGATIVO PANAS ______________________________ Anexo 14: Plantilla de Observación Transcrita Pruebas Piloto con la Prueba ______________________ Anexo 15: Revisión Interjueces Validez de Contenido __________________________________________ 129 130 136 139 141 143 145 148 150 152 157 159 161 162 163 ix x Introducción ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA INTRODUCCION Tener conocimiento de la medición, estadísticas y métodos de investigación psicológica y la comprensión de las fortalezas y limitaciones particulares de diferentes escalas es necesario porque las pruebas son solo herramientas que pueden ayudar a los clínicos con las formulaciones de casos y recomendaciones de tratamiento. El valor de la herramienta no se puede separar de la sofisticación del clínico que realiza inferencias sobre ella. Gregory Meyer Lubinski y Dawis (1995) señalaron que “el examen psicológico se erige como el invento más importante que la Ciencia Psicológica ha legado a la sociedad” (p. 21). Sin afán de reducir los innumerables aportes que la Psicología ha realizado al mundo contemporáneo en sus muy variados campos a solamente los test Psicológicos como lo proponen estos dos autores, si es necesario comprender con claridad que si existe algo que es propio de la Psicología como disciplina es la Psicometría. En apoyo con Martínez, Hernández y Hernández (2006), el poder predictivo de la psicometría radica en que existe una cadena de inferencias que dependen tanto de modelos estadísticos y probabilísticos, de modelos avanzados de matemáticas no lineales, como también de sólidas bases teóricas en las cuales se debe sustentar la prueba. Es a partir de estos enlaces que se relacionan propiedades psicométricas de garantía científica como la fiabilidad, la validez y la comparabilidad (Martínez, Hernández y Hernández, 2006).La Psicometría se nutre de otras ciencias, pero siempre al servicio de la Psicología. Si bien, para toda disciplina es necesario enfatizar en aquello que le es propio y le distingue del resto de profesiones, también se requiere conocer a profundidad que es lo que se utiliza y hacerlo con cuidado. Existe un fuerte vínculo entre la evaluación diagnóstica que aportan las pruebas y el tratamiento al que remiten. Si bien es cierto que, tal como lo reconoce 2 Gregory Meyer en el epígrafe, los test deben utilizarse únicamente como instrumentos de ayuda y no deben sobreponerse al criterio del profesional en psicología, sino que deben interpretarse en función de una adecuada triangulación de técnicas, para Fernández Ballesteros (2004), aun así poseen especial peso e importancia diagnóstica los cuales, inciden en la decisión del tipo e intensidad de tratamiento que se requiere. Los resultados de los test suelen tener con frecuencia impacto en la vida de las personas a quienes se les aplica (Martínez, Hernández y Hernández, 2006). Estudiar las propiedades psicométricas de algún test que se pretende utilizar es de vital importancia, ya que de su interpretación se deriva la toma de decisiones sobre el diagnóstico, la planificación del tratamiento y las intervenciones clínicas (Dumenci y Achembach, 2008) Por lo desarrollado en las anteriores líneas es clara entonces la necesidad de que la Psicología apoye mucho de su quehacer con el aporte Psicométrico pero, ¿qué sucede cuando se utiliza una prueba psicológica con características culturales diferentes al contexto para el que se diseñó?, Distintas posiciones tratan de responder a ello, por ejemplo para Geissenger (1994) es esperable que se produzca cierta discrepancia entre las condiciones propias de la realidad a la que pertenece quien está siendo evaluado y aquellas propias de la población con la cual se construyeron los baremos originales (Geissenger, 1994). Desde la posición de la Estadística, esto puede llevar a dos errores básicos de interpretación (Sidney y Castellan, 2012). El primer error (Tipo I o riesgo α) seria incluir la sintomatología de un individuo dentro de los criterios de trastornos y por tanto asignarle una categoría patologizante cuando realmente no la presenta. El segundo (Tipo II o riesgo β) es asumir una puntuación como “normal” cuando en realidad el sujeto presenta aspectos disfuncionales que le ameritan apoyo psicológico. En ambos casos se juega con el bienestar emocional de la persona a evaluar. Para Fernández-Ballesteros y Calero (2004) la mayor parte de los problemas derivados del uso de los test se presentan al utilizar inadecuadamente pruebas traducidas de otros contextos lingüísticos y culturales. (Fernández-Ballesteros y Calero 2004). 3 La American Psychological Association (en adelante APA) también se proclama sobre el uso inadecuado de los testa través de los Standards for Educational and Psychological Test (APA, 1999; citados por Martínez, Hernández y Hernández, 2006), en cuanto puede causar considerables perjuicios a quienes se les aplican, afectando las decisiones que se toman a partir de sus resultados. En resumen, al recoger el consenso académico de diferentes posicionamientos en cuanto a los alcances e implicaciones que pueda traer el utilizar pruebas descontextualizadas se remiten principalmente, dos consecuencias. Primero, el hecho de poner en juego el bienestar emocional de las personas con determinaciones basadas en parámetros psicométricos extranjeros a las necesidades nacionales. Segundo, pérdidas de validez profesional debido a la fundamentación para los diagnósticos en criterios inconvenientes, llegando inclusive al desprestigio del poder predictivo, terapéutico y preventivo que posee la psicología en general ante el resto de la comunidad científica. Tomando en cuenta que la mayoría de las pruebas en nuestro país provienen de otras latitudes, y basándonos en los argumentos anteriores sobre el peligro connatural acerca del uso de pruebas de otros contextos, es donde el principio de hacer uso de lo propio, como la Psicometría para la Psicología, se desarma en su propia inconsistencia. No obstante, existen dos caminos posibles para evitar una innecesaria y lastimosa deserción de la Psicometría en las filas de la Psicología. Dichas alternativas son en primer lugar el diseño y construcción de Pruebas nacionales, ajustadas a las necesidades locales; o bien, la Adaptación y Estandarización de Instrumentos extranjeros a las características propias. Ambas tienen sus ventajas y desventajas, existiendo seguidores que defienden una u otra, dificultando un consenso sobre cual es mejor, decisión que se debe basar más bien en las características de ambas y las posibilidades de implementar alguna u otra. En el caso de la primera para Fernández, Pérez, Alderete, Richaud y Liporace (2010) si bien es cierto es la más deseable, posee como requisito básico un desarrollo teórico sólido que catapulte la construcción del test, es decir que el test debe partir de una teoría local construida con anterioridad. Dicha condición es una carencia de los contextos latinoamericanos. La segunda alternativa trasciende a la primera debido a menores costes 4 en su implementación pues se toma una teoría y un instrumento ya sólidamente establecido, no obstante sus desventajas radican en el peligro de que la misma se dé sin un riguroso proceso de investigación que asegure la equivalencia de constructos y una correcta adaptación de la escala para evitar fuentes de sesgos (Fernández, Pérez, Alderete, Richaud y Liporace, 2010) Al no existir aun en nuestro país un andamiaje sólido teórico del cual basarse, es más oportuna de momento la segunda posibilidad. Al respecto la International Test Comission (en adelante ITC) considerando dicha necesidad en acuerdo con la American Educational Research, la APA y la National Council on Measurement in Education; formulan lineamientos para la adaptación de pruebas psicológicas agrupados en 4 áreas: Contexto, Desarrollo o adaptación de instrumentos, Administración e Interpretación (Ver Anexo 1) Es pertinente realizar más adaptaciones y estandarizaciones de pruebas psicológicas en el ámbito nacional bajo amparos metodológicos apropiados en el sector clínico, educativo, laboral, neuropsicológico, salud y forense. Para ello, se debe tener en cuenta los criterios con los que se construye la prueba, respecto a garantías científicas adecuadas que legitimen su validez y fiabilidad. (ITC, 2000; Fernández Ballesteros & Calero, 2004). Si bien es cierto, el diseño, construcción y validación de pruebas psicométricas posee premura en todas las áreas mencionadas, a nivel clínico el área de la Depresión posee especial interés. Como trastorno afectivo, es un constructo psicológico que presenta dentro de sus principales características la particularidad de poseer una alta prevalencia e incidencia a nivel nacional. Según señala el periódico La Nación, solo en atención de la depresión, para el 2006 en Costa Rica se dieron 33.823 incapacidades, mientras que para el 2010 la cifra ascendió a 47.020. Este último dato significó 580.160 días no laborados. Además, en el 2007 hubo 35.071 personas que necesitaron una licencia médica por presencia de síntomas propios del trastorno de depresión, y al llegar al 2008, la cifra aumentó a 45.426. (2011, Mayo, 29) Además, no solamente es un trastorno común sino que, debido a que sus implicaciones limitan al sujeto desde el plano afectivo hasta el conductual, fisiológico, cognitivo e incluso el interpersonal; suele presentar criterios elevados de frecuencia, intensidad y duración, 5 variables que acentúan su nivel de complejidad y apremio clínico. De acuerdo con la OMS (En Solís, 2009) para el año 2020 se habrá posicionado como la segunda causa de discapacidad, solamente superada por las enfermedades cardiovasculares. A nivel mundial se estima que la depresión afecta aproximadamente a 340 millones de personas en el mundo (Solís, 2009). Vázquez, Nieto, Hernangómez y Hervás (2005) comentan que aproximadamente 6,5% de la población presenta un trastorno depresivo mayor y un 3,3% presenta un cuadro de distimia. En promedio, la duración de los episodios se estima de unos 4 a 5 meses, aunque para un10 a un 20% de los pacientes la duración es de más de dos años (Vázquez, Nieto, Hernangómez y Hervás, 2005). En Europa los índices oscilan en un 3,9 por ciento para los trastornos del espectro depresivo, (Güemes, Guillen y Ballesteros, 2008). La APA (2005) estima que el índice de mortalidad para este trastorno es alto, los sujetos con trastorno depresivo mayor que mueren por suicidio llegan al 15%. También presenta una gran comorbilidad con otro tipo de trastornos (trastornos relacionados con consumo de sustancias, trastorno de angustia, trastorno obsesivo-compulsivo, anorexia nerviosa, bulimia nerviosa, trastorno límite de la personalidad), estimándose también que a lo largo de la vida el riesgo de sufrir este tipo de trastorno es de un 12,7% para los hombres y de un 21,3% para las mujeres (APA, 2005). Según la Caja Costarricense de Seguro Social (2005), se considera que en Costa Rica 254000 hombres y 426000 mujeres podrían padecer de este trastorno a lo largo de su vida. Dados los indicadores que en términos epidemiológicos presenta el trastorno de la depresión, tanto en nuestro país como a nivel mundial, y tomando en cuenta al mismo tiempo las necesidades por las que a nivel nacional se atraviesa en el aspecto de la psicometría en general, es notoria la trascendencia de contextualizar una prueba que mida el constructo de depresión. Estas razones fundamentan la decisión de realizar una adaptación de la segunda versión del Inventario de Depresión de Beck (BDI-II), como instrumento de ayuda en el diagnóstico clínico de la depresión. 6 El BDI-II es un cuestionario autoaplicado de 21 ítems, obteniendo la sumatoria total de estos se reflejaría el grado de severidad de depresión en el sujeto. La prueba ha gozado de gran aceptación, constituyéndose en el cuestionario de ayuda en la evaluación diagnóstica acerca del Trastorno de Depresión Mayor más utilizado en el ámbito internacional (Sanz, Perdigón y Vázquez, 2003) El BDI-II ha sido utilizado en múltiples contextos tanto con aplicaciones propiamente clínicas (Pérez y Muñoz, 2004), como en la investigación en estudios sobre consumo de drogas (Pedrero y López, 2005; Seignourel, Green y Schmitz, 2007), estudios neurocientíficos (Dunn, Kimbrell, Ketter, Frye, Willis, Luckenbaugh y Post, 2002; Rowland, Lam y Leahy, 2005), trastornos del sueño (Carney, Ulmer, Edinger, Krystal y Knauss, 2009), en el área de la salud en general (Poole, Bramwell y Murphy, 2009; Takai, Takahashi, Iwamitsu, Ando, Okazaki, Nakajima, Oishi y Miyaoka, 2009; Viljoen, Iverson, Griffits y Woodward, 2003; Arvand, Shafiabadi, Falsafinejad, Zali, 2012; Salli, Yilmaz, Ugurlu; 2012; Kizilcik, Sayiner, Unsal, Ayranci, Kosgeroglu, Tozun, 2012), así como en distintas poblaciones (Joe, Woolley, Brown, Ghahramanlou y Beck, 2008; Palmer y Binks, 2008). Los estudios en adolescentes también han gozado de atención (Wilson y Blumentritt, 2007; Osman, Barios, Kooper, Gutiérrez y Bagge, 2004; Osman, Barrios, Gutiérrez, Williams y Bailey, 2008, Byrne, Tewart y Lee, 2004). El inventario también ha sido utilizado en estudios sobre psicología clínica basada en la evidencia, como instrumento de medición comparativo en cuanto a la eficacia de distintos tratamientos terapéuticos en el abordaje de la depresión (Pérez y García, 2010). En cuanto a sus garantías psicométricas, numerosas investigaciones respaldan sus altos indicadores de validez y fiabilidad (Sprinkle, Lurie, Insko, Atkinson, Jones, Logan, Bissada, 2002; Arnarson, Olason, Smari y Sigurðsson, 2008; Alansari, 2006;), obteniendo resultados similares a los conseguidos en su estudio inicial llevado a cabo por Beck, Steer y Brown en 1996. Más adelante al final del marco conceptual se expone mayor información acerca de los indicadores psicométricos del BDI-II. 7 El alcance que pueda tener este estudio se detalla en dos aspectos: beneficios tanto directos como indirectos. En cuanto a los directos, el uso de la prueba adaptada permitiría mayor precisión diagnóstica, posibilitando un abordaje terapéutico apropiado a las necesidades específicas del paciente, reduciendo el coste de recursos innecesarios en la terapia. A su vez permite que el paciente posea claridad en cuanto al grado de severidad de depresión que presenta y el avance que experimenta a lo largo de la terapia. Con respecto a los beneficios indirectos, el presente estudio brinda un aporte metodológico importante, al documentarse por escrito la adaptación misma. Una de sus principales ventajas es que permitió tomar en cuenta la opinión, no solo de los investigadores que construyeron la prueba, sino la retroalimentación de la población de nuestro país para su elaboración. Por otro lado puede brindar aportes a posibles investigaciones que surjan a futuro referentes a la depresión, ya sea como antecedente, como insumo o con el aporte de conclusiones sugerentes. 8 Marco Referencia de ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA MARCO DE REFERENCIA Antecedentes A continuación se exponen los principales antecedentes encontrados, tanto a nivel nacional como internacional con relevancia para el estudio. Antecedentes Nacionales La psicometría en Costa Rica En 1978 Brenes, Espinosa, Bejarano y Riba llevaron a cabo una investigación en la cual pretendían determinar las pruebas más utilizadas en la época, así como las instituciones, pronósticos y condiciones en que se utilizaban. Se utilizó un cuestionario que incluía los siguientes rubros: nombre y tipo de la prueba, modelo psicológico en el que se basa, modelo de medición, quien la construyó, estudios de validación, muestra normativa original, quien la importó, fecha y el objetivo de haberla importado, estudios de validación, confiabilidad o estandarización realizados en nuestro país. Dentro de los resultados se obtuvo principalmente que los tres grandes solicitantes de servicios psicométricos parecían ser los centros de salud, los departamentos de personal de instituciones gubernamentales y privadas y los centros educacionales, que eran más las pruebas para adultos que las dedicadas a los niños, y que de las 85 pruebas que habían sido importadas solo seis se habían validado localmente. Los autores propusieron a manera de discusión la incorporación de más profesionales en esta área, en vistas de la necesidad por construir, adaptar y estandarizar pruebas psicológicas en el ámbito nacional, ante la importación de las mismas. Si bien hoy día en nuestro país se cuenta con mayores trabajos relacionados con el ámbito de la psicometría que en 1978, estos no son suficientes para cubrir las necesidades reales de la población. 10 Actualmente es notable como a pesar del auge que tiene en el mercado internacional el diseño de distintas pruebas psicométricas, en nuestro país es un área que se encuentra con un estado de cierto abandono, tanto en la construcción como en la adaptación y estandarización. Fenómeno observado en el resto de Latinoamérica, según Prieto, Muñiz, Almeida y Bartram (1999) el uso que se le da a los test psicológicos como instrumento de ayuda para el diagnóstico psicológico adolece de conocimiento adecuado, incidiendo en que las pruebas que se utilicen sean de procedencia extranjera, con condiciones distintas a las del contexto en que se utilizan. A nivel nacional, Chávez y Meléndez (2005) mencionan que la mayoría de adaptaciones y estandarizaciones de pruebas psicométricas han estado a cargo de estudiantes de psicología de la Universidad de Costa Rica, como parte de sus trabajos finales de graduación (TFG). Aguiar (2009) profundiza al señalar que del total de los mismos TFG en los últimos 15 años (anteriores al 2009), solo en 19 de más de 360 investigaciones se trabaja directamente con la temática (ya sea construcción, adaptación o estandarización). Los principales precursores a nivel nacional de este tipo de proyectos de graduación en el ámbito psicométrico son la Escuela de Psicología en conjunto con el Instituto de Investigaciones Psicológicas, ambos de la Universidad de Costa Rica (para un resumen de los mismos, ver Anexo 2). De estos trabajos, doce se refieren a adaptaciones, mientras que quince se dirigieron no solo a la adaptación sino a la estandarización. Además del total, diez tienen que ver con el área clínica (ocho son adaptaciones y dos son estandarizaciones) mientras que en el sector laboral son otras diez pruebas, pero predominan las estandarizaciones (siete) frente a las adaptaciones (tres). En el área educativa, solamente se cuentan cuatro estudios, y todos se tratan de estandarizaciones. Después del estudio de Brenes, Espinosa, Bejarano y Riba (1978) no se encontraron más investigaciones al respecto, lo cual pone al descubierto el vacío que existe en nuestro país en este respecto. A pesar de la falta de investigaciones a gran escala como la realizada por Brenes et al (1978) el uso de las pruebas no disminuyó, sino que ha aumentado significativamente. 11 Por tanto se torna de importancia tres aspectos significativos relacionados entre sí: en primer lugar el desarrollo de investigaciones vinculadas a la validación, la adaptación y la estandarización de pruebas psicológicas; en segundo término el entrenamiento en su uso por parte de los profesionales usuarios de estas, de forma que se garantice con esto un uso y selección apropiados en función de criterios de validez y confiabilidad aceptables. Por último la realización y actualización constante de un catálogo adecuado a nivel nacional acerca de las pruebas disponibles, así como su uso, pertinencia y criterios psicométricos con el fin de que se garantice un uso profesional de este recurso. Investigaciones Psicométricas relacionadas con la Depresión Mayor en Costa Rica Dentro del acervo de investigaciones efectuadas, sobresale el estudio de Grettel Lutz en 1992 referida a la adaptación del Inventario de Depresión Infantil de Kovacs (CDI), mostrando como consistencia interna un coeficiente alfa de Crombach de 0.85, cálculo que incluye los 27 ítems del inventario (Lutz, 1992). Fedra Solís en el año 2009 se propone aportar datos que confirmen la validez, confiabilidad y distribución de puntuaciones normalizadas del CDI mediante un re análisis en una muestra de niños costarricenses con características homologas a la población inicial (Solís, 2009). Reyes y Quirós (1993) realizan un estudio cuyo objetivo consistía en la obtención de un perfil del paciente deprimido encontrando un contexto interpretativo para la escala D del Mini Mult (Reyes y Quirós, 1993). El Minimult fue adaptado por Gonzalo Adís Castro y Mario Araya Quesada en el año 1978. En adultos, se cuenta únicamente con una escala mono rasgo de depresión adaptada, el Multiscore Depression Inventory de David Bernt. Esta fue adaptada por Lisímico Valerio en 1997. La escala original mide intensidad de la depresión, en dos versiones una de 118 ítems y una reducida de 47. Las preguntas se responden en función de Falso/Verdadero. La población mínima es de 13 años en adelante (Bernt, 1990). Para la adaptación, se trabajó con la versión reducida de 47 ítems, con una muestra clínica de 46 pacientes del Hospital Calderón Guardia, mientras que la población general contó con 238 sujetos, de estos 35 eran estudiantes de Décimo del Liceo Carlos Pascua en San Rafael de Heredia; 138 12 estudiantes de Química General, Física I y Física II de la Universidad de Costa Rica y 65 fueron educadores (Valerio, 1997). No obstante, en los resultados de la adaptación no se incluyen el alfa de Crombach, ni tampoco los concernientes a la prueba test-retest. En la prueba original el índice de consistencia interna oscila entre .96 y .97, a su vez que el test- retest arroja un coeficiente de .82. La validez convergente con el BDI – II es de r= .69 (p= .001) y con Hamilton es de r= .66 (p= 0.01) (Bernt, 1990). Con respecto al BDI (tanto en su primera y segunda versión como en la abreviada) no se cuenta aún con ningún estudio de validación para nuestro país. Ha sido utilizado en trabajos de tesis enfocados en la intervención terapéutica como en Facio (2007), donde se hacía uso del BDI-II en la fase de evaluación de la muestra para la aplicación de terapia racional emotiva en adultos mayores. (Facio, 2007). Antecedentes Internacionales El Inventario de Depresión de Beck II es uno de los instrumentos más comunes de investigación y evaluación de la depresión que se utilizan alrededor del mundo (Sanz, Perdigón y Vásquez; 2003). Por ello, muchas investigaciones han sido destinadas a la adaptación de esta escala en diferentes culturas y muchas de las investigaciones más importantes se han ocupado de la revisión psicométrica de las propiedades del instrumento. Los siguientes son algunos ejemplos del cúmulo de investigaciones realizadas en diferentes ubicaciones geográficas donde el BDI-II ha tenido influencia así como los índices de validez y fiabilidad que se han obtenido. El estudio inicial fue llevado a cabo por Beck, Steer y Brown en 1996. La investigación pretendía corroborar los datos de validez y fiabilidad y de esta manera lanzar la prueba al mercado internacional. Se contó con una muestra de 500 pacientes externos diagnosticados con depresión, de 4 institutos diferentes; y de 120 estudiantes de un curso introductorio de psicología. En este estudio se encontró como consistencia interna para la población clínica un índice de alfa de Crombach de .92 y para la de estudiantes uno de .93. La estabilidad de 1 a 2 semanas se relata con un .93. También se encuentra una correlación con su antecesor el BDI-IA de .93 (p <.001). 13 Con respecto a la validez convergente, se encuentra una correlación con la escala de Hamilton para evaluar la depresión de r= .71. Y en cuanto a la validez divergente, obtiene una correlación con la escala de Hamilton para evaluar la ansiedad de r .47 y con la escala de Ansiedad de Beck, de .60. Con respecto a otras pruebas, se encontraron correlaciones con las siguientes: Escala de desesperanza de Beck .68; Escala de Ideación de Suicidio .37. En cuanto a la validez factorial, se encuentran dos dimensiones, una cognitivo afectiva y otra somática, para ambas poblaciones. En Islandia, según Arnarson, Olason, Smari & Sigurðsson (2008), el promedio de puntuaciones del BDI- II para la población estudiantil universitaria (n= 1206) alcanza una media de 8.80 y para la población clínica (n= 248), 21.25; la consistencia interna un índice de α de Crombach de .91 para estudiantes y uno de .93 para la muestra clínica; los resultados del test-retest de 1 a 2 semanas consiguen un coeficiente de .89; la validez concurrente y divergente para las siguientes pruebas BAI (Beck Anxiety Inventory), HADS-a,( Hospital Anxiety and Depression Scale), HADS-D (Hospital Anxiety and Depression Scale), PSWQ (PennState Worry Questionnaire) y CES-D (Center for Epidemiological Studies Depression Scale) obtiene las siguientes coeficientes de correlaciones Pearson respectivamente .60, .61, .65, .71 y .81. En Turquía, Kapci, Uslu, Turkcapar y Karaoglan (2008), relatan los siguientes resultados: Los coeficientes α de Crombach para los grupos clínicos y no clínicos fueron .89 y .90 respectivamente. Con respecto al test-retest, se obtiene una correlación de r=.94. La validez convergente fue evaluada por su correlación con el BSI-Depression Subscale en el grupo no clínico y se encontró que fue de .82. Los análisis de validez discriminante demostraron correlación con el HS (r=.63), BAI (r=.65) y BSI Hostility subscale (r = .63) todas estadísticamente significativas (p < .001). En Irán, con la adaptación al idioma persa, Ghassemzadeh, Mojtabai, Karamghadiri y Ebrahimkhani (2005) encontraron los siguientes resultados (n= 125): la consistencia interna alcanzada fue α= .87; la fiabilidad test-retest obtuvo un coeficiente de correlación de Pearson de .73. Y se obtuvo una validez concurrente de .77 con la versión Persa del ATQ (Automatic Thought Questionnaire). La versión para China fue estudiada por Chang (2005). La investigación se realizó con 1154 estudiantes universitarios chinos. Se pretendió realizar un análisis factorial de las 14 dimensiones del BDI –II y producir 2 factores representados por el cognitivo-afectivo y el somático. Se determina una fiabilidad con un coeficiente alpha de Crombach de .86. A nivel Latinoamericano, en Argentina se llevó a cabo el trabajo de adaptación por parte de Brenlla y Rodríguez en el año 2004. Para la misma colaboraron 472 personas de población general y otra de estudiantes universitarios compuesta por 248 personas. Para la población clínica, se utilizaron 325 pacientes externos de institutos. Se confirmó una consistencia interna con un alfa de .88 para los pacientes y .86 para los grupos de población en general. La fiabilidad test-retest con un periodo de 7-10 días se mantuvo en un r= .90 en la población clínica y un r= .86 en la población general. En cuanto a la validez convergente, con los pacientes externos mantiene correlaciones positivas con la escala de Depresión del MMPI-II (r= .58) y con la escala de Depresión del SCL-90 (r=.63) En la validez discriminante, se encontraron correlaciones con la escala de Ansiedad del SCL-90 de .63. Con respecto a la población general, se encontraron las siguientes correlaciones: con la escala de depresión del MMPI-II .61; con el K10 (Escala de Malestar Psicológico de Kisley), .81; con el STAI (Escala de Ansiedad Rasgo para Adultos) .58. Con respecto a la validez factorial, se encontraron 2 factores en ambas muestras, en la de población general una Cognitivo-afectiva y otra Somática. En la población clínica, una Cognitiva y la otra Somato-afectiva. La versión utilizada en Costa Rica es esta versión Argentina. La otra versión del BDI-II en lengua hispana se obtuvo por medio de la adaptación de la misma llevada a cabo en España. Esta se llevó a cabo en tres poblaciones diferentes, una de población general con 470 sujetos, población universitaria con 590 estudiantes y 305 pacientes ambulatorios para la población clínica. Para cada una de esas tres poblaciones se obtuvieron los siguientes coeficientes alfa respectivamente: .87, .89, .89. (Sanz, García, Espinosa, Fortún & Vásquez, 2005; Sanz, Perdigón & Vásquez, 2003; Sanz, Navarro & Vásquez, 2003). Es importante señalar como en la mayoría de las adaptaciones de la prueba a otros contextos, se suelen obtener puntajes menores que los obtenidos inicialmente por Beck y colaboradores en su estudio inicial con respecto a los criterios de validez y fiabilidad. Esto 15 puede deberse a dos razones. Primero que al adaptar una prueba a otro contexto conlleva a que muchos factores culturales intervengan en el estudio y por tanto afecten los resultados. Aunque el BDI tiene una validez de constructo aceptable debido a que fue construido a partir de los criterios del DSM-IV (1994) estos criterios han sido generalmente investigados en la población estadounidense. Los síntomas de depresión parecen variar considerablemente de una cultura a otra (Tsai y Chentsova-Dutton, 2002) por tanto, en otras poblaciones existen variables distintas a las del DSM-IV referentes a la depresión no estudiadas, las cuales al no estar incluidas en el BDIII, afectan los resultados y la calidad discriminatoria de la prueba. No obstante, las puntuaciones obtenidas en adaptaciones internacionales aun siendo más bajas que las estadounidenses, poseen significancia estadística al obtener p < 0,05 en los casos documentados. El segundo aspecto que también influye en la tendencia a que los puntajes sean menores a los obtenidos originalmente por Beck, Steer y Brown es que la muestra en la mayoría de los casos es menor. Esto afecta indudablemente en la obtención de los datos, ya que a mayor muestra, los resultados tienden a poseer más fundamentación, confianza y estabilidad (Sidney & Castellan, 2012). Es necesario a manera de conclusión, que se realicen no solo más investigaciones sino con adecuadas garantías de validez y fiabilidad en los medios internacionales con el BDI-II. Esto por varias razones, la primera es que las expresiones comportamentales con las que un constructo se manifiesta en una población tienden a variar con el tiempo y no es adecuado sostener como válidos los datos que se hubiesen obtenido en un periodo de diez o quince años atrás. Lo segundo es que con estudios sólidos, se pueden llegar a conclusiones sólidas, las cuales prueban y se vuelven sugestivas a la legitimidad del instrumento forzando a que produzca cambios en su construcción, ya sea una versión revisada de la misma o hasta una versión más avanzada (un BDI-III por ejemplo). En este caso, las investigaciones deben continuar en el mismo ciclo una y otra vez, en concordancia con la producción de conocimiento la cual siempre es circular. 16 Marco Conceptual ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA MARCO CONCEPTUAL La presente investigación se enmarca desde una construcción teórica de dos ejes principales que respaldan su fundamentación. Como primer eje se presentará el tema de la Depresión como constructo teórico e intento explicativo de una sintomatología concreta, se presentará un repaso por postulados teóricos referentes. En segundo lugar la Teoría del diseño de pruebas psicológicas y su base en modelos estadístico-matemáticos, que le dan validez a la metodología utilizada en el estudio presente. Después de exponer un acercamiento a ambos se presentará un bosquejo general acerca del Inventario de Depresión de Beck, centro de la presente investigación. El constructo teórico de Depresión Evolución histórica del concepto La depresión (o en su defecto tristeza) es un concepto que está difundido de forma clara entre muchas culturas a través de tiempos históricos, de una forma estable y diferenciable de otros estados emocionales. De forma escrita, tal vez los primeros indicios en que se “diagnostica” depresión aparecen en la Biblia, la cual entre muchos otros relatos semejantes, destacan los estados depresivos que afectaban a Saúl y a Job. La concepción pre decimonónica de la melancolía constituía un cajón de sastre de distintos padecimientos, en los cuales no solamente figuraba la presencia de sintomatología depresiva, sino también de algunos de tipo alucinatorio, paranoides y demenciales. Por esta razón, la melancolía se volvía un término muy difuso, generalizable prácticamente a un gran cumulo de trastornos afectivos sin distinción (Luque y Berrios, 2011). 18 El término melancolía aparecería por primera vez en el último tercio del siglo V A. C. en uno de los escritos más antiguos de Hipócrates (Lanczik y Beckmann, 1991). La melancolía se atribuía como un exceso de bilis negra, siguiendo a la teoría de los humores, mismos de los que dependía el comportamiento humano según la concepción de Hipócrates. De acuerdo con esta acercamiento epistemológico, el exceso de bilis provocaría la corrupción del cerebro y con ello la aparición del cuadro depresivo (Fernández, 1988). En 1586, Timothy Bright publica la primera monografía en inglés sobre la melancolía, titulada Treatise of melancholy. En los siglos siguientes se denotan varios intentos por establecer una nomenclatura adecuada de la “melancolía”, no obstante la misma corresponde a Emilio Kraepelin (1856-1926) dentro de su sistema de clasificación orientado tanto en la predicción como en la clasificación. Más adelante el término de melancolía evoluciona en la propia concepción de Kraepelin al punto que diversos autores comienzan a hablar más de depresión mental que de melancolía en sintonía con la evolución del sistema diagnóstico del autor. El siglo XIX marca un cambio en el enfoque de la melancolía. Diversas posiciones teóricas comienzan a rechazar la vaguedad del término, pretendiendo la conceptualización de uno menos genérico. Rush propone la tristimania y Esquirol sugiere la lipemanía, siendo en ambos un componente central la baja motivación y estado de ánimo bajo (Luque y Berrios, 2011). La diferencia entre manía y depresión, no surge sino hasta el final del siglo XIX. La expresión “depresión mental” fue apareciendo y ganando adeptos. Postulado desde la Fisiología, con el tiempo se abandonó el adjetivo de “mental” (Luque y Berrios, 2011). Kraepelin postuló la existencia de una entidad nosológica de la melancolía subdividiéndola en tres sub formas: 1. Melancolía simple 2. Melancolía activa 3. Melancolía atónita 19 La melancolía simple era visualizada como la forma más sencilla de melancolía. Se caracterizaba por una anhedonia en la cual el sujeto perdía motivación para su propia existencia. La melancolía activa, presentaban más bien una excitación ansiosa. Por último la melancolía atónita suponía el polo opuesto de la melancolía activa en términos de estado psicomotor, empleando el término estupor como un sinónimo. (Lanczik y Beckmann, 1991). En su obra tardía, Kraepelin propone una categoría más amplia (locura maniaco depresiva) que contenía todas las formas de depresión y de la manía. De esta forma se posiciona la depresión como un opuesto a la manía, especificando más sus síntomas. Es aquí donde la Depresión gana validez y posición científica. Ya en el siglo XX el tema interesa a diversos estudiosos como Leonhard, Chaslin, Wernicke y Kleist (Luque y Berrios, 2011). Estos teóricos se oponen a la visión de Kraepelin de agrupar todos los trastornos del estado de ánimo en una sola entidad y comienzan a proponer una separación (Luque y Berrios, 2011). Leonhard por ejemplo establece una diferenciación entre psicosis afectiva, unipolar y bipolar basándose en estudios de Wernicke que diferenciaban entre melancolía afectiva y melancolía depresiva (Lanczik y Beckmann, 1991). En 1966 Perris y Angst demuestran, de forma separada en sus estudios, hallazgos que apuntan a una distinción nosológica entre los trastornos unipolar y bipolar. Estos dos autores, plantean a modo de conclusión que en la psicosis maniaco depresiva se presentaban tres entidades independientes: dos formas unipolares (depresiva y maniaca) y una bipolar (Luque y Berrios, 2011) En resumen, el constructo teórico de la Depresión históricamente pasó de ser un concepto vago, impreciso y confundible con otras categorías como la esquizofrenia por ejemplo, atravesando un proceso de concretización dela fragmentación del término “locura maniaco depresiva” con trabajos como los de Wernicke, Kleist y Leonhardhasta culminar en la propuesta de Angst y Perris en separar la depresión unipolar del trastorno bipolar, propuesta validada desde el DSM III en 1980, utilizada aun en los actuales sistemas de clasificación diagnóstica. 20 Sistemas de Clasificación actuales Ya posicionada y legitimada la depresión en los diversos intentos de nomenclatura del siglo XX, era posible desarrollar un sistema dicotómico de diagnóstico basado tanto en la predicción como en la clasificación referenciado a síntomas. Los sistemas de clasificación actuales se basan en este sistema orientado a los síntomas, fomentando a su vez, un sistema diferenciado. La quinta edición del Manual Diagnóstico y Estadístico de los Trastornos Mentales (en adelante DSM V) y la décima versión de la Clasificación Internacional de las Enfermedades (en adelante CIE-10)utilizados actualmente, con respecto al tema de los trastornos del estado de ánimo se adhieren a la dicotomía diagnóstica (clasificación y predicción) de las psicosis endógenas tal y como la concibió Kraepelin, pero también tienen en cuenta la discusión entre Kasanin y Leonhard (los cuales enfatizaban la separación entre melancolía y manía). Con el CIE-10 y el DSM es posible conocer la tendencia hacia un sistema diferenciado. Los autores del DSM adoptaron una serie de términos nosológicos que fueron suprimidos en el sistema de Kraepelin, entre éstos figuran melancolía, ciclotimia, distimia y psicosis afectivas. (Lanczik y Beckmann, 1991). Para el DSM V, el Trastorno depresivo mayor se caracteriza por la frecuencia de uno o más episodios depresivos mayores. Los episodios nose explican mejor por la presencia de un trastorno esquizoafectivo y no están superpuestos a una esquizofrenia, un trastorno esquizofreniforme, un trastorno delirante o un trastorno psicótico no especificado. (DSM V). El trastorno depresivo mayor puede clasificarse asimismo en el trastorno depresivo mayor episodio único, caracterizado por la presencia de un único episodio depresivo mayor, y el trastorno depresivo mayor recidivante, caracterizado por la presencia de dos o más episodios depresivos mayores separados por mínimo una semana en su aparición (APA, 2013) El CIE 10, detalla un episodio depresivo cuando por lo general, se cuenta con un humor depresivo, una pérdida de la capacidad de interesarse y disfrutar de las cosas, una disminución en su vitalidad llevando a una reducción de su nivel de actividad y a un 21 cansancio exagerado, que aparece incluso tras un esfuerzo mínimo. El CIE 10 también expone las siguientes como manifestaciones de los episodios depresivos: a) la disminución de la atención y concentración b) la pérdida de la confianza en sí mismo y sentimientos de inferioridad c) las ideas de culpa y de ser inútil d) una perspectiva sombría del futuro e) los pensamientos y actos suicidas o de autoagresiones f) los trastornos del sueño g) La pérdida del apetito Según el CIE 10, la aparición de episodios repetidos de depresión conlleva a la aparición del trastorno de depresivo recurrente, que pueden resultar los rasgos de episodio depresivo leve, moderado o grave (OMS, 1992) Los actuales sistemas de clasificación posicionan a la Depresión como constructo teórico con fuerte validez empírica. A pesar de ello, las causas de la Depresión no se entienden muy bien y la misma puede aparecer bajo muy variadas circunstancias. Muchas perspectivas teóricas han contribuido a brindar un acercamiento al fenómeno. Al considerarse en conjunto se posibilita una comprensión más integral de la Depresión. Factores causales de la depresión Teorías biológicas Influencias genéticas La importancia del factor hereditario en la aparición de Trastornos del espectro depresivo se demuestra por la asociación entre el grado de consanguinidad y la probabilidad de diagnóstico. (Sarason y Sarason, 2006) 22 En una investigación de Sullivan (2002, citado por Butcher, Mineka y Hooley 2006) en una revisión de aproximadamente 21.000 gemelos monocigóticos, se encontró que si uno sufría una depresión mayor unipolar, su contraparte tiene el doble de probabilidades de sufrirla. Otro tipo de estudios es utilizando el método de adopción para investigar la influencia genética sobre los trastornos del estado de ánimo. Uno de los más importantes mencionados por Butcher, Mineka y Hooley (2006) es el de Wender et al (1986), en el cual se encontró que la depresión unipolar aparecía siete veces más entre los parientes biológicos de niños adoptados y que tenían una depresión severa, que entre los parientes biológicos de niños de control también adoptados. Esto pone en claro la existencia de cierta contribución genética para el trastorno de depresión. Factores bioquímicos Existe evidencia que niveles anormales de distintos neurotransmisores como serotonina, norepinefrina, dopamina y demás neurotransmisores aminergicos están involucrados en la fisiopatía de la Depresión (Sarason y Sarason 2006) En el trastorno depresivo mayor se ha demostrado a través de diversos ensayos clínicos una reducción significativa en el número de transportadores de Serotonina de pacientes con depresión mayor. (Van Praag, 1998) La serotonina ejerce una importante acción en el estado de ánimo, conducta, movimiento, apreciación del dolor, actividad sexual, apetito, secreciones endocrinas, funciones cardiacas y el ciclo de sueño-vigilia (Guadarrama, Escobar y Zhang., 2006). Concordando con el hecho que durante un episodio depresivo disminuya significativamente el desempeño en estas áreas. El BDI II presenta ítems donde se revisan algunos de estos parámetros. Los tres grupos de antidepresivos (inhibidores de la monoaminoxidasa IMAO, tricíclicos e inhibidores de la recaptación de serotonina ISRS), potencian la actividad sináptica de serotonina inhibiendo la recaptación del neurotransmisor o su degradación, sustentándose 23 así que el sistema serotoninérgico desempeña un papel importante en la fisiopatología de la depresión (Arango, Escobar y Pimienta., 2004) La norepinefrina por su parte, involucrada en procesos de vigilia, toma su parte en Trastornos Depresivos cuando se da una alteración de la misma. De tal manera el estrés crónico genera depresión reactiva, resultando que las reservas de norepinefrina en el Locus Coerelus tienden a disminuir, lo que conduce a mantener el estado de depresión, en el caso de individuos con depresión secundaria al estrés crónico ocurre un fenómeno fisiológico similar. (Guadarrama, Escobar y Zhang., 2006). Funcionalmente, la norepinefrina parece estar relacionada con un número de procesos psicológicos, entre ellos la estabilización del estado de ánimo, la regulación del sueño, estado de alerta y activación, y en la respuesta a estresores que pueden iniciar o exacerbar la sintomatología depresiva (Goodale, 2007) Con respecto a la Dopamina, la reducción de la actividad dopaminérgica se ha asociado con la anhedonia, menor motivación y pérdida de interés. Las vías mesocorticolímbicas de Dopamina parecen ser fuentes reguladoras fundamentales del placer y la capacidad de disfrute. El estriato ventral y el córtex prefrontal parecen ser regiones dopaminérgicas importantes relacionadas con la motivación. Una disfunción del sistema mesocorticolímbico de la Dopamina podría agravar los síntomas de anhedonia, apatía, y pérdida de interés observados en la Depresión Mayor (Goodale, 2007) Mientras que la serotonina y la noradrenalina tienen fuerte influencia en patrones de conducta y funciones cognitivas, la dopamina está involucrada en la función motriz. Las tres catecolaminas son sin duda fundamentales para un funcionamiento adecuado neurobiológico. De modo que dependiendo de la interacción en la producción y captación de las mismas se pueden dar alteraciones en el estado de ánimo. La figura 1 ilustra la interacción de los tres neurotransmisores en la fisiopatología de la depresión. 24 Figura 1: Catecolaminas y su posible influencia en la Depresión Fuente: Guadarrama, Escobar y Zhang (2006) Teorías psicológicas Teorías conductuales Durante la década de los 70´s y 80´s, en el medio del conductismo se vinculó la explicación de la depresión a partir de la idea de que esta se produce en base a la ausencia de respuestas producto de refuerzos positivos o cuando aumenta la tasa de refuerzo negativo (Sarasson y Sarasson, 2006). Según Butcher, Mineka, Hooley (2007), la base de las teorías conductistas se fundamenta en el hecho de que las personas con depresión puede que tengan una tasa muy baja de reforzamientos positivos, y una tasa muy alta de acontecimientos negativos. No obstante, según los mismos autores la teoría conductual no demuestra que la depresión esté causada por esos factores, es decir, no sugieren una explicación causal al fenómeno sino más bien correlacional. Los mismos autores aseguran que por esta y otras razones, las teorías conductuales de la depresión no han ejercido demasiada influencia. (Butcher, Mineka, Hooley, 2007). 25 Teoría de la indefensión adquirida Martin Seligman, exponente de la teoría de la indefensión adquirida, propone a partir de sus estudios en laboratorios con animales, un marco explicativo más sólido que la teoría conductista. La misma establece que cuando los animales o los humanos se enteran de su falta de control ante la aparición de situaciones aversivas, puede que aprendan que están indefensos ante dichas situaciones, lo que a su vez les deja sin motivación para intentar responder y hacerse frente de esos mismos estímulos en un futuro; dando por resultado el desarrollo de posturas de pasividad e incluso de síntomas depresivos (Seligman, 1975) Abramson, Seligman y Teasdale (1978) (Según Butcher, Mineka, Hooley, 2007) propusieron que cuando las personas enfrentan acontecimientos negativos e incontrolables y cuestionan el porqué de esa situación, estas atribuciones que las personas hacen respecto a acontecimientos incontrolables se convertirían así en un factor esencial en el origen de la depresión. De esta manera proponen tres dimensiones básicas sobre las cuales se establecen dichas atribuciones: interna/externa, global/específica y estable/inestable. (Butcher, Mineka, Hooley, 2007).No obstante, los resultados de muchas investigaciones no apoyan lo que la teoría sugiere, mientras que otros estudios si, evidenciando por tanto la inconsistencia y falta de apoyo empírico de los que adolece a la teoría. La teoría de la depresión como desesperación Debido la inconsistencia de resultados obtenidos en base en las investigaciones realizadas en el marco de la teoría de indefensión, se realizó una revisión de la misma la cual recibió como nombre Teoría de la desesperación. Esta teoría propone a la desesperación compuesta por dos factores: la percepción de falta de control sobre algún aspecto a suceder, y la certidumbre absoluta de que está por ocurrir algo malo o que no va a ocurrir algo positivo (Butcher, Mineka, Hooley, 2007). 26 La teoría cognitiva de Beck A más de 40 años de su formulación es una de las teorías acerca la depresión más importantes y tomada en cuenta por el medio científico. Surgida de un contexto el cual consideraba que los síntomas relacionados con la depresión eran principalmente los de índole emocional, Beck plantea que es la parte racional la que precede y provoca los síntomas afectivos. Es decir, son los pensamientos negativos la parte más importante y destacable de la depresión y no las bajas tasas de reforzamiento (como propone la teoría conductista). Según Beck (2002), el modelo cognitivo postula tres conceptos específicos para explicar el sustrato psicológico de la depresión: 1. La triada cognitiva, 2. Los esquemas y 3. Los errores cognitivos. La triada cognitiva consiste en la visión negativa que realiza la persona de tres realidades: acerca de si mismo, del mundo y del futuro. Para Beck (2002), los signos y síntomas del síndrome depresivo serían una consecuencia de los patrones cognitivos negativos, realizados en estas tres instancias. El paciente responde y se prepara a una situación como si la misma realmente fuese a ocurrir, debido a sus creencias de que realmente van a ocurrir. Por ejemplo si el paciente piensa erróneamente que va a ser rechazado, reaccionará con el mismo efecto negativo (tristeza, enfado). Esta anticipación sesgada por las creencias del individuo, pueden explicar según Beck (2002) los síntomas motivacionales, dependencia e incluso los síntomas físicos de la depresión. Los Esquemas se refieren a la organización estructural en el pensamiento depresivo. Se refieren a patrones cognitivos relativamente estables que constituyen la base de la regularidad y las interpretaciones que se crean en base a un determinado conjunto de situaciones. El esquema es la base que le permite a una persona enfrentarse a una circunstancia, ya que permite transformar los datos en condiciones, permitiendo localizar, diferenciar y codificar el estímulo con que se enfrenta el individuo. Según Baldós (2009) los esquemas cognitivos influyen de modo fundamental en la información que la persona atiende, preside, almacena y recupera y en las interpretaciones, valoraciones y asociaciones que hace en un momento dado. Por esta razón, Beck (2002) plantea que en los estados 27 psicopatológicos, en este caso la depresión, las conceptualizaciones que tienen los individuos acerca de determinados sucesos se distorsionan de tal modo que se ajustan esquemas inadecuados e irracionales. Estos esquemas hacen que la persona pierda gran parte de control voluntario sobre su proceso de pensamiento y por tanto se muestre incapaz de acudir a otros esquemas más adecuados. Según Beck (2000) los esquemas se agrupan en torno a un modelo de tres instancias: las creencias centrales, las creencias intermedias y los pensamientos automáticos. Las creencias centrales se refieren a los esquemas y formas de pensamientos que se encuentran muy aferrados y se consideran como ciertos. Estos determinan el modo en que la persona se posiciona en el mundo, lo interpreta y reacciona ante él. Las creencias intermedias se refieren a las reglas, actitudes y presunciones que se derivan de las creencias centrales. Los pensamientos automáticos son la manifestación (no del todo consciente) de las creencias centrales e intermedias, las cuales aparecen siempre ante un estímulo específico pero ya conocido desde antes, que predisponen al sujeto a reaccionar de esa manera. Por último se encuentran los errores cognitivos en el procesamiento de información. De manera conjunta con las creencias distorsionadas que alimentan el trío cognitivo negativo, el mismo puede mantenerse a costa de diversos errores o sesgos cognitivos de carácter negativo. Cada uno de ellos supone un procesamiento sesgado de la información (Butcher, Mineka, Hooley, 2007). Beck (2002) opina que los mismos mantienen la creencia del paciente en la validez de sus conceptos negativos, incluso a pesar de la presencia de evidencia contraria. Entre ellos seencuentran: Inferencia arbitraria. Se refiere al proceso de adelantar una determinada conclusión en ausencia de la evidencia que la apoye, o que la evidencia sea contraria a la conclusión misma. Abstracción selectiva. El hecho de centrarse en un detalle extraído fuera de su contexto, ignorando las características más relevantes de la situación, y conceptualizar toda la experiencia en base a este fragmento (el cual siempre negativo) 28 Generalización excesiva. Se refiere a elaborar una regla general en base a una conclusión específica de uno o varios hechos aislados y aplicar el concepto a situaciones inconexas. Maximización y minimización. Se refiere a la sobre importancia que se le da a un hecho negativo, como también a la denigración u olvido sobre un hecho positivo. Personalización se refiere a la tendencia para atribuirse asimismo fenómenos cuando no existe una base firme para realizar tal conexión Pensamiento absolutista, dicotómico. Se refiere a la tendencia en clasificar cada experiencia según una o dos categorías opuestas. En el caso de la depresión se seleccionan las categorías del extremo negativo. Beck (2002) De esta manera, cada factor de la teoría de Beck se encuentra enlazado uno con otro, al punto que lo que predispone la manifestación de síntomas depresivos no sería la aparición de factores aislados entre sí, sino la interrelación existente entre los esquemas, el trío cognitivo negativo, y los errores de procesamiento de información. En este sentido, Butcher, Mineka y Hooley (2007) señalan que cada uno de los componentes la teoría cognitiva actúa como un reforzador de los demás. (Butcher, Mineka y Hooley, 2007, p. 233) A pesar de que a lo largo de los años la teoría cognitiva de Beck ha ido adquiriendo cada vez mayor coherencia y elaboración, constituyéndose en una de las teoría más sólidas utilizadas como referencia por diferentes profesionales en salud mental, se ha señalado distintas limitaciones en torno al modelo cognitivo general y/o de la terapia cognitiva en particular. La siguiente lista propuesta por Rachman, 1997 (citado por Baldós, 2009) expresa los principales problemas del enfoque de Beck No se ha demostrado el papel causal de las cogniciones negativas, estas podrían ser un simple correlato o una dimensión más entre otras. No se sabe si la reducción de las cogniciones clave es el principal mecanismo crítico de acción de la terapia cognitiva. 29 Terapias no centradas en modificar las cogniciones consiguen el mismo cambio en estas que la terapia cognitiva. No todas las personas pueden acceder a las cogniciones que supuestamente mantienen sus problemas. Además, gran parte del procesamiento cognitivo no es accesible a la conciencia. No siempre es posible modificar las cogniciones de una persona. El cambio cognitivo no siempre suponen cambio emocional. El papel de las emociones es subestimado; estas influyen mucho en cómo las personas estructuran cognitivamente sus experiencias. Rachman, 1997 (citado por Baldós, 2009) A pesar de estas limitaciones, Butcher, Mineka y Hooley (2007) destacan que con respecto a la teoría propuesta por Beck, se ha realizado bastante apoyo empírico e investigativo los cuales han encontrado resultados que apoyan los aspectos causales de la teoría. 30 Pruebas Psicométricas Según Abad, Garrido, Olea y Ponsoda (2006) “La Psicometría se ocupa de los problemas de medición en Psicología, utilizando la Estadística como pilar básico para la elaboración de teorías y para el desarrollo de métodos y técnicas específicas de medición” (Abad, Garrido, Olea y Ponsoda, 2006, p. 4). Por tanto los test psicométricos, se referirían a los métodos de evaluación que se basan en la misma psicometría, con el fin de describir, explicar o predecir determinado atributo psicológico. Kumar (2009) se refiere a los mismos como “un instrumento estandarizado que consiste de una serie de preguntas (llamadas ítems) los cuales evalúan ciertos aspectos de la individualidad de la persona y describe esto en términos de resultados y categorías” (Kumar, 2009, p. 72). La misma autora menciona como los mismos se han utilizado desde mucho antes de la consolidación de la psicología como ciencia formal. Uno de los grandes impulsores de la aplicación de las pruebas psicológicas, McKeen Cattell, define, en 1890 a las técnicas psicométricas como “un procedimiento, del recorrido de muestras de comportamiento, de un sujeto para estimar un repertorio o inferir un constructo psicológico, suficientemente sistemático como para ser repetible y comparable”. (Citado por Calero y Padilla, en Fernández-Ballesteros, 2004, p. 354). Un aspecto importante relacionado con las pruebas psicológicas es que permiten medir la respuesta a un estado o rasgo que no es directamente observable, tal es el caso de la ansiedad y la depresión (Abbell, Springer y Kamata, 2009). Relacionado con esto, las pruebas psicológicas referidas al ámbito de la depresión puede ubicarse dentro de las pruebas denominadas monorrasgo, las cuales buscan “evaluar rasgos específicos que se utilizan fundamentalmente con fines clínicos o de investigación” (Calero y Padilla, p. 351). Sin embargo existen test de personalidad que contiene alguna sub escala relacionada con la depresión (por ejemplo MMPI) Para Fernández-Ballesteros y Calero, (2004), toda prueba psicológica debe contar con adecuadas garantías que respalden su uso. Estos requisitos psicométricos se refieren a la validez (que el test mida lo que pretenda medir) y fiabilidad (que brinde la seguridad de que 31 se puede confiar en los resultados). A continuación se expone en detalle un acercamiento de los mismos. Fiabilidad Dentro de la Teoría Clásica de los Test, se postula que la Fiabilidad hace referencia al buen funcionamiento de un instrumento, es decir que cuenta con garantías de que con precisión mide el constructo del que parte. Desde una aproximación más psicométrica, la puntuación obtenida de un test es resultado de una relación entre la “puntuación real” y el “error de medida”. La puntuación real sería una cantidad hipotética que se asume un sujeto debe obtener acorde a una variable de interés. El error de medida es el resultado si a la “puntuación real” le restamos la “observada”. Mientras menor sea el error de medida, más va a representar la puntuación observada a la real. De esta forma para Fernández-Ballestero y Calero (2004) un test será más fiable cuanto mayor sea la proporción de variabilidad de las puntuaciones recogidas que se deba a la variabilidad de las puntuaciones verdaderas y menor la que se deba a la de los errores (p. 128) Para Ayearst y Bagby (2010) además de actuar como un indicador de la cantidad de error en la medición, la fiabilidad también ofrece información sobre la consistencia de un procedimiento de medición; y los índices utilizados para evaluar la fiabilidad describen la consistencia en los resultados obtenidos por el uso de una medida. Es notable que la fiabilidad se pueda ver afectada por una gran cantidad de factores, como las características en las que se administra un test, del mismo sujeto examinado o de la conformación de la prueba. Por tal razón según Ayearst y Bagby (2010) hay diferentes formas en las que la fiabilidad puede estimarse, dependiendo de la fuente de error que se necesite contrastar. A grosso modo, existen tres tipos de evidencias de fiabilidad: 1. Con la homogeneidad de la prueba 2. Relacionadas con la Estabilidad de la Medida 3. Con la objetividad del registro Estas tres fuentes de evidencia serán explicadas a continuación: 32 Relacionadas con la homogeneidad de la Prueba Si todos los ítems de una prueba se supone que parten de un mismo constructo, entonces, los mismos deben estar correlacionados positivamente. En otras palabras, la prueba debe poseer una consistencia interna adecuada. Consistencia interna se refiere al grado de uniformidad y coherencia entre los ítems y el test. Altas correlaciones entre ítems sugieren que entre todos están midiendo lo mismo. Siguiendo a Ayearst y Bagby (2010), existen varias formas a su vez de calcular la consistencia interna, entre ellas: Procedimiento Dos mitades. Sugiere dividir el test en dos partes, cada una con propiedades normativas y estadísticas similares y correlacionar ambas puntuaciones de cada mitad (Fernández-Ballestero y Calero, 2004., Gregory, 2011). Una alta correlación entre las mismas indicaría una alta consistencia interna. Una consecuencia de este método es que por reducir los ítems a la mitad, también se ve reducida la fiabilidad en cada mitad. Un método conocido como la fórmula de Spearman -Brown puede ser utilizado para corregir la atenuación mediante la extrapolación del coeficiente de fiabilidad obtenido a la longitud original de la prueba (Ayearst y Bagby, 2010) Formas paralelas. Se utiliza cuando una prueba presenta dos formas diferentes en su realización. Estas formas se desarrollan de manera independiente una de la otra, no obstante cubren los mismos rasgos, contenidos y nivel de dificultad de los reactivos. La estimación de confiabilidad de este método se obtiene al aplicar ambas formas a un mismo grupo y correlacionar los promedios obtenidos en cada una (Gregory, 2011) Este método conlleva consecuencias a considerar. Al presentarse dos versiones, introduce diferencias en la muestra de reactivos de cada forma, aumentando la varianza como fuente de error. Es decir, se presenta la posibilidad de que una conlleve más dificultad que la otra. También son bastante costosas ya que duplican el costo de la investigación. Por esta razón cada vez se encuentra en mayor desuso. Coeficiente alpha. Se trata de una media ponderada de las correlaciones entre las variables (o ítems) que forman parte de la escala. Introducido por Crombach en 1951, se ha convertido en la forma más extendida de estimar la consistencia interna (Ayearst y Bagby, 2010). La literatura en general propone que un alpha de más de .70 y menos de .80 33 evidencian de aceptable a alta fiabilidad, con uno de .80 a .90 de alta a excelente y de .90 en adelante es excepcional. Es importante rescatar que la cantidad de ítems en un test puede afectar el alpha, de modo que a mayor cantidad de ítems es posible que el alpha disminuya debido a la posible variabilidad en los mismos. Si las escalas son multidimensionales, el alpha pierde poder predictivo, siendo más útil coeficientes como el theta o el omega. Para Gregory (2011) cuando una prueba tiene una adecuada consistencia interna, también presentará una tendencia a presentar estabilidad en sus puntuaciones en el método test retest, siendo por tanto el alpha de Crombach una medida útil de la fiabilidad en general. Fórmulas de Kuder-Richardson. Basado en la covarianza de los ítems, este procedimiento llega a la misma estimación que el anterior. Según Fernández-Ballestero y Calero (2004) y Gregory (2011), las fórmulas sólo son utilizables con ítems dicotómicos, lo que restringe su utilización. Para ítems con más de dos alternativas de respuesta se debe utilizar el alfa de Crombach (Ayearst y Bagby, 2010) En resumen, si se pretende demostrar que existe una asociación entre los ítems y el constructo, se justifica alguna de las medidas arriba expuestas de la consistencia interna. De ellos, el coeficiente alfa, es la más popular de las estimaciones de la fiabilidad. Relacionadas con la estabilidad de la medida Si la prioridad es la estabilidad en los resultados de los test, entonces los métodos test retest son de relevancia. Fernández-Ballestero y Calero (2004), plantean la posibilidad de que medidas hechas en momentos distintos sean iguales. Parten de la consideración de que un mismo test puede considerarse paralelo consigo mismo, siendo administrado en ocasiones separadas por un intervalo temporal, siempre que la variable objeto de medición no haya cambiado. Gregory (2011) plantea el que si una prueba es fiable, entonces la segunda puntuación de cada persona es totalmente predecible a partir de la primera. Dependiendo de las condiciones del instrumento se puede optar por algún método en específico: Correlaciones Pearson/Spearman. El coeficiente de correlación de Pearson se utiliza cuando se trata de datos continuos, mientras que el de Spearman cuando los datos son rangos clasificados en forma ordinal. La correlación indica la fuerza y la 34 dirección de una relación lineal y proporcionalidad entre cada administración del test, de modo que una correlación alta positiva es indicador de fiabilidad. Correlación intraclase. Se utiliza cuando los datos por analizar son dimensionales (acomodados por clases), no obstante se utiliza en lugar de Pearson solo si los tamaños de la muestra son pequeños. Para Mandeville (2009), el coeficiente de correlación intraclase describe la proporción de la variación total la cual es explicada por las diferencias entre los observadores e instrumentos. Cohen kappa. Según Carletta (1996) ajusta el efecto del azar en la proporción de la concordancia observada. Se utiliza cuando los datos son categóricos. Mide el acuerdo entre dos observadores en sus correspondientes clasificaciones de varios elementos en varias categorías mutuamente excluyentes. Para todas las anteriores pruebas de fiabilidad, al tratarse de correlaciones, se considera que son consideradas fiables si dicha correlación excede el .80. El sentido de las medidas test retest se explica en tanto si un instrumento pretende medir un constructo en específico, entonces debe ser capaz de evaluarlo en cualquier momento que se plantee. No obstante, en mediciones que involucran constructos psicológicos esto se complejiza, ya que el realizar una segunda medición se expone a variaciones en como el constructo o atributo en cuestión se presenta. Relacionadas con la objetividad del registro Describen la consistencia de las calificaciones a través de múltiples evaluadores. Muchos tipos de índices de confiabilidad están disponibles, y la decisión sobre cuál usar depende del tipo de datos que se recogen. Se pretende que no haya diferencias entre los datos obtenidos por diferentes evaluadores (Fernández-Ballestero y Calero, 2004). Según Gregory (2011), es necesario confirmar este tipo de evidencia cuando se trata de pruebas que dan margen para una gran cantidad de juicio por parte del examinador en la asignación de puntuaciones, por ejemplo pruebas proyectivas, de desarrollo moral o de creatividad. Por tanto, de igual forma, se pueden utilizar diversos tipos de correlaciones ya sea de Pearson 35 (datos continuos en escala razón), Spearman (escalas ordinales), correlaciones intraclase (escalas dimensionales) o Cohen/Fleiss kappa (categorías discretas, nominales). Para un análisis no paramétrico de acuerdo entre múltiples evaluadores, el coeficiente de concordancia de Kendall es útil, este es un índice de acuerdo al orden de clasificaciones múltiples que varios jueces realizan de una serie de estímulos que utilizan análisis de las técnicas de varianza para determinar si existen importantes diferencias entre los estímulos en el ranking. Posibilita decidir el nivel de concordancia entre expertos. Una deficiencia de la correlación entre observadores en la estimación de la fiabilidad incluye el error aleatorio y no tiene en cuenta las posibles interpretaciones diferentes entre los calificadores del proceso que se ha utilizado (Ayearst y Bagby, 2010) En términos generales, la Fiabilidad de los coeficientes se puede calcular por medio de puntuaciones continuas y categóricas como con el uso de ambas pruebas estadísticas paramétricas y no paramétricas. Los niveles mínimos de fiabilidad aceptables se determinan mejor por el uso previsto en las probables consecuencias de resultados de las pruebas, y corresponde a los investigadores o clínicos determinar la cantidad de varianza de error que consideren adecuado tener en su medición. Desde la psicometría se han propuesto directrices para la evaluación de la fiabilidad de un instrumento, teniendo en consideración que las decisiones deben basarse en lo que se pretende conseguir al usar el test, decisiones de mayor relevancia (por ejemplo, el diagnóstico y/o intervención) requieren niveles más altos de fiabilidad y poco error de medición, y las decisiones de menor relevancia (por ejemplo, detección) toleran niveles ligeramente más bajos de fiabilidad y, por tanto, un mayor error en la medición. Según Gregory (2011) el escoger cual tipo es mejor como evidencia de confiabilidad depende de la naturaleza y el objetivo de la prueba individual en cuestión. Además de los anteriormente mencionados, existen y se desarrollan desde la estadística distintos métodos relacionados con la fiabilidad. En el Anexo 3 se presenta una tabla donde se describe de forma simplificada las particularidades de los principales métodos para estimar la evidencia de fiabilidad. 36 Validez Mientras que la fiabilidad tiene que ver con la consistencia en las puntuaciones de un test, la validez tiene que ver con el significado de esas puntuaciones. Por tanto hace referencia al constructo del que la prueba parte. Para Ayearst y Bagby (2010) si bien es cierto, una prueba puede ser confiable y a la vez poco válida, una prueba no puede ser válida y poco fiable. En el momento en que los indicadores de fiabilidad se desestiman, se atenta contra el mismo constructo, ya que el test no mediría lo que pretende medir. Por tal razón, si bien es cierto la fiabilidad es algo más estable teóricamente, la validez goza de mayor complejidad. Según Fernández-Ballestero y Calero (2004), el tema de la validez ha gozado de constantes reformulaciones. Históricamente han existido un sin número de posiciones, ya en 1966 se da una unificación de los términos, hablándose de solo tres, validez de contenido, criterio y constructo: Validez de constructo. Se centra en la coherencia entre el instrumento y el constructo psicológico que desea medir Validez de criterio. Se centra en la relación entre la prueba y del criterio del que parte la misma. Es decir si posee capacidad suficiente para discriminar. Validez de contenido. Se centra en la relevancia y representatividad que poseen los ítems con el resto del test. Más tarde, Messick (citado por Fernández-Ballestero y Calero, 2004) plantea que la división tradicional en tres dimensiones es incompleta porque no tiene en cuenta tanto las consecuencias a nivel social del mismo test. Shadish, Cook y Campbell (2002, citados por Aló y Vallejo, 2012), aportan el siguiente esquema de la validez en la investigación basada en términos de cuatro indicadores básicos, con análisis y procedimientos estadísticos referidos a cada uno: Validez de la conclusión estadística. Se refiere al estudio de la correlación entre un tratamiento y su resultado. Es decir, si un programa de intervención, tal y como se ha 37 implementado, correlaciona significativamente con los resultados, tal y como se han medido. Validez Interna. Se refiere a si la relación entre un tratamiento y su resultado es directa, es decir si los resultados observados se hubiesen dado sin estar presente el programa. Validez de Constructo. Se refiere a la capacidad de generalizar los resultados de una investigación desde sus indicadores tangibles a sus constructos de referencia. Implicaría realizar inferencias sobre la población, o constructos delimitados a partir de la muestra particular utilizada en el programa de intervención. Validez externa. Se conceptualiza como la posibilidad de generalizar la relación causal estudiada a otras poblaciones diferentes a las usadas en la intervención. Este último esquema de validez es especialmente útil en el caso de diseños experimentales. No obstante en el caso de estudios psicométricos, al utilizar como pilar básico la medición, basándose en la asignación de valores numéricos a objetos y eventos sin que sea algún tipo de intervención lo más relevante de la investigación, se enlazan principalmente en diseños no experimentales. En torno a este tema, siguiendo a Ayearst y Bagby (2010), proponen que las evidencias de validez en el caso de estudios de corte psicométrico se pueden dividir en dos clases: la validez interna y externa. Desde este esquema, se posiciona a la validez de constructo como un concepto general que engloba todos los demás tipos de validez, ya que los mismos siempre parten de la premisa de intentar ligar al test con el constructo del cual derivan. Estos autores consideran que el proceso de validación de constructo tiene lugar cuando un investigador cree que su instrumento refleja una teoría particular, a la que se adjuntan ciertos significados. A continuación se exponen los distintos tipos de validez. 38 Validez Interna. Esta tiene que ver con la información que es intrínseca a la propia medida. De ella se desprenden tres principalmente: Validez de Contenido.Para Ayearst y Bagby (2010) esta es una parte fundamental de la validez de criterio general ya que se refiere al grado en el cual los elementos de un instrumento posean representatividad y relevancia acorde a un constructo objetivo para un particular propósito de evaluación. Estos elementos incluyen los ítems, instrucciones del test y formato de respuesta. La relevancia de un instrumento de evaluación se refiere a la medida en que los ítems de la prueba son adecuados para el constructo de interés y para el uso previsto de la medida. De modo que se debe considerar únicamente los que posean importancia clínica, de modo que la prueba no se vea saturada de elementos no sólo innecesarios sino perjudiciales para el propósito específico (Ayearst y Bagby, 2010) Con representatividad se prevé el grado en el que los elementos son proporcionales a los dominios y facetas del constructo. Es decir que los ítems deben hacer referencia a las principales características del fenómeno psicológico a estudiar sin dejar de lado alguna faceta de importancia sustantiva (Ayearst y Bagby, 2010) Es importante mencionar que la validez de contenido puede variar en función del contexto. Un constructo puede cambiar a través del tiempo, añadiendo, modificando o sustrayendo elementos teóricos en su conformación. O puede ser de contenido actualizado pero variar de una población a otra (Tsai y Chentsova-Dutton, 2002). La sintomatología de muchos constructos varía entre poblaciones, de modo que usar un instrumento creado en alguna cultura que difiere de otra, atenuara la validez de contenido. La validación de contenido requiere no solo de métodos estadísticos, sino que debido a lo abstracto del concepto, se requiere de consulta a expertos por medio de una revisión del contenido del test con el fin de prever tanto la relevancia como la representatividad. 39 Validez Substantiva. Ayearst y Bagby (2010) comentan que un poco relacionado con el concepto de validez de contenido es la evidencia de "validez sustantiva," la cual se refiere a la formulación de ítems y procedimientos en consonancia con una teoría particular. Saber si la medida que se utilizará está bien fundamentada en la teoría de la que parte puede tener un impacto en la interpretación de los resultados de la misma. La presencia de una teoría subyacente aumenta la validez de constructo de una prueba proporcionando un puente directo entre contenido y constructo. Validez Estructural. Se refiere propiamente a la consistencia de la estructura interna de la prueba. Según Ayearst y Bagby (2010), a pesar de que el reporte de fiabilidad de consistencia interna, a través del alpha de Crombach, es una pieza importante, no basta únicamente con ese procedimiento. En otras palabras, así como la fiabilidad es una condición necesaria pero no suficiente para asegurar validez, la consistencia interna es una condición necesaria pero no suficiente para establecer la homogeneidad o unidimensionalidad. Por tanto, la puesta a prueba de la unidimensionalidad de la escala se determina mejor por el análisis factorial. La evidencia de validez estructural requiere una evaluación de si la estructura factorial de la medida (la estructura interna) es consistente con la hipótesis de la estructura interna del constructo. Los dos métodos de análisis factorial principales utilizados para evaluar la validez estructural son Análisis exploratorio de los factores y el análisis factorial confirmatorio. Según Ayearst y Bagby (2010), el análisis factorial exploratorio se usa para tratar de descubrir la estructura interna de un número relativamente grande de variables. Intuye el número de factores necesarios para dar cuenta de las correlaciones entre las variables medidas (ya sean ítems o subescalas). El procedimiento genera cargas factoriales así como la correlación (si existe) entre los factores. Por otro lado el análisis factorial confirmatorio trata de determinar si el número de factores obtenidos y sus cargas se corresponden con los que cabría esperar a la luz de una teoría previa acerca de los datos. Por tanto este tipo de análisis determina si cargas factoriales deberían corresponder con los factores del constructo teórico original. 40 La importancia de determinar cuántos factores se deben extraer no debe pasarse por alto, porque hay consecuencias si bien muchos o muy pocos factores son derivados. Si se retienen muy pocos factores, la estructura completa de la construcción no se revela totalmente y la validez estructural se ve comprometida. Si se retienen demasiados factores, el significado del constructo se convierte en difícil de interpretar. Validez Externa Se refiere a consideraciones propias del constructo de la prueba. Hace referencia a la condición causal del cual la prueba parte y si guarda relación con la misma. De igual manera se presentan tres: Validez convergente y discriminante. Ayearst y Bagby (2010) comentan que la validez convergente y discriminante contribuyen a la validez de constructo, ayudando en la identificación de lo que la constructo es y no es, y lo que la prueba mide y no mide. Por tanto contribuyen en el poder realizar predicciones. La validez convergente contribuye a indicar en qué medida los resultados del test correlacionan con alguno destinado a medir el mismo constructo. La validez discriminante o divergente por su parte se refiere al grado en que los resultados de una prueba no correlacionan con los de pruebas que midan otro constructo. Las conclusiones de evidencias de validez convergente o divergente son más robustas si la validez de la otra también ha sido evaluada. La evaluación de la validez discriminante de una medida es tan importante como la evaluación de la validez convergente (Ayearst y Bagby, 2010) 41 Validez incremental. Se define como el grado en que un pronosticador adicional explica algo de la medida criterio que no estaba explicado por los otros pronosticadores. El hecho que un instrumento psicológico presente altos indicadores de fiabilidad no quiere decir que si se utiliza en un contexto específico vaya a ser de mayor utilidad que el resto de técnicas que se utiliza. La validez incremental quiere decir que en el caso de alguna triangulación de técnicas, una técnica en específico, en este caso el test, merece estar en el conjunto de pruebas porque aporta información relevante. Para Ayearst y Bagby (2010) La evidencia de la validez incremental puede ser evaluada a través de análisis de regresión, que demuestran que la varianza única en la variable dependiente se explica por la inclusión de la medida en un conjunto de predictores. La decisión de incluir o excluir una medida de una batería de evaluación en gran medida debe basarse en si la inclusión de la medida da una mayor precisión de la predicción de la variable dependiente o una mayor precisión en las decisiones sobre la base de resultados de las pruebas. Validez diagnóstica. Para Ayearst y Bagby (2010) una medida determina la presencia o ausencia de un trastorno por el establecimiento de un "punto de corte", que es la puntuación en la prueba que pretende diferenciar a referencia el límite clínico de clasificación. Aquellos por encima del punto de corte se clasifican en una categoría (trastorno presente), y aquellos por debajo del punto de corte se clasifican en una categoría diferente (trastorno ausente). "Validez de diagnóstico" se refiere a la precisión con la que se realizan estas decisiones de clasificación. Un número de diferentes estadísticos se puede utilizar para evaluar la validez de diagnóstico de una prueba. Entre ellas tenemos: Sensibilidad. La capacidad de una medida para identificar a los individuos con un trastorno correctamente Especificidad. La capacidad de una medida para identificar individuos sin un trastorno correctamente Poder Predictivo Positivo. La probabilidad de que en el caso de un individuo que tiene un trastorno dado, la medida efectivamente le identifique con el trastorno Poder Predictivo Negativo. La probabilidad de que en el caso de un individuo que no tiene un trastorno dado, que la medida efectivamente le identifique sin el trastorno 42 Clasificación General Correcta. La "tasa de éxito" o proporción de individuos con y sin trastorno correctamente identificados por la medida Kappa. El acuerdo entre la medida y los criterios diagnósticos para el diagnóstico. De esta forma, al desarrollar un instrumento de medición, se deben tomar decisiones sobre que estadístico debe poseer mayor prioridad en base al objetivo de construcción del mismo. Si se pretende el uso del mismo en cuanto a la detección de mayor número de personas con la sintomatología en función, entonces el umbral de sensibilidad y poder predictivo positivo debe ser mayor. Para estudios de investigación en los cuales se propone obtener pureza en el diagnóstico de un grupo de personas con algún trastorno, es necesario priorizar la discriminación a partir de mayor especificidad. Teorías de Construcción y Validación de Pruebas Conseguir las anteriores condiciones de Fiabilidad y Validez no es sencillo, de modo que la construcción de un instrumento debe ampararse en bases metodológicas sólidas. El proceso para construir un test pretende contribuir a la calidad de las mediciones obtenidas durante la recogida de datos. Existen distintas aproximaciones para la construcción de una prueba, no obstante por consenso se utilizan dos primordialmente, desde la Teoría Clásica de los Test y desde La Teoría de la Respuesta al Ítem. Teoría Clásica de los Test La teoría Clásica de los Test supone la primera incursión en el diseño de pruebas, dominando como única opción la construcción de las mismas durante el siglo XX hasta 1980. Según Navas (1994) arranca con los trabajos de Spearman desarrollándose en conjunción con sus teorías de la inteligencia. Muñiz (2010) comenta que Spearman propone tres supuestos al modelo: 43 En el primer supuesto se define la puntuación verdadera (V) como la esperanza matemática de la puntuación empírica, que formalmente puede escribirse así: V = E(X). Es decir, la puntuación verdadera supone un promedio idealizado desde la estadística sobre una supuesta puntuación real de un individuo. Todo valor medido en un test (X) se compone de un parte verdadera de la característica (T) y una parte aleatoria correspondiente al error de medición (E): X = T + E. De esta forma la teoría clásica enfatiza en la necesidad de determinar el error de medición. En el segundo supuesto Spearman asume que no existe correlación entre el valor pronóstico de las puntuaciones verdaderas con respecto al tamaño de los errores que afectan a esas puntuaciones. Ambos coeficientes son independientes entre si El tercer supuesto establece que los errores de medida que los sujetos obtengan en un test no guardan relación con los errores de medida en otro test distinto. No hay razón para asumir que los errores cometidos en una ocasión sean covariantes sistemáticamente con los cometidos en otra ocasión Según Calero y Padilla (2004) La construcción de test desde la teoría clásica, tiene varias aproximaciones: Construcción racional. Desde esta perspectiva se inicia el proceso de elaboración del test con la redacción de la población inicial de ítems. Estos se construyen en base a un constructo de referencia y a partir de ahí se procede con el diseño de los mismos. Walsh y Betz (2000) apuntan que la construcción racional se basa en el supuesto que el contenido del test refleje directamente las características del constructo en cuestión. Desde esta aproximación el contenido de los ítems refleja la dimensión o constructo objeto de medición (Calero y Padilla, 2004). Construcción empírica. Desde esta aproximación, los ítems se construyen en base a parámetros observables desde alguna población meta que presente un criterio en interés. Es decir las pruebas no parten desde la teoría para la construcción sino desde la práctica. Walsh y Betz (2000) señalan tres características que presenta esta estrategia de construcción: a) Utilidad para objetivos aplicados 44 b) Permite establecer diferencias inter grupos c) Permite contrastar esas diferencias Desde esta aproximación en la selección de los ítems prima la correlación con un criterio Calero y Padilla (2004). Construcción analítico factorial. Se realiza un énfasis en la estructura interna final del cuestionario. El proceso consta de analizar factorialmente una gran cantidad de ítems, para determinar las dimensiones que subyacen a la conformación del mismo. Estas escalas se convierten en las dimensiones o factores posteriores del ítem, siendo los ítems con cargas factoriales más altas las que conformaran el cuestionario final. Desde esta aproximación se incorporan ambas perspectivas anteriores Calero y Padilla (2004). La teoría clásica de los test enfatiza en el supuesto de fiabilidad. De tal forma mientras mayor sea el error de medición, entonces menor será la componente verdadera de la característica en el valor medido y por tanto menor será también la confiabilidad con la que el test mide. La fiabilidad solo puede estimarse, debido a que los valores verdaderos son una apreciación teórica y por tanto, imposibles de conocer. Una forma de saberlo es por medio de Test paralelos, entendiendo por ello aquellos test construidos para medir el mismo constructo pero con distintos ítems. Las puntuaciones verdaderas de las personas en los test paralelos serían las mismas, y también serían iguales las varianzas de los errores de medida (Muñiz, 2010). En base a lo anterior, la fiabilidad es el único criterio de calidad que se puede determinar dentro de los marcos de esta teoría. La misma se queda corta con respecto a criterios de validez de un test. Es decir ofrece garantías de que un test mida con exactitud lo que pretende medir (fiabilidad), pero no que lo haga correctamente (validez). A raíz de lo anterior se desprenden grandes limitaciones de la teoría clásica de los test Primero, las puntuaciones no son invariantes. De modo que no se puede equiparar alguna puntuación obtenida en un test con la obtenida en otro debido a que ambos están construidos con escalas diferentes. Debido a esta limitación desde la teoría 45 clásica de los test se intentó amortiguar con el modelo de generalizabilidad, en el cual se convierten las puntuaciones en percentiles, ubicándose cada puntuación en un rango siendo homologable con cualquier otra obtenida. No obstante este modelo aun goza de críticas, ya que la obtención de la muestra percentil sigue siendo parcializada, una no se puede comparar con otra, tendría que ser de la misma muestra. Segundo, la construcción de los test estaba muestralmente sesgada. De modo que los mismos se construían con personas de algún nivel específico, siendo imposible la extrapolación. A raíz de estas limitaciones surge la Teoría de la Respuesta al ítem como propuesta metodológica en la construcción de instrumentos de medición psicológica, la cual ha venido tomando auge en las últimas décadas. Teoría de la Respuesta al Ítem A raíz de las deficiencias expuestas desde la Teoría Clásica, para el diseño y construcción de ítems ha surgido la Teoría de la Respuesta al Ítem (TRI). Tal como su nombre lo indica, cada ítem tiene significado en sí mismo a diferencia de su precedente en el cual todos los ítems funcionaban como una unidad. De esta forma desde la TRI se presenta mayor flexibilidad ya que permiten una lectura de cada uno independiente de la puntuación final. Muñiz (2010), aportan que el mayor aporte de la TRI radica en que proporciona invariantes al: Obtener mediciones que no varían en función del instrumento utilizado. Se pueden utilizar diferentes test y se obtienen puntuaciones equiparables entre sí. Disponer instrumentos de medida cuyas propiedades no varíen en función del nivel de las personas en algún determinado atributo. 46 Calero y Padilla (2004) mencionan que los dos supuestos básicos de la TRI son el de independencia local (cada ítem tiene independencia del resto de ítems) y el de unidimensionalidad (la prueba evalúa un rasgo único). Una de las mayores innovaciones de la TRI son los llamados bancos de datos. Para Navas (1994) estos no son más que un conjunto de elementos de ítems que miden un mismo rasgo, campo o área de conocimiento, estimados en la misma escala. Estos ítems se analizan en base a modelos estadísticos de modo que de la base de datos se estima los más representativos. Lo relativo a la medición psicológica tuvo una fuerte evolución en las últimas décadas, produciéndose importantes avances en el campo de la medición. Estas diferencias se entablan desde la evolución del modelo de la teoría clásica hacia uno más basado en el ítem. Muñiz (2010) presenta las siguientes diferencias entre ambas teorías. Tabla 1: Diferencias entre la Teoría Clásica y la Teoría de Respuesta al Ítem Aspectos Teoría Clásica Teoría de Respuesta al Ítem Modelo Lineal No Lineal Asunciones Débiles (fáciles de cumplir por los Fuertes (difíciles de cumplir por los Invarianza de las mediciones No Si Invarianza de las propiedades del No Si datos) datos) test Escala de las Puntuaciones Entre cero y la puntuación Entre -∞ y +∞ máxima del test Énfasis Test Item Relación Item-Test Sin especificar Curva Caracteristica del ítem Descripción de los Item Índices de Dificultad y de Parámetros a, b, c discriminación Errores de Medida Error típico de medida común para toda la muestra Tamaño Muestral Puede funcionar bien Función de Información (varía según el nivel de aptitud) con Se recomiendan más de 500 muestras entre 200 y 500 sujetos, aunque depende sujetos del modelo aproximadamente Fuente: Muñiz (2010) 47 Pruebas Psicométricas que miden Depresión Habiendo expuesto ambos pilares del cuerpo teórico de la presente investigación, Depresión y Psicometría, es posible exponer a continuación algunas pruebas psicológicas que abordan el tema de la Depresión, finalizando con una descripción detallada de la Segunda versión del Inventario de Depresión de Beck, centro del presente estudio. Escala para la Evaluación de la Depresión de Hamilton (Ham-D) La escala de Depresión de Hamilton surge en un contexto en el cual se necesitaba evaluar la eficacia de la primera generación en antidepresivos publicándose en 1960. Según Bagby, Ryder, Schuller y Marshall (2004) la prueba conserva este uso, convirtiéndose en la medida de depresión más utilizada actualmente. El objetivo de la prueba consiste en la valoración de la gravedad de los síntomas y los cambios en el paciente a lo largo del tratamiento. Consta de 21 ítems, cada uno de los cuales tiene entre 3 y 5 posibilidades de respuesta con puntuaciones de 0-2, 0-3 o 0-4 en sus ítems. La puntuación final va de 0 a 52. Los valores para fiabilidad interna oscilan entre .46 y .97, para la fiabilidad entre examinadores la r de Pearson osciló entre .82 y 0,98, la fiabilidad test retest osciló entre .81 y .98. Bagby, Ryder, Schullery Marshall (2004) argumentan que la prueba también ofrece buenos indicadores de validez de contenido, convergente, discriminativa y predictiva. Escala Autoaplicada para la Depresión de Zung (Zung SDS) La escala de Zung para depresión se diseñó con el fin obtener información para determinar grados de severidad de un episodio depresivo mayor en pacientes psiquiátricos hospitalizados publicándose así en 1965. Está formada por 20 frases que evalúan la frecuencia de aparición. Cada ítem se puntúa en una escala de 1 a 4, con un rango de puntuación final de 20 a 100. Como parte de las medidas psicométricas, la prueba muestra en su versión original un alfa de Crombach de .875, sensibilidad de .96, especificidad de .71, y coeficiente kappa de 0.441. Para la versión abreviada, el alfa de Crombach es de .845, la sensibilidad de .92, la especificidad de .71, y el coeficiente kappa de .383 (Díaz, Campo, Rueda y Barros, 2005) 48 Subescala de Depresión del Cuestionario de 90 Síntomas (SCL-90) La Sympton Check List 90 (SCL 90) es una escala de síntomas que evalúa el grado de distrés que manifiesta un individuo entre el día de la aplicación y la semana anterior a la prueba. Es un instrumento auto aplicable cuya edad mínima que se requiere es de 18 años. Está constituido por 90 reactivos que se contestan en una escala Likert de 5 puntos que van desde cero (no del todo) hasta 4 (extremadamente). La prueba no es sobre depresión específicamente, sino que la concibe como una de sus dimensiones. Dichas dimensiones son: Somatización, Obsesivo compulsivo, Sensibilidad interpersonal, Depresión, Ansiedad, Hostilidad, Ansiedad fóbica, Ideación paranoide, Psicoticismo, Índice de Severidad Global. (Cruz, López, Blas, González, Chávez, 2005) Subescala de Depresión del Inventario Multifásico de la Personalidad de Minnesota (MMPI-D) El MMPI es una de las pruebas más usadas para la identificación de perfiles de personalidad y la detección de psicopatologías. Incluye 657 reactivos, conlleva entre 60 y 90 minutos su aplicación. Las edades de aplicación van desde 18 a 84 años. Cuenta con 57 escalas y 63 subescalas (Nichols, 2011). La escala de Depresión del MMPI 2, se interesa por medir sintomatología depresiva, desanimo, falta de felicidad, de interés, apatía, retardo psicomotor, irritabilidad y tendencia a la preocupación. Sus niveles de puntuación van desde bajo (menos de 40), Medio (de 41 a 55), Moderado (56 a 65), Alto (66 a 75) y Muy alto (76 o más) (Nichols, 2011).Para Costa Rica, la adaptación del MMPI se llevó a cabo por Carlos Saborío en el 2011. Multiscore Depression Inventory de David Bernt (MDI) Mide intensidad de la depresión, en dos versiones una de 118 ítems y una reducida de 47. Las preguntas se responden en función de Falso/Verdadero. La población mínima es de 13 años en adelante (Bernt, 1990).En la prueba original el índice de consistencia interna oscila entre .96 y .97, a su vez que el test- retest arroja un coeficiente de .82. La validez convergente con el BDI – II es de r= .69 (p= .001) y con Hamilton es de r= .66 (p= 0.01) (Bernt, 1990).Tiene 9 escalas: Bajo nivel de energía, Dificultades Cognitivas, Sentimientos de culpa, Baja autoestima, Introversión social, Pesimismo, Irritabilidad, Sentimientos de tristeza y Desesperanza instrumental. 49 Inventario de Depresión de Beck Características Generales Según los mismos autores de la prueba, Beck, Steer y Brown (2009) el Inventario de Depresión de Beck en su segunda versión (BDI-II) es un cuestionario autoaplicado de 21 ítems, los cuales evalúan un amplio cúmulo de síntomas depresivos (uno por cada ítem), con una edad mínima de trece años. Cada ítem contiene cuatro opciones, las cuales varían en intensidad del síntoma, desde 0 (ausencia o síntoma leve) hasta 4 (presencia disfuncional del mismo). Entre sus usos principales se encuentra la evaluación de cambio en pacientes con tratamiento de depresión y el diagnóstico de la misma (Pérez y Muñoz, 2004). El BDI-II ha sido utilizado en múltiples contextos en el ámbito clínico (Pérez y Muñoz, 2004), y en la investigación desde estudios en consumo de drogas (Pedrero y López, 2005; Seignourel, Green y Schmitz, 2007), estudios neurocientíficos (Dunn, Kimbrell, Ketter, Frye, Willis, Luckenbaugh y Post, 2002; Rowland, Lam y Leahy, 2005), trastornos del sueño (Carney, Ulmer, Edinger, Krystal y Knauss, 2009); en el área médica en general (Poole, Bramwell y Murphy, 2009; Takai, Takahashi, Iwamitsu, Ando, Okazaki, Nakajima, Oishi y Miyaoka, 2009; Viljoen, Iverson, Griffits y Woodward, 2003), así como en diferentes poblaciones como Afroamericanos (Joe, Woolley, Brown, Ghahramanlou y Beck, 2008), presidiarios (Palmer y Binks, 2008) e incluso, los estudios con adolescentes han gozado de gran preocupación (Wilson y Blumentritt, 2007; Osman, Barios, Kooper, Gutierrez y Bagge, 2004; Osman, Barrios, Gutierrez, Williams y Bailey, 2008, Byrne, Tewart y Lee, 2004). La aceptación que ha recibido del medio internacional ha sido muy importante al punto de constituirse, según Sanz, Navarro y Vázquez (2003) en el instrumento de autoaplicación en evaluación de depresión más usado tanto en el ámbito clínico como en investigación. Los autores de la prueba señalan como en los primeros 25 años del instrumento ya se habían producido más de 1500 artículos haciendo referencia a su uso, así como múltiples investigaciones empíricas demostrando su utilidad. (Beck, Steer y Brown, 2009). Esto brinda evidencias que apoyan el alto valor transcultural de la prueba. 50 Según Pérez y Muñoz (2004), el BDI-II posee capacidad discriminativa entre: 1. Pacientes con y sin trastorno depresivo, 2. Pacientes con distimia de aquellos con un trastorno depresivo mayor y 3. Pacientes con un trastorno de ansiedad generalizada de aquellos con un trastorno depresivo mayor. No obstante, el BDI-II no está diseñado para diferenciar entre distintos trastornos depresivos, sino solo entre dimensiones de depresión. Los mismos autores señalan que la prueba es muy sensible al cambio terapéutico y puede ser administrado de forma repetida. (Beck, Steer y Brown, 2009) Desarrollo y evolución El antecesor del BDI-II, el BDI creado en 1963, fue formulado en base a la construcción del concepto de depresión que se sostenía en ese momento tomando como principio fundamental la teoría de la depresión de Aaron Beck basado en lo que el autor denominó el trío cognitivo negativo (pensamientos negativos sobre sí mismo, el mundo y el futuro) (Butcher et al, 2006) teoría que suponía un consenso clínico en cuanto a la comprensión de la depresión en ese momento (Sanz et al, 2003). Para Pérez y Muñoz (2004) esta primera versión, al ser anterior al DSM-III estaba exenta de los criterios diagnósticos y dentro de sus objetivos no se encontraba la clasificación. La misma se desarrolló por tanto a partir de la experiencia clínica de Beck en psicoanálisis. A lo largo de los años, conforme su teoría fue adquiriendo mayor coherencia, elaboración y respaldo investigativo, se tornó necesaria la modificación del BDI inicial. La versión inicial la cual apenas constaba de una escala de valoración de uso para el clínico desarrollada en 1961, fue modificada para 1978 por un cuestionario autoaplicado de 21 ítems, cada uno con cuatro opciones de respuesta (BDI-IA). No obstante, con el surgimiento e influencia del DSM-III (y posteriores) y la introducción de definiciones como la distimia y la depresión mayor, surgen investigaciones que desacreditan la capacidad discriminativa del BDI-IA, señalando su falta de adecuación a los criterios diagnósticos emergentes en la depresión. Sanz et al(2003), señalan que el BDI I-A no cubre el criterio sintomático de enlentecimiento o agitación psicomotor, cubre síntomas (hipocondría y desesperanza) que no son propios del episodio depresivo mayor para el DSM y, no permite evaluar sintomatología depresiva durante el periodo de tiempo mínimo (2 semanas). 51 A la luz de estas deficiencias, en 1994 Beck y sus colaboradores comienzan con el trabajo piloto y es en 1996 cuando surge el BDI-II, el cual según Pérez y Muñoz (2004) continua conservando la misma estructura de 21 ítems de cuatro valores pero varía algunos aspectos importantes, como la extensión de la anterior ventana de medida de una semana a dos y la modificación de algunos ítems de importancia, con el objetivo de cubrir los distintos criterios diagnósticos del DSM. Características Psicométricas Debido a su afinidad investigativa, los criterios psicométricos del BDI-II están constatados en múltiples estudios a lo largo del orbe, en distintos tipos de poblaciones de diferentes ámbitos. En los estudios iniciales de la prueba, se utilizaron dos muestras, una de pacientes externos provenientes de cuatro centros de investigación distintos, los cuales sumaban 500 personas; y una muestra de 120 estudiantes de un curso introductorio de psicología en la Universidad de Nueva Bruswick, Fredericton, Canadá. Según Beck, Steer y Brown (2009) los índices más importantes obtenidos de la prueba son los siguientes: Fiabilidad. El coeficiente alfa de Crombach es de un .92 para el grupo de pacientes y .93 para el grupo de estudiantes. La correlación test retest para los autores de la prueba apunta un .93 poseyendo significancia estadística (p < .001) (Beck, Steer y Brown, 2009). Pérez y Muñoz (2004), hablan más bien de un .81-.83 para el trascurso de una semana. Validez. Validez de contenido. Al presentar en sus ítems todos los criterios que apunta el DSM-IV, evalúa de forma muy completa y obediente todos los síntomas. Validez concurrente. Pérez y Muñoz (2004) muestran las siguientes correlaciones con las siguientes pruebas: Escala para la evaluación de Hamilton (Ham-D) para pacientes psiquiátricos en un .61-.86. Escala Autoaplicada para la Depresión de Zung (Zung SDS): .57-.86. Subescala de Depresión del Cuestionario de 90 Síntomas (SCL-90): .76. 52 Subescala de Depresión del Inventario Multifásico de la Personalidad de Minnesota (MMPI-D): .60. Escala de Desesperanza de Beck (BHS): .60. Validez Estructural. El BDI-II presenta dos dimensiones subyacentes, una Cognitivaafectiva (dada por los ítems 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 y 17) y otra Somática (ítems 15, 16, 18, 19 y 20) altamente correlacionadas entre sí (.98; p<.001). Numerosas investigaciones respaldan la existencia y validez de ambas dimensiones en el BDI-II (Storch, Roberti, y Roth, D, 2004; Beck, Steer y Brown, 2009) Validez diagnóstica. No discrimina subtipos de trastornos depresivos, sino únicamente el grado de severidad de depresión. Discrimina entre pacientes con y sin trastorno depresivo, pacientes con distimia de aquellos con un trastorno depresivo mayor y pacientes con un trastorno de ansiedad generalizada de aquellos con un trastorno depresivo mayor (Pérez y Muñoz, 2004). Ha demostrado tener una sensibilidad de .95, lo que indica que va a identificar el 95% de los pacientes deprimidos como deprimidos (Arnau, Meagher, Norris, y Bramson, 2001). Del mismo modo, tiene una especificidad de .90, lo que indica que identifica correctamente aproximadamente el 90% de los individuos deprimidos como no deprimidos (Arnau et al., 2001). Su Poder Predictivo Positivo es .50, lo que indica que aproximadamente el 50% de los individuos identificados como deprimidos realmente están deprimidos, mientras que su Poder Predictivo Negativo es .99, lo que indica que el 99% de los individuos identificados como no deprimidos realmente no están deprimidos (Arnau et al., 2001). Así que, aunque el BDI-II identifica a las personas no deprimidas con una precisión casi perfecta, sólo hay un 50% de probabilidad de que las personas identificadas por la medida como deprimidos realmente lo están. Es decir, el BDI II tiene una tendencia a presentar falsos positivos en el 50% de los casos y, una tendencia a los verdaderos negativos en un 99%. Esta decisión tiene la ventaja de que excluye de tratamiento a quien verdaderamente no lo necesita, pero sobre etiqueta a las personas con algún grado de intensidad de la Depresión, incitando al tratamiento. 53 Planteamiento del Problema de Investigación ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA 54 PLANTEAMIENTO DEL PROBLEMA DE INVESTIGACION Problema de Investigación Descrita la pertinencia que representa para el país contar con una prueba con propiedades psicométricas adecuadas para la evaluación diagnóstica de la depresión, además de la alta prevalencia con que se diagnostica este trastorno a nivel clínico, se planteó el presente proyecto de adaptación. De lo anterior surge el siguiente problema que sustenta el trabajo de esta investigación: ¿Presentará la adaptación del BDI-II aplicada en una muestra del Gran Área Metropolitana (GAM) propiedades psicométricas adecuadas? Objetivos Objetivo general. Adaptar la segunda versión del Inventario de Depresión de Beck (BDI-II) en una muestra de personas residentes en el GAM. Objetivos específicos Traducir el inventario con las palabras culturalmente ajustadas para cada ítem de modo que resulten más comprensibles para la población costarricense. Realizar una revisión del primer borrador de la prueba, mediante un criterio interjueces. 55 Modificar la prueba según una valoración de las indicaciones ofrecidas por los jueces. Evaluar la comprensión de los ítems del BDI-II en una muestra piloto de 40 personas de población general. Aplicar la versión definitiva a una muestra de personas residentes del GAM. Corroborar los criterios de validez y fiabilidad resultantes de la prueba concernientes a la muestra por medio de los análisis estadísticos correspondientes. Hipótesis Con la resolución de los anteriores objetivos, se pueden cumplir alguna de las siguientes hipótesis: Hi: Los resultados psicométricos que se obtengan con la adaptación del Beck Depression Inventory II (BDI- II) en la población costarricense serán similares con respecto a los obtenidos de las adaptaciones realizadas en otros contextos, y poseerán significancia estadística adecuada en los índices de validez y fiabilidad. Ho: Los resultados psicométricos que se obtengan con la adaptación del Beck Depression Inventory II (BDI- II) en la población costarricense serán más bajos con respecto a los obtenidos de las adaptaciones realizadas en otros contextos, y tampoco poseerán significancia estadística adecuada en los índices de validez y fiabilidad. H1: Se obtendrán resultados psicométricos más elevados que los obtenidos por las adaptaciones con el BDI-II realizadas en otros contextos y por ello dichos resultados poseerán significancia estadística adecuada en los índices de validez y fiabilidad de la prueba. H2: Se obtendrán resultados psicométricos más bajos que los obtenidos por las adaptaciones con el BDI-II realizadas en otros contextos, pero aún con ello si poseerán significancia estadística adecuada en los índices de validez y fiabilidad de la prueba. 56 Metodología ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA METODOLOGÍA Antes de describir las características del estudio, es importante comentar que la presente investigación se sustentó en torno a tres ejes que metodológicamente guiaron la misma: Los lineamientos para la adaptación de pruebas psicológicas de la International Commision Test (Ver Anexo 1) La propuesta metodológica para la adaptación y estandarización de instrumentos de Geissenger (1994)la cual se comentará posteriormente. El esquema de Validez y Fiabilidad de Wasserman y Bracken (2003) Por tanto, toda la metodología se asume en función de estos tres parámetros. Tipo de estudio. Al tratarse de la adaptación de una prueba psicológica, es de tipo psicométrico. La psicometría, al utilizar como pilar básico la medición, está basada en la asignación de valores numéricos a objetos y eventos, de acuerdo con ciertas reglas (Kerlinger y Lee, 2002). Todo estudio psicométrico, al basarse en la medición, asigna números a determinados atributos y variables de uno o varios constructos psicológicos, con el fin de lograr una estimación de los mismos, pretendiendo el estudio de la validez, fiabilidad y datos normativos de una prueba (Cohen y Swerdlik, 2006). Diseño de investigación. La investigación al basarse en la recolección y análisis de datos puede clasificarse como un diseño no experimental-transversal, debido a la pretensión de recolección de los datos en un 58 único momento, buscando la descripción y análisis de la incidencia e interrelación de variables de esa situación en específico (Hernández, Fernández y Baptista, 2006). Sujetos de investigación Población: El estudio se realizó principalmente en dos poblaciones diferentes: una población general y una población clínica con sintomatología depresiva. Para la población general se trabajó con 618 sujetos procedentes del Gran Área Metropolitana. Se decidió trabajar con este sector de la población nacional únicamente por razones de factibilidad, ya que resultaba metodológicamente imposible cubrir con representatividad estadística toda la población nacional. Con la población clínica se trabajó con 79 sujetos, tomados de 3 fuentes: Casos clínicos que maneja la Caja Costarricense de Seguro Social (CCSS) en consulta externa del Hospital Psiquiátrico Roberto Chacón Paut. Casos clínicos de pacientes con Depresión de la Clínica de Tibás Apoyo por parte de profesionales en Psicología. Para la muestra de la población general, al obtenerse a partir de elementos derivados de instituciones, lugares y demás, no por razones de representatividad sino por comodidad del investigador se puede hablar de un muestreo por conveniencia (Hernández 2004). Para la muestra de la población clínica, es posible hablar de un muestro de juicio o intencional (Hernández, 2004), debido a que se contó con el apoyo del comité de Bioética del Hospital Max Peralta en Cartago al contar con esta población cautiva en el Hospital Psiquiátrico Roberto Chacón Paut. Criterios de inclusión: Para ambas poblaciones el principal criterio de inclusión se realizó en función de la edad, incluyendo únicamente a las personas mayores de 18 años. En caso de ubicar personas menores de edad, hubiese sido necesario contar con un asentimiento informado de los padres para cada caso, excediendo los recursos de la investigación en términos de coste, tiempo y esfuerzo. 59 Además, se tomaron en cuenta únicamente costarricenses por nacimiento, o extranjeros inmigrantes que posean más de 10 años de radicar en el país. Lo anterior debido a que el proceso de aculturación por el que se atraviesa en situaciones de migración suele venir acompañada de síntomas de adaptación, entre ellos propiamente los relacionados con depresión (Lu, 2010; Wright, 2009; Fozdar, 2009). Esta situación puede provocar un sesgo en la recogida de datos, llegando a afectar los resultados finales que se obtengan. En acuerdo con Lu (2010) todo proceso de aculturación viene acompañado de procesos psicosociales distintos, los cuales son interpretados de forma distinta de persona en persona. Por eso no existe un periodo de tiempo que se defina como válido y universal para todos los casos sino que este periodo variará de persona en persona. De esta manera se ha pensado en 10 años, tratando de disminuir en la medida de lo posible las probabilidades de que se incluyan datos de un sujeto que puedan sesgar los resultados de la población general al presentar síntomas propios de una situación de adaptación al nuevo contexto. En los casos clínicos se tomaran en cuenta las referencias de Consulta Externa de pacientes con sintomatología Depresiva realizadas por profesionales en Psicología únicamente, y que cuenten ya sea con menos de 22 días de haberse efectuado el diagnóstico o que no se haya superado un número de 4 sesiones incluyéndose tanto evaluación como tratamiento. Con respecto a los criterios de Sintomatología Depresiva, se utilizaron los mismos que indica el DSM 5 (APA 2013) cuando contaran con al menos 3: Estado de ánimo depresivo la mayor parte del día, casi cada día según lo indica el propio sujeto (p. ej., se siente triste o vacío) o la observación realizada por otros (p. ej., llanto) Disminución acusada del interés o de la capacidad para el placer en todas o casi todas las actividades, la mayor parte del día, casi cada día (según refiere el propio sujeto u observan los demás) Pérdida importante de peso sin hacer régimen o aumento de peso (p. ej., un cambio de más del 5 % del peso corporal en 1 mes), o pérdida o aumento del apetito casi cada día. Insomnio o hipersomnia casi cada día 60 Agitación o enlentecimiento psicomotores casi cada día Fatiga o pérdida de energía casi cada día Sentimientos de inutilidad o de culpa excesivos o inapropiados (que pueden ser delirantes) casi cada día Disminución de la capacidad para pensar o concentrarse, o indecisión, casi cada día (ya sea una atribución subjetiva o una observación ajena) Pensamientos recurrentes de muerte (no sólo temor a la muerte), ideación suicida recurrente sin un plan específico o una tentativa de suicidio o un plan específico para suicidarse (APA-2013) Con la población clínica se excluían aquellos que no contaran con los anteriores criterios descritos, además cuando: Los síntomas eran debido a los efectos fisiológicos directos de una sustancia (p. ej., una droga, un medicamento) o una enfermedad médica (p. ej., hipotiroidismo). Había presencia de un diagnóstico de Trastorno Bipolar, Esquizofrenia Instrumentos y técnicas Como técnica principal se siguió en estricto apego los lineamientos que se utilizan internacionalmente para la adaptación de pruebas psicométricas propuestos por Geissenger (1994). Dichos lineamientos se discutirán posteriormente. En cuanto a los instrumentos, básicamente se utilizó la segunda versión del Inventario de Depresión de Beck (BDI-II). En la primera fase de “traducción y adaptación del instrumento” se utilizaron el Inventario en su versión estadounidense original, su versión adaptada al contexto español y al argentino. Una vez conseguida la traducción al contexto nacional, entonces se utilizó como instrumento en las siguientes fases concernientes a la aplicación y validación. También se contó con el Multiscore Depression Inventory y la Escala de Afecto positivo y Negativo. En el análisis de los datos se trabajó con la versión 21 de los programas SPSS y AMOS. 61 Procedimientos Con el fin de garantizar el cumplimiento de las directrices propuestas por la ICT (2010, ver “Anexo 1”) para la adaptación de test psicológicos, el proceso de adaptación de la prueba BDI–II fue dividido en nueve fases siguiendo en estricto orden los lineamientos internacionalmente aceptados y reconocidos para la adaptación y estandarización de pruebas psicológicas (Geissenger, 1994). Esas 9 fases han sido agrupadas en cuatro categorías o etapas, con lo que se pretende sistematizar el avance de la investigación en cuanto a ejes temáticos: “La Adaptación del Instrumento”, “Pruebas con el Instrumento”, “Análisis y exposición de las cualidades psicométricas del instrumento” y “Promoción del Instrumento Adaptado”. La metodología utilizada, en apego a las fases propuestas por Geissenger (1994), se describe a continuación. Etapa 1: Adaptación del instrumento Esta etapa está determinada por la revisión y redacción de los criterios adecuados con los que se presentará la prueba en su versión final. Tuvo por objetivo traducir el inventario con las palabras más apropiadas para cada ítem de modo que resulten lo mejor comprensibles para la población costarricense. Estuvo conformada por los tres primeros pasos que propone Geissenger (1994). Traducción y adaptación del instrumento Consiste en una valoración de si el instrumento amerita ser traducido de su lengua original pregunta por pregunta. En el caso del BDI –II, su idioma original es el inglés, lo cual obliga su traducción. Para esto se trabajó en varias subfases paralelas: 1. Traducción de la prueba. Se realizaron dos procesos simultáneos: a. Traducción de la prueba por parte de un traductor. Se contó con un traductor graduado de la Carrera de Bachillerato en Inglés de la Universidad de Costa Rica. Esta se encuentra en el Anexo 6 b. Traducción por parte del investigador responsable del proyecto. En paralelo a la traducción del primero, el investigador también tradujo la prueba por su cuenta. Esta se encuentra en el Anexo 7 62 2. Comparación y unificación de las dos versiones. Una vez obtenidas ambas versiones, las mismas se unificaron. Ver Anexo 8 3. Comparación con la versión española y argentina. La versión resultante se comparó con las dos versiones que existen en el idioma español. 4. Redacción de un borrador. Al final se creó un primer borrador o propuesta de lo que sería el BDI II. Con esto termina la primera fase. Ver Anexo 9. Revisión de la versión traducida o adaptada En esta fase el borrador que surgió de la fase anterior se les administró a distintas personas con el fin de que evaluaran y valoraran la calidad de la traducción. Se tomaron en cuenta los criterios de dos tipos de jueces, un primer grupo compuesto por profesionales en Psicología y un segundo compuesto por personas de Población General. Con el primer grupo de jueces se determinaron aspectos de forma y estructura, apego a la esencia teórica del instrumento original, así como la conformidad con el lenguaje inclusivo y claridad gramatical del instrumento. Se les facilitó un folleto en el cual se incluía la versión original en inglés, la versión en español y el borrador de la Adaptación. Con el segundo grupo de jueces se evaluó el proceso de respuesta y la manera en que los ítems presentados les eran comprendidos, para ello se utilizó como base la Guía de Entrevista Cognitiva adaptada por Smith y Molina (2011) para la aplicación en la elaboración y mejoramiento de instrumentos de papel y lápiz (ver Anexo 10).Este procedimiento a pesar de que no conforma la propuesta de Adaptación de Geissenger (1994), se utilizó de forma adicional al proyecto con el fin que garantizase validez a la investigación. Los criterios de inclusión fue el siguiente: No debían contar con conocimientos avanzados de la psicología No podían estar vinculados a alguna carrera de Psicología en alguna Universidad No podían tener experiencia en la administración de cuestionarios de algún tipo. Únicamente se pretendió analizar si el documento resultaba comprensible por la población general. Se contó con 5 hombres y 5 mujeres, con edades desde los 18 hasta los 75 años, desde Primaria incompleta hasta estudios Universitarios, distribuidos de la siguiente forma: 63 Tabla 2: Distribución sociodemográfica de participantes Entrevista Cognitiva Sujeto A Sujeto B Sujeto C Sujeto D Sujeto E Sujeto F Sujeto G Sujeto H Sujeto I Sujeto J Género Nivel Educativo Edad M F F M M M F F M F Universidad Completa Estudios ParaUniversitarios Primaria Incompleta Primaria Completa Secundaria completa Universidad Incompleta Universidad Completa Secundaria Incompleta Universidad Completa Secundaria Completa 30 27 50 55 24 25 35 18 26 75 Adaptar el borrador del instrumento con base en las sugerencias de los jueces Consistió en una valoración de las correcciones ofrecidas por los profesionales en la fase anterior y una modificación de la prueba según las indicaciones ofrecidas por los jueces. Al realizarse dicha integración, la prueba se sometió finalmente a dos procesos de esta fase: una traducción inversa y posteriormente una revisión y corrección por parte de un profesional en Filología. Traducción Inversa o Comparación “Back Translation”: Consiste en una traducción del borrador del idioma español al inglés, con el fin de determinar si existen diferencias significativas inadmisibles entre el borrador en español y la versión en inglés. De existir tales diferencias, las mismas se examinan y se considera el planteamiento de posibles aspectos que sean dignos de modificación. Dicha traducción inversa estuvo a cargo de un traductor distinto del primero, con el fin de reducir las posibilidades de sesgos en la información que se proporcione. Revisión Filológica: Al final, el documento fue analizado por un profesional en Filología, con el fin de corroborar la estructura gramatical y redacción de la prueba. La versión final resultante se adjunta en el Anexo 11. 64 Etapa 2: Pruebas con el instrumento Una vez realizada la traducción y adaptación del instrumento, fue necesario comprobar su comportamiento en cuanto a la aplicación y sus propiedades psicométricas. Para lograr esto, se realizaron varias aplicaciones con el instrumento resultante de la Etapa 1, pretendiendo que la puntuación refleje la realidad de la muestra en relación con el constructo de la prueba. El objetivo al que obedece es el de evaluar la comprensión de los ítems del inventario desde la perspectiva de una sub muestra de personas de la población general. Le conforman las siguientes fases de igual manera propuestas por Geissenger (1994): Prueba piloto del instrumento El borrador final se aplicó a una población de prueba, con el objetivo de observar el comportamiento del instrumento en una posterior prueba de campo. Según Geissenger (2004) esta fase es necesaria en el sentido que dilucida ciertos problemas que puedan surgir en un futuro. Se trabajó con 40 personas de población general ubicados en el parque Central de San José. Se les administró consentimiento informado (Anexo 4) y la adaptación del cuestionario BDI II. Con el fin de determinar tiempo de duración, comprensión de los ítems y dificultades de lectoescritura se utilizó una plantilla de observación que el evaluador iba llenando conforme las personas terminaban el cuestionario. La misma se encuentra en el Anexo 5. Prueba de campo En esta fase la adaptación final del BDI-II con las debidas correcciones realizadas y habiendo tomado en cuenta que la prueba piloto no se evidenciaron grandes dificultades con respecto a la comprensión de los ítems, se aplicó a la muestra del GAM. Para Geissenger (1994) en este caso la muestra debe ser poseer representatividad a nivel poblacional, sujeto a criterios estadísticos con el fin de garantizar la generalizabilidad de los resultados obtenidos. A su vez, para disminuir al máximo las posibilidades de valores perdidos, siempre se contó con la presencia y fiscalización del investigador, garantizándose que la prueba fuera contestada en su totalidad. Básicamente, se utilizaron dos tipos de muestra, ambas del Gran Área Metropolitana: Una derivada de la población general y otra de la población clínica 65 Población General Con el objetivo de revisar los criterios de validez y fiabilidad de la prueba, con respecto a la validez interna se utilizó una muestra de 53 personas para el procedimiento test-retest; mientras que para la validez convergente y divergente se les aplicó a 251 personas en conjunto con el BDI-II el instrumento MDI (Multiscore Depression Inventory, adaptado en 1997 Anexo 12) y el Possitive and Negative Affect Schedule (Escala de afecto positivo y negativo PANAS Anexo 13). En total, se contó con 618 personas de población general de las cuales A 251se les administró BDI, MDI, PANAS A 53test-retest A 314 únicamente BDI La selección del Multiscore Depression Inventory responde a que es el único instrumento de depresión adaptado en el país, siendo el de mayor uso por parte de la CCSS. Contrastar el BDI II con este aportaría un buen criterio de convergencia. La selección del PANAS se realizó con la intención de contar con un instrumento que incluyese en sí mismo alguna medida que distanciara del constructo de Depresión. El PANAS cuenta con una escala de afecto positivo, que permitiría evaluar este criterio de divergencia. De forma adicional al proyecto se diseñó además una versión digital en línea de la Adaptación del Instrumento. Esta se realizó con el programa Lime Survey, obteniéndose 63 personas participantes, la consecución de las mismas fueron obtenidas por medio de la red social Facebook, desde el cual se les enviaba un mensaje privado con la solicitud de participación, además del link desde el que podrían tener acceso al cuestionario. Población Clínica En términos precisos, población que presenta sintomatología básica de Trastorno de Depresión Mayor según criterios del DSM-V (APA 2013), tomándose en cuenta referencias realizadas únicamente por evaluaciones de profesionales en psicología, tanto de los servicios de la CCSS, la clínica de Tibás, como de consulta clínica privada. 66 En el caso de la CCSS, fue necesario enviar el proyecto a revisión del Comité Local de Bioética en el Max Peralta de Cartago, documentos entre los cuales fue necesario diseñar una propuesta y aprobar un curso de Bioética. Se escogió la población del Hospital Psiquiátrico Roberto Chacón Paut, precisamente en la Unidad de Intervención en Crisis por dos razones: Es una población cautiva (interna), por tanto ofrece facilidades tanto al investigador como a los participantes en la recolección de los datos. En otros centros hubiese sido necesario que los participantes se movilizaran a la institución, al alterar su propia rutina diaria, muchos no asistirían a la cita. Los comités de Bioética exigen que el traslado de los participantes al Centro sea reembolsado excediendo los recursos económicos de la investigación. En el Chacón Paut, se exime este rubro al estar internados. En la Clínica de Tibás se pudo contar con la participación de 12 personas, siendo los mismos pacientes del servicio de Psicología de la misma. La Clínica de Tibás es una institución de Salud privada en este país, así como la que corresponde a los sectores de Pavas, Santa Ana y Santo Domingo de Heredia. A estas 4 cooperativas se les externó la solicitud, siendo la de Tibás la única que respondió. Finalmente, 12 fueron aportados de parte de profesionales en Psicología. A estos se les leía el consentimiento y se les pasaba la versión adaptada del BDI-II. De esta forma se pudo obtener una muestra de 79 personas población clínica, de las cuales: a 30 se les administró BDI, MDI, PANAS mientras que a 49 únicamente BDI. 67 Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento Una vez obtenidos todos los datos necesarios, se procedió a una revisión y exposición de los principales datos de la prueba como instrumento de medición viable. Para conseguir dicha revisión, en esta fase se dio una sistematización de toda la información obtenida en las pruebas de campo con los programas de análisis estadístico SPSS y de ecuaciones y modelos estructurales AMOS. En esta fase se revisó indicadores de validez y fiabilidad de la prueba y dando por terminada la adaptación de la misma, al adecuar los puntos de corte en función de las necesidades locales, estableciendo así una revisión de las principales garantías psicométricas. Estandarizar las puntuaciones Para Geissenger (1994) una vez que se han administrado los cuestionarios, los resultados se computan y se establecen normas que correspondan exclusivamente a la muestra meta con base en los criterios diagnósticos establecidos por la misma prueba. El autor indica que también se debe valorar la necesidad de replantear algunos ítems ya sea modificándolos o en caso estrictamente necesario eliminándolos. En el caso del BDI-II, al tratarse de una prueba que no presenta baremos dentro de su corrección, no es necesaria la estandarización. Sin embargo si fue necesaria una comprobación de los cuatro modos de intensidad que la misma ofrece: “Mínimo”, “Leve”, “Moderado” y “Severo”. De esta manera la consolidación de los puntos de corte ofrecería un indicador a futuro de la posible ubicación de un paciente dentro del espectro depresivo para nuestro país. Dado que el objetivo de esta fase consiste en determinar que la prueba cuenta con garantías suficientes per se para demostrar que mide con integridad, consistencia y veracidad, se evidencia a través de los indicadores de fiabilidad con los siguientes procedimientos: Relacionados con la Estabilidad de la medida: Procedimiento Test Retest a través de Correlaciones Pearson/Spearman Relacionadas con la Homogeneidad de la medida: Alfa de Crombach 68 Relacionadas con la Objetividad de la medida: No fueron necesarias pruebas en este rubro ya que se utiliza para pruebas en la que influye la subjetividad del evaluador, tales como instrumentos de evaluación en creatividad, de motivación, pruebas proyectivas. El BDI II es una prueba cuya puntuación goza de objetividad, ya que se obtiene por la sumatoria de valores en los ítems. Realizar una investigación sobre la validación del instrumento Consiste en una revisión para determinar si el instrumento mide lo que pretende medir (validez). Con respecto a indicadores de validez se realizaron los siguientes procedimientos: Validez de contenido: Criterio de Acuerdo Interjueces Este tipo de validez se indagó por medio de un cuestionario de criterio interjueces (Anexo 15). En el mismo cada juez debía anotar un número en escala del 1 al 4 para cada ítem siguiendo la siguiente clasificación de 4 puntos: 1. No relevante 2. Algo relevante 3. Muy relevante 4. Totalmente relevante Al final se promediaría el estimado de cada juez, obteniéndose un estadístico representativo de la validez de contenido. Validez Estructural: Análisis factorial exploratorio y confirmatorio Primero se realizó una prueba KMO y de esfericidad de Bartlett con el fin de verificar si un posible análisis factorial se adecua a la muestra. Al proceder con el Análisis Factorial Exploratorio, se utilizó una rotación Oblicua (Promax), por cuatro razones: 69 Se trata de un cuestionario monorrasgo y por tanto los supuestos factores e incluso los mismos ítems del BDI están correlacionados entre si Dada la naturaleza del constructo de Depresión y su característica tendencia a experimentar de forma simultánea síntomas negativos a la vez. Beck en su estudio inicial utilizó una rotación Promax, que es Oblicua. Cuarto el resultado del test de esfericidad de Bartlett apoya el supuesto de que las variables están muy intercorrelacionadas entre sí. Esta rotación Oblicua se acompañó además de una normalización de Kaiser.Posteriormente se obtuvo la Matriz Estructural y de Configuración así como la correlación entre factores Una vez realizado el análisis factorial exploratorio se realizó un análisis factorial confirmatorio con el fin de corroborar la distribución de las cargas para cada factor. Validez Concurrente/discriminante: Correlaciones con MDI y Panas Por lo general, en otras adaptaciones del BDI II a otros contextos se utilizan pruebas vinculadas al constructo de Ansiedad con el fin de dilucidar la validez divergente (Wang & Gorenstein, 2013). No obstante este procedimiento puede tener un sesgo implícito, ya que como reflexionan Agudelo, Buela Casal y Spielberger (2007) el constructo de Depresión y el de Ansiedad al presentar comorbilidad entre la sintomatología de cada uno, es difícil distinguir si realmente se trata de constructos diferentes, radicando en un problema de diferenciación diagnóstica entre ambos. De esta forma, basar resultados de convergencia y divergencia en función de dicha correlación puede resultar perjudicial para la investigación. De esta forma se contó con la administración tanto de la versión adaptada del BDI II en conjunto con la versión del Multiscore Depression Inventory adaptada en Costa Rica y la escala de Afecto Positivo y Negativo PANAS. La validez convergente estaría representada por el grado en que las puntuaciones del BDI II correlacionan de forma positiva con el MDI y con la escala de Afecto Negativo del PANAS, mientras que la divergente en función de la correlación negativa con la Escala de Afecto Positivo, sugiriendo discrepancia entre ambas. 70 Validez diagnóstica: Análisis de medias entre poblaciones. Puntos de corte y Curva COR Como se indicaba en párrafos anteriores, la Validez de diagnóstico se refiere a la precisión con la que se realizan las decisiones de clasificación. Esto se garantizará delimitando los puntos de corte. Beck en su estudio inicial propone 4 puntos de corte. La puntuación del BDI II se obtiene por medio de la sumatoria de cada elección de los 21 ítems. Cada ítem es codificado en una escala de 4 puntos, que van de 0 a 3. El máximo posible correspondería a 63 (21 x 3) y el mínimo 0. Se garantiza que la puntuación máxima del test se conserve, sin embargo los 4 puntos de corte internos se modificaron en función de las sugerencias de los análisis estadísticos derivados de la muestra participante. Cada rango de puntuación albergaría el 25% de la muestra, de modo que la agrupación se realizó percentilar. También se utilizó el procedimiento de Curva COR, con el fin de identificar distintos modelos de especificidad y sensibilidad. Etapa 4: Promoción del Instrumento Adaptado En esta Etapa se desglosan dos fases finales, relacionadas con la publicación acerca de las garantías psicométricas de la Adaptación, Normas de Interpretación y Condiciones de uso. El objetivo es dar a conocer el instrumento entre representantes profesionales que estén interesados en el uso del instrumento a futuro. Por tanto ambas fases tienen que ver con la divulgación. Desarrollo de manuales y otros instrumentos para el conocimiento de la versión. Para Geissenger (1994), en este aspecto al diseñar un cuestionario de evaluación se tiene como responsabilidad la confección de manuales para el instrumento, donde se indique la evidencia sobre la validez y confiabilidad del mismo. En cuanto a una adaptación se deben 71 incluir las normas de aplicación e interpretación de los resultados, así como guías para su correcta aplicación. Es importante también una comparación entre las características locales y las originales. Se diseñó un Manual de uso para el BDI-II en Costa Rica. Este Manual de uso se adjunta como Anexo 16 Entrenar a los usuarios Se refiere al desarrollo de capacitaciones para la correcta utilización del instrumento. Esta se brindó a estudiantes de Psicología en medio de su Trabajo Final de Graduación, ya que desde el mismo utilizarían el BDI-II. También se brindó a funcionarios del Instituto Wem. Los contenidos de dicha capacitación fueron: Características generales del BDI, Desarrollo y evolución Proceso de adaptación a Costa Rica Características Psicométricas de la Adaptación Administración y puntuación del BDI A futuro se pretende una mayor promoción del instrumento, en función de la demanda de instituciones que así lo requieran. Análisis de los datos Los casos que se consideraron inválidos se eliminaron, no obstante, se intentó reducir la frecuencia de datos perdidos con la presencia del investigador en la toma de ellos, asegurando que las personas hayan marcado todas las casillas. Para el análisis de los datos se utilizó los paquetes estadísticos SPSS y AMOS (SPSS Inc.). Protección a los sujetos Se garantizará confidencialidad, custodia, anonimato y después de 10 años la eliminación de protocolos, asegurando que los datos que aportaron los sujetos no se publiquen abiertamente cuando esta información pueda identificarles por un tercero. El análisis de los datos si se publicará, pero al realizarse de forma general impedirá evidenciar cualquier tipo de resultado personal. El Consentimiento Informado se le brindó a cada persona en conjunto con la prueba. Ver Anexo 3. 72 Resultados ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA RESULTADOS Siguiendo en apego a los tres ejes descritos al inicio del apartado de Metodología, se describirán los resultados en función de las cuatro etapas propuestas por Geissenger (1994). Etapa 1: Adaptación del instrumento En esta etapa se traduce tal como lo describe la Metodología el cuestionario desde su idioma original. El criterio interjueces fue de especial importancia, ya que brindó aportes para la versión final. Al trabajarse con dos grupos se obtuvieron los siguientes resultados: Grupo Profesionales en Psicología Los aportes de los profesionales en Psicología tuvieron mayor peso en aspectos de forma, claridad de los ítems y modificaciones en el diseño de la prueba. Algunos aportes fueron excluidos ya que consideraban modificar aspectos básicos de la prueba, siendo los mismos esenciales en la misma. Se valoraron los aportes de los mismos, palabras que concordaban mejor que otras, propuestas de morfología y sintaxis y hasta tamaño de letra. Algunas de las acotaciones más destacadas fueron: Utilizar inutilidad en lugar de baja autoestima Utilizar sentimientos de culpa en lugar de percepción de culpa Utilizar disconformidad con mi mismo en lugar de autodisconformidad Grupo Personas Población General: Entrevista Cognitiva En general el grupo de personas que colaboraron manifestaron una comprensión adecuada del mismo, opinando que el lenguaje utilizado les resultaba comprensible y familiar. En ocasiones algunos ítems necesitaron de clarificación ya que comentaban se podían interpretar desde varias formas, tal es el caso de Sentimientos de Castigo: referente a la posibilidad de si el castigo es autoinfligido o si se refiere a algo más genérico y abstracto (La vida me castiga, Dios me castiga) 74 Inquietud: Acerca de si el ítem estaba ligado a Ansiedad o exceso de energía. Irritabilidad: en un caso se preguntó si se refería a irritabilidad de carácter o irritabilidad física (piel) Con respecto al formato, el tamaño de letra les pareció adecuado (a excepción de las instrucciones), así como el orden de las preguntas. En los reactivos “Cambios en el patrón de sueño” y “Cambios en el Apetito”, indicaron no tener dificultades en los mismos, a pesar de que variaba el formato. A continuación se muestra una tabla unificada desde la cual se describe lo encontrado a partir de cada categoría de la Entrevista Cognitiva. Tabla 3: Aportes de Participantes de Entrevista Cognitiva con respecto al Instrumento Tarea INSTRUCCIONES: Identificar problemas en todas las introducciones, instrucciones o explicaciones desde la perspectiva del encuestado Problema Introducciones, instrucciones o explicaciones complicadas, confusas o vagas. Aporte de los participantes Las instrucciones son claras. El tamaño de letra es muy pequeño. La mayoría insiste en que hasta leer el documento las entenderán completamente CLARIDAD DE LAS PREGUNTAS O REACTIVOS: Identificar problemas relacionados con la intención o significado de las preguntas La pregunta es muy larga o rara, la sintaxis es compleja, la redacción es incorrecta Los términos técnicos están poco definidos, son muy complejos, no están claros Existen múltiples formas de interpretar la pregunta, la redacción es vaga o ambivalente. Los períodos de tiempo no están especificados, son vagos o contradictorios. En este rubro no hubo sugerencias o dudas Los supuestos sobre la situación del entrevistado o su experiencia son inapropiados. Se asume una experiencia o conducta constante y estable que en realidad puede variar. No aplica SUPUESTOS: Determinar si existen problemas con los presupuestos o la lógica subyacente a las preguntas El reactivo contiene más de una pregunta implícita o hace referencia a más de un objeto actitudinal. CONOCIMIENTO /MEMORIA: Verificar si los encuestados tienen problemas para saber o recordar la información que se solicita. La persona no tiene conocimiento sobre el tema y es probable que no tenga una actitud al respecto La actitud (evaluación) al respecto puede no estar consolidada o no existe El entrevistado puede no recordar la información solicitada. La pregunta requiere de un proceso En este rubro no hubo sugerencias o dudas En este rubro no hubo sugerencias o dudas No aplica En algunos casos hubo dudas en cuestión de temporalidad, pero luego recordaban que en las instrucciones decía “15 días” No se presentó No se presentó No aplica No se presentó No se presentó 75 mental complejo. SENSIBILIDAD: Revise las preguntas o palabras de naturaleza sensible La pregunta hace referencia a tópicos privados, embarazosos, que implican conductas no deseadas o ilegales. La redacción de los reactivos o los términos utilizados son poco sensibles, ofensivos o ajenos a la experiencia de los entrevistados. El reactivo evoca respuestas socialmente aceptadas (deseabilidad social). CATEGORÍAS DE RESPUESTA: Verifique qué tan adecuadas son las categorías de respuesta de cada pregunta No se presentó. El investigador consulta sobre el último ítem relacionado con “Interés en el Sexo” y todos contestan que las palabras que se utilizan son adecuadas. No se presentó No se presentó Las preguntas abiertas son difíciles o inapropiadas. Existe desajuste entre la pregunta y las categorías de respuesta. No aplica Los términos técnicos en las opciones de respuesta son poco claros, complejos o están sin definir. En algunas ocasiones se presentaron dudas con respecto a los siguientes ítems: Inutilidad Irritabilidad No obstante no eran del todo significativas No se presentó Las categorías de respuesta pueden ser interpretadas de múltiples maneras (vaguedad). Existe un traslape entre las categorías de respuesta. Hay opciones de respuesta ausentes. El orden de las categorías de respuesta es ilógico En algunas ocasiones se presentaron dudas con respecto a los siguientes ítems: Cambios en el apetito Hábitos de sueño No aplica No se presentó En algunas ocasiones se presentaron dudas con respecto a los siguientes ítems: Sentimientos de castigo A partir del criterio de Interjueces, se generó la versión final del Inventario (Ver Anexo 11), respaldada por los cambios sugeridos por la Traducción Inversa y la Revisión Filológica. 76 Etapa 2: Pruebas con el Instrumento En esta etapa, se procedió directamente a las pruebas de campo con el documento final, corregido apropiadamente según todas las sugerencias y controles de la fase anterior. Los resultados para cada fase se detallan a continuación: Fase de pruebas piloto. Se les administró el cuestionario a 40 personas. La plantilla trascrita con los datos de los participantes se adjunta en el Anexo 14. Se obtuvo un promedio de duración de 11 minutos 52 segundos por cuestionario (5:59 consentimiento; 5:53 cuestionario). De acuerdo a la figura 2, la Comprensión de los ítems fue adecuada, en tanto un 87% de los participantes no hicieron preguntas, un 10% una pregunta y un 3% más de una pregunta. Comprensión de items 10% 3% No hace preguntas Hace 1 pregunta 87% Hace 2 o 3 preguntas Figura 2: Comprensión de Ítems, Pruebas Piloto Por su parte, la figura 3 denota que no hubo dificultades en lectoescritura sobresalientes, siendo que un 90% no requirieron apoyo frente a un 10 % restante que si lo solicitó Dificultades lectoescritura 10% No requiere apoyo 90% Requiere Apoyo en la lectoescritura Figura 3: Dificultades en Lectoescritura Pruebas Piloto 77 Fase de pruebas de campo Estadísticos Descriptivos con población General Los análisis descriptivos con respecto al total de la muestra de población general se presentan a continuación. Para la población general se obtuvo una media de 9.68. Según la Tabla 4, con respecto a la variable Sexo, del total de casos válidos, 297 corresponden a la variable Masculino y 320 a la variable Femenino obteniendo un promedio de 9.76 y 9.54 respectivamente. Como se puede apreciar en la tabla 5, dichas diferencias no son significativas. Tabla 4: Diferencias de Medias por variable Sexo Población General Sexo N Media Desviación típ. Error típ. de la media Masculino 297 9.76 9.338 .542 Femenino 320 9.54 8.262 .462 Tabla 5: Pruebas T y Levene de medias para variable sexo. Población General Prueba de Prueba T para la igualdad de medias Levene para la igualdad de varianzas F Sig. 5.194 .023 t gl Sig. Difere Error 95% Intervalo de (bilat ncia típ. de confianza para la eral) de la diferencia media diferen Inferior s cia Superior .302 615 .763 .214 .709 -1.178 1.606 .300 592 .764 .214 .712 -1.184 1.612 Se han asumido varianzas iguales No se han asumido varianzas iguales 78 Con respecto a los grupos de Edad, en la tabla 6 se aprecia las diferencias entre rangos de edad. De la misma se puede apreciar como las diferencias entre promedios no son sustanciales, siendo el más alto el del grupo de 66 años en adelante y el menor el de 45 a 55 años. Tabla 6: Diferencias de medias por rangos de Edad Población General GrupoEdad N Media Desv. típ. 18-25 297 9.74 8.520 26-35 124 10.91 9.913 36-45 102 8.73 8.111 46-55 59 8.14 8.355 56-65 26 9.31 8.698 66 en adelante 4 15.25 15.564 Las diferencias por provincias se aprecian en la tabla 7. San José recoge el promedio más alto y Alajuela el más bajo. Tabla 7: Diferencias de medias por Provincia del GAM Provincia N Media Desv. típ. San José 368 10.45 9.426 Alajuela 88 7.59 8.299 Cartago 76 8.83 5.963 Heredia 45 8.67 7.891 79 Por último con lo que corresponde a Nivel Educativo, la tabla 8 revela una sutil tendencia a la disminución de los promedios arrojados por el BDI en cuanto se presenta un mayor nivel educativo. Tabla 8: Diferencias de medias por Variable Nivel Educativo Nivel Educativo N Media Desv. típ. Primaria incompleta 6 17.50 14.433 Primaria completa 31 10.65 9.478 Secundaria incompleta 58 11.40 10.115 Secundaria completa 108 9.98 9.638 Estudios parauniversitarios 26 10.15 8.303 Universidad incompleta 243 9.29 8.233 Universidad Completa 135 8.73 8.188 Total 607 9.68 8.840 Estadísticos Descriptivos Cuestionarios Online Con esta muestra de cuestionarios obtenidos de forma digital, según la Tabla 9 se registra una media de 10.90 con una desviación estándar de 8.67 para 61 sujetos. De estos, 34 correspondían a la variable Masculino y 27 a la variable Femenino. A pesar de la sutil diferencia entre medias para ambas variables, la diferencia entre las mismas según la Tabla 10 no es significativa. Tabla 9: Diferencias de Medias por variable Sexo Muestra de cuestionarios On line Sexo N Media Desv. típ. Masculino 34 10.32 7.888 Femenino 27 11.63 9.684 Total 61 10.90 8.677 80 Tabla 10 Pruebas T y Levene de Medias para variable Sexo. Muestra de cuestionarios On line Medias BDI Se han asumido varianzas iguales No se han asumido varianzas iguales Prueba de Levene para la igualdad de varianzas Prueba T para la igualdad de medias F Sig. t .340 .562 gl Sig. (bilater al) Diferencia de medias Error típ. de la diferencia -.581 59 .564 -1.306 2.249 95% Intervalo de confianza para la diferencia Inferior Superior -5.807 3.195 -.567 49.738 .573 -1.306 2.303 -5.932 3.320 Con respecto a la variable grupos de edad, tal como indica la Tabla 11, la media más alta es obtenida por el grupo de 36 a 45 años y la más baja por el grupo de 46 a 55. Solo se registra un caso de este último grupo. El grueso de la muestra se sitúa en los primeros grupos. La muestra carece de sujetos en el grupo de 55 a 65 y de 66 en adelante. Tabla 11: Diferencias de medias por rangos de Edad Muestra de cuestionarios On line Grupo Edad N Media Desv. típ. 18-25 30 10.40 7.850 26-35 25 11.40 9.115 36-45 5 12.20 13.217 46-55 1 7.00 . Total 61 10.90 8.677 81 Finalmente en cuanto a diferencias por nivel educativo, en la tabla 12 se puede apreciar como la muestra se concentra en las variables Universidad incompleta y Universidad Completa. La mayor media es alcanzada por el grupo de Secundaria Completa y la menor en el que corresponde a Estudios parauniversitarios. Tabla 12 Diferencias de medias por Variable Nivel Educativo Cuestionarios On line Nivel Educativo N Media Desv. típ. Secundaria completa 5 12.40 4.159 Estudios parauniversitarios 2 7.50 9.192 Universidad incompleta 26 10.54 8.434 Universidad Completa 28 11.21 9.708 Total 61 10.90 8.677 Estadísticos Descriptivos Población Clínica Con población clínica según la Tabla 13 se desprende una media total en la puntuación del BDI de 33.00, con una desviación estándar de 10.785 para los 79 casos válidos. Tabla 13: Media Puntuación BDI población Clínica N Mínimo Máximo Media Desv. típ. Puntuación BDI-II 79 9 55 33.00 10.785 N válido (según lista) 79 Para la variable Sexo, en la Tabla 14para el total de los 79 casos válidos, se aprecian 11 de la variable Masculino y 68 de la variable Femenino. Se denotan diferencias entre ambas medias, siendo superior la de variable de sexo Femenino. No obstante a pesar que la tabla 15 considere que estas diferencias poseen significancia estadística, no es adecuado realizar este tipo de inferencia a falta de una muestra mayor que garantice mayor comparabilidad. 82 Tabla 14: Diferencias de Medias por variable Sexo Población General Puntuación BDI-II Sexo N Media Desviación típ. Error típ. de la media Masculino 11 24.27 6.944 2.094 Femenino 68 34.41 10.662 1.293 Tabla 15 Pruebas T y Levene de medias para variable sexo. Población Clínica Se han asumido varianzas iguales No se han asumido varianzas iguales Prueba de Levene para la igualdad de varianzas F Sig. Prueba T para la igualdad de medias t gl Sig. (bilateral) Diferencia de medias Error típ. de la diferencia 4.178 -3.042 77 .003 -10.139 3.333 95% Intervalo de confianza para la diferencia Inferior Superior -16.776 -3.502 -4.120 18.677 .001 -10.139 2.461 -15.295 .044 -4.983 Con respecto a la variable Edad, las medias en las puntuaciones por grupo de edad se recogen en la tabla 16. En la misma se denota como el grupo que puntúa más alto es el de 26 a 35 años, mientras que el grupo más bajo es el de 56-65 años. Tabla 16: Diferencias de medias por rangos de Edad Población Clínica Grupo Edad N Media Desv. típ. 18-25 8 32.63 11.856 26-35 18 35.44 9.919 36-45 15 30.67 12.670 46-55 15 33.33 9.092 56-65 11 30.64 13.801 66 en adelante 10 33.80 9.555 Total 77 32.91 10.910 83 En cuanto a Nivel educativo, tal como lo señala la tabla 17, hay una sutil disminución en cuanto a la media en función de un mayor nivel educativo, mostrándose un aumento con la variable Universidad completa. Tabla 17: Diferencias de medias por Variable Nivel Educativo Nivel Educativo N Media Desv. típ. Primaria incompleta 4 40.25 11.236 Primaria completa 16 31.06 12.751 Secundaria incompleta 12 31.67 11.404 Secundaria completa 9 34.11 9.413 Estudios parauniversitarios 3 31.00 6.245 Universidad incompleta 8 28.13 8.855 Universidad Completa 23 35.09 10.488 Total 75 32.93 10.786 84 Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento Evidencias de Fiabilidad Estabilidad de la Medida La prueba test Retest, aplicada en 51 participantes de población general a un espacio de 15 días entre cada aplicación, tal como indica la Tabla 9 revela un coeficiente de correlación de Pearson de .954 entre una aplicación y la otra. Este resultado indica que la prueba presenta adecuados indicadores de Fiabilidad en cuanto a la Estabilidad de la Medida. Tabla 18: Estadísticos de Fiabilidad Test Retest Alfa de Cronbach Correlacion entre formas Correlacion Spearman-Brown Parte 1 Valor N de Items Parte 2 Valor N de Items Total N de Items .901 21 .935 21 42 .954 Longitud igual .976 Longitud desigual .976 Coeficiente de Guttman Dos mitades .975 Homogeneidad de la Medida Tal como indica la Tabla 19, los coeficientes Alfa de Cronbach presentan una alta correlación delos ítems de la prueba entre sí, siendo suficiente para garantizar la fiabilidad de la escala. Tabla 19: Alpha de Crombach en las distintas muestras Coeficiente Alfa de Crombach Población General .908 Cuestionarios En Línea .891 Población Clínica .885 85 Evidencias de Validez Validez de Contenido Se contó con 3 participantes expertos, dos Máster en psicología y un licenciado. Al promediar la calificación de los tres y estandarizarlo en escala 0 a 1, el promedio final fue de .84. Dicha media es un criterio aceptable que ofrece garantía de la validez de contenido del instrumento. Las puntuaciones para el resto de ítems se muestran en la tabla 20. En la misma se puede apreciar que el ítem que recibe menor puntuación es Agitación, mientras que Tristeza, Pesimismo, Disconformidad con mi mismo, Pensamientos o deseos de Suicidio, e Inutilidad consiguieron puntuación perfecta por parte de los tres jueces. Tabla 20: Promedio de Puntuaciones dadas por los jueces expertos a cada ítem Reactivo Puntuaciones Puntuaciones Puntuaciones Promedio Total Juez 1 (1-4) Juez 2 (1-4) Juez 3 (1-4) (Escala 0-1) Tristeza 4 4 4 1 Pesimismo 4 4 4 1 Fracasos del pasado 4 4 3 0,92 Pérdida de Satisfacción 3 4 3 0,83 Culpa 4 3 3 0,83 Sensación de Castigo 4 2 3 0,75 Disconformidad 4 4 4 1 Autocriticas 4 4 2 0,83 Suicidio 4 4 4 1 Llanto 4 2 3 0,75 Agitación 4 2 1 0,58 Perdida de Interés 4 4 3 0,92 Indecisión 4 3 3 0,83 Inutilidad 4 4 4 1 Energía 4 2 4 0,83 Sueño 4 2 3 0,75 Irritabilidad 4 3 2 0,75 Apetito 3 2 4 0,75 Concentración 4 2 3 0,75 Cansancio 4 3 3 0,83 Interes sexual 4 3 3 0,83 86 Validez Estructural Para este estudio se llevaron a cabo dos tipos de análisis factoriales: Exploratorio y confirmatorio para ambas muestras, General y Clínica. Análisis Factorial Exploratorio Población General Tal como indica la Tabla 21 el test de esfericidad de Bartlet y la prueba KMO para población general arrojan puntuaciones aceptables, para el test de adecuación muestral (KMO) se considera una excelente adecuación muestral al superar el .9; el test de esfericidad de Bartlett permite asumir el supuesto de que las variables están intercorrelacionadas y anuentes a un análisis factorial. Tabla 21: KMO y Test de Esfericidad Bartlett Población General Medida de Adecuación Muestral Kaiser Meyer Olkin Test de Esfericidad de Bartlet Chi cuadrado aproximado .931 3.804E3 df 210 Sig. .000 En la Tabla 22 se presenta los resultados del total de la varianza explicada por los dos principales factores presentados. La extracción de componentes indica 2 autovalores superior a 1 y por tanto 2 factores. Esto se ampara en la Figura 5 en la cual se aprecia como a partir del segundo factor la línea se aplana. Dados estos dos criterios, se puede considerar válida la presencia de dos factores que engloban el conjunto de reactivos. 87 Tabla 22: Total de la Varianza Explicada por los autovalores Factor Autovalores Iniciales Total % de % Varianza Acumulativo 1 6.869 32.710 32.710 2 1.487 7.080 39.790 3 1.097 5.222 45.012 4 1.029 4.900 49.912 5 .867 4.130 54.042 6 .866 4.122 58.164 7 .838 3.989 62.154 8 .750 3.571 65.725 9 .728 3.468 69.193 10 .701 3.339 72.532 11 .671 3.196 75.728 12 .631 3.006 78.733 13 .620 2.951 81.684 14 .580 2.762 84.447 15 .551 2.624 87.071 16 .541 2.576 89.647 17 .510 2.429 92.076 18 .468 2.229 94.305 19 .416 1.979 96.284 20 .400 1.903 98.188 21 .381 1.812 100.000 Método de Extracción: Principal Axis Factoring Sumas de la Extracción de Cargas al Cuadrado Total % de Varianza 6.226 29.646 .869 4.136 Sumas de la Rotación de Cargas al Cuadrado % Acumulativo Total 29.646 33.782 5.636 4.867 Figura 4: Gráfico de Sedimentación 88 En las tablas: Matriz de Patrones (Tabla 23) y Matriz Estructural (Tabla 22), se aprecia el peso de distribución de las cargas factoriales de cada ítem con respecto a los dos factores mencionados. Por último, se presenta una correlación entre ambos factores de .655, dato que evidencia una alta asociación entre ambos factores. Tabla 24: Matriz de configuración Tabla 23: Matriz Estructural Componente 1 2 .644 .414 .644 .414 .634 .353 .519 .637 .544 .415 .687 .349 .717 .520 Componente 1 2 .653 .653 .706 .179 .519 .477 .102 .803 .660 .087 Tristeza Pesimismo Fracasos del pasado Pérdida de Satisfacción Sentimientos de culpa Sensación de Castigo Disconformidad con mi mismo Autocriticas .632 .541 Pensamientos o .789 .575 deseos de Suicidio Llanto .580 .323 Agitación .572 .473 Pérdida de Interés .473 .583 Indecisión .533 .542 Inutilidad .594 .499 Pérdida de Energía .356 .761 Cambios en los .441 .654 Hábitos de Sueño Irritabilidad .453 .574 Cambios en el Apetito .525 .650 Dificultad de .401 .656 Concentración Cansancio o Fatiga .449 .774 Pérdida de interés en .644 .608 el sexo Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Promax con Kaiser. Tristeza Pesimismo Fracasos del pasado Pérdida de Satisfacción Sentimientos de culpa Sensación de Castigo Disconformidad con mi mismo Autocriticas .488 .221 Pensamientos o deseos .722 .102 de Suicidio Llanto .645 Agitación .459 .172 Pérdida de Interés .160 .479 Indecisión .312 .338 Inutilidad .468 .192 Pérdida de Energía .924 Cambios en los Hábitos .641 de Sueño Irritabilidad .134 .486 Cambios en el Apetito .175 .535 Dificultad de .689 Concentración Cansancio o Fatiga .841 Pérdida de interés en el .430 .327 sexo Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Promax con Kaiser. Tabla 25: Matriz de correlaciones de componentes Componente 1 2 1 1.000 .655 2 .655 1.000 Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Promax con Kaiser. 89 Población Clínica Tal como indica la Tabla 26el test de esfericidad de Bartlett y la prueba KMO para población general arrojan puntuaciones aceptables. Tabla 26: KMO y Test de Esfericidad Bartlett Población Clínica Medida de adecuación muestral de Kaiser-Meyer-Olkin. .808 Prueba de esfericidad de Chi-cuadrado aproximado 583.075 Bartlett gl 210 Sig. .000 En la Tabla 27 se presenta los resultados del total de la Varianza explicada por los dos principales factores presentados. La extracción de componentes indica 2 autovalores superior a 1 y por tanto 2 factores. Tabla 27: Total de la Varianza Explicada por autovalores Autovalores iniciales Total 1 2 3 6.645 1.608 1.462 % de la varianza 31.644 7.655 6.964 % acumulado 31.644 39.299 46.262 4 1.260 6.000 52.263 5 1.161 5.528 57.791 6 1.049 4.997 62.787 7 .963 4.587 67.375 8 .902 4.294 71.668 9 .769 3.664 75.332 10 .719 3.424 78.757 11 .686 3.267 82.024 12 .576 2.742 84.766 13 .515 2.451 87.217 14 .478 2.278 89.495 15 .435 2.069 91.564 16 .392 1.868 93.433 17 .377 1.794 95.227 18 .327 1.556 96.783 19 .288 1.372 98.155 20 .229 1.090 99.245 21 .159 .755 100.000 Sumas de las saturaciones al cuadrado de la extracción Total % de la % varianza acumulado 6.645 31.644 31.644 1.608 7.655 39.299 Suma de la rotación de las cargas al cuadrado Total 5.604 5.465 Método de extracción: Análisis de Componentes principales. 90 En las tablas: Matriz de Configuración (Tabla 28) y Matriz Estructural (Tabla 29), se aprecia el peso de distribución de las cargas factoriales de cada ítem con respecto a los dos factores mencionados. Por último, se presenta una correlación entre ambos factores de .559, dato que evidencia asociación entre ambos factores. Tabla 28 Matriz de Configuración 1 2 Tristeza .521 .220 Pesimismo .800 Fracasos del pasado .621 Perdida de Satisfacción .587 Sentimientos de culpa .488 .195 Sensación de Castigo .879 Disconformidad con mi .534 .065 mismo Autocriticas .579 .153 Pensamientos o deseos .414 .148 de Suicidio Llanto .236 .371 Agitación .305 Perdida de Interés .060 .636 Indecisión .258 .462 Inutilidad .617 .071 Perdida de Energía .800 Cambios en los Hábitos .266 .344 de sueño Irritabilidad .359 .314 Cambios en el Apetito .227 .428 Dificultad de .719 Concentración Cansancio o Fatiga .135 .628 Perdida de interés en el .708 sexo Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Promax con Kaiser. a. La rotación ha convergido en 3 iteraciones. 91 Tabla 29: Matriz Estructural Componente 1 2 .644 .511 .713 .292 .593 .297 .318 .581 .597 .468 .676 .129 .571 .364 Tristeza Pesimismo Fracasos del pasado pérdida de Satisfacción Sentimientos de culpa Sensación de Castigo Disconformidad con mi mismo Autocriticas .665 .477 Pensamientos o deseos .497 .380 de Suicidio Llanto .444 .503 Agitación .332 .218 pérdida de Interés .416 .670 Indecisión .517 .606 Inutilidad .656 .416 pérdida de Energía .424 .787 Cambios en los Hábitos .458 .493 de sueño Irritabilidad .534 .515 Cambios en el Apetito .466 .555 Dificultad de .273 .647 Concentración Cansancio o Fatiga .487 .704 pérdida de interés en el .131 .560 sexo Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Promax con Kaiser. Tabla 30: Matriz de correlaciones de componentes Componente 1 2 1 1.000 .559 2 .559 1.000 Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Promax con Kaiser. 92 Análisis Factorial Confirmatorio Tanto en el análisis factorial exploratorio de la población general como en la población clínica, se sugiere que dos factores asumen la distribución de las cargas factoriales de todos los reactivos. Una posible previsualización de los mismos propuesto por ambos análisis factoriales exploratorios se presentaría de esta forma: Agrupación de ítems Muestra General Factor 1: Tristeza, Pesimismo, Fracasos del pasado, Culpa, Castigo, Disconformidad con mi mismo, Autocriticas, Suicidio, Inutilidad, Agitación, Llanto Factor 2: Perdida de satisfacción, Perdida de Interés, Cambios en Sueño, Perdida de Energía, Cambios en Apetito, Concentración, Cansancio, Irritabilidad, Ambos: Sexo, Indecisión. Agrupación de ítems Muestra Clínica Factor 1: Tristeza, Pesimismo, Fracasos del pasado, Culpa, Castigo, Disconformidad con mi mismo, Autocriticas, Suicidio, Inutilidad, Irritabilidad, Agitación Factor 2: Perdida de satisfacción, Perdida de Interés, Cambios en Sueño, Perdida de Energía, Cambios en Apetito, Concentración, Cansancio, Indecisión, Sexo Ambos: Llanto De esta manera, los ítems en el factor 1 en ambas muestras hacen referencia a categorías del tipo cognitivo y emocional a nivel general principalmente por la Rumiación negativa (Fracasos del Pasado, Culpa, Ideación suicida), Visión Negativa de la Realidad (Tristeza, Pesimismo,) y Autoestima (Disconformidad con mi mismo, Autocriticas e Inutilidad) Mientras que en el factor 2 se referencia directamente a cualidades relacionadas con la inactivación conductual como el hacer actividades (dormir, comer, prácticas sexuales), motivación para hacer actividades (Satisfacción e Interés) Energía para realizarlas (Perdida de energía, Cansancio o Fatiga) y el Inicio y desarrollo de tareas (Concentración e Indecisión). Por tanto antes de proceder con el análisis factorial confirmatorio se propone para los ítems del factor 1 la variable latente Cognitivo/Emocional y para los correspondientes al factor 2 la variable latente Conductual/Fisiológico. Desde este modelo entonces, el constructo de Depresión implícito en el BDI-II podría estar entendiendo Depresión por la mediación tanto de pensamientos y emociones negativas en conjunto con la indisposición conductual/fisiológica a realizar actividades. Los resultados del Análisis Factorial Confirmatorio reafirman la distribución de las cargas factoriales con significancia estadística en los dos factores. 93 Población General En la Tabla 31 se denota que todos los pesos son estadísticamente significativos con un nivel de confianza del 95% puesto que en todos los casos la relación crítica (R.C.) de la desviación estándar (D.E.) es superior a 1.96. En todos los ítems, p < .001. Tabla 31: Pesos de Regresión por factores Estimado D.E. R.C. P Tristeza <--- Cognitivoemocional 1,000 Pesimismo <--- Cognitivoemocional 1,328 ,110 12,028 *** Fracasos <--- Cognitivoemocional 1,604 ,138 11,640 *** Culpa <--- Cognitivoemocional 1,149 ,106 10,842 *** Castigo <--- Cognitivoemocional 1,929 ,158 12,211 *** Disconformidad <--- Cognitivoemocional 2,166 ,158 13,676 *** Autocriticas <--- Cognitivoemocional 1,952 ,154 12,685 *** Suicidio <--- Cognitivoemocional 1,195 ,082 14,652 *** Inutilidad <--- Cognitivoemocional 1,254 ,102 12,287 *** Agitación <--- Cognitivoemocional 1,731 ,152 11,407 *** Llanto <--- Cognitivoemocional 1,695 ,159 10,634 *** Satisfaccion <--- ConductualFisiologico 1,000 Interés <--- ConductualFisiologico 1,138 ,095 11,926 *** Sueño <--- ConductualFisiologico 1,210 ,097 12,526 *** Energía <--- ConductualFisiologico 1,074 ,082 13,093 *** Apetito <--- ConductualFisiologico 1,327 ,100 13,236 *** Concentración <--- ConductualFisiologico 1,083 ,089 12,114 *** Cansancio <--- ConductualFisiologico 1,296 ,092 14,031 *** Irritabilidad <--- ConductualFisiologico ,936 ,081 11,588 *** Indecisión <--- ConductualFisiologico 1,296 ,109 11,924 *** Interessexual <--- ConductualFisiologico 1,100 ,080 13,822 *** En cuanto a los pesos factoriales para la solución estandarizada, vienen representados en la Tabla 32. Los mismos arrojan indicadores estadísticamente aceptables en cuanto a la vinculación con su respectivo factor teóricamente asumido. 94 Tabla32: Pesos de Regresiónestandarizados Tristeza Pesimismo Fracasos Culpa Castigo Disconformidad Autocriticas Suicidio Inutilidad Agitación Llanto Satisfaccion Interés Sueño Energía Apetito Concentración Cansancio Irritabilidad Indecisión Interessexual <--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--- Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico Estimado ,593 ,585 ,561 ,513 ,597 ,698 ,628 ,774 ,602 ,546 ,501 ,625 ,558 ,592 ,625 ,634 ,568 ,683 ,539 ,558 ,670 La Tabla 33 muestra las covarianzas entre ambos factores, presentando un estimado de .083 (estadístico aceptable) con una desviación estándar de .008. La covarianza entre ambos factores es significativamente diferente de cero, al nivel de 0.001 (a dos colas). Y en la tabla 34 las correlaciones entre ambos factores, siendo estimada en .861. Tabla 33: Covarianzas entre Factores Cognitivoemocional <--> ConductualFisiologico Estimado D.E. R.C. P ,083 ,008 9,866 *** Tabla 34: Correlaciones entre Factores Estimado Cognitivoemocional <--> ConductualFisiologico ,861 95 Población Clínica Los resultados del Análisis Factorial Confirmatorio en la muestra Clínica deben interpretarse con precaución ya que se dispuso de una muestra de 79 observaciones, siendo recomendable para el BDI-II una de 105 (5 observaciones por cada variable por 21 del total de ítems del BDI, según Arias, 2008). En la Tabla 35 se denota que todos los pesos son estadísticamente significativos con un nivel de confianza del 95% siendo que en todos los casos la relación crítica (R.C.) de la desviación estándar (D.E.) es superior a 1.96. En todos los ítems, p < .001. Tabla 35: Pesos de Regresión por factores Tristeza Pesimismo Fracasos Culpa Castigo Disconformidad Autocriticas Suicidio Inutilidad Irritabilidad Agitacion Llanto Satisfaccion PerdidaInteres Sueño Energia Apetito Concentracion Cansancio Indesicion Interessexual <--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--- CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico Estimado 1,000 1,005 ,922 ,953 1,203 1,000 1,269 ,755 1,125 1,147 ,533 1,055 1,000 1,524 1,063 1,492 1,280 1,117 1,599 1,345 1,004 D.E. R.C. P ,237 ,246 ,214 ,319 ,246 ,257 ,204 ,245 ,269 ,226 ,276 4,238 3,749 4,444 3,776 4,060 4,946 3,703 4,590 4,269 2,356 3,828 *** *** *** *** *** *** *** *** *** ,018 *** ,380 ,304 ,340 ,353 ,294 ,373 ,350 ,351 4,012 3,500 4,385 3,630 3,796 4,283 3,840 2,864 *** *** *** *** *** *** *** ,004 En cuanto a los pesos factoriales para la solución estandarizada, vienen representados en la Tabla 36. Los mismos arrojan indicadores estadísticamente aceptables en cuanto a la vinculación con su respectivo factor teóricamente asumido. 96 Tabla36: Pesos de Regresión estandarizados Tristeza Pesimismo Fracasos Culpa Castigo Disconformidad Autocriticas Suicidio Inutilidad Irritabilidad Agitacion Llanto PerdidaInteres Sueño Energia Apetito Concentracion Cansancio Indesicion Interessexual <--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--- CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional CognitivoEmocional ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico Estimado ,629 ,565 ,489 ,599 ,493 ,537 ,686 ,482 ,623 ,570 ,294 ,501 ,629 ,510 ,738 ,538 ,575 ,705 ,586 ,390 La Tabla 37 muestra las covarianzas entre ambos factores, presentando un estimado de .161 con una desviación estándar de .051. La covarianza entre ambos factores es significativamente diferente de cero, al nivel de 0.001 (a dos colas). Y en la tabla 38 las correlaciones entre ambos factores, siendo estimada en .781. Tabla 37: Covarianzas entre Factores CognitivoEmocional <--> ConductualFisiologico Estimado ,161 D.E. ,051 R.C. 3,183 P ,001 Tabla 38: Correlaciones entre Factores CognitivoEmocional <--> ConductualFisiologico Estimado ,781 97 Validez Convergente y Divergente Población General Como indica la Tabla 39, los análisis de correlaciones de Pearson entre las pruebas mencionadas sugieren correlaciones positivas entre el BDI-II con el MDI y la escala de Afecto Negativo del PANAS (.828 y .690 respectivamente) con significancia estadística a dos colas. Por otro lado, entre el BDI II y la escala de Afecto Positivo existe discrepancia ya que correlacionan de forma negativa entre ambas con un coeficiente de correlación de Pearson de -.278 a una significancia estadística de dos colas. De esta forma las puntuaciones del BDI concuerdan con los resultados arrojados por sus homólogos MDI y escala de Afecto Negativo de PANAS, y se distancia de los resultados de la escala de Afecto Positivo del PANAS. Tabla 39: Correlaciones entre BDI-II, MDI y PANAS Población General BDI BDI Correlacion de Pearson 1 Afecto Positivo Negativo MDI -.278** .690** .828** .000 .000 .000 249 219 228 203 -.278** 1 -.072 -.412** .292 .000 Sig. (bilateral) N Afecto Afecto Correlacion de Pearson Positivo Sig. (bilateral) .000 N 219 226 217 188 .690** -.072 1 .704** Afecto Correlacion de Pearson Negativo Sig. (bilateral) .000 .292 N 228 217 235 199 .828** -.412** .704** 1 Sig. (bilateral) .000 .000 .000 N 203 188 199 MDI Correlacion de Pearson .000 211 **. La correlación es significativa al nivel 0,01 (bilateral). 98 Población Clínica En cuanto a Validez Convergente, según la tabla 40 las correlaciones entre el BDI y la escala de Afecto Negativo relatan una fuerte asociación entre ambas con un coeficiente de correlación de Pearson de .877. A su vez con el MDI se delata un .675, confirmando la fuerte asociación entre ambas. En esta línea, la escala de Afecto Negativo también correlaciona de forma positiva con el MDI, señalando un .716 como coeficiente. Con respecto a Validez Divergente, la escala de Afecto Positivo discrepa fuertemente con las otras mediciones, siendo correlaciones negativas en todos los casos: -.813, -.846 y -840 para el BDI, la escala de Afecto Negativo y el MDI respectivamente. Tabla 40: Correlaciones entre BDI-II, MDI y PANAS Población Clínica BDI BDI Correlación de Pearson 1 Sig. (bilateral) N Afecto Correlación de Pearson Positivo Sig. (bilateral) N Afecto Correlación de Pearson Negativo Sig. (bilateral) N MDI Correlación de Pearson Sig. (bilateral) N 30 -.813** Afecto Afecto MDI Positivo Negativo -.813** .877** .675** .000 .000 .000 30 30 30 1 -.846** -.840** .000 .000 .000 30 30 30 30 .877** -.846** 1 .716** .000 .000 30 30 30 30 .675** -.840** .716** 1 .000 .000 .000 30 30 30 .000 30 **. La correlación es significativa al nivel 0,01 (bilateral). 99 Validez Diagnóstica La tabla 41 muestra las diferencias de medias entre ambos grupos de muestras, Población general y clínica. Para la muestra de Población General se seleccionó al azar un conjunto de 79 personas, con el objetivo de que fuese homologable con su correspondiente en la muestra clínica de igual cantidad. De esta tabla se desprende la diferencia de medias, la tabla 42 muestra como la diferencia entre las mismas es estadísticamente significativa. Tabla 41: Medias y desviaciones estándares de las puntuaciones del BDI-II por muestra Muestra N Media Desviación típ. Error típ. de la media Población General 79 9.09 9.292 1.045 Población Clínica 79 33.00 10.785 1.213 Tabla 42: Prueba T para muestras independientes medias por muestra Prueba de Levene para la igualdad de varianzas F Sig. Se han asumido varianza s iguales No se han asumido varianza s iguales 3.525 .062 Prueba T para la igualdad de medias t gl Sig. (bila teral ) Diferen cia de medias Error típ. de la diferenci a 95% Intervalo de confianza para la diferencia Inferior Superior -14.930 156 .000 -23.911 1.602 -27.075 -20.748 -14.930 152.661 .000 -23.911 1.602 -27.076 -20.747 En concordancia con la figura 6 donde se muestra la Curva COR, en la tabla 43 se muestra que el Área bajo la Curva es de .937 siendo esta aceptable. Obteniendo las coordenadas de la Curva COR y convirtiéndolas a porcentajes, en la tabla 43 se muestra la sensibilidad y especificidad para los puntos de corte del BDI-II en función de su discriminación entre pacientes con depresión y muestra General. El punto de corte que corresponde a 14,50 ofrece una sensibilidad de 95,5% y una especificidad de 73,1%. Por tanto, según la muestra participante de esta investigación, una puntuación por encima de 15 se puede considerar un 100 buen criterio para identificar alrededor del 95% individuos con Depresión correctamente y siendo menor a esta ofrece un estimado de discriminación de alrededor del 75% de individuos sin Depresión. Figura 5: Curva COR Tabla 43: Área bajo la curva Área Error típ.a Sig. asintóticab Intervalo de confianza asintótico al 95% Límite inferior .937 .020 .000 .897 Límite superior .977 a. Bajo el supuesto no paramétrico b. Hipótesis nula: área verdadera = 0,5 101 Tabla 44: Porcentajes de Sensibilidad, especificidad para la detección de Depresión Mayor para cada punto de corte del BDI-II Positivo si es mayor o igual quea Sensibilidad (en %) Especificidad (en %) -1,00 100 0 ,50 100 11,9402985 1,50 100 17,9104478 2,50 100 23,880597 3,50 100 31,3432836 4,50 100 38,8059701 5,50 100 44,7761194 6,50 100 52,238806 7,50 100 58,2089552 8,50 100 61,1940299 9,50 98,5074627 67,1641791 11,00 98,5074627 68,6567164 12,50 97,0149254 68,6567164 13,50 97,0149254 71,641791 14,50 95,5223881 73,1343284 15,50 94,0298507 77,6119403 16,50 94,0298507 79,1044776 17,50 94,0298507 83,5820896 18,50 91,0447761 83,5820896 19,50 88,0597015 85,0746269 20,50 86,5671642 86,5671642 21,50 82,0895522 88,0597015 22,50 79,1044776 89,5522388 23,50 77,6119403 89,5522388 25,00 73,1343284 89,5522388 26,50 68,6567164 92,5373134 27,50 65,6716418 92,5373134 28,50 64,1791045 94,0298507 29,50 61,1940299 95,5223881 30,50 61,1940299 97,0149254 31,50 58,2089552 97,0149254 32,50 53,7313433 97,0149254 33,50 50,7462687 97,0149254 34,50 44,7761194 97,0149254 35,50 43,2835821 97,0149254 36,50 37,3134328 98,5074627 37,50 29,8507463 98,5074627 38,50 26,8656716 98,5074627 102 39,50 23,880597 98,5074627 40,50 22,3880597 98,5074627 41,50 19,4029851 98,5074627 42,50 19,4029851 100 43,50 17,9104478 100 44,50 14,9253731 100 45,50 13,4328358 100 46,50 10,4477612 100 47,50 8,95522388 100 51,50 2,98507463 100 56,00 0 100 a. El menor valor de corte es el valor de contraste observado mínimo menos 1, mientras que el mayor valor de corte es el valor de contraste observado máximo más 1. Todos los demás valores de corte son la media de dos valores de contraste observados ordenados y consecutivos. Por último, en la tabla 45 se muestra una propuesta de agrupación de ambas muestras general y clínica (n: 79 para cada una) en la cual se indican 4 puntos de corte, de la misma forma que con el BDI-II original. Dicha agrupación obedece a una distribución por percentiles, colocando en cada rango el 25% de la muestra. El mismo queda de la siguiente forma: Tabla 45: Propuesta de Puntos de Corte para Costa Rica Puntos de Corte Rango Mínimo Puntuación de 0 a 7 Rango Leve Puntuación de 8 a 20 Rango Moderado Puntuación de 21 a 34 Rango Severo Puntuación de 34 a 63 103 Conclusiones ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA 104 CONCLUSIONES Al finalizar este proyecto de investigación, se obtuvieron distintas conclusiones y recomendaciones sobre el trabajo realizado. Conclusiones Al finalizar el estudio, se consiguió cumplir con satisfacción cada uno de los objetivos propuestos. El logro de los mismos se detalla a continuación. Con respecto al Objetivo General, se obtuvo satisfactoriamente una adaptación de la segunda versión del Inventario de Depresión de Beck con la muestra utilizada en población General y Clínica. Dado que los índices de validez y fiabilidad obtenidos presentan propiedades psicométricas adecuadas, se recomienda su uso clínico e investigativo. Además se cumple con la hipótesis de Investigación H1, ya que los resultados obtenidos fueron similares con respecto a los obtenidos de las adaptaciones realizadas en otros contextos, y poseen significancia estadística adecuada en los índices de validez y fiabilidad. Según investigaciones revisadas, en otros contextos adaptaciones del BDI-II han obtenido coeficientes Alfa de Cronbach que varían en un rango de .83 a .96 (Wang & Gorenstein, 2013., Beck, Steer y Brown, 1996., Aasen, 2001., Musawi, 2001., Arnason, 2008) de tal forma al obtenerse un .908 y .885 para muestras general y clínica se mantiene en este rango. Con respecto al procedimiento Test Retest, investigaciones realizadas en el ámbito internacional arrojan correlaciones Pearson entre los .76 y .96 con un promedio en el intervalo de re aplicación de 2 semanas. (Un rango de 1 semana a 6 meses) (Wang & Gorenstein, 2013., Gorenstein, Wang, Argimon, Werlang, 2011., Kapci, Uslu, Turkcapar, Karaoglan, 2008., Sprinkle, Lurie, Insko, Atkinson, Jones, Logan, 2002., Ghassemzadeh H, Mojtabai R, Karamghadiri N, Ebrahimkhani N, 2005) al obtenerse un coeficiente de 105 correlación de Pearson de .954 en el presente estudio, se asegura la estabilidad de la medida incluso muy por encima de la mayoría de las investigaciones. Con el primer objetivo específico, vinculado con la traducción del inventario, se logró una adecuada traducción de los ítems de su original en inglés, participando en este proceso distintas técnicas para triangular y garantizar la calidad de la traducción final, entre ellas la incorporación de traducciones paralelas y traducción inversa, expertos tal como propone Geissenger (1994). Para el segundo objetivo, concerniente a una revisión según el criterio Interjueces, se posibilitó una revisión del documento por medio de dos fuentes, Población General y Jueces Expertos. Si bien es cierto, la investigación se inscribe dentro de los lineamientos de la Teoría Clásica de los Tests, al procurar enfatizar en las garantías de validez y fiabilidad del instrumento, un aspecto de gran relevancia fue el aporte del método de Entrevista Cognitiva, propia de la Teoría de Respuesta al Ítem, como enriquecimiento a la investigación. De esta forma se realiza un aporte metodológico importante al considerar la perspectiva de personas con niveles socio demográficos variados en la adaptación presente. Este aporte se posiciona como un procedimiento adicional al proyecto. De esta manera al modificar la prueba según la valoración de las indicaciones ofrecidas por los jueces se consiguió el tercer objetivo satisfactoriamente, siendo este el correspondiente a la obtención de la versión final de la prueba, inserta en el Anexo 11. Esta revisión incluye una revisión filológica de la estructura gramatical de las distintas oraciones que conforman el cuerpo de reactivos. El cuarto objetivo, propiamente la comprensión de los ítems por parte de los participantes en la prueba piloto fue aceptable, denotándose del mismo una adecuada comprensión y lectura de los ítems. Esto permite asegurar una adecuada comprensión de los mismos por parte de futuros pacientes o participantes. Al proceder con el quinto objetivo, aplicar la versión definitiva a una muestra de personas residentes del GAM, se utilizaron dos muestras una clínica y otra general, las cuales obtuvieron promedios muy distintos, según lo esperado. De forma adicional al proyecto se 106 utilizó una muestra de cuestionarios administrados online. Esta muestra obtuvo puntuaciones similares a las del resto de la Muestra de Población General. Representa esto un aliciente para futuras investigaciones desde las que se puede plantear el uso de cuestionarios en línea, dadas sus ventajosas condiciones de administración. Según indican los hallazgos de esta investigación sus desventajas radicarían en que es difícil encontrar participantes con edades de 55 años o más, además de personas únicamente con estudios de primaria, y demás población con difícil acceso a internet, sesgando la investigación. Es necesario estudiar a futuro esta posibilidad. Los resultados deslegitiman la creencia académica de que las mujeres se deprimen más que los hombres y la intensidad de la misma es superior (Berenzon, S., Tiburcio, M., MedinaMora, M. 2005., Caraveo, Colmenares y Saldivar, 1999., De la Fuente, Medina-Mora y Caraveo, 1997). Apoyando más lo obtenido en otras adaptaciones del BDI en las cuales al parecer a pesar de que se notan diferencias sutiles, las mismas no son significativas (Kapci, Uslu, Turkcapar, Karaoglan, 2008., Lipps, Lowe, Young, 2007) Un hallazgo sugerente es la posible relación entre la variable nivel educativo e intensidad de Depresión. Según lo encontrado, a menor nivel educativo las puntuaciones del BDI-II tienden a aumentar. Esto concuerda con lo encontrado por otros autores en distintas investigaciones (Üstün, Sartorius, 1995., Burvill, 1995, Zung, Broadhead, Roth, 1993), según las cuales a menor nivel educativo la intensidad de la sintomatología depresiva aumenta. Con respecto al sexto y último objetivo específico, relacionado con corroborar los criterios de validez y fiabilidad resultantes de la prueba, esta ofrece adecuados indicadores de validez y fiabilidad. Estos resultados indican una alta correlación de los ítems de la prueba entre sí, siendo suficiente para garantizar la fiabilidad de la escala. Se garantiza la consistencia interna de la misma, para ambas poblaciones con las que se trabajó. Con respecto a la validez de contenido, la prueba en su estructura posee legitimación científica y académica, siendo puntuada por los evaluadores de forma positiva. Algunas de las deficiencias inherentes del instrumento apuntadas por los jueces radican en que no 107 incorporan aspectos interpersonales vinculadas a la depresión, como el retraimiento, la adicción al trabajo, consumo de sustancias y demás. Se encontró una estructura factorial similar a la planteada por Beck y colaboradores en su estudio inicial, difiriendo en agregar al factor 2 un componente más conductual motivacional. Así, los ítems en el factor 1 en ambas muestras hace referencia a categorías del tipo cognitivo y emocional. Mientras que en el factor 2 se referencia directamente a cualidades relacionadas con la inactivación conductual y baja motivación. El BDI-II podría estar interpretando Depresión como un resultado de la suposición tanto de pensamientos y emociones negativas en conjunto con la indisposición conductual/fisiológica a realizar actividades. Los resultados del Análisis Factorial Confirmatorio reafirman la distribución de las cargas factoriales con significancia estadística en los dos factores. Arnason (2008), Beck, Steer y Brown (1996) y Lipps GE, Lowe GA, Young R. (2007); también documentan el hallazgos de dos factores en el test, todos estos investigadores hablan de uno “Cognitivo-afectivo” y otro “somático”. Las correlaciones entre factores apuntan a r = 0.62 y 0.66 Para estudiantes y pacientes respectivamente en el estudio inicial de Beck y colaboradores (Beck, Steer y Brown, 1996) Con respecto a la distribución factorial del BDI surge un cuestionamiento que puede abrir pie a investigaciones futuras. Por un lado los pesos factoriales de cada ítem se distribuyen significativamente para cada uno de los dos componentes, siendo consecuente con lo encontrado por Beck y colaboradores (1994) en su estudio inicial. No obstante tal como indica la tabla 22, un 32.710% de la varianza es explicada por el componente 1, mostrándose a continuación un drástico descenso en el componente 2 a 7.080%. La incógnita de esto se concibe a que en función de los datos obtenidos, sería igual de válido asumir que es mejor hablar de un único factor, al mismo tiempo que es igual de valido hablar de dos factores. La pregunta a si es o no el BDI II un instrumento unitario en cuanto a su constructo o más bien puede hablarse de una estructura factorial inserta se mantiene aún sin respuesta. Las puntuaciones del BDI concuerdan con los resultados arrojados por sus homólogos MDI y escala de Afecto Negativo de PANAS en ambas poblaciones general y clínica, y se 108 distancian de los resultados de la escala de Afecto Positivo del PANAS. Esto favorece asegurar que el constructo de Depresión como criterio está siendo compartido en buena parte con otras pruebas, en este caso el MDI. Y que se distancia de pruebas que miden conceptos opuestos al de la Depresión como la escala de afecto Positivo del PANAS. Según Wang, & Gorenstein (2013), en otras investigaciones, se han encontrado coeficientes de correlación de Pearson que van desde 0.66 a 0.86 para distintas pruebas utilizadas (Hamilton Depression Rating Scale (HAM-D), the Zung Self-Rating Depression Scale (SDS), the Montgomery-Asberg Depression Rating Scale (MADRS), and the Geriatric Depression Scale (GDS) siendo las puntuaciones con el MDI y la escala de Afecto Negativo del PANAS (.828 y .690 respectivamente para población general y .675 y .877 en población clínica) aceptables. Wang, & Gorenstein (2013), aportan que en estudios en otras latitudes, con respecto a validez discriminante, se oscila en un rango de .37 a .83; con una media de .50. Para este estudio se obtuvieron correlaciones con la Escala de Afecto Positivo del PANAS de -.278 y -.813 para población general y clínica respectivamente, superando lo obtenido en otras investigaciones. Se corroboró que la adaptación del BDI-II permite diferenciar entre personas con Depresión y personas sin diagnóstico de la misma, ya que las puntuaciones entre ambas muestras se distancian bastante. No solamente existe diferencia entre medias en cuanto a las poblaciones general y clínica, sino también con respecto a la varianza de las mismas. Las Tabla 4, 6, 7 y 8 indican una desviación típica muy cercana e incluso en ocasiones superior a la media. De este modo, los estadísticos descriptivos de Población General cuentan con altas dispersiones, siendo un comportamiento que refleja gran heterogeneidad en la muestra situación esperable en la misma pues, al no contar con muchos criterios de inclusión facilita la dispersión. Mientras que en las tablas 14, 16 y 17 la distribución suele ser más homogénea al ser menor las desviaciones estándar con respecto a las medias, esto se debe por tratarse de una muestra representativa de un constructo específico. Los porcentajes de Especificidad y Sensibilidad obtenidos permitirían a futuro amoldar el uso de la misma en función de las necesidades propias, si es necesaria la detección de 109 mayor número de personas con la sintomatología en función, entonces el umbral de sensibilidad debe ser mayor. Para estudios de investigación en los cuales se propone obtener mayor pureza en el diagnóstico de depresión de un grupo de personas con algún trastorno, es necesario priorizar la discriminación a partir de mayor especificidad. Los rangos de severidad de Depresión propuestos posibilitan a su vez estimar un acercamiento categórico de la intensidad de Depresión en algún individuo evaluado. Por último, la metodología propuesta por Geissenger utilizada en este estudio demostró ser definitoria en la consecución de los resultados finales. Un alcance indirecto de esta investigación es la validación de la metodología como una propuesta sólida en la adaptación de pruebas y a la vez la flexibilidad de la misma metodología en la complementación con otras técnicas como la Entrevista Cognitiva. Limitaciones Las limitaciones se dividen en dos, las concernientes al proceso metodológico de adaptación y las relacionadas con el instrumento per se. Con respecto al proceso metodológico, la principal limitación del estudio está relacionada con lo correspondiente a la muestra de Población clínica. Una parte importante de la misma se consiguió principalmente por colaboración de la Caja Costarricense de Seguro Social. Para obtener los permisos con la misma, el comité de bioética exige una serie de requisitos necesarios para la Investigación. El proceso de aprobación por parte del comité conlleva meses, una vez aprobada la propuesta por parte del comité la posibilidad de tiempo para reunir datos de población clínica estuvo reducida. Con más tiempo se hubiese reunido una muestra mayor. Algunas limitaciones metodológicas propias del proyecto subyacen a la falta de representatividad estadística en la población general, utilizando en su mayoría datos del Gran Área Metropolitana. Realizar estudios con mayor representatividad favorece la credibilidad científica y el uso de distintos procedimientos estadísticos. 110 También se destaca la carencia de cuestionarios adaptados al país relacionados con el constructo de Depresión. De lo contrario, contar con los mismos hubiese permitido mayor solidez en los resultados de Validez Convergente, al posibilitar un instrumento que se acerque lo suficiente al constructo. De igual forma, es difícil encontrar pruebas con indicadores de validez y fiabilidad solidas en el país. Realizar pruebas de Validez Divergente atraviesa estas consideraciones. Con respecto a las limitaciones propias del instrumento, el BDI-II presenta algunas consideraciones que es necesario conocerlas. En primer lugar, la claridad del instrumento si bien es cierto es una de sus principales fortalezas al facilitar la comprensión por muy variados grupos etarios sin problemas, también se presta para que sus resultados pueden ser fácilmente exagerados o minimizados por el individuo completo. Es decir posee una predisposición a la manipulación del resultado, tendencia de respuesta y deseabilidad social. Al ser una escala corta, tampoco aporta algún ítem relacionado con el sesgo. Segundo, el BDI II es un buen instrumento que indica el grado de severidad de depresión, no así entre subtipos de Trastornos del Espectro Depresivo. Si este fuese el interés clínico, es necesario optar por algún otro método diagnóstico. En tercer lugar, el BDI-II ofrece puntos de corte, no así baremos que permitan especificar el diagnostico en función de variables como sexo y edad. De esta forma en algunas circunstancias el instrumento puede pecar de imprecisión, siendo necesaria la triangulación con otras técnicas. Una cuarta debilidad concierne al contenido de los ítems propiamente. A pesar de que el instrumento sigue una escala ordinal en la cual las posibles puntuaciones (0-3) de cada ítem son equiparables entre sí, eso no quiere decir que en la práctica lo sea. Por ejemplo empíricamente hablando no es equiparable un “Me suicidaría apenas tenga la oportunidad de hacerlo” con un “Tengo hambre todo el tiempo”, a pesar que ambos puntúan igual, 3.Por 111 tal razón es obligación del profesional a cargo considerar cada rasgo por separado, cuando lo amerite. En esta adaptación, se dio el caso de ítems cuyas cargas factoriales eran débiles con respecto a los componentes. Tal es el caso de Interés por el sexo, llanto y agitación. Es necesario en futuras investigaciones revisar si dichos rasgos realmente pertenecen al constructo. Una quinta y última limitación se relaciona propiamente con el constructo de depresión. La sintomatología depresiva tiende a cambiar en periodos inclusive cortos de tiempo. De esta forma puede ser un sesgo aplicar un procedimiento Test –Retest ya que una condición del mismo es que la variable objeto de medición no haya cambiado (Fernández- Ballesteros y Calero, 2004). Así mismo es difícil la obtención de casos puros de Depresión, ya que la misma presenta comorbilidad con muy variados trastornos (APA, 2005). Recomendaciones Con respecto a la adaptación directamente, se recomienda su uso en el contexto costarricense. Dados sus elevados índices de validez y fiabilidad encontrados en el presente estudio, además de sus precedentes en contextos internacionales, la adaptación se posiciona como un potencial colaborador en el diagnóstico clínico de la depresión. La metodología utilizada (Geissenger, 1994) fue definitoria del éxito de los resultados. Se recomienda ampliamente su uso e inclusive desarrollo, para cualquier adaptación o estandarización que se plantee. Justificar una investigación en base a esta metodología garantiza un buen estimador de éxito. En conjunto con el punto anterior, la metodología propuesta por Geissenger puede complementarse adecuadamente con procedimientos más relacionados con la Teoría de respuesta al Ítem como la Entrevista Cognitiva. Según la presente investigación fue una combinación que resulto enriquecedora para la adaptación. Tomar en cuenta el criterio de la 112 población meta con la que se administrara el instrumento es una paso que no debe faltar en futuras adaptaciones de distintos instrumentos. Se recomienda realizar a futuro una validación de las cualidades psicométricas de la adaptación. Con una muestra más grande, especialmente de población clínica, como también con representatividad de las otras provincias faltantes, Guanacaste, Puntarenas y Limón. De igual forma que la metodología funciono exitosamente, el modelo de validez de Wasserman y Bracken (2003) es un adecuado recurso en el diseño de indicadores de validez. Con respecto a distintos hallazgos no planteados inicialmente como objetivos que se fueron dando conforme la investigación avanzaba, se recomienda: Estudiar a futuro la posible relación entre nivel educativo y Trastornos del estado de ánimo. Los resultados deslegitiman la creencia de que las mujeres se deprimen más que los hombres. Esto puede crear una interesante línea de investigación. Investigar la posible inserción de Cuestionarios Online en el quehacer investigativo. Su impacto, ventajas y desventajas. En el diagnóstico clínico de depresión se puede considerar la relevancia que tiene los componentes indicados por el BDI-II, cognitivo-afectivo y conductualfisiológico y otorgar prioridad al tratamiento. El profesional a cargo de una evaluación no debe utilizar el BDI-II sin incorporar una adecuada triangulación de otras técnicas. El aporte de la puntuación del inventario solo tiene legitimidad cuando se engancha con lo aportado por otros métodos. Tal como apunta Gregory Meyer visto en el epígrafe de la presente investigación: El valor de la herramienta no se puede separar de la sofisticación del clínico que realiza inferencias sobre ella. 113 Referencias ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA 114 REFERENCIAS Aasen, H. (2001). An empirical investigation of depression symptoms: norms, psychometric characteristics and factor structure of the Beck Depression Inventory-II. Bergen: University of Bergen Abad, F., Garrido, J., Olea, J., & Ponsoda, V. (2006). Introducción a la Psicometría. Teoría Clásica de los Test y Teoría de la Respuesta al Ítem. Madrid: Universidad Autónoma de Madrid. Abell, N., Springer D., Kamata, A. (2009). Developing and Validating Rapid Assessment Instruments. New York: Oxford University Press. Agudelo, D., Buela Casal, G., Spielberger, C. (2007). Ansiedad y Depresión: el problema de la diferenciación a través de los síntomas. Salud Mental, 30, 33-41 Aguiar, T. (2009). Adaptación de la escala de neuroticismo del "Introversion und Neurotizismus bei Kindern" (INK) para estudiantes que cursen cuarto, quinto y sexto grado en escuelas del Área Metropolitana, en el año 2007., Universidad de Costa Rica, Ciudad Universitaria Rodrigo Facio. Alansari, B. (2006). Internal Consistency of an Arabic Adaptation of the Beck Depression Inventory-II with College Students in Eighteen Arab Countries. Social Behavior and Personality, 34, 425-430. Alansari, B. (2005). Beck Depression Inventory (BDI-II) Items characteristics among undergraduate students of nineteen islamic countries. Social Behavior and Personality, 33, 675-684. 115 Alo, M. & Vallejo, G. (2012) Diseños experimentales en Psicología. Madrid: Pirámide. Al-Musawi, N. (2001). Psychometric Properties of the Beck Depression Inventory–II with University Students in Bahrain .Journal of Personality Assessment, 77, 568–579. American Psychyatric Association (2013). Quinta Edición del Manual Diagnóstico de los Trastornos mentales. Barcelona: MASSON. Arango, C., Escobar, M., Pimienta, H. (2004). Fundamentos moleculares y celulares de la depresión y de los mecanismos antidepresivos. Revista Colombiana de Psiquiatría, 33, 165-185 Arias, B. (2008). Desarrollo de un ejemplo de análisis factorial confirmatorio con LISREL, AMOS y SAS. Seminario de Actualización en Investigación sobre Discapacidad SAID 2008. España: Universidad de Valladolid Arnarson, Olason, D., Smari, J., & Sigurðsson, J. (2008).The Beck Depression Inventory Second Edition (BDI-II): Psychometric properties in Icelandic student and patient populations. Nord J Psychiatry, 62, 360-365. Arvand, J., Shafiabadi, A., Falsafinejad, M., Zali, M. (2012) The effects of group solution– focused therapy on depression and completion of treatment in patients with chronic hepatitis B. Health MED, 6, 925-928 Baldós, A. (2009). Terapia cognitiva de Beck. En F. Labrador (Ed.), Técnicas de Modificación de Conducta. Madrid: Pirámide. Bagby, R., Ryder, A., Schuller, D., & Marshall, M. (2005). ¿Sigue siendo la escala de depresión de Hamilton una prueba de referencia? American Journal of Psychiatry, 8, 137-151. 116 Beck, A.T., Rush, J., Shaw, B. & Emery, G. (1983/2002).Terapia Cognitiva de la Depresión. España: Desclée De Brouwer Beck, A., Steer, R., Ball, R., & Ranieri, W. (1996).Comparison of Beck Depression Inventories IA and II in Psychiatric Outpatients. Journal of Personality Assessment, 67, 588-597. Beck, A., Steer, R., & Brown, G. (1996/2009).Manual para el Inventario de Depresión de Beck—II. (1ª Reimpresión).Buenos Aires: Paidós. Bernt, D. (1990). Multiscore Depression Inventory (MDI): Manual. Los Ángeles: Western Psychological Services. Berenzon, S., Tiburcio, M., Medina-Mora, M. (2005). Variables demográficas asociadas con la depresión: diferencias entre hombres y mujeres que habitan en zonas urbanas de bajos ingresos. Salud Mental, 28, 33-40 Brenes, A., Espinoza, M., Bejarano, J., & Riba, G. (1978). Realidad Psicométrica Nacional: 1978. Instituto de Investigaciones Psicológicas. Universidad de Costa Rica, San José. Costa Rica. Brenlla, M., &Rodríguez, C. (2009). Adaptación Argentina del Inventario de Depresión de Beck (BDI-II). Buenos Aires: Paidós Byrne, B., Stewart, S., & Lee, P. (2004). Validating the Beck Depression Inventory–II for Hong Kong Community Adolescents. International Journal of Testing, 4, 199-216. Butcher, J., Mineka, S., Hooley, J. (2007).Psicología Clínica. Madrid: Pearson. 117 Burvill, P. (1995) Recent progress in the epidemiology of major depression. Epidemiologic Rev, 17, 21-31. Calero, M., & Padilla, J. (2004). Técnicas Psicométricas: los test. In R. FernándezBallesteros (Ed.), Evaluación Psicológica. Conceptos, Métodos y Estudio de casos. Madrid: Pirámide. Caraveo, J., Colmenares, E, Saldivar, G. (1999) Estudio clínico epidemiológico de los trastornos depresivos. Salud mental, 22(2):7-17 Carney, C., Ulmer, C., Edinger, J., Krystal, A., Knauss, F. (2009).Assessing depression symptoms in those with insomnia: An examination of the beck depression inventory second edition (BDI-II).Journal of Psychiatric Research, 43, 576–582. Chang, H. (2005). Dimensions of the Chinese Beck Depression Inventory-II in a University Sample. Individual Differences Research, 3, 193-199. Chávez, A., & Meléndez, D. (2005). Estandarización y Adaptación de la prueba NAIPES G Nivel Elemental para el proceso de selección de personal del sector autónomo de salud costarricense, (C.C.S.S.) en la región Chorotega., Universidad de Costa Rica, Liberia. Cohen, R. & Swerdlick, M. (2006). Pruebas y Evaluación Psicológica. Introducción a las pruebas y a la medición. México, D.F.: Mc Graw Hill. Costa Rica, Instituto Costarricense de Estadística y Censo. (2008). Estimaciones y Proyecciones de Población por sexo y edad (cifras actualizadas). San José: Autor 118 Cruz, C., López, L., Blas, C., González, L., & Chávez, R. (2005). Datos sobre la Validez y Confiabilidad de la Symptom Check List 90 (SCL 90) en una muestra de sujetos mexicanos. Salud Mental, 28, 72-81. De la Fuente, R., Medina-Mora, M, Caraveo, J. (1997). Salud Mental en México. Fondo de cultura económica: México D.F. Díaz, L. (2011, 29 de agosto). CCSS desdeña atención de problemas mentales. La Nación, [en línea]. Recuperado el 11 de octubre de 2011, de http://www.nacion.com/2011-0529/ElPais/NotaPrincipal/ElPais2792240.aspx Díaz, L., Campo, A., Rueda, G., & Barros, J. (2005). Propuesta de una versión abreviada de la escala de Zung para depresión. Colombia Médica, 36, 168-172. Dumenci, L., Achenbach, T. (2008) Effects of estimation methods on making trait –level inferences from ordered categorical items for assessing psychopatology. Psychological Assesment, 20, 55-62 Dunn, R., Kimbrell, T., Ketter, T., Frye, M., Willis, M., Luckenbaugh, D., et al. (2002).Principal Components of the Beck Depression Inventory and Regional Cerebral Metabolism in Unipolar and Bipolar Depression. Biological Psychiatry, 51, 387-399. Facio, T. (2007). Uso de la Terapia Racional Emotiva Conductual en la Atención de las Personas Adultas Mayores con Desórdenes de Depresión, Ansiedad o Irritabilidad. Universidad de Costa Rica, Ciudad Universitaria Rodrigo Facio. 119 Fernández-Ballesteros, R., & Calero, M. (2004). Garantías científicas y éticas de la evaluación científica. En R. Fernández-Ballesteros (Ed.), Evaluación Psicológica. Conceptos, Métodos y Estudio de casos. Madrid: Pirámide. Fernández-Ballesteros (2004). El proceso como procedimiento interventivo 1: el proceso descriptivo predictivo. En R. Fernández-Ballesteros (Ed.), Evaluación Psicológica. Conceptos, Métodos y Estudio de casos. Madrid: Pirámide. Fernández, A., Pérez, E., Alderete, A., Richaud, M., Liporace, M. (2010) ¿Construir o Adaptar Test Psicológicos? Diferentes respuestas a una Cuestión Controvertida. Evaluar, 10, 60-74 Fozdar, F. (2009). The Golden Country’: Ex-Yugoslav and African Refugee Experiences of Settlement and ‘Depression. Journal of Ethnic and Migration Studies, 35, 1335-1352. Geissenger, K. (1994). Cross-Cultural Normative Assessment: Translation and Adaptation Issues Influencing the Normative Interpretation of Assessment Instruments. Psychological Assessment, 6(4), 304-312. Ghassemzadeh, H., Mojtabai, R., Karamghadiri, N., & Ebrahimkhani, N. (2005). Psychometric properties of a Persian-language version of the Beck Depression Inventory second edition: BDI-II-Persian. Depression and Anxiety, 21, 185–192. Goodale, E. (2007) El papel de la norepinefrina y de la dopamina en la depresión. Revista de Toxicomanías, 50, 19-22 Gorenstein, C., Wang, Y., Argimon, I., Werlang, B. (2011) Manual do Inventario de Depressao de Beck - BDI-II. Sao Paulo: Casa do Psicologo 120 Guadarrama, L., Escobar, A., Zhang, L. (2006) Bases neuroquímicas y neuroanatómicas de la depresión. Revista Facultad Medicina UNAM, 49, 66-72 Güemes, I., Guillen, V., & Ballesteros, J. (2008). Psicoterapia frente a farmacoterapia en depresión en atención ambulatoria. Actas Españolas de Psiquiatría, 36, 299-306. Hernández, R., Fernández, C., & Baptista, P. (2006). Metodología de la investigación. México D.F.: Mc. Graw Hill. Hernández, O. (2004) Estadística elemental para Ciencias Sociales. San José, Costa Rica: Editorial de la Universidad de Costa Rica. Instituto Nacional de Estadística y Censo (2010).Costa Rica. Población por años calendario, según sexo y grupos quinquenales de edades 2011-2050. Extraído el 4 de abril de 2013 del sitio Web: http://www.inec.go.cr/Web/Home/GeneradorPagina.aspx International Test Commission (2010).International Test Commission Guidelines for Translating and Adapting Tests. Extraído el 12 de abril 2013delsitio web http://www.intestcom.org Joe, S., Woolley, M., Brown, G., Ghahramanlou, M., & Beck, A. (2008). Psychometric Properties of the Beck Depression Inventory–II in Low-Income, African American Suicide Attempters. Journal of Personality Assessment, 90, 521–523. Kapci, E., Uslu, R., Turkcapar, H., & Karaoglan, A. (2008). Beck Depression Inventory II: evaluation of the psychometric properties and cut-off points in a Turkish adult population. Depression and Anxiety, 25, E104–E110. 121 Kerlinger, F., & Lee, H. (2002). Investigación del Comportamiento. Métodos de Investigación en Ciencias Sociales. México D. F.: Mc Graw Hill. Kizilcik Z, Sayiner, F., Unsal, A., Ayranci, U., Kosgeroglu, N., Tozun, M. (2012). Prevalence of depression in patients on hemodialysis and its impact on quality of life. Pak J Med Sci, 28,695-699 Kumar, C. (2009). Applied Psychometry. New Delhi: SAGE. Kuhner, C., Burger, C., Keller, F., Hautzinger, M. (2007) Reliability and validity of the Revised Beck Depression Inventory (BDI-II). Results from German samples.Nervenarzt, 78, 651-6. Lipps, E., Lowe, G., Young, R. (2007) Validation of the beck depression inventory-II in a Jamaican university student cohort. West Indian Med J., 56, 404-8. Lubinski, D., Dawis, R. (1995) Assesing individual differences in human behavior: methods, concepts and findings. Palo Alto, California: consulting Psychologists Press. Lu, Y. (2010). Mental health and risk behaviours of rural-urbanmigrants: Longitudinal evidence from Indonesia. PopulationStudies, 64, 147-163. Lutz, G. (1992). Adaptación del Inventario de Depresión para Niños en escolares del cuarto, quinto y sexto grado pertenecientes al área metropolitana de San José. Universidad de Costa Rica, Ciudad Universitaria Rodrigo Facio. Manual de atención integral a la depresión y el suicidio en adolescentes (2005). Caja Costarricense de Seguro Social. 122 Martínez, M., Hernández, M., Hernández, M (2006). Psicometría. Madrid: Alianza Editorial Muñiz, J. (2010) Las Teorías de los Test: Teoría Clásica y Teoría de Respuesta a los Ítems. Papeles del Psicólogo, 31, 57-66 Navas, M. (1994) TeoríaClásica de los test versus Teoría de Respuesta al Ítem. Revista Psicologica, 15, 175-208 Nichols, D. (2011) Essentials of MMPI-2 Assesment.Second Edition.Estados Unidos: John Wiley and Sons. Organización Mundial de la Salud. (1992) Decima revisión de la clasificación internacional de las enfermedades (CIE). Trastornos mentales y del comportamiento, descripciones clínicas y pautas para el diagnóstico. Madrid: Meditor Osman, A., Barrios, F., Gutierrez, P., Williams, J., & Bailey, J. (2008).Psychometric Properties of the Beck Depression Inventory-II in Nonclinical Adolescent Samples.Journal of clinical psychology, 64, 83-102. Osman, A., Barrios, F., Kopper, B., Gutierrez, P., &Bagge, C. (2004).Reliability and Validity of the Beck Depression Inventory—II with Adolescent Psychiatric Inpatients.Psychological Assessment, 16, 120-132. Pallesen, S., Nordhus, I., Carlstedt, B., Thayer, J., Johnsen, T. (2006) A Norwegian adaptation of the Penn State Worry Questionnaire: factor structure, reliability, validity and norms. Scand J Psychol, 47, 281-91. Palmer, E., &Binks, C. (2008). Psychometric properties of the Beck Depression InventoryII with incarcerated male offenders aged 18–21 years. Criminal Behaviour and Mental Health, 18, 232-242. 123 Pedrero, E., López, A. (2005). Autoinformes de sintomatología depresiva en drogodependientes: nivel de coincidencia del BDI, SCL-90-R y MCMI-II. ¿Depresión o malestar inespecífico? ADICCIONES, 17, 215-230. Pérez, E., & Muñoz, M. (2004). Inventario de Depresión de Beck. En R. FernándezBallesteros (Ed.), Evaluación Psicológica. Conceptos, Métodos y Estudio de casos. Madrid: Pirámide. Pérez, M. & García, J. (2010). Guía de Tratamientos Psicológicos Eficaces para la Depresión. En Pérez, Fernández, Fernández y Amigo (Coord.), Guía de Tratamientos Psicológicos Eficaces I: Adultos.Madrid: Pirámide. Poole, H., Bramwell, R., Murphy, P. (2009). The utility of the Beck Depression Inventory Fast Screen (BDI-FS) in a pain clinic population.European Journal of Pain, 13, 865– 869. Prieto, G., Muñiz, J., Almeida, L., & Bartram, D. (1999).Uso de los test psicológicos en España, Portugal e Iberoamérica. RIDEP, 8, 67-82. Reyes, R., Quirós, E. (1993). Características del Paciente Deprimido según el Mini Mult 82. Universidad de Costa Rica, Ciudad Universitaria Rodrigo Facio. Riolo, S., Nguyen, T., Greden, J., & King, C. (2005).Prevalence of Depression by Race/Ethnicity: Findings from the National Health and Nutrition Examination Survey III.American Journal of Public Health, 95, 998-1000. 124 Rowland, S., Lam, C., & Leahy, B. (2005). Use of the Beck Depression Inventory-II (BDIII) with persons with traumatic brain injury: Analysis of factorial structure. BrainInjury, 19, 77-83. Salli, A., Yilmaz, H., & Ugurlu, H. (2012).The relationship between tender point count and disease severity in patients with primary Fibromyalgia.Rheumatology International, 32, 105–107 Sanz, J., García-Vera, M., Espinosa, R., Fortún, M., &Vázquez, C. (2005). Adaptación española del Inventario para la Depresión de Beck-II (BDI-II): 3. Propiedades psicométricas en pacientes con trastornos psicológicos. Clínica y Salud, 16, 121-142 Sanz, J., Navarro, M., y Vázquez, C.(2003). Adaptación española del Inventariopara la Depresión de Beck-II (BDI-II): 1.Propiedades psicométricas en estudiantesuniversitarios. Análisis y Modificación deConducta, 29(124), 239-288. Sanz, J., Perdigón, A., &Vázquez, C. (2003). Adaptación española del Inventario para la Depresión de Beck-II (BDI-II): 2. Propiedades psicométricas en población general. Clínica y Salud, 14, 249-280. Seignourel, P., Green, C., Schmitz, J. (2008). Factor structure and diagnostic efficiency of the BDI-II in treatment-seeking substance users.Drug and Alcohol Dependence, 93, 271–278. Seligman, M. (1975). Helplessness: On Depression, Development, and Death. San Francisco: W. H. Freeman 125 Sidney, S., Castellan, N. (2012). Estadística no Paramétrica aplicada a las Ciencias de la Conducta. México D.F.: Trillas Smith, V. & Molina, M. (2011). Cuaderno Metodológico 5. La entrevista cognitiva: guía para su aplicación en la evaluación y mejoramiento de instrumentos de papel y lápiz. San José, CR.: Instituto de Investigaciones Psicológicas, Universidad de Costa Rica. Solís, F. (2009). Aportes al análisis de la validez y de la confiabilidad del Inventario de Depresión para niños de Kovacs, como herramienta de tamizaje para la evaluación de los indicadores del riesgo de depresión, en una muestra de niños costarricenses, escolarizados, de edades comprendidas entre los 7 y 12 años, de población no clínica. Proyecto de investigación para optar por el grado de especialista en psicología clínica, Universidad de Costa Rica, San Pedro, Costa Rica. Sprinkle, S., Lurie, D., Insko, S., Atkinson, I., Jones, G., Logan, A., et al. (2002). Criterion Validity, Severity Cut Scores, and Test–Retest Reliability of the Beck Depression Inventory—II in a University Counseling Center Sample.Journal of Counseling Psychology, 49, 381-385. Takai, M., Takahashi, M., Iwamitsu, Y., Ando, N., Okazaki, S., Nakajima, K., Oishi S., Miyaoka, H. (2009).The experience of burnout among home caregivers of patients with dementia: Relations to depression and quality of life. Archives of Gerontology and Geriatrics, 49, e1–e5. Tsai, J. &Chentsova Dutton, Y. (2002).Understanding depression across cultures.En I. Gotlib& C. Hammen (Eds), Handbook of depression (pp. 467-91). New York: Guilford. 126 Üstün, T., Sartorius, N., (1995). Mental illness in general health care: an international study. Chichester: John Wiley. Van Praag H.M. (1998) Anxiety and increased aggression as pacemakers of depression. Acta Psychiatric Scand, 98, 81-88 Vázquez, C., Nieto, M., Hernangómez, L., Hervás, G. (2004). Trastorno psicológico en un caso de depresión mayor. En J. Espada, J. Olivares, F. Méndez (Comp.), Terapia Psicológica. Casos prácticos. (pp. 201- 231). Madrid: Pirámide. Valerio, L. (1997). Traducción y adaptación del Inventario Múltiple de Depresión. Sistemas de Estudios de Posgrado: Tesis para optar a la especialidad en Psicología Clínica, Universidad de Costa Rica – (CENDEISS). Centro de Estudios, San José, Costa Rica Viljoen, J., Iverson, G., Griffits, S., &Woodward, T. (2003).Factor Structure of the Beck Depression Inventory— II in a Medical Outpatient Sample. Journal of Clinical Psychology in Medical Settings, 10, 289-291. Wang, Yuan-Pang, & Gorenstein, Clarice. (2013). Psychometric properties of the Beck Depression Inventory-II: a comprehensive review. Revista Brasileira de Psiquiatria, 35(4), 416-431. Wilson, C., &Blumentritt, T. (2007).Psychometric Properties of the Beck Depression Inventory-II in a Clinically-Identified Sample of Mexican American Adolescents. Journal of Child and Family Studies, 16, 789–798. Wright, S. (2009). Going home: migration as enactment and symbol.Journal of Analytical Psychology, 54, 475-492. Zung, W., Broadhead, W., Roth, M. (1993) Prevalence of depressive symptoms in primary care. J Fam Pract, 37, 337-344 127 ANEXOS ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA 128 Anexo 1: Lineamientos para la Adaptación de Pruebas según la International Comission Test (ICT) Contexto. Referido a la comprensión de que muchos de los constructos evaluados en psicología son dependientes de variables culturales y por tanto fácilmente susceptibles de sesgo ante la imposibilidad de equivalencia cultural. Desarrollo o adaptación de instrumentos. Plantea la necesidad de asegurar con fundamentación metodológica adecuada la adaptación misma, según la utilización en estudios transculturales, la equivalencia de test y de elementos y la validación para diferentes poblaciones. Administración. Se refiere a la construcción de normas relacionadas con instrucciones y condiciones contextuales que podrían afectar la equivalencia de los test. Interpretación. Comprende la consideración de las diferencias culturales en las normas de interpretación de un test. (International Test Comission, 2010; Fernández Ballesteros & Calero, 2004) 129 Anexo 2: Antecedentes Psicométricos en Trabajos Finales de Graduación en la Universidad de Costa Rica Adaptaciones 1979 Estandarizaciones Análisis de pruebas María Emilia Chávez. El test gestáltico visomotor de Lauretta Bender: adaptación de las normas para su corrección en la población escolar de 6 a 12 años del cantón de Goicoechea. 1979 María luisa González, Mayra Guzmán, Grettel Milano. Adaptación a Costa Rica de la escala de desarrollo psicomotor de la primera infancia de Brunet y Lezine, de 40 a 30 meses. 1980 Lilliana Echeverría, Corina Flores Ana Jiménez. Adaptación de la Escala Weschler para Niños a la Población Escolar de la Provincia de San José. 1980. 1981 Graciela Meza y Miguel Garita. Adaptación del Test de Matrices Progresivas de Raven (Escala General). 1982 Delio González y Margarita Esquivel. Víctor Vargas Méndez. Análisis de una Estandarización de la prueba OTIS prueba de habilidad General para 130 Sencillo para la selección de Personal Selección de Personal en el Servicio Civil. Administrativo del I.C.E. Minor Aguilar Gutiérrez. Adaptación y estandarización del inventario de personalidad de H.J. Eysenck y Wilson para una población de aspirantes al puesto de Auxiliar de Investigación del Organismo de Investigación Judicial. 1983 Olga Marta Murillo. Estudio de Validación y Confiabilidad del test de Jeness como instrumento diagnóstico de la personalidad del menor infractor. 1984 Elsa Kruse y Leticia Rodríguez. Adaptación y Estandarización del cuestionario “16 Factores de la Personalidad” de Raymond B. Catell para su empleo en la selección de personal. 1985 Mayra de Mena Guardia, Dora Gamboa, Sara Gurfinkiel, Carmen Ivankovich y Yamilé Soto. 131 Adaptación de dos escalas del test de Orientación en las Relaciones Personales (TORIF) de William Schütz a una población universitaria costarricense. 1988 Jensen. Adaptación del Inventario Biográfico Juan Manuel Esquivel Alfaro. para el Diagnostico de Trastornos del Estandarización del Inventario de Comportamiento (IBC). madurez vocacional para estudiantes del IX año de la educación general y XI de la educación diversificada 1989 Ana Lorena Rojas Breedy. Adaptación de la Guillermo Barrantes. Estandarización del Escala de Evaluación de la Cohesión y CERP 2 para Selección de Personal en el Adaptabilidad Familiar de Olson (Faces III) a la Servicio Civil. población de familias con adolescentes que cursan educación secundaria en el cantón central de la provincia de San José. 1990 Olga Alfaro, Luis Garnier y Mauricio Leandro. El Minimult 82, revisión y estandarización del minimult de Kincannon. 1991 Jenny Mora Vargas y Pilar Trimiño. María Marta Duran y Leonardo Guillen. Adaptación del test de Memoria de Botwinick y Estandarización del Test D48 para 132 Storant para la población mayor de 60 años del Selección de personal en el Sector Publico área metropolitana de Costa Rica. 1992 Centralizado Costarricense. Lutz. Adaptación del Inventario de Depresión para Niños. 1993 Marta Medina Gómez. Estandarización del Test de Apreciación de Vendedores para la selección de personal en la empresa privada. Ligia Morales y Cira Vega. Adaptación y Estandarización del Test Beta de Inteligencia general para la Selección de personal en instituciones del Sector Público Costarricense. Ching y Vega. Estandarización de la Batería Diagnostica de la Madurez Lectora BADIMALE. 133 1995 Kattia Solís. Estandarización de Inventario Mcadow Kendall de evaluación socioemocional (SEAI) para estudiantes sordos de preescolar de las escuelas de enseñanza especial del Ministerio de Educación Pública. Andrés Umaña. Estandarización de Inventario de Personalidad de Eysenck. Blanco y Jiménez. Estandarización de la Prueba verbal de Creatividad para Preescolares (PVCP). 1996 Vladimir Escorsia. Estandarización de la Prueba de Razonamiento Abstracto P20 500. 1997 Quintanilla. Adaptación de Prueba de estilos de liderazgo. 134 1999 Luis Raifer Rubenstein. Adaptación y Estandarización del Test Dieciséis Factores de la Personalidad Versión 5. 2009 Tatiana Aguiar. Adaptación de la escala de Fedra Solís Durán. Aportes al análisis de neuroticismo del "Introversion und validez y de la confiabilidad del Neurotizismus bei Kindern" (INK) para Inventario de Depresión para niños de estudiantes que cursen cuarto, quinto y sexto Kovacs, como herramienta para la grado en escuelas del Área Metropolitana, en el evaluación de los indicadores de riesgo de año 2007. depresión, en una muestra de niños costarricenses, escolarizados, de edades comprendidas entre los 7 y 12 años, de población no clínica. 2014 Cinthya Meléndez. Escala de evaluación funcional de la persona con trastorno mental y del comportamiento para el hospital Dr. Roberto Chacón Paut. Fuente: Elaboración Propia 135 Anexo 3: Evidencias de Fiabilidad Tipo de evidencia Método Estabilidad de la medida Test-retest Objetividad de la medida Criterio entre evaluadores Descripción Procedimiento Estadístico El mismo instrumento se administra a la misma muestra en dos ocasiones separadas por un espacio de tiempo prudente. Describen la consistencia de las calificaciones a través de múltiples evaluadores. Cuando se trata de pruebas que dan margen para una gran cantidad de juicio por parte del examinador en la asignación de puntuaciones, Correlaciones Pearson-Spearman Coeficiente de concordancia de Kendall Fuentes de varianza de error Cambios a lo largo del tiempo Diferencias entre evaluadores Consideraciones Al realizar varias administraciones hacen que sea más costoso. Condiciones La variable procedente del constructo no debe cambiar en un plazo corto de tiempo Es necesaria la Variosevaluadores. presencia de varios evaluadores. Al realizar varias administraciones hacen que sea más costoso 136 Homogeneidad de la medida Dos mitades Formas paralelas Alpha Crombach por ejemplo pruebas proyectivas, de desarrollo moral o de creatividad. Sugiere dividir el test en dos partes, cada una con propiedades normativas y estadisticas similares y correlacionar ambas puntuaciones de cada mitad Se aplican dos versiones de una prueba a un mismo grupo y se correlacionan los promedios obtenidos en cada una Se trata de una media ponderada de las Correlaciones Pearson/Spearman. Fórmula de Spearman -Brown Muestreo de Reactivos Al presentarse dos versiones, introduce diferencias en la muestra de reactivos de cada forma, aumentando la varianza como fuente de error. Se necesita una cantidad abundante de items, ya que al dividir afecta la estructura factorial. Ambas mitades deben ser paralelas entre si. Correlaciones Pearson/Spearman. Muestreo de reactivos Al realizar varias administraciones hacen que sea más costoso. La prueba debe presentar dos formas y ambas deben cubrir los mismos rasgos, contenidos y nivel de dificultad Alfa de Crombach Muestreo de reactivosHomogeneidad Si las escalas son multidimensionales, el alpha pierde poder predictivo, Estar formado por un conjunto de ítems que se combinan para 137 correlaciones entre las variables (o ítems) que forman parte de la escala. siendo más util hallar una coeficientes como puntuación global el tetha o el omega. Todos los ítems miden la característica deseada en la misma dirección. Fuente: Elaboracion Propia 138 Anexo 4: Consentimiento informado UNIVERSIDAD DE COSTA RICA FACULTAD DE CIENCIAS SOCIALES COMITÉ ÉTICO CIENTIFICO Teléfono:(506) 25115561 Telefax: (506) 2511-4017 VICERRECTORÍA DE INVESTIGACIÓN Teléfonos:(506) 2511-4201 Telefax: (506) 2224-9367 ESCUELA DE PSICOLOGIA CONSENTIMIENTO INFORMADO Proyecto: Adaptación de la Segunda versión del Inventario de Depresión de Beck (BDI-II) a la población del Gran Área Metropolitana de Costa Rica Mi nombre es Dennis Redondo Alfaro, soy estudiante de la Escuela de Psicología de la Universidad de Costa Rica y deseo realizar una investigación sobre el estado de ánimo en la gente. PROPÓSITO DEL PROYECTO: Con esta investigación pretendo encontrar aspectos que se tornen de relevancia en el tratamiento de distintas afecciones como la Depresión. ¿QUÉ SE HARÁ?: El procedimiento consiste en llenar el cuestionario que se le muestra adjunto, marcando la opción que mejor represente su estado de ánimo. Aproximadamente le tomará de 5 a 10 minutos. No existen respuestas buenas ni malas, tan solo se busca que las mismas reflejen de la forma más acertada su estado de ánimo reciente. No es necesario que escriba algún tipo de información que pueda revelar algún aspecto de su identidad. Incluso los datos que si se le soliciten se mantendrán en absoluta confidencialidad y todos serán manejados únicamente por mi persona. No se entregaran resultados a ninguna persona acerca de lo que puntúe el cuestionario, ya que el mismo se manejará exclusivamente con fines investigativos. RIESGOS: No está estipulado que el contestar todas las preguntas le conlleven alguna consecuencia a nivel físico, emocional o de alguna otra índole. Sin embargo, en caso que alguna pregunta le genere incomodidad puede dejar de contestar las mismas sin ningún compromiso. BENEFICIOS: 139 Como resultado de su participación en este estudio, no obtendrá ningún beneficio directo, sin embargo, es posible que el investigador aprenda más acerca del estado de ánimo de la gente en nuestro pais y este conocimiento beneficie a otras personas en el futuro. No se debe preocupar por algún coste económico que puede tener el cuestionario. Así mismo tampoco recibirá pago por su participación. Siéntase con total libertad para preguntar sobre cualquier aspecto que le ayude a aclarar sus dudas al respecto. Antes de dar su autorización para este estudio es importante que hayan sido contestadas satisfactoriamente todas sus preguntas. Puede consultar sobre los derechos de los Sujetos Participantes en Proyectos de Investigación a la Dirección de Regulación de Salud del Ministerio de Salud, al teléfono 22-57-20-90, de lunes a viernes de 8 a.m. a 4 p.m. Cualquier consulta adicional puede comunicarse a la Vicerrectoría de Investigación de la Universidad de Costa Rica a los teléfonos 2511-4201 ó 2511-5839, de lunes a viernes de 8 a.m. a 5 p.m. En caso de disgustarle algún aspecto de las preguntas, usted puede abandonar la prueba en cualquier momento pudiendo informar o no, las razones de su decisión, la cual será respetada en su integridad. No habrá ninguna consecuencia desfavorable para usted, en caso de no colaborar con la investigación. Si solo desea contestar la prueba pero que los datos no se usen en el estudio, tambien puede indicarlo sin ningun tipo de implicación. Su participación en este estudio es confidencial, los resultados podrían aparecer en una publicación científica o ser divulgados en una reunión científica pero de una manera anónima. CONSENTIMIENTO He leído o se me ha leído, toda la información descrita en esta fórmula, antes de firmarla. Se me ha brindado la oportunidad de hacer preguntas y éstas han sido contestadas en forma adecuada. Por lo tanto, accedo a participar como participante en este estudio. ______________________________________________________________________ Nombre, cédula y firma del o la participante Nombre, cédula y firma del Investigador que solicita el consentimiento ___________________________ Fecha 140 Anexo 5: Plantilla de Observación Pruebas Piloto con la Prueba Tiempo de lectura y llenado de Consentimiento Tiempo de lectura y llenado de Cuestionario Comprensión de los ítems (Minutos y segundos) (Minutos y segundos) B: Hace 1 pregunta Dificultades lectoescritura A: No hace preguntas A: No requiere apoyo C: Hace 2 o 3 preguntas B: Requiere apoyo en la lectura D: Hace más de 3 preguntas 1 2 3 4 5 6 7 Sujetos Pruebas Piloto 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 141 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 142 Anexo 6: Versión de Traductor Oficial Nombre: ____________________________ Estado Civil: ________________ Edad: _____ Sexo: ____ Ocupación: __________________________ Nivel Educativo: ____________________________________ Instrucciones: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones cuidadosamente y luego seleccione una oración de cada grupo que mejor describa la forma en que usted se ha estado sintiendo durante las dos últimas semanas, incluyendo hoy. Encierre con un círculo el número que está a la par de la oración que haya seleccionado. Si varias oraciones en un grupo parecen aplicar de igual manera, encierre el número más alto correspondiente a ese grupo. Asegúrese de no escoger más de una oración en cualquier grupo, incluyendo el punto 16 (Cambios en el Patrón del Sueño) o el punto 18 (Cambios en el Apetito). Tristeza 0 1 2 3 No me siento triste. Me siento triste la mayor parte del tiempo. Me siento triste todo el tiempo. Me siento tan triste e infeliz que no puedo soportarlo. Pesimismo 0 1 2 3 No me siento desanimado sobre mi futuro. Me siento más desanimado sobre mi futuro de lo que solía estarlo. No espero que las cosas funcionen para mí. Siento que no tengo esperanzas en mi futuro y más bien será peor. Fracasos del Pasado 0 1 2 3 No me siento como un fracasado. Siento que he fracasado más de lo que debí. Cuando pienso en el pasado, recuerdo muchos fracasos. Siento que soy un total fracaso como persona. Pérdida de Satisfacción 0 Siento tanta satisfacción de las cosas que disfruto al igual antes. No disfruto tanto de las cosas como solía hacerlo. Obtengo poca satisfacción de las cosas que solía disfrutar. No obtengo satisfacción alguna de las cosas que solía disfrutar. 1 2 3 Sentimientos de Culpabilidad 0 1 No me siento culpable en particular. Me siento culpable por varias cosas que he hecho o que debí hacer. Me siento bastante culpable la mayor parte del tiempo. Me siento culpable todo el tiempo. 2 3 Sentimientos de Castigo 0 1 2 3 No siento que estoy siendo castigado. Siento que debería ser castigado. Espero ser castigado. Siento que estoy siendo castigado. Auto-desprecio 0 1 2 3 Me siento igual acerca de mí mismo como siempre. He perdido confianza en mí mismo. Me siento decepcionado de mí mismo. Me odio a mí mismo. Autocrítica 0 1 2 3 No me critico ni me culpo más de lo usual. Me critico más de lo que solía hacerlo. Me critico por todos mis fallos. Me culpo por todo lo malo que pasa. Pensamientos o Deseos de Suicidio 0 1 2 3 No tengo pensamiento alguno de matarme Tengo pensamientos de matarme pero no lo haría. Me gustaría matarme. Me mataría si tuviera la oportunidad de hacerlo. Llanto 0 1 2 3 No lloro más de lo que solía hacerlo. Lloro más de lo que solía hacerlo. Lloro por cualquier cosa. Siento ganas de llorar pero no puedo hacerlo. 143 Inquietud Irritabilidad 0 1 2 No me siento más inquieto o intranquilo de lo normal. Me siento más inquieto o intranquilo de lo normal. Me siento tan inquieto o intranquilo que me es difícil quedarme quieto. Me siento tan inquieto o intranquilo que tengo que estar moviéndome o haciendo algo. 0 1 2 3 No me siento más irritado de lo normal. Me siento más irritado de lo normal. Me siento mucho más irritado de lo normal. Me siento irritado todo el tiempo. Cambios en el Apetito Pérdida de interés 0 No he perdido el interés en las personas o en las actividades. Tengo menos interés en las personas o en las actividades. He perdido mayor interés en las personas o en las actividades. Me resulta difícil interesarme en algo. 0 No he experimentado ningún cambio en mi apetito. _________________________________________ 1a Mi apetito es un poco menor de lo normal 1b Mi apetito es un poco mayor de lo normal. _________________________________________ 2a Mi apetito es mucho menor de lo normal. 2b Mi apetito es mucho mayor de lo normal. ________________________________________ 3a No tengo apetito del todo. 3b Tengo hambre todo el tiempo. 3 1 2 3 3 Indecisión Tomo decisiones tan bien como siempre. Tengo más dificultad en la toma de decisiones de lo normal. Tengo mucha mayor dificultad en la toma de decisiones que antes. Tengo problemas a la hora de tomar decisiones. Baja Autoestima 3 Me puedo concentrar tan bien como siempre. No me puedo concentrar tan bien como antes. Se me hace difícil mantener mi mente en algo por mucho tiempo. Siento que no me puedo concentrar en nada. 0 1 Cansancio o Fatiga 2 3 No siento que yo valga la pena. No me considero como alguien valioso y útil como solía hacerlo. Me siento más inútil que otras personas. Me siento extremadamente inútil. 0 1 2 Pérdida de energía 3 0 1 2 3 Tengo tanta energía como siempre. Tengo menos energía que antes. No tengo suficiente energía para hacer mucho. No tengo suficiente energía para hacer algo del todo. No me siento más cansado o fatigado de lo normal. Me canso o me fatigo más fácilmente de lo normal. Me siento demasiado cansado o fatigado para hacer varias cosas que solía hacer. Me siento demasiado cansado o fatigado para hacer la mayoría de las cosas que solía hacer. Cambios en el Patrón del Sueño 0 No he tenido ningún cambio en mi patrón del sueño. 0 1 2 0 1 2 Dificultad de Concentración Pérdida de interés en el sexo 0 1 No he notado ningún cambio en mi interés por el sexo. Estoy menos interesado en el sexo de lo que solía estarlo. Estoy mucho menos interesado en el sexo ahora. He perdido interés en el sexo completamente. 2 3 1a Duermo un poco más de lo normal. 1b Duermo un poco menos de lo normal. _____________________________________ 2a Duermo mucho más de lo normal. 2b Duermo mucho menos de lo normal. _____________________________________ 3a Duermo la mayor parte del día. 3b Me despierto 1 ó 2 horas más temprano y no puedo dormir de nuevo 144 Anexo 7: Traducción del Investigador del Proyecto Nombre_______________ Estado Civil________________ Edad___________ Sexo Ocupación_______________________ Nivel Educativo___________________ Instrucciones: Este cuestionario consta de 21 grupos de ítems. Por favor lea cada grupo de ítems cuidadosamente, y luego seleccione en cada grupo la frase que mejor describe la forma en la cual usted se ha estado sintiendo durante las últimas dos semanas, incluyendo hoy. Encierre el número que se encuentre junto a la frase que haya escogido. Si le pareciera que no solo una sino varias frases en el grupo le describen adecuadamente, entonces encierre el número más alto entre dichas opciones. Asegúrese de solo escoger una frase por grupo, incluso en el Ítem 16 (Cambios en el patrón del sueño) o el Ítem 18 (Cambios en el Apetito). 1. Tristeza 0 No me siento triste 1 Me siento triste muchas veces 2 Siempre estoy triste 3 Estoy tan triste o infeliz que no puedo soportarlo 2. Pesimismo 0 No me siento desanimado con mi futuro 1 Estoy más desanimado sobre mi futuro que lo habitual 2 No espero que las cosas salgan bien para mí 3 Siento que mi futuro es desesperanzador y únicamente va a empeorar 3. Fracasos pasados 0 No me siento fracasado 1 He tenido más fracasos que los que debería 2 Cada vez que miro al pasado, veo un montón de fracasos 3 Siento que como persona soy un total fracasado 4. Desgana 0 Disfruto tanto de las cosas que me agradan como siempre lo he hecho 1 No disfruto las cosas tanto como lo habitual 2 Experimento muy poco placer de las cosas que solía disfrutar 3 No obtengo ningún placer de las cosas que solía disfrutar 5. Sentimientos de culpa 0 No tengo ningún remordimiento de consciencia en particular 1 Me siento culpable sobre muchas cosas que hice o debí haber hecho. 2 Siento mucha culpa la mayoría de las veces. 3 Siento mucha culpa todo el tiempo. 6. Sentimientos de castigo 0 No siento que merezca un castigo 1 Siento que debería ser castigado 2 Espero ser castigado 3 Siento que estoy siendo castigado 145 7. Insatisfacción con si mismo PODRIA SER AUTOIMAGEN 0 Me siento igual conmigo mismo como antes 1 He perdido confianza en mi mismo 2 Estoy disconforme con mi mismo 3 Me desagrado a mi mismo 8. Autocritica 0 No me critico o me culpabilizo más de lo usual 1 Estoy más crítico de mí mismo que lo acostumbrado 2 Me critico a mi mismo por todos mis defectos 3 Me culpabilizo de todo lo malo que sucede 9. Pensamientos o deseos de suicidio 0 No tengo ningún pensamiento de matarme 1 Tengo pensamientos de suicidio pero no los llevaría a cabo 2 Me gustaría matarme 3 Me mataría en cuanto tenga la oportunidad 10. Llanto 0 No lloro más que lo acostumbrado 1 Lloro más que lo acostumbrado 2 Lloro por cualquier cosa pequeña que suceda 3 Siento ganas de llorar pero no puedo hacerlo. 11. Inquietud 0 No me siento más intranquilo o herido que lo usual 1 Me siento más intranquilo o herido que lo usual 2 Estoy más intranquilo o agitado que es difícil mantenerme sosegado 3 Estoy tan intranquilo o agitado que tengo que mantenerme moviendo o haciendo algo 12. Perdida de interés 0 No he perdido el interés en otras personas o actividades 1 Estoy menos interesado en otras personas o cosas que antes 2 He perdido mucho de mi interés en otras personas 3 Me es difícil conseguir interesarme en algo 13. Indecisión 0 Tomo decisiones tan bien como siempre 1 Encuentro más difícil tomar decisiones que lo usual 2 Tengo una gran dificultad en hacer decisiones que lo acostumbrado 3 Tengo problemas en tomar cualquier decisión 14. Desprecio 0 No siento que sea despreciable 1 No me considero como alguien valioso y útil como solía hacerlo. 2 Me siento más despreciable comparado con otras personas 3 Me siento totalmente despreciable 15. Perdida de energía 146 0 1 2 3 Tengo tanta energía como siempre Tengo menos energía que la que usualmente tengo No tengo la suficiente energía para hacer mucho No tengo la suficiente energía para hacer nada 16. Cambios en el patrón del sueño 0 No he experimentado algún cambio en mi patrón del sueño 1a duermo un poco más que lo usual 1b duermo un poco menos usual 2a duermo mucho más que usual 2b duermo mucho menos que lo usual 3a Duermo la mayor parte del día. 3b Me despierto 1 o 2 horas más temprano y luego no puedo volver a dormir 17. Irritabilidad 0 No estoy más irritable que lo usual 1 estoy más irritable que lo usual 2 estoy mucho más irritable que lo usual 3 estoy irritable todo el tiempo 18. Cambios en el apetito 0 no he experimentado algún cambio en mi apetito 1a mi apetito es un poco menor que lo usual 1b mi apetito es un poco mayor que lo usual 2a mi apetito es mucho menor que antes 2b mi apetito mucho más grande que usual 3a no tengo apetito del todo 3b Tengo hambre todo el tiempo. 19. Dificultades de concentración 0 me puedo concentrar también como siempre 1 No me puedo concentrar tan bien como lo usual 2 es difícil mantener mi mente en algo por mucho tiempo 3 encuentro que no puedo concentrarme en nada 20. Cansancio o fatiga 0 estoy más aburrido o cansado que usual 1 consigo aburrirme o cansarme más fácilmente que antes 2 estoy tan aburrido o cansado al hacer un montón de cosas de lo acostumbrado. 3 estoy tan aburrido o cansado para hacer muchas de las cosas que lo acostumbrado 21. Perdida de interés en el sexo 0 no he encontrado un cambio reciente en mi interés en el sexo 1 Estoy menos interesado en sexo que lo acostumbrado 2 Estoy mucho menos interesado en sexo ahora 3 He perdido el interés en el sexo completamente 147 Anexo 8:Unificación de Traducciones Nombre: ____________________________ Estado Civil: ________________ Edad: _____ Sexo: ____ Ocupación: __________________________ Nivel Educativo: ____________________________________ Instrucciones: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones cuidadosamente y luego seleccione en cada grupo la frase que mejor describa la forma en que usted se ha estado sintiendo durante las dos últimas semanas, incluyendo hoy. Encierre con un círculo el número que está a la par de la frase que haya seleccionado. Si varias oraciones en un grupo parecen aplicar de igual manera, encierre el número más alto correspondiente a ese grupo. Asegúrese de no escoger más de una frase en cualquier grupo, incluyendo el punto 16 (Cambios en el Patrón del Sueño) o el punto 18 (Cambios en el Apetito). Tristeza 4 5 6 7 No me siento triste. Me siento triste la mayor parte del tiempo. Me siento triste todo el tiempo. Me siento tan triste e infeliz que no puedo soportarlo. Pesimismo 4 No me siento desanimado sobre mi futuro. 5 Me siento más desanimado sobre mi futuro de lo que solía estarlo. 6 No espero que las cosas vayan a funcionar para mí. 7 Siento que no tengo esperanzas en mi futuro y más bien será peor. Fracasos del Pasado 4 No me siento como un fracasado. 5 Siento que he fracasado más de lo que debí. 6 Cuando pienso en el pasado, recuerdo muchos fracasos. 7 Siento que soy un total fracaso como persona. Pérdida de Satisfacción 4 Siento tanta satisfacción de las cosas que disfruto al igual que antes. 5 No disfruto tanto de las cosas como solía hacerlo. 6 Obtengo poca satisfacción de las cosas que solía disfrutar. 7 No obtengo satisfacción alguna de las cosas que solía disfrutar. Sentimientos de Castigo 4 No siento que merezca ser castigado. 5 Siento que debo ser castigado. 6 Espero ser castigado. 7 Siento que estoy siendo castigado. Auto-desprecio 4 Me siento igual conmigo mismo como siempre. He perdido la confianza en mí mismo. 5 Me siento decepcionado de mí mismo. 6 Me odio a mí mismo. Autocrítica 4 No me critico ni me culpo más de lo usual. 5 Me critico más de lo que solía hacerlo. 6 Me critico por todos mis fallos y defectos. 7 Me culpo por todo lo malo que pasa. Pensamientos o Deseos de Suicidio 4 No tengo pensamiento alguno de matarme 5 Tengo pensamientos de matarme pero no lo haría. 6 Me gustaría matarme. 7 Me mataría si tuviera la oportunidad de hacerlo. Llanto 4 5 6 7 No lloro más de lo que solía hacerlo. Lloro más de lo que solía hacerlo. Lloro por cualquier cosa pequeña que suceda. Siento ganas de llorar pero no puedo hacerlo. Sentimientos de Culpabilidad 4 No me siento culpable en particular. 5 Me siento culpable por varias cosas que he hecho o que debí hacer. 6 Me siento bastante culpable la mayor parte del tiempo. 7 Me siento culpable todo el tiempo. 148 Inquietud 4 No me siento más inquieto o intranquilo de lo normal. 5 Me siento más inquieto o intranquilo de lo normal. 6 Me siento tan inquieto o intranquilo que me es difícil quedarme quieto. 7 Me siento tan inquieto o intranquilo que tengo que estar moviéndome o haciendo algo. Pérdida de interés 4 No he perdido el interés en las personas o en las actividades. 5 Tengo menos interés en las personas o en las actividades que antes. 6 He perdido la mayoría del interés en las personas o en las actividades. 7 Me resulta difícil interesarme en algo. Indecisión 4 Tomo decisiones tan bien como siempre. 5 Tengo más dificultad en la toma de decisiones de lo normal. 6 Tengo mucha mayor dificultad en la toma de decisiones que antes. 7 Tengo problemas a la hora de tomar decisiones. Baja Autoestima 4 No siento que yo valga la pena. 5 No me considero como alguien valioso y útil como solía hacerlo. 6 Me siento más inútil que las demás personas. 7 Me siento extremadamente inútil. Pérdida de energía 4 Tengo tanta energía como siempre. 5 Tengo menos energía que antes. 6 No tengo la suficiente energía para hacer mucho. 7 No tengo la suficiente energía para hacer nada. Cambios en el Patrón del Sueño 1 No he tenido ningún cambio en mi patrón del sueño. 1a Duermo un poco más de lo usual. 1b Duermo un poco menos de lo usual. Irritabilidad 4 No me siento más irritado de lo normal. 5 Me siento más irritado de lo normal. 6 Me siento mucho más irritado de lo normal. 7 Me siento irritado todo el tiempo. Cambios en el Apetito 1 No he experimentado ningún cambio en mi apetito. _________________________________________ 1a Mi apetito es un poco menor de lo usual 1b Mi apetito es un poco mayor de lo usual. _________________________________________ 2a Mi apetito es mucho menor de lo usual. 2b Mi apetito es mucho mayor de lo usual. ________________________________________ 3a No tengo apetito del todo. 3b Tengo hambre todo el tiempo. Dificultad de Concentración 4 Me puedo concentrar tan bien como siempre. 5 No me puedo concentrar tan bien como antes. 6 Se me hace difícil mantener mi mente en algo por mucho tiempo. 7 Siento que no me puedo concentrar en nada. Aburrimiento o cansancio 4 No me siento más cansado o aburrido de lo normal. 5 Me canso o me aburro más fácilmente de lo normal. 6 Me siento demasiado cansado o aburrido para hacer muchas de las cosas que solía hacer. 7 Me siento demasiado cansado o aburrido para hacer la mayoría de las cosas que solía hacer. Pérdida de interés en el sexo 4 No he notado ningún cambio reciente en mi interés por el sexo. 5 Estoy menos interesado en el sexo de lo que solía estarlo. 6 Estoy mucho menos interesado en el sexo ahora. 7 He perdido el interés en el sexo completamente. _____________________________________ 2a Duermo mucho más de lo usual. 2b Duermo mucho menos de lo usual. _____________________________________ 3a Duermo la mayor parte del día. 3b Me despierto 1 ó 2 horas más temprano y no puedo volverme a dormir. 149 Anexo 9: Primer borrador resultante de la primera fase: Traducción del Instrumento Nombre: ____________________________ Estado Civil: ________________ Edad: _____ Sexo: ____ Ocupación: __________________________ Nivel Educativo: ____________________________________ Instrucciones: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones cuidadosamente y luego seleccione en cada grupo la frase que mejor describa la forma en que usted se ha estado sintiendo durante las dos últimas semanas, incluyendo hoy. Encierre con un círculo el número que está a la par de la frase que haya seleccionado. Si varias oraciones en un grupo parecen aplicar de igual manera, encierre el número más alto correspondiente a ese grupo. Asegúrese de no escoger más de una frase en cualquier grupo, incluyendo el punto 16 (Cambios en el Patrón del Sueño) o el punto 18 (Cambios en el Apetito). Tristeza 0. 1. 2. 3. Sentimientos de Castigo No me siento triste. Me siento triste la mayor parte del tiempo. Me siento triste todo el tiempo. Me siento tan triste e infeliz que no puedo soportarlo. Pesimismo 0. 1. 2. 3. 3. No siento que merezca ser castigado. Siento que debo ser castigado. Espero ser castigado. Siento que estoy siendo castigado. Auto-desprecio No me siento desanimado sobre mi futuro. Me siento más desanimado sobre mi futuro de lo que solía estarlo. No espero que las cosas vallan a funcionar para mí. Siento que no tengo esperanzas en mi futuro y más bien será peor. Fracasos del Pasado 0. 1. 2. 8 9 10 11 No me siento como un fracasado. Siento que he fracasado más de lo que debí. Cuando pienso en el pasado, recuerdo muchos fracasos. Siento que soy un total fracaso como persona. 7 8 9 Autocrítica 8 9 10 11 8 Sentimientos de Culpabilidad No me critico ni me culpo más de lo usual. Me critico más de lo que solía hacerlo. Me critico por todos mis fallos y defectos. Me culpo por todo lo malo que pasa. Pensamientos o Deseos de Suicidio Pérdida de Satisfacción Siento tanta satisfacción de las cosas que disfruto al igual que antes. 9 No disfruto tanto de las cosas como solía hacerlo. 10 Obtengo poca satisfacción de las cosas que solía disfrutar. 11 No obtengo ninguna satisfacción de las cosas que solía disfrutar. Me siento igual conmigo mismo como siempre. He perdido la confianza en mí mismo. Me siento decepcionado de mí mismo. Me odio a mí mismo. 8 9 10 11 No tengo pensamiento alguno de matarme Tengo pensamientos de matarme pero no lo haría. Me gustaría matarme. Me mataría si tuviera la oportunidad de hacerlo. 8 9 10 11 No lloro más de lo que solía hacerlo. Lloro más de lo que solía hacerlo. Lloro por cualquier cosa pequeña que suceda. Siento ganas de llorar pero no puedo hacerlo. Llanto 8 9 No me siento culpable en particular. Me siento culpable por varias cosas que he hecho o que debí hacer. 10 Me siento bastante culpable la mayor parte del tiempo. 11 Me siento culpable todo el tiempo. 150 4. Inquietud 10. Irritabilidad 8 No me siento más inquieto o intranquilo de lo normal. 9 Me siento más inquieto o intranquilo de lo normal. 10 Me siento tan inquieto o intranquilo que me es difícil quedarme quieto. 11 Me siento tan inquieto o intranquilo que tengo que estar moviéndome o haciendo algo. 8 9 10 11 5. 2 No he experimentado ningún cambio en mi apetito. _________________________________________ 1a Mi apetito es un poco menor de lo usual 1b Mi apetito es un poco mayor de lo usual. _________________________________________ 2a Mi apetito es mucho menor de lo usual. 2b Mi apetito es mucho mayor de lo usual. ________________________________________ 3a No tengo apetito del todo. 3b Tengo hambre todo el tiempo. Pérdida de interés 8 No he perdido el interés en las personas o en las actividades. 9 Tengo menos interés en las personas o en las actividades que antes. 10 He perdido la mayoría del interés en las personas o en las actividades. 11 Me resulta difícil interesarme en algo. 6. 8 9 Indecisión Tomo decisiones tan bien como siempre. Tengo más dificultad en la toma de decisiones de lo normal. 10 Tengo mucha mayor dificultad en la toma de decisiones que antes. 11 Tengo problemas a la hora de tomar decisiones. 7. Baja Autoestima 8 9 No me siento inútil No me considero como alguien valioso y útil como antes. 10 Me siento más inútil que las demás personas. 11 Me siento extremadamente inútil. 8. Pérdida de energía 8 9 10 11 Tengo tanta energía como siempre. Tengo menos energía que antes. No tengo la suficiente energía para hacer mucho. No tengo la suficiente energía para hacer nada. 9. Cambios en el Patrón del Sueño 2 No he tenido ningún cambio en mi patrón del sueño. No me siento más irritable de lo normal. Me siento más irritable de lo normal. Me siento mucho más irritable de lo normal. Me siento irritable todo el tiempo. 11. Cambios en el Apetito 12. Dificultad de Concentración 8 Me puedo concentrar tan bien como siempre. 9 No me puedo concentrar tan bien como antes. 10 Se me hace difícil mantener mi mente en algo por mucho tiempo. 11 Siento que no me puedo concentrar en nada. 13. Cansancio o fatiga 4. 5. 6. 7. No me siento más cansado o fatigado de lo normal. Me canso o me fatigo más fácilmente de lo normal. Me siento demasiado cansado o fatigado para hacer muchas de las cosas que solía hacer. Me siento demasiado cansado o fatigado para hacer la mayoría de las cosas que solía hacer. 14. Pérdida de interés en el sexo 8. No he notado ningún cambio reciente en mi interés por el sexo. 9. Estoy menos interesado en el sexo de lo que solía estarlo. 10. Estoy mucho menos interesado en el sexo ahora. 11. He perdido el interés en el sexo completamente. 1a Duermo un poco más de lo usual. 1b Duermo un poco menos de lo usual. _____________________________________ 2a Duermo mucho más de lo usual. 2b Duermo mucho menos de lo usual. _____________________________________ 3a Duermo la mayor parte del día. 3b Me despierto 1 ó 2 horas más temprano y no puedo volverme a dormir. 151 Anexo 10: Guía de Entrevista Cognitiva Tarea Problema Pruebas Ítem del BDI INSTRUCCIONES: Identifique problemas en todas las introducciones, instrucciones o explicaciones desde la perspectiva del encuestado Introducciones, instrucciones o explicaciones complicadas, confusas o vagas. ¿Antes de pasar a las preguntas, podría repetirme con sus propias palabras la instrucción que acaba de oír o leer? instrucciones CLARIDAD DE LAS PREGUNTAS O REACTIVOS: Identifique problemas relacionados con la intención o significado de las preguntas La pregunta es muy larga o rara, la sintaxis es compleja, la redacción es incorrecta ¿Puede decirme con sus propias palabras que es lo que le acabo de preguntar?, ¿puede decirme con sus propias palabras la frase que acaba de leer? Todos Los términos técnicos están poco definidos, son muy complejos, no están claros ¿Qué significa para usted la palabra (término) en esta pregunta? Existen múltiples formas de interpretar la pregunta, la redacción es vaga o ambivalente. ¿En qué estaba pensando usted cuando le pregunté sobre…? ¿Podría darme ejemplos?, ¿cuáles aspectos incluye el término…? ¿Cuáles no están contemplados en este término? 152 SUPUESTOS: Determine si existen problemas con los presupuestos o la lógica subyacente a las preguntas CONOCIMIENTO /MEMORIA: Verifique si los encuestados tienen problemas para saber o recordar la información que se solicita. Los períodos de tiempo no están especificados, son vagos o contradictorios. ¿Usted puede recordar ese período sobre el que le estoy preguntando?, Usted contestó (repetir la respuesta), ¿cuándo fue eso?, ¿qué período abarca eso? Los supuestos sobre la situación del entrevistado o su experiencia son inapropiados. ¿Qué tanto se aplica esta pregunta a su experiencia?, ¿qué tan lejos está esta situación de su experiencia cotidiana?, ¿puede explicarme más su situación? Se asume una experiencia o conducta constante y estable que en realidad puede variar. ¿Diría usted que eso le pasa siempre?, ¿diría usted que eso varía dependiendo de algo? El reactivo contiene más de una pregunta implícita o hace referencia a más de un objeto actitudinal. Usted acaba decir “depende”, ¿depende de qué?; cuénteme más acerca de sus opiniones sobre este tema. La persona no tiene conocimiento sobre el tema y es probable que no tenga una actitud al respecto La actitud (evaluación) al respecto puede no estar consolidada o no existe ¿Qué tanto conoce sobre (tema)?, ¿qué tan seguro se siente usted al hablar sobre (tema)? ¿Había pensado usted antes en (tema)?, ¿qué tan 153 frecuentemente ha pensado usted al respecto? El entrevistado puede no recordar la información solicitada. ¿Para usted fue esto fácil o difícil recordar?, ¿qué tan seguro está usted de eso?, ¿por qué? La pregunta requiere de un proceso mental complejo. ¿Qué fue lo que usted hizo mentalmente para contestar esta pregunta?, ¿en qué pensó primero?, ¿cómo llegó usted a esa respuesta? SENSIBILIDAD: Revise las La pregunta hace referencia a preguntas o palabras de naturaleza tópicos privados, embarazosos, sensible que implican conductas no deseadas o ilegales. ¿Está bien hablar de estos temas en una encuesta o se siente muy incómodo?; en general, ¿cómo se siente usted ante este tipo de preguntas? La redacción de los reactivos o los términos utilizados son poco sensibles, ofensivos o ajenos a la experiencia de los entrevistados. En esta pregunta, utilizamos el término (palabra sensible), ¿le suena bien a usted o utilizaría otro término? El reactivo evoca respuestas socialmente aceptadas (deseabilidad social). ¿Le parece que se puede dar cualquier respuesta a esta pregunta o más bien le parece que hay una respuesta correcta 154 a esta pregunta? CATEGORÍAS DE RESPUESTA: Verifique qué tan adecuadas son las categorías de respuesta de cada pregunta Las preguntas abiertas son difíciles o inapropiadas. ¿Fue fácil o difícil para usted decidir cuál respuesta dar a esta pregunta? Existe desajuste entre la pregunta y las categorías de respuesta. En esta lista que le di, ¿fue fácil o difícil encontrar la respuesta que usted quería dar? Los términos técnicos en las opciones de respuesta son poco claros, complejos o están sin definir. Las categorías de respuesta pueden ser interpretadas de múltiples maneras (vaguedad). De esta lista, ¿qué significa para usted (término)? Existe un traslape entre las categorías de respuesta. ¿Qué tan fácil o difícil le resultó escoger la respuesta dentro de esta lista de opciones?, ¿por qué escogió usted esta respuesta y no las otras? Hay opciones de respuesta ausentes. En esta lista que le di, ¿fue fácil o difícil encontrar la Dígame qué se le viene a usted a la mente cuando le digo (categorías de respuesta) / cuando ve está escala de respuestas 155 respuesta que usted quería dar? El orden de las categorías de respuesta es ilógico ¿Fue fácil o difícil para usted decidir cuál respuesta dar a esta pregunta?; al ver esta lista de posibles respuestas, ¿usted encontró alguna dificultad para entenderla? Fuente: Adaptación de Smith y Molina (2011) de Willis (2005) 156 Anexo 11: Versión final Adaptación Inventario de Depresión de Beck II Estado Civil: __________ Edad: _____ Sexo: ____ Lugar donde vive____________________ Ocupación: __________________ Nivel Educativo: ________________Fecha_____________ Instrucciones: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones cuidadosamente y luego escoja en cada grupo únicamente la frase que mejor describa la forma en que usted se ha estado sintiendo durante las dos últimas semanas, incluyendo hoy. Encierre con un círculo el número que está a la par de la frase que haya seleccionado. Si le cuesta mucho decidirse entre dos opciones, escoja la que tenga el número más alto. Asegúrese de no escoger más de una frase en cualquier grupo, incluyendo el punto 16 (Cambios en el Patrón del Sueño) o el punto 18 (Cambios en el Apetito). Tristeza 12. 13. 14. 15. No me siento triste. Me siento triste la mayor parte del tiempo. Me siento triste todo el tiempo. Me siento tan triste e infeliz que no puedo soportarlo. Sensación de Castigo 12 13 14 15 Pesimismo 15. 16. 17. 18. No siento desanimo sobre mi futuro. Siento más desanimo sobre mi futuro de lo usual. No espero que las cosas vayan a funcionar para mí. Creo que no tengo esperanzas en mi futuro y que más bien será peor. Fracasos del pasado 19. No me siento como un(a) fracasado(a). 20. Creo que he fracasado más de lo que debí. 21. Cuando pienso en el pasado, recuerdo muchos fracasos. 22. Creo que soy un total fracaso como persona. Pérdida de satisfacción 12 Disfruto de las cosas que me gustan tanto como antes 13 No disfruto tanto de las cosas como solía hacerlo. 14 Obtengo poca satisfacción de las cosas que solía disfrutar. 15 No obtengo ninguna satisfacción de las cosas que antes disfrutaba. Sentimientos de culpa 12 No me siento culpable por algo en particular. 13 Me siento culpable por algunas cosas que he hecho o que debí hacer. 14 Me siento bastante culpable la mayor parte del tiempo. 15 Me siento culpable todo el tiempo. No creo que esté siendo castigado(a). Creo que puedo ser castigado(a). Espero recibir mi castigo(a). Creo que estoy siendo castigado (a). Disconformidad con mi mismo (a) 10 11 12 13 Me siento igual conmigo mismo(a) como antes. He perdido la confianza en mí mismo (a). Me siento decepcionado (a) de mí mismo (a). No me gusta como soy. Autocríticas 12 13 14 15 No me critico ni me culpo más de lo usual. Me critico más de lo que solía hacerlo. Me critico por todos mis fallos y defectos. Me culpo por todo lo malo que pasa. Pensamientos o deseos de Suicidio 12 13 14 15 No tengo ningún pensamiento de suicidio Tengo pensamientos de suicidio pero no lo haría. Me gustaría suicidarme. Me suicidaría apenas tenga la oportunidad de hacerlo Llanto 12 13 14 15 No lloro más de lo que solía hacerlo antes. Lloro más de lo que solía hacerlo antes. Lloro por cualquier cosa. Tengo ganas de llorar pero no puedo hacerlo. Agitación 12 No me siento más inquieto(a) o agitado(a) de lo normal. 13 Me siento más inquieto(a) o agitado(a) de lo normal. 14 Me siento tan inquieto(a) o agitado(a) que me es difícil quedarme en un solo lugar. 15 Me siento tan inquieto(a) o agitado(a) que tengo que estar moviéndome o haciendo algo. Pérdida de interés 12 No he perdido el interés por las personas o las actividades. 13 Tengo menos interés en las personas o en las actividades que antes. 14 He perdido la mayoría del interés en las personas o en las actividades. 15 Es difícil que algo me interese. Indecisión 12 Tomo decisiones tan bien como siempre. 13 Tengo más dificultad en la toma de decisiones de lo normal. 14 Tengo mucha mayor dificultad en la toma de decisiones que antes. 15 Tengo problemas a la hora de tomar decisiones. Inutilidad 12 13 14 15 No me siento inútil No me considero tan valioso(a) y útil como antes. Me siento más inútil que las demás personas. Me siento extremadamente inútil. Pérdida de energía 12 Tengo tanta energía como siempre. 13 Tengo menos energía que antes. 14 No tengo la suficiente energía para hacer muchas cosas. 15 No tengo energía para nada. Irritabilidad 12 13 14 15 No me siento más irritable de lo normal. Me siento más irritable de lo normal. Me siento mucho más irritable de lo normal. Me siento irritable todo el tiempo. Cambios en el Apetito 3 1a 1b 2a 2b 3a 3b No he experimentado ningún cambio en mi apetito. Mi apetito es un poco menor de lo usual Mi apetito es un poco mayor de lo usual. Mi apetito es mucho menor de lo usual. Mi apetito es mucho mayor de lo usual. No tengo apetito del todo. Tengo hambre todo el tiempo. Dificultad de Concentración 12 Me puedo concentrar tan bien como siempre. 13 No me puedo concentrar tan bien como antes. 14 Me cuesta mantenerme concentrado en algo durante mucho tiempo 15 Me parece que no me puedo concentrar en nada. Cansancio o fatiga 16. No me siento más cansado(a) o fatigado(a) de lo normal. 17. Me canso o me fatigo más fácilmente de lo normal. 18. Me siento tan cansado(a) o fatigado(a) como para hacer muchas de las cosas que solía hacer. 19. Me siento tan cansado(a) o fatigado(a) como para hacer la mayoría de las cosas que solía hacer. Pérdida de interés en el sexo 20. No he notado ningún cambio reciente en mi interés por el sexo. 21. Tengo menos interés en el sexo del que solía tener. 22. Tengo mucho menos interés en el sexo ahora. 23. He perdido completamente el interés en el sexo Cambios en los Hábitos de Sueño 3 1a 1b 2a 2b 3a 3b No he tenido ningún cambio en mis hábitos de sueño. Duermo un poco más de lo usual. Duermo un poco menos de lo usual. Duermo mucho más de lo usual. Duermo mucho menos de lo usual. Duermo la mayor parte del día. Me despierto 1 ó 2 horas más temprano y no puedo volverme a dormir. Puntuación página 1 ____ Puntuación página 2 ____ Puntuación Total (págs. 1 + 2) ____ 158 Anexo 12: Escala MDI Instrucciones: Este es un cuestionario diseñado para describir algunos de sus sentimientos y actitudes. Lea cuidadosamente cada pregunta. Marque con una X si es verdadera (V) o falso (F). No deje ninguna pregunta sin contestar. 1. A menudo me siento débil y cansado (a) V F 2. Mi pensamiento es preciso y claro V F 3. A menudo me remuerde la consciencia V F 4. Generalmente me siento inferior V F 5. Me siento mejor cuanto menos gente haya alrededor V F 6. Mi futuro parece cada vez mejor y mejor V F 7. Me encolerizo cuando alguien me contradice V F 8. Soy una persona feliz V F 9. Las personas no me tratan justamente V F 10. A menudo me siento con pereza y lento V F 11. Mis pensamientos son a menudo confusos V F 12. Me he dejado vencer muchas veces V F 13. La opinión que tengo de mi mismo es bastante alta V F 14. Soy un solitario (a) V F 15. Mi futuro parece prometedor (color de rosa) V F 16. Usualmente no discuto con la gente V F 17. Frecuentemente me siento alto de espíritu V F 18. Nadie me considera como me siento V F 19. Mi nivel de energía es generalmente alto V F 20. Generalmente tomo las decisiones con facilidad V F 21. Difícilmente me arrepiento de mis acciones V F 22. Con frecuencia me siento inútil V F 23. Usualmente no me afecta estar entre multitudes V F 159 24. Las cosas se ponen cada vez mejor en mi vida V F 25. La mayoría del tiempo tengo poca paciencia V F 26. Usualmente me siento decaído (a) V F 27. Generalmente obtengo adecuada consideración V F 28. Usualmente me siento lleno (a) de energía V F 29. Mis pensamientos avanzan como círculos a mi alrededor V F 30. A menudo me siento mal de las cosas que he hecho V F 31. A menudo siento que soy un inútil V F 32. Generalmente deseo que la gente me deje solo (a) V F 33. A menudo pienso negativamente sobre el futuro V F 34. Pierdo la paciencia fácilmente V F 35. Frecuentemente me siento triste V F 36. Nadie parece tener suficiente interés en mi V F 37. Usualmente me siento vivo (a) y lleno (a) de energía V F 38. Mi mente por lo general esta atormentada por la confusión V F 39. A menudo me siento culpable V F 40. Estoy seguro de que a la mayoría de la gente me encuentra aburrida (o) V F 41. Soy una persona sociable y amistosa V F 42. Mi futuro, en general, se ve bastante brillante V F 43. Usualmente tengo un temperamento desagradable V F 44. Mi vitalidad es usualmente alta V F 45. Siempre tengo dificultades para tomar decisiones importantes V F 46. Hago muchas cosas de las que luego me arrepiento V F 47. Me parece que nunca hago algo correcto V F ¡Muchas Gracias por su participación! 160 Anexo 13: ESCALA DE AFECTO POSITIVO Y NEGATIVO PANAS Instrucciones: Responda a las siguientes preguntas sobre cómo se ha sentido en el ÚLTIMO MES. Por favor, lea cada una con detenimiento y RODEE con un CÍRCULO el número que en cada una se ajuste mejor al grado en que se ha sentido, conforme al siguiente criterio: 1 = Nada o muy ligeramente 2 = Un poco 3 = Moderadamente 4 = Bastante 5 = Mucho 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. Atento/a Angustiado/a Interesado/a por cosas Preocupado/a, alterado/a Alerta Hostil Excitado/a Irritable Entusiasmado/a Asustado/a Inspirado/a Temeroso/a Orgulloso/a Avergonzado/a Resuelto/a, decidido/a Culpable Fuerte Nervioso/a Activo/a Ansioso/a 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 161 Anexo 14:Plantilla de Observación Transcrita Pruebas Piloto con la Prueba Tiempo de lectura y llenado de Consentimiento (Minutos y segundos) Tiempo de lectura y llenado de Cuestionario (Minutos y segundos) Comprensión de los ítems A: No hace preguntas B: Hace 1 pregunta C: Hace 2 o 3 preguntas D: Hace más de 3 preguntas Dificultades lectoescritura A: No requiere apoyo B: Requiere apoyo en la lectura 7:20 6:31 A A 7:01 7:04 6:40 5:37 A A A A 0:27 1:30 B A 6 4:23 5:35 5:36 6:02 A A A B 7 7:21 8:00 C A 8 5:32 5:07 A A 9 6:27 6:17 A A 10 6:45 6:44 A A 11 6:28 6:48 A A 12 8:29 7:49 A A 13 5:33 4:27 A A 14 0:34 1:49 A A 15 8:44 7:55 B A 16 8:23 8:45 A A 17 7:40 6:23 A A 18 7:23 6:12 A A 19 6:17 6:45 A A 20 5:49 2:34 A A 21 5:38 4:38 A A 22 5:12 9:24 A B 23 5: 01 2:34 A A 24 8:04 7:44 A A 25 8:20 7:47 A A 26 7:43 7:12 A A 27 7:35 6:32 B A 28 6:36 6:25 A A 29 7:12 6:30 A A 30 6:59 6:22 A A 31 7:03 6:44 A A 32 5:48 2:34 A A 33 5:34 3:13 A A 34 5:20 9:12 A B 35 5:24 7:45 A B 36 0:24 2:33 A A 37 4:12 5:23 A A 38 3:47 4:45 A A 39 7:52 7:27 B A 40 2:25 2:50 A A 1 2 3 Sujetos Pruebas Piloto 4 5 162 Anexo 15: Revisión Interjueces Validez de Contenido Trabajo Final de Graduación: Adaptación Segunda Versión del Inventario de Depresión de Beck al Contexto Costarricense. Proceso de Revisión Interjueces, Validez de Contenido Investigador a cargo: Dennis Redondo Alfaro Directora de Tesis: Ana María Jurado Solórzano Revisor: ____________________________________________________________ Grado Académico: ____________________________________________________ Mi nombre es Dennis Redondo Alfaro y me encuentro realizando una adaptación del Inventario de Depresión de Beck (BDI-II) al contexto costarricense. El BDI II es un instrumento de medición que determina el grado de severidad de la Depresión. De esta manera cada uno de los 21 ítems o reactivos intentan guardar correspondencia con alguna conducta propia del cuadro sintomatológico del trastorno a manera de auto informe. Es necesario en el proceso de validación de la adaptación, garantizar su validez de contenido, es decir que el conjunto de ítems que integran la prueba realmente reflejen de forma aceptable al constructo del que se deriva. Se le ha invitado a usted como parte de un comité de expertos con el objetivo de contar con su juicio en torno a la correspondencia entre cada reactivo del Inventario y el constructo teórico de Depresión, del cual la prueba parte. El procedimiento es el siguiente: 1. 2. 3. Por favor, lea con cuidado cada reactivo de la prueba. Reflexione qué tanto considera que el reactivo guarda relación con el constructo de Depresión. A la par de cada enunciado de cada reactivo se encuentra un cuadrado. Dentro del mismo escriba un número del 1 al 4, para cada ítem siguiendo la siguiente escala de clasificación de 4 puntos: 1: No relevante 2: Algo relevante 3: Muy relevante 4: Totalmente relevante Entonces por ejemplo, si considera que un ítem no tiene correspondencia en la sintomatologíatípica de la Depresión escriba“1”. Si al contrario cree que es absolutamente relevante escriba“4”. Solo puede escribir uno de esos 4 números por cada reactivo. Procure que ninguno quede en blanco. 4. Al final aparecen algunas preguntas, no olvide considerarlas. 163 Inventario de Depresión de Beck II Estado Civil: __________ Edad: _____ Sexo: ____ Lugar donde vive____________________ Ocupación: __________________ Nivel Educativo: ________________Fecha_____________ Instrucciones: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones cuidadosamente y luego escoja en cada grupo únicamente la frase que mejor describa la forma en que usted se ha estado sintiendo durante las dos últimas semanas, incluyendo hoy. Encierre con un círculo el número que está a la par de la frase que haya seleccionado. Si le cuesta mucho decidirse entre dos opciones, escoja la que tenga el número más alto. Asegúrese de no escoger más de una frase en cualquier grupo, incluyendo el punto 16 (Cambios en el Patrón del Sueño) o el punto 18 (Cambios en el Apetito). Tristeza 8 9 10 11 No me siento triste. Me siento triste la mayor parte del tiempo. Me siento triste todo el tiempo. Me siento tan triste e infeliz que no puedo soportarlo. Pesimismo 8 9 No siento desanimo sobre mi futuro. Siento más desanimo sobre mi futuro de lo usual. 10 No espero que las cosas vayan a funcionar para mí. 11 Creo que no tengo esperanzas en mi futuro y que más bien será peor. Fracasos del pasado 8 No me siento como un(a) fracasado(a). 9 Creo que he fracasado más de lo que debí. 10 Cuando pienso en el pasado, recuerdo muchos fracasos. 11 Creo que soy un total fracaso como persona. Pérdida de satisfacción 16 Disfruto de las cosas que me gustan tanto como antes 17 No disfruto tanto de las cosas como solía hacerlo. 18 Obtengo poca satisfacción de las cosas que solía disfrutar. 19 No obtengo ninguna satisfacción de las cosas que antes disfrutaba. Sensación de Castigo 16 17 18 19 No creo que esté siendo castigado. Creo que puedo ser castigado. Espero recibir mi castigo. Creo que estoy siendo castigado (a). Disconformidad con mi mismo (a) 14 15 16 17 Me siento igual conmigo mismo(a) como antes. He perdido la confianza en mí mismo (a). Me siento decepcionado (a) de mí mismo (a). No me gusta como soy. Autocríticas 16 17 18 19 No me critico ni me culpo más de lo usual. Me critico más de lo que solía hacerlo. Me critico por todos mis fallos y defectos. Me culpo por todo lo malo que pasa. Pensamientos o deseos de Suicidio 16 17 18 19 No tengo ningún pensamiento de suicidio Tengo pensamientos de suicidio pero no lo haría. Me gustaría suicidarme. Me suicidaría apenas tenga la oportunidad de hacerlo Llanto 16 17 18 19 No lloro más de lo que solía hacerlo antes. Lloro más de lo que solía hacerlo antes. Lloro por cualquier cosa. Tengo ganas de llorar pero no puedo hacerlo. Sentimientos de culpa 16 No me siento culpable por algo en particular. 17 Me siento culpable por algunas cosas que he hecho o que debí hacer. 18 Me siento bastante culpable la mayor parte del tiempo. 19 Me siento culpable todo el tiempo. 164 Agitación 16 No me siento más inquieto(a) o agitado(a) de lo normal. 17 Me siento más inquieto(a) o agitado(a) de lo normal. 18 Me siento tan inquieto(a) o agitado(a) que me es difícil quedarme en un solo lugar. 19 Me siento tan inquieto(a) o agitado(a) que tengo que estar moviéndome o haciendo algo. Pérdida de interés 16 No he perdido el interés por las personas o las actividades. 17 Tengo menos interés en las personas o en las actividades que antes. 18 He perdido la mayoría del interés en las personas o en las actividades. 19 Es difícil que algo me interese. Indecisión 16 Tomo decisiones tan bien como siempre. 17 Tengo más dificultad en la toma de decisiones de lo normal. 18 Tengo mucha mayor dificultad en la toma de decisiones que antes. 19 Tengo problemas a la hora de tomar decisiones. Inutilidad 16 17 18 19 No me siento inútil No me considero tan valioso(a) y útil como antes. Me siento más inútil que las demás personas. Me siento extremadamente inútil. Pérdida de energía 16 Tengo tanta energía como siempre. 17 Tengo menos energía que antes. 18 No tengo la suficiente energía para hacer muchas cosas. 19 No tengo energía para nada. Irritabilidad 16 17 18 19 No me siento más irritable de lo normal. Me siento más irritable de lo normal. Me siento mucho más irritable de lo normal. Me siento irritable todo el tiempo. Cambios en el Apetito 4 1a 1b 2a 2b 3a 3b No he experimentado ningún cambio en mi apetito. Mi apetito es un poco menor de lo usual Mi apetito es un poco mayor de lo usual. Mi apetito es mucho menor de lo usual. Mi apetito es mucho mayor de lo usual. No tengo apetito del todo. Tengo hambre todo el tiempo. Dificultad de Concentración 16 Me puedo concentrar tan bien como siempre. 17 No me puedo concentrar tan bien como antes. 18 Me cuesta mantenerme concentrado en algo durante mucho tiempo 19 Me parece que no me puedo concentrar en nada. Cansancio o fatiga 8 No me siento más cansado o fatigado de lo normal. 9 Me canso o me fatigo más fácilmente de lo normal. 10 Me siento tan cansado o fatigado como para hacer muchas de las cosas que solía hacer. 11 Me siento tan cansado o fatigado como para hacer la mayoría de las cosas que solía hacer. Pérdida de interés en el sexo 8 No he notado ningún cambio reciente en mi interés por el sexo. 9 Tengo menos interés en el sexo del que solía tener. 10 Tengo mucho menos interés en el sexo ahora. 11 He perdido completamente el interés en el sexo Cambios en los Hábitos de Sueño 4 1a 1b 2a 2b 3a 3b No he tenido ningún cambio en mis hábitos de sueño. Duermo un poco más de lo usual. Duermo un poco menos de lo usual. Duermo mucho más de lo usual. Duermo mucho menos de lo usual. Duermo la mayor parte del día. Me despierto 1 ó 2 horas más temprano y no puedo volverme a dormir. 165 Preguntas finales Aparte de los ítems indicados en el BDI II, ¿considera es necesario añadir otros que los autores originales hayan obviado? ¿Cuales? ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ _______________________________________________________________________ ¿Considera pertinente el uso clínico de este instrumento en evaluación de la Depresión? ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ _______________________________________________________________________ ¿Utilizaría el BDI en su trabajo clínico con pacientes cuando sospeche presentan sintomatología Depresiva? Si ( ) No ( ) ¿Por qué? ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ _______________________________________________________________________ Alguna observación que desee añadir: ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ ________________________________________________________________________ _______________________________________________________________________ Muchas gracias por su colaboración. Su criterio será de gran valor para la investigación. 166 Anexo 16: Manual de Uso 167 Aaron T. Beck, Robert A. Steer. Gregory K. Brown. BDI-II. Inventario de Depresión de Beck. Segunda Edición. Manual de la Adaptación al Contexto Costarricense Adaptación. Dennis Redondo Alfaro 2015 Aaron T. Beck Robert A. Steer Gregory K. Brown BDI-II INVENTARIO DE DEPRESIÓN DE BECK Segunda Edición Adaptación al Contexto Costarricense Manual de Uso Adaptación: Dennis Redondo Alfaro 2015 Reconocimientos Dra. Ana María Jurado Solórzano. Directora de Tesis Dr. Roberto Lopez Coré. Lector de Tesis Msc. Alfonso Villalobos. Lector de Tesis Msc. Maria Elena Murillo. Tutora Institucional CCSS. Autor: Dennis Redondo Alfaro TABLA DE CONTENIDO INTRODUCCIÓN.......................................................................................................................... 6 CARACTERÍSTICAS GENERALES................................................................................................... 7 DESARROLLO Y EVOLUCIÓN ........................................................................................................ 8 PROCESO DE ADAPTACIÓN A COSTA RICA .......................................................................... 10 Etapa 1: Adaptación del instrumento ................................................................................ 11 Traducción y adaptación del instrumento.................................................................... 11 Revisión de la versión traducida o adaptada ............................................................... 12 Adaptar el borrador del instrumento con base en las sugerencias de los jueces ... 12 Etapa 2: Pruebas con el instrumento ................................................................................. 13 Prueba piloto del instrumento......................................................................................... 13 Prueba de campo.............................................................................................................. 13 Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento ............... 14 Estandarizar las puntuaciones ........................................................................................ 15 Realizar una investigación sobre la validación del instrumento ............................... 15 CARACTERÍSTICAS PSICOMÉTRICAS DE LA ADAPTACIÓN .................................................. 16 Evidencias de Fiabilidad...................................................................................................... 16 Estabilidad de la Medida ................................................................................................ 16 Homogeneidad de la Medida ......................................................................................... 16 Evidencias de Validez .......................................................................................................... 17 Validez de Contenido ...................................................................................................... 17 Validez Estructural ............................................................................................................ 17 Validez Convergente y Divergente .................................................................................. 2 Validez Diagnóstica ........................................................................................................... 4 ADMINISTRACIÓN Y PUNTUACIÓN DEL BDI ............................................................................. 8 REFERENCIAS BIBLIOGRÁFICAS................................................................................................ 10 INTRODUCCIÓN Como trastorno afectivo, la Depresión es un constructo psicológico que presenta dentro de sus principales características la particularidad de poseer una alta prevalencia e incidencia a nivel nacional. Además, no solamente es un trastorno común sino que, debido a que sus implicaciones limitan al sujeto desde el plano afectivo hasta el conductual, fisiológico, cognitivo e incluso el interpersonal; suele presentar criterios elevados de frecuencia, intensidad y duración, variables que acentúan su nivel de complejidad y apremio clínico Por tal razón se toma la decisión de realizar una adaptación de la segunda versión del Inventario de Depresión de Beck (BDI-II), como instrumento de ayuda en el diagnóstico clínico de la depresión. Dicho proceso de Investigación se enmarcó como Trabajo Final de Graduación para optar por el grado de Licenciatura en la Escuela de Psicología de la Universidad de Costa Rica. Por medio de este manual se pretende mostrar las características que tuvo dicha adaptación, además de mostrar las normas de Administración y Puntuación con el fin de proveer al lector, un instrumento que le facilite el diagnostico clínico y le posibilite de mayor precisión. CARACTERÍSTICAS GENERALES El Inventario de Depresión de Beck en su segunda versión (BDI-II) es un cuestionario autoaplicado de 21 ítems, los cuales evalúan un amplio cúmulo de síntomas depresivos (uno por cada ítem), con una edad mínima de trece años. Cada ítem contiene cuatro opciones, las cuales varían en intensidad del síntoma, desde 0 (ausencia o síntoma leve) hasta 4 (presencia disfuncional del mismo). Entre sus usos principales se encuentra la evaluación de cambio en pacientes con tratamiento de depresión y el diagnostico de la misma (Pérez y Muñoz, 2004). El BDI-II ha sido utilizado en múltiples contextos en el ámbito clínico y en la investigación. La aceptación que ha recibido del medio internacional ha sido muy importante al punto de constituirse, según Sanz, Navarro y Vázquez (2003) en el instrumento de autoaplicación en evaluación de depresión más usado tanto en el ámbito clínico como en investigación. Los autores de la prueba señalan como en los primeros 25 años del instrumento ya se habían producido más de 1500 artículos haciendo referencia a su uso, así como múltiples investigaciones empíricas demostrando su utilidad. (Beck, Steer y Brown, 2009). Según Pérez y Muñoz (2004), posee capacidad discriminativa entre: 1. Pacientes con y sin trastorno depresivo, 2. Pacientes con distimia de aquellos con un trastorno depresivo mayor y 3. Pacientes con un trastorno de ansiedad generalizada de aquellos con un trastorno depresivo mayor. No obstante, el BDI-II no está diseñado para diferenciar entre distintos trastornos depresivos, sino solo entre dimensiones de depresión. Los mismos autores señalan que la prueba es muy sensible al cambio terapéutico y puede ser administrado de forma repetida. (Beck, Steer y Brown, 2009) DESARROLLO Y EVOLUCIÓN El antecesor del BDI-II, el BDI creado en 1963, fue formulado en base a la construcción del concepto de depresión que se sostenía en ese momento tomando como principio fundamental la teoría de la depresión de Aaron Beck basado en lo que el autor denominó el trío cognitivo negativo (pensamientos negativos sobre sí mismo, el mundo y el futuro) (Butcher et al, 2006) teoría que suponía un consenso clínico en cuanto a la comprensión de la depresión en ese momento (Sanz et al, 2003). Para Pérez y Muñoz (2004) esta primera versión, al ser anterior al DSM-III estaba exenta de los criterios diagnósticos y dentro de sus objetivos no se encontraba la clasificación. La misma se desarrolló por tanto a partir de la experiencia clínica de Beck en psicoanálisis. A lo largo de los años, conforme su teoría fue adquiriendo mayor coherencia, elaboración y respaldo investigativo, se tornó necesaria la modificación del BDI inicial. La versión inicial la cual apenas constaba de una escala de valoración de uso para el clínico desarrollada en 1961, fue modificada para 1978 por un cuestionario autoaplicado de 21 ítems, cada uno con cuatro opciones de respuesta (BDI-IA). No obstante, con el surgimiento e influencia del DSM-III (y posteriores) y la introducción de definiciones como la distimia y la depresión mayor, surgen investigaciones que desacreditan la capacidad discriminativa del BDI-IA, señalando su falta de adecuación a los criterios diagnósticos emergentes en la depresión. Sanz et al, 2003, señala que el BDI I-A no cubre el criterio sintomático de enlentecimiento o agitación psicomotor, cubre síntomas (hipocondría y desesperanza) que no son propios del episodio depresivo mayor para el DSM y, no permite evaluar sintomatología depresiva durante el periodo de tiempo mínimo (2 semanas). A la luz de estas deficiencias, en 1994 Beck y sus colaboradores comienzan con el trabajo piloto y es en 1996 cuando surge el BDI-II, el cual según Pérez y Muñoz (2004) continua conservando la misma estructura de 21 ítems de cuatro valores pero varía dos aspectos importantes, la anterior ventana de medida de una semana a dos y algunos ítems de importancia, los cuales para los mismos autores y para Sanz et al (2003) se modifican con el objetivo de cubrir los distintos criterios diagnósticos del DSM. PROCESO DE ADAPTACIÓN A COSTA RICA El estudio se realizó principalmente en dos poblaciones diferentes: una población general y una población clínica con sintomatología depresiva teniendo todos los sujetos más de 18 años. Para la población general se trabajó con 618 sujetos procedentes del Gran Área Metropolitana. Se decidió trabajar con este sector de la población nacional únicamente por razones de factibilidad, ya que resultaba metodológicamente imposible cubrir con representatividad estadística toda la población nacional. Con la población clínica se trabajó con 70 sujetos, tomados de 2 fuentes: Casos clínicos que maneja la Caja Costarricense de Seguro Social (CCSS) en consulta externa del Hospital Psiquiátrico Roberto Chacón Paut. Apoyo por parte de profesionales en Psicología. El proceso de adaptación de la prueba BDI–II fue dividido en siete fases siguiendo en estricto orden los lineamientos internacionalmente aceptados y reconocidos para la adaptación y estandarización de pruebas psicológicas (Geissenger, 1994). Esas 7 fases han sido agrupadas en tres categorías o etapas, con lo que se pretende sistematizar el avance de la investigación en cuanto a ejes temáticos: “La Adaptación del Instrumento”, “Pruebas con el Instrumento” y “Análisis y exposición de las cualidades psicométricas del instrumento”. La metodología utilizada, en apego a las primeras siete fases propuestas por Geissenger (1994), se describe a continuación. Etapa 1: Adaptación del instrumento Esta fase está determinada por la revisión y redacción de los criterios adecuados con los que se presentará la prueba en su versión final. Tuvo por objetivo traducir el inventario con las palabras más apropiadas para cada ítem de modo que resulten lo mejor comprensibles para la población costarricense. Está conformada por los tres primeros pasos que propone Geissenger (1994). Traducción y adaptación del instrumento Consiste en una valoración de si el instrumento amerita ser traducido de su lengua original pregunta por pregunta. En el caso del BDI –II, su idioma original es el inglés, lo cual obliga su traducción. Para esto se trabajó en varias subfases paralelas: Traducción de la prueba. Se realizaron dos procesos simultáneos: Traducción de la prueba por parte de un traductor profesional Traducción por parte del investigador responsable del proyecto. Comparación y unificación de las dos versiones. Una vez obtenidas ambas versiones, las mismas se unificaron. Comparación con la versión española y argentina. La versión resultante se comparó con las dos versiones que existen en el idioma español. Redacción de un borrador. Al final se creó un primer borrador o propuesta. Revisión de la versión traducida o adaptada En este proceso el borrador que surgió de la fase anterior se les administró a distintas personas con el fin de que evaluaran y valoraran la calidad de la traducción. Las recomendaciones obtenidas en esta fase constituyeron insumos de la revisión que se procuraría para la siguiente. Se tomaron en cuenta los criterios de dos tipos de jueces, un primer grupo compuesto por profesionales en Psicología y un segundo compuesto por personas de Población General. Adaptar el borrador del instrumento con base en las sugerencias de los jueces Consistió en una valoración de las correcciones ofrecidas por los profesionales en la fase anterior y una modificación de la prueba según las indicaciones ofrecidas por los jueces. Al realizarse dicha integración, la prueba se sometió finalmente a dos procesos de esta fase: una traducción inversa y posteriormente una revisión y corrección por parte de un profesional en Filología. Etapa 2: Pruebas con el instrumento Una vez realizada la traducción y adaptación del instrumento, fue necesario comprobar su comportamiento con una muestra de participantes. Para lograr esto, se realizaron varias aplicaciones con el instrumento resultante de la Etapa 1. El objetivo al que obedece es el de evaluar la comprensión de los ítems del inventario desde la perspectiva de una sub muestra de personas de la población general. Le conforman las siguientes fases de igual manera propuestas por Geissenger (1994): Prueba piloto del instrumento El borrador final se aplicó a una población de prueba, con el objetivo de observar el comportamiento del instrumento en una posterior prueba de campo. Se trabajó con 40 personas de población general ubicados en el parque Central de San José. Se les administro consentimiento informado y la adaptación del cuestionario BDI II. Prueba de campo En esta fase la adaptación final del BDI-II con las debidas correcciones realizadas y habiendo tomado en cuenta que la prueba piloto se dio con éxito, se aplicó a la muestra del GAM. A su vez, para disminuir al máximo las posibilidades de valores perdidos, siempre se contó con la presencia y fiscalización del investigador, garantizándose que la prueba fuera contestada en su totalidad. Básicamente, se utilizaron dos tipos de muestra, ambas del Gran Área Metropolitana: Una derivada de la población general y otra de la población clínica Población General Con el objetivo de revisar los criterios de validez y fiabilidad de la prueba, con respecto a la validez interna se utilizó una muestra de 51 personas para el procedimiento test-retest; mientras que para la validez convergente y divergente se les aplicó a 281 personas (251 de población general y 30 población clínica) en conjunto con el BDI-II el instrumento MDI (Multiscore Depression Inventory, adaptado en 1997) y el Possitive and Negative Affect Schedule (Escala de afecto positivo y negativo PANAS) En cuanto a la población clínica, la investigación tomó en cuenta personas que presentasen sintomatología básica de Trastorno de Depresión Mayor según los criterios del DSM-V), tomándose en cuenta referencias realizadas únicamente por evaluaciones de profesionales en psicología y psiquiatría, tanto de los servicios de la CCSS, como de consulta clínica privada. De esta forma se pudo obtener una muestra de 70 personas población clínica. Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento Una vez obtenidos todos los datos necesarios, se procedió a la fase final, la cual constó de una revisión y exposición de los principales datos de la prueba como instrumento de medición viable. Para conseguir dicha revisión, en esta fase se dio una sistematización de toda la información obtenida en las pruebas de campo en el programa análisis estadístico SPSS. En esta fase se revisó indicadores de validez y fiabilidad de la prueba. Estandarizar las puntuaciones Dado que el objetivo de esta fase consiste en determinar que la prueba cuenta con garantías suficientes per se para demostrar que mide con integridad, consistencia y veracidad, se evidencia a través de los indicadores de fiabilidad con los siguientes procedimientos: Relacionados con la Estabilidad de la medida: Procedimiento Test Retest a través de Correlaciones Pearson/Spearman Relacionadas con la Homogeneidad de la medida: Alpha de Cronbach Relacionadas con la Objetividad de la medida: No fueron necesarias pruebas en este rubro ya que se utiliza para pruebas con calificación en la que influye a subjetividad del evaluador. Realizar una investigación sobre la validación del instrumento Con respecto a indicadores de validez se realizaron los siguientes procedimientos: Validez contenido: Criterio de Acuerdo Interjueces Validez Estructural: Análisis factorial exploratorio. Validez Concurrente/discriminante: Correlaciones con MDI y Panas Validez diagnóstica: Análisis de medias entre poblaciones. Puntos de corte (ROC) CARACTERÍSTICAS PSICOMÉTRICAS DE LA ADAPTACIÓN Evidencias de Fiabilidad Estabilidad de la Medida La prueba test Retest, aplicada en 51 participantes de población general a un espacio de 15 días entre cada aplicación, tal como indica la Tabla 1 se revela un coeficiente de correlación de Pearson de .954 entre una aplicación y la otra. Estos resultados indican que la prueba presenta adecuados indicadores de Fiabilidad en cuanto a la Estabilidad de la Medida. Tabla 1: Estadísticos de Fiabilidad Test Retest Cronbach's Alpha Correlation Between Forms Spearman-Brown Coefficient Part 1 Value N of Items Part 2 Value N of Items Total N of Items .901 21 .935 21 42 .954 Equal Length .976 Unequal Length .976 Guttman Split-Half Coefficient .975 Homogeneidad de la Medida Tal como indica la Tabla 2, para población general se obtuvo un coeficiente de homogeneidad Alpha de Crombach de .908, para la población clínica el alpha fue de .885. Estos resultados indican una alta correlación delos ítems de la prueba entre sí, siendo suficiente para garantizar la fiabilidad de la escala. Tabla 2: Alpha de Crombach en las distintas muestras Coeficiente Alfa de Crombach Población General .908 Cuestionarios En Línea .891 Población Clínica .885 Evidencias de Validez Validez de Contenido Este tipo de validez se indagó por medio de un cuestionario de criterio interjueces. En el mismo cada juez debía anotar un número en escala del 1 al 4 para cada ítem siguiendo la siguiente clasificación de 4 puntos: 1. No relevante 2. Algo relevante 3. Muy relevante 4. Totalmente relevante Se contó con 3 participantes expertos, dos master en psicología y un licenciado. Al promediar la calificación de los tres y estandarizarlo en escala 0 a 1, el promedio final fue de 0,84. Validez Estructural Para este estudio se llevaron a cabo dos tipos de análisis factoriales: Exploratorio y confirmatorio. Análisis Factorial Exploratorio Al proceder con el análisis Factorial Exploratorio, se utilizó una rotación Oblicua acompañada de una normalización de Kaiser La siguiente tabla 3 presenta los resultados del total de la Varianza explicada por los dos principales factores presentados. La extracción de componentes indica 2 autovalores eigenvalue superior a 1 y por tanto 2 factores. Tabla 3: Total de la Varianza Explicada por valores Eigenvalue Factor Eigenvalues Iniciales Total % de % Varianza Acumulativo 1 6.869 32.710 32.710 2 1.487 7.080 39.790 3 1.097 5.222 45.012 4 1.029 4.900 49.912 5 .867 4.130 54.042 6 .866 4.122 58.164 7 .838 3.989 62.154 8 .750 3.571 65.725 9 .728 3.468 69.193 10 .701 3.339 72.532 11 .671 3.196 75.728 12 .631 3.006 78.733 13 .620 2.951 81.684 14 .580 2.762 84.447 15 .551 2.624 87.071 16 .541 2.576 89.647 17 .510 2.429 92.076 18 .468 2.229 94.305 19 .416 1.979 96.284 20 .400 1.903 98.188 21 .381 1.812 100.000 Método de Extracción: Principal Axis Factoring Sumas de la Extracción de Cargas al Cuadrado Total % de Varianza 6.226 29.646 .869 4.136 Sumas de la Rotación de Cargas al Cuadrado % Acumulativo Total 29.646 33.782 5.636 4.867 En la siguiente tabla se aprecia el peso de distribución de las cargas factoriales de cada ítem con respecto a los dos factores mencionados: Tabla 1: Matriz de configuración de factores Componente 1 2 .653 -.014 .653 -.014 .706 -.109 .179 .519 .477 .102 .803 -.177 .660 .087 Tristeza Pesimismo Fracasos del pasado Pérdida de Satisfacción Sentimientos de culpa Sensación de Castigo Disconformidad con mi mismo Autocriticas .488 .221 Pensamientos o deseos .722 .102 de Suicidio Llanto .645 -.099 Agitación .459 .172 Pérdida de Interés .160 .479 Indecisión .312 .338 Inutilidad .468 .192 Pérdida de Energía -.249 .924 Cambios en los Hábitos .021 .641 de Sueño Irritabilidad .134 .486 Cambios en el Apetito .175 .535 Dificultad de -.050 .689 Concentración Cansancio o Fatiga -.102 .841 Pérdida de interés en el .430 .327 sexo Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Promax con Kaiser. Por último, se muestra una correlación entre ambos de .655, dato que evidencia una alta asociación entre ambos factores. Tabla 2: Matriz de correlaciones de componentes Componente 1 2 1 1.000 .655 2 .655 1.000 Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Promax con Kaiser. Análisis Factorial Confirmatorio Dado que en el Análisis Factorial Exploratorio se sugiere la existencia de que dos factores asumen la distribución de las cargas factoriales, los resultados del Análisis Factorial Confirmatorio reafirman la distribución de las cargas factoriales con significancia estadística en los dos factores. En la Tabla 6 se denota que todos los pesos son estadísticamente significativos con un nivel de confianza del 95% puesto que en todos los casos la relación crítica (C.R.) de la desviación estándar (S.E.) es superior a 1.96. En todos los ítems, p < .001. Tabla 6: Pesos de Regresión por factores Estimado S.E. C.R. P Tristeza <--- Cognitivoemocional 1,000 Pesimismo <--- Cognitivoemocional 1,328 ,110 12,028 *** Fracasos <--- Cognitivoemocional 1,604 ,138 11,640 *** Culpa <--- Cognitivoemocional 1,149 ,106 10,842 *** Castigo <--- Cognitivoemocional 1,929 ,158 12,211 *** Disconformidad <--- Cognitivoemocional 2,166 ,158 13,676 *** Autocriticas <--- Cognitivoemocional 1,952 ,154 12,685 *** Suicidio <--- Cognitivoemocional 1,195 ,082 14,652 *** Inutilidad <--- Cognitivoemocional 1,254 ,102 12,287 *** Agitación <--- Cognitivoemocional 1,731 ,152 11,407 *** Llanto <--- Cognitivoemocional 1,695 ,159 10,634 *** Satisfaccion <--- ConductualFisiologico 1,000 Interés <--- ConductualFisiologico 1,138 ,095 11,926 *** Sueño <--- ConductualFisiologico 1,210 ,097 12,526 *** Energía <--- ConductualFisiologico 1,074 ,082 13,093 *** Apetito <--- ConductualFisiologico 1,327 ,100 13,236 *** Concentración <--- ConductualFisiologico 1,083 ,089 12,114 *** Cansancio <--- ConductualFisiologico 1,296 ,092 14,031 *** Irritabilidad <--- ConductualFisiologico ,936 ,081 11,588 *** Indecisión <--- ConductualFisiologico 1,296 ,109 11,924 *** Interessexual <--- ConductualFisiologico 1,100 ,080 13,822 *** En cuanto a los pesos factoriales para la solución estandarizada, vienen representados en la Tabla 7. Los mismos arrojan indicadores estadísticamente aceptables en cuanto a la vinculación con su respectivo factor teóricamente asumido. Tabla 3: Pesos de Regresión estandarizados Tristeza Pesimismo Fracasos Culpa Castigo Disconformidad Autocriticas Suicidio Inutilidad Agitación Llanto Satisfaccion Interés Sueño Energía Apetito Concentración Cansancio Irritabilidad Indecisión Interessexual <--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--- Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional Cognitivoemocional ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico ConductualFisiologico Estimado ,593 ,585 ,561 ,513 ,597 ,698 ,628 ,774 ,602 ,546 ,501 ,625 ,558 ,592 ,625 ,634 ,568 ,683 ,539 ,558 ,670 Finalmente en la tabla 9 las correlaciones entre ambos factores, siendo estimada en .861. Tabla 9: Correlaciones entre Factores Estimado Cognitivoemocional <--> ConductualFisiologico ,861 Validez Convergente y Divergente Población General Como indica la Tabla 10, los análisis de correlaciones de Pearson entre las pruebas mencionadas sugieren correlaciones positivas entre el BDI-II con el MDI y la escala de Afecto Negativo del PANAS (.828 y .690 respectivamente) con significancia estadística a dos colas. Por otro lado, entre el BDI II y la escala de Afecto Positivo existe discrepancia ya que correlacionan de forma negativa entre ambas con un coeficiente de correlación de Pearson de -.278 a una significancia estadística de dos colas. De esta forma las puntuaciones del BDI concuerdan con los resultados arrojados por sus homólogos MDI y escala de Afecto Negativo de PANAS, y se distancia de los resultados de la escala de Afecto Positivo del PANAS. Tabla 4: Correlaciones entre BDI-II, MDI y PANAS Población General BDI BDI Correlación de Pearson 1 Afecto Positivo Negativo MDI -.278** .690** .828** .000 .000 .000 249 219 228 203 -.278** 1 -.072 -.412** Sig. (bilateral) N Afecto Afecto Correlación de Pearson Positivo Sig. (bilateral) .000 .292 .000 N 219 226 217 188 .690** -.072 1 .704** Afecto Correlación de Pearson Negativo Sig. (bilateral) .000 .292 N 228 217 235 199 .828** -.412** .704** 1 Sig. (bilateral) .000 .000 .000 N 203 188 199 MDI Correlación de Pearson **. La correlación es significativa al nivel 0,01 (bilateral). .000 211 Población Clínica En cuanto a Validez Convergente, según la tabla 11 las correlaciones entre el BDI y la escala de Afecto Negativo relatan una fuerte asociación entre ambas con un coeficiente de correlación de Pearson de .877. A su vez con el MDI se delata un .675, confirmando la fuerte asociación entre ambas. En esta línea, la escala de Afecto Negativo también correlaciona de forma positiva con el MDI, señalando un .716 como coeficiente. Con respecto a Validez Divergente, la escala de Afecto Positivo discrepa fuertemente con las otras mediciones, siendo correlaciones negativas en todos los casos: -.813, -.846 y -840 para el BDI, la escala de Afecto Negativo y el MDI respectivamente. Tabla 11: Correlaciones entre BDI-II, MDI y PANAS Población Clínica BDI BDI Correlación de Pearson 1 Afecto Correlación de Pearson Positivo Sig. (bilateral) N Afecto Correlación de Pearson Negativo Sig. (bilateral) N MDI Correlación de Pearson Sig. (bilateral) N Afecto MDI Positivo Negativo -.813** .877** .675** .000 .000 .000 30 30 30 30 -.813** 1 -.846** -.840** .000 .000 Sig. (bilateral) N Afecto .000 30 30 30 30 .877** -.846** 1 .716** .000 .000 30 30 30 30 .675** -.840** .716** 1 .000 .000 .000 30 30 30 **. La correlación es significativa al nivel 0,01 (bilateral). .000 30 Validez Diagnóstica La tabla 12 muestra las diferencias de medias entre ambos grupos de muestras, Población general y clínica. Para la muestra de Población General se seleccionó al azar un conjunto de 79 personas, con el objetivo de que fuese homologable con su correspondiente en la muestra clínica de igual cantidad. De esta tabla se desprende la diferencia de medias, la tabla 13 muestra como la diferencia entre las mismas es estadísticamente significativa. Tabla 12: Medias y desviaciones estándares de las puntuaciones del BDI-II por muestra Muestra N Media Desviación típ. Error típ. de la media Población General 79 9.09 9.292 1.045 Población Clínica 79 33.00 10.785 1.213 Tabla 13: Prueba T para muestras independientes medias por muestra Prueba de Levene para la igualdad de varianzas F Se han asumido varianza s iguales No se han asumido varianza s iguales 3.525 Sig. .062 Prueba T para la igualdad de medias t gl Sig. (bilateral) Diferencia de medias Error típ. de la diferenci a 95% Intervalo de confianza para la diferencia Inferior Superior -14.930 156 .000 -23.911 1.602 27.075 -20.748 -14.930 152 .66 1 .000 -23.911 1.602 27.076 -20.747 En concordancia con la figura 1 donde se muestra la Curva COR, en la tabla 14 se muestra que el Área bajo la Curva es de .937 siendo esta aceptable. Obteniendo las coordenadas de la Curva COR y convirtiéndolas a porcentajes, en la tabla 43 se muestra la sensibilidad y especificidad para los puntos de corte del BDI-II en función de su discriminación entre pacientes con depresión y muestra General. El punto de corte que corresponde a 14,50 ofrece una sensibilidad de 95,5% y una especificidad de 73,1%. Por tanto, según la muestra participante de esta investigación, una puntuación por encima de 15 se puede considerar un buen criterio para identificar alrededor del 95% individuos con Depresión correctamente y siendo menor a esta ofrece un estimado de discriminación de alrededor del 75% de individuos sin Depresión. Figura1: Curva COR Tabla 14: Área bajo la curva Área Error típ.a Sig. asintóticab Intervalo de confianza asintótico al 95% Límite inferior .937 .020 a. Bajo el supuesto no paramétrico b. Hipótesis nula: área verdadera = 0,5 .000 .897 Límite superior .977 Tabla 15: Porcentajes de Sensibilidad, especificidad para la detección de Depresión Mayor para cada punto de corte del BDI-II Positivo si es mayor o igual quea Sensibilidad (en %) Especificidad (en %) -1,00 100 0 ,50 100 11,9402985 1,50 100 17,9104478 2,50 100 23,880597 3,50 100 31,3432836 4,50 100 38,8059701 5,50 100 44,7761194 6,50 100 52,238806 7,50 100 58,2089552 8,50 100 61,1940299 9,50 98,5074627 67,1641791 11,00 98,5074627 68,6567164 12,50 97,0149254 68,6567164 13,50 97,0149254 71,641791 14,50 95,5223881 73,1343284 15,50 94,0298507 77,6119403 16,50 94,0298507 79,1044776 17,50 94,0298507 83,5820896 18,50 91,0447761 83,5820896 19,50 88,0597015 85,0746269 20,50 86,5671642 86,5671642 21,50 82,0895522 88,0597015 22,50 79,1044776 89,5522388 23,50 77,6119403 89,5522388 25,00 73,1343284 89,5522388 26,50 68,6567164 92,5373134 27,50 65,6716418 92,5373134 28,50 64,1791045 94,0298507 29,50 61,1940299 95,5223881 30,50 61,1940299 97,0149254 31,50 58,2089552 97,0149254 32,50 53,7313433 97,0149254 33,50 50,7462687 97,0149254 34,50 44,7761194 97,0149254 35,50 43,2835821 97,0149254 36,50 37,3134328 98,5074627 37,50 29,8507463 98,5074627 38,50 26,8656716 98,5074627 39,50 23,880597 98,5074627 40,50 22,3880597 98,5074627 41,50 19,4029851 98,5074627 42,50 19,4029851 100 43,50 17,9104478 100 44,50 14,9253731 100 45,50 13,4328358 100 46,50 10,4477612 100 47,50 8,95522388 100 51,50 2,98507463 100 56,00 0 100 a. El menor valor de corte es el valor de contraste observado mínimo menos 1, mientras que el mayor valor de corte es el valor de contraste observado máximo más 1. Todos los demás valores de corte son la media de dos valores de contraste observados ordenados y consecutivos. Por último, en la tabla 16 se muestra una propuesta de agrupación de ambas muestras general y clínica (n: 79 para cada una) en la cual se indican 4 puntos de corte, de la misma forma que con el BDI-II original. Dicha agrupación obedece a una distribución por percentiles, colocando en cada rango el 25% de la muestra. El mismo queda de la siguiente forma: Tabla 16: Propuesta de Puntos de Corte para Costa Rica Puntos de Corte Rango Mínimo Puntuación de 0 a 7 Rango Leve Puntuación de 8 a 20 Rango Moderado Puntuación de 21 a 34 Rango Severo Puntuación de 34 a 63 ADMINISTRACIÓN Y PUNTUACIÓN DEL BDI Condiciones de Administración El BDI II no presenta requisitos muy elaborados, siendo más bien fácil su administración. Se recomienda que el lugar donde se administra sea iluminado, tranquilo, ventilado y con una temperatura adecuada. Si la persona se le dificulta la lectoescritura, el administrador le puede leer los ítems en voz alta. Tiempo de administración Se requieren de 5 a 10 minutos. Pacientes con Depresión severa pueden tardar más. En el caso de administrarse de forma oral, la duración suele ser más larga. Administración La consigna de administración está en el mismo cuestionario. Esta la puede leer el paciente o ser leída en voz alta por el administrador: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones cuidadosamente y luego seleccione en cada grupo la frase que mejor describa la forma en que usted se ha estado sintiendo durante las dos últimas semanas, incluyendo hoy. Encierre con un círculo el número que está a la par de la frase que haya seleccionado. Si varias oraciones en un grupo parecen aplicar de igual manera, encierre el número más alto correspondiente a ese grupo. Asegúrese de no escoger más de una frase en cualquier grupo, incluyendo el punto 16 (Cambios en el Patrón del Sueño) o el punto 18 (Cambios en el Apetito). Administración Oral En caso de que la administración sea heteroaplicada, en lugar de la consigna anterior se debe acompañar de la que sigue: Este es un cuestionario. En el cuestionario hay grupos de oraciones. Le leeré cada grupo y entonces me indica la frase que mejor describa la forma en que usted se ha estado sintiendo durante las dos últimas semanas, incluyendo hoy. Al leer cada enunciado se le puede solicitar al paciente: Con cual te identificaste más Cuál sería el adecuado en tu caso Cual describe mejor como te has estado sintiendo Puntuación La puntuación del BDI II se obtiene por medio de la sumatoria de cada elección de los 21 ítems. Cada ítem es codificado en una escala de 4 puntos, que van de 0 a 3. El máximo posible correspondería a 63 (21 x 3) y el mínimo 0. REFERENCIAS BIBLIOGRÁFICAS Beck, A., Steer, R., & Brown, G. (1996/2009).Manual para el Inventario de Depresión de Beck—II. (1ª Reimpresión).Buenos Aires: Paidós. Butcher, J., Mineka, S., Hooley, J. (2007). Psicología Clínica. Madrid: Pearson. Geissenger, K. (1994). Cross-Cultural Normative Assessment: Translation and Adaptation Issues Influencing the Normative Interpretation of Assessment Instruments. Psychological Assessment, 6(4), 304-312. Pérez, E., & Muñoz, M. (2004). Inventario de Depresión de Beck. En R. FernándezBallesteros (Ed.), Evaluación Psicológica. Conceptos, Métodos y Estudio de casos. Madrid: Pirámide. Sanz, J., Navarro, M., y Vázquez, C. (2003). Adaptación española del Inventario para la Depresión de Beck-II (BDI-II): 1.Propiedades psicométricas en estudiantes universitarios. Análisis y Modificación de Conducta, 29(124), 239-288.