Adaptación Inventario de Depresión de Beck.

Anuncio
UNIVERSIDAD DE COSTA RICA
FACULTAD DE CIENCIAS SOCIALES
ESCUELA DE PSICOLOGIA
TRABAJO FINAL DE GRADUACION PARA OPTAR POR EL GRADO DE
LICENCIATURA EN PSICOLOGIA
Título
ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE DEPRESION
DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA
Sustentante:
DENNIS FABIAN REDONDO ALFARO
A75253
Comité Asesor:
Directora: Dra. Ana María Jurado Solórzano
Lector: Dr. Roberto López Core
Lector: Msc. Alfonso Villalobos Pérez
Tutora externa: Msc. María Elena Murillo
2015
Hoja de aprobación, con el nombre de los miembros del Tribunal y del sustentante
Dra. Ana María Jurado Solórzano. Directora
'~~
Dr. Roberto López Core. Lector
Lic. Bradley Marín Picado. Profesor invitado
Lic. Esteban Navarro Díaz. Representante de la Escuela
Dermis Redondo Alfaro. Sustentante
Dedicatoria
Dedico este Trabajo Final de Graduación a las grandes personas que me han acompañado.
A mi familia, Víctor, Ligia, Osvaldo e Ignacio. Mi superación personal es dedicada a ellos,
como recuerdo de que podemos salir adelante si nos lo proponemos. A mis hermanos, pues,
les recuerdo que si yo lo logré, ustedes pueden. Sigan adelante y luchen por sus sueños. A
mis papás les dejo esta tesis, como un símbolo de agradecimiento. Es un honor para mí que
la vida les recompense por medio de mi esfuerzo.
A mi novia Marta, por su motivadora y aliciente escucha. Tu comprensión fue un tesoro
para mí. No era tu proyecto, no era tu problema, pero decidiste ayudarme y ser participe por
voluntad tuya. Tener alguien cerca que te aliente siempre hace las cosas más livianas.
Agradeceré por siempre tu voluntad de apoyarme en la tesis.
Ante los problemas, mi abuelo Edgar me enseñó a enfrentarlos con honradez. Mi abuela
Rosa a resolverlos con sentido común. Mi abuelo Filiberto el sentido de lucha y no
rendirme jamás. Y de mi abuela Luz la importancia de encararlos con una sonrisa. Estas
cuatro cualidades fueron más que necesarias en este proyecto. Sin alguna de ellas, nunca lo
hubiese terminado. Parece que ellos sabían a lo que me enfrentaría y me dejaron esas
herramientas. También les dedico esta tesis.
A Leo y Robert, los cuales a través de su amistad han estado presentes, con preocupación
genuina e interés en mi propia superación. De adolescentes éramos jóvenes con sueños,
ahora los estamos alcanzando.
Por último, a Dios mi señor. Cada respiro, cada latido empleado en esta tesis, fue por su
colaboración. Gracias por colaborarme, seguiré creciendo profesionalmente, de antemano
gracias por el apoyo futuro.
iii
Reconocimientos
Varias personas colaboraron con el desarrollo de esta Tesis.
Empiezo por mis lectores Roberto López, Alfonso Villalobos y mi directora Ana María
Jurado. Comprendo los sacrificios que implica apoyar trabajos de este tipo. Gracias por su
atención.
En el caso de Ana María, años atrás siempre me apoyo con libros para fotocopiar, con
tiempo para mis preguntas académicas en su oficina, con asistencias para seguir
aprendiendo en sus cursos. Reconozco su entrega desde un inicio.
A María Elena Murillo, cuyo esfuerzo y dedicación fue vital en el proyecto. Cuesta
encontrar personas tan comprometidas sin pedir nada a cambio. Sin su colaboración de no
hubiese sido posible contar con población clínica.
A todas las personas participantes de la investigación, de Correos de Costa Rica, de la
Clínica Integrada de Tibás, de los Parques de San José, estudiantes de Psicología y demás.
Siendo imposible nombrarlos a todos, se les reconoce el avance de esta tesis a su
disposición en la participación.
iv
RESUMEN
A través de este Trabajo final de Graduación se planteó el objetivo de realizar una
adaptación de la Segunda versión del Inventario de Depresión de Beck en el Gran Área
Metropolitana de Costa Rica. Para el mismo se contó con la participación de una muestra
de población general de 618 personas y de 79 de población clínica con Sintomatología
Depresiva.
Los resultados indican un alpha de Crombach para la población General de .908 y uno de
.885 para la población clínica. La prueba Test Retest a 15 días revela un coeficiente de
correlación Pearson de .95entre una aplicación y la otra.
Con respecto a las evidencias de Validez, los análisis factoriales, tanto exploratorios como
confirmatorios revelan la presencia de 2 factores uno cognitivo-afectivo y otro conductualfisiológico.
Análisis de correlaciones de Pearson sugieren correlaciones positivas entre el BDI-II con el
Multiscore Depression Inventory(.828 en población general y .675 en población clínica) y
la escala de Afecto Negativo del PANAS (.690 en población general y .877 en población
clínica) con significancia estadística a dos colas. Mientras que con la escala de Afecto
Positivo existe discrepancia ya que correlacionan de forma negativa con un coeficiente de
correlación de Pearson de -.278 en población general -.813en población clínica a una
significancia estadística de dos colas.
El promedio de puntuaciones de la población general fue de 9.52, mientras que en
población clínica de 33.00, siendo esta diferencia estadísticamente significativa. Al final se
muestra la propuesta adecuada para Costa Rica de puntos de corte del BDI-II.
Como conclusiones se confirma la adaptación del BDI-II con buenos indicadores de validez
y fiabilidad, siendo recomendable su uso en el contexto nacional. Es necesario por ende,
someter el instrumento a estudios de validez a futuro.
v
Índice deContenidos
RESUMEN_____________________________________________________________________ v
Índice de Tablas ________________________________________________________________ viii
Índice de Figuras ________________________________________________________________ix
Índice de Anexos ________________________________________________________________ix
INTRODUCCION _________________________________________________________________ 2
MARCO DE REFERENCIA __________________________________________________________ 10
Antecedentes ________________________________________________________________ 10
Antecedentes Nacionales _____________________________________________________ 10
Antecedentes Internacionales _________________________________________________ 13
MARCO CONCEPTUAL ________________________________________________________ 18
El constructo teórico de Depresión _______________________________________________ 18
Evolución histórica del concepto _______________________________________________ 18
Sistemas de Clasificación actuales ______________________________________________ 21
Factores causales de la depresión _______________________________________________ 22
Pruebas Psicométricas _________________________________________________________ 31
Fiabilidad _________________________________________________________________ 32
Validez ___________________________________________________________________ 37
Teorías de Construcción y Validación de Pruebas __________________________________ 43
Pruebas Psicométricas que miden Depresión ________________________________________ 48
Escala para la Evaluación de la Depresión de Hamilton (Ham-D) ______________________ 48
Escala Autoaplicada para la Depresión de Zung (Zung SDS) __________________________ 48
Subescala de Depresión del Cuestionario de 90 Síntomas (SCL-90) ____________________ 49
Subescala de Depresión del Inventario Multifásico de la Personalidad de Minnesota (MMPI-D)
_________________________________________________________________________ 49
Multiscore Depression Inventory de David Bernt(MDI)______________________________ 49
Inventario de Depresión de Beck _______________________________________________ 50
PLANTEAMIENTO DEL PROBLEMA DE INVESTIGACION __________________________________ 55
Problema de Investigación ______________________________________________________ 55
Objetivos ___________________________________________________________________ 55
Hipótesis____________________________________________________________________ 56
METODOLOGÍA_________________________________________________________________ 58
vi
Tipo de estudio. ______________________________________________________________ 58
Diseño de investigación. _______________________________________________________ 58
Sujetos de investigación ______________________________________________________ 59
Instrumentos y técnicas ________________________________________________________ 61
Procedimientos _______________________________________________________________ 62
Etapa 1: Adaptación del instrumento ____________________________________________ 62
Etapa 2: Pruebas con el instrumento ____________________________________________ 65
Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento ______________ 68
Etapa 4: Promoción del Instrumento Adaptado ____________________________________ 71
Análisis de los datos ___________________________________________________________ 72
Protección a los sujetos ________________________________________________________ 72
RESULTADOS __________________________________________________________________ 74
Etapa 1: Adaptación del instrumento ______________________________________________ 74
Etapa 2: Pruebas con el Instrumento ______________________________________________ 77
Fase de pruebas piloto. _______________________________________________________ 77
Fase de pruebas de campo ____________________________________________________ 78
Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento ________________ 85
Evidencias de Fiabilidad _____________________________________________________ 85
Evidencias de Validez _______________________________________________________ 86
CONCLUSIONES _______________________________________________________________ 105
Conclusiones _______________________________________________________________ 105
Limitaciones ________________________________________________________________ 110
Recomendaciones ___________________________________________________________ 112
REFERENCIAS _________________________________________________________________ 115
ANEXOS ____________________________________________________________________ 128
vii
Índice de Tablas
Tabla 1: Diferencias entre la Teoría Clásica y la Teoría de Respuesta al Ítem _______________________ 47
Tabla 2: Distribución sociodemográfica de participantes Entrevista Cognitiva ______________________ 64
Tabla 3: Aportes de Participantes de Entrevista Cognitiva con respecto al Instrumento _______________ 75
Tabla 4: Diferencias de Medias por variable Sexo Población General _____________________________ 78
Tabla 5: Pruebas T y Levene de medias para variable sexo. Población General _____________________ 78
Tabla 6: Diferencias de medias por rangos de Edad Población General ____________________________ 79
Tabla 7: Diferencias de medias por Provincia del GAM _________________________________________ 79
Tabla 8: Diferencias de medias por Variable Nivel Educativo ____________________________________ 80
Tabla 9: Diferencias de Medias por variable Sexo Muestra de cuestionarios On line __________________ 80
Tabla 10 Pruebas T y Levene de Medias para variable Sexo. Muestra de cuestionarios On line _________ 81
Tabla 11: Diferencias de medias por rangos de Edad Muestra de cuestionarios On line _______________ 81
Tabla 12 Diferencias de medias por Variable Nivel Educativo Cuestionarios On line _________________ 82
Tabla 13: Media Puntuación BDI población Clínica ____________________________________________ 82
Tabla 14: Diferencias de Medias por variable Sexo Población General ____________________________ 83
Tabla 15 Pruebas T y Levene de medias para variable sexo. Población Clínica______________________ 83
Tabla 16: Diferencias de medias por rangos de Edad Población Clínica____________________________ 83
Tabla 17: Diferencias de medias por Variable Nivel Educativo ___________________________________ 84
Tabla 18: Estadísticos de Fiabilidad Test Retest _______________________________________________ 85
Tabla 19: Alpha de Crombach en las distintas muestras _________________________________________ 85
Tabla 20: Promedio de Puntuaciones dadas por los jueces expertos a cada ítem _____________________ 86
Tabla 21: KMO y Test de Esfericidad Bartlett Población General _________________________________ 87
Tabla 22: Total de la Varianza Explicada por valores Eigenvalue _________________________________ 88
Tabla 23: Matriz Estructural _______________________________________________________________ 89
Tabla 24: Matriz de configuración __________________________________________________________ 89
Tabla 25: Matriz de correlaciones de componentes _____________________________________________ 89
Tabla 26: KMO y Test de Esfericidad Bartlett Población Clínica __________________________________ 90
Tabla 27: Total de la Varianza Explicada por valores Eigenvalue _________________________________ 90
Tabla 28 Matriz de Configuración __________________________________________________________ 91
Tabla 29: Matriz Estructural _______________________________________________________________ 92
Tabla 30: Matriz de correlaciones de componentes _____________________________________________ 92
Tabla 31: Pesos de Regresión por factores ___________________________________________________ 94
Tabla 32: Pesos de Regresión estandarizados _________________________________________________ 95
Tabla 33: Covarianzas entre Factores _______________________________________________________ 95
Tabla 34: Correlaciones entre Factores ______________________________________________________ 95
Tabla 35: Pesos de Regresión por factores ___________________________________________________ 96
Tabla 36: Pesos de Regresión estandarizados _________________________________________________ 97
Tabla 37: Covarianzas entre Factores _______________________________________________________ 97
Tabla 38: Correlaciones entre Factores ______________________________________________________ 97
Tabla 39: Correlaciones entre BDI-II, MDI y PANAS Población General ___________________________ 98
Tabla 40: Correlaciones entre BDI-II, MDI y PANAS Población Clínica ___________________________ 99
Tabla 41: Medias y desviaciones estándares de las puntuaciones del BDI-II por muestra _____________ 100
Tabla 42: Prueba T para muestras independientes medias por muestra ____________________________ 100
Tabla 43: Área bajo la curva _____________________________________________________________ 101
Tabla 44: Porcentajes de Sensibilidad, especificidad para la detección de Depresión Mayor para cada punto
de corte del BDI-II ______________________________________________________________________ 102
viii
Tabla 45: Propuesta de Puntos de Corte para Costa Rica ______________________________________ 103
Índice de Figuras
Figura 1: Catecolaminas y su posible influencia en la Depresión _________________________________ 25
Figura 2: Comprensión de Ítems, Pruebas Piloto ______________________________________________ 77
Figura 3: Dificultades en Lectoescritura Pruebas Piloto ________________________________________ 77
Figura 4: Gráfico de Sedimentación _________________________________________________________ 88
Figura 5: Curva COR ___________________________________________________________________ 101
Índice de Anexos
Anexo 1: Lineamientos para la Adaptación de Pruebas según la International Comission Test (ICT) ____
Anexo 2: Antecedentes Psicométricos en TFG en la Universidad de Costa Rica _____________________
Anexo 3: Evidencias de Fiabilidad _________________________________________________________
Anexo 4: Consentimiento informado ________________________________________________________
Anexo 5: Plantilla de Observación Pruebas Piloto con la Prueba ________________________________
Anexo 6: Versión de Traductor Oficial ______________________________________________________
Anexo 7: Traducción del Investigador del Proyecto ___________________________________________
Anexo 8: Unificación de Traducciones ______________________________________________________
Anexo 9: Primer borrador resultante de la primera fase: Traducción del Instrumento ________________
Anexo 10: Guía de Entrevista Cognitiva _____________________________________________________
Anexo 11: Versión final Adaptación Inventario de Depresión de Beck II ___________________________
Anexo 12: Escala MDI___________________________________________________________________
Anexo 13: ESCALA DE AFECTO POSITIVO Y NEGATIVO PANAS ______________________________
Anexo 14: Plantilla de Observación Transcrita Pruebas Piloto con la Prueba ______________________
Anexo 15: Revisión Interjueces Validez de Contenido __________________________________________
129
130
136
139
141
143
145
148
150
152
157
159
161
162
163
ix
x
Introducción
ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE
DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA
INTRODUCCION
Tener conocimiento de la medición, estadísticas y métodos de investigación psicológica y la
comprensión de las fortalezas y limitaciones particulares de diferentes escalas es necesario
porque las pruebas son solo herramientas que pueden ayudar a los clínicos con las
formulaciones de casos y recomendaciones de tratamiento. El valor de la herramienta no se
puede separar de la sofisticación del clínico que realiza inferencias sobre ella.
Gregory Meyer
Lubinski y Dawis (1995) señalaron que “el examen psicológico se erige como el invento
más importante que la Ciencia Psicológica ha legado a la sociedad” (p. 21). Sin afán de
reducir los innumerables aportes que la Psicología ha realizado al mundo contemporáneo en
sus muy variados campos a solamente los test Psicológicos como lo proponen estos dos
autores, si es necesario comprender con claridad que si existe algo que es propio de la
Psicología como disciplina es la Psicometría.
En apoyo con Martínez, Hernández y Hernández (2006), el poder predictivo de la
psicometría radica en que existe una cadena de inferencias que dependen tanto de modelos
estadísticos y probabilísticos, de modelos avanzados de matemáticas no lineales, como
también de sólidas bases teóricas en las cuales se debe sustentar la prueba. Es a partir de
estos enlaces que se relacionan propiedades psicométricas de garantía científica como la
fiabilidad, la validez y la comparabilidad (Martínez, Hernández y Hernández, 2006).La
Psicometría se nutre de otras ciencias, pero siempre al servicio de la Psicología.
Si bien, para toda disciplina es necesario enfatizar en aquello que le es propio y le distingue
del resto de profesiones, también se requiere conocer a profundidad que es lo que se utiliza
y hacerlo con cuidado. Existe un fuerte vínculo entre la evaluación diagnóstica que aportan
las pruebas y el tratamiento al que remiten. Si bien es cierto que, tal como lo reconoce
2
Gregory Meyer en el epígrafe, los test deben utilizarse únicamente como instrumentos de
ayuda y no deben sobreponerse al criterio del profesional en psicología, sino que deben
interpretarse en función de una adecuada triangulación de técnicas, para Fernández
Ballesteros (2004), aun así poseen especial peso e importancia diagnóstica los cuales,
inciden en la decisión del tipo e intensidad de tratamiento que se requiere.
Los resultados de los test suelen tener con frecuencia impacto en la vida de las personas a
quienes se les aplica (Martínez, Hernández y Hernández, 2006). Estudiar las propiedades
psicométricas de algún test que se pretende utilizar es de vital importancia, ya que de su
interpretación se deriva la toma de decisiones sobre el diagnóstico, la planificación del
tratamiento y las intervenciones clínicas (Dumenci y Achembach, 2008)
Por lo desarrollado en las anteriores líneas es clara entonces la necesidad de que la
Psicología apoye mucho de su quehacer con el aporte Psicométrico pero, ¿qué sucede
cuando se utiliza una prueba psicológica con características culturales diferentes al contexto
para el que se diseñó?, Distintas posiciones tratan de responder a ello, por ejemplo para
Geissenger (1994) es esperable que se produzca cierta discrepancia entre las condiciones
propias de la realidad a la que pertenece quien está siendo evaluado y aquellas propias de la
población con la cual se construyeron los baremos originales (Geissenger, 1994).
Desde la posición de la Estadística, esto puede llevar a dos errores básicos de interpretación
(Sidney y Castellan, 2012). El primer error (Tipo I o riesgo α) seria incluir la
sintomatología de un individuo dentro de los criterios de trastornos y por tanto asignarle
una categoría patologizante cuando realmente no la presenta. El segundo (Tipo II o riesgo
β) es asumir una puntuación como “normal” cuando en realidad el sujeto presenta aspectos
disfuncionales que le ameritan apoyo psicológico. En ambos casos se juega con el bienestar
emocional de la persona a evaluar.
Para Fernández-Ballesteros y Calero (2004) la mayor parte de los problemas derivados del
uso de los test se presentan al utilizar inadecuadamente pruebas traducidas de otros
contextos lingüísticos y culturales. (Fernández-Ballesteros y Calero 2004).
3
La American Psychological Association (en adelante APA) también se proclama sobre el
uso inadecuado de los testa través de los Standards for Educational and Psychological Test
(APA, 1999; citados por Martínez, Hernández y Hernández, 2006), en cuanto puede causar
considerables perjuicios a quienes se les aplican, afectando las decisiones que se toman a
partir de sus resultados.
En resumen, al recoger el consenso académico de diferentes posicionamientos en cuanto a
los alcances e implicaciones que pueda traer el utilizar pruebas descontextualizadas se
remiten principalmente, dos consecuencias. Primero, el hecho de poner en juego el
bienestar emocional de las personas con determinaciones basadas en parámetros
psicométricos extranjeros a las necesidades nacionales. Segundo, pérdidas de validez
profesional debido a la fundamentación para los diagnósticos en criterios inconvenientes,
llegando inclusive al desprestigio del poder predictivo, terapéutico y preventivo que posee
la psicología en general ante el resto de la comunidad científica.
Tomando en cuenta que la mayoría de las pruebas en nuestro país provienen de otras
latitudes, y basándonos en los argumentos anteriores sobre el peligro connatural acerca del
uso de pruebas de otros contextos, es donde el principio de hacer uso de lo propio, como la
Psicometría para la Psicología, se desarma en su propia inconsistencia.
No obstante, existen dos caminos posibles para evitar una innecesaria y lastimosa deserción
de la Psicometría en las filas de la Psicología. Dichas alternativas son en primer lugar el
diseño y construcción de Pruebas nacionales, ajustadas a las necesidades locales; o bien, la
Adaptación y Estandarización de Instrumentos extranjeros a las características propias.
Ambas tienen sus ventajas y desventajas, existiendo seguidores que defienden una u otra,
dificultando un consenso sobre cual es mejor, decisión que se debe basar más bien en las
características de ambas y las posibilidades de implementar alguna u otra.
En el caso de la primera para Fernández, Pérez, Alderete, Richaud y Liporace (2010) si
bien es cierto es la más deseable, posee como requisito básico un desarrollo teórico sólido
que catapulte la construcción del test, es decir que el test debe partir de una teoría local
construida con anterioridad. Dicha condición es una carencia de los contextos
latinoamericanos. La segunda alternativa trasciende a la primera debido a menores costes
4
en su implementación pues se toma una teoría y un instrumento ya sólidamente establecido,
no obstante sus desventajas radican en el peligro de que la misma se dé sin un riguroso
proceso de investigación que asegure la equivalencia de constructos y una correcta
adaptación de la escala para evitar fuentes de sesgos (Fernández, Pérez, Alderete, Richaud
y Liporace, 2010)
Al no existir aun en nuestro país un andamiaje sólido teórico del cual basarse, es más
oportuna de momento la segunda posibilidad. Al respecto la International Test Comission
(en adelante ITC) considerando dicha necesidad en acuerdo con la American Educational
Research, la APA y la National Council on Measurement in Education; formulan
lineamientos para la adaptación de pruebas psicológicas agrupados en 4 áreas: Contexto,
Desarrollo o adaptación de instrumentos, Administración e Interpretación (Ver Anexo 1)
Es pertinente realizar más adaptaciones y estandarizaciones de pruebas psicológicas en el
ámbito nacional bajo amparos metodológicos apropiados en el sector clínico, educativo,
laboral, neuropsicológico, salud y forense. Para ello, se debe tener en cuenta los criterios
con los que se construye la prueba, respecto a garantías científicas adecuadas que legitimen
su validez y fiabilidad. (ITC, 2000; Fernández Ballesteros & Calero, 2004).
Si bien es cierto, el diseño, construcción y validación de pruebas psicométricas posee
premura en todas las áreas mencionadas, a nivel clínico el área de la Depresión posee
especial interés. Como trastorno afectivo, es un constructo psicológico que presenta dentro
de sus principales características la particularidad de poseer una alta prevalencia e
incidencia a nivel nacional. Según señala el periódico La Nación, solo en atención de la
depresión, para el 2006 en Costa Rica se dieron 33.823 incapacidades, mientras que para el
2010 la cifra ascendió a 47.020. Este último dato significó 580.160 días no laborados.
Además, en el 2007 hubo 35.071 personas que necesitaron una licencia médica por
presencia de síntomas propios del trastorno de depresión, y al llegar al 2008, la cifra
aumentó a 45.426. (2011, Mayo, 29)
Además, no solamente es un trastorno común sino que, debido a que sus implicaciones
limitan al sujeto desde el plano afectivo hasta el conductual, fisiológico, cognitivo e incluso
el interpersonal; suele presentar criterios elevados de frecuencia, intensidad y duración,
5
variables que acentúan su nivel de complejidad y apremio clínico. De acuerdo con la OMS
(En Solís, 2009) para el año 2020 se habrá posicionado como la segunda causa de
discapacidad, solamente superada por las enfermedades cardiovasculares.
A nivel mundial se estima que la depresión afecta aproximadamente a 340 millones de
personas en el mundo (Solís, 2009). Vázquez, Nieto, Hernangómez y Hervás (2005)
comentan que aproximadamente 6,5% de la población presenta un trastorno depresivo
mayor y un 3,3% presenta un cuadro de distimia. En promedio, la duración de los episodios
se estima de unos 4 a 5 meses, aunque para un10 a un 20% de los pacientes la duración es
de más de dos años (Vázquez, Nieto, Hernangómez y Hervás, 2005). En Europa los índices
oscilan en un 3,9 por ciento para los trastornos del espectro depresivo, (Güemes, Guillen y
Ballesteros, 2008).
La APA (2005) estima que el índice de mortalidad para este trastorno es alto, los sujetos
con trastorno depresivo mayor que mueren por suicidio llegan al 15%. También presenta
una gran comorbilidad con otro tipo de trastornos (trastornos relacionados con consumo de
sustancias, trastorno de angustia, trastorno obsesivo-compulsivo, anorexia nerviosa,
bulimia nerviosa, trastorno límite de la personalidad), estimándose también que a lo largo
de la vida el riesgo de sufrir este tipo de trastorno es de un 12,7% para los hombres y de un
21,3% para las mujeres (APA, 2005).
Según la Caja Costarricense de Seguro Social (2005), se considera que en Costa Rica
254000 hombres y 426000 mujeres podrían padecer de este trastorno a lo largo de su vida.
Dados los indicadores que en términos epidemiológicos presenta el trastorno de la
depresión, tanto en nuestro país como a nivel mundial, y tomando en cuenta al mismo
tiempo las necesidades por las que a nivel nacional se atraviesa en el aspecto de la
psicometría en general, es notoria la trascendencia de contextualizar una prueba que mida el
constructo de depresión. Estas razones fundamentan la decisión de realizar una adaptación
de la segunda versión del Inventario de Depresión de Beck (BDI-II), como instrumento de
ayuda en el diagnóstico clínico de la depresión.
6
El BDI-II es un cuestionario autoaplicado de 21 ítems, obteniendo la sumatoria total de
estos se reflejaría el grado de severidad de depresión en el sujeto. La prueba ha gozado de
gran aceptación, constituyéndose en el cuestionario de ayuda en la evaluación diagnóstica
acerca del Trastorno de Depresión Mayor más utilizado en el ámbito internacional (Sanz,
Perdigón y Vázquez, 2003)
El BDI-II ha sido utilizado en múltiples contextos tanto con aplicaciones propiamente
clínicas (Pérez y Muñoz, 2004), como en la investigación en estudios sobre consumo de
drogas (Pedrero y López, 2005; Seignourel, Green y Schmitz, 2007), estudios
neurocientíficos (Dunn, Kimbrell, Ketter, Frye, Willis, Luckenbaugh y Post, 2002;
Rowland, Lam y Leahy, 2005), trastornos del sueño (Carney, Ulmer, Edinger, Krystal y
Knauss, 2009), en el área de la salud en general (Poole, Bramwell y Murphy, 2009; Takai,
Takahashi, Iwamitsu, Ando, Okazaki, Nakajima, Oishi y Miyaoka, 2009; Viljoen, Iverson,
Griffits y Woodward, 2003; Arvand, Shafiabadi, Falsafinejad, Zali, 2012; Salli, Yilmaz,
Ugurlu; 2012; Kizilcik, Sayiner, Unsal, Ayranci, Kosgeroglu, Tozun, 2012), así como en
distintas poblaciones (Joe, Woolley, Brown, Ghahramanlou y Beck, 2008; Palmer y Binks,
2008).
Los estudios en adolescentes también han gozado de atención (Wilson y Blumentritt, 2007;
Osman, Barios, Kooper, Gutiérrez y Bagge, 2004; Osman, Barrios, Gutiérrez, Williams y
Bailey, 2008, Byrne, Tewart y Lee, 2004). El inventario también ha sido utilizado en
estudios sobre psicología clínica basada en la evidencia, como instrumento de medición
comparativo en cuanto a la eficacia de distintos tratamientos terapéuticos en el abordaje de
la depresión (Pérez y García, 2010).
En cuanto a sus garantías psicométricas, numerosas investigaciones respaldan sus altos
indicadores de validez y fiabilidad (Sprinkle, Lurie, Insko, Atkinson, Jones, Logan,
Bissada, 2002; Arnarson, Olason, Smari y Sigurðsson, 2008; Alansari, 2006;), obteniendo
resultados similares a los conseguidos en su estudio inicial llevado a cabo por Beck, Steer y
Brown en 1996. Más adelante al final del marco conceptual se expone mayor información
acerca de los indicadores psicométricos del BDI-II.
7
El alcance que pueda tener este estudio se detalla en dos aspectos: beneficios tanto directos
como indirectos. En cuanto a los directos, el uso de la prueba adaptada permitiría mayor
precisión diagnóstica, posibilitando un abordaje terapéutico apropiado a las necesidades
específicas del paciente, reduciendo el coste de recursos innecesarios en la terapia. A su vez
permite que el paciente posea claridad en cuanto al grado de severidad de depresión que
presenta y el avance que experimenta a lo largo de la terapia.
Con respecto a los beneficios indirectos, el presente estudio brinda un aporte metodológico
importante, al documentarse por escrito la adaptación misma. Una de sus principales
ventajas es que permitió tomar en cuenta la opinión, no solo de los investigadores que
construyeron la prueba, sino la retroalimentación de la población de nuestro país para su
elaboración. Por otro lado puede brindar aportes a posibles investigaciones que surjan a
futuro referentes a la depresión, ya sea como antecedente, como insumo o con el aporte de
conclusiones sugerentes.
8
Marco
Referencia
de
ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE
DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA
MARCO DE REFERENCIA
Antecedentes
A continuación se exponen los principales antecedentes encontrados, tanto a nivel nacional
como internacional con relevancia para el estudio.
Antecedentes Nacionales
La psicometría en Costa Rica
En 1978 Brenes, Espinosa, Bejarano y Riba llevaron a cabo una investigación en la cual
pretendían determinar las pruebas más utilizadas en la época, así como las instituciones,
pronósticos y condiciones en que se utilizaban. Se utilizó un cuestionario que incluía los
siguientes rubros: nombre y tipo de la prueba, modelo psicológico en el que se basa,
modelo de medición, quien la construyó, estudios de validación, muestra normativa
original, quien la importó, fecha y el objetivo de haberla importado, estudios de validación,
confiabilidad o estandarización realizados en nuestro país.
Dentro de los resultados se obtuvo principalmente que los tres grandes solicitantes de
servicios psicométricos parecían ser los centros de salud, los departamentos de personal de
instituciones gubernamentales y privadas y los centros educacionales, que eran más las
pruebas para adultos que las dedicadas a los niños, y que de las 85 pruebas que habían sido
importadas solo seis se habían validado localmente. Los autores propusieron a manera de
discusión la incorporación de más profesionales en esta área, en vistas de la necesidad por
construir, adaptar y estandarizar pruebas psicológicas en el ámbito nacional, ante la
importación de las mismas. Si bien hoy día en nuestro país se cuenta con mayores trabajos
relacionados con el ámbito de la psicometría que en 1978, estos no son suficientes para
cubrir las necesidades reales de la población.
10
Actualmente es notable como a pesar del auge que tiene en el mercado internacional el
diseño de distintas pruebas psicométricas, en nuestro país es un área que se encuentra con
un estado de cierto abandono, tanto en la construcción como en la adaptación y
estandarización. Fenómeno observado en el resto de Latinoamérica, según Prieto, Muñiz,
Almeida y Bartram (1999) el uso que se le da a los test psicológicos como instrumento de
ayuda para el diagnóstico psicológico adolece de conocimiento adecuado, incidiendo en
que las pruebas que se utilicen sean de procedencia extranjera, con condiciones distintas a
las del contexto en que se utilizan.
A nivel nacional, Chávez y Meléndez (2005) mencionan que la mayoría de adaptaciones y
estandarizaciones de pruebas psicométricas han estado a cargo de estudiantes de psicología
de la Universidad de Costa Rica, como parte de sus trabajos finales de graduación (TFG).
Aguiar (2009) profundiza al señalar que del total de los mismos TFG en los últimos 15
años (anteriores al 2009), solo en 19 de más de 360 investigaciones se trabaja directamente
con la temática (ya sea construcción, adaptación o estandarización).
Los principales precursores a nivel nacional de este tipo de proyectos de graduación en el
ámbito psicométrico son la Escuela de Psicología en conjunto con el Instituto de
Investigaciones Psicológicas, ambos de la Universidad de Costa Rica (para un resumen de
los mismos, ver Anexo 2). De estos trabajos, doce se refieren a adaptaciones, mientras que
quince se dirigieron no solo a la adaptación sino a la estandarización. Además del total,
diez tienen que ver con el área clínica (ocho son adaptaciones y dos son estandarizaciones)
mientras que en el sector laboral son otras diez pruebas, pero predominan las
estandarizaciones (siete) frente a las adaptaciones (tres). En el área educativa, solamente se
cuentan cuatro estudios, y todos se tratan de estandarizaciones.
Después del estudio de Brenes, Espinosa, Bejarano y Riba (1978) no se encontraron más
investigaciones al respecto, lo cual pone al descubierto el vacío que existe en nuestro país
en este respecto. A pesar de la falta de investigaciones a gran escala como la realizada por
Brenes et al (1978) el uso de las pruebas no disminuyó, sino que ha aumentado
significativamente.
11
Por tanto se torna de importancia tres aspectos significativos relacionados entre sí: en
primer lugar el desarrollo de investigaciones vinculadas a la validación, la adaptación y la
estandarización de pruebas psicológicas; en segundo término el entrenamiento en su uso
por parte de los profesionales usuarios de estas, de forma que se garantice con esto un uso y
selección apropiados en función de criterios de validez y confiabilidad aceptables. Por
último la realización y actualización constante de un catálogo adecuado a nivel nacional
acerca de las pruebas disponibles, así como su uso, pertinencia y criterios psicométricos
con el fin de que se garantice un uso profesional de este recurso.
Investigaciones Psicométricas relacionadas con la Depresión Mayor en Costa Rica
Dentro del acervo de investigaciones efectuadas, sobresale el estudio de Grettel Lutz en
1992 referida a la adaptación del Inventario de Depresión Infantil de Kovacs (CDI),
mostrando como consistencia interna un coeficiente alfa de Crombach de 0.85, cálculo que
incluye los 27 ítems del inventario (Lutz, 1992). Fedra Solís en el año 2009 se propone
aportar datos que confirmen la validez, confiabilidad y distribución de puntuaciones
normalizadas del CDI mediante un re análisis en una muestra de niños costarricenses con
características homologas a la población inicial (Solís, 2009).
Reyes y Quirós (1993) realizan un estudio cuyo objetivo consistía en la obtención de un
perfil del paciente deprimido encontrando un contexto interpretativo para la escala D del
Mini Mult (Reyes y Quirós, 1993). El Minimult fue adaptado por Gonzalo Adís Castro y
Mario Araya Quesada en el año 1978.
En adultos, se cuenta únicamente con una escala mono rasgo de depresión adaptada, el
Multiscore Depression Inventory de David Bernt. Esta fue adaptada por Lisímico Valerio
en 1997. La escala original mide intensidad de la depresión, en dos versiones una de 118
ítems y una reducida de 47. Las preguntas se responden en función de Falso/Verdadero. La
población mínima es de 13 años en adelante (Bernt, 1990). Para la adaptación, se trabajó
con la versión reducida de 47 ítems, con una muestra clínica de 46 pacientes del Hospital
Calderón Guardia, mientras que la población general contó con 238 sujetos, de estos 35
eran estudiantes de Décimo del Liceo Carlos Pascua en San Rafael de Heredia; 138
12
estudiantes de Química General, Física I y Física II de la Universidad de Costa Rica y 65
fueron educadores (Valerio, 1997).
No obstante, en los resultados de la adaptación no se incluyen el alfa de Crombach, ni
tampoco los concernientes a la prueba test-retest. En la prueba original el índice de
consistencia interna oscila entre .96 y .97, a su vez que el test- retest arroja un coeficiente
de .82. La validez convergente con el BDI – II es de r= .69 (p= .001) y con Hamilton es de
r= .66 (p= 0.01) (Bernt, 1990).
Con respecto al BDI (tanto en su primera y segunda versión como en la abreviada) no se
cuenta aún con ningún estudio de validación para nuestro país. Ha sido utilizado en trabajos
de tesis enfocados en la intervención terapéutica como en Facio (2007), donde se hacía uso
del BDI-II en la fase de evaluación de la muestra para la aplicación de terapia racional
emotiva en adultos mayores. (Facio, 2007).
Antecedentes Internacionales
El Inventario de Depresión de Beck II es uno de los instrumentos más comunes de
investigación y evaluación de la depresión que se utilizan alrededor del mundo (Sanz,
Perdigón y Vásquez; 2003). Por ello, muchas investigaciones han sido destinadas a la
adaptación de esta escala en diferentes culturas y muchas de las investigaciones más
importantes se han ocupado de la revisión psicométrica de las propiedades del instrumento.
Los siguientes son algunos ejemplos del cúmulo de investigaciones realizadas en diferentes
ubicaciones geográficas donde el BDI-II ha tenido influencia así como los índices de
validez y fiabilidad que se han obtenido.
El estudio inicial fue llevado a cabo por Beck, Steer y Brown en 1996. La investigación
pretendía corroborar los datos de validez y fiabilidad y de esta manera lanzar la prueba al
mercado internacional. Se contó con una muestra de 500 pacientes externos diagnosticados
con depresión, de 4 institutos diferentes; y de 120 estudiantes de un curso introductorio de
psicología. En este estudio se encontró como consistencia interna para la población clínica
un índice de alfa de Crombach de .92 y para la de estudiantes uno de .93. La estabilidad de
1 a 2 semanas se relata con un .93. También se encuentra una correlación con su antecesor
el BDI-IA de .93 (p <.001).
13
Con respecto a la validez convergente, se encuentra una correlación con la escala de
Hamilton para evaluar la depresión de r= .71. Y en cuanto a la validez divergente, obtiene
una correlación con la escala de Hamilton para evaluar la ansiedad de r .47 y con la escala
de Ansiedad de Beck, de .60. Con respecto a otras pruebas, se encontraron correlaciones
con las siguientes: Escala de desesperanza de Beck .68; Escala de Ideación de Suicidio .37.
En cuanto a la validez factorial, se encuentran dos dimensiones, una cognitivo afectiva y
otra somática, para ambas poblaciones.
En Islandia, según Arnarson, Olason, Smari & Sigurðsson (2008), el promedio de
puntuaciones del BDI- II para la población estudiantil universitaria (n= 1206) alcanza una
media de 8.80 y para la población clínica (n= 248), 21.25; la consistencia interna un índice
de α de Crombach de .91 para estudiantes y uno de .93 para la muestra clínica; los
resultados del test-retest de 1 a 2 semanas consiguen un coeficiente de .89; la validez
concurrente y divergente para las siguientes pruebas BAI (Beck Anxiety Inventory),
HADS-a,( Hospital Anxiety and Depression Scale), HADS-D (Hospital Anxiety and
Depression Scale), PSWQ (PennState Worry Questionnaire) y CES-D (Center for
Epidemiological Studies Depression Scale) obtiene las siguientes coeficientes de
correlaciones Pearson respectivamente .60, .61, .65, .71 y .81.
En Turquía, Kapci, Uslu, Turkcapar y Karaoglan (2008), relatan los siguientes resultados:
Los coeficientes α de Crombach para los grupos clínicos y no clínicos fueron .89 y .90
respectivamente. Con respecto al test-retest, se obtiene una correlación de r=.94. La validez
convergente fue evaluada por su correlación con el BSI-Depression Subscale en el grupo no
clínico y se encontró que fue de .82. Los análisis de validez discriminante demostraron
correlación con el HS (r=.63), BAI (r=.65) y BSI Hostility subscale (r = .63) todas
estadísticamente significativas (p < .001). En Irán, con la adaptación al idioma persa,
Ghassemzadeh, Mojtabai, Karamghadiri y Ebrahimkhani (2005) encontraron los siguientes
resultados (n= 125): la consistencia interna alcanzada fue α= .87; la fiabilidad test-retest
obtuvo un coeficiente de correlación de Pearson de .73. Y se obtuvo una validez
concurrente de .77 con la versión Persa del ATQ (Automatic Thought Questionnaire).
La versión para China fue estudiada por Chang (2005). La investigación se realizó con
1154 estudiantes universitarios chinos. Se pretendió realizar un análisis factorial de las
14
dimensiones del BDI –II y producir 2 factores representados por el cognitivo-afectivo y el
somático. Se determina una fiabilidad con un coeficiente alpha de Crombach de .86.
A nivel Latinoamericano, en Argentina se llevó a cabo el trabajo de adaptación por parte de
Brenlla y Rodríguez en el año 2004. Para la misma colaboraron 472 personas de población
general y otra de estudiantes universitarios compuesta por 248 personas. Para la población
clínica, se utilizaron 325 pacientes externos de institutos. Se confirmó una consistencia
interna con un alfa de .88 para los pacientes y .86 para los grupos de población en general.
La fiabilidad test-retest con un periodo de 7-10 días se mantuvo en un r= .90 en la
población clínica y un r= .86 en la población general.
En cuanto a la validez convergente, con los pacientes externos mantiene correlaciones
positivas con la escala de Depresión del MMPI-II (r= .58) y con la escala de Depresión del
SCL-90 (r=.63) En la validez discriminante, se encontraron correlaciones con la escala de
Ansiedad del SCL-90 de .63. Con respecto a la población general, se encontraron las
siguientes correlaciones: con la escala de depresión del MMPI-II .61; con el K10 (Escala de
Malestar Psicológico de Kisley), .81; con el STAI (Escala de Ansiedad Rasgo para
Adultos) .58. Con respecto a la validez factorial, se encontraron 2 factores en ambas
muestras, en la de población general una Cognitivo-afectiva y otra Somática. En la
población clínica, una Cognitiva y la otra Somato-afectiva. La versión utilizada en Costa
Rica es esta versión Argentina.
La otra versión del BDI-II en lengua hispana se obtuvo por medio de la adaptación de la
misma llevada a cabo en España. Esta se llevó a cabo en tres poblaciones diferentes, una de
población general con 470 sujetos, población universitaria con 590 estudiantes y 305
pacientes ambulatorios para la población clínica. Para cada una de esas tres poblaciones se
obtuvieron los siguientes coeficientes alfa respectivamente: .87, .89, .89. (Sanz, García,
Espinosa, Fortún & Vásquez, 2005; Sanz, Perdigón & Vásquez, 2003; Sanz, Navarro &
Vásquez, 2003).
Es importante señalar como en la mayoría de las adaptaciones de la prueba a otros
contextos, se suelen obtener puntajes menores que los obtenidos inicialmente por Beck y
colaboradores en su estudio inicial con respecto a los criterios de validez y fiabilidad. Esto
15
puede deberse a dos razones. Primero que al adaptar una prueba a otro contexto conlleva a
que muchos factores culturales intervengan en el estudio y por tanto afecten los resultados.
Aunque el BDI tiene una validez de constructo aceptable debido a que fue construido a
partir de los criterios del DSM-IV (1994) estos criterios han sido generalmente investigados
en la población estadounidense.
Los síntomas de depresión parecen variar considerablemente de una cultura a otra (Tsai y
Chentsova-Dutton, 2002) por tanto, en otras poblaciones existen variables distintas a las del
DSM-IV referentes a la depresión no estudiadas, las cuales al no estar incluidas en el BDIII, afectan los resultados y la calidad discriminatoria de la prueba. No obstante, las
puntuaciones obtenidas en adaptaciones internacionales aun siendo más bajas que las
estadounidenses, poseen significancia estadística al obtener p < 0,05 en los casos
documentados.
El segundo aspecto que también influye en la tendencia a que los puntajes sean menores a
los obtenidos originalmente por Beck, Steer y Brown es que la muestra en la mayoría de los
casos es menor. Esto afecta indudablemente en la obtención de los datos, ya que a mayor
muestra, los resultados tienden a poseer más fundamentación, confianza y estabilidad
(Sidney & Castellan, 2012).
Es necesario a manera de conclusión, que se realicen no solo más investigaciones sino con
adecuadas garantías de validez y fiabilidad en los medios internacionales con el BDI-II.
Esto por varias razones, la primera es que las expresiones comportamentales con las que un
constructo se manifiesta en una población tienden a variar con el tiempo y no es adecuado
sostener como válidos los datos que se hubiesen obtenido en un periodo de diez o quince
años atrás. Lo segundo es que con estudios sólidos, se pueden llegar a conclusiones sólidas,
las cuales prueban y se vuelven sugestivas a la legitimidad del instrumento forzando a que
produzca cambios en su construcción, ya sea una versión revisada de la misma o hasta una
versión más avanzada (un BDI-III por ejemplo).
En este caso, las investigaciones deben continuar en el mismo ciclo una y otra vez, en
concordancia con la producción de conocimiento la cual siempre es circular.
16
Marco
Conceptual
ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE
DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA
MARCO CONCEPTUAL
La presente investigación se enmarca desde una construcción teórica de dos ejes principales
que respaldan su fundamentación. Como primer eje se presentará el tema de la Depresión
como constructo teórico e intento explicativo de una sintomatología concreta, se presentará
un repaso por postulados teóricos referentes. En segundo lugar la Teoría del diseño de
pruebas psicológicas y su base en modelos estadístico-matemáticos, que le dan validez a la
metodología utilizada en el estudio presente. Después de exponer un acercamiento a ambos
se presentará un bosquejo general acerca del Inventario de Depresión de Beck, centro de la
presente investigación.
El constructo teórico de Depresión
Evolución histórica del concepto
La depresión (o en su defecto tristeza) es un concepto que está difundido de forma clara
entre muchas culturas a través de tiempos históricos, de una forma estable y diferenciable
de otros estados emocionales. De forma escrita, tal vez los primeros indicios en que se
“diagnostica” depresión aparecen en la Biblia, la cual entre muchos otros relatos
semejantes, destacan los estados depresivos que afectaban a Saúl y a Job.
La concepción pre decimonónica de la melancolía constituía un cajón de sastre de distintos
padecimientos, en los cuales no solamente figuraba la presencia de sintomatología
depresiva, sino también de algunos de tipo alucinatorio, paranoides y demenciales. Por esta
razón, la melancolía se volvía un término muy difuso, generalizable prácticamente a un
gran cumulo de trastornos afectivos sin distinción (Luque y Berrios, 2011).
18
El término melancolía aparecería por primera vez en el último tercio del siglo V A. C. en
uno de los escritos más antiguos de Hipócrates (Lanczik y Beckmann, 1991). La melancolía
se atribuía como un exceso de bilis negra, siguiendo a la teoría de los humores, mismos de
los que dependía el comportamiento humano según la concepción de Hipócrates. De
acuerdo con esta acercamiento epistemológico, el exceso de bilis provocaría la corrupción
del cerebro y con ello la aparición del cuadro depresivo (Fernández, 1988).
En 1586, Timothy Bright publica la primera monografía en inglés sobre la melancolía,
titulada Treatise of melancholy. En los siglos siguientes se denotan varios intentos por
establecer una nomenclatura adecuada de la “melancolía”, no obstante la misma
corresponde a Emilio Kraepelin (1856-1926) dentro de su sistema de clasificación
orientado tanto en la predicción como en la clasificación.
Más adelante el término de melancolía evoluciona en la propia concepción de Kraepelin al
punto que diversos autores comienzan a hablar más de depresión mental que de melancolía
en sintonía con la evolución del sistema diagnóstico del autor.
El siglo XIX marca un cambio en el enfoque de la melancolía. Diversas posiciones teóricas
comienzan a rechazar la vaguedad del término, pretendiendo la conceptualización de uno
menos genérico. Rush propone la tristimania y Esquirol sugiere la lipemanía, siendo en
ambos un componente central la baja motivación y estado de ánimo bajo (Luque y Berrios,
2011).
La diferencia entre manía y depresión, no surge sino hasta el final del siglo XIX. La
expresión “depresión mental” fue apareciendo y ganando adeptos. Postulado desde la
Fisiología, con el tiempo se abandonó el adjetivo de “mental” (Luque y Berrios, 2011).
Kraepelin postuló la existencia de una entidad nosológica de la melancolía subdividiéndola
en tres sub formas:
1. Melancolía simple
2. Melancolía activa
3. Melancolía atónita
19
La melancolía simple era visualizada como la forma más sencilla de melancolía. Se
caracterizaba por una anhedonia en la cual el sujeto perdía motivación para su propia
existencia. La melancolía activa, presentaban más bien una excitación ansiosa. Por último
la melancolía atónita suponía el polo opuesto de la melancolía activa en términos de estado
psicomotor, empleando el término estupor como un sinónimo. (Lanczik y Beckmann,
1991).
En su obra tardía, Kraepelin propone una categoría más amplia (locura maniaco depresiva)
que contenía todas las formas de depresión y de la manía. De esta forma se posiciona la
depresión como un opuesto a la manía, especificando más sus síntomas. Es aquí donde la
Depresión gana validez y posición científica.
Ya en el siglo XX el tema interesa a diversos estudiosos como Leonhard, Chaslin,
Wernicke y Kleist (Luque y Berrios, 2011). Estos teóricos se oponen a la visión de
Kraepelin de agrupar todos los trastornos del estado de ánimo en una sola entidad y
comienzan a proponer una separación (Luque y Berrios, 2011). Leonhard por ejemplo
establece una diferenciación entre psicosis afectiva, unipolar y bipolar basándose en
estudios de Wernicke que diferenciaban entre melancolía afectiva y melancolía depresiva
(Lanczik y Beckmann, 1991).
En 1966 Perris y Angst demuestran, de forma separada en sus estudios, hallazgos que
apuntan a una distinción nosológica entre los trastornos unipolar y bipolar. Estos dos
autores, plantean a modo de conclusión que en la psicosis maniaco depresiva se
presentaban tres entidades independientes: dos formas unipolares (depresiva y maniaca) y
una bipolar (Luque y Berrios, 2011)
En resumen, el constructo teórico de la Depresión históricamente pasó de ser un concepto
vago, impreciso y confundible con otras categorías como la esquizofrenia por ejemplo,
atravesando un proceso de concretización dela fragmentación del término “locura maniaco
depresiva” con trabajos como los de Wernicke, Kleist y Leonhardhasta culminar en la
propuesta de Angst y Perris en separar la depresión unipolar del trastorno bipolar, propuesta
validada desde el DSM III en 1980, utilizada aun en los actuales sistemas de clasificación
diagnóstica.
20
Sistemas de Clasificación actuales
Ya posicionada y legitimada la depresión en los diversos intentos de nomenclatura del siglo
XX, era posible desarrollar un sistema dicotómico de diagnóstico basado tanto en la
predicción como en la clasificación referenciado a síntomas. Los sistemas de clasificación
actuales se basan en este sistema orientado a los síntomas, fomentando a su vez, un sistema
diferenciado.
La quinta edición del Manual Diagnóstico y Estadístico de los Trastornos Mentales (en
adelante DSM V) y la décima versión de la Clasificación Internacional de las
Enfermedades (en adelante CIE-10)utilizados actualmente, con respecto al tema de los
trastornos del estado de ánimo se adhieren a la dicotomía diagnóstica (clasificación y
predicción) de las psicosis endógenas tal y como la concibió Kraepelin, pero también tienen
en cuenta la discusión entre Kasanin y Leonhard (los cuales enfatizaban la separación entre
melancolía y manía). Con el CIE-10 y el DSM es posible conocer la tendencia hacia un
sistema diferenciado. Los autores del DSM adoptaron una serie de términos nosológicos
que fueron suprimidos en el sistema de Kraepelin, entre éstos figuran melancolía,
ciclotimia, distimia y psicosis afectivas. (Lanczik y Beckmann, 1991).
Para el DSM V, el Trastorno depresivo mayor se caracteriza por la frecuencia de uno o más
episodios depresivos mayores. Los episodios nose explican mejor por la presencia de un
trastorno esquizoafectivo y no están superpuestos a una esquizofrenia, un trastorno
esquizofreniforme, un trastorno delirante o un trastorno psicótico no especificado. (DSM
V). El trastorno depresivo mayor puede clasificarse asimismo en el trastorno depresivo
mayor episodio único, caracterizado por la presencia de un único episodio depresivo mayor,
y el trastorno depresivo mayor recidivante, caracterizado por la presencia de dos o más
episodios depresivos mayores separados por mínimo una semana en su aparición (APA,
2013)
El CIE 10, detalla un episodio depresivo cuando por lo general, se cuenta con un humor
depresivo, una pérdida de la capacidad de interesarse y disfrutar de las cosas, una
disminución en su vitalidad llevando a una reducción de su nivel de actividad y a un
21
cansancio exagerado, que aparece incluso tras un esfuerzo mínimo. El CIE 10 también
expone las siguientes como manifestaciones de los episodios depresivos:
a) la disminución de la atención y concentración
b) la pérdida de la confianza en sí mismo y sentimientos de inferioridad
c) las ideas de culpa y de ser inútil
d) una perspectiva sombría del futuro
e) los pensamientos y actos suicidas o de autoagresiones
f) los trastornos del sueño
g) La pérdida del apetito
Según el CIE 10, la aparición de episodios repetidos de depresión conlleva a la aparición
del trastorno de depresivo recurrente, que pueden resultar los rasgos de episodio depresivo
leve, moderado o grave (OMS, 1992)
Los actuales sistemas de clasificación posicionan a la Depresión como constructo teórico
con fuerte validez empírica. A pesar de ello, las causas de la Depresión no se entienden
muy bien y la misma puede aparecer bajo muy variadas circunstancias. Muchas
perspectivas teóricas han contribuido a brindar un acercamiento al fenómeno. Al
considerarse en conjunto se posibilita una comprensión más integral de la Depresión.
Factores causales de la depresión
Teorías biológicas
Influencias genéticas
La importancia del factor hereditario en la aparición de Trastornos del espectro depresivo
se demuestra por la asociación entre el grado de consanguinidad y la probabilidad de
diagnóstico. (Sarason y Sarason, 2006)
22
En una investigación de Sullivan (2002, citado por Butcher, Mineka y Hooley 2006) en una
revisión de aproximadamente 21.000 gemelos monocigóticos, se encontró que si uno sufría
una depresión mayor unipolar, su contraparte tiene el doble de probabilidades de sufrirla.
Otro tipo de estudios es utilizando el método de adopción para investigar la influencia
genética sobre los trastornos del estado de ánimo. Uno de los más importantes mencionados
por Butcher, Mineka y Hooley (2006) es el de Wender et al (1986), en el cual se encontró
que la depresión unipolar aparecía siete veces más entre los parientes biológicos de niños
adoptados y que tenían una depresión severa, que entre los parientes biológicos de niños de
control también adoptados.
Esto pone en claro la existencia de cierta contribución genética para el trastorno de
depresión.
Factores bioquímicos
Existe evidencia que niveles anormales de distintos neurotransmisores como serotonina,
norepinefrina, dopamina y demás neurotransmisores aminergicos están involucrados en la
fisiopatía de la Depresión (Sarason y Sarason 2006)
En el trastorno depresivo mayor se ha demostrado a través de diversos ensayos clínicos una
reducción significativa en el número de transportadores de Serotonina de pacientes con
depresión mayor. (Van Praag, 1998)
La serotonina ejerce una importante acción en el estado de ánimo, conducta, movimiento,
apreciación del dolor, actividad sexual, apetito, secreciones endocrinas, funciones cardiacas
y el ciclo de sueño-vigilia (Guadarrama, Escobar y Zhang., 2006). Concordando con el
hecho que durante un episodio depresivo disminuya significativamente el desempeño en
estas áreas. El BDI II presenta ítems donde se revisan algunos de estos parámetros.
Los tres grupos de antidepresivos (inhibidores de la monoaminoxidasa IMAO, tricíclicos e
inhibidores de la recaptación de serotonina ISRS), potencian la actividad sináptica de
serotonina inhibiendo la recaptación del neurotransmisor o su degradación, sustentándose
23
así que el sistema serotoninérgico desempeña un papel importante en la fisiopatología de la
depresión (Arango, Escobar y Pimienta., 2004)
La norepinefrina por su parte, involucrada en procesos de vigilia, toma su parte en
Trastornos Depresivos cuando se da una alteración de la misma. De tal manera el estrés
crónico genera depresión reactiva, resultando que las reservas de norepinefrina en el Locus
Coerelus tienden a disminuir, lo que conduce a mantener el estado de depresión, en el caso
de individuos con depresión secundaria al estrés crónico ocurre un fenómeno fisiológico
similar. (Guadarrama, Escobar y Zhang., 2006).
Funcionalmente, la norepinefrina parece estar relacionada con un número de procesos
psicológicos, entre ellos la estabilización del estado de ánimo, la regulación del sueño,
estado de alerta y activación, y en la respuesta a estresores que pueden iniciar o exacerbar
la sintomatología depresiva (Goodale, 2007)
Con respecto a la Dopamina, la reducción de la actividad dopaminérgica se ha asociado con
la anhedonia, menor motivación y pérdida de interés. Las vías mesocorticolímbicas de
Dopamina parecen ser fuentes reguladoras fundamentales del placer y la capacidad de
disfrute. El estriato ventral y el córtex prefrontal parecen ser regiones dopaminérgicas
importantes
relacionadas
con
la
motivación.
Una
disfunción
del
sistema
mesocorticolímbico de la Dopamina podría agravar los síntomas de anhedonia, apatía, y
pérdida de interés observados en la Depresión Mayor (Goodale, 2007)
Mientras que la serotonina y la noradrenalina tienen fuerte influencia en patrones de
conducta y funciones cognitivas, la dopamina está involucrada en la función motriz. Las
tres catecolaminas son sin duda fundamentales para un funcionamiento adecuado
neurobiológico. De modo que dependiendo de la interacción en la producción y captación
de las mismas se pueden dar alteraciones en el estado de ánimo. La figura 1 ilustra la
interacción de los tres neurotransmisores en la fisiopatología de la depresión.
24
Figura 1: Catecolaminas y su posible influencia en la Depresión
Fuente: Guadarrama, Escobar y Zhang (2006)
Teorías psicológicas
Teorías conductuales
Durante la década de los 70´s y 80´s, en el medio del conductismo se vinculó la explicación
de la depresión a partir de la idea de que esta se produce en base a la ausencia de respuestas
producto de refuerzos positivos o cuando aumenta la tasa de refuerzo negativo (Sarasson y
Sarasson, 2006). Según Butcher, Mineka, Hooley (2007), la base
de las teorías
conductistas se fundamenta en el hecho de que las personas con depresión puede que
tengan una tasa muy baja de reforzamientos positivos, y una tasa muy alta de
acontecimientos negativos. No obstante, según los mismos autores la teoría conductual no
demuestra que la depresión esté causada por esos factores, es decir, no sugieren una
explicación causal al fenómeno sino más bien correlacional. Los mismos autores aseguran
que por esta y otras razones, las teorías conductuales de la depresión no han ejercido
demasiada influencia. (Butcher, Mineka, Hooley, 2007).
25
Teoría de la indefensión adquirida
Martin Seligman, exponente de la teoría de la indefensión adquirida, propone a partir de sus
estudios en laboratorios con animales, un marco explicativo más sólido que la teoría
conductista. La misma establece que cuando los animales o los humanos se enteran de su
falta de control ante la aparición de situaciones aversivas, puede que aprendan que están
indefensos ante dichas situaciones, lo que a su vez les deja sin motivación para intentar
responder y hacerse frente de esos mismos estímulos en un futuro; dando por resultado el
desarrollo de posturas de pasividad e incluso de síntomas depresivos (Seligman, 1975)
Abramson, Seligman y Teasdale (1978) (Según Butcher, Mineka, Hooley, 2007)
propusieron que cuando las personas enfrentan acontecimientos negativos e incontrolables
y cuestionan el porqué de esa situación, estas atribuciones que las personas hacen respecto
a acontecimientos incontrolables se convertirían así en un factor esencial en el origen de la
depresión. De esta manera proponen tres dimensiones básicas sobre las cuales se establecen
dichas atribuciones: interna/externa, global/específica y estable/inestable. (Butcher,
Mineka, Hooley, 2007).No obstante, los resultados de muchas investigaciones no apoyan lo
que la teoría sugiere, mientras que otros estudios si, evidenciando
por tanto la
inconsistencia y falta de apoyo empírico de los que adolece a la teoría.
La teoría de la depresión como desesperación
Debido la inconsistencia de resultados obtenidos en base en las investigaciones realizadas
en el marco de la teoría de indefensión, se realizó una revisión de la misma la cual recibió
como nombre Teoría de la desesperación. Esta teoría propone a la desesperación
compuesta por dos factores: la percepción de falta de control sobre algún aspecto a suceder,
y la certidumbre absoluta de que está por ocurrir algo malo o que no va a ocurrir algo
positivo (Butcher, Mineka, Hooley, 2007).
26
La teoría cognitiva de Beck
A más de 40 años de su formulación es una de las teorías acerca la depresión más
importantes y tomada en cuenta por el medio científico. Surgida de un contexto el cual
consideraba que los síntomas relacionados con la depresión eran principalmente los de
índole emocional, Beck plantea que es la parte racional la que precede y provoca los
síntomas afectivos. Es decir, son los pensamientos negativos la parte más importante y
destacable de la depresión y no las bajas tasas de reforzamiento (como propone la teoría
conductista).
Según Beck (2002), el modelo cognitivo postula tres conceptos específicos para explicar el
sustrato psicológico de la depresión: 1. La triada cognitiva, 2. Los esquemas y 3. Los
errores cognitivos.
La triada cognitiva consiste en la visión negativa que realiza la persona de tres realidades:
acerca de si mismo, del mundo y del futuro. Para Beck (2002), los signos y síntomas del
síndrome depresivo serían una consecuencia de los patrones cognitivos negativos,
realizados en estas tres instancias. El paciente responde y se prepara a una situación como
si la misma realmente fuese a ocurrir, debido a sus creencias de que realmente van a
ocurrir. Por ejemplo si el paciente piensa erróneamente que va a ser rechazado, reaccionará
con el mismo efecto negativo (tristeza, enfado). Esta anticipación sesgada por las creencias
del individuo, pueden explicar según Beck (2002) los síntomas motivacionales,
dependencia e incluso los síntomas físicos de la depresión.
Los Esquemas se refieren a la organización estructural en el pensamiento depresivo. Se
refieren a patrones cognitivos relativamente estables que constituyen la base de la
regularidad y las interpretaciones que se crean en base a un determinado conjunto de
situaciones. El esquema es la base que le permite a una persona enfrentarse a una
circunstancia, ya que permite transformar los datos en condiciones, permitiendo localizar,
diferenciar y codificar el estímulo con que se enfrenta el individuo. Según Baldós (2009)
los esquemas cognitivos influyen de modo fundamental en la información que la persona
atiende, preside, almacena y recupera y en las interpretaciones, valoraciones y asociaciones
que hace en un momento dado. Por esta razón, Beck (2002) plantea que en los estados
27
psicopatológicos, en este caso la depresión, las conceptualizaciones que tienen los
individuos acerca de determinados sucesos se distorsionan de tal modo que se ajustan
esquemas inadecuados e irracionales. Estos esquemas hacen que la persona pierda gran
parte de control voluntario sobre su proceso de pensamiento y por tanto se muestre incapaz
de acudir a otros esquemas más adecuados.
Según Beck (2000) los esquemas se agrupan en torno a un modelo de tres instancias: las
creencias centrales, las creencias intermedias y los pensamientos automáticos. Las
creencias centrales se refieren a los esquemas y formas de pensamientos que se encuentran
muy aferrados y se consideran como ciertos. Estos determinan el modo en que la persona se
posiciona en el mundo, lo interpreta y reacciona ante él. Las creencias intermedias se
refieren a las reglas, actitudes y presunciones que se derivan de las creencias centrales. Los
pensamientos automáticos son la manifestación (no del todo consciente) de las creencias
centrales e intermedias, las cuales aparecen siempre ante un estímulo específico pero ya
conocido desde antes, que predisponen al sujeto a reaccionar de esa manera.
Por último se encuentran los errores cognitivos en el procesamiento de información. De
manera conjunta con las creencias distorsionadas que alimentan el trío cognitivo negativo,
el mismo puede mantenerse a costa de diversos errores o sesgos cognitivos de carácter
negativo. Cada uno de ellos supone un procesamiento sesgado de la información (Butcher,
Mineka, Hooley, 2007). Beck (2002) opina que los mismos mantienen la creencia del
paciente en la validez de sus conceptos negativos, incluso a pesar de la presencia de
evidencia contraria. Entre ellos seencuentran:

Inferencia arbitraria. Se refiere al proceso de adelantar una determinada conclusión
en ausencia de la evidencia que la apoye, o que la evidencia sea contraria a la
conclusión misma.

Abstracción selectiva. El hecho de centrarse en un detalle extraído fuera de su
contexto, ignorando las características más relevantes de la situación, y
conceptualizar toda la experiencia en base a este fragmento (el cual siempre
negativo)
28

Generalización excesiva. Se refiere a elaborar una regla general en base a una
conclusión específica de uno o varios hechos aislados y aplicar el concepto a
situaciones inconexas.

Maximización y minimización. Se refiere a la sobre importancia que se le da a un
hecho negativo, como también a la denigración u olvido sobre un hecho positivo.

Personalización se refiere a la tendencia para atribuirse asimismo fenómenos
cuando no existe una base firme para realizar tal conexión

Pensamiento absolutista, dicotómico. Se refiere a la tendencia en clasificar cada
experiencia según una o dos categorías opuestas. En el caso de la depresión se
seleccionan las categorías del extremo negativo.
Beck (2002)
De esta manera, cada factor de la teoría de Beck se encuentra enlazado uno con otro, al
punto que lo que predispone la manifestación de síntomas depresivos no sería la aparición
de factores aislados entre sí, sino la interrelación existente entre los esquemas, el trío
cognitivo negativo, y los errores de procesamiento de información. En este sentido,
Butcher, Mineka y Hooley (2007) señalan que cada uno de los componentes la teoría
cognitiva actúa como un reforzador de los demás. (Butcher, Mineka y Hooley, 2007, p.
233)
A pesar de que a lo largo de los años la teoría cognitiva de Beck ha ido adquiriendo cada
vez mayor coherencia y elaboración, constituyéndose en una de las teoría más sólidas
utilizadas como referencia por diferentes profesionales en salud mental, se ha señalado
distintas limitaciones en torno al modelo cognitivo general y/o de la terapia cognitiva en
particular. La siguiente lista propuesta por Rachman, 1997 (citado por Baldós, 2009)
expresa los principales problemas del enfoque de Beck

No se ha demostrado el papel causal de las cogniciones negativas, estas podrían ser
un simple correlato o una dimensión más entre otras.

No se sabe si la reducción de las cogniciones clave es el principal mecanismo crítico
de acción de la terapia cognitiva.
29

Terapias no centradas en modificar las cogniciones consiguen el mismo cambio en
estas que la terapia cognitiva.

No todas las personas pueden acceder a las cogniciones que supuestamente
mantienen sus problemas. Además, gran parte del procesamiento cognitivo no es
accesible a la conciencia.

No siempre es posible modificar las cogniciones de una persona.

El cambio cognitivo no siempre suponen cambio emocional.

El papel de las emociones es subestimado; estas influyen mucho en cómo las
personas estructuran cognitivamente sus experiencias.
Rachman, 1997 (citado por Baldós, 2009)
A pesar de estas limitaciones, Butcher, Mineka y Hooley (2007) destacan que con respecto
a la teoría propuesta por Beck, se ha realizado bastante apoyo empírico e investigativo los
cuales han encontrado resultados que apoyan los aspectos causales de la teoría.
30
Pruebas Psicométricas
Según Abad, Garrido, Olea y Ponsoda (2006) “La Psicometría se ocupa de los problemas
de medición en Psicología, utilizando la Estadística como pilar básico para la elaboración
de teorías y para el desarrollo de métodos y técnicas específicas de medición” (Abad,
Garrido, Olea y Ponsoda, 2006, p. 4). Por tanto los test psicométricos, se referirían a los
métodos de evaluación que se basan en la misma psicometría, con el fin de describir,
explicar o predecir determinado atributo psicológico. Kumar (2009) se refiere a los mismos
como “un instrumento estandarizado que consiste de una serie de preguntas (llamadas
ítems) los cuales evalúan ciertos aspectos de la individualidad de la persona y describe
esto en términos de resultados y categorías” (Kumar, 2009, p. 72). La misma autora
menciona como los mismos se han utilizado desde mucho antes de la consolidación de la
psicología como ciencia formal.
Uno de los grandes impulsores de la aplicación de las pruebas psicológicas, McKeen
Cattell, define, en 1890 a las técnicas psicométricas como “un procedimiento, del recorrido
de muestras de comportamiento, de un sujeto para estimar un repertorio o inferir un
constructo psicológico, suficientemente sistemático como para ser repetible y
comparable”. (Citado por Calero y Padilla, en Fernández-Ballesteros, 2004, p. 354).
Un aspecto importante relacionado con las pruebas psicológicas es que permiten medir la
respuesta a un estado o rasgo que no es directamente observable, tal es el caso de la
ansiedad y la depresión (Abbell, Springer y Kamata, 2009).
Relacionado con esto, las pruebas psicológicas referidas al ámbito de la depresión puede
ubicarse dentro de las pruebas denominadas monorrasgo, las cuales buscan “evaluar rasgos
específicos que se utilizan fundamentalmente con fines clínicos o de investigación” (Calero
y Padilla, p. 351). Sin embargo existen test de personalidad que contiene alguna sub escala
relacionada con la depresión (por ejemplo MMPI)
Para Fernández-Ballesteros y Calero, (2004), toda prueba psicológica debe contar con
adecuadas garantías que respalden su uso. Estos requisitos psicométricos se refieren a la
validez (que el test mida lo que pretenda medir) y fiabilidad (que brinde la seguridad de que
31
se puede confiar en los resultados). A continuación se expone en detalle un acercamiento de
los mismos.
Fiabilidad
Dentro de la Teoría Clásica de los Test, se postula que la Fiabilidad hace referencia al buen
funcionamiento de un instrumento, es decir que cuenta con garantías de que con precisión
mide el constructo del que parte. Desde una aproximación más psicométrica, la puntuación
obtenida de un test es resultado de una relación entre la “puntuación real” y el “error de
medida”. La puntuación real sería una cantidad hipotética que se asume un sujeto debe
obtener acorde a una variable de interés. El error de medida es el resultado si a la
“puntuación real” le restamos la “observada”. Mientras menor sea el error de medida, más
va a representar la puntuación observada a la real.
De esta forma para Fernández-Ballestero y Calero (2004) un test será más fiable cuanto
mayor sea la proporción de variabilidad de las puntuaciones recogidas que se deba a la
variabilidad de las puntuaciones verdaderas y menor la que se deba a la de los errores (p.
128)
Para Ayearst y Bagby (2010) además de actuar como un indicador de la cantidad de error
en la medición, la fiabilidad también ofrece información sobre la consistencia de un
procedimiento de medición; y los índices utilizados para evaluar la fiabilidad describen la
consistencia en los resultados obtenidos por el uso de una medida. Es notable que la
fiabilidad se pueda ver afectada por una gran cantidad de factores, como las características
en las que se administra un test, del mismo sujeto examinado o de la conformación de la
prueba. Por tal razón según Ayearst y Bagby (2010) hay diferentes formas en las que la
fiabilidad puede estimarse, dependiendo de la fuente de error que se necesite contrastar. A
grosso modo, existen tres tipos de evidencias de fiabilidad:
1. Con la homogeneidad de la prueba
2. Relacionadas con la Estabilidad de la Medida
3. Con la objetividad del registro
Estas tres fuentes de evidencia serán explicadas a continuación:
32
Relacionadas con la homogeneidad de la Prueba
Si todos los ítems de una prueba se supone que parten de un mismo constructo, entonces,
los mismos deben estar correlacionados positivamente. En otras palabras, la prueba debe
poseer una consistencia interna adecuada. Consistencia interna se refiere al grado de
uniformidad y coherencia entre los ítems y el test. Altas correlaciones entre ítems sugieren
que entre todos están midiendo lo mismo. Siguiendo a Ayearst y Bagby (2010), existen
varias formas a su vez de calcular la consistencia interna, entre ellas:
Procedimiento Dos mitades. Sugiere dividir el test en dos partes, cada una con
propiedades normativas y estadísticas similares y correlacionar ambas puntuaciones de cada
mitad (Fernández-Ballestero y Calero, 2004., Gregory, 2011). Una alta correlación entre las
mismas indicaría una alta consistencia interna. Una consecuencia de este método es que por
reducir los ítems a la mitad, también se ve reducida la fiabilidad en cada mitad. Un método
conocido como la fórmula de Spearman -Brown puede ser utilizado para corregir la
atenuación mediante la extrapolación del coeficiente de fiabilidad obtenido a la longitud
original de la prueba (Ayearst y Bagby, 2010)
Formas paralelas. Se utiliza cuando una prueba presenta dos formas diferentes en su
realización. Estas formas se desarrollan de manera independiente una de la otra, no obstante
cubren los mismos rasgos, contenidos y nivel de dificultad de los reactivos. La estimación
de confiabilidad de este método se obtiene al aplicar ambas formas a un mismo grupo y
correlacionar los promedios obtenidos en cada una (Gregory, 2011) Este método conlleva
consecuencias a considerar. Al presentarse dos versiones, introduce diferencias en la
muestra de reactivos de cada forma, aumentando la varianza como fuente de error. Es decir,
se presenta la posibilidad de que una conlleve más dificultad que la otra. También son
bastante costosas ya que duplican el costo de la investigación. Por esta razón cada vez se
encuentra en mayor desuso.
Coeficiente alpha. Se trata de una media ponderada de las correlaciones entre las variables
(o ítems) que forman parte de la escala. Introducido por Crombach en 1951, se ha
convertido en la forma más extendida de estimar la consistencia interna (Ayearst y Bagby,
2010). La literatura en general propone que un alpha de más de .70 y menos de .80
33
evidencian de aceptable a alta fiabilidad, con uno de .80 a .90 de alta a excelente y de .90
en adelante es excepcional. Es importante rescatar que la cantidad de ítems en un test puede
afectar el alpha, de modo que a mayor cantidad de ítems es posible que el alpha disminuya
debido a la posible variabilidad en los mismos. Si las escalas son multidimensionales, el
alpha pierde poder predictivo, siendo más útil coeficientes como el theta o el omega.
Para Gregory (2011) cuando una prueba tiene una adecuada consistencia interna, también
presentará una tendencia a presentar estabilidad en sus puntuaciones en el método test
retest, siendo por tanto el alpha de Crombach una medida útil de la fiabilidad en general.
Fórmulas de Kuder-Richardson. Basado en la covarianza de los ítems, este
procedimiento llega a la misma estimación que el anterior. Según Fernández-Ballestero y
Calero (2004) y Gregory (2011), las fórmulas sólo son utilizables con ítems dicotómicos, lo
que restringe su utilización. Para ítems con más de dos alternativas de respuesta se debe
utilizar el alfa de Crombach (Ayearst y Bagby, 2010)
En resumen, si se pretende demostrar que existe una asociación entre los ítems y el
constructo, se justifica alguna de las medidas arriba expuestas de la consistencia interna. De
ellos, el coeficiente alfa, es la más popular de las estimaciones de la fiabilidad.
Relacionadas con la estabilidad de la medida
Si la prioridad es la estabilidad en los resultados de los test, entonces los métodos test retest
son de relevancia. Fernández-Ballestero y Calero (2004), plantean la posibilidad de que
medidas hechas en momentos distintos sean iguales. Parten de la consideración de que un
mismo test puede considerarse paralelo consigo mismo, siendo administrado en ocasiones
separadas por un intervalo temporal, siempre que la variable objeto de medición no haya
cambiado. Gregory (2011) plantea el que si una prueba es fiable, entonces la segunda
puntuación de cada persona es totalmente predecible a partir de la primera. Dependiendo de
las condiciones del instrumento se puede optar por algún método en específico:

Correlaciones Pearson/Spearman. El coeficiente de correlación de Pearson se
utiliza cuando se trata de datos continuos, mientras que el de Spearman cuando los
datos son rangos clasificados en forma ordinal. La correlación indica la fuerza y la
34
dirección de una relación lineal y proporcionalidad entre cada administración del
test, de modo que una correlación alta positiva es indicador de fiabilidad.

Correlación intraclase. Se utiliza cuando los datos por analizar son dimensionales
(acomodados por clases), no obstante se utiliza en lugar de Pearson solo si los
tamaños de la muestra son pequeños. Para Mandeville (2009), el coeficiente de
correlación intraclase describe la proporción de la variación total la cual es
explicada por las diferencias entre los observadores e instrumentos.

Cohen kappa. Según Carletta (1996) ajusta el efecto del azar en la proporción de la
concordancia observada. Se utiliza cuando los datos son categóricos. Mide el
acuerdo entre dos observadores en sus correspondientes clasificaciones de varios
elementos en varias categorías mutuamente excluyentes.
Para todas las anteriores pruebas de fiabilidad, al tratarse de correlaciones, se considera que
son consideradas fiables si dicha correlación excede el .80. El sentido de las medidas test
retest se explica en tanto si un instrumento pretende medir un constructo en específico,
entonces debe ser capaz de evaluarlo en cualquier momento que se plantee. No obstante, en
mediciones que involucran constructos psicológicos esto se complejiza, ya que el realizar
una segunda medición se expone a variaciones en como el constructo o atributo en cuestión
se presenta.
Relacionadas con la objetividad del registro
Describen la consistencia de las calificaciones a través de múltiples evaluadores. Muchos
tipos de índices de confiabilidad están disponibles, y la decisión sobre cuál usar depende
del tipo de datos que se recogen. Se pretende que no haya diferencias entre los datos
obtenidos por diferentes evaluadores (Fernández-Ballestero y Calero, 2004). Según
Gregory (2011), es necesario confirmar este tipo de evidencia cuando se trata de pruebas
que dan margen para una gran cantidad de juicio por parte del examinador en la asignación
de puntuaciones, por ejemplo pruebas proyectivas, de desarrollo moral o de creatividad. Por
tanto, de igual forma, se pueden utilizar diversos tipos de correlaciones ya sea de Pearson
35
(datos continuos en escala razón), Spearman (escalas ordinales), correlaciones intraclase
(escalas dimensionales) o Cohen/Fleiss kappa (categorías discretas, nominales).
Para un análisis no paramétrico de acuerdo entre múltiples evaluadores, el coeficiente de
concordancia de Kendall es útil, este es un índice de acuerdo al orden de clasificaciones
múltiples que varios jueces realizan de una serie de estímulos que utilizan análisis de las
técnicas de varianza para determinar si existen importantes diferencias entre los estímulos
en el ranking. Posibilita decidir el nivel de concordancia entre expertos. Una deficiencia de
la correlación entre observadores en la estimación de la fiabilidad incluye el error aleatorio
y no tiene en cuenta las posibles interpretaciones diferentes entre los calificadores del
proceso que se ha utilizado (Ayearst y Bagby, 2010)
En términos generales, la Fiabilidad de los coeficientes se puede calcular por medio de
puntuaciones continuas y categóricas como con el uso de ambas pruebas estadísticas
paramétricas y no paramétricas. Los niveles mínimos de fiabilidad aceptables se determinan
mejor por el uso previsto en las probables consecuencias de resultados de las pruebas, y
corresponde a los investigadores o clínicos determinar la cantidad de varianza de error que
consideren adecuado tener en su medición.
Desde la psicometría se han propuesto directrices para la evaluación de la fiabilidad de un
instrumento, teniendo en consideración que las decisiones deben basarse en lo que se
pretende conseguir al usar el test, decisiones de mayor relevancia (por ejemplo, el
diagnóstico y/o intervención) requieren niveles más altos de fiabilidad y poco error de
medición, y las decisiones de menor relevancia (por ejemplo, detección) toleran niveles
ligeramente más bajos de fiabilidad y, por tanto, un mayor error en la medición. Según
Gregory (2011) el escoger cual tipo es mejor como evidencia de confiabilidad depende de
la naturaleza y el objetivo de la prueba individual en cuestión. Además de los anteriormente
mencionados, existen y se desarrollan desde la estadística distintos métodos relacionados
con la fiabilidad. En el Anexo 3 se presenta una tabla donde se describe de forma
simplificada las particularidades de los principales métodos para estimar la evidencia de
fiabilidad.
36
Validez
Mientras que la fiabilidad tiene que ver con la consistencia en las puntuaciones de un test,
la validez tiene que ver con el significado de esas puntuaciones. Por tanto hace referencia al
constructo del que la prueba parte. Para Ayearst y Bagby (2010) si bien es cierto, una
prueba puede ser confiable y a la vez poco válida, una prueba no puede ser válida y poco
fiable. En el momento en que los indicadores de fiabilidad se desestiman, se atenta contra el
mismo constructo, ya que el test no mediría lo que pretende medir. Por tal razón, si bien es
cierto la fiabilidad es algo más estable teóricamente, la validez goza de mayor complejidad.
Según Fernández-Ballestero y Calero (2004), el tema de la validez ha gozado de constantes
reformulaciones. Históricamente han existido un sin número de posiciones, ya en 1966 se
da una unificación de los términos, hablándose de solo tres, validez de contenido, criterio y
constructo:

Validez de constructo. Se centra en la coherencia entre el instrumento y el
constructo psicológico que desea medir

Validez de criterio. Se centra en la relación entre la prueba y del criterio del que
parte la misma. Es decir si posee capacidad suficiente para discriminar.

Validez de contenido. Se centra en la relevancia y representatividad que poseen los
ítems con el resto del test.
Más tarde, Messick (citado por Fernández-Ballestero y Calero, 2004) plantea que la
división tradicional en tres dimensiones es incompleta porque no tiene en cuenta tanto las
consecuencias a nivel social del mismo test. Shadish, Cook y Campbell (2002, citados por
Aló y Vallejo, 2012), aportan el siguiente esquema de la validez en la investigación basada
en términos de cuatro indicadores básicos, con análisis y procedimientos estadísticos
referidos a cada uno:
Validez de la conclusión estadística. Se refiere al estudio de la correlación entre un
tratamiento y su resultado. Es decir, si un programa de intervención, tal y como se ha
37
implementado, correlaciona significativamente con los resultados, tal y como se han
medido.
Validez Interna. Se refiere a si la relación entre un tratamiento y su resultado es directa, es
decir si los resultados observados se hubiesen dado sin estar presente el programa.
Validez de Constructo. Se refiere a la capacidad de generalizar los resultados de una
investigación desde sus indicadores tangibles a sus constructos de referencia. Implicaría
realizar inferencias sobre la población, o constructos delimitados a partir de la muestra
particular utilizada en el programa de intervención.
Validez externa. Se conceptualiza como la posibilidad de generalizar la relación causal
estudiada a otras poblaciones diferentes a las usadas en la intervención.
Este último esquema de validez es especialmente útil en el caso de diseños experimentales.
No obstante en el caso de estudios psicométricos, al utilizar como pilar básico la medición,
basándose en la asignación de valores numéricos a objetos y eventos sin que sea algún tipo
de intervención lo más relevante de la investigación, se enlazan principalmente en diseños
no experimentales. En torno a este tema, siguiendo a Ayearst y Bagby (2010), proponen
que las evidencias de validez en el caso de estudios de corte psicométrico se pueden dividir
en dos clases: la validez interna y externa.
Desde este esquema, se posiciona a la validez de constructo como un concepto general que
engloba todos los demás tipos de validez, ya que los mismos siempre parten de la premisa
de intentar ligar al test con el constructo del cual derivan. Estos autores consideran que el
proceso de validación de constructo tiene lugar cuando un investigador cree que su
instrumento refleja una teoría particular, a la que se adjuntan ciertos significados. A
continuación se exponen los distintos tipos de validez.
38
Validez Interna.
Esta tiene que ver con la información que es intrínseca a la propia medida. De ella se
desprenden tres principalmente:
Validez de Contenido.Para Ayearst y Bagby (2010) esta es una parte fundamental de la
validez de criterio general ya que se refiere al grado en el cual los elementos de un
instrumento posean representatividad y relevancia acorde a un constructo objetivo para un
particular propósito de evaluación. Estos elementos incluyen los ítems, instrucciones del
test y formato de respuesta.
La relevancia de un instrumento de evaluación se refiere a la medida en que los ítems de la
prueba son adecuados para el constructo de interés y para el uso previsto de la medida. De
modo que se debe considerar únicamente los que posean importancia clínica, de modo que
la prueba no se vea saturada de elementos no sólo innecesarios sino perjudiciales para el
propósito específico (Ayearst y Bagby, 2010)
Con representatividad se prevé el grado en el que los elementos son proporcionales a los
dominios y facetas del constructo. Es decir que los ítems deben hacer referencia a las
principales características del fenómeno psicológico a estudiar sin dejar de lado alguna
faceta de importancia sustantiva (Ayearst y Bagby, 2010)
Es importante mencionar que la validez de contenido puede variar en función del contexto.
Un constructo puede cambiar a través del tiempo, añadiendo, modificando o sustrayendo
elementos teóricos en su conformación. O puede ser de contenido actualizado pero variar
de una población a otra (Tsai y Chentsova-Dutton, 2002). La sintomatología de muchos
constructos varía entre poblaciones, de modo que usar un instrumento creado en alguna
cultura que difiere de otra, atenuara la validez de contenido.
La validación de contenido requiere no solo de métodos estadísticos, sino que debido a lo
abstracto del concepto, se requiere de consulta a expertos por medio de una revisión del
contenido del test con el fin de prever tanto la relevancia como la representatividad.
39
Validez Substantiva. Ayearst y Bagby (2010) comentan que un poco relacionado con el
concepto de validez de contenido es la evidencia de "validez sustantiva," la cual se refiere a
la formulación de ítems y procedimientos en consonancia con una teoría particular. Saber si
la medida que se utilizará está bien fundamentada en la teoría de la que parte puede tener
un impacto en la interpretación de los resultados de la misma. La presencia de una teoría
subyacente aumenta la validez de constructo de una prueba proporcionando un puente
directo entre contenido y constructo.
Validez Estructural. Se refiere propiamente a la consistencia de la estructura interna de la
prueba. Según Ayearst y Bagby (2010), a pesar de que el reporte de fiabilidad de
consistencia interna, a través del alpha de Crombach, es una pieza importante, no basta
únicamente con ese procedimiento. En otras palabras, así como la fiabilidad es una
condición necesaria pero no suficiente para asegurar validez, la consistencia interna es una
condición
necesaria
pero
no
suficiente
para
establecer
la
homogeneidad
o
unidimensionalidad. Por tanto, la puesta a prueba de la unidimensionalidad de la escala se
determina mejor por el análisis factorial.
La evidencia de validez estructural requiere una evaluación de si la estructura factorial de la
medida (la estructura interna) es consistente con la hipótesis de la estructura interna del
constructo. Los dos métodos de análisis factorial principales utilizados para evaluar la
validez estructural son Análisis exploratorio de los factores y el análisis factorial
confirmatorio.
Según Ayearst y Bagby (2010), el análisis factorial exploratorio se usa para tratar de
descubrir la estructura interna de un número relativamente grande de variables. Intuye el
número de factores necesarios para dar cuenta de las correlaciones entre las variables
medidas (ya sean ítems o subescalas). El procedimiento genera cargas factoriales así como
la correlación (si existe) entre los factores.
Por otro lado el análisis factorial confirmatorio trata de determinar si el número de factores
obtenidos y sus cargas se corresponden con los que cabría esperar a la luz de una teoría
previa acerca de los datos. Por tanto este tipo de análisis determina si cargas factoriales
deberían corresponder con los factores del constructo teórico original.
40
La importancia de determinar cuántos factores se deben extraer no debe pasarse por alto,
porque hay consecuencias si bien muchos o muy pocos factores son derivados. Si se
retienen muy pocos factores, la estructura completa de la construcción no se revela
totalmente y la validez estructural se ve comprometida. Si se retienen demasiados factores,
el significado del constructo se convierte en difícil de interpretar.
Validez Externa
Se refiere a consideraciones propias del constructo de la prueba. Hace referencia a la
condición causal del cual la prueba parte y si guarda relación con la misma. De igual
manera se presentan tres:
Validez convergente y discriminante. Ayearst y Bagby (2010) comentan que la validez
convergente y discriminante contribuyen a la validez de constructo, ayudando en la
identificación de lo que la constructo es y no es, y lo que la prueba mide y no mide. Por
tanto contribuyen en el poder realizar predicciones.
La validez convergente contribuye a indicar en qué medida los resultados del test
correlacionan con alguno destinado a medir el mismo constructo. La validez discriminante
o divergente por su parte se refiere al grado en que los resultados de una prueba no
correlacionan con los de pruebas que midan otro constructo.
Las conclusiones de evidencias de validez convergente o divergente son más robustas si la
validez de la otra también ha sido evaluada. La evaluación de la validez discriminante de
una medida es tan importante como la evaluación de la validez convergente (Ayearst y
Bagby, 2010)
41
Validez incremental. Se define como el grado en que un pronosticador adicional explica
algo de la medida criterio que no estaba explicado por los otros pronosticadores. El hecho
que un instrumento psicológico presente altos indicadores de fiabilidad no quiere decir que
si se utiliza en un contexto específico vaya a ser de mayor utilidad que el resto de técnicas
que se utiliza. La validez incremental quiere decir que en el caso de alguna triangulación de
técnicas, una técnica en específico, en este caso el test, merece estar en el conjunto de
pruebas porque aporta información relevante.
Para Ayearst y Bagby (2010) La evidencia de la validez incremental puede ser evaluada a
través de análisis de regresión, que demuestran que la varianza única en la variable
dependiente se explica por la inclusión de la medida en un conjunto de predictores. La
decisión de incluir o excluir una medida de una batería de evaluación en gran medida debe
basarse en si la inclusión de la medida da una mayor precisión de la predicción de la
variable dependiente o una mayor precisión en las decisiones sobre la base de resultados de
las pruebas.
Validez diagnóstica. Para Ayearst y Bagby (2010) una medida determina la presencia o
ausencia de un trastorno por el establecimiento de un "punto de corte", que es la puntuación
en la prueba que pretende diferenciar a referencia el límite clínico de clasificación.
Aquellos por encima del punto de corte se clasifican en una categoría (trastorno presente), y
aquellos por debajo del punto de corte se clasifican en una categoría diferente (trastorno
ausente). "Validez de diagnóstico" se refiere a la precisión con la que se realizan estas
decisiones de clasificación. Un número de diferentes estadísticos se puede utilizar para
evaluar la validez de diagnóstico de una prueba. Entre ellas tenemos:

Sensibilidad. La capacidad de una medida para identificar a los individuos con un
trastorno correctamente

Especificidad. La capacidad de una medida para identificar individuos sin un
trastorno correctamente

Poder Predictivo Positivo. La probabilidad de que en el caso de un individuo que
tiene un trastorno dado, la medida efectivamente le identifique con el trastorno

Poder Predictivo Negativo. La probabilidad de que en el caso de un individuo que
no tiene un trastorno dado, que la medida efectivamente le identifique sin el
trastorno
42

Clasificación General Correcta. La "tasa de éxito" o proporción de individuos con
y sin trastorno correctamente identificados por la medida

Kappa. El acuerdo entre la medida y los criterios diagnósticos para el diagnóstico.
De esta forma, al desarrollar un instrumento de medición, se deben tomar decisiones sobre
que estadístico debe poseer mayor prioridad en base al objetivo de construcción del mismo.
Si se pretende el uso del mismo en cuanto a la detección de mayor número de personas con
la sintomatología en función, entonces el umbral de sensibilidad y poder predictivo positivo
debe ser mayor. Para estudios de investigación en los cuales se propone obtener pureza en
el diagnóstico de un grupo de personas con algún trastorno, es necesario priorizar la
discriminación a partir de mayor especificidad.
Teorías de Construcción y Validación de Pruebas
Conseguir las anteriores condiciones de Fiabilidad y Validez no es sencillo, de modo que la
construcción de un instrumento debe ampararse en bases metodológicas sólidas. El proceso
para construir un test pretende contribuir a la calidad de las mediciones obtenidas durante la
recogida de datos. Existen distintas aproximaciones para la construcción de una prueba, no
obstante por consenso se utilizan dos primordialmente, desde la Teoría Clásica de los Test
y desde La Teoría de la Respuesta al Ítem.
Teoría Clásica de los Test
La teoría Clásica de los Test supone la primera incursión en el diseño de pruebas,
dominando como única opción la construcción de las mismas durante el siglo XX hasta
1980.
Según Navas (1994) arranca con los trabajos de Spearman desarrollándose en conjunción
con sus teorías de la inteligencia. Muñiz (2010) comenta que Spearman propone tres
supuestos al modelo:
43

En el primer supuesto se define la puntuación verdadera (V) como la esperanza
matemática de la puntuación empírica, que formalmente puede escribirse así: V =
E(X). Es decir, la puntuación verdadera supone un promedio idealizado desde la
estadística sobre una supuesta puntuación real de un individuo. Todo valor medido
en un test (X) se compone de un parte verdadera de la característica (T) y una parte
aleatoria correspondiente al error de medición (E): X = T + E. De esta forma la
teoría clásica enfatiza en la necesidad de determinar el error de medición.

En el segundo supuesto Spearman asume que no existe correlación entre el valor
pronóstico de las puntuaciones verdaderas con respecto al tamaño de los errores que
afectan a esas puntuaciones. Ambos coeficientes son independientes entre si

El tercer supuesto establece que los errores de medida que los sujetos obtengan en
un test no guardan relación con los errores de medida en otro test distinto. No hay
razón para asumir que los errores cometidos en una ocasión sean covariantes
sistemáticamente con los cometidos en otra ocasión
Según Calero y Padilla (2004) La construcción de test desde la teoría clásica, tiene varias
aproximaciones:
Construcción racional. Desde esta perspectiva se inicia el proceso de elaboración del test
con la redacción de la población inicial de ítems. Estos se construyen en base a un
constructo de referencia y a partir de ahí se procede con el diseño de los mismos. Walsh y
Betz (2000) apuntan que la construcción racional se basa en el supuesto que el contenido
del test refleje directamente las características del constructo en cuestión. Desde esta
aproximación el contenido de los ítems refleja la dimensión o constructo objeto de
medición (Calero y Padilla, 2004).
Construcción empírica. Desde esta aproximación, los ítems se construyen en base a
parámetros observables desde alguna población meta que presente un criterio en interés. Es
decir las pruebas no parten desde la teoría para la construcción sino desde la práctica.
Walsh y Betz (2000) señalan tres características que presenta esta estrategia de
construcción:
a) Utilidad para objetivos aplicados
44
b) Permite establecer diferencias inter grupos
c) Permite contrastar esas diferencias
Desde esta aproximación en la selección de los ítems prima la correlación con un criterio
Calero y Padilla (2004).
Construcción analítico factorial. Se realiza un énfasis en la estructura interna final del
cuestionario. El proceso consta de analizar factorialmente una gran cantidad de ítems, para
determinar las dimensiones que subyacen a la conformación del mismo. Estas escalas se
convierten en las dimensiones o factores posteriores del ítem, siendo los ítems con cargas
factoriales más altas las que conformaran el cuestionario final. Desde esta aproximación se
incorporan ambas perspectivas anteriores Calero y Padilla (2004).
La teoría clásica de los test enfatiza en el supuesto de fiabilidad. De tal forma mientras
mayor sea el error de medición, entonces menor será la componente verdadera de la
característica en el valor medido y por tanto menor será también la confiabilidad con la que
el test mide.
La fiabilidad solo puede estimarse, debido a que los valores verdaderos son una apreciación
teórica y por tanto, imposibles de conocer. Una forma de saberlo es por medio de Test
paralelos, entendiendo por ello aquellos test construidos para medir el mismo constructo
pero con distintos ítems. Las puntuaciones verdaderas de las personas en los test paralelos
serían las mismas, y también serían iguales las varianzas de los errores de medida (Muñiz,
2010).
En base a lo anterior, la fiabilidad es el único criterio de calidad que se puede determinar
dentro de los marcos de esta teoría. La misma se queda corta con respecto a criterios de
validez de un test. Es decir ofrece garantías de que un test mida con exactitud lo que
pretende medir (fiabilidad), pero no que lo haga correctamente (validez).
A raíz de lo anterior se desprenden grandes limitaciones de la teoría clásica de los test

Primero, las puntuaciones no son invariantes. De modo que no se puede equiparar
alguna puntuación obtenida en un test con la obtenida en otro debido a que ambos
están construidos con escalas diferentes. Debido a esta limitación desde la teoría
45
clásica de los test se intentó amortiguar con el modelo de generalizabilidad, en el
cual se convierten las puntuaciones en percentiles, ubicándose cada puntuación en
un rango siendo homologable con cualquier otra obtenida. No obstante este modelo
aun goza de críticas, ya que la obtención de la muestra percentil sigue siendo
parcializada, una no se puede comparar con otra, tendría que ser de la misma
muestra.

Segundo, la construcción de los test estaba muestralmente sesgada. De modo que
los mismos se construían con personas de algún nivel específico, siendo imposible
la extrapolación.
A raíz de estas limitaciones surge la Teoría de la Respuesta al ítem como propuesta
metodológica en la construcción de instrumentos de medición psicológica, la cual ha
venido tomando auge en las últimas décadas.
Teoría de la Respuesta al Ítem
A raíz de las deficiencias expuestas desde la Teoría Clásica, para el diseño y construcción
de ítems ha surgido la Teoría de la Respuesta al Ítem (TRI). Tal como su nombre lo indica,
cada ítem tiene significado en sí mismo a diferencia de su precedente en el cual todos los
ítems funcionaban como una unidad. De esta forma desde la TRI se presenta mayor
flexibilidad ya que permiten una lectura de cada uno independiente de la puntuación final.
Muñiz (2010), aportan que el mayor aporte de la TRI radica en que proporciona invariantes
al:

Obtener mediciones que no varían en función del instrumento utilizado. Se pueden
utilizar diferentes test y se obtienen puntuaciones equiparables entre sí.

Disponer instrumentos de medida cuyas propiedades no varíen en función del nivel
de las personas en algún determinado atributo.
46
Calero y Padilla (2004) mencionan que los dos supuestos básicos de la TRI son el de
independencia local (cada ítem tiene independencia del resto de ítems) y el de
unidimensionalidad (la prueba evalúa un rasgo único).
Una de las mayores innovaciones de la TRI son los llamados bancos de datos. Para Navas
(1994) estos no son más que un conjunto de elementos de ítems que miden un mismo rasgo,
campo o área de conocimiento, estimados en la misma escala. Estos ítems se analizan en
base a modelos estadísticos de modo que de la base de datos se estima los más
representativos.
Lo relativo a la medición psicológica tuvo una fuerte evolución en las últimas décadas,
produciéndose importantes avances en el campo de la medición. Estas diferencias se
entablan desde la evolución del modelo de la teoría clásica hacia uno más basado en el
ítem. Muñiz (2010) presenta las siguientes diferencias entre ambas teorías.
Tabla 1: Diferencias entre la Teoría Clásica y la Teoría de Respuesta al Ítem
Aspectos
Teoría Clásica
Teoría de Respuesta al Ítem
Modelo
Lineal
No Lineal
Asunciones
Débiles (fáciles de cumplir por los
Fuertes (difíciles de cumplir por los
Invarianza de las mediciones
No
Si
Invarianza de las propiedades del
No
Si
datos)
datos)
test
Escala de las Puntuaciones
Entre
cero
y
la
puntuación
Entre -∞ y +∞
máxima del test
Énfasis
Test
Item
Relación Item-Test
Sin especificar
Curva Caracteristica del ítem
Descripción de los Item
Índices
de
Dificultad
y
de
Parámetros a, b, c
discriminación
Errores de Medida
Error típico de medida común
para toda la muestra
Tamaño Muestral
Puede
funcionar
bien
Función
de
Información
(varía
según el nivel de aptitud)
con
Se recomiendan más de 500
muestras entre 200 y 500
sujetos, aunque depende
sujetos
del modelo
aproximadamente
Fuente: Muñiz (2010)
47
Pruebas Psicométricas que miden Depresión
Habiendo expuesto ambos pilares del cuerpo teórico de la presente investigación,
Depresión y Psicometría, es posible exponer a continuación algunas pruebas psicológicas
que abordan el tema de la Depresión, finalizando con una descripción detallada de la
Segunda versión del Inventario de Depresión de Beck, centro del presente estudio.
Escala para la Evaluación de la Depresión de Hamilton (Ham-D)
La escala de Depresión de Hamilton surge en un contexto en el cual se necesitaba evaluar
la eficacia de la primera generación en antidepresivos publicándose en 1960. Según Bagby,
Ryder, Schuller y Marshall (2004) la prueba conserva este uso, convirtiéndose en la medida
de depresión más utilizada actualmente. El objetivo de la prueba consiste en la valoración
de la gravedad de los síntomas y los cambios en el paciente a lo largo del tratamiento.
Consta de 21 ítems, cada uno de los cuales tiene entre 3 y 5 posibilidades de respuesta con
puntuaciones de 0-2, 0-3 o 0-4 en sus ítems. La puntuación final va de 0 a 52. Los valores
para fiabilidad interna oscilan entre .46 y .97, para la fiabilidad entre examinadores la r de
Pearson osciló entre .82 y 0,98, la fiabilidad test retest osciló entre .81 y .98. Bagby,
Ryder, Schullery Marshall (2004) argumentan que la prueba también ofrece buenos
indicadores de validez de contenido, convergente, discriminativa y predictiva.
Escala Autoaplicada para la Depresión de Zung (Zung SDS)
La escala de Zung para depresión se diseñó con el fin obtener información para determinar
grados de severidad de un episodio depresivo mayor en pacientes psiquiátricos
hospitalizados publicándose así en 1965. Está formada por 20 frases que evalúan la
frecuencia de aparición. Cada ítem se puntúa en una escala de 1 a 4, con un rango de
puntuación final de 20 a 100. Como parte de las medidas psicométricas, la prueba muestra
en su versión original un alfa de Crombach de .875, sensibilidad de .96, especificidad de
.71, y coeficiente kappa de 0.441. Para la versión abreviada, el alfa de Crombach es de
.845, la sensibilidad de .92, la especificidad de .71, y el coeficiente kappa de .383 (Díaz,
Campo, Rueda y Barros, 2005)
48
Subescala de Depresión del Cuestionario de 90 Síntomas (SCL-90)
La Sympton Check List 90 (SCL 90) es una escala de síntomas que evalúa el grado de
distrés que manifiesta un individuo entre el día de la aplicación y la semana anterior a la
prueba. Es un instrumento auto aplicable cuya edad mínima que se requiere es de 18 años.
Está constituido por 90 reactivos que se contestan en una escala Likert de 5 puntos que van
desde cero (no del todo) hasta 4 (extremadamente). La prueba no es sobre depresión
específicamente, sino que la concibe como una de sus dimensiones. Dichas dimensiones
son: Somatización, Obsesivo compulsivo, Sensibilidad interpersonal, Depresión, Ansiedad,
Hostilidad, Ansiedad fóbica, Ideación paranoide, Psicoticismo, Índice de Severidad Global.
(Cruz, López, Blas, González, Chávez, 2005)
Subescala de Depresión del Inventario Multifásico de la Personalidad de Minnesota
(MMPI-D)
El MMPI es una de las pruebas más usadas para la identificación de perfiles de
personalidad y la detección de psicopatologías. Incluye 657 reactivos, conlleva entre 60 y
90 minutos su aplicación. Las edades de aplicación van desde 18 a 84 años. Cuenta con 57
escalas y 63 subescalas (Nichols, 2011). La escala de Depresión del MMPI 2, se interesa
por medir sintomatología depresiva, desanimo, falta de felicidad, de interés, apatía, retardo
psicomotor, irritabilidad y tendencia a la preocupación. Sus niveles de puntuación van
desde bajo (menos de 40), Medio (de 41 a 55), Moderado (56 a 65), Alto (66 a 75) y Muy
alto (76 o más) (Nichols, 2011).Para Costa Rica, la adaptación del MMPI se llevó a cabo
por Carlos Saborío en el 2011.
Multiscore Depression Inventory de David Bernt (MDI)
Mide intensidad de la depresión, en dos versiones una de 118 ítems y una reducida de 47.
Las preguntas se responden en función de Falso/Verdadero. La población mínima es de 13
años en adelante (Bernt, 1990).En la prueba original el índice de consistencia interna oscila
entre .96 y .97, a su vez que el test- retest arroja un coeficiente de .82. La validez
convergente con el BDI – II es de r= .69 (p= .001) y con Hamilton es de r= .66 (p= 0.01)
(Bernt, 1990).Tiene 9 escalas: Bajo nivel de energía, Dificultades Cognitivas, Sentimientos
de culpa, Baja autoestima, Introversión social, Pesimismo, Irritabilidad, Sentimientos de
tristeza y Desesperanza instrumental.
49
Inventario de Depresión de Beck
Características Generales
Según los mismos autores de la prueba, Beck, Steer y Brown (2009) el Inventario de
Depresión de Beck en su segunda versión (BDI-II) es un cuestionario autoaplicado de 21
ítems, los cuales evalúan un amplio cúmulo de síntomas depresivos (uno por cada ítem),
con una edad mínima de trece años. Cada ítem contiene cuatro opciones, las cuales varían
en intensidad del síntoma, desde 0 (ausencia o síntoma leve) hasta 4 (presencia disfuncional
del mismo). Entre sus usos principales se encuentra la evaluación de cambio en pacientes
con tratamiento de depresión y el diagnóstico de la misma (Pérez y Muñoz, 2004).
El BDI-II ha sido utilizado en múltiples contextos en el ámbito clínico (Pérez y Muñoz,
2004), y en la investigación desde estudios en consumo de drogas (Pedrero y López, 2005;
Seignourel, Green y Schmitz, 2007), estudios neurocientíficos (Dunn, Kimbrell, Ketter,
Frye, Willis, Luckenbaugh y Post, 2002; Rowland, Lam y Leahy, 2005), trastornos del
sueño (Carney, Ulmer, Edinger, Krystal y Knauss, 2009); en el área médica en general
(Poole, Bramwell y Murphy, 2009; Takai, Takahashi, Iwamitsu, Ando, Okazaki, Nakajima,
Oishi y Miyaoka, 2009; Viljoen, Iverson, Griffits y Woodward, 2003), así como en
diferentes poblaciones como Afroamericanos (Joe, Woolley, Brown, Ghahramanlou y
Beck, 2008), presidiarios (Palmer y Binks, 2008) e incluso, los estudios con adolescentes
han gozado de gran preocupación (Wilson y Blumentritt, 2007; Osman, Barios, Kooper,
Gutierrez y Bagge, 2004; Osman, Barrios, Gutierrez, Williams y Bailey, 2008, Byrne,
Tewart y Lee, 2004).
La aceptación que ha recibido del medio internacional ha sido muy importante al punto de
constituirse, según Sanz, Navarro y Vázquez (2003) en el instrumento de autoaplicación en
evaluación de depresión más usado tanto en el ámbito clínico como en investigación. Los
autores de la prueba señalan como en los primeros 25 años del instrumento ya se habían
producido más de 1500 artículos haciendo referencia a su uso, así como múltiples
investigaciones empíricas demostrando su utilidad. (Beck, Steer y Brown, 2009). Esto
brinda evidencias que apoyan el alto valor transcultural de la prueba.
50
Según Pérez y Muñoz (2004), el BDI-II posee capacidad discriminativa entre: 1. Pacientes
con y sin trastorno depresivo, 2. Pacientes con distimia de aquellos con un trastorno
depresivo mayor y 3. Pacientes con un trastorno de ansiedad generalizada de aquellos con
un trastorno depresivo mayor. No obstante, el BDI-II no está diseñado para diferenciar
entre distintos trastornos depresivos, sino solo entre dimensiones de depresión. Los mismos
autores señalan que la prueba es muy sensible al cambio terapéutico y puede ser
administrado de forma repetida. (Beck, Steer y Brown, 2009)
Desarrollo y evolución
El antecesor del BDI-II, el BDI creado en 1963, fue formulado en base a la construcción del
concepto de depresión que se sostenía en ese momento tomando como principio
fundamental la teoría de la depresión de Aaron Beck basado en lo que el autor denominó el
trío cognitivo negativo (pensamientos negativos sobre sí mismo, el mundo y el futuro)
(Butcher et al, 2006) teoría que suponía un consenso clínico en cuanto a la comprensión de
la depresión en ese momento (Sanz et al, 2003). Para Pérez y Muñoz (2004) esta primera
versión, al ser anterior al DSM-III estaba exenta de los criterios diagnósticos y dentro de
sus objetivos no se encontraba la clasificación. La misma se desarrolló por tanto a partir de
la experiencia clínica de Beck en psicoanálisis.
A lo largo de los años, conforme su teoría fue adquiriendo mayor coherencia, elaboración y
respaldo investigativo, se tornó necesaria la modificación del BDI inicial. La versión inicial
la cual apenas constaba de una escala de valoración de uso para el clínico desarrollada en
1961, fue modificada para 1978 por un cuestionario autoaplicado de 21 ítems, cada uno con
cuatro opciones de respuesta (BDI-IA). No obstante, con el surgimiento e influencia del
DSM-III (y posteriores) y la introducción de definiciones como la distimia y la depresión
mayor, surgen investigaciones que desacreditan la capacidad discriminativa del BDI-IA,
señalando su falta de adecuación a los criterios diagnósticos emergentes en la depresión.
Sanz et al(2003), señalan que el BDI I-A no cubre el criterio sintomático de
enlentecimiento o agitación psicomotor, cubre síntomas (hipocondría y desesperanza) que
no son propios del episodio depresivo mayor para el DSM y, no permite evaluar
sintomatología depresiva durante el periodo de tiempo mínimo (2 semanas).
51
A la luz de estas deficiencias, en 1994 Beck y sus colaboradores comienzan con el trabajo
piloto y es en 1996 cuando surge el BDI-II, el cual según Pérez y Muñoz (2004) continua
conservando la misma estructura de 21 ítems de cuatro valores pero varía algunos aspectos
importantes, como la extensión de la anterior ventana de medida de una semana a dos y la
modificación de algunos ítems de importancia, con el objetivo de cubrir los distintos
criterios diagnósticos del DSM.
Características Psicométricas
Debido a su afinidad investigativa, los criterios psicométricos del BDI-II están constatados
en múltiples estudios a lo largo del orbe, en distintos tipos de poblaciones de diferentes
ámbitos. En los estudios iniciales de la prueba, se utilizaron dos muestras, una de pacientes
externos provenientes de cuatro centros de investigación distintos, los cuales sumaban 500
personas; y una muestra de 120 estudiantes de un curso introductorio de psicología en la
Universidad de Nueva Bruswick, Fredericton, Canadá. Según Beck, Steer y Brown (2009)
los índices más importantes obtenidos de la prueba son los siguientes:
Fiabilidad. El coeficiente alfa de Crombach es de un .92 para el grupo de pacientes y .93
para el grupo de estudiantes. La correlación test retest para los autores de la prueba apunta
un .93 poseyendo significancia estadística (p < .001) (Beck, Steer y Brown, 2009). Pérez y
Muñoz (2004), hablan más bien de un .81-.83 para el trascurso de una semana.
Validez.
Validez de contenido. Al presentar en sus ítems todos los criterios que apunta el DSM-IV,
evalúa de forma muy completa y obediente todos los síntomas.
Validez concurrente. Pérez y Muñoz (2004) muestran las siguientes correlaciones con las
siguientes pruebas:

Escala para la evaluación de Hamilton (Ham-D) para pacientes psiquiátricos en un
.61-.86.

Escala Autoaplicada para la Depresión de Zung (Zung SDS): .57-.86.

Subescala de Depresión del Cuestionario de 90 Síntomas (SCL-90): .76.
52

Subescala de Depresión del Inventario Multifásico de la Personalidad de Minnesota
(MMPI-D): .60.

Escala de Desesperanza de Beck (BHS): .60.
Validez Estructural. El BDI-II presenta dos dimensiones subyacentes, una Cognitivaafectiva (dada por los ítems 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 y 17) y otra Somática
(ítems 15, 16, 18, 19 y 20) altamente correlacionadas entre sí (.98; p<.001). Numerosas
investigaciones respaldan la existencia y validez de ambas dimensiones en el BDI-II
(Storch, Roberti, y Roth, D, 2004; Beck, Steer y Brown, 2009)
Validez diagnóstica. No discrimina subtipos de trastornos depresivos, sino únicamente el
grado de severidad de depresión. Discrimina entre pacientes con y sin trastorno depresivo,
pacientes con distimia de aquellos con un trastorno depresivo mayor y pacientes con un
trastorno de ansiedad generalizada de aquellos con un trastorno depresivo mayor (Pérez y
Muñoz, 2004).
Ha demostrado tener una sensibilidad de .95, lo que indica que va a identificar el 95% de
los pacientes deprimidos como deprimidos (Arnau, Meagher, Norris, y Bramson, 2001).
Del mismo modo, tiene una especificidad de .90, lo que indica que identifica correctamente
aproximadamente el 90% de los individuos deprimidos como no deprimidos (Arnau et al.,
2001). Su Poder Predictivo Positivo es .50, lo que indica que aproximadamente el 50% de
los individuos identificados como deprimidos realmente están deprimidos, mientras que su
Poder Predictivo Negativo es .99, lo que indica que el 99% de los individuos identificados
como no deprimidos realmente no están deprimidos (Arnau et al., 2001).
Así que, aunque el BDI-II identifica a las personas no deprimidas con una precisión casi
perfecta, sólo hay un 50% de probabilidad de que las personas identificadas por la medida
como deprimidos realmente lo están. Es decir, el BDI II tiene una tendencia a presentar
falsos positivos en el 50% de los casos y, una tendencia a los verdaderos negativos en un
99%. Esta decisión tiene la ventaja de que excluye de tratamiento a quien verdaderamente
no lo necesita, pero sobre etiqueta a las personas con algún grado de intensidad de la
Depresión, incitando al tratamiento.
53
Planteamiento del Problema de
Investigación
ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE
DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA
54
PLANTEAMIENTO DEL PROBLEMA
DE INVESTIGACION
Problema de Investigación
Descrita la pertinencia que representa para el país contar con una prueba con propiedades
psicométricas adecuadas para la evaluación diagnóstica de la depresión, además de la alta
prevalencia con que se diagnostica este trastorno a nivel clínico, se planteó el presente
proyecto de adaptación.
De lo anterior surge el siguiente problema que sustenta el trabajo de esta investigación:
¿Presentará la adaptación del BDI-II aplicada en una muestra del Gran Área Metropolitana
(GAM) propiedades psicométricas adecuadas?
Objetivos
Objetivo general.
Adaptar la segunda versión del Inventario de Depresión de Beck (BDI-II) en una muestra
de personas residentes en el GAM.
Objetivos específicos

Traducir el inventario con las palabras culturalmente ajustadas para cada ítem de
modo que resulten más comprensibles para la población costarricense.

Realizar una revisión del primer borrador de la prueba, mediante un criterio
interjueces.
55

Modificar la prueba según una valoración de las indicaciones ofrecidas por los
jueces.

Evaluar la comprensión de los ítems del BDI-II en una muestra piloto de 40
personas de población general.

Aplicar la versión definitiva a una muestra de personas residentes del GAM.

Corroborar los criterios de validez y fiabilidad resultantes de la prueba
concernientes a la muestra por medio de los análisis estadísticos correspondientes.
Hipótesis
Con la resolución de los anteriores objetivos, se pueden cumplir alguna de las siguientes
hipótesis:
Hi: Los resultados psicométricos que se obtengan con la adaptación del Beck Depression
Inventory II (BDI- II) en la población costarricense serán similares con respecto a los
obtenidos de las adaptaciones realizadas en otros contextos, y poseerán significancia
estadística adecuada en los índices de validez y fiabilidad.
Ho: Los resultados psicométricos que se obtengan con la adaptación del Beck Depression
Inventory II (BDI- II) en la población costarricense serán más bajos con respecto a los
obtenidos de las adaptaciones realizadas en otros contextos, y tampoco poseerán
significancia estadística adecuada en los índices de validez y fiabilidad.
H1: Se obtendrán resultados psicométricos más elevados que los obtenidos por las
adaptaciones con el BDI-II realizadas en otros contextos y por ello dichos resultados
poseerán significancia estadística adecuada en los índices de validez y fiabilidad de la
prueba.
H2: Se obtendrán resultados psicométricos más bajos que los obtenidos por las
adaptaciones con el BDI-II realizadas en otros contextos, pero aún con ello si poseerán
significancia estadística adecuada en los índices de validez y fiabilidad de la prueba.
56
Metodología
ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE
DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA
METODOLOGÍA
Antes de describir las características del estudio, es importante comentar que la presente
investigación se sustentó en torno a tres ejes que metodológicamente guiaron la misma:

Los lineamientos para la adaptación de pruebas psicológicas de la International
Commision Test (Ver Anexo 1)

La propuesta metodológica para la adaptación y estandarización de instrumentos de
Geissenger (1994)la cual se comentará posteriormente.

El esquema de Validez y Fiabilidad de Wasserman y Bracken (2003)
Por tanto, toda la metodología se asume en función de estos tres parámetros.
Tipo de estudio.
Al tratarse de la adaptación de una prueba psicológica, es de tipo psicométrico. La
psicometría, al utilizar como pilar básico la medición, está basada en la asignación de
valores numéricos a objetos y eventos, de acuerdo con ciertas reglas (Kerlinger y Lee,
2002). Todo estudio psicométrico, al basarse en la medición, asigna números a
determinados atributos y variables de uno o varios constructos psicológicos, con el fin de
lograr una estimación de los mismos, pretendiendo el estudio de la validez, fiabilidad y
datos normativos de una prueba (Cohen y Swerdlik, 2006).
Diseño de investigación.
La investigación al basarse en la recolección y análisis de datos puede clasificarse como un
diseño no experimental-transversal, debido a la pretensión de recolección de los datos en un
58
único momento, buscando la descripción y análisis de la incidencia e interrelación de
variables de esa situación en específico (Hernández, Fernández y Baptista, 2006).
Sujetos de investigación
Población: El estudio se realizó principalmente en dos poblaciones diferentes: una
población general y una población clínica con sintomatología depresiva. Para la población
general se trabajó con 618 sujetos procedentes del Gran Área Metropolitana. Se decidió
trabajar con este sector de la población nacional únicamente por razones de factibilidad, ya
que resultaba metodológicamente imposible cubrir con representatividad estadística toda la
población nacional.
Con la población clínica se trabajó con 79 sujetos, tomados de 3 fuentes:

Casos clínicos que maneja la Caja Costarricense de Seguro Social (CCSS) en
consulta externa del Hospital Psiquiátrico Roberto Chacón Paut.

Casos clínicos de pacientes con Depresión de la Clínica de Tibás

Apoyo por parte de profesionales en Psicología.
Para la muestra de la población general, al obtenerse a partir de elementos derivados de
instituciones, lugares y demás, no por razones de representatividad sino por comodidad del
investigador se puede hablar de un muestreo por conveniencia (Hernández 2004). Para la
muestra de la población clínica, es posible hablar de un muestro de juicio o intencional
(Hernández, 2004), debido a que se contó con el apoyo del comité de Bioética del Hospital
Max Peralta en Cartago al contar con esta población cautiva en el Hospital Psiquiátrico
Roberto Chacón Paut.
Criterios de inclusión: Para ambas poblaciones el principal criterio de inclusión se realizó
en función de la edad, incluyendo únicamente a las personas mayores de 18 años. En caso
de ubicar personas menores de edad, hubiese sido necesario contar con un asentimiento
informado de los padres para cada caso, excediendo los recursos de la investigación en
términos de coste, tiempo y esfuerzo.
59
Además, se tomaron en cuenta únicamente costarricenses por nacimiento, o extranjeros
inmigrantes que posean más de 10 años de radicar en el país. Lo anterior debido a que el
proceso de aculturación por el que se atraviesa en situaciones de migración suele venir
acompañada de síntomas de adaptación, entre ellos propiamente los relacionados con
depresión (Lu, 2010; Wright, 2009; Fozdar, 2009). Esta situación puede provocar un sesgo
en la recogida de datos, llegando a afectar los resultados finales que se obtengan. En
acuerdo con Lu (2010) todo proceso de aculturación viene acompañado de procesos
psicosociales distintos, los cuales son interpretados de forma distinta de persona en persona.
Por eso no existe un periodo de tiempo que se defina como válido y universal para todos los
casos sino que este periodo variará de persona en persona. De esta manera se ha pensado en
10 años, tratando de disminuir en la medida de lo posible las probabilidades de que se
incluyan datos de un sujeto que puedan sesgar los resultados de la población general al
presentar síntomas propios de una situación de adaptación al nuevo contexto.
En los casos clínicos se tomaran en cuenta las referencias de Consulta Externa de pacientes
con sintomatología Depresiva realizadas por profesionales en Psicología únicamente, y que
cuenten ya sea con menos de 22 días de haberse efectuado el diagnóstico o que no se haya
superado un número de 4 sesiones incluyéndose tanto evaluación como tratamiento. Con
respecto a los criterios de Sintomatología Depresiva, se utilizaron los mismos que indica el
DSM 5 (APA 2013) cuando contaran con al menos 3:

Estado de ánimo depresivo la mayor parte del día, casi cada día según lo indica el
propio sujeto (p. ej., se siente triste o vacío) o la observación realizada por otros (p.
ej., llanto)

Disminución acusada del interés o de la capacidad para el placer en todas o casi
todas las actividades, la mayor parte del día, casi cada día (según refiere el propio
sujeto u observan los demás)

Pérdida importante de peso sin hacer régimen o aumento de peso (p. ej., un cambio
de más del 5 % del peso corporal en 1 mes), o pérdida o aumento del apetito casi
cada día.

Insomnio o hipersomnia casi cada día
60

Agitación o enlentecimiento psicomotores casi cada día

Fatiga o pérdida de energía casi cada día

Sentimientos de inutilidad o de culpa excesivos o inapropiados (que pueden ser
delirantes) casi cada día

Disminución de la capacidad para pensar o concentrarse, o indecisión, casi cada día
(ya sea una atribución subjetiva o una observación ajena)

Pensamientos recurrentes de muerte (no sólo temor a la muerte), ideación suicida
recurrente sin un plan específico o una tentativa de suicidio o un plan específico
para suicidarse (APA-2013)
Con la población clínica se excluían aquellos que no contaran con los anteriores criterios
descritos, además cuando:

Los síntomas eran debido a los efectos fisiológicos directos de una sustancia (p. ej.,
una droga, un medicamento) o una enfermedad médica (p. ej., hipotiroidismo).

Había presencia de un diagnóstico de Trastorno Bipolar, Esquizofrenia
Instrumentos y técnicas
Como técnica principal se siguió en estricto apego los lineamientos que se utilizan
internacionalmente para la adaptación de pruebas psicométricas propuestos por Geissenger
(1994). Dichos lineamientos se discutirán posteriormente.
En cuanto a los instrumentos, básicamente se utilizó la segunda versión del Inventario de
Depresión de Beck (BDI-II). En la primera fase de “traducción y adaptación del
instrumento” se utilizaron el Inventario en su versión estadounidense original, su versión
adaptada al contexto español y al argentino. Una vez conseguida la traducción al contexto
nacional, entonces se utilizó como instrumento en las siguientes fases concernientes a la
aplicación y validación. También se contó con el Multiscore Depression Inventory y la
Escala de Afecto positivo y Negativo. En el análisis de los datos se trabajó con la versión
21 de los programas SPSS y AMOS.
61
Procedimientos
Con el fin de garantizar el cumplimiento de las directrices propuestas por la ICT (2010, ver
“Anexo 1”) para la adaptación de test psicológicos, el proceso de adaptación de la prueba
BDI–II fue dividido en nueve fases siguiendo en estricto orden los lineamientos
internacionalmente aceptados y reconocidos para la adaptación y estandarización de
pruebas psicológicas (Geissenger, 1994). Esas 9 fases han sido agrupadas en cuatro
categorías o etapas, con lo que se pretende sistematizar el avance de la investigación en
cuanto a ejes temáticos: “La Adaptación del Instrumento”, “Pruebas con el Instrumento”,
“Análisis y exposición de las cualidades psicométricas del instrumento” y “Promoción del
Instrumento Adaptado”. La metodología utilizada, en apego a las fases propuestas por
Geissenger (1994), se describe a continuación.
Etapa 1: Adaptación del instrumento
Esta etapa está determinada por la revisión y redacción de los criterios adecuados con los
que se presentará la prueba en su versión final. Tuvo por objetivo traducir el inventario con
las palabras más apropiadas para cada ítem de modo que resulten lo mejor comprensibles
para la población costarricense. Estuvo conformada por los tres primeros pasos que
propone Geissenger (1994).
Traducción y adaptación del instrumento
Consiste en una valoración de si el instrumento amerita ser traducido de su lengua original
pregunta por pregunta. En el caso del BDI –II, su idioma original es el inglés, lo cual obliga
su traducción. Para esto se trabajó en varias subfases paralelas:
1. Traducción de la prueba. Se realizaron dos procesos simultáneos:
a. Traducción de la prueba por parte de un traductor. Se contó con un traductor
graduado de la Carrera de Bachillerato en Inglés de la Universidad de Costa
Rica. Esta se encuentra en el Anexo 6
b. Traducción por parte del investigador responsable del proyecto. En paralelo
a la traducción del primero, el investigador también tradujo la prueba por su
cuenta. Esta se encuentra en el Anexo 7
62
2. Comparación y unificación de las dos versiones. Una vez obtenidas ambas
versiones, las mismas se unificaron. Ver Anexo 8
3. Comparación con la versión española y argentina. La versión resultante se
comparó con las dos versiones que existen en el idioma español.
4. Redacción de un borrador. Al final se creó un primer borrador o propuesta de lo
que sería el BDI II. Con esto termina la primera fase. Ver Anexo 9.
Revisión de la versión traducida o adaptada
En esta fase el borrador que surgió de la fase anterior se les administró a distintas personas
con el fin de que evaluaran y valoraran la calidad de la traducción. Se tomaron en cuenta
los criterios de dos tipos de jueces, un primer grupo compuesto por profesionales en
Psicología y un segundo compuesto por personas de Población General.
Con el primer grupo de jueces se determinaron aspectos de forma y estructura, apego a la
esencia teórica del instrumento original, así como la conformidad con el lenguaje inclusivo
y claridad gramatical del instrumento. Se les facilitó un folleto en el cual se incluía la
versión original en inglés, la versión en español y el borrador de la Adaptación.
Con el segundo grupo de jueces se evaluó el proceso de respuesta y la manera en que los
ítems presentados les eran comprendidos, para ello se utilizó como base la Guía de
Entrevista Cognitiva adaptada por Smith y Molina (2011) para la aplicación en la
elaboración y mejoramiento de instrumentos de papel y lápiz (ver Anexo 10).Este
procedimiento a pesar de que no conforma la propuesta de Adaptación de Geissenger
(1994), se utilizó de forma adicional al proyecto con el fin que garantizase validez a la
investigación. Los criterios de inclusión fue el siguiente:

No debían contar con conocimientos avanzados de la psicología

No podían estar vinculados a alguna carrera de Psicología en alguna Universidad

No podían tener experiencia en la administración de cuestionarios de algún tipo.
Únicamente se pretendió analizar si el documento resultaba comprensible por la población
general. Se contó con 5 hombres y 5 mujeres, con edades desde los 18 hasta los 75 años,
desde Primaria incompleta hasta estudios Universitarios, distribuidos de la siguiente forma:
63
Tabla 2: Distribución sociodemográfica de participantes Entrevista Cognitiva
Sujeto A
Sujeto B
Sujeto C
Sujeto D
Sujeto E
Sujeto F
Sujeto G
Sujeto H
Sujeto I
Sujeto J
Género
Nivel Educativo
Edad
M
F
F
M
M
M
F
F
M
F
Universidad Completa
Estudios ParaUniversitarios
Primaria Incompleta
Primaria Completa
Secundaria completa
Universidad Incompleta
Universidad Completa
Secundaria Incompleta
Universidad Completa
Secundaria Completa
30
27
50
55
24
25
35
18
26
75
Adaptar el borrador del instrumento con base en las sugerencias de los jueces
Consistió en una valoración de las correcciones ofrecidas por los profesionales en la fase
anterior y una modificación de la prueba según las indicaciones ofrecidas por los jueces. Al
realizarse dicha integración, la prueba se sometió finalmente a dos procesos de esta fase:
una traducción inversa y posteriormente una revisión y corrección por parte de un
profesional en Filología.
Traducción Inversa o Comparación “Back Translation”: Consiste en una traducción del
borrador del idioma español al inglés, con el fin de determinar si existen diferencias
significativas inadmisibles entre el borrador en español y la versión en inglés. De existir
tales diferencias, las mismas se examinan y se considera el planteamiento de posibles
aspectos que sean dignos de modificación. Dicha traducción inversa estuvo a cargo de un
traductor distinto del primero, con el fin de reducir las posibilidades de sesgos en la
información que se proporcione.
Revisión Filológica: Al final, el documento fue analizado por un profesional en Filología,
con el fin de corroborar la estructura gramatical y redacción de la prueba. La versión final
resultante se adjunta en el Anexo 11.
64
Etapa 2: Pruebas con el instrumento
Una vez realizada la traducción y adaptación del instrumento, fue necesario comprobar su
comportamiento en cuanto a la aplicación y sus propiedades psicométricas. Para lograr esto,
se realizaron varias aplicaciones con el instrumento resultante de la Etapa 1, pretendiendo
que la puntuación refleje la realidad de la muestra en relación con el constructo de la
prueba. El objetivo al que obedece es el de evaluar la comprensión de los ítems del
inventario desde la perspectiva de una sub muestra de personas de la población general. Le
conforman las siguientes fases de igual manera propuestas por Geissenger (1994):
Prueba piloto del instrumento
El borrador final se aplicó a una población de prueba, con el objetivo de observar el
comportamiento del instrumento en una posterior prueba de campo. Según Geissenger
(2004) esta fase es necesaria en el sentido que dilucida ciertos problemas que puedan surgir
en un futuro. Se trabajó con 40 personas de población general ubicados en el parque Central
de San José. Se les administró consentimiento informado (Anexo 4) y la adaptación del
cuestionario BDI II. Con el fin de determinar tiempo de duración, comprensión de los ítems
y dificultades de lectoescritura se utilizó una plantilla de observación que el evaluador iba
llenando conforme las personas terminaban el cuestionario. La misma se encuentra en el
Anexo 5.
Prueba de campo
En esta fase la adaptación final del BDI-II con las debidas correcciones realizadas y
habiendo tomado en cuenta que la prueba piloto no se evidenciaron grandes dificultades
con respecto a la comprensión de los ítems, se aplicó a la muestra del GAM. Para
Geissenger (1994) en este caso la muestra debe ser poseer representatividad a nivel
poblacional, sujeto a criterios estadísticos con el fin de garantizar la generalizabilidad de los
resultados obtenidos. A su vez, para disminuir al máximo las posibilidades de valores
perdidos, siempre se contó con la presencia y fiscalización del investigador, garantizándose
que la prueba fuera contestada en su totalidad.
Básicamente, se utilizaron dos tipos de muestra, ambas del Gran Área Metropolitana: Una
derivada de la población general y otra de la población clínica
65
Población General
Con el objetivo de revisar los criterios de validez y fiabilidad de la prueba, con respecto a la
validez interna se utilizó una muestra de 53 personas para el procedimiento test-retest;
mientras que para la validez convergente y divergente se les aplicó a 251 personas en
conjunto con el BDI-II el instrumento MDI (Multiscore Depression Inventory, adaptado en
1997 Anexo 12) y el Possitive and Negative Affect Schedule (Escala de afecto positivo y
negativo PANAS Anexo 13).
En total, se contó con 618 personas de población general de las cuales

A 251se les administró BDI, MDI, PANAS

A 53test-retest

A 314 únicamente BDI
La selección del Multiscore Depression Inventory responde a que es el único instrumento
de depresión adaptado en el país, siendo el de mayor uso por parte de la CCSS. Contrastar
el BDI II con este aportaría un buen criterio de convergencia. La selección del PANAS se
realizó con la intención de contar con un instrumento que incluyese en sí mismo alguna
medida que distanciara del constructo de Depresión. El PANAS cuenta con una escala de
afecto positivo, que permitiría evaluar este criterio de divergencia.
De forma adicional al proyecto se diseñó además una versión digital en línea de la
Adaptación del Instrumento. Esta se realizó con el programa Lime Survey, obteniéndose 63
personas participantes, la consecución de las mismas fueron obtenidas por medio de la red
social Facebook, desde el cual se les enviaba un mensaje privado con la solicitud de
participación, además del link desde el que podrían tener acceso al cuestionario.
Población Clínica
En términos precisos, población que presenta sintomatología básica de Trastorno de
Depresión Mayor según criterios del DSM-V (APA 2013), tomándose en cuenta referencias
realizadas únicamente por evaluaciones de profesionales en psicología, tanto de los
servicios de la CCSS, la clínica de Tibás, como de consulta clínica privada.
66
En el caso de la CCSS, fue necesario enviar el proyecto a revisión del Comité Local de
Bioética en el Max Peralta de Cartago, documentos entre los cuales fue necesario diseñar
una propuesta y aprobar un curso de Bioética.
Se escogió la población del Hospital Psiquiátrico Roberto Chacón Paut, precisamente en la
Unidad de Intervención en Crisis por dos razones:

Es una población cautiva (interna), por tanto ofrece facilidades tanto al investigador
como a los participantes en la recolección de los datos. En otros centros hubiese
sido necesario que los participantes se movilizaran a la institución, al alterar su
propia rutina diaria, muchos no asistirían a la cita.

Los comités de Bioética exigen que el traslado de los participantes al Centro sea
reembolsado excediendo los recursos económicos de la investigación. En el Chacón
Paut, se exime este rubro al estar internados.
En la Clínica de Tibás se pudo contar con la participación de 12 personas, siendo los
mismos pacientes del servicio de Psicología de la misma. La Clínica de Tibás es una
institución de Salud privada en este país, así como la que corresponde a los sectores de
Pavas, Santa Ana y Santo Domingo de Heredia. A estas 4 cooperativas se les externó la
solicitud, siendo la de Tibás la única que respondió.
Finalmente, 12 fueron aportados de parte de profesionales en Psicología. A estos se les leía
el consentimiento y se les pasaba la versión adaptada del BDI-II.
De esta forma se pudo obtener una muestra de 79 personas población clínica, de las cuales:
a 30 se les administró BDI, MDI, PANAS mientras que a 49 únicamente BDI.
67
Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento
Una vez obtenidos todos los datos necesarios, se procedió a una revisión y exposición de
los principales datos de la prueba como instrumento de medición viable. Para conseguir
dicha revisión, en esta fase se dio una sistematización de toda la información obtenida en
las pruebas de campo con los programas de análisis estadístico SPSS y de ecuaciones y
modelos estructurales AMOS. En esta fase se revisó indicadores de validez y fiabilidad de
la prueba y dando por terminada la adaptación de la misma, al adecuar los puntos de corte
en función de las necesidades locales, estableciendo así una revisión de las principales
garantías psicométricas.
Estandarizar las puntuaciones
Para Geissenger (1994) una vez que se han administrado los cuestionarios, los resultados se
computan y se establecen normas que correspondan exclusivamente a la muestra meta con
base en los criterios diagnósticos establecidos por la misma prueba. El autor indica que
también se debe valorar la necesidad de replantear algunos ítems ya sea modificándolos o
en caso estrictamente necesario eliminándolos.
En el caso del BDI-II, al tratarse de una prueba que no presenta baremos dentro de su
corrección, no es necesaria la estandarización. Sin embargo si fue necesaria una
comprobación de los cuatro modos de intensidad que la misma ofrece: “Mínimo”, “Leve”,
“Moderado” y “Severo”. De esta manera la consolidación de los puntos de corte ofrecería
un indicador a futuro de la posible ubicación de un paciente dentro del espectro depresivo
para nuestro país.
Dado que el objetivo de esta fase consiste en determinar que la prueba cuenta con garantías
suficientes per se para demostrar que mide con integridad, consistencia y veracidad, se
evidencia a través de los indicadores de fiabilidad con los siguientes procedimientos:

Relacionados con la Estabilidad de la medida: Procedimiento Test Retest a través
de Correlaciones Pearson/Spearman

Relacionadas con la Homogeneidad de la medida: Alfa de Crombach
68

Relacionadas con la Objetividad de la medida: No fueron necesarias pruebas en
este rubro ya que se utiliza para pruebas en la que influye la subjetividad del
evaluador, tales como instrumentos de evaluación en creatividad, de motivación,
pruebas proyectivas. El BDI II es una prueba cuya puntuación goza de objetividad,
ya que se obtiene por la sumatoria de valores en los ítems.
Realizar una investigación sobre la validación del instrumento
Consiste en una revisión para determinar si el instrumento mide lo que pretende medir
(validez). Con respecto a indicadores de validez se realizaron los siguientes
procedimientos:
Validez de contenido: Criterio de Acuerdo Interjueces
Este tipo de validez se indagó por medio de un cuestionario de criterio interjueces (Anexo
15). En el mismo cada juez debía anotar un número en escala del 1 al 4 para cada ítem
siguiendo la siguiente clasificación de 4 puntos:
1. No relevante
2. Algo relevante
3. Muy relevante
4. Totalmente relevante
Al final se promediaría el estimado de cada juez, obteniéndose un estadístico representativo
de la validez de contenido.
Validez Estructural: Análisis factorial exploratorio y confirmatorio
Primero se realizó una prueba KMO y de esfericidad de Bartlett con el fin de verificar si un
posible análisis factorial se adecua a la muestra.
Al proceder con el Análisis Factorial Exploratorio, se utilizó
una rotación Oblicua
(Promax), por cuatro razones:
69

Se trata de un cuestionario monorrasgo y por tanto los supuestos factores e incluso
los mismos ítems del BDI están correlacionados entre si

Dada la naturaleza del constructo de Depresión y su característica tendencia a
experimentar de forma simultánea síntomas negativos a la vez.

Beck en su estudio inicial utilizó una rotación Promax, que es Oblicua.

Cuarto el resultado del test de esfericidad de Bartlett apoya el supuesto de que las
variables están muy intercorrelacionadas entre sí.
Esta rotación Oblicua se acompañó además de una normalización de Kaiser.Posteriormente
se obtuvo la Matriz Estructural y de Configuración así como la correlación entre factores
Una vez realizado el análisis factorial exploratorio se realizó un análisis factorial
confirmatorio con el fin de corroborar la distribución de las cargas para cada factor.
Validez Concurrente/discriminante: Correlaciones con MDI y Panas
Por lo general, en otras adaptaciones del BDI II a otros contextos se utilizan pruebas
vinculadas al constructo de Ansiedad con el fin de dilucidar la validez divergente (Wang &
Gorenstein, 2013). No obstante este procedimiento puede tener un sesgo implícito, ya que
como reflexionan Agudelo, Buela Casal y Spielberger (2007) el constructo de Depresión y
el de Ansiedad al presentar comorbilidad entre la sintomatología de cada uno, es difícil
distinguir si realmente se trata de constructos diferentes, radicando en un problema de
diferenciación diagnóstica entre ambos. De esta forma, basar resultados de convergencia y
divergencia en función de dicha correlación puede resultar perjudicial para la investigación.
De esta forma se contó con la administración tanto de la versión adaptada del BDI II en
conjunto con la versión del Multiscore Depression Inventory adaptada en Costa Rica y la
escala de Afecto Positivo y Negativo PANAS.
La validez convergente estaría representada por el grado en que las puntuaciones del BDI II
correlacionan de forma positiva con el MDI y con la escala de Afecto Negativo del
PANAS, mientras que la divergente en función de la correlación negativa con la Escala de
Afecto Positivo, sugiriendo discrepancia entre ambas.
70
Validez diagnóstica: Análisis de medias entre poblaciones. Puntos de corte y Curva
COR
Como se indicaba en párrafos anteriores, la Validez de diagnóstico se refiere a la precisión
con la que se realizan las decisiones de clasificación. Esto se garantizará delimitando los
puntos de corte.
Beck en su estudio inicial propone 4 puntos de corte. La puntuación del BDI II se obtiene
por medio de la sumatoria de cada elección de los 21 ítems. Cada ítem es codificado en una
escala de 4 puntos, que van de 0 a 3. El máximo posible correspondería a 63 (21 x 3) y el
mínimo 0.
Se garantiza que la puntuación máxima del test se conserve, sin embargo los 4 puntos de
corte internos se modificaron en función de las sugerencias de los análisis estadísticos
derivados de la muestra participante. Cada rango de puntuación albergaría el 25% de la
muestra, de modo que la agrupación se realizó percentilar.
También se utilizó el procedimiento de Curva COR, con el fin de identificar distintos
modelos de especificidad y sensibilidad.
Etapa 4: Promoción del Instrumento Adaptado
En esta Etapa se desglosan dos fases finales, relacionadas con la publicación acerca de las
garantías psicométricas de la Adaptación, Normas de Interpretación y Condiciones de uso.
El objetivo es dar a conocer el instrumento entre representantes profesionales que estén
interesados en el uso del instrumento a futuro. Por tanto ambas fases tienen que ver con la
divulgación.
Desarrollo de manuales y otros instrumentos para el conocimiento de la versión.
Para Geissenger (1994), en este aspecto al diseñar un cuestionario de evaluación se tiene
como responsabilidad la confección de manuales para el instrumento, donde se indique la
evidencia sobre la validez y confiabilidad del mismo. En cuanto a una adaptación se deben
71
incluir las normas de aplicación e interpretación de los resultados, así como guías para su
correcta aplicación. Es importante también una comparación entre las características locales
y las originales. Se diseñó un Manual de uso para el BDI-II en Costa Rica. Este Manual de
uso se adjunta como Anexo 16
Entrenar a los usuarios
Se refiere al desarrollo de capacitaciones para la correcta utilización del instrumento. Esta
se brindó a estudiantes de Psicología en medio de su Trabajo Final de Graduación, ya que
desde el mismo utilizarían el BDI-II. También se brindó a funcionarios del Instituto Wem.
Los contenidos de dicha capacitación fueron:




Características generales del BDI, Desarrollo y evolución
Proceso de adaptación a Costa Rica
Características Psicométricas de la Adaptación
Administración y puntuación del BDI
A futuro se pretende una mayor promoción del instrumento, en función de la demanda de
instituciones que así lo requieran.
Análisis de los datos
Los casos que se consideraron inválidos se eliminaron, no obstante, se intentó reducir la
frecuencia de datos perdidos con la presencia del investigador en la toma de ellos,
asegurando que las personas hayan marcado todas las casillas. Para el análisis de los datos
se utilizó los paquetes estadísticos SPSS y AMOS (SPSS Inc.).
Protección a los sujetos
Se garantizará confidencialidad, custodia, anonimato y después de 10 años la eliminación
de protocolos, asegurando que los datos que aportaron los sujetos no se publiquen
abiertamente cuando esta información pueda identificarles por un tercero. El análisis de los
datos si se publicará, pero al realizarse de forma general impedirá evidenciar cualquier tipo
de resultado personal. El Consentimiento Informado se le brindó a cada persona en
conjunto con la prueba. Ver Anexo 3.
72
Resultados
ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE
DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA
RESULTADOS
Siguiendo en apego a los tres ejes descritos al inicio del apartado de Metodología, se
describirán los resultados en función de las cuatro etapas propuestas por Geissenger (1994).
Etapa 1: Adaptación del instrumento
En esta etapa se traduce tal como lo describe la Metodología el cuestionario desde su
idioma original. El criterio interjueces fue de especial importancia, ya que brindó aportes
para la versión final. Al trabajarse con dos grupos se obtuvieron los siguientes resultados:
Grupo Profesionales en Psicología
Los aportes de los profesionales en Psicología tuvieron mayor peso en aspectos de forma,
claridad de los ítems y modificaciones en el diseño de la prueba. Algunos aportes fueron
excluidos ya que consideraban modificar aspectos básicos de la prueba, siendo los mismos
esenciales en la misma. Se valoraron los aportes de los mismos, palabras que concordaban
mejor que otras, propuestas de morfología y sintaxis y hasta tamaño de letra.
Algunas de las acotaciones más destacadas fueron:

Utilizar inutilidad en lugar de baja autoestima

Utilizar sentimientos de culpa en lugar de percepción de culpa

Utilizar disconformidad con mi mismo en lugar de autodisconformidad
Grupo Personas Población General: Entrevista Cognitiva
En general el grupo de personas que colaboraron manifestaron una comprensión adecuada
del mismo, opinando que el lenguaje utilizado les resultaba comprensible y familiar. En
ocasiones algunos ítems necesitaron de clarificación ya que comentaban se podían
interpretar desde varias formas, tal es el caso de

Sentimientos de Castigo: referente a la posibilidad de si el castigo es autoinfligido o
si se refiere a algo más genérico y abstracto (La vida me castiga, Dios me castiga)
74

Inquietud: Acerca de si el ítem estaba ligado a Ansiedad o exceso de energía.

Irritabilidad: en un caso se preguntó si se refería a irritabilidad de carácter o
irritabilidad física (piel)
Con respecto al formato, el tamaño de letra les pareció adecuado (a excepción de las
instrucciones), así como el orden de las preguntas. En los reactivos “Cambios en el patrón
de sueño” y “Cambios en el Apetito”, indicaron no tener dificultades en los mismos, a pesar
de que variaba el formato. A continuación se muestra una tabla unificada desde la cual se
describe lo encontrado a partir de cada categoría de la Entrevista Cognitiva.
Tabla 3: Aportes de Participantes de Entrevista Cognitiva con respecto al Instrumento
Tarea
INSTRUCCIONES:
Identificar problemas
en
todas
las
introducciones,
instrucciones
o
explicaciones desde la
perspectiva
del
encuestado
Problema
Introducciones,
instrucciones
o
explicaciones complicadas, confusas o
vagas.
Aporte de los participantes
Las instrucciones son claras.
El tamaño de letra es muy pequeño.
La mayoría insiste en que hasta leer el
documento
las
entenderán
completamente
CLARIDAD DE LAS
PREGUNTAS
O
REACTIVOS:
Identificar problemas
relacionados con la
intención o significado
de las preguntas
La pregunta es muy larga o rara, la
sintaxis es compleja, la redacción es
incorrecta
Los términos técnicos están poco
definidos, son muy complejos, no están
claros
Existen múltiples formas de interpretar la
pregunta, la redacción es vaga o
ambivalente.
Los períodos de tiempo no están
especificados,
son
vagos
o
contradictorios.
En este rubro no hubo sugerencias o
dudas
Los supuestos sobre la situación del
entrevistado o su experiencia son
inapropiados.
Se asume una experiencia o conducta
constante y estable que en realidad
puede variar.
No aplica
SUPUESTOS:
Determinar si existen
problemas con los
presupuestos
o
la
lógica subyacente a las
preguntas
El reactivo contiene más de una
pregunta implícita o hace referencia a
más de un objeto actitudinal.
CONOCIMIENTO
/MEMORIA:
Verificar
si
los
encuestados
tienen
problemas para saber
o
recordar
la
información que se
solicita.
La persona no tiene conocimiento sobre
el tema y es probable que no tenga una
actitud al respecto
La actitud (evaluación) al respecto puede
no estar consolidada o no existe
El entrevistado puede no recordar la
información solicitada.
La pregunta requiere de un proceso
En este rubro no hubo sugerencias o
dudas
En este rubro no hubo sugerencias o
dudas
No aplica
En algunos casos hubo dudas en
cuestión de temporalidad, pero luego
recordaban que en las instrucciones
decía “15 días”
No se presentó
No se presentó
No aplica
No se presentó
No se presentó
75
mental complejo.
SENSIBILIDAD:
Revise las preguntas o
palabras de naturaleza
sensible
La pregunta hace referencia a tópicos
privados, embarazosos, que implican
conductas no deseadas o ilegales.
La redacción de los reactivos o los
términos utilizados son poco sensibles,
ofensivos o ajenos a la experiencia de
los entrevistados.
El reactivo evoca respuestas socialmente
aceptadas (deseabilidad social).
CATEGORÍAS
DE
RESPUESTA:
Verifique
qué
tan
adecuadas son las
categorías
de
respuesta de cada
pregunta
No se presentó. El investigador
consulta
sobre
el
último
ítem
relacionado con “Interés en el Sexo” y
todos contestan que las palabras que
se utilizan son adecuadas.
No se presentó
No se presentó
Las preguntas abiertas son difíciles o
inapropiadas.
Existe desajuste entre la pregunta y las
categorías de respuesta.
No aplica
Los términos técnicos en las opciones de
respuesta son poco claros, complejos o
están sin definir.
En algunas ocasiones se presentaron
dudas con respecto a los siguientes
ítems:

Inutilidad

Irritabilidad
No obstante no eran del todo
significativas
No se presentó
Las categorías de respuesta pueden ser
interpretadas de múltiples maneras
(vaguedad).
Existe un traslape entre las categorías de
respuesta.
Hay opciones de respuesta ausentes.
El orden de las categorías de respuesta
es ilógico
En algunas ocasiones se presentaron
dudas con respecto a los siguientes
ítems:

Cambios en el apetito

Hábitos de sueño
No aplica
No se presentó
En algunas ocasiones se presentaron
dudas con respecto a los siguientes
ítems:

Sentimientos de castigo
A partir del criterio de Interjueces, se generó la versión final del Inventario (Ver Anexo 11),
respaldada por los cambios sugeridos por la Traducción Inversa y la Revisión Filológica.
76
Etapa 2: Pruebas con el Instrumento
En esta etapa, se procedió directamente a las pruebas de campo con el documento final,
corregido apropiadamente según todas las sugerencias y controles de la fase anterior. Los
resultados para cada fase se detallan a continuación:
Fase de pruebas piloto. Se les administró el cuestionario a 40 personas. La plantilla
trascrita con los datos de los participantes se adjunta en el Anexo 14. Se obtuvo un
promedio de duración de 11 minutos 52 segundos por cuestionario (5:59 consentimiento;
5:53 cuestionario). De acuerdo a la figura 2, la Comprensión de los ítems fue adecuada, en
tanto un 87% de los participantes no hicieron preguntas, un 10% una pregunta y un 3% más
de una pregunta.
Comprensión de items
10% 3%
No hace preguntas
Hace 1 pregunta
87%
Hace 2 o 3 preguntas
Figura 2: Comprensión de Ítems, Pruebas Piloto
Por su parte, la figura 3 denota que no hubo dificultades en lectoescritura sobresalientes,
siendo que un 90% no requirieron apoyo frente a un 10 % restante que si lo solicitó
Dificultades lectoescritura
10%
No requiere apoyo
90%
Requiere Apoyo en la
lectoescritura
Figura 3: Dificultades en Lectoescritura Pruebas Piloto
77
Fase de pruebas de campo
Estadísticos Descriptivos con población General
Los análisis descriptivos con respecto al total de la muestra de población general se
presentan a continuación. Para la población general se obtuvo una media de 9.68. Según la
Tabla 4, con respecto a la variable Sexo, del total de casos válidos, 297 corresponden a la
variable Masculino y 320 a la variable Femenino obteniendo un promedio de 9.76 y 9.54
respectivamente. Como se puede apreciar en la tabla 5, dichas diferencias no son
significativas.
Tabla 4: Diferencias de Medias por variable Sexo Población General
Sexo
N
Media
Desviación típ.
Error típ. de la media
Masculino
297
9.76
9.338
.542
Femenino
320
9.54
8.262
.462
Tabla 5: Pruebas T y Levene de medias para variable sexo. Población General
Prueba de
Prueba T para la igualdad de medias
Levene para la
igualdad de
varianzas
F
Sig.
5.194
.023
t
gl
Sig.
Difere
Error
95% Intervalo de
(bilat
ncia
típ. de
confianza para la
eral)
de
la
diferencia
media
diferen
Inferior
s
cia
Superior
.302
615
.763
.214
.709
-1.178
1.606
.300
592
.764
.214
.712
-1.184
1.612
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
78
Con respecto a los grupos de Edad, en la tabla 6 se aprecia las diferencias entre rangos de
edad. De la misma se puede apreciar como las diferencias entre promedios no son
sustanciales, siendo el más alto el del grupo de 66 años en adelante y el menor el de 45 a
55 años.
Tabla 6: Diferencias de medias por rangos de Edad Población General
GrupoEdad
N
Media
Desv. típ.
18-25
297
9.74
8.520
26-35
124
10.91
9.913
36-45
102
8.73
8.111
46-55
59
8.14
8.355
56-65
26
9.31
8.698
66 en adelante
4
15.25
15.564
Las diferencias por provincias se aprecian en la tabla 7. San José recoge el promedio más
alto y Alajuela el más bajo.
Tabla 7: Diferencias de medias por Provincia del GAM
Provincia
N
Media
Desv. típ.
San José
368
10.45
9.426
Alajuela
88
7.59
8.299
Cartago
76
8.83
5.963
Heredia
45
8.67
7.891
79
Por último con lo que corresponde a Nivel Educativo, la tabla 8 revela una sutil tendencia a
la disminución de los promedios arrojados por el BDI en cuanto se presenta un mayor nivel
educativo.
Tabla 8: Diferencias de medias por Variable Nivel Educativo
Nivel Educativo
N
Media
Desv. típ.
Primaria incompleta
6
17.50
14.433
Primaria completa
31
10.65
9.478
Secundaria incompleta
58
11.40
10.115
Secundaria completa
108
9.98
9.638
Estudios parauniversitarios
26
10.15
8.303
Universidad incompleta
243
9.29
8.233
Universidad Completa
135
8.73
8.188
Total
607
9.68
8.840
Estadísticos Descriptivos Cuestionarios Online
Con esta muestra de cuestionarios obtenidos de forma digital, según la Tabla 9 se registra
una media de 10.90 con una desviación estándar de 8.67 para 61 sujetos. De estos, 34
correspondían a la variable Masculino y 27 a la variable Femenino. A pesar de la sutil
diferencia entre medias para ambas variables, la diferencia entre las mismas según la Tabla
10 no es significativa.
Tabla 9: Diferencias de Medias por variable Sexo Muestra de cuestionarios On line
Sexo
N
Media
Desv. típ.
Masculino
34
10.32
7.888
Femenino
27
11.63
9.684
Total
61
10.90
8.677
80
Tabla 10 Pruebas T y Levene de Medias para variable Sexo. Muestra de cuestionarios On
line
Medias
BDI
Se han
asumido
varianzas
iguales
No se
han
asumido
varianzas
iguales
Prueba de
Levene para
la igualdad
de varianzas
Prueba T para la igualdad de medias
F
Sig.
t
.340
.562
gl
Sig.
(bilater
al)
Diferencia
de
medias
Error típ.
de la
diferencia
-.581
59
.564
-1.306
2.249
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-5.807
3.195
-.567
49.738
.573
-1.306
2.303
-5.932
3.320
Con respecto a la variable grupos de edad, tal como indica la Tabla 11, la media más alta es
obtenida por el grupo de 36 a 45 años y la más baja por el grupo de 46 a 55. Solo se registra
un caso de este último grupo. El grueso de la muestra se sitúa en los primeros grupos. La
muestra carece de sujetos en el grupo de 55 a 65 y de 66 en adelante.
Tabla 11: Diferencias de medias por rangos de Edad Muestra de cuestionarios On line
Grupo Edad
N
Media
Desv. típ.
18-25
30
10.40
7.850
26-35
25
11.40
9.115
36-45
5
12.20
13.217
46-55
1
7.00
.
Total
61
10.90
8.677
81
Finalmente en cuanto a diferencias por nivel educativo, en la tabla 12 se puede apreciar
como la muestra se concentra en las variables Universidad incompleta y Universidad
Completa. La mayor media es alcanzada por el grupo de Secundaria Completa y la menor
en el que corresponde a Estudios parauniversitarios.
Tabla 12 Diferencias de medias por Variable Nivel Educativo Cuestionarios On line
Nivel Educativo
N
Media
Desv. típ.
Secundaria completa
5
12.40
4.159
Estudios parauniversitarios
2
7.50
9.192
Universidad incompleta
26
10.54
8.434
Universidad Completa
28
11.21
9.708
Total
61
10.90
8.677
Estadísticos Descriptivos Población Clínica
Con población clínica según la Tabla 13 se desprende una media total en la puntuación del
BDI de 33.00, con una desviación estándar de 10.785 para los 79 casos válidos.
Tabla 13: Media Puntuación BDI población Clínica
N
Mínimo
Máximo
Media
Desv. típ.
Puntuación BDI-II
79
9
55
33.00
10.785
N válido (según lista)
79
Para la variable Sexo, en la Tabla 14para el total de los 79 casos válidos, se aprecian 11 de
la variable Masculino y 68 de la variable Femenino. Se denotan diferencias entre ambas
medias, siendo superior la de variable de sexo Femenino. No obstante a pesar que la tabla
15 considere que estas diferencias poseen significancia estadística, no es adecuado realizar
este tipo de inferencia a falta de una muestra mayor que garantice mayor comparabilidad.
82
Tabla 14: Diferencias de Medias por variable Sexo Población General
Puntuación
BDI-II
Sexo
N
Media
Desviación típ.
Error típ. de la media
Masculino
11
24.27
6.944
2.094
Femenino
68
34.41
10.662
1.293
Tabla 15 Pruebas T y Levene de medias para variable sexo. Población Clínica
Se han
asumido
varianzas
iguales
No se han
asumido
varianzas
iguales
Prueba
de
Levene para
la igualdad de
varianzas
F
Sig.
Prueba T para la igualdad de medias
t
gl
Sig.
(bilateral)
Diferencia
de medias
Error típ.
de
la
diferencia
4.178
-3.042
77
.003
-10.139
3.333
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-16.776 -3.502
-4.120
18.677
.001
-10.139
2.461
-15.295
.044
-4.983
Con respecto a la variable Edad, las medias en las puntuaciones por grupo de edad se
recogen en la tabla 16. En la misma se denota como el grupo que puntúa más alto es el de
26 a 35 años, mientras que el grupo más bajo es el de 56-65 años.
Tabla 16: Diferencias de medias por rangos de Edad Población Clínica
Grupo Edad
N
Media
Desv. típ.
18-25
8
32.63
11.856
26-35
18
35.44
9.919
36-45
15
30.67
12.670
46-55
15
33.33
9.092
56-65
11
30.64
13.801
66 en adelante
10
33.80
9.555
Total
77
32.91
10.910
83
En cuanto a Nivel educativo, tal como lo señala la tabla 17, hay una sutil disminución en
cuanto a la media en función de un mayor nivel educativo, mostrándose un aumento con la
variable Universidad completa.
Tabla 17: Diferencias de medias por Variable Nivel Educativo
Nivel Educativo
N
Media
Desv. típ.
Primaria incompleta
4
40.25
11.236
Primaria completa
16
31.06
12.751
Secundaria incompleta
12
31.67
11.404
Secundaria completa
9
34.11
9.413
Estudios parauniversitarios
3
31.00
6.245
Universidad incompleta
8
28.13
8.855
Universidad Completa
23
35.09
10.488
Total
75
32.93
10.786
84
Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento
Evidencias de Fiabilidad
Estabilidad de la Medida
La prueba test Retest, aplicada en 51 participantes de población general a un espacio de 15
días entre cada aplicación, tal como indica la Tabla 9 revela un coeficiente de correlación
de Pearson de .954 entre una aplicación y la otra. Este resultado indica que la prueba
presenta adecuados indicadores de Fiabilidad en cuanto a la Estabilidad de la Medida.
Tabla 18: Estadísticos de Fiabilidad Test Retest
Alfa de Cronbach
Correlacion entre formas
Correlacion Spearman-Brown
Parte 1
Valor
N de Items
Parte 2
Valor
N de Items
Total N de Items
.901
21
.935
21
42
.954
Longitud igual
.976
Longitud desigual
.976
Coeficiente de Guttman Dos mitades
.975
Homogeneidad de la Medida
Tal como indica la Tabla 19, los coeficientes Alfa de Cronbach presentan una alta
correlación delos ítems de la prueba entre sí, siendo suficiente para garantizar la fiabilidad
de la escala.
Tabla 19: Alpha de Crombach en las distintas muestras
Coeficiente Alfa de Crombach
Población General
.908
Cuestionarios En Línea
.891
Población Clínica
.885
85
Evidencias de Validez
Validez de Contenido
Se contó con 3 participantes expertos, dos Máster en psicología y un licenciado. Al
promediar la calificación de los tres y estandarizarlo en escala 0 a 1, el promedio final fue
de .84. Dicha media es un criterio aceptable que ofrece garantía de la validez de contenido
del instrumento.
Las puntuaciones para el resto de ítems se muestran en la tabla 20. En la misma se puede
apreciar que el ítem que recibe menor puntuación es Agitación, mientras que Tristeza,
Pesimismo, Disconformidad con mi mismo, Pensamientos o deseos de Suicidio, e Inutilidad
consiguieron puntuación perfecta por parte de los tres jueces.
Tabla 20: Promedio de Puntuaciones dadas por los jueces expertos a cada ítem
Reactivo
Puntuaciones
Puntuaciones
Puntuaciones
Promedio Total
Juez 1 (1-4)
Juez 2 (1-4)
Juez 3 (1-4)
(Escala 0-1)
Tristeza
4
4
4
1
Pesimismo
4
4
4
1
Fracasos del pasado
4
4
3
0,92
Pérdida de Satisfacción
3
4
3
0,83
Culpa
4
3
3
0,83
Sensación de Castigo
4
2
3
0,75
Disconformidad
4
4
4
1
Autocriticas
4
4
2
0,83
Suicidio
4
4
4
1
Llanto
4
2
3
0,75
Agitación
4
2
1
0,58
Perdida de Interés
4
4
3
0,92
Indecisión
4
3
3
0,83
Inutilidad
4
4
4
1
Energía
4
2
4
0,83
Sueño
4
2
3
0,75
Irritabilidad
4
3
2
0,75
Apetito
3
2
4
0,75
Concentración
4
2
3
0,75
Cansancio
4
3
3
0,83
Interes sexual
4
3
3
0,83
86
Validez Estructural
Para este estudio se llevaron a cabo dos tipos de análisis factoriales: Exploratorio y
confirmatorio para ambas muestras, General y Clínica.
Análisis Factorial Exploratorio
Población General
Tal como indica la Tabla 21 el test de esfericidad de Bartlet y la prueba KMO para
población general arrojan puntuaciones aceptables, para el test de adecuación muestral
(KMO) se considera una excelente adecuación muestral al superar el .9; el test de
esfericidad de Bartlett permite asumir el supuesto
de que las variables están
intercorrelacionadas y anuentes a un análisis factorial.
Tabla 21: KMO y Test de Esfericidad Bartlett Población General
Medida de Adecuación Muestral Kaiser Meyer Olkin
Test de Esfericidad de Bartlet
Chi cuadrado aproximado
.931
3.804E3
df
210
Sig.
.000
En la Tabla 22 se presenta los resultados del total de la varianza explicada por los dos
principales factores presentados. La extracción de componentes indica 2 autovalores
superior a 1 y por tanto 2 factores. Esto se ampara en la Figura 5 en la cual se aprecia como
a partir del segundo factor la línea se aplana. Dados estos dos criterios, se puede considerar
válida la presencia de dos factores que engloban el conjunto de reactivos.
87
Tabla 22: Total de la Varianza Explicada por los autovalores
Factor
Autovalores Iniciales
Total
% de
%
Varianza
Acumulativo
1
6.869
32.710
32.710
2
1.487
7.080
39.790
3
1.097
5.222
45.012
4
1.029
4.900
49.912
5
.867
4.130
54.042
6
.866
4.122
58.164
7
.838
3.989
62.154
8
.750
3.571
65.725
9
.728
3.468
69.193
10
.701
3.339
72.532
11
.671
3.196
75.728
12
.631
3.006
78.733
13
.620
2.951
81.684
14
.580
2.762
84.447
15
.551
2.624
87.071
16
.541
2.576
89.647
17
.510
2.429
92.076
18
.468
2.229
94.305
19
.416
1.979
96.284
20
.400
1.903
98.188
21
.381
1.812
100.000
Método de Extracción: Principal Axis Factoring
Sumas de la Extracción de
Cargas al Cuadrado
Total
% de
Varianza
6.226
29.646
.869
4.136
Sumas de la Rotación de
Cargas al Cuadrado
% Acumulativo
Total
29.646
33.782
5.636
4.867
Figura 4: Gráfico de Sedimentación
88
En las tablas: Matriz de Patrones (Tabla 23) y Matriz Estructural (Tabla 22), se aprecia el
peso de distribución de las cargas factoriales de cada ítem con respecto a los dos factores
mencionados. Por último, se presenta una correlación entre ambos factores de .655, dato
que evidencia una alta asociación entre ambos factores.
Tabla 24: Matriz de configuración
Tabla 23: Matriz Estructural
Componente
1
2
.644
.414
.644
.414
.634
.353
.519
.637
.544
.415
.687
.349
.717
.520
Componente
1
2
.653
.653
.706
.179
.519
.477
.102
.803
.660
.087
Tristeza
Pesimismo
Fracasos del pasado
Pérdida de Satisfacción
Sentimientos de culpa
Sensación de Castigo
Disconformidad con mi
mismo
Autocriticas
.632
.541
Pensamientos o
.789
.575
deseos de Suicidio
Llanto
.580
.323
Agitación
.572
.473
Pérdida de Interés
.473
.583
Indecisión
.533
.542
Inutilidad
.594
.499
Pérdida de Energía
.356
.761
Cambios en los
.441
.654
Hábitos de Sueño
Irritabilidad
.453
.574
Cambios en el Apetito
.525
.650
Dificultad de
.401
.656
Concentración
Cansancio o Fatiga
.449
.774
Pérdida de interés en
.644
.608
el sexo
Método de extracción: Análisis de
componentes principales.
Método de rotación: Normalización Promax
con Kaiser.
Tristeza
Pesimismo
Fracasos del pasado
Pérdida de Satisfacción
Sentimientos de culpa
Sensación de Castigo
Disconformidad con mi
mismo
Autocriticas
.488
.221
Pensamientos o deseos
.722
.102
de Suicidio
Llanto
.645
Agitación
.459
.172
Pérdida de Interés
.160
.479
Indecisión
.312
.338
Inutilidad
.468
.192
Pérdida de Energía
.924
Cambios en los Hábitos
.641
de Sueño
Irritabilidad
.134
.486
Cambios en el Apetito
.175
.535
Dificultad de
.689
Concentración
Cansancio o Fatiga
.841
Pérdida de interés en el
.430
.327
sexo
Método de extracción: Análisis de
componentes principales.
Método de rotación: Normalización Promax
con Kaiser.
Tabla 25: Matriz de correlaciones de componentes
Componente
1
2
1
1.000
.655
2
.655
1.000
Método de extracción: Análisis de componentes
principales.
Método de rotación: Normalización Promax con Kaiser.
89
Población Clínica
Tal como indica la Tabla 26el test de esfericidad de Bartlett y la prueba KMO para
población general arrojan puntuaciones aceptables.
Tabla 26: KMO y Test de Esfericidad Bartlett Población Clínica
Medida de adecuación muestral de Kaiser-Meyer-Olkin.
.808
Prueba de esfericidad de
Chi-cuadrado aproximado
583.075
Bartlett
gl
210
Sig.
.000
En la Tabla 27 se presenta los resultados del total de la Varianza explicada por los dos
principales factores presentados. La extracción de componentes indica 2 autovalores
superior a 1 y por tanto 2 factores.
Tabla 27: Total de la Varianza Explicada por autovalores
Autovalores iniciales
Total
1
2
3
6.645
1.608
1.462
% de la
varianza
31.644
7.655
6.964
%
acumulado
31.644
39.299
46.262
4
1.260
6.000
52.263
5
1.161
5.528
57.791
6
1.049
4.997
62.787
7
.963
4.587
67.375
8
.902
4.294
71.668
9
.769
3.664
75.332
10
.719
3.424
78.757
11
.686
3.267
82.024
12
.576
2.742
84.766
13
.515
2.451
87.217
14
.478
2.278
89.495
15
.435
2.069
91.564
16
.392
1.868
93.433
17
.377
1.794
95.227
18
.327
1.556
96.783
19
.288
1.372
98.155
20
.229
1.090
99.245
21
.159
.755
100.000
Sumas de las saturaciones al
cuadrado de la extracción
Total
% de la
%
varianza
acumulado
6.645
31.644
31.644
1.608
7.655
39.299
Suma de la rotación de
las cargas al cuadrado
Total
5.604
5.465
Método de extracción: Análisis de Componentes principales.
90
En las tablas: Matriz de Configuración (Tabla 28) y Matriz Estructural (Tabla 29), se
aprecia el peso de distribución de las cargas factoriales de cada ítem con respecto a los dos
factores mencionados. Por último, se presenta una correlación entre ambos factores de .559,
dato que evidencia asociación entre ambos factores.
Tabla 28 Matriz de Configuración
1
2
Tristeza
.521
.220
Pesimismo
.800
Fracasos del pasado
.621
Perdida de Satisfacción
.587
Sentimientos de culpa
.488
.195
Sensación de Castigo
.879
Disconformidad con mi
.534
.065
mismo
Autocriticas
.579
.153
Pensamientos o deseos
.414
.148
de Suicidio
Llanto
.236
.371
Agitación
.305
Perdida de Interés
.060
.636
Indecisión
.258
.462
Inutilidad
.617
.071
Perdida de Energía
.800
Cambios en los Hábitos
.266
.344
de sueño
Irritabilidad
.359
.314
Cambios en el Apetito
.227
.428
Dificultad de
.719
Concentración
Cansancio o Fatiga
.135
.628
Perdida de interés en el
.708
sexo
Método de extracción: Análisis de componentes
principales.
Método de rotación: Normalización Promax con
Kaiser.
a. La rotación ha convergido en 3 iteraciones.
91
Tabla 29: Matriz Estructural
Componente
1
2
.644
.511
.713
.292
.593
.297
.318
.581
.597
.468
.676
.129
.571
.364
Tristeza
Pesimismo
Fracasos del pasado
pérdida de Satisfacción
Sentimientos de culpa
Sensación de Castigo
Disconformidad con mi
mismo
Autocriticas
.665
.477
Pensamientos o deseos
.497
.380
de Suicidio
Llanto
.444
.503
Agitación
.332
.218
pérdida de Interés
.416
.670
Indecisión
.517
.606
Inutilidad
.656
.416
pérdida de Energía
.424
.787
Cambios en los Hábitos
.458
.493
de sueño
Irritabilidad
.534
.515
Cambios en el Apetito
.466
.555
Dificultad de
.273
.647
Concentración
Cansancio o Fatiga
.487
.704
pérdida de interés en el
.131
.560
sexo
Método de extracción: Análisis de componentes
principales.
Método de rotación: Normalización Promax con
Kaiser.
Tabla 30: Matriz de correlaciones de componentes
Componente
1
2
1
1.000
.559
2
.559
1.000
Método de extracción: Análisis de componentes principales.
Método de rotación: Normalización Promax con Kaiser.
92
Análisis Factorial Confirmatorio
Tanto en el análisis factorial exploratorio de la población general como en la población
clínica, se sugiere que dos factores asumen la distribución de las cargas factoriales de todos
los reactivos. Una posible previsualización de los mismos propuesto por ambos análisis
factoriales exploratorios se presentaría de esta forma:
Agrupación de ítems Muestra General



Factor 1: Tristeza, Pesimismo, Fracasos del pasado, Culpa, Castigo,
Disconformidad con mi mismo, Autocriticas, Suicidio, Inutilidad, Agitación, Llanto
Factor 2: Perdida de satisfacción, Perdida de Interés, Cambios en Sueño, Perdida de
Energía, Cambios en Apetito, Concentración, Cansancio, Irritabilidad,
Ambos: Sexo, Indecisión.
Agrupación de ítems Muestra Clínica



Factor 1: Tristeza, Pesimismo, Fracasos del pasado, Culpa, Castigo,
Disconformidad con mi mismo, Autocriticas, Suicidio, Inutilidad, Irritabilidad,
Agitación
Factor 2: Perdida de satisfacción, Perdida de Interés, Cambios en Sueño, Perdida de
Energía, Cambios en Apetito, Concentración, Cansancio, Indecisión, Sexo
Ambos: Llanto
De esta manera, los ítems en el factor 1 en ambas muestras hacen referencia a categorías
del tipo cognitivo y emocional a nivel general principalmente por la Rumiación negativa
(Fracasos del Pasado, Culpa, Ideación suicida), Visión Negativa de la Realidad (Tristeza,
Pesimismo,) y Autoestima (Disconformidad con mi mismo, Autocriticas e Inutilidad)
Mientras que en el factor 2 se referencia directamente a cualidades relacionadas con la
inactivación conductual como el hacer actividades (dormir, comer, prácticas sexuales),
motivación para hacer actividades (Satisfacción e Interés) Energía para realizarlas (Perdida
de energía, Cansancio o Fatiga) y el Inicio y desarrollo de tareas (Concentración e
Indecisión). Por tanto antes de proceder con el análisis factorial confirmatorio se propone
para los ítems del factor 1 la variable latente Cognitivo/Emocional y para los
correspondientes al factor 2 la variable latente Conductual/Fisiológico.
Desde este modelo entonces, el constructo de Depresión implícito en el BDI-II podría estar
entendiendo Depresión por la mediación tanto de pensamientos y emociones negativas en
conjunto con la indisposición conductual/fisiológica a realizar actividades. Los resultados
del Análisis Factorial Confirmatorio reafirman la distribución de las cargas factoriales con
significancia estadística en los dos factores.
93
Población General
En la Tabla 31 se denota que todos los pesos son estadísticamente significativos con un
nivel de confianza del 95% puesto que en todos los casos la relación crítica (R.C.) de la
desviación estándar (D.E.) es superior a 1.96. En todos los ítems, p < .001.
Tabla 31: Pesos de Regresión por factores
Estimado
D.E.
R.C.
P
Tristeza
<---
Cognitivoemocional
1,000
Pesimismo
<---
Cognitivoemocional
1,328
,110
12,028
***
Fracasos
<---
Cognitivoemocional
1,604
,138
11,640
***
Culpa
<---
Cognitivoemocional
1,149
,106
10,842
***
Castigo
<---
Cognitivoemocional
1,929
,158
12,211
***
Disconformidad
<---
Cognitivoemocional
2,166
,158
13,676
***
Autocriticas
<---
Cognitivoemocional
1,952
,154
12,685
***
Suicidio
<---
Cognitivoemocional
1,195
,082
14,652
***
Inutilidad
<---
Cognitivoemocional
1,254
,102
12,287
***
Agitación
<---
Cognitivoemocional
1,731
,152
11,407
***
Llanto
<---
Cognitivoemocional
1,695
,159
10,634
***
Satisfaccion
<---
ConductualFisiologico
1,000
Interés
<---
ConductualFisiologico
1,138
,095
11,926
***
Sueño
<---
ConductualFisiologico
1,210
,097
12,526
***
Energía
<---
ConductualFisiologico
1,074
,082
13,093
***
Apetito
<---
ConductualFisiologico
1,327
,100
13,236
***
Concentración
<---
ConductualFisiologico
1,083
,089
12,114
***
Cansancio
<---
ConductualFisiologico
1,296
,092
14,031
***
Irritabilidad
<---
ConductualFisiologico
,936
,081
11,588
***
Indecisión
<---
ConductualFisiologico
1,296
,109
11,924
***
Interessexual
<---
ConductualFisiologico
1,100
,080
13,822
***
En cuanto a los pesos factoriales para la solución estandarizada, vienen representados en la
Tabla 32. Los mismos arrojan indicadores estadísticamente aceptables en cuanto a la
vinculación con su respectivo factor teóricamente asumido.
94
Tabla32: Pesos de Regresiónestandarizados
Tristeza
Pesimismo
Fracasos
Culpa
Castigo
Disconformidad
Autocriticas
Suicidio
Inutilidad
Agitación
Llanto
Satisfaccion
Interés
Sueño
Energía
Apetito
Concentración
Cansancio
Irritabilidad
Indecisión
Interessexual
<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<---
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
Estimado
,593
,585
,561
,513
,597
,698
,628
,774
,602
,546
,501
,625
,558
,592
,625
,634
,568
,683
,539
,558
,670
La Tabla 33 muestra las covarianzas entre ambos factores, presentando un estimado de .083
(estadístico aceptable) con una desviación estándar de .008. La covarianza entre ambos
factores es significativamente diferente de cero, al nivel de 0.001 (a dos colas). Y en la
tabla 34 las correlaciones entre ambos factores, siendo estimada en .861.
Tabla 33: Covarianzas entre Factores
Cognitivoemocional
<-->
ConductualFisiologico
Estimado
D.E.
R.C.
P
,083
,008
9,866
***
Tabla 34: Correlaciones entre Factores
Estimado
Cognitivoemocional
<-->
ConductualFisiologico
,861
95
Población Clínica
Los resultados del Análisis Factorial Confirmatorio en la muestra Clínica deben
interpretarse con precaución ya que se dispuso de una muestra de 79 observaciones, siendo
recomendable para el BDI-II una de 105 (5 observaciones por cada variable por 21 del total
de ítems del BDI, según Arias, 2008). En la Tabla 35 se denota que todos los pesos son
estadísticamente significativos con un nivel de confianza del 95% siendo que en todos los
casos la relación crítica (R.C.) de la desviación estándar (D.E.) es superior a 1.96. En todos
los ítems, p < .001.
Tabla 35: Pesos de Regresión por factores
Tristeza
Pesimismo
Fracasos
Culpa
Castigo
Disconformidad
Autocriticas
Suicidio
Inutilidad
Irritabilidad
Agitacion
Llanto
Satisfaccion
PerdidaInteres
Sueño
Energia
Apetito
Concentracion
Cansancio
Indesicion
Interessexual
<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<---
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
Estimado
1,000
1,005
,922
,953
1,203
1,000
1,269
,755
1,125
1,147
,533
1,055
1,000
1,524
1,063
1,492
1,280
1,117
1,599
1,345
1,004
D.E.
R.C.
P
,237
,246
,214
,319
,246
,257
,204
,245
,269
,226
,276
4,238
3,749
4,444
3,776
4,060
4,946
3,703
4,590
4,269
2,356
3,828
***
***
***
***
***
***
***
***
***
,018
***
,380
,304
,340
,353
,294
,373
,350
,351
4,012
3,500
4,385
3,630
3,796
4,283
3,840
2,864
***
***
***
***
***
***
***
,004
En cuanto a los pesos factoriales para la solución estandarizada, vienen representados en la
Tabla 36. Los mismos arrojan indicadores estadísticamente aceptables en cuanto a la
vinculación con su respectivo factor teóricamente asumido.
96
Tabla36: Pesos de Regresión estandarizados
Tristeza
Pesimismo
Fracasos
Culpa
Castigo
Disconformidad
Autocriticas
Suicidio
Inutilidad
Irritabilidad
Agitacion
Llanto
PerdidaInteres
Sueño
Energia
Apetito
Concentracion
Cansancio
Indesicion
Interessexual
<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<---
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
CognitivoEmocional
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
Estimado
,629
,565
,489
,599
,493
,537
,686
,482
,623
,570
,294
,501
,629
,510
,738
,538
,575
,705
,586
,390
La Tabla 37 muestra las covarianzas entre ambos factores, presentando un estimado de .161
con una desviación estándar de .051. La covarianza entre ambos factores es
significativamente diferente de cero, al nivel de 0.001 (a dos colas). Y en la tabla 38 las
correlaciones entre ambos factores, siendo estimada en .781.
Tabla 37: Covarianzas entre Factores
CognitivoEmocional
<-->
ConductualFisiologico
Estimado
,161
D.E.
,051
R.C.
3,183
P
,001
Tabla 38: Correlaciones entre Factores
CognitivoEmocional
<-->
ConductualFisiologico
Estimado
,781
97
Validez Convergente y Divergente
Población General
Como indica la Tabla 39, los análisis de correlaciones de Pearson entre las pruebas
mencionadas sugieren correlaciones positivas entre el BDI-II con el MDI y la escala de
Afecto Negativo del PANAS (.828 y .690 respectivamente) con significancia estadística a
dos colas. Por otro lado, entre el BDI II y la escala de Afecto Positivo existe discrepancia
ya que correlacionan de forma negativa entre ambas con un coeficiente de correlación de
Pearson de -.278 a una significancia estadística de dos colas.
De esta forma las puntuaciones del BDI concuerdan con los resultados arrojados por sus
homólogos MDI y escala de Afecto Negativo de PANAS, y se distancia de los resultados
de la escala de Afecto Positivo del PANAS.
Tabla 39: Correlaciones entre BDI-II, MDI y PANAS Población General
BDI
BDI
Correlacion de Pearson
1
Afecto
Positivo
Negativo
MDI
-.278**
.690**
.828**
.000
.000
.000
249
219
228
203
-.278**
1
-.072
-.412**
.292
.000
Sig. (bilateral)
N
Afecto
Afecto
Correlacion de Pearson
Positivo
Sig. (bilateral)
.000
N
219
226
217
188
.690**
-.072
1
.704**
Afecto
Correlacion de Pearson
Negativo
Sig. (bilateral)
.000
.292
N
228
217
235
199
.828**
-.412**
.704**
1
Sig. (bilateral)
.000
.000
.000
N
203
188
199
MDI
Correlacion de Pearson
.000
211
**. La correlación es significativa al nivel 0,01 (bilateral).
98
Población Clínica
En cuanto a Validez Convergente, según la tabla 40 las correlaciones entre el BDI y la
escala de Afecto Negativo relatan una fuerte asociación entre ambas con un coeficiente de
correlación de Pearson de .877. A su vez con el MDI se delata un .675, confirmando la
fuerte asociación entre ambas.
En esta línea, la escala de Afecto Negativo también correlaciona de forma positiva con el
MDI, señalando un .716 como coeficiente.
Con respecto a Validez Divergente, la escala de Afecto Positivo discrepa fuertemente con
las otras mediciones, siendo correlaciones negativas en todos los casos: -.813, -.846 y -840
para el BDI, la escala de Afecto Negativo y el MDI respectivamente.
Tabla 40: Correlaciones entre BDI-II, MDI y PANAS Población Clínica
BDI
BDI
Correlación de Pearson
1
Sig. (bilateral)
N
Afecto
Correlación de Pearson
Positivo
Sig. (bilateral)
N
Afecto
Correlación de Pearson
Negativo
Sig. (bilateral)
N
MDI
Correlación de Pearson
Sig. (bilateral)
N
30
-.813**
Afecto
Afecto
MDI
Positivo
Negativo
-.813**
.877**
.675**
.000
.000
.000
30
30
30
1
-.846**
-.840**
.000
.000
.000
30
30
30
30
.877**
-.846**
1
.716**
.000
.000
30
30
30
30
.675**
-.840**
.716**
1
.000
.000
.000
30
30
30
.000
30
**. La correlación es significativa al nivel 0,01 (bilateral).
99
Validez Diagnóstica
La tabla 41 muestra las diferencias de medias entre ambos grupos de muestras, Población
general y clínica. Para la muestra de Población General se seleccionó al azar un conjunto de
79 personas, con el objetivo de que fuese homologable con su correspondiente en la
muestra clínica de igual cantidad. De esta tabla se desprende la diferencia de medias, la
tabla 42 muestra como la diferencia entre las mismas es estadísticamente significativa.
Tabla 41: Medias y desviaciones estándares de las puntuaciones del BDI-II por muestra
Muestra
N
Media
Desviación típ.
Error típ. de la media
Población General
79
9.09
9.292
1.045
Población Clínica
79
33.00
10.785
1.213
Tabla 42: Prueba T para muestras independientes medias por muestra
Prueba de
Levene para la
igualdad de
varianzas
F
Sig.
Se han
asumido
varianza
s iguales
No se
han
asumido
varianza
s iguales
3.525
.062
Prueba T para la igualdad de medias
t
gl
Sig.
(bila
teral
)
Diferen
cia de
medias
Error típ.
de la
diferenci
a
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-14.930
156
.000
-23.911
1.602
-27.075
-20.748
-14.930
152.661
.000
-23.911
1.602
-27.076
-20.747
En concordancia con la figura 6 donde se muestra la Curva COR, en la tabla 43 se muestra
que el Área bajo la Curva es de .937 siendo esta aceptable. Obteniendo las coordenadas de
la Curva COR y convirtiéndolas a porcentajes, en la tabla 43 se muestra la sensibilidad y
especificidad para los puntos de corte del BDI-II en función de su discriminación entre
pacientes con depresión y muestra General. El punto de corte que corresponde a 14,50
ofrece una sensibilidad de 95,5% y una especificidad de 73,1%. Por tanto, según la muestra
participante de esta investigación, una puntuación por encima de 15 se puede considerar un
100
buen criterio para identificar alrededor del 95% individuos con Depresión correctamente y
siendo menor a esta ofrece un estimado de discriminación de alrededor del 75% de
individuos sin Depresión.
Figura 5: Curva COR
Tabla 43: Área bajo la curva
Área
Error típ.a
Sig. asintóticab
Intervalo de confianza asintótico al 95%
Límite inferior
.937
.020
.000
.897
Límite superior
.977
a. Bajo el supuesto no paramétrico
b. Hipótesis nula: área verdadera = 0,5
101
Tabla 44: Porcentajes de Sensibilidad, especificidad para la detección de Depresión
Mayor para cada punto de corte del BDI-II
Positivo si es mayor o igual
quea
Sensibilidad (en %)
Especificidad (en %)
-1,00
100
0
,50
100
11,9402985
1,50
100
17,9104478
2,50
100
23,880597
3,50
100
31,3432836
4,50
100
38,8059701
5,50
100
44,7761194
6,50
100
52,238806
7,50
100
58,2089552
8,50
100
61,1940299
9,50
98,5074627
67,1641791
11,00
98,5074627
68,6567164
12,50
97,0149254
68,6567164
13,50
97,0149254
71,641791
14,50
95,5223881
73,1343284
15,50
94,0298507
77,6119403
16,50
94,0298507
79,1044776
17,50
94,0298507
83,5820896
18,50
91,0447761
83,5820896
19,50
88,0597015
85,0746269
20,50
86,5671642
86,5671642
21,50
82,0895522
88,0597015
22,50
79,1044776
89,5522388
23,50
77,6119403
89,5522388
25,00
73,1343284
89,5522388
26,50
68,6567164
92,5373134
27,50
65,6716418
92,5373134
28,50
64,1791045
94,0298507
29,50
61,1940299
95,5223881
30,50
61,1940299
97,0149254
31,50
58,2089552
97,0149254
32,50
53,7313433
97,0149254
33,50
50,7462687
97,0149254
34,50
44,7761194
97,0149254
35,50
43,2835821
97,0149254
36,50
37,3134328
98,5074627
37,50
29,8507463
98,5074627
38,50
26,8656716
98,5074627
102
39,50
23,880597
98,5074627
40,50
22,3880597
98,5074627
41,50
19,4029851
98,5074627
42,50
19,4029851
100
43,50
17,9104478
100
44,50
14,9253731
100
45,50
13,4328358
100
46,50
10,4477612
100
47,50
8,95522388
100
51,50
2,98507463
100
56,00
0
100
a. El menor valor de corte es el valor de contraste observado mínimo menos 1,
mientras que el mayor valor de corte es el valor de contraste observado máximo más
1. Todos los demás valores de corte son la media de dos valores de contraste
observados ordenados y consecutivos.
Por último, en la tabla 45 se muestra una propuesta de agrupación de ambas muestras
general y clínica (n: 79 para cada una) en la cual se indican 4 puntos de corte, de la misma
forma que con el BDI-II original. Dicha agrupación obedece a una distribución por
percentiles, colocando en cada rango el 25% de la muestra. El mismo queda de la siguiente
forma:
Tabla 45: Propuesta de Puntos de Corte para Costa Rica
Puntos de Corte
Rango Mínimo
Puntuación de 0 a 7
Rango Leve
Puntuación de 8 a 20
Rango Moderado
Puntuación de 21 a 34
Rango Severo
Puntuación de 34 a 63
103
Conclusiones
ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE
DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA
104
CONCLUSIONES
Al finalizar este proyecto de investigación, se obtuvieron distintas conclusiones y
recomendaciones sobre el trabajo realizado.
Conclusiones
Al finalizar el estudio, se consiguió cumplir con satisfacción cada uno de los objetivos
propuestos. El logro de los mismos se detalla a continuación.
Con respecto al Objetivo General, se obtuvo satisfactoriamente una adaptación de la
segunda versión del Inventario de Depresión de Beck con la muestra utilizada en población
General y Clínica. Dado que los índices de validez y fiabilidad obtenidos presentan
propiedades psicométricas adecuadas, se recomienda su uso clínico e investigativo.
Además se cumple con la hipótesis de Investigación H1, ya que los resultados obtenidos
fueron similares con respecto a los obtenidos de las adaptaciones realizadas en otros
contextos, y poseen significancia estadística adecuada en los índices de validez y fiabilidad.
Según investigaciones revisadas, en otros contextos adaptaciones del BDI-II han obtenido
coeficientes Alfa de Cronbach que varían en un rango de .83 a .96 (Wang & Gorenstein,
2013., Beck, Steer y Brown, 1996., Aasen, 2001., Musawi, 2001., Arnason, 2008) de tal
forma al obtenerse un .908 y .885 para muestras general y clínica se mantiene en este
rango.
Con respecto al procedimiento Test Retest, investigaciones realizadas en el ámbito
internacional arrojan correlaciones Pearson entre los .76 y .96 con un promedio en el
intervalo de re aplicación de 2 semanas. (Un rango de 1 semana a 6 meses) (Wang &
Gorenstein, 2013., Gorenstein, Wang, Argimon, Werlang, 2011., Kapci, Uslu, Turkcapar,
Karaoglan, 2008., Sprinkle, Lurie, Insko, Atkinson, Jones, Logan, 2002., Ghassemzadeh H,
Mojtabai R, Karamghadiri N, Ebrahimkhani N, 2005) al obtenerse un coeficiente de
105
correlación de Pearson de .954 en el presente estudio, se asegura la estabilidad de la medida
incluso muy por encima de la mayoría de las investigaciones.
Con el primer objetivo específico, vinculado con la traducción del inventario, se logró una
adecuada traducción de los ítems de su original en inglés, participando en este proceso
distintas técnicas para triangular y garantizar la calidad de la traducción final, entre ellas la
incorporación de traducciones paralelas y traducción inversa, expertos tal como propone
Geissenger (1994).
Para el segundo objetivo, concerniente a una revisión según el criterio Interjueces, se
posibilitó una revisión del documento por medio de dos fuentes, Población General y
Jueces Expertos. Si bien es cierto, la investigación se inscribe dentro de los lineamientos de
la Teoría Clásica de los Tests, al procurar enfatizar en las garantías de validez y fiabilidad
del instrumento, un aspecto de gran relevancia fue el aporte del método de Entrevista
Cognitiva, propia de la Teoría de Respuesta al Ítem, como enriquecimiento a la
investigación. De esta forma se realiza un aporte metodológico importante al considerar la
perspectiva de personas con niveles socio demográficos variados en la adaptación presente.
Este aporte se posiciona como un procedimiento adicional al proyecto.
De esta manera al modificar la prueba según la valoración de las indicaciones ofrecidas por
los jueces se consiguió el tercer objetivo satisfactoriamente, siendo este el correspondiente
a la obtención de la versión final de la prueba, inserta en el Anexo 11. Esta revisión incluye
una revisión filológica de la estructura gramatical de las distintas oraciones que conforman
el cuerpo de reactivos.
El cuarto objetivo, propiamente la comprensión de los ítems por parte de los participantes
en la prueba piloto fue aceptable, denotándose del mismo una adecuada comprensión y
lectura de los ítems. Esto permite asegurar una adecuada comprensión de los mismos por
parte de futuros pacientes o participantes.
Al proceder con el quinto objetivo, aplicar la versión definitiva a una muestra de personas
residentes del GAM, se utilizaron dos muestras una clínica y otra general, las cuales
obtuvieron promedios muy distintos, según lo esperado. De forma adicional al proyecto se
106
utilizó una muestra de cuestionarios administrados online. Esta muestra obtuvo
puntuaciones similares a las del resto de la Muestra de Población General. Representa esto
un aliciente para futuras investigaciones desde las que se puede plantear el uso de
cuestionarios en línea, dadas sus ventajosas condiciones de administración. Según indican
los hallazgos de esta investigación sus desventajas radicarían en que es difícil encontrar
participantes con edades de 55 años o más, además de personas únicamente con estudios de
primaria, y demás población con difícil acceso a internet, sesgando la investigación. Es
necesario estudiar a futuro esta posibilidad.
Los resultados deslegitiman la creencia académica de que las mujeres se deprimen más que
los hombres y la intensidad de la misma es superior (Berenzon, S., Tiburcio, M., MedinaMora, M. 2005., Caraveo, Colmenares y Saldivar, 1999., De la Fuente, Medina-Mora y
Caraveo, 1997). Apoyando más lo obtenido en otras adaptaciones del BDI en las cuales al
parecer a pesar de que se notan diferencias sutiles, las mismas no son significativas (Kapci,
Uslu, Turkcapar, Karaoglan, 2008., Lipps, Lowe, Young, 2007)
Un hallazgo sugerente es la posible relación entre la variable nivel educativo e intensidad
de Depresión. Según lo encontrado, a menor nivel educativo las puntuaciones del BDI-II
tienden a aumentar. Esto concuerda con lo encontrado por otros autores en distintas
investigaciones (Üstün, Sartorius, 1995., Burvill, 1995, Zung, Broadhead, Roth, 1993),
según las cuales a menor nivel educativo la intensidad de la sintomatología depresiva
aumenta.
Con respecto al sexto y último objetivo específico, relacionado con corroborar los criterios
de validez y fiabilidad resultantes de la prueba, esta ofrece adecuados indicadores de
validez y fiabilidad. Estos resultados indican una alta correlación de los ítems de la prueba
entre sí, siendo suficiente para garantizar la fiabilidad de la escala. Se garantiza la
consistencia interna de la misma, para ambas poblaciones con las que se trabajó.
Con respecto a la validez de contenido, la prueba en su estructura posee legitimación
científica y académica, siendo puntuada por los evaluadores de forma positiva. Algunas de
las deficiencias inherentes del instrumento apuntadas por los jueces radican en que no
107
incorporan aspectos interpersonales vinculadas a la depresión, como el retraimiento, la
adicción al trabajo, consumo de sustancias y demás.
Se encontró una estructura factorial similar a la planteada por Beck y colaboradores en su
estudio inicial, difiriendo en agregar al factor 2 un componente más conductual
motivacional. Así, los ítems en el factor 1 en ambas muestras hace referencia a categorías
del tipo cognitivo y emocional. Mientras que en el factor 2 se referencia directamente a
cualidades relacionadas con la inactivación conductual y baja motivación. El BDI-II podría
estar interpretando Depresión como un resultado de la suposición tanto de pensamientos y
emociones negativas en conjunto con la indisposición conductual/fisiológica a realizar
actividades. Los resultados del Análisis Factorial Confirmatorio reafirman la distribución
de las cargas factoriales con significancia estadística en los dos factores.
Arnason (2008), Beck, Steer y Brown (1996) y Lipps GE, Lowe GA, Young R. (2007);
también documentan el hallazgos de dos factores en el test, todos estos investigadores
hablan de uno “Cognitivo-afectivo” y otro “somático”. Las correlaciones entre factores
apuntan a r = 0.62 y 0.66 Para estudiantes y pacientes respectivamente en el estudio inicial
de Beck y colaboradores (Beck, Steer y Brown, 1996)
Con respecto a la distribución factorial del BDI surge un cuestionamiento que puede abrir
pie a investigaciones futuras. Por un lado los pesos factoriales de cada ítem se distribuyen
significativamente para cada uno de los dos componentes, siendo consecuente con lo
encontrado por Beck y colaboradores (1994) en su estudio inicial. No obstante tal como
indica la tabla 22, un 32.710%
de la varianza es explicada por el componente 1,
mostrándose a continuación un drástico descenso en el componente 2 a 7.080%. La
incógnita de esto se concibe a que en función de los datos obtenidos, sería igual de válido
asumir que es mejor hablar de un único factor, al mismo tiempo que es igual de valido
hablar de dos factores. La pregunta a si es o no el BDI II un instrumento unitario en cuanto
a su constructo o más bien puede hablarse de una estructura factorial inserta se mantiene
aún sin respuesta.
Las puntuaciones del BDI concuerdan con los resultados arrojados por sus homólogos MDI
y escala de Afecto Negativo de PANAS en ambas poblaciones general y clínica, y se
108
distancian de los resultados de la escala de Afecto Positivo del PANAS. Esto favorece
asegurar que el constructo de Depresión como criterio está siendo compartido en buena
parte con otras pruebas, en este caso el MDI. Y que se distancia de pruebas que miden
conceptos opuestos al de la Depresión como la escala de afecto Positivo del PANAS.
Según Wang, & Gorenstein (2013), en otras investigaciones, se han encontrado coeficientes
de correlación de Pearson que van desde 0.66 a 0.86 para distintas pruebas utilizadas
(Hamilton Depression Rating Scale (HAM-D), the Zung Self-Rating Depression Scale
(SDS), the Montgomery-Asberg Depression Rating Scale (MADRS), and the Geriatric
Depression Scale (GDS) siendo las puntuaciones con el MDI y la escala de Afecto
Negativo del PANAS (.828 y .690 respectivamente para población general y .675 y .877 en
población clínica) aceptables. Wang, & Gorenstein (2013), aportan que en estudios en otras
latitudes, con respecto a validez discriminante, se oscila en un rango de .37 a .83; con una
media de .50. Para este estudio se obtuvieron correlaciones con la Escala de Afecto Positivo
del PANAS de -.278 y -.813 para población general y clínica respectivamente, superando
lo obtenido en otras investigaciones.
Se corroboró que la adaptación del BDI-II permite diferenciar entre personas con Depresión
y personas sin diagnóstico de la misma, ya que las puntuaciones entre ambas muestras se
distancian bastante.
No solamente existe diferencia entre medias en cuanto a las poblaciones general y clínica,
sino también con respecto a la varianza de las mismas. Las Tabla 4, 6, 7 y 8 indican una
desviación típica muy cercana e incluso en ocasiones superior a la media. De este modo, los
estadísticos descriptivos de Población General cuentan con altas dispersiones, siendo un
comportamiento que refleja gran heterogeneidad en la muestra situación esperable en la
misma pues, al no contar con muchos criterios de inclusión facilita la dispersión. Mientras
que en las tablas 14, 16 y 17 la distribución suele ser más homogénea al ser menor las
desviaciones estándar con respecto a las medias, esto se debe por tratarse de una muestra
representativa de un constructo específico.
Los porcentajes de Especificidad y Sensibilidad obtenidos permitirían a futuro amoldar el
uso de la misma en función de las necesidades propias, si es necesaria la detección de
109
mayor número de personas con la sintomatología en función, entonces el umbral de
sensibilidad debe ser mayor. Para estudios de investigación en los cuales se propone
obtener mayor pureza en el diagnóstico de depresión de un grupo de personas con algún
trastorno, es necesario priorizar la discriminación a partir de mayor especificidad. Los
rangos de severidad de Depresión propuestos posibilitan a su vez estimar un acercamiento
categórico de la intensidad de Depresión en algún individuo evaluado.
Por último, la metodología propuesta por Geissenger utilizada en este estudio demostró ser
definitoria en la consecución de los resultados finales. Un alcance indirecto de esta
investigación es la validación de la metodología como una propuesta sólida en la
adaptación de pruebas y a la vez la flexibilidad de la misma metodología en la
complementación con otras técnicas como la Entrevista Cognitiva.
Limitaciones
Las limitaciones se dividen en dos, las concernientes al proceso metodológico de
adaptación y las relacionadas con el instrumento per se.
Con respecto al proceso metodológico, la principal limitación del estudio está relacionada
con lo correspondiente a la muestra de Población clínica. Una parte importante de la misma
se consiguió principalmente por colaboración de la Caja Costarricense de Seguro Social.
Para obtener los permisos con la misma, el comité de bioética exige una serie de requisitos
necesarios para la Investigación. El proceso de aprobación por parte del comité conlleva
meses, una vez aprobada la propuesta por parte del comité la posibilidad de tiempo para
reunir datos de población clínica estuvo reducida. Con más tiempo se hubiese reunido una
muestra mayor.
Algunas limitaciones metodológicas propias del proyecto subyacen a la falta de
representatividad estadística en la población general, utilizando en su mayoría datos del
Gran Área Metropolitana. Realizar estudios con mayor representatividad favorece la
credibilidad científica y el uso de distintos procedimientos estadísticos.
110
También se destaca la carencia de cuestionarios adaptados al país relacionados con el
constructo de Depresión. De lo contrario, contar con los mismos hubiese permitido mayor
solidez en los resultados de Validez Convergente, al posibilitar un instrumento que se
acerque lo suficiente al constructo. De igual forma, es difícil encontrar pruebas con
indicadores de validez y fiabilidad solidas en el país. Realizar pruebas de Validez
Divergente atraviesa estas consideraciones.
Con respecto a las limitaciones propias del instrumento, el BDI-II presenta algunas
consideraciones que es necesario conocerlas.
En primer lugar, la claridad del instrumento si bien es cierto es una de sus principales
fortalezas al facilitar la comprensión por muy variados grupos etarios sin problemas,
también se presta para que sus resultados pueden ser fácilmente exagerados o minimizados
por el individuo completo. Es decir posee una predisposición a la manipulación del
resultado, tendencia de respuesta y deseabilidad social. Al ser una escala corta, tampoco
aporta algún ítem relacionado con el sesgo.
Segundo, el BDI II es un buen instrumento que indica el grado de severidad de depresión,
no así entre subtipos de Trastornos del Espectro Depresivo. Si este fuese el interés clínico,
es necesario optar por algún otro método diagnóstico.
En tercer lugar, el BDI-II ofrece puntos de corte, no así baremos que permitan especificar el
diagnostico en función de variables como sexo y edad. De esta forma en algunas
circunstancias el instrumento puede pecar de imprecisión, siendo necesaria la triangulación
con otras técnicas.
Una cuarta debilidad concierne al contenido de los ítems propiamente. A pesar de que el
instrumento sigue una escala ordinal en la cual las posibles puntuaciones (0-3) de cada ítem
son equiparables entre sí, eso no quiere decir que en la práctica lo sea. Por ejemplo
empíricamente hablando no es equiparable un “Me suicidaría apenas tenga la oportunidad
de hacerlo” con un “Tengo hambre todo el tiempo”, a pesar que ambos puntúan igual, 3.Por
111
tal razón es obligación del profesional a cargo considerar cada rasgo por separado, cuando
lo amerite.
En esta adaptación, se dio el caso de ítems cuyas cargas factoriales eran débiles con
respecto a los componentes. Tal es el caso de Interés por el sexo, llanto y agitación. Es
necesario en futuras investigaciones revisar si dichos rasgos realmente pertenecen al
constructo.
Una quinta y última limitación se relaciona propiamente con el constructo de depresión. La
sintomatología depresiva tiende a cambiar en periodos inclusive cortos de tiempo. De esta
forma puede ser un sesgo aplicar un procedimiento Test –Retest ya que una condición del
mismo es que la variable objeto de medición no haya cambiado (Fernández- Ballesteros y
Calero, 2004). Así mismo es difícil la obtención de casos puros de Depresión, ya que la
misma presenta comorbilidad con muy variados trastornos (APA, 2005).
Recomendaciones
Con respecto a la adaptación directamente, se recomienda su uso en el contexto
costarricense. Dados sus elevados índices de validez y fiabilidad encontrados en el presente
estudio, además de sus precedentes en contextos internacionales, la adaptación se posiciona
como un potencial colaborador en el diagnóstico clínico de la depresión.
La metodología utilizada (Geissenger, 1994) fue definitoria del éxito de los resultados. Se
recomienda ampliamente su uso e inclusive desarrollo, para cualquier adaptación o
estandarización que se plantee. Justificar una investigación en base a esta metodología
garantiza un buen estimador de éxito.
En conjunto con el punto anterior, la metodología propuesta por Geissenger puede
complementarse adecuadamente con procedimientos más relacionados con la Teoría de
respuesta al Ítem como la Entrevista Cognitiva. Según la presente investigación fue una
combinación que resulto enriquecedora para la adaptación. Tomar en cuenta el criterio de la
112
población meta con la que se administrara el instrumento es una paso que no debe faltar en
futuras adaptaciones de distintos instrumentos.
Se recomienda realizar a futuro una validación de las cualidades psicométricas de la
adaptación. Con una muestra más grande, especialmente de población clínica, como
también con representatividad de las otras provincias faltantes, Guanacaste, Puntarenas y
Limón. De igual forma que la metodología funciono exitosamente, el modelo de validez de
Wasserman y Bracken (2003) es un adecuado recurso en el diseño de indicadores de
validez.
Con respecto a distintos hallazgos no planteados inicialmente como objetivos que se fueron
dando conforme la investigación avanzaba, se recomienda:

Estudiar a futuro la posible relación entre nivel educativo y Trastornos del estado de
ánimo.

Los resultados deslegitiman la creencia de que las mujeres se deprimen más que los
hombres. Esto puede crear una interesante línea de investigación.

Investigar la posible inserción de Cuestionarios Online en el quehacer investigativo.
Su impacto, ventajas y desventajas.

En el diagnóstico clínico de depresión se puede considerar la relevancia que tiene
los componentes indicados por el BDI-II, cognitivo-afectivo y conductualfisiológico y otorgar prioridad al tratamiento.
El profesional a cargo de una evaluación no debe utilizar el BDI-II sin incorporar una
adecuada triangulación de otras técnicas. El aporte de la puntuación del inventario solo
tiene legitimidad cuando se engancha con lo aportado por otros métodos. Tal como apunta
Gregory Meyer visto en el epígrafe de la presente investigación:
El valor de la herramienta no se puede separar de la sofisticación del clínico que
realiza inferencias sobre ella.
113
Referencias
ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE
DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA
114
REFERENCIAS
Aasen, H. (2001). An empirical investigation of depression symptoms: norms,
psychometric characteristics and factor structure of the Beck Depression Inventory-II.
Bergen: University of Bergen
Abad, F., Garrido, J., Olea, J., & Ponsoda, V. (2006). Introducción a la Psicometría. Teoría
Clásica de los Test y Teoría de la Respuesta al Ítem. Madrid: Universidad Autónoma
de Madrid.
Abell, N., Springer D., Kamata, A. (2009). Developing and Validating Rapid Assessment
Instruments. New York: Oxford University Press.
Agudelo, D., Buela Casal, G., Spielberger, C. (2007). Ansiedad y Depresión: el problema
de la diferenciación a través de los síntomas. Salud Mental, 30, 33-41
Aguiar, T. (2009). Adaptación de la escala de neuroticismo del "Introversion und
Neurotizismus bei Kindern" (INK) para estudiantes que cursen cuarto, quinto y sexto
grado en escuelas del Área Metropolitana, en el año 2007., Universidad de Costa
Rica, Ciudad Universitaria Rodrigo Facio.
Alansari, B. (2006). Internal Consistency of an Arabic Adaptation of the Beck Depression
Inventory-II with College Students in Eighteen Arab Countries. Social Behavior and
Personality, 34, 425-430.
Alansari, B. (2005). Beck Depression Inventory (BDI-II) Items characteristics among
undergraduate students of nineteen islamic countries. Social Behavior and
Personality, 33, 675-684.
115
Alo, M. & Vallejo, G. (2012) Diseños experimentales en Psicología. Madrid: Pirámide.
Al-Musawi, N. (2001). Psychometric Properties of the Beck Depression Inventory–II with
University Students in Bahrain .Journal of Personality Assessment, 77, 568–579.
American Psychyatric Association (2013). Quinta Edición del Manual Diagnóstico de los
Trastornos mentales. Barcelona: MASSON.
Arango, C., Escobar, M., Pimienta, H. (2004). Fundamentos moleculares y celulares de la
depresión y de los mecanismos antidepresivos. Revista Colombiana de Psiquiatría,
33, 165-185
Arias, B. (2008). Desarrollo de un ejemplo de análisis factorial confirmatorio con LISREL,
AMOS y SAS. Seminario de Actualización en Investigación sobre Discapacidad
SAID 2008. España: Universidad de Valladolid
Arnarson, Olason, D., Smari, J., & Sigurðsson, J. (2008).The Beck Depression Inventory
Second Edition (BDI-II): Psychometric properties in Icelandic student and patient
populations. Nord J Psychiatry, 62, 360-365.
Arvand, J., Shafiabadi, A., Falsafinejad, M., Zali, M. (2012) The effects of group solution–
focused therapy on depression and completion of treatment in patients with chronic
hepatitis B. Health MED, 6, 925-928
Baldós, A. (2009). Terapia cognitiva de Beck. En F. Labrador (Ed.), Técnicas de
Modificación de Conducta. Madrid: Pirámide.
Bagby, R., Ryder, A., Schuller, D., & Marshall, M. (2005). ¿Sigue siendo la escala de
depresión de Hamilton una prueba de referencia? American Journal of Psychiatry, 8,
137-151.
116
Beck, A.T., Rush, J., Shaw, B. & Emery, G. (1983/2002).Terapia Cognitiva de la
Depresión. España: Desclée De Brouwer
Beck, A., Steer, R., Ball, R., & Ranieri, W. (1996).Comparison of Beck Depression
Inventories IA and II in Psychiatric Outpatients. Journal of Personality Assessment,
67, 588-597.
Beck, A., Steer, R., & Brown, G. (1996/2009).Manual para el Inventario de Depresión de
Beck—II. (1ª Reimpresión).Buenos Aires: Paidós.
Bernt, D. (1990). Multiscore Depression Inventory (MDI): Manual. Los Ángeles:
Western Psychological Services.
Berenzon, S., Tiburcio, M., Medina-Mora, M. (2005). Variables demográficas asociadas
con la depresión: diferencias entre hombres y mujeres que habitan en zonas urbanas
de bajos ingresos. Salud Mental, 28, 33-40
Brenes, A., Espinoza, M., Bejarano, J., & Riba, G. (1978). Realidad Psicométrica
Nacional: 1978. Instituto de Investigaciones Psicológicas. Universidad de Costa Rica,
San José. Costa Rica.
Brenlla, M., &Rodríguez, C. (2009). Adaptación Argentina del Inventario de Depresión de
Beck (BDI-II). Buenos Aires: Paidós
Byrne, B., Stewart, S., & Lee, P. (2004). Validating the Beck Depression Inventory–II for
Hong Kong Community Adolescents. International Journal of Testing, 4, 199-216.
Butcher, J., Mineka, S., Hooley, J. (2007).Psicología Clínica. Madrid: Pearson.
117
Burvill, P. (1995) Recent progress in the epidemiology of major depression. Epidemiologic
Rev, 17, 21-31.
Calero, M., & Padilla, J. (2004). Técnicas Psicométricas: los test. In R. FernándezBallesteros (Ed.), Evaluación Psicológica. Conceptos, Métodos y Estudio de casos.
Madrid: Pirámide.
Caraveo, J., Colmenares, E, Saldivar, G. (1999) Estudio clínico epidemiológico de los
trastornos depresivos. Salud mental, 22(2):7-17
Carney, C., Ulmer, C., Edinger, J., Krystal, A., Knauss, F. (2009).Assessing depression
symptoms in those with insomnia: An examination of the beck depression inventory
second edition (BDI-II).Journal of Psychiatric Research, 43, 576–582.
Chang, H. (2005). Dimensions of the Chinese Beck Depression Inventory-II in a University
Sample. Individual Differences Research, 3, 193-199.
Chávez, A., & Meléndez, D. (2005). Estandarización y Adaptación de la prueba NAIPES G
Nivel Elemental para el proceso de selección de personal del sector autónomo de
salud costarricense, (C.C.S.S.) en la región Chorotega., Universidad de Costa Rica,
Liberia.
Cohen, R. & Swerdlick, M. (2006). Pruebas y Evaluación Psicológica. Introducción a las
pruebas y a la medición. México, D.F.: Mc Graw Hill.
Costa Rica, Instituto Costarricense de Estadística y Censo. (2008). Estimaciones y
Proyecciones de Población por sexo y edad (cifras actualizadas). San José: Autor
118
Cruz, C., López, L., Blas, C., González, L., & Chávez, R. (2005). Datos sobre la Validez y
Confiabilidad de la Symptom Check List 90 (SCL 90) en una muestra de sujetos
mexicanos. Salud Mental, 28, 72-81.
De la Fuente, R., Medina-Mora, M, Caraveo, J. (1997). Salud Mental en México. Fondo de
cultura económica: México D.F.
Díaz, L. (2011, 29 de agosto). CCSS desdeña atención de problemas mentales. La Nación,
[en línea]. Recuperado el 11 de octubre de 2011, de http://www.nacion.com/2011-0529/ElPais/NotaPrincipal/ElPais2792240.aspx
Díaz, L., Campo, A., Rueda, G., & Barros, J. (2005). Propuesta de una versión abreviada de
la escala de Zung para depresión. Colombia Médica, 36, 168-172.
Dumenci, L., Achenbach, T. (2008) Effects of estimation methods on making trait –level
inferences
from
ordered
categorical
items
for
assessing
psychopatology.
Psychological Assesment, 20, 55-62
Dunn, R., Kimbrell, T., Ketter, T., Frye, M., Willis, M., Luckenbaugh, D., et al.
(2002).Principal Components of the Beck Depression Inventory and Regional
Cerebral Metabolism in Unipolar and Bipolar Depression. Biological Psychiatry, 51,
387-399.
Facio, T. (2007). Uso de la Terapia Racional Emotiva Conductual en la Atención de las
Personas Adultas Mayores con Desórdenes de Depresión, Ansiedad o Irritabilidad.
Universidad de Costa Rica, Ciudad Universitaria Rodrigo Facio.
119
Fernández-Ballesteros, R., & Calero, M. (2004). Garantías científicas y éticas de la
evaluación científica. En R. Fernández-Ballesteros (Ed.), Evaluación Psicológica.
Conceptos, Métodos y Estudio de casos. Madrid: Pirámide.
Fernández-Ballesteros (2004). El proceso como procedimiento interventivo 1: el proceso
descriptivo predictivo. En R. Fernández-Ballesteros (Ed.), Evaluación Psicológica.
Conceptos, Métodos y Estudio de casos. Madrid: Pirámide.
Fernández, A., Pérez, E., Alderete, A., Richaud, M., Liporace, M. (2010) ¿Construir o
Adaptar Test Psicológicos? Diferentes respuestas a una Cuestión Controvertida.
Evaluar, 10, 60-74
Fozdar, F. (2009). The Golden Country’: Ex-Yugoslav and African Refugee Experiences of
Settlement and ‘Depression. Journal of Ethnic and Migration Studies, 35, 1335-1352.
Geissenger, K. (1994). Cross-Cultural Normative Assessment: Translation and Adaptation
Issues Influencing the Normative Interpretation of Assessment Instruments.
Psychological Assessment, 6(4), 304-312.
Ghassemzadeh, H., Mojtabai, R., Karamghadiri, N., & Ebrahimkhani, N. (2005).
Psychometric properties of a Persian-language version of the Beck Depression
Inventory second edition: BDI-II-Persian. Depression and Anxiety, 21, 185–192.
Goodale, E. (2007) El papel de la norepinefrina y de la dopamina en la depresión. Revista
de Toxicomanías, 50, 19-22
Gorenstein, C., Wang, Y., Argimon, I., Werlang, B. (2011) Manual do Inventario de
Depressao de Beck - BDI-II. Sao Paulo: Casa do Psicologo
120
Guadarrama, L., Escobar, A., Zhang, L. (2006) Bases neuroquímicas y neuroanatómicas de
la depresión. Revista Facultad Medicina UNAM, 49, 66-72
Güemes, I., Guillen, V., & Ballesteros, J. (2008). Psicoterapia frente a farmacoterapia en
depresión en atención ambulatoria. Actas Españolas de Psiquiatría, 36, 299-306.
Hernández, R., Fernández, C., & Baptista, P. (2006). Metodología de la investigación.
México D.F.: Mc. Graw Hill.
Hernández, O. (2004) Estadística elemental para Ciencias Sociales. San José, Costa Rica:
Editorial de la Universidad de Costa Rica.
Instituto Nacional de Estadística y Censo (2010).Costa Rica. Población por años calendario,
según sexo y grupos quinquenales de edades 2011-2050. Extraído el 4 de abril de
2013 del sitio Web: http://www.inec.go.cr/Web/Home/GeneradorPagina.aspx
International Test Commission (2010).International Test Commission Guidelines for
Translating and Adapting Tests. Extraído el 12 de abril 2013delsitio web
http://www.intestcom.org
Joe, S., Woolley, M., Brown, G., Ghahramanlou, M., & Beck, A. (2008). Psychometric
Properties of the Beck Depression Inventory–II in Low-Income, African American
Suicide Attempters. Journal of Personality Assessment, 90, 521–523.
Kapci, E., Uslu, R., Turkcapar, H., & Karaoglan, A. (2008). Beck Depression Inventory II:
evaluation of the psychometric properties and cut-off points in a Turkish adult
population. Depression and Anxiety, 25, E104–E110.
121
Kerlinger, F., & Lee, H. (2002). Investigación del Comportamiento. Métodos de
Investigación en Ciencias Sociales. México D. F.: Mc Graw Hill.
Kizilcik Z, Sayiner, F., Unsal, A., Ayranci, U., Kosgeroglu, N., Tozun, M. (2012).
Prevalence of depression in patients on hemodialysis and its impact on quality of life.
Pak J Med Sci, 28,695-699
Kumar, C. (2009). Applied Psychometry. New Delhi: SAGE.
Kuhner, C., Burger, C., Keller, F., Hautzinger, M. (2007) Reliability and validity of the
Revised
Beck
Depression
Inventory
(BDI-II).
Results
from
German
samples.Nervenarzt, 78, 651-6.
Lipps, E., Lowe, G., Young, R. (2007) Validation of the beck depression inventory-II in a
Jamaican university student cohort. West Indian Med J., 56, 404-8.
Lubinski, D., Dawis, R. (1995) Assesing individual differences in human behavior:
methods, concepts and findings. Palo Alto, California: consulting Psychologists
Press.
Lu, Y. (2010). Mental health and risk behaviours of rural-urbanmigrants: Longitudinal
evidence from Indonesia. PopulationStudies, 64, 147-163.
Lutz, G. (1992). Adaptación del Inventario de Depresión para Niños en escolares del
cuarto, quinto y sexto grado pertenecientes al área metropolitana de San José.
Universidad de Costa Rica, Ciudad Universitaria Rodrigo Facio.
Manual de atención integral a la depresión y el suicidio en adolescentes (2005). Caja
Costarricense de Seguro Social.
122
Martínez, M., Hernández, M., Hernández, M (2006). Psicometría. Madrid: Alianza
Editorial
Muñiz, J. (2010) Las Teorías de los Test: Teoría Clásica y Teoría de Respuesta a los Ítems.
Papeles del Psicólogo, 31, 57-66
Navas, M. (1994) TeoríaClásica de los test versus Teoría de Respuesta al Ítem. Revista
Psicologica, 15, 175-208
Nichols, D. (2011) Essentials of MMPI-2 Assesment.Second Edition.Estados Unidos: John
Wiley and Sons.
Organización Mundial de la Salud. (1992) Decima revisión de la clasificación internacional
de las enfermedades (CIE). Trastornos mentales y del comportamiento, descripciones
clínicas y pautas para el diagnóstico. Madrid: Meditor
Osman, A., Barrios, F., Gutierrez, P., Williams, J., & Bailey, J. (2008).Psychometric
Properties of the Beck Depression Inventory-II in Nonclinical Adolescent
Samples.Journal of clinical psychology, 64, 83-102.
Osman, A., Barrios, F., Kopper, B., Gutierrez, P., &Bagge, C. (2004).Reliability and
Validity of the Beck Depression Inventory—II with Adolescent Psychiatric
Inpatients.Psychological Assessment, 16, 120-132.
Pallesen, S., Nordhus, I., Carlstedt, B., Thayer, J., Johnsen, T. (2006) A Norwegian
adaptation of the Penn State Worry Questionnaire: factor structure, reliability,
validity and norms. Scand J Psychol, 47, 281-91.
Palmer, E., &Binks, C. (2008). Psychometric properties of the Beck Depression InventoryII with incarcerated male offenders aged 18–21 years. Criminal Behaviour and
Mental Health, 18, 232-242.
123
Pedrero, E., López, A. (2005). Autoinformes de sintomatología depresiva en
drogodependientes: nivel de coincidencia del BDI, SCL-90-R y MCMI-II.
¿Depresión o malestar inespecífico? ADICCIONES, 17, 215-230.
Pérez, E., & Muñoz, M. (2004). Inventario de Depresión de Beck. En R. FernándezBallesteros (Ed.), Evaluación Psicológica. Conceptos, Métodos y Estudio de casos.
Madrid: Pirámide.
Pérez, M. & García, J. (2010). Guía de Tratamientos Psicológicos Eficaces para la
Depresión. En Pérez, Fernández, Fernández y Amigo (Coord.), Guía de Tratamientos
Psicológicos Eficaces I: Adultos.Madrid: Pirámide.
Poole, H., Bramwell, R., Murphy, P. (2009). The utility of the Beck Depression Inventory
Fast Screen (BDI-FS) in a pain clinic population.European Journal of Pain, 13, 865–
869.
Prieto, G., Muñiz, J., Almeida, L., & Bartram, D. (1999).Uso de los test psicológicos en
España, Portugal e Iberoamérica. RIDEP, 8, 67-82.
Reyes, R., Quirós, E. (1993). Características del Paciente Deprimido según el Mini Mult
82. Universidad de Costa Rica, Ciudad Universitaria Rodrigo Facio.
Riolo, S., Nguyen, T., Greden, J., & King, C. (2005).Prevalence of Depression by
Race/Ethnicity: Findings from the National Health and Nutrition Examination Survey
III.American Journal of Public Health, 95, 998-1000.
124
Rowland, S., Lam, C., & Leahy, B. (2005). Use of the Beck Depression Inventory-II (BDIII) with persons with traumatic brain injury: Analysis of factorial structure.
BrainInjury, 19, 77-83.
Salli, A., Yilmaz, H., & Ugurlu, H. (2012).The relationship between tender point count and
disease severity in patients with primary Fibromyalgia.Rheumatology International,
32, 105–107
Sanz, J., García-Vera, M., Espinosa, R., Fortún, M., &Vázquez, C. (2005). Adaptación
española del Inventario para la Depresión de Beck-II (BDI-II): 3. Propiedades
psicométricas en pacientes con trastornos psicológicos. Clínica y Salud, 16, 121-142
Sanz, J., Navarro, M., y Vázquez, C.(2003). Adaptación española del Inventariopara la
Depresión
de
Beck-II
(BDI-II):
1.Propiedades
psicométricas
en
estudiantesuniversitarios. Análisis y Modificación deConducta, 29(124), 239-288.
Sanz, J., Perdigón, A., &Vázquez, C. (2003). Adaptación española del Inventario para la
Depresión de Beck-II (BDI-II): 2. Propiedades psicométricas en población general.
Clínica y Salud, 14, 249-280.
Seignourel, P., Green, C., Schmitz, J. (2008). Factor structure and diagnostic efficiency of
the BDI-II in treatment-seeking substance users.Drug and Alcohol Dependence, 93,
271–278.
Seligman, M. (1975). Helplessness: On Depression, Development, and Death. San
Francisco: W. H. Freeman
125
Sidney, S., Castellan, N. (2012). Estadística no Paramétrica aplicada a las Ciencias de la
Conducta. México D.F.: Trillas
Smith, V. & Molina, M. (2011). Cuaderno Metodológico 5. La entrevista cognitiva: guía
para su aplicación en la evaluación y mejoramiento de instrumentos de papel y lápiz.
San José, CR.: Instituto de Investigaciones Psicológicas, Universidad de Costa Rica.
Solís, F. (2009). Aportes al análisis de la validez y de la confiabilidad del Inventario de
Depresión para niños de Kovacs, como herramienta de tamizaje para la evaluación
de los indicadores del riesgo de depresión, en una muestra de niños costarricenses,
escolarizados, de edades comprendidas entre los 7 y 12 años, de población no
clínica. Proyecto de investigación para optar por el grado de
especialista en
psicología clínica, Universidad de Costa Rica, San Pedro, Costa Rica.
Sprinkle, S., Lurie, D., Insko, S., Atkinson, I., Jones, G., Logan, A., et al. (2002). Criterion
Validity, Severity Cut Scores, and Test–Retest Reliability of the Beck Depression
Inventory—II in a University Counseling Center Sample.Journal of Counseling
Psychology, 49, 381-385.
Takai, M., Takahashi, M., Iwamitsu, Y., Ando, N., Okazaki, S., Nakajima, K., Oishi S.,
Miyaoka, H. (2009).The experience of burnout among home caregivers of patients
with dementia: Relations to depression and quality of life. Archives of Gerontology
and Geriatrics, 49, e1–e5.
Tsai, J. &Chentsova Dutton, Y. (2002).Understanding depression across cultures.En I.
Gotlib& C. Hammen (Eds), Handbook of depression (pp. 467-91). New York:
Guilford.
126
Üstün, T., Sartorius, N., (1995). Mental illness in general health care: an international
study. Chichester: John Wiley.
Van Praag H.M. (1998) Anxiety and increased aggression as pacemakers of depression.
Acta Psychiatric Scand, 98, 81-88
Vázquez, C., Nieto, M., Hernangómez, L., Hervás, G. (2004). Trastorno psicológico en un
caso de depresión mayor. En J. Espada, J.
Olivares, F. Méndez (Comp.), Terapia
Psicológica. Casos prácticos. (pp. 201- 231). Madrid: Pirámide.
Valerio, L. (1997). Traducción y adaptación del Inventario Múltiple de Depresión. Sistemas
de Estudios de Posgrado: Tesis para optar a la especialidad en Psicología Clínica,
Universidad de Costa Rica – (CENDEISS). Centro de Estudios, San José, Costa Rica
Viljoen, J., Iverson, G., Griffits, S., &Woodward, T. (2003).Factor Structure of the Beck
Depression Inventory— II in a Medical Outpatient Sample. Journal of Clinical
Psychology in Medical Settings, 10, 289-291.
Wang, Yuan-Pang, & Gorenstein, Clarice. (2013). Psychometric properties of the Beck
Depression Inventory-II: a comprehensive review. Revista Brasileira de Psiquiatria,
35(4), 416-431.
Wilson, C., &Blumentritt, T. (2007).Psychometric Properties of the Beck Depression
Inventory-II in a Clinically-Identified Sample of Mexican American Adolescents.
Journal of Child and Family Studies, 16, 789–798.
Wright, S. (2009). Going home: migration as enactment and symbol.Journal of Analytical
Psychology, 54, 475-492.
Zung, W., Broadhead, W., Roth, M. (1993) Prevalence of depressive symptoms in primary care. J
Fam Pract, 37, 337-344
127
ANEXOS
ADAPTACION DE LA SEGUNDA VERSION DEL INVENTARIO DE
DEPRESION DE BECK AL GRAN AREA METROPOLITANA DE COSTA RICA
128
Anexo 1: Lineamientos para la Adaptación de Pruebas según la International Comission
Test (ICT)

Contexto. Referido a la comprensión de que muchos de los constructos evaluados
en psicología son dependientes de variables culturales y por tanto fácilmente
susceptibles de sesgo ante la imposibilidad de equivalencia cultural.

Desarrollo o adaptación de instrumentos. Plantea la necesidad de asegurar con
fundamentación metodológica adecuada la adaptación misma, según la utilización
en estudios transculturales, la equivalencia de test y de elementos y la validación
para diferentes poblaciones.

Administración. Se refiere a la construcción de normas relacionadas con
instrucciones y condiciones contextuales que podrían afectar la equivalencia de los
test.

Interpretación. Comprende la consideración de las diferencias culturales en las
normas de interpretación de un test.
(International Test Comission, 2010; Fernández Ballesteros & Calero, 2004)
129
Anexo 2: Antecedentes Psicométricos en Trabajos Finales de Graduación en la Universidad de Costa Rica
Adaptaciones
1979
Estandarizaciones
Análisis de pruebas
María Emilia Chávez. El test gestáltico
visomotor de Lauretta Bender: adaptación de
las normas para su corrección en la población
escolar de 6 a 12 años del cantón de
Goicoechea. 1979
María luisa González, Mayra Guzmán, Grettel
Milano. Adaptación a Costa Rica de la escala
de desarrollo psicomotor de la primera infancia
de Brunet y Lezine, de 40 a 30 meses.
1980
Lilliana
Echeverría,
Corina
Flores
Ana
Jiménez. Adaptación de la Escala Weschler
para Niños a la Población Escolar de la
Provincia de San José. 1980.
1981
Graciela Meza y Miguel Garita. Adaptación del
Test de Matrices Progresivas de Raven (Escala
General).
1982
Delio González y Margarita Esquivel. Víctor Vargas Méndez. Análisis de una
Estandarización
de
la
prueba
OTIS
prueba de habilidad General para
130
Sencillo para la selección de Personal Selección de Personal en el Servicio Civil.
Administrativo del I.C.E.
Minor Aguilar Gutiérrez. Adaptación y
estandarización del inventario de
personalidad de H.J. Eysenck y Wilson
para una población de aspirantes al puesto
de Auxiliar de Investigación del
Organismo de Investigación Judicial.
1983
Olga Marta Murillo. Estudio de
Validación y Confiabilidad del test de
Jeness como instrumento diagnóstico de la
personalidad del menor infractor.
1984
Elsa Kruse y Leticia Rodríguez.
Adaptación y Estandarización del
cuestionario “16 Factores de la
Personalidad” de Raymond B. Catell para
su empleo en la selección de personal.
1985
Mayra de Mena Guardia, Dora Gamboa, Sara
Gurfinkiel, Carmen Ivankovich y Yamilé Soto.
131
Adaptación de dos escalas del test de
Orientación en las Relaciones Personales
(TORIF) de William Schütz a una población
universitaria costarricense.
1988
Jensen. Adaptación del Inventario Biográfico Juan Manuel Esquivel Alfaro.
para
el
Diagnostico
de
Trastornos
del Estandarización del Inventario de
Comportamiento (IBC).
madurez vocacional para estudiantes del
IX año de la educación general y XI de la
educación diversificada
1989
Ana Lorena Rojas Breedy. Adaptación de la Guillermo Barrantes. Estandarización del
Escala de Evaluación de la Cohesión y CERP 2 para Selección de Personal en el
Adaptabilidad Familiar de Olson (Faces III) a la Servicio Civil.
población de familias con adolescentes que
cursan educación secundaria en el cantón
central de la provincia de San José.
1990
Olga Alfaro, Luis Garnier y Mauricio
Leandro. El Minimult 82, revisión y
estandarización del minimult de
Kincannon.
1991
Jenny
Mora
Vargas
y
Pilar
Trimiño. María Marta Duran y Leonardo Guillen.
Adaptación del test de Memoria de Botwinick y Estandarización del Test D48 para
132
Storant para la población mayor de 60 años del Selección de personal en el Sector Publico
área metropolitana de Costa Rica.
1992
Centralizado Costarricense.
Lutz. Adaptación del Inventario de Depresión
para Niños.
1993
Marta Medina Gómez. Estandarización
del Test de Apreciación de Vendedores
para la selección de personal en la
empresa privada.
Ligia Morales y Cira Vega. Adaptación y
Estandarización
del
Test
Beta
de
Inteligencia general para la Selección de
personal en instituciones del Sector
Público Costarricense.
Ching y Vega. Estandarización de la
Batería
Diagnostica
de
la
Madurez
Lectora BADIMALE.
133
1995
Kattia
Solís.
Estandarización
de
Inventario Mcadow Kendall de evaluación
socioemocional (SEAI) para estudiantes
sordos de preescolar de las escuelas de
enseñanza especial del Ministerio de
Educación Pública.
Andrés
Umaña.
Estandarización
de
Inventario de Personalidad de Eysenck.
Blanco y Jiménez. Estandarización de la
Prueba verbal de Creatividad para
Preescolares (PVCP).
1996
Vladimir Escorsia. Estandarización de la
Prueba de Razonamiento Abstracto P20
500.
1997
Quintanilla. Adaptación de Prueba de estilos de
liderazgo.
134
1999
Luis Raifer Rubenstein. Adaptación y
Estandarización del Test Dieciséis
Factores de la Personalidad Versión 5.
2009
Tatiana Aguiar. Adaptación de la escala de
Fedra Solís Durán. Aportes al análisis de
neuroticismo del "Introversion und
validez y de la confiabilidad del
Neurotizismus bei Kindern" (INK) para
Inventario de Depresión para niños de
estudiantes que cursen cuarto, quinto y sexto
Kovacs, como herramienta para la
grado en escuelas del Área Metropolitana, en el
evaluación de los indicadores de riesgo de
año 2007.
depresión, en una muestra de niños
costarricenses, escolarizados, de edades
comprendidas entre los 7 y 12 años, de
población no clínica.
2014
Cinthya Meléndez. Escala de evaluación
funcional de la persona con trastorno
mental y del comportamiento para el
hospital Dr. Roberto Chacón Paut.
Fuente: Elaboración Propia
135
Anexo 3: Evidencias de Fiabilidad
Tipo de
evidencia
Método
Estabilidad de
la medida
Test-retest
Objetividad de
la medida
Criterio entre
evaluadores
Descripción
Procedimiento
Estadístico
El mismo
instrumento se
administra a la
misma muestra
en dos
ocasiones
separadas por
un espacio de
tiempo
prudente.
Describen la
consistencia de
las
calificaciones a
través de
múltiples
evaluadores.
Cuando se trata
de pruebas que
dan margen
para una gran
cantidad de
juicio por parte
del examinador
en la
asignación de
puntuaciones,
Correlaciones
Pearson-Spearman
Coeficiente de
concordancia de
Kendall
Fuentes de
varianza de
error
Cambios a lo
largo del
tiempo
Diferencias
entre
evaluadores
Consideraciones
Al realizar varias
administraciones
hacen que sea más
costoso.
Condiciones
La variable
procedente del
constructo no debe
cambiar en un
plazo corto de
tiempo
Es necesaria la Variosevaluadores.
presencia de varios
evaluadores.
Al
realizar
varias
administraciones
hacen que sea más
costoso
136
Homogeneidad
de la medida
Dos mitades
Formas
paralelas
Alpha
Crombach
por ejemplo
pruebas
proyectivas, de
desarrollo
moral o de
creatividad.
Sugiere dividir
el test en dos
partes, cada
una con
propiedades
normativas y
estadisticas
similares y
correlacionar
ambas
puntuaciones
de cada mitad
Se aplican dos
versiones de
una prueba a
un mismo
grupo y se
correlacionan
los promedios
obtenidos en
cada una
Se trata de una
media
ponderada de
las
Correlaciones
Pearson/Spearman.
Fórmula de
Spearman -Brown
Muestreo de
Reactivos
Al presentarse dos
versiones, introduce
diferencias en la
muestra de
reactivos de cada
forma, aumentando
la varianza como
fuente de error.
Se necesita una
cantidad
abundante de
items, ya que al
dividir afecta la
estructura
factorial.
Ambas mitades
deben ser paralelas
entre si.
Correlaciones
Pearson/Spearman.
Muestreo de
reactivos
Al realizar varias
administraciones
hacen que sea más
costoso.
La prueba debe
presentar dos
formas y ambas
deben cubrir los
mismos rasgos,
contenidos y nivel
de dificultad
Alfa de Crombach
Muestreo de
reactivosHomogeneidad
Si las escalas son
multidimensionales,
el alpha pierde
poder predictivo,
Estar formado por
un conjunto de
ítems que se
combinan para
137
correlaciones
entre las
variables (o
ítems) que
forman parte
de la escala.
siendo más util hallar una
coeficientes como puntuación global
el tetha o el omega. Todos los ítems
miden la
característica
deseada en la
misma dirección.
Fuente: Elaboracion Propia
138
Anexo 4: Consentimiento informado
UNIVERSIDAD DE COSTA RICA
FACULTAD DE CIENCIAS SOCIALES
COMITÉ ÉTICO CIENTIFICO
Teléfono:(506) 25115561
Telefax: (506) 2511-4017
VICERRECTORÍA DE INVESTIGACIÓN
Teléfonos:(506) 2511-4201 Telefax: (506) 2224-9367
ESCUELA DE PSICOLOGIA
CONSENTIMIENTO INFORMADO
Proyecto: Adaptación de la Segunda versión del Inventario de Depresión de Beck
(BDI-II) a la población del Gran Área Metropolitana de Costa Rica
Mi nombre es Dennis Redondo Alfaro, soy estudiante de la Escuela de Psicología de la
Universidad de Costa Rica y deseo realizar una investigación sobre el estado de ánimo en la
gente.
PROPÓSITO DEL PROYECTO:
Con esta investigación pretendo encontrar aspectos que se tornen de relevancia en el
tratamiento de distintas afecciones como la Depresión.
¿QUÉ SE HARÁ?:
El procedimiento consiste en llenar el cuestionario que se le muestra adjunto, marcando la
opción que mejor represente su estado de ánimo. Aproximadamente le tomará de 5 a 10
minutos. No existen respuestas buenas ni malas, tan solo se busca que las mismas reflejen
de la forma más acertada su estado de ánimo reciente.
No es necesario que escriba algún tipo de información que pueda revelar algún aspecto de
su identidad. Incluso los datos que si se le soliciten se mantendrán en absoluta
confidencialidad y todos serán manejados únicamente por mi persona. No se entregaran
resultados a ninguna persona acerca de lo que puntúe el cuestionario, ya que el mismo se
manejará exclusivamente con fines investigativos.
RIESGOS:
No está estipulado que el contestar todas las preguntas le conlleven alguna consecuencia a
nivel físico, emocional o de alguna otra índole. Sin embargo, en caso que alguna pregunta
le genere incomodidad puede dejar de contestar las mismas sin ningún compromiso.
BENEFICIOS:
139
Como resultado de su participación en este estudio, no obtendrá ningún beneficio directo,
sin embargo, es posible que el investigador aprenda más acerca del estado de ánimo de la
gente en nuestro pais y este conocimiento beneficie a otras personas en el futuro.
No se debe preocupar por algún coste económico que puede tener el cuestionario. Así
mismo tampoco recibirá pago por su participación.
Siéntase con total libertad para preguntar sobre cualquier aspecto que le ayude a aclarar sus
dudas al respecto. Antes de dar su autorización para este estudio es importante que hayan
sido contestadas satisfactoriamente todas sus preguntas. Puede consultar sobre los derechos
de los Sujetos Participantes en Proyectos de Investigación a la Dirección de Regulación de
Salud del Ministerio de Salud, al teléfono 22-57-20-90, de lunes a viernes de 8 a.m. a 4
p.m. Cualquier consulta adicional puede comunicarse a la Vicerrectoría de Investigación
de la Universidad de Costa Rica a los teléfonos 2511-4201 ó 2511-5839, de lunes a viernes
de 8 a.m. a 5 p.m.
En caso de disgustarle algún aspecto de las preguntas, usted puede abandonar la prueba en
cualquier momento pudiendo informar o no, las razones de su decisión, la cual será
respetada en su integridad. No habrá ninguna consecuencia desfavorable para usted, en caso
de no colaborar con la investigación. Si solo desea contestar la prueba pero que los datos no
se usen en el estudio, tambien puede indicarlo sin ningun tipo de implicación.
Su participación en este estudio es confidencial, los resultados podrían aparecer en una
publicación científica o ser divulgados en una reunión científica pero de una manera
anónima.
CONSENTIMIENTO
He leído o se me ha leído, toda la información descrita en esta fórmula, antes de firmarla.
Se me ha brindado la oportunidad de hacer preguntas y éstas han sido contestadas en forma
adecuada. Por lo tanto, accedo a participar como participante en este estudio.
______________________________________________________________________
Nombre, cédula y firma del o la participante
Nombre, cédula y firma del Investigador que solicita el consentimiento
___________________________
Fecha
140
Anexo 5: Plantilla de Observación Pruebas Piloto con la Prueba
Tiempo de lectura y
llenado de
Consentimiento
Tiempo de lectura y
llenado de
Cuestionario
Comprensión de los ítems
(Minutos y segundos)
(Minutos y segundos)
B: Hace 1 pregunta
Dificultades
lectoescritura
A: No hace preguntas
A: No requiere apoyo
C: Hace 2 o 3 preguntas
B: Requiere apoyo en la
lectura
D: Hace más de 3 preguntas
1
2
3
4
5
6
7
Sujetos Pruebas Piloto
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
141
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
142
Anexo 6: Versión de Traductor Oficial
Nombre: ____________________________ Estado Civil: ________________ Edad: _____ Sexo: ____
Ocupación: __________________________ Nivel Educativo: ____________________________________
Instrucciones: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones cuidadosamente y
luego seleccione una oración de cada grupo que mejor describa la forma en que usted se ha estado sintiendo durante las dos
últimas semanas, incluyendo hoy. Encierre con un círculo el número que está a la par de la oración que haya seleccionado.
Si varias oraciones en un grupo parecen aplicar de igual manera, encierre el número más alto correspondiente a ese grupo.
Asegúrese de no escoger más de una oración en cualquier grupo, incluyendo el punto 16 (Cambios en el Patrón del Sueño) o
el punto 18 (Cambios en el Apetito).
Tristeza

0
1
2
3
No me siento triste.
Me siento triste la mayor parte del tiempo.
Me siento triste todo el tiempo.
Me siento tan triste e infeliz que no puedo soportarlo.
Pesimismo

0
1
2
3
No me siento desanimado sobre mi futuro.
Me siento más desanimado sobre mi futuro de lo que
solía estarlo.
No espero que las cosas funcionen para mí.
Siento que no tengo esperanzas en mi futuro y más bien
será peor.

Fracasos del Pasado
0
1
2
3
No me siento como un fracasado.
Siento que he fracasado más de lo que debí.
Cuando pienso en el pasado, recuerdo muchos fracasos.
Siento que soy un total fracaso como persona.

Pérdida de Satisfacción
0
Siento tanta satisfacción de las cosas que disfruto al igual
antes.
No disfruto tanto de las cosas como solía hacerlo.
Obtengo poca satisfacción de las cosas que solía disfrutar.
No obtengo satisfacción alguna de las cosas que solía
disfrutar.
1
2
3

Sentimientos de Culpabilidad
0
1
No me siento culpable en particular.
Me siento culpable por varias cosas que he hecho o que
debí hacer.
Me siento bastante culpable la mayor parte del tiempo.
Me siento culpable todo el tiempo.
2
3
Sentimientos de Castigo

0
1
2
3
No siento que estoy siendo castigado.
Siento que debería ser castigado.
Espero ser castigado.
Siento que estoy siendo castigado.
Auto-desprecio

0
1
2
3
Me siento igual acerca de mí mismo como siempre.
He perdido confianza en mí mismo.
Me siento decepcionado de mí mismo.
Me odio a mí mismo.
Autocrítica

0
1
2
3
No me critico ni me culpo más de lo usual.
Me critico más de lo que solía hacerlo.
Me critico por todos mis fallos.
Me culpo por todo lo malo que pasa.
Pensamientos o Deseos de Suicidio

0
1
2
3
No tengo pensamiento alguno de matarme
Tengo pensamientos de matarme pero no lo haría.
Me gustaría matarme.
Me mataría si tuviera la oportunidad de hacerlo.
Llanto

0
1
2
3
No lloro más de lo que solía hacerlo.
Lloro más de lo que solía hacerlo.
Lloro por cualquier cosa.
Siento ganas de llorar pero no puedo hacerlo.
143

Inquietud

Irritabilidad
0
1
2
No me siento más inquieto o intranquilo de lo normal.
Me siento más inquieto o intranquilo de lo normal.
Me siento tan inquieto o intranquilo que me es difícil
quedarme quieto.
Me siento tan inquieto o intranquilo que tengo que estar
moviéndome o haciendo algo.
0
1
2
3
No me siento más irritado de lo normal.
Me siento más irritado de lo normal.
Me siento mucho más irritado de lo normal.
Me siento irritado todo el tiempo.

Cambios en el Apetito

Pérdida de interés
0
No he perdido el interés en las personas o en las
actividades.
Tengo menos interés en las personas o en las actividades.
He perdido mayor interés en las personas o en las
actividades.
Me resulta difícil interesarme en algo.
0 No he experimentado ningún cambio en mi apetito.
_________________________________________
1a Mi apetito es un poco menor de lo normal
1b Mi apetito es un poco mayor de lo normal.
_________________________________________
2a Mi apetito es mucho menor de lo normal.
2b Mi apetito es mucho mayor de lo normal.
________________________________________
3a No tengo apetito del todo.
3b Tengo hambre todo el tiempo.
3
1
2
3
3
Indecisión
Tomo decisiones tan bien como siempre.
Tengo más dificultad en la toma de decisiones de lo
normal.
Tengo mucha mayor dificultad en la toma de decisiones
que antes.
Tengo problemas a la hora de tomar decisiones.

Baja Autoestima
3
Me puedo concentrar tan bien como siempre.
No me puedo concentrar tan bien como antes.
Se me hace difícil mantener mi mente en algo por
mucho tiempo.
Siento que no me puedo concentrar en nada.
0
1

Cansancio o Fatiga
2
3
No siento que yo valga la pena.
No me considero como alguien valioso y útil como solía
hacerlo.
Me siento más inútil que otras personas.
Me siento extremadamente inútil.
0
1
2

Pérdida de energía
3
0
1
2
3
Tengo tanta energía como siempre.
Tengo menos energía que antes.
No tengo suficiente energía para hacer mucho.
No tengo suficiente energía para hacer algo del todo.
No me siento más cansado o fatigado de lo normal.
Me canso o me fatigo más fácilmente de lo normal.
Me siento demasiado cansado o fatigado para hacer
varias cosas que solía hacer.
Me siento demasiado cansado o fatigado para hacer la
mayoría de las cosas que solía hacer.

Cambios en el Patrón del Sueño
0
No he tenido ningún cambio en mi patrón del sueño.

0
1
2

0
1
2
Dificultad de Concentración

Pérdida de interés en el sexo
0
1
No he notado ningún cambio en mi interés por el sexo.
Estoy menos interesado en el sexo de lo que solía
estarlo.
Estoy mucho menos interesado en el sexo ahora.
He perdido interés en el sexo completamente.
2
3
1a Duermo un poco más de lo normal.
1b Duermo un poco menos de lo normal.
_____________________________________
2a
Duermo mucho más de lo normal.
2b Duermo mucho menos de lo normal.
_____________________________________
3a Duermo la mayor parte del día.
3b Me despierto 1 ó 2 horas más temprano y no puedo dormir
de nuevo
144
Anexo 7: Traducción del Investigador del Proyecto
Nombre_______________ Estado Civil________________ Edad___________ Sexo
Ocupación_______________________ Nivel Educativo___________________
Instrucciones: Este cuestionario consta de 21 grupos de ítems. Por favor lea cada grupo de ítems
cuidadosamente, y luego seleccione en cada grupo la frase que mejor describe la forma en la cual
usted se ha estado sintiendo durante las últimas dos semanas, incluyendo hoy. Encierre el
número que se encuentre junto a la frase que haya escogido. Si le pareciera que no solo una sino
varias frases en el grupo le describen adecuadamente, entonces encierre el número más alto entre
dichas opciones. Asegúrese de solo escoger una frase por grupo, incluso en el Ítem 16 (Cambios en
el patrón del sueño) o el Ítem 18 (Cambios en el Apetito).
1. Tristeza
0
No me siento triste
1
Me siento triste muchas veces
2
Siempre estoy triste
3
Estoy tan triste o infeliz que no puedo soportarlo
2. Pesimismo
0
No me siento desanimado con mi futuro
1
Estoy más desanimado sobre mi futuro que lo habitual
2
No espero que las cosas salgan bien para mí
3
Siento que mi futuro es desesperanzador y únicamente va a empeorar
3. Fracasos pasados
0
No me siento fracasado
1
He tenido más fracasos que los que debería
2
Cada vez que miro al pasado, veo un montón de fracasos
3
Siento que como persona soy un total fracasado
4. Desgana
0
Disfruto tanto de las cosas que me agradan como siempre lo he hecho
1
No disfruto las cosas tanto como lo habitual
2
Experimento muy poco placer de las cosas que solía disfrutar
3
No obtengo ningún placer de las cosas que solía disfrutar
5. Sentimientos de culpa
0
No tengo ningún remordimiento de consciencia en particular
1
Me siento culpable sobre muchas cosas que hice o debí haber hecho.
2
Siento mucha culpa la mayoría de las veces.
3
Siento mucha culpa todo el tiempo.
6. Sentimientos de castigo
0
No siento que merezca un castigo
1
Siento que debería ser castigado
2
Espero ser castigado
3
Siento que estoy siendo castigado
145
7. Insatisfacción con si mismo PODRIA SER AUTOIMAGEN
0
Me siento igual conmigo mismo como antes
1
He perdido confianza en mi mismo
2
Estoy disconforme con mi mismo
3
Me desagrado a mi mismo
8. Autocritica
0
No me critico o me culpabilizo más de lo usual
1
Estoy más crítico de mí mismo que lo acostumbrado
2
Me critico a mi mismo por todos mis defectos
3
Me culpabilizo de todo lo malo que sucede
9. Pensamientos o deseos de suicidio
0
No tengo ningún pensamiento de matarme
1
Tengo pensamientos de suicidio pero no los llevaría a cabo
2
Me gustaría matarme
3
Me mataría en cuanto tenga la oportunidad
10. Llanto
0
No lloro más que lo acostumbrado
1
Lloro más que lo acostumbrado
2
Lloro por cualquier cosa pequeña que suceda
3
Siento ganas de llorar pero no puedo hacerlo.
11. Inquietud
0
No me siento más intranquilo o herido que lo usual
1
Me siento más intranquilo o herido que lo usual
2
Estoy más intranquilo o agitado que es difícil mantenerme sosegado
3
Estoy tan intranquilo o agitado que tengo que mantenerme moviendo o haciendo algo
12. Perdida de interés
0
No he perdido el interés en otras personas o actividades
1
Estoy menos interesado en otras personas o cosas que antes
2
He perdido mucho de mi interés en otras personas
3
Me es difícil conseguir interesarme en algo
13. Indecisión
0
Tomo decisiones tan bien como siempre
1
Encuentro más difícil tomar decisiones que lo usual
2
Tengo una gran dificultad en hacer decisiones que lo acostumbrado
3
Tengo problemas en tomar cualquier decisión
14. Desprecio
0
No siento que sea despreciable
1
No me considero como alguien valioso y útil como solía hacerlo.
2
Me siento más despreciable comparado con otras personas
3
Me siento totalmente despreciable
15. Perdida de energía
146
0
1
2
3
Tengo tanta energía como siempre
Tengo menos energía que la que usualmente tengo
No tengo la suficiente energía para hacer mucho
No tengo la suficiente energía para hacer nada
16. Cambios en el patrón del sueño
0
No he experimentado algún cambio en mi patrón del sueño
1a
duermo un poco más que lo usual
1b
duermo un poco menos usual
2a
duermo mucho más que usual
2b
duermo mucho menos que lo usual
3a
Duermo la mayor parte del día.
3b
Me despierto 1 o 2 horas más temprano y luego no puedo volver a dormir
17. Irritabilidad
0
No estoy más irritable que lo usual
1
estoy más irritable que lo usual
2
estoy mucho más irritable que lo usual
3
estoy irritable todo el tiempo
18. Cambios en el apetito
0
no he experimentado algún cambio en mi apetito
1a
mi apetito es un poco menor que lo usual
1b
mi apetito es un poco mayor que lo usual
2a
mi apetito es mucho menor que antes
2b
mi apetito mucho más grande que usual
3a
no tengo apetito del todo
3b
Tengo hambre todo el tiempo.
19. Dificultades de concentración
0
me puedo concentrar también como siempre
1
No me puedo concentrar tan bien como lo usual
2
es difícil mantener mi mente en algo por mucho tiempo
3
encuentro que no puedo concentrarme en nada
20. Cansancio o fatiga
0
estoy más aburrido o cansado que usual
1
consigo aburrirme o cansarme más fácilmente que antes
2
estoy tan aburrido o cansado al hacer un montón de cosas de lo acostumbrado.
3
estoy tan aburrido o cansado para hacer muchas de las cosas que lo acostumbrado
21. Perdida de interés en el sexo
0
no he encontrado un cambio reciente en mi interés en el sexo
1
Estoy menos interesado en sexo que lo acostumbrado
2
Estoy mucho menos interesado en sexo ahora
3
He perdido el interés en el sexo completamente
147
Anexo 8:Unificación de Traducciones
Nombre: ____________________________ Estado Civil: ________________ Edad: _____ Sexo: ____
Ocupación: __________________________ Nivel Educativo: ____________________________________
Instrucciones: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones cuidadosamente y luego seleccione
en cada grupo la frase que mejor describa la forma en que usted se ha estado sintiendo durante las dos últimas semanas, incluyendo hoy.
Encierre con un círculo el número que está a la par de la frase que haya seleccionado. Si varias oraciones en un grupo parecen aplicar de igual
manera, encierre el número más alto correspondiente a ese grupo. Asegúrese de no escoger más de una frase en cualquier grupo, incluyendo el
punto 16 (Cambios en el Patrón del Sueño) o el punto 18 (Cambios en el Apetito).
Tristeza
4
5
6
7
No me siento triste.
Me siento triste la mayor parte del tiempo.
Me siento triste todo el tiempo.
Me siento tan triste e infeliz que no puedo
soportarlo.
Pesimismo
4 No me siento desanimado sobre mi futuro.
5 Me siento más desanimado sobre mi futuro de lo
que solía estarlo.
6 No espero que las cosas vayan a funcionar para
mí.
7 Siento que no tengo esperanzas en mi futuro y
más bien será peor.
Fracasos del Pasado
4 No me siento como un fracasado.
5 Siento que he fracasado más de lo que debí.
6 Cuando pienso en el pasado, recuerdo muchos
fracasos.
7 Siento que soy un total fracaso como persona.
Pérdida de Satisfacción
4 Siento tanta satisfacción de las cosas que disfruto al
igual que antes.
5 No disfruto tanto de las cosas como solía hacerlo.
6 Obtengo poca satisfacción de las cosas que solía
disfrutar.
7 No obtengo satisfacción alguna de las cosas que
solía disfrutar.
Sentimientos de Castigo
4
No siento que merezca ser castigado.
5
Siento que debo ser castigado.
6
Espero ser castigado.
7
Siento que estoy siendo castigado.
Auto-desprecio
4
Me siento igual conmigo mismo como siempre.
He perdido la confianza en mí mismo.
5
Me siento decepcionado de mí mismo.
6
Me odio a mí mismo.
Autocrítica
4
No me critico ni me culpo más de lo usual.
5
Me critico más de lo que solía hacerlo.
6
Me critico por todos mis fallos y defectos.
7
Me culpo por todo lo malo que pasa.
Pensamientos o Deseos de Suicidio
4 No tengo pensamiento alguno de matarme
5 Tengo pensamientos de matarme pero no lo haría.
6 Me gustaría matarme.
7 Me mataría si tuviera la oportunidad de hacerlo.
Llanto
4
5
6
7
No lloro más de lo que solía hacerlo.
Lloro más de lo que solía hacerlo.
Lloro por cualquier cosa pequeña que suceda.
Siento ganas de llorar pero no puedo hacerlo.
Sentimientos de Culpabilidad
4 No me siento culpable en particular.
5 Me siento culpable por varias cosas que he hecho o
que debí hacer.
6 Me siento bastante culpable la mayor parte del
tiempo.
7 Me siento culpable todo el tiempo.
148
Inquietud
4 No me siento más inquieto o intranquilo de lo
normal.
5 Me siento más inquieto o intranquilo de lo
normal.
6 Me siento tan inquieto o intranquilo que me es
difícil quedarme quieto.
7 Me siento tan inquieto o intranquilo que tengo que
estar moviéndome o haciendo algo.
Pérdida de interés
4 No he perdido el interés en las personas o en las
actividades.
5 Tengo menos interés en las personas o en las
actividades que antes.
6 He perdido la mayoría del interés en las personas
o en las actividades.
7 Me resulta difícil interesarme en algo.
Indecisión
4 Tomo decisiones tan bien como siempre.
5 Tengo más dificultad en la toma de decisiones de
lo normal.
6 Tengo mucha mayor dificultad en la toma de
decisiones que antes.
7 Tengo problemas a la hora de tomar decisiones.
Baja Autoestima
4 No siento que yo valga la pena.
5 No me considero como alguien valioso y útil
como solía hacerlo.
6 Me siento más inútil que las demás personas.
7 Me siento extremadamente inútil.
Pérdida de energía
4 Tengo tanta energía como siempre.
5 Tengo menos energía que antes.
6 No tengo la suficiente energía para hacer mucho.
7 No tengo la suficiente energía para hacer nada.
Cambios en el Patrón del Sueño
1 No he tenido ningún cambio en mi patrón del
sueño.
1a Duermo un poco más de lo usual.
1b Duermo un poco menos de lo usual.
Irritabilidad
4 No me siento más irritado de lo normal.
5 Me siento más irritado de lo normal.
6 Me siento mucho más irritado de lo normal.
7 Me siento irritado todo el tiempo.
Cambios en el Apetito
1 No he experimentado ningún cambio en mi
apetito.
_________________________________________
1a Mi apetito es un poco menor de lo usual
1b Mi apetito es un poco mayor de lo usual.
_________________________________________
2a Mi apetito es mucho menor de lo usual.
2b Mi apetito es mucho mayor de lo usual.
________________________________________
3a No tengo apetito del todo.
3b Tengo hambre todo el tiempo.
Dificultad de Concentración
4 Me puedo concentrar tan bien como siempre.
5 No me puedo concentrar tan bien como antes.
6 Se me hace difícil mantener mi mente en algo
por mucho tiempo.
7 Siento que no me puedo concentrar en nada.
Aburrimiento o cansancio
4 No me siento más cansado o aburrido de lo
normal.
5 Me canso o me aburro más fácilmente de lo
normal.
6 Me siento demasiado cansado o aburrido para
hacer muchas de las cosas que solía hacer.
7 Me siento demasiado cansado o aburrido para
hacer la mayoría de las cosas que solía hacer.
Pérdida de interés en el sexo
4 No he notado ningún cambio reciente en mi
interés por el sexo.
5 Estoy menos interesado en el sexo de lo que
solía estarlo.
6 Estoy mucho menos interesado en el sexo
ahora.
7 He perdido el interés en el sexo completamente.
_____________________________________
2a
Duermo mucho más de lo usual.
2b Duermo mucho menos de lo usual.
_____________________________________
3a Duermo la mayor parte del día.
3b Me despierto 1 ó 2 horas más temprano y no
puedo volverme a dormir.
149
Anexo 9: Primer borrador resultante de la primera fase: Traducción del Instrumento
Nombre: ____________________________ Estado Civil: ________________ Edad: _____ Sexo: ____
Ocupación: __________________________ Nivel Educativo: ____________________________________
Instrucciones: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones cuidadosamente y
luego seleccione en cada grupo la frase que mejor describa la forma en que usted se ha estado sintiendo durante las dos
últimas semanas, incluyendo hoy. Encierre con un círculo el número que está a la par de la frase que haya seleccionado. Si
varias oraciones en un grupo parecen aplicar de igual manera, encierre el número más alto correspondiente a ese grupo.
Asegúrese de no escoger más de una frase en cualquier grupo, incluyendo el punto 16 (Cambios en el Patrón del Sueño) o el
punto 18 (Cambios en el Apetito).
Tristeza
0.
1.
2.
3.
Sentimientos de Castigo
No me siento triste.
Me siento triste la mayor parte del tiempo.
Me siento triste todo el tiempo.
Me siento tan triste e infeliz que no puedo soportarlo.
Pesimismo
0.
1.
2.
3.
3.
No siento que merezca ser castigado.
Siento que debo ser castigado.
Espero ser castigado.
Siento que estoy siendo castigado.
Auto-desprecio
No me siento desanimado sobre mi futuro.
Me siento más desanimado sobre mi futuro de lo que
solía estarlo.
No espero que las cosas vallan a funcionar para mí.
Siento que no tengo esperanzas en mi futuro y más
bien será peor.
Fracasos del Pasado
0.
1.
2.
8
9
10
11
No me siento como un fracasado.
Siento que he fracasado más de lo que debí.
Cuando pienso en el pasado, recuerdo muchos
fracasos.
Siento que soy un total fracaso como persona.
7
8
9
Autocrítica
8
9
10
11
8
Sentimientos de Culpabilidad
No me critico ni me culpo más de lo usual.
Me critico más de lo que solía hacerlo.
Me critico por todos mis fallos y defectos.
Me culpo por todo lo malo que pasa.
Pensamientos o Deseos de Suicidio
Pérdida de Satisfacción
Siento tanta satisfacción de las cosas que disfruto al
igual que antes.
9 No disfruto tanto de las cosas como solía hacerlo.
10 Obtengo poca satisfacción de las cosas que solía
disfrutar.
11 No obtengo ninguna satisfacción de las cosas que solía
disfrutar.
Me siento igual conmigo mismo como siempre.
He perdido la confianza en mí mismo.
Me siento decepcionado de mí mismo.
Me odio a mí mismo.
8
9
10
11
No tengo pensamiento alguno de matarme
Tengo pensamientos de matarme pero no lo haría.
Me gustaría matarme.
Me mataría si tuviera la oportunidad de hacerlo.
8
9
10
11
No lloro más de lo que solía hacerlo.
Lloro más de lo que solía hacerlo.
Lloro por cualquier cosa pequeña que suceda.
Siento ganas de llorar pero no puedo hacerlo.
Llanto
8
9
No me siento culpable en particular.
Me siento culpable por varias cosas que he hecho o
que debí hacer.
10 Me siento bastante culpable la mayor parte del tiempo.
11 Me siento culpable todo el tiempo.
150
4.
Inquietud
10. Irritabilidad
8 No me siento más inquieto o intranquilo de lo normal.
9 Me siento más inquieto o intranquilo de lo normal.
10 Me siento tan inquieto o intranquilo que me es difícil
quedarme quieto.
11 Me siento tan inquieto o intranquilo que tengo que estar
moviéndome o haciendo algo.
8
9
10
11
5.
2
No he experimentado ningún cambio en mi apetito.
_________________________________________
1a Mi apetito es un poco menor de lo usual
1b Mi apetito es un poco mayor de lo usual.
_________________________________________
2a Mi apetito es mucho menor de lo usual.
2b Mi apetito es mucho mayor de lo usual.
________________________________________
3a No tengo apetito del todo.
3b Tengo hambre todo el tiempo.
Pérdida de interés
8
No he perdido el interés en las personas o en las
actividades.
9 Tengo menos interés en las personas o en las
actividades que antes.
10 He perdido la mayoría del interés en las personas o en
las actividades.
11 Me resulta difícil interesarme en algo.
6.
8
9
Indecisión
Tomo decisiones tan bien como siempre.
Tengo más dificultad en la toma de decisiones de lo
normal.
10 Tengo mucha mayor dificultad en la toma de decisiones
que antes.
11 Tengo problemas a la hora de tomar decisiones.
7.
Baja Autoestima
8
9
No me siento inútil
No me considero como alguien valioso y útil como
antes.
10 Me siento más inútil que las demás personas.
11 Me siento extremadamente inútil.
8.
Pérdida de energía
8
9
10
11
Tengo tanta energía como siempre.
Tengo menos energía que antes.
No tengo la suficiente energía para hacer mucho.
No tengo la suficiente energía para hacer nada.
9.
Cambios en el Patrón del Sueño
2
No he tenido ningún cambio en mi patrón del sueño.
No me siento más irritable de lo normal.
Me siento más irritable de lo normal.
Me siento mucho más irritable de lo normal.
Me siento irritable todo el tiempo.
11. Cambios en el Apetito
12.
Dificultad de Concentración
8
Me puedo concentrar tan bien como siempre.
9
No me puedo concentrar tan bien como antes.
10 Se me hace difícil mantener mi mente en algo por
mucho tiempo.
11 Siento que no me puedo concentrar en nada.
13. Cansancio o fatiga
4.
5.
6.
7.
No me siento más cansado o fatigado de lo normal.
Me canso o me fatigo más fácilmente de lo normal.
Me siento demasiado cansado o fatigado para hacer
muchas de las cosas que solía hacer.
Me siento demasiado cansado o fatigado para hacer
la mayoría de las cosas que solía hacer.
14. Pérdida de interés en el sexo
8.
No he notado ningún cambio reciente en mi interés
por el sexo.
9. Estoy menos interesado en el sexo de lo que solía
estarlo.
10. Estoy mucho menos interesado en el sexo ahora.
11. He perdido el interés en el sexo completamente.
1a Duermo un poco más de lo usual.
1b Duermo un poco menos de lo usual.
_____________________________________
2a
Duermo mucho más de lo usual.
2b Duermo mucho menos de lo usual.
_____________________________________
3a Duermo la mayor parte del día.
3b
Me despierto 1 ó 2 horas más temprano y no puedo
volverme a dormir.
151
Anexo 10: Guía de Entrevista Cognitiva
Tarea
Problema
Pruebas
Ítem del BDI
INSTRUCCIONES:
Identifique problemas en todas
las introducciones,
instrucciones o explicaciones
desde la perspectiva del
encuestado
Introducciones, instrucciones o
explicaciones complicadas,
confusas o vagas.
¿Antes de pasar a las
preguntas, podría repetirme
con sus propias palabras la
instrucción que acaba de oír o
leer?
instrucciones
CLARIDAD DE LAS
PREGUNTAS O
REACTIVOS: Identifique
problemas relacionados con la
intención o significado de las
preguntas
La pregunta es muy larga o rara,
la sintaxis es compleja, la
redacción es incorrecta
¿Puede decirme con sus
propias palabras que es lo que
le acabo de preguntar?, ¿puede
decirme con sus propias
palabras la frase que acaba de
leer?
Todos
Los términos técnicos están
poco definidos, son muy
complejos, no están claros
¿Qué significa para usted la
palabra (término) en esta
pregunta?
Existen múltiples formas de
interpretar la pregunta, la
redacción es vaga o
ambivalente.
¿En qué estaba pensando usted
cuando le pregunté sobre…?
¿Podría darme ejemplos?,
¿cuáles aspectos incluye el
término…? ¿Cuáles no están
contemplados en este término?
152
SUPUESTOS: Determine si
existen problemas con los
presupuestos o la lógica
subyacente a las preguntas
CONOCIMIENTO /MEMORIA:
Verifique si los encuestados
tienen problemas para saber o
recordar la información que se
solicita.
Los períodos de tiempo no
están especificados, son vagos
o contradictorios.
¿Usted puede recordar ese
período sobre el que le estoy
preguntando?, Usted contestó
(repetir la respuesta), ¿cuándo
fue eso?, ¿qué período abarca
eso?
Los supuestos sobre la
situación del entrevistado o su
experiencia son inapropiados.
¿Qué tanto se aplica esta
pregunta a su experiencia?,
¿qué tan lejos está esta
situación de su experiencia
cotidiana?, ¿puede explicarme
más su situación?
Se asume una experiencia o
conducta constante y estable
que en realidad puede variar.
¿Diría usted que eso le pasa
siempre?, ¿diría usted que eso
varía dependiendo de algo?
El reactivo contiene más de
una pregunta implícita o hace
referencia a más de un objeto
actitudinal.
Usted acaba decir “depende”,
¿depende de qué?; cuénteme
más acerca de sus opiniones
sobre este tema.
La persona no tiene
conocimiento sobre el tema y
es probable que no tenga una
actitud al respecto
La actitud (evaluación) al
respecto puede no estar
consolidada o no existe
¿Qué tanto conoce sobre (tema)?,
¿qué tan seguro se siente usted al
hablar sobre (tema)?
¿Había pensado usted antes en
(tema)?, ¿qué tan
153
frecuentemente ha pensado
usted al respecto?
El entrevistado puede no
recordar la información
solicitada.
¿Para usted fue esto fácil o
difícil recordar?, ¿qué tan
seguro está usted de eso?, ¿por
qué?
La pregunta requiere de un
proceso mental complejo.
¿Qué fue lo que usted hizo
mentalmente para contestar
esta pregunta?, ¿en qué pensó
primero?, ¿cómo llegó usted a
esa respuesta?
SENSIBILIDAD: Revise las
La pregunta hace referencia a
preguntas o palabras de naturaleza tópicos privados, embarazosos,
sensible
que implican conductas no
deseadas o ilegales.
¿Está bien hablar de estos
temas en una encuesta o se
siente muy incómodo?; en
general, ¿cómo se siente usted
ante este tipo de preguntas?
La redacción de los reactivos o
los términos utilizados son
poco sensibles, ofensivos o
ajenos a la experiencia de los
entrevistados.
En esta pregunta, utilizamos el
término (palabra sensible), ¿le
suena bien a usted o utilizaría
otro término?
El reactivo evoca respuestas
socialmente aceptadas
(deseabilidad social).
¿Le parece que se puede dar
cualquier respuesta a esta
pregunta o más bien le parece
que hay una respuesta correcta
154
a esta pregunta?
CATEGORÍAS DE
RESPUESTA: Verifique qué tan
adecuadas son las categorías de
respuesta de cada pregunta
Las preguntas abiertas son
difíciles o inapropiadas.
¿Fue fácil o difícil para usted
decidir cuál respuesta dar a
esta pregunta?
Existe desajuste entre la
pregunta y las categorías de
respuesta.
En esta lista que le di, ¿fue
fácil o difícil encontrar la
respuesta que usted quería dar?
Los términos técnicos en las
opciones de respuesta son poco
claros, complejos o están sin
definir.
Las categorías de respuesta
pueden ser interpretadas de
múltiples maneras (vaguedad).
De esta lista, ¿qué significa para
usted (término)?
Existe un traslape entre las
categorías de respuesta.
¿Qué tan fácil o difícil le
resultó escoger la respuesta
dentro de esta lista de
opciones?, ¿por qué escogió
usted esta respuesta y no las
otras?
Hay opciones de respuesta
ausentes.
En esta lista que le di, ¿fue
fácil o difícil encontrar la
Dígame qué se le viene a usted
a la mente cuando le digo
(categorías de respuesta) /
cuando ve está escala de
respuestas
155
respuesta que usted quería dar?
El orden de las categorías de
respuesta es ilógico
¿Fue fácil o difícil para usted
decidir cuál respuesta dar a
esta pregunta?; al ver esta lista
de posibles respuestas, ¿usted
encontró alguna dificultad para
entenderla?
Fuente: Adaptación de Smith y Molina (2011) de Willis (2005)
156
Anexo 11: Versión final Adaptación Inventario de Depresión de Beck II
Estado Civil: __________ Edad: _____ Sexo: ____ Lugar donde vive____________________
Ocupación: __________________ Nivel Educativo: ________________Fecha_____________
Instrucciones: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones
cuidadosamente y luego escoja en cada grupo únicamente la frase que mejor describa la forma en que usted se ha
estado sintiendo durante las dos últimas semanas, incluyendo hoy. Encierre con un círculo el número que está a la par
de la frase que haya seleccionado. Si le cuesta mucho decidirse entre dos opciones, escoja la que tenga el número más
alto. Asegúrese de no escoger más de una frase en cualquier grupo, incluyendo el punto 16 (Cambios en el Patrón del
Sueño) o el punto 18 (Cambios en el Apetito).
Tristeza
12.
13.
14.
15.
No me siento triste.
Me siento triste la mayor parte del tiempo.
Me siento triste todo el tiempo.
Me siento tan triste e infeliz que no puedo soportarlo.
Sensación de Castigo
12
13
14
15
Pesimismo
15.
16.
17.
18.
No siento desanimo sobre mi futuro.
Siento más desanimo sobre mi futuro de lo usual.
No espero que las cosas vayan a funcionar para mí.
Creo que no tengo esperanzas en mi futuro y que más
bien será peor.
Fracasos del pasado
19. No me siento como un(a) fracasado(a).
20. Creo que he fracasado más de lo que debí.
21. Cuando pienso en el pasado, recuerdo muchos
fracasos.
22. Creo que soy un total fracaso como persona.
Pérdida de satisfacción
12 Disfruto de las cosas que me gustan tanto como antes
13 No disfruto tanto de las cosas como solía hacerlo.
14 Obtengo poca satisfacción de las cosas que solía
disfrutar.
15 No obtengo ninguna satisfacción de las cosas que
antes disfrutaba.
Sentimientos de culpa
12 No me siento culpable por algo en particular.
13 Me siento culpable por algunas cosas que he hecho o
que debí hacer.
14 Me siento bastante culpable la mayor parte del
tiempo.
15 Me siento culpable todo el tiempo.
No creo que esté siendo castigado(a).
Creo que puedo ser castigado(a).
Espero recibir mi castigo(a).
Creo que estoy siendo castigado (a).
Disconformidad con mi mismo (a)
10
11
12
13
Me siento igual conmigo mismo(a) como antes.
He perdido la confianza en mí mismo (a).
Me siento decepcionado (a) de mí mismo (a).
No me gusta como soy.
Autocríticas
12
13
14
15
No me critico ni me culpo más de lo usual.
Me critico más de lo que solía hacerlo.
Me critico por todos mis fallos y defectos.
Me culpo por todo lo malo que pasa.
Pensamientos o deseos de Suicidio
12
13
14
15
No tengo ningún pensamiento de suicidio
Tengo pensamientos de suicidio pero no lo haría.
Me gustaría suicidarme.
Me suicidaría apenas tenga la oportunidad de
hacerlo
Llanto
12
13
14
15
No lloro más de lo que solía hacerlo antes.
Lloro más de lo que solía hacerlo antes.
Lloro por cualquier cosa.
Tengo ganas de llorar pero no puedo hacerlo.
Agitación
12 No me siento más inquieto(a) o agitado(a) de lo
normal.
13 Me siento más inquieto(a) o agitado(a) de lo
normal.
14 Me siento tan inquieto(a) o agitado(a) que me es
difícil quedarme en un solo lugar.
15 Me siento tan inquieto(a) o agitado(a) que tengo
que estar moviéndome o haciendo algo.
Pérdida de interés
12 No he perdido el interés por las personas o las
actividades.
13 Tengo menos interés en las personas o en las
actividades que antes.
14 He perdido la mayoría del interés en las personas
o en las actividades.
15 Es difícil que algo me interese.
Indecisión
12 Tomo decisiones tan bien como siempre.
13 Tengo más dificultad en la toma de decisiones de
lo normal.
14 Tengo mucha mayor dificultad en la toma de
decisiones que antes.
15 Tengo problemas a la hora de tomar decisiones.
Inutilidad
12
13
14
15
No me siento inútil
No me considero tan valioso(a) y útil como antes.
Me siento más inútil que las demás personas.
Me siento extremadamente inútil.
Pérdida de energía
12 Tengo tanta energía como siempre.
13 Tengo menos energía que antes.
14 No tengo la suficiente energía para hacer muchas
cosas.
15 No tengo energía para nada.
Irritabilidad
12
13
14
15
No me siento más irritable de lo normal.
Me siento más irritable de lo normal.
Me siento mucho más irritable de lo normal.
Me siento irritable todo el tiempo.
Cambios en el Apetito
3
1a
1b
2a
2b
3a
3b
No he experimentado ningún cambio en mi apetito.
Mi apetito es un poco menor de lo usual
Mi apetito es un poco mayor de lo usual.
Mi apetito es mucho menor de lo usual.
Mi apetito es mucho mayor de lo usual.
No tengo apetito del todo.
Tengo hambre todo el tiempo.
Dificultad de Concentración
12 Me puedo concentrar tan bien como siempre.
13 No me puedo concentrar tan bien como antes.
14 Me cuesta mantenerme concentrado en algo durante
mucho tiempo
15 Me parece que no me puedo concentrar en nada.
Cansancio o fatiga
16. No me siento más cansado(a) o fatigado(a) de lo
normal.
17. Me canso o me fatigo más fácilmente de lo normal.
18. Me siento tan cansado(a) o fatigado(a) como para
hacer muchas de las cosas que solía hacer.
19. Me siento tan cansado(a) o fatigado(a) como para
hacer la mayoría de las cosas que solía hacer.
Pérdida de interés en el sexo
20. No he notado ningún cambio reciente en mi interés
por el sexo.
21. Tengo menos interés en el sexo del que solía tener.
22. Tengo mucho menos interés en el sexo ahora.
23. He perdido completamente el interés en el sexo
Cambios en los Hábitos de Sueño
3
1a
1b
2a
2b
3a
3b
No he tenido ningún cambio en mis hábitos de
sueño.
Duermo un poco más de lo usual.
Duermo un poco menos de lo usual.
Duermo mucho más de lo usual.
Duermo mucho menos de lo usual.
Duermo la mayor parte del día.
Me despierto 1 ó 2 horas más temprano y no puedo
volverme a dormir.
Puntuación página 1 ____
Puntuación página 2 ____
Puntuación Total (págs. 1 + 2) ____
158
Anexo 12: Escala MDI
Instrucciones: Este es un cuestionario diseñado para describir algunos de sus sentimientos
y actitudes. Lea cuidadosamente cada pregunta. Marque con una X si es verdadera (V) o
falso (F). No deje ninguna pregunta sin contestar.
1.
A menudo me siento débil y cansado (a)
V
F
2.
Mi pensamiento es preciso y claro
V
F
3.
A menudo me remuerde la consciencia
V
F
4.
Generalmente me siento inferior
V
F
5.
Me siento mejor cuanto menos gente haya alrededor
V
F
6.
Mi futuro parece cada vez mejor y mejor
V
F
7.
Me encolerizo cuando alguien me contradice
V
F
8.
Soy una persona feliz
V
F
9.
Las personas no me tratan justamente
V
F
10.
A menudo me siento con pereza y lento
V
F
11.
Mis pensamientos son a menudo confusos
V
F
12.
Me he dejado vencer muchas veces
V
F
13.
La opinión que tengo de mi mismo es bastante alta
V
F
14.
Soy un solitario (a)
V
F
15.
Mi futuro parece prometedor (color de rosa)
V
F
16.
Usualmente no discuto con la gente
V
F
17.
Frecuentemente me siento alto de espíritu
V
F
18.
Nadie me considera como me siento
V
F
19.
Mi nivel de energía es generalmente alto
V
F
20.
Generalmente tomo las decisiones con facilidad
V
F
21.
Difícilmente me arrepiento de mis acciones
V
F
22.
Con frecuencia me siento inútil
V
F
23.
Usualmente no me afecta estar entre multitudes
V
F
159
24.
Las cosas se ponen cada vez mejor en mi vida
V
F
25.
La mayoría del tiempo tengo poca paciencia
V
F
26.
Usualmente me siento decaído (a)
V
F
27.
Generalmente obtengo adecuada consideración
V
F
28.
Usualmente me siento lleno (a) de energía
V
F
29.
Mis pensamientos avanzan como círculos a mi alrededor
V
F
30.
A menudo me siento mal de las cosas que he hecho
V
F
31.
A menudo siento que soy un inútil
V
F
32.
Generalmente deseo que la gente me deje solo (a)
V
F
33.
A menudo pienso negativamente sobre el futuro
V
F
34.
Pierdo la paciencia fácilmente
V
F
35.
Frecuentemente me siento triste
V
F
36.
Nadie parece tener suficiente interés en mi
V
F
37.
Usualmente me siento vivo (a) y lleno (a) de energía
V
F
38.
Mi mente por lo general esta atormentada por la confusión
V
F
39.
A menudo me siento culpable
V
F
40.
Estoy seguro de que a la mayoría de la gente me encuentra aburrida (o)
V
F
41.
Soy una persona sociable y amistosa
V
F
42.
Mi futuro, en general, se ve bastante brillante
V
F
43.
Usualmente tengo un temperamento desagradable
V
F
44.
Mi vitalidad es usualmente alta
V
F
45.
Siempre tengo dificultades para tomar decisiones importantes
V
F
46.
Hago muchas cosas de las que luego me arrepiento
V
F
47.
Me parece que nunca hago algo correcto
V
F
¡Muchas Gracias por su participación!
160
Anexo 13: ESCALA DE AFECTO POSITIVO Y NEGATIVO PANAS
Instrucciones: Responda a las siguientes preguntas sobre cómo se ha sentido
en el ÚLTIMO MES. Por favor, lea cada una con detenimiento y RODEE con
un CÍRCULO el número que en cada una se ajuste mejor al grado en que se ha
sentido, conforme al siguiente criterio:
1 = Nada o muy ligeramente
2 = Un poco
3 = Moderadamente
4 = Bastante
5 = Mucho
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
Atento/a
Angustiado/a
Interesado/a por cosas
Preocupado/a, alterado/a
Alerta
Hostil
Excitado/a
Irritable
Entusiasmado/a
Asustado/a
Inspirado/a
Temeroso/a
Orgulloso/a
Avergonzado/a
Resuelto/a, decidido/a
Culpable
Fuerte
Nervioso/a
Activo/a
Ansioso/a
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
5
161
Anexo 14:Plantilla de Observación Transcrita Pruebas Piloto con la Prueba
Tiempo de lectura y
llenado de
Consentimiento
(Minutos y segundos)
Tiempo de lectura y
llenado de
Cuestionario
(Minutos y segundos)
Comprensión de los ítems
A: No hace preguntas
B: Hace 1 pregunta
C: Hace 2 o 3 preguntas
D: Hace más de 3 preguntas
Dificultades
lectoescritura
A: No requiere apoyo
B: Requiere apoyo en la
lectura
7:20
6:31
A
A
7:01
7:04
6:40
5:37
A
A
A
A
0:27
1:30
B
A
6
4:23
5:35
5:36
6:02
A
A
A
B
7
7:21
8:00
C
A
8
5:32
5:07
A
A
9
6:27
6:17
A
A
10
6:45
6:44
A
A
11
6:28
6:48
A
A
12
8:29
7:49
A
A
13
5:33
4:27
A
A
14
0:34
1:49
A
A
15
8:44
7:55
B
A
16
8:23
8:45
A
A
17
7:40
6:23
A
A
18
7:23
6:12
A
A
19
6:17
6:45
A
A
20
5:49
2:34
A
A
21
5:38
4:38
A
A
22
5:12
9:24
A
B
23
5: 01
2:34
A
A
24
8:04
7:44
A
A
25
8:20
7:47
A
A
26
7:43
7:12
A
A
27
7:35
6:32
B
A
28
6:36
6:25
A
A
29
7:12
6:30
A
A
30
6:59
6:22
A
A
31
7:03
6:44
A
A
32
5:48
2:34
A
A
33
5:34
3:13
A
A
34
5:20
9:12
A
B
35
5:24
7:45
A
B
36
0:24
2:33
A
A
37
4:12
5:23
A
A
38
3:47
4:45
A
A
39
7:52
7:27
B
A
40
2:25
2:50
A
A
1
2
3
Sujetos Pruebas Piloto
4
5
162
Anexo 15: Revisión Interjueces Validez de Contenido
Trabajo Final de Graduación: Adaptación Segunda Versión del Inventario de Depresión de
Beck al Contexto Costarricense.
Proceso de Revisión Interjueces, Validez de Contenido
Investigador a cargo: Dennis Redondo Alfaro
Directora de Tesis: Ana María Jurado Solórzano
Revisor: ____________________________________________________________
Grado Académico: ____________________________________________________
Mi nombre es Dennis Redondo Alfaro y me encuentro realizando una adaptación del
Inventario de Depresión de Beck (BDI-II) al contexto costarricense. El BDI II es un
instrumento de medición que determina el grado de severidad de la Depresión. De esta
manera cada uno de los 21 ítems o reactivos intentan guardar correspondencia con
alguna conducta propia del cuadro sintomatológico del trastorno a manera de auto
informe.
Es necesario en el proceso de validación de la adaptación, garantizar su validez de
contenido, es decir que el conjunto de ítems que integran la prueba realmente reflejen de
forma aceptable al constructo del que se deriva. Se le ha invitado a usted como parte de
un comité de expertos con el objetivo de contar con su juicio en torno a la
correspondencia entre cada reactivo del Inventario y el constructo teórico de Depresión,
del cual la prueba parte.
El procedimiento es el siguiente:
1.
2.
3.
Por favor, lea con cuidado cada reactivo de la prueba.
Reflexione qué tanto considera que el reactivo guarda relación con el constructo
de Depresión.
A la par de cada enunciado de cada reactivo se encuentra un cuadrado. Dentro del
mismo escriba un número del 1 al 4, para cada ítem siguiendo la siguiente escala
de clasificación de 4 puntos:
1: No relevante
2: Algo relevante
3: Muy relevante
4: Totalmente relevante
Entonces por ejemplo, si considera que un ítem no tiene correspondencia en la
sintomatologíatípica de la Depresión escriba“1”. Si al contrario cree que es absolutamente
relevante escriba“4”. Solo puede escribir uno de esos 4 números por cada reactivo.
Procure que ninguno quede en blanco.
4.
Al final aparecen algunas preguntas, no olvide considerarlas.
163
Inventario de Depresión de Beck II
Estado Civil: __________ Edad: _____ Sexo: ____ Lugar donde vive____________________
Ocupación: __________________ Nivel Educativo: ________________Fecha_____________
Instrucciones: Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de oraciones cuidadosamente y luego
escoja en cada grupo únicamente la frase que mejor describa la forma en que usted se ha estado sintiendo durante las dos últimas
semanas, incluyendo hoy. Encierre con un círculo el número que está a la par de la frase que haya seleccionado. Si le cuesta
mucho decidirse entre dos opciones, escoja la que tenga el número más alto. Asegúrese de no escoger más de una frase en
cualquier grupo, incluyendo el punto 16 (Cambios en el Patrón del Sueño) o el punto 18 (Cambios en el Apetito).
Tristeza
8
9
10
11
No me siento triste.
Me siento triste la mayor parte del tiempo.
Me siento triste todo el tiempo.
Me siento tan triste e infeliz que no puedo
soportarlo.
Pesimismo
8
9
No siento desanimo sobre mi futuro.
Siento más desanimo sobre mi futuro de lo
usual.
10 No espero que las cosas vayan a funcionar para
mí.
11 Creo que no tengo esperanzas en mi futuro y
que más bien será peor.
Fracasos del pasado
8 No me siento como un(a) fracasado(a).
9 Creo que he fracasado más de lo que debí.
10 Cuando pienso en el pasado, recuerdo muchos
fracasos.
11 Creo que soy un total fracaso como persona.
Pérdida de satisfacción
16 Disfruto de las cosas que me gustan tanto como
antes
17 No disfruto tanto de las cosas como solía hacerlo.
18 Obtengo poca satisfacción de las cosas que solía
disfrutar.
19 No obtengo ninguna satisfacción de las cosas que
antes disfrutaba.
Sensación de Castigo
16
17
18
19
No creo que esté siendo castigado.
Creo que puedo ser castigado.
Espero recibir mi castigo.
Creo que estoy siendo castigado (a).
Disconformidad con mi mismo (a)
14
15
16
17
Me siento igual conmigo mismo(a) como antes.
He perdido la confianza en mí mismo (a).
Me siento decepcionado (a) de mí mismo (a).
No me gusta como soy.
Autocríticas
16
17
18
19
No me critico ni me culpo más de lo usual.
Me critico más de lo que solía hacerlo.
Me critico por todos mis fallos y defectos.
Me culpo por todo lo malo que pasa.
Pensamientos o deseos de Suicidio
16
17
18
19
No tengo ningún pensamiento de suicidio
Tengo pensamientos de suicidio pero no lo haría.
Me gustaría suicidarme.
Me suicidaría apenas tenga la oportunidad de
hacerlo
Llanto
16
17
18
19
No lloro más de lo que solía hacerlo antes.
Lloro más de lo que solía hacerlo antes.
Lloro por cualquier cosa.
Tengo ganas de llorar pero no puedo hacerlo.
Sentimientos de culpa
16 No me siento culpable por algo en particular.
17 Me siento culpable por algunas cosas que he
hecho o que debí hacer.
18 Me siento bastante culpable la mayor parte del
tiempo.
19 Me siento culpable todo el tiempo.
164
Agitación
16 No me siento más inquieto(a) o agitado(a) de lo
normal.
17 Me siento más inquieto(a) o agitado(a) de lo
normal.
18 Me siento tan inquieto(a) o agitado(a) que me es
difícil quedarme en un solo lugar.
19 Me siento tan inquieto(a) o agitado(a) que tengo
que estar moviéndome o haciendo algo.
Pérdida de interés
16 No he perdido el interés por las personas o las
actividades.
17 Tengo menos interés en las personas o en las
actividades que antes.
18 He perdido la mayoría del interés en las personas
o en las actividades.
19 Es difícil que algo me interese.
Indecisión
16 Tomo decisiones tan bien como siempre.
17 Tengo más dificultad en la toma de decisiones de
lo normal.
18 Tengo mucha mayor dificultad en la toma de
decisiones que antes.
19 Tengo problemas a la hora de tomar decisiones.
Inutilidad
16
17
18
19
No me siento inútil
No me considero tan valioso(a) y útil como antes.
Me siento más inútil que las demás personas.
Me siento extremadamente inútil.
Pérdida de energía
16 Tengo tanta energía como siempre.
17 Tengo menos energía que antes.
18 No tengo la suficiente energía para hacer muchas
cosas.
19 No tengo energía para nada.
Irritabilidad
16
17
18
19
No me siento más irritable de lo normal.
Me siento más irritable de lo normal.
Me siento mucho más irritable de lo normal.
Me siento irritable todo el tiempo.
Cambios en el Apetito
4
1a
1b
2a
2b
3a
3b
No he experimentado ningún cambio en mi apetito.
Mi apetito es un poco menor de lo usual
Mi apetito es un poco mayor de lo usual.
Mi apetito es mucho menor de lo usual.
Mi apetito es mucho mayor de lo usual.
No tengo apetito del todo.
Tengo hambre todo el tiempo.
Dificultad de Concentración
16 Me puedo concentrar tan bien como siempre.
17 No me puedo concentrar tan bien como antes.
18 Me cuesta mantenerme concentrado en algo durante
mucho tiempo
19 Me parece que no me puedo concentrar en nada.
Cansancio o fatiga
8 No me siento más cansado o fatigado de lo normal.
9 Me canso o me fatigo más fácilmente de lo normal.
10 Me siento tan cansado o fatigado como para hacer
muchas de las cosas que solía hacer.
11 Me siento tan cansado o fatigado como para hacer la
mayoría de las cosas que solía hacer.
Pérdida de interés en el sexo
8
No he notado ningún cambio reciente en mi interés
por el sexo.
9 Tengo menos interés en el sexo del que solía tener.
10 Tengo mucho menos interés en el sexo ahora.
11 He perdido completamente el interés en el sexo
Cambios en los Hábitos de Sueño
4
1a
1b
2a
2b
3a
3b
No he tenido ningún cambio en mis hábitos de
sueño.
Duermo un poco más de lo usual.
Duermo un poco menos de lo usual.
Duermo mucho más de lo usual.
Duermo mucho menos de lo usual.
Duermo la mayor parte del día.
Me despierto 1 ó 2 horas más temprano y no puedo
volverme a dormir.
165
Preguntas finales
Aparte de los ítems indicados en el BDI II, ¿considera es necesario añadir otros que los
autores originales hayan obviado? ¿Cuales?
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
_______________________________________________________________________
¿Considera pertinente el uso clínico de este instrumento en evaluación de la Depresión?
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
_______________________________________________________________________
¿Utilizaría el BDI en su trabajo clínico con pacientes cuando sospeche presentan
sintomatología Depresiva?
Si ( ) No ( )
¿Por qué?
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
_______________________________________________________________________
Alguna observación que desee añadir:
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
_______________________________________________________________________
Muchas gracias por su colaboración.
Su criterio será de gran valor para la investigación.
166
Anexo 16: Manual de Uso
167
Aaron T. Beck, Robert A. Steer. Gregory K. Brown.
BDI-II. Inventario de Depresión de
Beck. Segunda Edición.
Manual de la Adaptación al Contexto Costarricense
Adaptación. Dennis Redondo Alfaro
2015
Aaron T. Beck
Robert A. Steer
Gregory K. Brown
BDI-II
INVENTARIO DE DEPRESIÓN
DE BECK
Segunda Edición
Adaptación al Contexto Costarricense
Manual de Uso
Adaptación: Dennis Redondo Alfaro
2015
Reconocimientos
Dra. Ana María Jurado Solórzano. Directora de Tesis
Dr. Roberto Lopez Coré. Lector de Tesis
Msc. Alfonso Villalobos. Lector de Tesis
Msc. Maria Elena Murillo. Tutora Institucional CCSS.
Autor: Dennis Redondo Alfaro
TABLA DE CONTENIDO
INTRODUCCIÓN.......................................................................................................................... 6
CARACTERÍSTICAS GENERALES................................................................................................... 7
DESARROLLO Y EVOLUCIÓN ........................................................................................................ 8
PROCESO DE ADAPTACIÓN A COSTA RICA .......................................................................... 10
Etapa 1: Adaptación del instrumento ................................................................................ 11
Traducción y adaptación del instrumento.................................................................... 11
Revisión de la versión traducida o adaptada ............................................................... 12
Adaptar el borrador del instrumento con base en las sugerencias de los jueces ... 12
Etapa 2: Pruebas con el instrumento ................................................................................. 13
Prueba piloto del instrumento......................................................................................... 13
Prueba de campo.............................................................................................................. 13
Etapa 3: Análisis y Exposición de la calidad psicométrica del instrumento ............... 14
Estandarizar las puntuaciones ........................................................................................ 15
Realizar una investigación sobre la validación del instrumento ............................... 15
CARACTERÍSTICAS PSICOMÉTRICAS DE LA ADAPTACIÓN .................................................. 16
Evidencias de Fiabilidad...................................................................................................... 16
Estabilidad de la Medida ................................................................................................ 16
Homogeneidad de la Medida ......................................................................................... 16
Evidencias de Validez .......................................................................................................... 17
Validez de Contenido ...................................................................................................... 17
Validez Estructural ............................................................................................................ 17
Validez Convergente y Divergente .................................................................................. 2
Validez Diagnóstica ........................................................................................................... 4
ADMINISTRACIÓN Y PUNTUACIÓN DEL BDI ............................................................................. 8
REFERENCIAS BIBLIOGRÁFICAS................................................................................................ 10
INTRODUCCIÓN
Como trastorno afectivo, la Depresión es un constructo psicológico que presenta dentro de
sus principales características la particularidad de poseer una alta prevalencia e incidencia
a nivel nacional. Además, no solamente es un trastorno común sino que, debido a que sus
implicaciones limitan al sujeto desde el plano afectivo hasta el conductual, fisiológico,
cognitivo e incluso el interpersonal; suele presentar criterios elevados de frecuencia,
intensidad y duración, variables que acentúan su nivel de complejidad y apremio clínico
Por tal razón se toma la decisión de realizar una adaptación de la segunda versión del
Inventario de Depresión de Beck (BDI-II), como instrumento de ayuda en el diagnóstico
clínico de la depresión. Dicho proceso de Investigación se enmarcó como Trabajo Final de
Graduación para optar por el grado de Licenciatura en la Escuela de Psicología de la
Universidad de Costa Rica.
Por medio de este manual se pretende mostrar las características que tuvo dicha
adaptación, además de mostrar las normas de Administración y Puntuación con el fin de
proveer al lector, un instrumento que le facilite el diagnostico clínico y le posibilite de
mayor precisión.
CARACTERÍSTICAS GENERALES
El Inventario de Depresión de Beck en su segunda versión (BDI-II) es un cuestionario
autoaplicado de 21 ítems, los cuales evalúan un amplio cúmulo de síntomas depresivos
(uno por cada ítem), con una edad mínima de trece años. Cada ítem contiene cuatro
opciones, las cuales varían en intensidad del síntoma, desde 0 (ausencia o síntoma leve)
hasta 4 (presencia disfuncional del mismo). Entre sus usos principales se encuentra la
evaluación de cambio en pacientes con tratamiento de depresión y el diagnostico de la
misma (Pérez y Muñoz, 2004).
El BDI-II ha sido utilizado en múltiples contextos en el ámbito clínico y en la
investigación. La aceptación que ha recibido del medio internacional ha sido muy
importante al punto de constituirse, según Sanz, Navarro y Vázquez (2003) en el
instrumento de autoaplicación en evaluación de depresión más usado tanto en el ámbito
clínico como en investigación. Los autores de la prueba señalan como en los primeros 25
años del instrumento ya se habían producido más de 1500 artículos haciendo referencia a
su uso, así como múltiples investigaciones empíricas demostrando su utilidad. (Beck, Steer
y Brown, 2009).
Según Pérez y Muñoz (2004), posee capacidad discriminativa entre: 1. Pacientes con y sin
trastorno depresivo, 2. Pacientes con distimia de aquellos con un trastorno depresivo
mayor y 3. Pacientes con un trastorno de ansiedad generalizada de aquellos con un
trastorno depresivo mayor. No obstante, el BDI-II no está diseñado para diferenciar entre
distintos trastornos depresivos, sino solo entre dimensiones de depresión. Los mismos
autores señalan que la prueba es muy sensible al cambio terapéutico y puede ser
administrado de forma repetida. (Beck, Steer y Brown, 2009)
DESARROLLO Y EVOLUCIÓN
El antecesor del BDI-II, el BDI creado en 1963, fue formulado en base a la construcción
del concepto de depresión que se sostenía en ese momento tomando como principio
fundamental la teoría de la depresión de Aaron Beck basado en lo que el autor denominó el
trío cognitivo negativo (pensamientos negativos sobre sí mismo, el mundo y el futuro)
(Butcher et al, 2006) teoría que suponía un consenso clínico en cuanto a la comprensión de
la depresión en ese momento (Sanz et al, 2003). Para Pérez y Muñoz (2004) esta primera
versión, al ser anterior al DSM-III estaba exenta de los criterios diagnósticos y dentro de
sus objetivos no se encontraba la clasificación. La misma se desarrolló por tanto a partir de
la experiencia clínica de Beck en psicoanálisis.
A lo largo de los años, conforme su teoría fue adquiriendo mayor coherencia, elaboración y
respaldo investigativo, se tornó necesaria la modificación del BDI inicial. La versión inicial
la cual apenas constaba de una escala de valoración de uso para el clínico desarrollada en
1961, fue modificada para 1978 por un cuestionario autoaplicado de 21 ítems, cada uno con
cuatro opciones de respuesta (BDI-IA).
No obstante, con el surgimiento e influencia del DSM-III (y posteriores) y la introducción
de definiciones como la distimia y la depresión mayor, surgen investigaciones que
desacreditan la capacidad discriminativa del BDI-IA, señalando su falta de adecuación a
los criterios diagnósticos emergentes en la depresión. Sanz et al, 2003, señala que el BDI
I-A no cubre el criterio sintomático de enlentecimiento o agitación psicomotor, cubre
síntomas (hipocondría y desesperanza) que no son propios del episodio depresivo mayor
para el DSM y, no permite evaluar sintomatología depresiva durante el periodo de tiempo
mínimo (2 semanas).
A la luz de estas deficiencias, en 1994 Beck y sus colaboradores comienzan con el trabajo
piloto y es en 1996 cuando surge el BDI-II, el cual según Pérez y Muñoz (2004) continua
conservando la misma estructura de 21 ítems de cuatro valores pero varía dos aspectos
importantes, la anterior ventana de medida de una semana a dos y algunos ítems de
importancia, los cuales para los mismos autores y para Sanz et al (2003) se modifican con
el objetivo de cubrir los distintos criterios diagnósticos del DSM.
PROCESO DE ADAPTACIÓN A COSTA RICA
El estudio se realizó principalmente en dos poblaciones diferentes: una población general y
una población clínica con sintomatología depresiva teniendo todos los sujetos más de 18
años. Para la población general se trabajó con 618 sujetos procedentes del Gran Área
Metropolitana. Se decidió trabajar con este sector de la población nacional únicamente por
razones de factibilidad, ya que resultaba metodológicamente imposible cubrir con
representatividad estadística toda la población nacional.
Con la población clínica se trabajó con 70 sujetos, tomados de 2 fuentes:

Casos clínicos que maneja la Caja Costarricense de Seguro Social (CCSS) en
consulta externa del Hospital Psiquiátrico Roberto Chacón Paut.

Apoyo por parte de profesionales en Psicología.
El proceso de adaptación de la prueba BDI–II fue dividido en siete fases siguiendo en
estricto orden los lineamientos internacionalmente aceptados y reconocidos para la
adaptación y estandarización de pruebas psicológicas (Geissenger, 1994). Esas 7 fases han
sido agrupadas en tres categorías o etapas, con lo que se pretende sistematizar el avance de
la investigación en cuanto a ejes temáticos: “La Adaptación del Instrumento”, “Pruebas con
el Instrumento” y “Análisis y exposición de las cualidades psicométricas del instrumento”.
La metodología utilizada, en apego a las primeras siete fases propuestas por Geissenger
(1994), se describe a continuación.
Etapa 1: Adaptación del instrumento
Esta fase está determinada por la revisión y redacción de los criterios adecuados con los
que se presentará la prueba en su versión final. Tuvo por objetivo traducir el inventario con
las palabras más apropiadas para cada ítem de modo que resulten lo mejor comprensibles
para la población costarricense. Está conformada por los tres primeros pasos que propone
Geissenger (1994).
Traducción y adaptación del instrumento
Consiste en una valoración de si el instrumento amerita ser traducido de su lengua original
pregunta por pregunta. En el caso del BDI –II, su idioma original es el inglés, lo cual obliga
su traducción. Para esto se trabajó en varias subfases paralelas:
Traducción de la prueba. Se realizaron dos procesos simultáneos:
Traducción de la prueba por parte de un traductor
profesional
Traducción por parte del investigador responsable del
proyecto.
Comparación y unificación de las dos versiones. Una vez obtenidas ambas versiones, las mismas
se unificaron.
Comparación con la versión española y argentina. La versión resultante se comparó con las dos
versiones que existen en el idioma español.
Redacción de un borrador. Al final se creó un primer borrador o propuesta.
Revisión de la versión traducida o adaptada
En este proceso el borrador que surgió de la fase anterior se les administró a distintas
personas con el fin de que evaluaran y valoraran la calidad de la traducción. Las
recomendaciones obtenidas en esta fase constituyeron insumos de la revisión que se
procuraría para la siguiente. Se tomaron en cuenta los criterios de dos tipos de jueces, un
primer grupo compuesto por profesionales en Psicología y un segundo compuesto por
personas de Población General.
Adaptar el borrador del instrumento con base en las sugerencias de los
jueces
Consistió en una valoración de las correcciones ofrecidas por los profesionales en la fase
anterior y una modificación de la prueba según las indicaciones ofrecidas por los jueces. Al
realizarse dicha integración, la prueba se sometió finalmente a dos procesos de esta fase:
una traducción inversa y posteriormente una revisión y corrección por parte de un
profesional en Filología.
Etapa 2: Pruebas con el instrumento
Una vez realizada la traducción y adaptación del instrumento, fue necesario comprobar su
comportamiento con una muestra de participantes. Para lograr esto, se realizaron varias
aplicaciones con el instrumento resultante de la Etapa 1. El objetivo al que obedece es el de
evaluar la comprensión de los ítems del inventario desde la perspectiva de una sub muestra
de personas de la población general. Le conforman las siguientes fases de igual manera
propuestas por Geissenger (1994):
Prueba piloto del instrumento
El borrador final se aplicó a una población de prueba, con el objetivo de observar el
comportamiento del instrumento en una posterior prueba de campo. Se trabajó con 40
personas de población general ubicados en el parque Central de San José. Se les administro
consentimiento informado y la adaptación del cuestionario BDI II.
Prueba de campo
En esta fase la adaptación final del BDI-II con las debidas correcciones realizadas y
habiendo tomado en cuenta que la prueba piloto se dio con éxito, se aplicó a la muestra del
GAM. A su vez, para disminuir al máximo las posibilidades de valores perdidos, siempre se
contó con la presencia y fiscalización del investigador, garantizándose que la prueba fuera
contestada en su totalidad.
Básicamente, se utilizaron dos tipos de muestra, ambas del Gran Área Metropolitana: Una
derivada de la población general y otra de la población clínica
Población General
Con el objetivo de revisar los criterios de validez y fiabilidad de la prueba, con respecto a la
validez interna se utilizó una muestra de 51 personas para el procedimiento test-retest;
mientras que para la validez convergente y divergente se les aplicó a 281 personas (251 de
población general y 30 población clínica) en conjunto con el BDI-II el instrumento MDI
(Multiscore Depression Inventory, adaptado en 1997) y el Possitive and Negative Affect
Schedule (Escala de afecto positivo y negativo PANAS)
En cuanto a la población clínica, la investigación tomó en cuenta personas que presentasen
sintomatología básica de Trastorno de Depresión Mayor según los criterios del DSM-V),
tomándose en cuenta referencias realizadas únicamente por evaluaciones de profesionales
en psicología y psiquiatría, tanto de los servicios de la CCSS, como de consulta clínica
privada. De esta forma se pudo obtener una muestra de 70 personas población clínica.
Etapa 3: Análisis y Exposición de la calidad
psicométrica del instrumento
Una vez obtenidos todos los datos necesarios, se procedió a la fase final, la cual constó de
una revisión y exposición de los principales datos de la prueba como instrumento de
medición viable. Para conseguir dicha revisión, en esta fase se dio una sistematización de
toda la información obtenida en las pruebas de campo en el programa análisis estadístico
SPSS. En esta fase se revisó indicadores de validez y fiabilidad de la prueba.
Estandarizar las puntuaciones
Dado que el objetivo de esta fase consiste en determinar que la prueba cuenta con garantías
suficientes per se para demostrar que mide con integridad, consistencia y veracidad, se
evidencia a través de los indicadores de fiabilidad con los siguientes procedimientos:

Relacionados con la Estabilidad de la medida: Procedimiento Test Retest a través
de Correlaciones Pearson/Spearman

Relacionadas con la Homogeneidad de la medida: Alpha de Cronbach

Relacionadas con la Objetividad de la medida: No fueron necesarias pruebas en
este rubro ya que se utiliza para pruebas con calificación en la que influye a
subjetividad del evaluador.
Realizar una investigación sobre la validación del instrumento
Con respecto a indicadores de validez se realizaron los siguientes procedimientos:

Validez contenido: Criterio de Acuerdo Interjueces

Validez Estructural: Análisis factorial exploratorio.

Validez Concurrente/discriminante: Correlaciones con MDI y Panas

Validez diagnóstica: Análisis de medias entre poblaciones. Puntos de corte (ROC)
CARACTERÍSTICAS PSICOMÉTRICAS DE LA
ADAPTACIÓN
Evidencias de Fiabilidad
Estabilidad de la Medida
La prueba test Retest, aplicada en 51 participantes de población general a un espacio de 15
días entre cada aplicación, tal como indica la Tabla 1 se revela un coeficiente de correlación
de Pearson de .954 entre una aplicación y la otra. Estos resultados indican que la prueba
presenta adecuados indicadores de Fiabilidad en cuanto a la Estabilidad de la Medida.
Tabla 1: Estadísticos de Fiabilidad Test Retest
Cronbach's Alpha
Correlation Between Forms
Spearman-Brown Coefficient
Part 1
Value
N of Items
Part 2
Value
N of Items
Total N of Items
.901
21
.935
21
42
.954
Equal Length
.976
Unequal Length
.976
Guttman Split-Half Coefficient
.975
Homogeneidad de la Medida
Tal como indica la Tabla 2, para población general se obtuvo un coeficiente de
homogeneidad Alpha de Crombach de .908, para la población clínica el alpha fue de .885.
Estos resultados indican una alta correlación delos ítems de la prueba entre sí, siendo
suficiente para garantizar la fiabilidad de la escala.
Tabla 2: Alpha de Crombach en las distintas muestras
Coeficiente Alfa de Crombach
Población General
.908
Cuestionarios En Línea
.891
Población Clínica
.885
Evidencias de Validez
Validez de Contenido
Este tipo de validez se indagó por medio de un cuestionario de criterio interjueces. En el
mismo cada juez debía anotar un número en escala del 1 al 4 para cada ítem siguiendo la
siguiente clasificación de 4 puntos:
1. No relevante
2. Algo relevante
3. Muy relevante
4. Totalmente relevante
Se contó con 3 participantes expertos, dos master en psicología y un licenciado. Al
promediar la calificación de los tres y estandarizarlo en escala 0 a 1, el promedio final fue
de 0,84.
Validez Estructural
Para este estudio se llevaron a cabo dos tipos de análisis factoriales: Exploratorio y
confirmatorio.
Análisis Factorial Exploratorio
Al proceder con el análisis Factorial Exploratorio, se utilizó
una rotación Oblicua
acompañada de una normalización de Kaiser
La siguiente tabla 3 presenta los resultados del total de la Varianza explicada por los dos
principales factores presentados. La extracción de componentes indica 2 autovalores
eigenvalue superior a 1 y por tanto 2 factores.
Tabla 3: Total de la Varianza Explicada por valores Eigenvalue
Factor
Eigenvalues Iniciales
Total
% de
%
Varianza
Acumulativo
1
6.869
32.710
32.710
2
1.487
7.080
39.790
3
1.097
5.222
45.012
4
1.029
4.900
49.912
5
.867
4.130
54.042
6
.866
4.122
58.164
7
.838
3.989
62.154
8
.750
3.571
65.725
9
.728
3.468
69.193
10
.701
3.339
72.532
11
.671
3.196
75.728
12
.631
3.006
78.733
13
.620
2.951
81.684
14
.580
2.762
84.447
15
.551
2.624
87.071
16
.541
2.576
89.647
17
.510
2.429
92.076
18
.468
2.229
94.305
19
.416
1.979
96.284
20
.400
1.903
98.188
21
.381
1.812
100.000
Método de Extracción: Principal Axis Factoring
Sumas de la Extracción de
Cargas al Cuadrado
Total
% de
Varianza
6.226
29.646
.869
4.136
Sumas de la Rotación de
Cargas al Cuadrado
% Acumulativo
Total
29.646
33.782
5.636
4.867
En la siguiente tabla se aprecia el peso de distribución de las cargas factoriales de cada ítem
con respecto a los dos factores mencionados:
Tabla 1: Matriz de configuración de
factores
Componente
1
2
.653
-.014
.653
-.014
.706
-.109
.179
.519
.477
.102
.803
-.177
.660
.087
Tristeza
Pesimismo
Fracasos del pasado
Pérdida de Satisfacción
Sentimientos de culpa
Sensación de Castigo
Disconformidad con mi
mismo
Autocriticas
.488
.221
Pensamientos o deseos
.722
.102
de Suicidio
Llanto
.645
-.099
Agitación
.459
.172
Pérdida de Interés
.160
.479
Indecisión
.312
.338
Inutilidad
.468
.192
Pérdida de Energía
-.249
.924
Cambios en los Hábitos
.021
.641
de Sueño
Irritabilidad
.134
.486
Cambios en el Apetito
.175
.535
Dificultad de
-.050
.689
Concentración
Cansancio o Fatiga
-.102
.841
Pérdida de interés en el
.430
.327
sexo
Método de extracción: Análisis de
componentes principales.
Método de rotación: Normalización Promax
con Kaiser.
Por último, se muestra una correlación entre ambos de .655, dato que evidencia una alta
asociación entre ambos factores.
Tabla 2: Matriz de correlaciones de componentes
Componente
1
2
1
1.000
.655
2
.655
1.000
Método de extracción: Análisis de componentes
principales.
Método de rotación: Normalización Promax con Kaiser.
Análisis Factorial Confirmatorio
Dado que en el Análisis Factorial Exploratorio se sugiere la existencia de que dos
factores asumen la distribución de las cargas factoriales, los resultados del Análisis
Factorial Confirmatorio reafirman la distribución de las cargas factoriales con
significancia estadística en los dos factores. En la Tabla 6 se denota que todos los pesos
son estadísticamente significativos con un nivel de confianza del 95% puesto que en
todos los casos la relación crítica (C.R.) de la desviación estándar (S.E.) es superior a
1.96. En todos los ítems, p < .001.
Tabla 6: Pesos de Regresión por factores
Estimado
S.E.
C.R.
P
Tristeza
<---
Cognitivoemocional
1,000
Pesimismo
<---
Cognitivoemocional
1,328
,110
12,028
***
Fracasos
<---
Cognitivoemocional
1,604
,138
11,640
***
Culpa
<---
Cognitivoemocional
1,149
,106
10,842
***
Castigo
<---
Cognitivoemocional
1,929
,158
12,211
***
Disconformidad
<---
Cognitivoemocional
2,166
,158
13,676
***
Autocriticas
<---
Cognitivoemocional
1,952
,154
12,685
***
Suicidio
<---
Cognitivoemocional
1,195
,082
14,652
***
Inutilidad
<---
Cognitivoemocional
1,254
,102
12,287
***
Agitación
<---
Cognitivoemocional
1,731
,152
11,407
***
Llanto
<---
Cognitivoemocional
1,695
,159
10,634
***
Satisfaccion
<---
ConductualFisiologico
1,000
Interés
<---
ConductualFisiologico
1,138
,095
11,926
***
Sueño
<---
ConductualFisiologico
1,210
,097
12,526
***
Energía
<---
ConductualFisiologico
1,074
,082
13,093
***
Apetito
<---
ConductualFisiologico
1,327
,100
13,236
***
Concentración
<---
ConductualFisiologico
1,083
,089
12,114
***
Cansancio
<---
ConductualFisiologico
1,296
,092
14,031
***
Irritabilidad
<---
ConductualFisiologico
,936
,081
11,588
***
Indecisión
<---
ConductualFisiologico
1,296
,109
11,924
***
Interessexual
<---
ConductualFisiologico
1,100
,080
13,822
***
En cuanto a los pesos factoriales para la solución estandarizada, vienen representados en
la Tabla 7. Los mismos arrojan indicadores estadísticamente aceptables en cuanto a la
vinculación con su respectivo factor teóricamente asumido.
Tabla 3: Pesos de Regresión estandarizados
Tristeza
Pesimismo
Fracasos
Culpa
Castigo
Disconformidad
Autocriticas
Suicidio
Inutilidad
Agitación
Llanto
Satisfaccion
Interés
Sueño
Energía
Apetito
Concentración
Cansancio
Irritabilidad
Indecisión
Interessexual
<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<--<---
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
Cognitivoemocional
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
ConductualFisiologico
Estimado
,593
,585
,561
,513
,597
,698
,628
,774
,602
,546
,501
,625
,558
,592
,625
,634
,568
,683
,539
,558
,670
Finalmente en la tabla 9 las correlaciones entre ambos factores, siendo estimada en .861.
Tabla 9: Correlaciones entre Factores
Estimado
Cognitivoemocional
<-->
ConductualFisiologico
,861
Validez Convergente y Divergente
Población General
Como indica la Tabla 10, los análisis de correlaciones de Pearson entre las pruebas
mencionadas sugieren correlaciones positivas entre el BDI-II con el MDI y la escala de
Afecto Negativo del PANAS (.828 y .690 respectivamente) con significancia estadística
a dos colas. Por otro lado, entre el BDI II y la escala de Afecto Positivo existe
discrepancia ya que correlacionan de forma negativa entre ambas con un coeficiente de
correlación de Pearson de -.278 a una significancia estadística de dos colas.
De esta forma las puntuaciones del BDI concuerdan con los resultados arrojados por sus
homólogos MDI y escala de Afecto Negativo de PANAS, y se distancia de los
resultados de la escala de Afecto Positivo del PANAS.
Tabla 4: Correlaciones entre BDI-II, MDI y PANAS Población General
BDI
BDI
Correlación de Pearson
1
Afecto
Positivo
Negativo
MDI
-.278**
.690**
.828**
.000
.000
.000
249
219
228
203
-.278**
1
-.072
-.412**
Sig. (bilateral)
N
Afecto
Afecto
Correlación de Pearson
Positivo
Sig. (bilateral)
.000
.292
.000
N
219
226
217
188
.690**
-.072
1
.704**
Afecto
Correlación de Pearson
Negativo
Sig. (bilateral)
.000
.292
N
228
217
235
199
.828**
-.412**
.704**
1
Sig. (bilateral)
.000
.000
.000
N
203
188
199
MDI
Correlación de Pearson
**. La correlación es significativa al nivel 0,01 (bilateral).
.000
211
Población Clínica
En cuanto a Validez Convergente, según la tabla 11 las correlaciones entre el BDI y la
escala de Afecto Negativo relatan una fuerte asociación entre ambas con un coeficiente
de correlación de Pearson de .877. A su vez con el MDI se delata un .675, confirmando
la fuerte asociación entre ambas.
En esta línea, la escala de Afecto Negativo también correlaciona de forma positiva con
el MDI, señalando un .716 como coeficiente.
Con respecto a Validez Divergente, la escala de Afecto Positivo discrepa fuertemente
con las otras mediciones, siendo correlaciones negativas en todos los casos: -.813, -.846
y -840 para el BDI, la escala de Afecto Negativo y el MDI respectivamente.
Tabla 11: Correlaciones entre BDI-II, MDI y PANAS Población Clínica
BDI
BDI
Correlación de Pearson
1
Afecto
Correlación de Pearson
Positivo
Sig. (bilateral)
N
Afecto
Correlación de Pearson
Negativo
Sig. (bilateral)
N
MDI
Correlación de Pearson
Sig. (bilateral)
N
Afecto
MDI
Positivo
Negativo
-.813**
.877**
.675**
.000
.000
.000
30
30
30
30
-.813**
1
-.846**
-.840**
.000
.000
Sig. (bilateral)
N
Afecto
.000
30
30
30
30
.877**
-.846**
1
.716**
.000
.000
30
30
30
30
.675**
-.840**
.716**
1
.000
.000
.000
30
30
30
**. La correlación es significativa al nivel 0,01 (bilateral).
.000
30
Validez Diagnóstica
La tabla 12 muestra las diferencias de medias entre ambos grupos de muestras,
Población general y clínica. Para la muestra de Población General se seleccionó al azar
un conjunto de 79 personas, con el objetivo de que fuese homologable con su
correspondiente en la muestra clínica de igual cantidad. De esta tabla se desprende la
diferencia de medias, la tabla 13 muestra como la diferencia entre las mismas es
estadísticamente significativa.
Tabla 12: Medias y desviaciones estándares de las puntuaciones del BDI-II por muestra
Muestra
N
Media
Desviación típ.
Error típ. de la media
Población General
79
9.09
9.292
1.045
Población Clínica
79
33.00
10.785
1.213
Tabla 13: Prueba T para muestras independientes medias por muestra
Prueba de Levene
para la igualdad
de varianzas
F
Se han
asumido
varianza
s iguales
No se
han
asumido
varianza
s iguales
3.525
Sig.
.062
Prueba T para la igualdad de medias
t
gl
Sig.
(bilateral)
Diferencia
de medias
Error típ.
de la
diferenci
a
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-14.930
156
.000
-23.911
1.602
27.075
-20.748
-14.930
152
.66
1
.000
-23.911
1.602
27.076
-20.747
En concordancia con la figura 1 donde se muestra la Curva COR, en la tabla 14 se
muestra que el Área bajo la Curva es de .937 siendo esta aceptable. Obteniendo las
coordenadas de la Curva COR y convirtiéndolas a porcentajes, en la tabla 43 se muestra
la sensibilidad y especificidad para los puntos de corte del BDI-II en función de su
discriminación entre pacientes con depresión y muestra General. El punto de corte que
corresponde a 14,50 ofrece una sensibilidad de 95,5% y una especificidad de 73,1%.
Por tanto, según la muestra participante de esta investigación, una puntuación por
encima de 15 se puede considerar un buen criterio para identificar alrededor del 95%
individuos con Depresión correctamente y siendo menor a esta ofrece un estimado de
discriminación de alrededor del 75% de individuos sin Depresión.
Figura1: Curva COR
Tabla 14: Área bajo la curva
Área
Error típ.a
Sig. asintóticab
Intervalo de confianza asintótico al 95%
Límite inferior
.937
.020
a. Bajo el supuesto no paramétrico
b. Hipótesis nula: área verdadera = 0,5
.000
.897
Límite superior
.977
Tabla 15: Porcentajes de Sensibilidad, especificidad para la detección de Depresión
Mayor para cada punto de corte del BDI-II
Positivo si es mayor o igual
quea
Sensibilidad (en %)
Especificidad (en %)
-1,00
100
0
,50
100
11,9402985
1,50
100
17,9104478
2,50
100
23,880597
3,50
100
31,3432836
4,50
100
38,8059701
5,50
100
44,7761194
6,50
100
52,238806
7,50
100
58,2089552
8,50
100
61,1940299
9,50
98,5074627
67,1641791
11,00
98,5074627
68,6567164
12,50
97,0149254
68,6567164
13,50
97,0149254
71,641791
14,50
95,5223881
73,1343284
15,50
94,0298507
77,6119403
16,50
94,0298507
79,1044776
17,50
94,0298507
83,5820896
18,50
91,0447761
83,5820896
19,50
88,0597015
85,0746269
20,50
86,5671642
86,5671642
21,50
82,0895522
88,0597015
22,50
79,1044776
89,5522388
23,50
77,6119403
89,5522388
25,00
73,1343284
89,5522388
26,50
68,6567164
92,5373134
27,50
65,6716418
92,5373134
28,50
64,1791045
94,0298507
29,50
61,1940299
95,5223881
30,50
61,1940299
97,0149254
31,50
58,2089552
97,0149254
32,50
53,7313433
97,0149254
33,50
50,7462687
97,0149254
34,50
44,7761194
97,0149254
35,50
43,2835821
97,0149254
36,50
37,3134328
98,5074627
37,50
29,8507463
98,5074627
38,50
26,8656716
98,5074627
39,50
23,880597
98,5074627
40,50
22,3880597
98,5074627
41,50
19,4029851
98,5074627
42,50
19,4029851
100
43,50
17,9104478
100
44,50
14,9253731
100
45,50
13,4328358
100
46,50
10,4477612
100
47,50
8,95522388
100
51,50
2,98507463
100
56,00
0
100
a. El menor valor de corte es el valor de contraste observado mínimo menos 1,
mientras que el mayor valor de corte es el valor de contraste observado máximo
más 1. Todos los demás valores de corte son la media de dos valores de
contraste observados ordenados y consecutivos.
Por último, en la tabla 16 se muestra una propuesta de agrupación de ambas muestras
general y clínica (n: 79 para cada una) en la cual se indican 4 puntos de corte, de la
misma forma que con el BDI-II original. Dicha agrupación obedece a una distribución
por percentiles, colocando en cada rango el 25% de la muestra. El mismo queda de la
siguiente forma:
Tabla 16: Propuesta de Puntos de Corte para Costa Rica
Puntos de Corte
Rango Mínimo
Puntuación de 0 a 7
Rango Leve
Puntuación de 8 a 20
Rango Moderado
Puntuación de 21 a 34
Rango Severo
Puntuación de 34 a 63
ADMINISTRACIÓN Y PUNTUACIÓN DEL BDI
Condiciones de Administración
El BDI II no presenta requisitos muy elaborados, siendo más bien fácil su
administración. Se recomienda que el lugar donde se administra sea iluminado,
tranquilo, ventilado y con una temperatura adecuada.
Si la persona se le dificulta la lectoescritura, el administrador le puede leer los ítems en
voz alta.
Tiempo de administración
Se requieren de 5 a 10 minutos. Pacientes con Depresión severa pueden tardar más. En
el caso de administrarse de forma oral, la duración suele ser más larga.
Administración
La consigna de administración está en el mismo cuestionario. Esta la puede leer el
paciente o ser leída en voz alta por el administrador:
Este cuestionario consta de 21 grupos de oraciones. Por favor lea cada grupo de
oraciones cuidadosamente y luego seleccione en cada grupo la frase que mejor
describa la forma en que usted se ha estado sintiendo durante las dos últimas
semanas, incluyendo hoy. Encierre con un círculo el número que está a la par de
la frase que haya seleccionado. Si varias oraciones en un grupo parecen aplicar de
igual manera, encierre el número más alto correspondiente a ese grupo. Asegúrese
de no escoger más de una frase en cualquier grupo, incluyendo el punto 16
(Cambios en el Patrón del Sueño) o el punto 18 (Cambios en el Apetito).
Administración Oral
En caso de que la administración sea heteroaplicada, en lugar de la consigna anterior
se debe acompañar de la que sigue:
Este es un cuestionario. En el cuestionario hay grupos de oraciones. Le leeré cada
grupo y entonces me indica la frase que mejor describa la forma en que usted se ha
estado sintiendo durante las dos últimas semanas, incluyendo hoy.
Al leer cada enunciado se le puede solicitar al paciente:
Con cual te identificaste más
Cuál sería el adecuado en tu caso
Cual describe mejor como te has estado sintiendo
Puntuación
La puntuación del BDI II se obtiene por medio de la sumatoria de cada elección de los
21 ítems. Cada ítem es codificado en una escala de 4 puntos, que van de 0 a 3. El
máximo posible correspondería a 63 (21 x 3) y el mínimo 0.
REFERENCIAS BIBLIOGRÁFICAS
Beck, A., Steer, R., & Brown, G. (1996/2009).Manual para el Inventario de Depresión
de Beck—II. (1ª Reimpresión).Buenos Aires: Paidós.
Butcher, J., Mineka, S., Hooley, J. (2007). Psicología Clínica. Madrid: Pearson.
Geissenger, K. (1994). Cross-Cultural Normative Assessment: Translation and
Adaptation Issues Influencing the Normative Interpretation of Assessment
Instruments. Psychological Assessment, 6(4), 304-312.
Pérez, E., & Muñoz, M. (2004). Inventario de Depresión de Beck. En R. FernándezBallesteros (Ed.), Evaluación Psicológica. Conceptos, Métodos y Estudio de
casos. Madrid: Pirámide.
Sanz, J., Navarro, M., y Vázquez, C. (2003). Adaptación española del Inventario para la
Depresión de Beck-II (BDI-II): 1.Propiedades psicométricas en estudiantes
universitarios. Análisis y Modificación de Conducta, 29(124), 239-288.
Descargar