¿Funciona el tratamiento de los agresores? Una revisión meta-analítica del tratamiento de la violencia doméstica. Julia C. Babcocka,*, Charles E. Greena, Chet Robie Resumen Esta revisión metaanalítica examina los hallazgos de 22 estudios que evalúan la eficacia del tratamiento para hombres violentos en el ámbito doméstico. Se revisó la literatura de resultados de los estudios controlados cuasiexperimentales y experimentales para probar el impacto relativo del modelo de Duluth, la terapia cognitivo-conductual (TCC) y otros tipos de tratamiento sobre la reincidencia posterior de la violencia. El diseño del estudio y el tipo de tratamiento se probaron como moderadores. El diseño del tratamiento tendió a tener una pequeña influencia en el tamaño del efecto. No hubo diferencias en los tamaños del efecto al comparar el modelo de Duluth versus las intervenciones de tipo TCC. En general, los efectos debidos al tratamiento se encontraban en un rango pequeño, lo que significa que las intervenciones actuales tienen un impacto mínimo en la reducción de la reincidencia más allá del efecto de ser arrestado. Se presentan analogías con el tratamiento para otras poblaciones para su comparación. Se discuten las implicaciones para las decisiones políticas y la investigación futura. Palabras clave: Modelo de Duluth; Terapia cognitivo-conductual; Reincidencia; Violencia 1.Introducción Se estima que 840.000 mujeres denunciaron agresiones a manos de una persona íntima en 1996 (Oficina de Estadísticas de Justicia, 1998), por lo que las intervenciones destinadas a abordar este creciente problema de salud pública se han centrado en los perpetradores de la violencia doméstica con la esperanza de disuadir de nuevas agresiones. Antes de la década de 1980, se prestaba poca atención a la intervención en casos de violencia doméstica (Fagan, 1989). Los temas de privacidad familiar vs. el interés superior de la sociedad eran primordiales (Zimring, 1989); a veces se pensaba que la violencia doméstica era lo mejor ''dejar tras las cortinas cerradas'' (State v. Oliver, 1874, citado en Rosenfeld, 1992). La posterior criminalización de la violencia doméstica dictaba si el delito de violencia doméstica debía conllevar rehabilitación o encarcelamiento. Desde entonces, los que abusan de sus cónyuges han "caído tradicionalmente bajo el brazo rehabilitador, en lugar del brazo punitivo del sistema de justicia penal" (Rosenfeld, 1992, p. 207). En la actualidad, con la implementación de políticas de arresto obligatorio y consejería ordenada por la corte, las intervenciones de los agresores se convirtieron en una fusión entre el castigo y la rehabilitación. 1.1. Estándares actuales de atención Mientras que las intervenciones para los agresores están lejos de ser estandarizadas, los estándares de atención de las intervenciones de maltrato han estado evolucionando en los Estados Unidos desde la década de 1990 (ver Austin & Dankwort, 1999, para una revisión). La mayoría de los Estados consideran que el autor es el único responsable del delito y, como tal, deberá rendir cuentas. La mayoría de las pautas también requieren la capacitación de facilitadores de grupo y experiencia en el trabajo de la violencia doméstica, aunque por lo general no se requieren títulos y licencias profesionales. La duración recomendada de la intervención oscila entre 12 a 52 semanas. Finalmente, el modelo de intervención de grupo es el formato de elección en el 90% de los mandatos, y la terapia individual y de pareja se considera inapropiada en la mayoría de los estándares actuales (Austin & Dankwort, 1999). En su mayor parte, los estándares estatales han sido desarrollado independientemente de la investigación empírica. A pesar de las declaraciones de que el arresto seguido de un tratamiento ordenado por la corte ofrece "una gran esperanza y potencial para romper el ciclo destructivo de la violencia" (U.S. Attorney General's Task Force on Family Violence, 1984, p. 48), hay poca evidencia empírica de que el tratamiento sea efectivo para reducir la reincidencia de la violencia familiar en un grado significativo. En su revisión de los estudios anteriores sobre los programas de tratamiento de la violencia marital, Rosenfeld (1992) concluyó que los hombres que son arrestados y reciben tratamiento completo tienen tasas de reincidencia sólo ligeramente más bajas que los hombres que son arrestados pero rechazan el tratamiento, abandonan el tratamiento o permanecen sin tratamiento. Algunos incluso han argumentado que los programas de tratamiento pueden poner a las mujeres en mayor riesgo de violencia doméstica, al contribuir a una falsa sensación de seguridad entre las mujeres maltratadas cuyos esposos han buscado tratamiento (Holtzworth-Munroe, Beatty & Anglin, 1995). Afortunadamente, en la última década, varios investigadores han llevado a cabo estudios bien diseñados capaces de arrojar algo de luz sobre las preguntas y preocupaciones con respecto a la eficacia del tratamiento de los agresores. Actualmente existe un pequeño pero creciente conjunto de investigaciones metodológicamente rigurosas sobre la eficacia de los programas actuales. El propósito de este artículo es revisar críticamente la investigación de los resultados del tratamiento sobre las intervenciones de los agresores y realizar un meta-análisis para examinar el impacto de (1) el tipo de tratamiento y (2) el diseño del estudio sobre el tamaño del efecto atribuible al tratamiento. Ya que la respuesta actual de la comunidad al maltrato es una combinación de sanciones legales más rehabilitación, el objetivo de este meta-análisis es examinar el efecto de la intervención terapéutica, más allá del efecto de las intervenciones legales. Varios estudios han resumido los efectos del tratamiento de los agresores (Babcock & LaTaillade, 2000; Davis & Taylor, 1999; Hamberger & Hastings, 1993; Levesque & Gelles, 1998; Rosenfeld, 1992; Tolman & Bennett, 1990). Después de su revisión de la literatura de investigación, Hamberger & Hastings (1993, p. 220) se hicieron la pregunta, "¿Qué sabemos sobre los efectos a corto y largo plazo del tratamiento en agresión a la esposa? Concluyen diciendo: "No mucho", debido a problemas metodológicos de la investigación existente. En su revisión cuantitativa, Rosenfeld (1992) concluyó que hay disminuciones mínimas en las tasas de reincidencia entre los que finalizan el tratamiento (36%) y los hombres que sólo reciben intervenciones del sistema legal (39%). Rosenfeld se abstuvo de realizar un metanálisis, debido al número limitado de estudios que utilizaban metodologías consistentes disponibles en ese momento. Davis & Taylor (1999) revisaron recientemente la literatura empírica sobre los resultados del tratamiento de los agresores y llegaron a conclusiones muy diferentes. Aunque no realizaron un metanálisis, calcularon los tamaños medios del efecto a partir de cinco estudios. Basándose en estos promedios, estimaron que el tamaño del efecto del tratamiento era aproximadamente h = 0,41 (menos de 0,50 se considera ''pequeño''), pero sin embargo concluyeron que ''hay pruebas bastante consistentes de que el tratamiento funciona y que el efecto del tratamiento es sustancial''' (Davis & Taylor, 1999, p. 69). Levesque y Gelles (1998) fueron los primeros en presentar un metaanálisis de 17 estudios sobre los resultados del tratamiento de los agresores. Basándose en los pequeños tamaños del efecto (hs que van de 0,18 a 0,27), concluyeron que las intervenciones de los agresores ''funcionan un poco, probablemente''. Para ayudar a aclarar algunas de estas discrepantes conclusiones, realizamos un metaanálisis formal, incluyendo los estudios más rigurosos desde el punto de vista metodológico, y nuevos hallazgos sobre experimentos recientemente concluidos. El estudio actual es el primer meta-análisis formal sobre los resultados de los estudios de los tratamientos de los agresores que se ha publicado hasta la fecha. Se intentó mejorar la investigación anterior de dos maneras. Primero, Hamberger y Hastings (1993) incluyeron en su revisión estudios que utilizaron diseños pre-post no controlados. El nivel de confianza de que cualquier cambio en el comportamiento de los agresores era, de hecho, debido al tratamiento, fue socavado porque la presencia de un grupo de control no descartó causas externas. Los estudios pre-post excluyen la estimación del tamaño de un efecto debido al tratamiento, ya que se confunden con los efectos del sistema legal, es decir, los efectos de "ser atrapado". Como tal, el presente estudio utilizó sólo estudios que poseían algún tipo de grupo de control (por ejemplo, abandono del tratamiento, otro tipo de grupo de control no equivalente, o aquellos asignados aleatoriamente a una condición sin tratamiento). Segundo, estudios previos (Davis & Taylor, 1999; Levesque & Gelles, 1998;) han reportado el tamaño del efecto del tratamiento de los agresores en términos de la h de Cohen (Cohen, 1988). Sin embargo, esta estadística no se ajusta al tamaño de la muestra y se utiliza más comúnmente en el análisis de potencia que en el metanálisis. Para tener en cuenta el tamaño de la muestra, se seleccionó el d de Cohen como la medida del tamaño del efecto en el presente estudio. 1.2. Intervenciones para agresores Sólo unas pocas modalidades de intervención han sido sometidas a pruebas empíricas rigurosas. Estos incluyen grupos de hombres con psicoeducación feministas, grupos cognitivo-conductual para hombres, manejo de la ira (una forma de tratamiento grupal cognitivo-conductual) y terapia de pareja. 1.2.1. Modelo psicoeducativo El tipo más prominente de intervención clínica con agresores es un enfoque psicoeducativo feminista (Pence & Paymar, 1993). Esta intervención, originada por el programa del Proyecto de Intervención de Abuso Doméstico de Duluth en Minnesota, es frecuentemente referido como el modelo de Duluth. Según este modelo, la causa principal de la violencia doméstica es la ideología patriarcal y la sanción social implícita o explícita del uso del poder y el control de los hombres sobre las mujeres. Este programa, desarrollado desde una perspectiva de trabajo social, típicamente evita los diagnósticos tipo DSM y no considera la intervención como terapia. Más bien, los facilitadores de grupo llevan a cabo ejercicios de concientización para cuestionar el derecho percibido del hombre a controlar o dominar a su pareja. Una herramienta fundamental del modelo de Duluth es la "Rueda de Poder y Control", que ilustra que la violencia es parte de un patrón de comportamiento que incluye la intimidación, el privilegio masculino, el aislamiento, el abuso emocional y económico, en lugar de incidentes aislados de abuso o explosiones cíclicas de cólera acumulada o sentimientos dolorosos (Pence & Paymar, 1993). Los objetivos del tratamiento del modelo de Duluth son ayudar a los hombres a cambiar el uso de los comportamientos en la Rueda de Poder y Control, que resultan en relaciones autoritarias y destructivas, a usar los comportamientos en la "Rueda de la Igualdad", que forman la base de las relaciones igualitarias (Pence & Paymar, 1993). El modelo feminista de tipo Duluth sigue siendo el tratamiento de elección indiscutible para la mayoría de las comunidades. De hecho, los estados de Iowa y Florida ordenan que los programas de intervención de maltrato se adhieran a los principios generales del modelo de Duluth para ser certificados por el estado (Abel, en prensa; Healey, Smith & O'Sullivan, 1998). 1.2.2. Grupos cognitivos conductuales Una alternativa al grupo psicoeducativo feminista es el modelo de terapia cognitivo-conductual (TCC). Las intervenciones cognitivas conductuales, desarrolladas principalmente por psicólogos, tienden a hacer de la violencia el foco principal del tratamiento. Ya que la violencia es un comportamiento aprendido, la no violencia puede aprenderse de manera similar de acuerdo con el modelo cognitivo-conductual (Adams, 1988). La violencia continúa porque es funcional para el usuario, reduciendo la tensión corporal, logrando el cumplimiento de la víctima, poniendo fin temporalmente a una situación incómoda y dando al abusador una sensación de poder y control (Sonkin, Martin y Walker, 1985). Reconociendo los aspectos funcionales de la violencia, el terapeuta cognitivo-conductual señala los pros y los contras de la violencia. Además, utilizan capacitación en destrezas (por ejemplo, comunicación, asertividad y destrezas sociales) y técnicas de manejo de la ira (por ejemplo, tiempo fuera, entrenamiento de relajación y cambio de atributos negativos) para promover la conciencia de alternativas a la violencia. Las etiquetas de intervención suelen ser engañosas. Algunos grupos de TCC no son estrictamente "cognitivos" o "conductuales", ya que abordan los componentes emocionales de la violencia, como la empatía y los celos (Dunford, 2000). La mayoría de los grupos cognitivo conductuales modernos también suelen abordar las actitudes y valores de los perpetradores con respecto a las mujeres y el uso de la violencia hacia ellas. En la medida en que los grupos de TCC abordan las actitudes patriarcales, y los grupos modelo de Duluth abordan los aspectos aprendidos y reforzados de la violencia, cualquier diferencia entre los grupos modelo de TCC y de Duluth se vuelve cada vez más confusa. 1.2.3. Otras modalidades de terapia La razón para el uso de la terapia de grupo es que los hombres aprenden a confrontar la negación del otro y la culpa de la víctima (Murphy & Baxter, 1997). Debido a la preocupación por la eficacia de las intervenciones grupales sólo para hombres, algunos, en el campo de la violencia doméstica, están explorando alternativas al enfoque psicoeducativo grupal mediante la prueba de grupos conjuntos (Dunford, 2000; O'Leary, Heyman, & Neidig, 1999). Los defensores de los grupos de parejas afirman que incluir a la esposa en la intervención del grupo puede cambiar el tenor del grupo de hombres al hacer que los juegos de roles sean más realistas y al reducir los "golpes a las mujeres" (Dunford, 2000). También puede empoderar a la esposa al permitirle ''figuras de autoridad de testigos que enfrentan la naturaleza ofensiva y opresiva del abuso del cónyuge'', así como un modelo para sus maneras constructivas de lidiar con el conflicto (Dunford, 2000, p. 469). Sin embargo, la mayoría de los estados establecen normas, directrices o mandatos que desalientan o prohíben el financiamiento de cualquier programa que ofrezca consejería para parejas o familias como modo primario de intervención (Healy et al., 1998; Lipchick, Sirles, & Kubicki, 1997), ya que las revelaciones de la mujer en presencia de su pareja pueden conducir a una retribución posterior (Lipchick et al., 1997) o implicar que ella tiene al menos parte de la culpa de su victimización (Jacobson, 1993). 2. Método 2.1. Resumen de los métodos de estudios previos El propósito principal de este artículo es resumir cuantitativamente los hallazgos hasta la fecha sobre el efecto del tratamiento de los agresores en la reincidencia de la violencia. Se realizó una revisión de la literatura sobre el tratamiento de los agresores usando PsycInfo, introduciendo las palabras clave "agresores" y "violencia doméstica". Estas fueron cruzadas con términos como "tratamiento" e "intervención". Se recuperaron los estudios identificados de esta manera y se revisaron sus secciones de referencia para obtener estudios adicionales sobre los resultados del tratamiento. Además, se examinaron las secciones de referencia de cinco revisiones de la literatura de tratamiento para agresores (Bargarozzi & Giddings, 1983; Davis & Taylor, 1999; Gelles, 1980; Rosenfeld, 1992; Tolman & Bennett, 1990). Antes de los resultados de nuestro meta-análisis cuantitativo, resumiremos brevemente los métodos y hallazgos de los estudios disponibles hasta el presente, creando una amplia red para incluir materiales publicados, manuscritos en prensa y datos presentados en conferencias nacionales. Para tres estudios recientes (Feder & Forde, 1999; Gondolf, 2000; Taft, Murphy, Elliott y Morrel, 2001), se obtuvo información adicional necesaria para calcular el tamaño del efecto directamente de los autores. 2.1.1. Estudios cuasi-experimentales La Tabla 1 presenta los estudios cuasi-experimentales, la mayoría de los cuales utilizaron el diseño del grupo de control no equivalente (Campbell & Stanley, 1963) para comparar a los que completaron el tratamiento con los que abandonaron el mismo o a los agresores tratados con un grupo de agresores no tratados (que no utilizaron asignación aleatoria verdadera). Debe notarse que el diseño no equivalente del grupo de control empleado por la mayoría de los estudios sobre intervenciones de maltrato no cumple con los estándares de la American Psycho- logical Association para establecer el apoyo empírico (Chambless et al., 1996). Todos los estudios cuasiexperimentales comparten el problema metodológico de potencialmente "apilar la cubierta" a favor del tratamiento. Se sabe que los hombres que eligen completar el tratamiento son diferentes de los que abandonan (por ejemplo, más educados, más propensos a ser empleados, casados y caucásicos, y menos propensos a tener antecedentes penales) (Babcock & Steiner, 1999; Hamberger & Hastings, 1988). Dos estudios intentaron controlar estas diferencias preexistentes entre los grupos (Babcock & Steiner, 1999; Gondolf, 1997) y encontraron que el efecto atribuible al tratamiento seguía siendo estadísticamente significativo. Sin embargo, los porcentajes y tamaños de los efectos presentados en la Tabla 1 no se corrigen para tener en cuenta los factores de confusión debido a las diferencias de grupo entre los que abandonan el tratamiento y los que lo completan. Es difícil estimar el control del tamaño del efecto para las variables demográficas porque la mayoría de los estudios no presentan los datos de tal manera que sería posible realizar un nuevo análisis, controlando las confusiones; predecimos que hacerlo disminuiría drásticamente el tamaño del efecto. Una segunda dificultad metodológica con los diseños cuasi-experimentales es el grado en que la condición de "abandono" está contaminada por los efectos de las sanciones alternativas contra los agresores. Gondolf (2000) encontró que el tamaño del efecto del tratamiento en uno de los sitios de su estudio (Pittsburgh) fue insignificante. Más tarde se enteró de que se imponían sanciones alternativas cuando se abandonaba el tratamiento, por lo que los desertores eran inválidos como grupo de comparación. Por lo tanto, ese sitio fue excluido de nuestro meta-análisis. Otros estudios que se incluyeron en el metanálisis pueden tener confusiones similares que no se revelan en sus informes. En algunos casos, los diseños cuasi-experimentales y los experimentos aleatorios pueden producir tamaños de efecto comparables (Heinsman & Shadish, 1996). Sin embargo, si esto es cierto para el conjunto de estudios sobre la intervención de los agresores sigue siendo una cuestión empírica. 2.1.2. Experimentos reales Debido al riesgo siempre presente de confusión entre los estudios cuasi-experimentales, los resultados de los experimentos aleatorios son el "patrón oro" para los meta-análisis (Shadish & Ragsdale, 1996, p. 1290). Por lo tanto, los resultados de los cinco estudios experimentales recientes deben considerarse una estimación más precisa del tamaño real del efecto debido al tratamiento de los agresores. La Tabla 2 presenta los cinco estudios hasta la fecha que han empleado asignación aleatoria. Estos cinco experimentos merecen una atención especial. Feder y Forde (1999) asignaron al azar a los agresores en libertad condicional a un programa psicoeducativo feminista o a ningún tratamiento en el Condado de Broward, FL. En general, no hubo diferencias estadísticamente significativas entre los dos grupos en cuanto a la reincidencia, medida por los registros policiales (d = 0,04) o por el informe de la víctima (d = 0,02). Hubo un efecto pequeño pero significativo sobre la reincidencia entre el subconjunto de hombres asignados aleatoriamente al tratamiento grupal que asistieron a las 26 sesiones. En este estudio, la asignación aleatoria aparentemente fracasó, con un número impar de hombres asignados a la condición de tratamiento y control (Feder & Forde, 1999). Además, este estudio sufrió de una tasa de deserción particularmente alta de los hombres del tratamiento (60%) y una baja tasa de respuesta de las víctimas en el seguimiento (22%). En una gran evaluación del personal de la Marina de los Estados Unidos estacionado en San Diego, Dunford (1998, 2000) comparó un grupo cognitivo-conductual de 36 semanas y un formato de terapia de pareja de 26 semanas con una rigurosa condición de monitoreo y un control sin tratamiento (planificación de la seguridad de las víctimas). Ni los grupos de hombres con TCC (d = 0,13) ni la terapia de pareja (d = 0,10) tuvieron un impacto significativo sobre la reincidencia en el seguimiento de un año basado en el informe de las víctimas. Este estudio representa el estudio más riguroso metodológicamente realizado hasta la fecha en cuanto al tamaño de la muestra, la duración del seguimiento, las tasas de deserción, las tasas de informes de seguimiento y la evaluación del cumplimiento del tratamiento. Sin embargo, es importante notar que esta muestra de agresores, aquellos empleados a través de la Marina en San Diego, no son representativos de la población de agresores obligados por la corte a participar en programas de violencia doméstica en todo el país. Todos los participantes de la investigación estaban empleados, tenían un alto interés en la conformidad social y, por lo tanto, estaban más "unidos socialmente" (Sherman, Smith, Schmidt y Rogan, 1992). Cualquier intervención, incluyendo el arresto y la identificación por parte de las autoridades, puede servir para disuadir a las personas enlazadas socialmente de cometer delitos repetidos. Esto puede reflejarse en las inusualmente bajas tasas oficiales de reincidencia de los agresores no tratados (4%). Davis, Taylor y Maxwell (2001) compararon un grupo psicoeducativo largo (26 semanas) con un grupo psicoeducativo breve (8 semanas) y un grupo psicoeducativo, y con un control de servicio comunitario (70 horas de limpieza de lotes vacantes, pintura de centros de ancianos, etc.) en Brooklyn, NY. Encontraron una reducción estadísticamente significativa en la reincidencia y un tamaño del efecto pequeño pero respetable de d = 0,41 basado en los antecedentes penales sólo en el grupo de tratamiento prolongado; el grupo de ocho semanas fue indistinguible del control de servicio comunitario (d = 0,02). En cuanto al informe de la pareja, este estudio empleó un método bastante inusual para calcular las reincidencias. Sólo se incluyeron nuevos incidentes de violencia en los dos meses anteriores al punto de contacto de seguimiento, en lugar de un recuento acumulativo. Cuando se basa en el informe de la víctima de estos delitos recientes, ni la intervención larga ni la breve tuvieron un efecto estadísticamente significativo sobre la reagresión en comparación con ningún tratamiento. En consecuencia, el tamaño del efecto debido al tratamiento basado en el informe de la pareja sobre la violencia posterior fue pequeño (d = 0,21). Es importante notar que, como en el experimento del Condado de Broward (Feder & Forde, 1999), la asignación al azar puede haber sido comprometida. En el experimento de Brooklyn (Davis et al., 1998), casi el 30% de las asignaciones iniciales fueron sometidas a ''anulaciones judiciales'' (Gondolf, 2001); es decir, los jueces reasignaron a los acusados a diferentes intervenciones. Ford y Regoli (1993) diseñaron un estudio que asignó aleatoriamente a los agresores al tratamiento como un desvío previo al juicio (es decir, los antecedentes penales de los acusados serían despejados en espera de la finalización del tratamiento), el tratamiento como una condición de la libertad condicional después de la condena, en comparación con las estrategias alternativas de sentencia (por ejemplo, pagar una multa o ir a la cárcel). Aunque este estudio fue diseñado para probar diferentes opciones de sentencia en lugar de los efectos debidos al tratamiento, uno puede comparar a los agresores sentenciados a tratamiento vs. los agresores no sentenciados a tratamiento (aunque el tipo de tratamiento y las tasas reales de asistencia no fueron especificados). Una vez más, no hubo diferencias significativas o tamaños de efecto que compararan las tasas de reincidencia basadas en el informe de las víctimas entre los hombres sentenciados a tratamiento y los que no lo fueron. No se encontró que el tratamiento como remisión previa al juicio (d = 0,00) ni como condición de la libertad condicional posterior a la condena (d = 0,22) fuera superior a las intervenciones puramente legales. Finalmente, Palmer, Brown y Barrera (1992) llevaron a cabo un estudio a pequeña escala en Canadá de hombres que utilizaron un procedimiento aleatorio en bloque: los hombres fueron asignados a un tratamiento psicoeducativo de 10 semanas si un nuevo grupo debía comenzar dentro de las 3 semanas o, de no ser así, a un grupo de control de "sólo libertad condicional". El tratamiento relativamente desestructurado y centrado en el cliente abordaba las creencias sobre la violencia, la responsabilidad por el comportamiento violento, la capacidad de lidiar con el conflicto y la ira, la autoestima y las relaciones con las mujeres (Peluch, 1987). Según los informes de la policía, los hombres asignados a la condición de tratamiento reincidieron a un ritmo significativamente menor que los hombres asignados sólo a la libertad condicional, lo que produce un tamaño de efecto medio (d = 0,54). Sin embargo, este estudio está limitado por el pequeño tamaño de la muestra, y los resultados pueden no ser generalizables a otras muestras. Llevar a cabo un experimento en el que se sacrifica la discreción judicial y se asigna al azar a los delincuentes a tratamiento o no tratamiento puede ser problemático por motivos éticos y prácticos (Dutton, Bodnarchuk, Kropp y Hart, 1997). La adopción de un diseño experimental no garantiza una evaluación más rigurosa de lo que los diseños cuasi-experimentales permiten (Gondolf, 2001). Si bien es cierto que los diseños experimentales permiten una mayor confianza en las conclusiones sobre las relaciones causales, también es cierto que los problemas de desgaste diferencial y el fracaso de la asignación aleatoria reducen la validez interna de este diseño. Además, los investigadores deben lidiar con el problema de la "intención de tratar": ¿deben calcularse los tamaños de los efectos a partir del tamaño inicial de la muestra o sólo a partir de los que la completan? ¿Y si la mayoría de los delincuentes "tratados" asistieran a grupos sin tratamiento? Se recomienda que los investigadores reporten ambas tasas de reincidencia para todos los agresores que fueron asignados al tratamiento así como aquellos que realmente completaron el tratamiento (aunque pocos estudios lo han hecho). 2.2. Criterios de inclusión de los estudios Originalmente, se localizaron 68 estudios empíricos de la eficacia de los programas de tratamiento de los agresores. Estos estudios se clasificaron según el diseño: experimental (k=5), cuasiexperimental (k=17) y pre-post (k=48). El criterio para la inclusión en este meta-análisis fue (1) la presencia de algún tipo de grupo de comparación de agresores y (2) la confianza en el informe de la víctima o registro policial como índice de reincidencia. Los estudios no controlados, pre-post test han sido revisados previamente (Davis & Taylor, 1999; Hamberger & Hastings, 1993; Rosenfeld, 1992). Estos son los diseños metodológicos más débiles y generalmente tienden a sobreestimar el tamaño del efecto (Lipsey & Wilson, 1993). Sobre esta base, no se incluyeron 48 de los 70 estudios. Las evaluaciones cuantitativas más sólidas de las intervenciones de violencia doméstica generalmente se dividen en dos categorías: (1) cuasi-experimental, donde los que terminan el tratamiento son comparados con los que abandonan el tratamiento o con un grupo de comparación emparejado que no recibió tratamiento y (2) diseños experimentales verdaderos, donde los clientes son asignados aleatoriamente a tratamiento(s) vs. ningún tratamiento. Los estudios (k = 22) consistentes en diseños experimentales y cuasi experimentales formaron los datos para esta revisión cuantitativa. Estos estudios arrojaron un total de 44 tamaños del efecto (los tamaños del efecto formaron la unidad de análisis para el presente estudio), en los que se comparó un grupo de tratamiento con un control aleatorio o con abandonos del tratamiento. Varios estudios recientes han comparado dos tratamientos activos para la violencia doméstica sin la inclusión de un grupo de control y sin la comparación de los que los completan con un grupo de comparación sin tratamiento o con abandono. Por ejemplo, dos estudios (Brannen & Rubin, 1996; O'Leary et al., 1999) compararon un formato de parejas con un formato de grupo específico de género. Saunders (1996) comparó la respuesta de los agresores con diferentes perfiles de personalidad a ambos grupos estructurados más estándar vs. terapias más orientadas al proceso. Aunque se puede calcular el tamaño del efecto a partir de estos estudios de comparación de tratamientos, la estadística resultante reflejaría la magnitud de la diferencia entre dos tratamientos activos. Esto subestimaría enormemente el tamaño del efecto debido al tratamiento y potencialmente sesgaría los resultados contra el tratamiento. Otros estudios (por ejemplo, Edleson & Syers, 1991) reportan tasas de reincidencia sólo para los que terminan el tratamiento. Sullivan y Bybee (1999) realizaron un ensayo clínico aleatorio bien diseñado de la intervención de defensa de las víctimas que arrojó un tamaño del efecto (d) de 0,35 basado en el informe de reincidencia de las víctimas; sin embargo, las intervenciones con las víctimas están fuera del alcance del metaanálisis actual. Mientras que estos estudios son contribuciones importantes a la literatura clínica, no proporcionan tamaños de efecto que estimen el efecto debido al tratamiento de los agresores. Por lo tanto, no se incluyen en este metanálisis. 2.3. Codificación Los tamaños de los efectos se codificaron a lo largo de una serie de dimensiones que eran teóricamente prometedoras para la investigación como moderadores. Cada tamaño del efecto se clasificó de acuerdo con el tipo de informe en el que se basaron las tasas de reincidencia, el tipo de tratamiento, la duración del tratamiento, el tiempo de seguimiento y las tasas de deserción. El reporte de la reincidencia del agresor tomó dos formas: reporte policial y reporte de la pareja. Muchos de los tamaños de los efectos anteriores dependían exclusivamente del autoinforme de los agresores como medida de resultado. Tales efectos no pueden diferenciar entre el éxito del tratamiento y la tendencia de los agresores a no reportar la verdadera incidencia del abuso (Davis & Taylor, 1999; Rosenfeld, 1992). Moffit et al (1997) encontraron que la fiabilidad entre hombres y mujeres en una muestra de la comunidad sobre la presencia/ausencia de violencia era pobre (kappa=.36 promedio). Concluyeron que en un entorno terapéutico o correccional, "donde las presiones (para los agresores) de sesgar sus informes pueden superar las promesas de confidencialidad de los investigadores", los informes colaterales pueden ser esenciales (Moffit et al., 1997, p. 54). A la luz de este posible sesgo de notificación, sólo se incluyeron en esta revisión los tamaños del efecto que utilizan al menos un informe independiente de reincidencia, ya sea el informe de la víctima o los antecedentes penales. En muchos casos, se examinaron tanto los informes de la policía como los de la pareja. Como tal, nuestros análisis de los datos examinaron tamaños de efectos separados para todas las comparaciones presentadas en cada estudio; el análisis del moderador se realizó dos veces, por separado para el informe de la pareja y de la policía, para evitar la inflación artificial del número de estudios. 2.3.1. Reincidencia Considerando la importancia práctica, la mayoría de los clínicos que trabajan con agresores están de acuerdo en que el cese de la violencia en la pareja íntima es un criterio importante para el éxito (Edleson, 1996), en lugar de, por ejemplo, mostrar una disminución en la frecuencia o severidad de los actos violentos. A los efectos de este examen, se considera "reincidencia" cualquier denuncia de violencia física denunciada por las víctimas y/o cualquier incidente de violencia doméstica denunciado a la policía durante un período de seguimiento (es decir, la reincidencia es una variable dicotómica y se calculan los tamaños de los efectos de la proporción de hombres que reincidieron). La mayoría de los estudios utilizaron la Escala de Tácticas de Conflicto (CTS/CTS-2) (Straus, 1979; Straus, Hamby, Boney-McCoy, & Sugarman, 1996) como una medida de resultado del informe de reincidencia de la pareja. Nuestra medida dependiente del reporte de reincidencia de la pareja fue el porcentaje que detuvo la agresión física adicional, en lugar de un cambio en la puntuación del CTS. Mientras que el cese del abuso emocional de los hombres y el aumento de la responsabilidad también son objetivos de muchos programas de tratamiento, pocas evaluaciones o experimentos de programas han examinado cualquier variable de resultado que no sea la frecuencia del abuso físico o la reincidencia criminal. Por lo tanto, sólo se incluyeron en esta revisión metaanalítica los informes de la policía y de la pareja sobre agresiones físicas. 2.3.2. Tipos de tratamientos Los tipos de tratamiento incluyeron Duluth/feminista psicoeducativo (k = 19), CBT (k = 11), y otros (k = 7). Dado que el método metaanalítico requiere el examen de la heterogeneidad/ homogeneidad de la varianza debida a cada moderador putativo, se requirió un tamaño de célula mayor que uno para cada nivel del moderador. Como consecuencia, cualquier tipo de tratamiento que se produjera una sola vez en la base de datos se agregaba a la categoría "otro". Los siete tamaños de efecto en la categoría "otros" procedían de estudios que probaban la eficacia de la terapia de pareja (Dunford, 2000), la terapia de apoyo (Taft et al., 2001), la mejora de la relación (Waldo, 1988), una mezcla de diferentes intervenciones (Newell, 1994) y terapias de un tipo no especificado (Ford & Regoli, 1993). 2.3.3. Duración del tratamiento La duración del tratamiento fue dicotomizada: corta (duración media del tratamiento < 16 semanas) y larga (duración media del tratamiento 16 semanas). Si algún tratamiento no mantuvo una duración uniforme, se utilizó la duración promedio del tratamiento. 2.3.4. Duración del seguimiento Los tamaños del efecto se clasificaron en una de dos categorías según la duración del seguimiento: corto (tiempo medio de seguimiento < 12 meses) y largo (tiempo medio de seguimiento > 12 meses). Para los estudios con tiempos de seguimiento variables, se calculó el tiempo medio de seguimiento. 2.3.5. Deserción La deserción del tratamiento se calculó como el porcentaje de individuos que fueron clasificados como "desertores" de los estudios cuasi-experimentales de los autores. Debe tenerse en cuenta que los diferentes autores tienen criterios distintos para determinar qué es lo que constituye la finalización del tratamiento. Para algunos tamaños de efectos, los participantes deben asistir al 100% de las sesiones; otros autores informan que "los participantes" son los que asisten al 80% o más de las sesiones requeridas. Debido a las inconsistencias en el cálculo y reporte de la deserción, esta variable no se introdujo en el metanálisis. Sin embargo, las tasas de deserción se presentan en los Cuadros 1 y 2. Pueden considerarse como un índice de la calidad del tratamiento o de la calidad de la respuesta coordinada de la comunidad y pueden influir en el tamaño del efecto. 2.4. Confiabilidad Por razones de confiabilidad, tanto el primer como el segundo autor revisaron y codificaron cada estudio. No hubo desacuerdos sobre el diseño del estudio, el tipo de informe, la duración del tratamiento o la duración del seguimiento (fiabilidad = 100% de acuerdo). Sin embargo, hubo un estudio en el que los codificadores no estuvieron de acuerdo con el tipo de tratamiento (confiabilidad = acuerdo del 95%). En este caso, se contactó al autor del estudio (Jeffrey Edelson, comunicación personal, 13 de septiembre de 2000) para ayudar a asignar una etiqueta al tratamiento. 2.5. Estimaciones del tamaño del efecto La Tabla 1 presenta el diseño general, el tipo de tratamiento y las tasas de reincidencia o reincidencia de todos los diseños cuasi-experimentales identificables, y la Tabla 2 presenta los verdaderos estudios experimentales existentes realizados en la última década. Las tasas de reincidencia (es decir, el porcentaje en las condiciones tratadas y de control que reincidieron) según lo informado en los estudios se volvieron a calcular en un tamaño del efecto, utilizando la estadística g sobre proporciones (Hedges & Olkin, 1985). La estadística g sobre proporciones se transformó entonces en la estadística d, ajustando el tamaño de la muestra (Johnson, 1995). Es importante señalar que el tamaño de las muestras finales con datos completos de reincidencia en el seguimiento, especialmente los basados en el informe de la pareja/víctima, suele ser significativamente menor que el de la n inicial. En muchos casos, los ns específicos de los grupos tratados y de comparación con datos de seguimiento completos no fueron explícitos, aunque la tasa de respuesta de seguimiento sí lo fue. En esos casos, estimamos la n final mediante ''descuento'' de la n inicial en cada condición por la proporción con datos de seguimiento completos. Un "tamaño del efecto" es un intento de cuantificar la magnitud del efecto debido al tratamiento utilizando una métrica compartida que no está influenciada por el tamaño de la muestra. Cuando se basa en la estadística d, los tamaños de efecto de 0,20 se consideran ''pequeños'', 0,50 se consideran ''medianos'', y los tamaños de efecto de 0,80 y más se consideran grandes (Cohen, 1988). El tamaño del efecto d está en unidades de desviaciones estándar; por lo tanto, un tamaño del efecto de 0,25 se traduce en una mejora de una cuarta parte de una desviación estándar en comparación con ningún tratamiento. En los diseños experimentales reales, el tamaño del efecto nos permite evaluar la magnitud del impacto que el tratamiento tiene sobre la reincidencia; en los diseños cuasiexperimentales, el tamaño del efecto se aproxima a la fuerza de la relación entre el tratamiento y la reincidencia, sin control para las confusiones externas (Campbell y Stanley, 1963). Los tamaños del efecto y las varianzas se calcularon en términos de d mediante el método metaanalítico de Hedges and Olkin (1985). Esto permitió la ponderación diferencial de los efectos para el tamaño de la muestra. El cálculo del d se realizó utilizando D-Stat versión 1.11 (Johnson, 1995). Este programa de software calcula d basado en proporciones tratando cada proporción como la media de una distribución de éxitos vs. fracasos. Se calcularon los tamaños del efecto para cada comparación para cada medida dependiente (es decir, tipo de informe), lo que resultó en un total de 37 tamaños del efecto. El análisis del moderador se llevó a cabo utilizando MetaWin 1.0 (Rosenberg, Adams y Gurevitch, 1997). Este programa de computación sigue el enfoque jerárquico de Hedges y Olkin al meta-análisis que emplea la estadística Q para determinar el grado de heterogeneidad que existe entre y dentro de los grupos. Como se mencionó anteriormente, otros estudios (Davis & Taylor, 1999; Levesque & Gelles, 1998) han reportado el tamaño del efecto del tratamiento de los agresores en términos de la h de Cohen (Cohen, 1988). Recalcular el tamaño del efecto en términos de la h de Cohen no cambia sustancialmente las conclusiones de este artículo. Los tamaños de efecto d pueden convertirse fácilmente en tamaños de efecto r (Wolf, 1986, p. 35)1 para calcular una visualización de tamaño de efecto binomial (BESD), utilizando la fórmula (Rosenthal, 1995; Rosnow & Rosenthal, 1988): BESD ¼ 0:50 þ ðr=2Þ El BESD permite la traducción del tamaño del efecto en términos de tasas de resultados diferenciales para ayudar a interpretar la importancia práctica del tamaño del efecto. Trabajos anteriores (Babcock & LaTaillade, 2000; Davis & Taylor, 1999) han examinado informalmente el efecto del tratamiento de los agresores tomando el tamaño promedio del efecto en todo el estudio. En contraste, los meta-análisis formales evalúan los tamaños del efecto del peso por tamaño de la muestra. Por lo tanto, los resultados de este artículo pueden diferir sustancialmente de la simple promediación o "echando un vistazo" de los tamaños de los efectos presentados en las tablas. 3. Resultados Sobre la base de los datos resumidos en la tabla 1, el porcentaje ponderado de delincuentes no tratados que reincidieron fue del 21% sobre la base de los informes policiales y del 35% sobre la base de los informes de sus parejas. Estas tasas de reincidencia para los delincuentes no tratados son consistentes con las reportadas anteriormente (O'Leary et al., 1989; Rosenfeld, 1992). 3.1. Sesgo de la publicación El análisis para determinar el sesgo de publicación y el fenómeno del "cajón de archivos" se llevó a cabo utilizando un gráfico cuantitativo normal (Wang & Bushman, 1998). Si los resultados nulos fueran selectivamente ignorados, la gráfica de la cantidad normal revelaría la ausencia de tamaños de efecto alrededor de cero. El examen de las parcelas no reveló evidencia de sesgo de publicación (ver Fig. 1). Fig. 1. Gráfico de cuantiles normal para evaluar el problema de ''cajón de archivos''. 3.2. Análisis de valores atípicos El análisis de los valores atípicos se realizó utilizando la estadística de desviación metaanalítica ajustada de la muestra (SAMD) desarrollada por Huffcutt y Arthur (1995). Las estadísticas de SAMD se calcularon por separado para el informe de la policía y de la pareja. El examen del diagrama de barras de las estadísticas de la SAMD cuando se evaluó la reincidencia según el informe de la policía sugirió cuatro posibles valores atípicos: tanto la TCC (SAMD = 8,73) como las intervenciones de apoyo (SAMD = 6,99) con retención reportadas por Taft et al. (2001) y CBT en Harrell (1991) (SAMD =11.08). Por lo tanto, Taft et al. y Harrell fueron excluidos de los análisis posteriores. El gráfico de la pantalla de las estadísticas de SAMD basadas en el informe de la pareja indicaba que había dos valores atípicos. Estos puntos de datos representaron a Dobash, Dobash, Cavanagh y Lewis (1996) y Harrell (1991) con SAMDs de 11.01 y 15.02, respectivamente. Ambos tamaños del efecto se excluyeron del análisis posterior basado en el análisis de los valores atípicos. 3.3. Moderadores del tamaño del efecto Los 36 tamaños de efectos restantes se introdujeron en el análisis jerárquico de efectos fijos descrito por Hedges y Olkin (1985). Se probó un modelo que reflejaba una combinación de moderadores metodológicos y de tratamiento (Fig. 2); éstos incluían: tipo de informe, diseño experimental vs. cuasi-experimental y tipo de tratamiento. 3.4. Efectos debidos al método de evaluación de la reincidencia La primera variable moderadora introducida en el análisis fue el tipo de informe. El análisis resultante de dos conjuntos de tamaños de efectos basado en informes de la policía y de los socios (es decir, un enfoque de moderador jerárquico) permitió el uso óptimo de los datos existentes sin el uso redundante de muestras en cada grupo. Se informaron intervalos de confianza (IC) del 95% para todas las estimaciones del tamaño del efecto. Los IC que no contienen cero pueden considerarse estadísticamente significativos desde cero en el nivel de P < 0,05. Los efectos basados en el informe policial (k = 20) arrojaron un tamaño general del efecto de d = 0,18 (IC del 95% = 0,11-0,25) y los efectos basados en el informe de la pareja (k = 16) arrojaron un tamaño del efecto equivalente de d = 0,18 (IC del 95% = 0,08-0,28). El examen de la estadística Q-within no fue de una heterogeneidad significativa para el informe policial (Qw = 26,96; df = 19; ns) o el informe de la pareja (Qw = 10,96; df = 16; ns). Una estadística Qw significativa indica heterogeneidad entre los tamaños del efecto que sugieren la existencia de más moderadores. Aunque el Qw no fue estadísticamente significativo ni para la policía ni para el informe de la pareja, lo que indica una falta de heterogeneidad, la presencia del modelo hipotético (Fig. 2) justificaba un examen continuo de los moderadores restantes (Rosenthal, 1995). 3.5. Efecto debido al diseño del estudio La segunda variable moderadora introducida en el modelo fue el diseño de la investigación (es decir, experimental o cuasi-experimental). Se examinaron los efectos de esta variable basándose en el informe de la policía y de la pareja. El análisis del diseño de la investigación como moderador del tamaño del efecto dentro del informe policial reveló que los diseños experimentales (k = 6) tenían un d = 0,12 (IC del 95% = 0,02-0,22). El tamaño general del efecto para los diseños cuasiexperimentales con informe policial (k = 14) fue d = 0,23 (IC del 95%: 0,14-0,32). Tanto para los diseños experimentales como para los cuasiexperimentales, el tratamiento tuvo un impacto significativo pero pequeño sobre el cese de la agresión doméstica. No hubo una diferencia significativa entre los tamaños del efecto general para los diseños experimentales y cuasiexperimentales basados en el informe policial (Qb = 2,44; df = 1, ns). El examen de los resultados basado en el informe policial indicó que había una heterogeneidad significativa entre los tamaños del efecto entre los diseños experimentales (Qw = 11,44; df = 5; P < 0,05.), pero no entre los diseños cuasiexperimentales (Qw = 13,07; df = 13; ns). Se realizaron análisis similares para los tamaños del efecto basados en el informe de la pareja (k = 16). El análisis del diseño de la investigación como moderador del tamaño del efecto dentro del informe de la pareja reveló un tamaño medio del efecto para los diseños experimentales (k = 7) de 0,09 (IC del 95%: 0,02 a 0,21), no significativamente diferente de cero. Los diseños cuasiexperimentales basados en el tamaño del efecto general con informe de la pareja (k = 9) fueron d = 0,34 (IC del 95% = 0,17 0,51). Esto representa un tamaño de efecto significativo pero pequeño. Hubo una diferencia estadísticamente significativa entre los tamaños del efecto general para los diseños experimentales y cuasiexperimentales basados en el informe de la pareja (Qb = 5,49; df = 1; P < 0,05). Los diseños cuasiexperimentales basados en el tamaño del efecto general con informe de la pareja (k = 9) fueron d = 0,34 (IC del 95%: 0,17 a 0,51). Esto representa un tamaño de efecto significativo pero pequeño. Hubo una diferencia estadísticamente significativa entre los tamaños del efecto general para los diseños experimentales y cuasiexperimentales basados en el informe de la pareja (Qb = 5,49; df = 1; P < 0,05). El examen de los tamaños del efecto basado en los diseños experimentales y el informe de la pareja indicó que no hubo heterogeneidad significativa (Qw = 2,72; df = 6, ns). La inspección de los tamaños del efecto basada en los diseños cuasiexperimentales y el informe de la pareja indica que no hay heterogeneidad significativa (Qw = 2.76, df = 8, ns) dentro de estas células. 3.6. Efecto debido al tipo de tratamiento La tercera variable moderadora introducida en el modelo fue el tipo de tratamiento. Se examinó el tamaño de los efectos basándose en el diseño experimental y el informe policial, el diseño cuasiexperimental y el informe policial, y el diseño cuasi-experimental y el informe de la pareja. El cálculo del tamaño general del efecto debido al tipo de tratamiento en los diseños experimentales con informe policial indicó que Duluth (k = 5) tuvo un tamaño del efecto de d = 0,19 (IC del 95%: 0,06-0,31). La TCC y "otras" terapias carecían de suficiente tamaño celular (k < 2) para calcular el tamaño del efecto. Así, Duluth demostró un pequeño efecto basado en el informe policial y el diseño experimental. El examen del tamaño del efecto general del efecto debido al tipo de tratamiento dentro de los diseños cuasiexperimentales con informe de la policía indicó que Duluth (k = 7) tuvo un tamaño del efecto de d = 0,32 (IC del 95%: 0,19 a 0,46), la TCC (k = 5) tuvo un tamaño del efecto de d = 0,12 (IC del 95%: 0,02 a 0,26) y otros (k = 2) tuvieron un tamaño del efecto de d = 0,27 (IC del 95%: 0,03 a 0,51). En este caso, los tamaños del efecto del modelo de Duluth y de las intervenciones "otras" fueron significativamente diferentes de cero, mientras que las intervenciones de TCC no fueron significativamente diferentes de cero. Sin embargo, estos tamaños de efecto no difirieron significativamente entre sí (Qb = 4.43, df = 2, ns). El examen del tamaño general del efecto debido al tipo de tratamiento dentro de los diseños experimentales con el informe de la pareja indicó que Duluth (k = 3) tuvo un tamaño del efecto de d = 0,12 (IC del 95%: 0,10-0,33) y otros (k = 3) tuvieron un tamaño del efecto de d = 0,03 (IC del 95%: 0,18-0,23). Las terapias de TCC carecían de un tamaño de celda suficiente (k < 2) para calcular el tamaño del efecto. Los tamaños del efecto no difirieron significativamente entre sí (Qb = 0.37, df = 2, ns). El cálculo del tamaño del efecto general debido al tipo de tratamiento dentro de los diseños cuasi-experimentales con informe de la pareja indicó que las intervenciones de Duluth (k = 5) tuvieron un tamaño del efecto de d = 0,35 (95% CI: 0,15 a 0,55) y la TCC (k = 3) tuvieron un tamaño del efecto de d = 0,29 (95%CI: 0,01 a 0,60), mientras que la categoría "otros" carecía de un tamaño de celda suficiente para incluirse en este análisis. Sin embargo, los dos tamaños del efecto no fueron significativamente diferentes entre sí (Qb = 0.10, df = 1, ns). Debido al pequeño tamaño de celda para cada tipo de tratamiento, se examinó un segundo modelo que agregó los tamaños de los efectos experimentales y cuasiexperimentales para cada método de reporte (es decir, policía o pareja). La Q dentro de las estadísticas y la Q entre estadísticas fueron idénticas al modelo inicial de informe de la policía y de la pareja. El cálculo del tamaño general del efecto debido al tipo de tratamiento en el informe policial indicó que Duluth (k = 11) tuvo un tamaño del efecto de d = 0,25 (95%CI: 0,16-0,34), TCC(k = 6) tuvo un tamaño del efecto de d = 0,09 (IC del 95%: 0,03-0,20), y otros (k = 3) tuvieron un tamaño del efecto de d = 0,09 (95%CI: 0,01-0,32). No hubo diferencias estadísticamente significativas entre los tamaños del efecto entre las tres categorías de tratamiento (Qb = 4,80; df = 2; ns). El examen del tamaño general del efecto debido al tipo de tratamiento dentro del informe de la pareja indicó que Duluth (k = 8) tuvo un tamaño del efecto de d = 0,24 (IC del 95%: 0,09 a 0,39), la TCC (k = 4) tuvo un tamaño del efecto de d = 0,20 (95%CI: 0,001 a 0,40), y otros (k = 4) tuvieron un tamaño del efecto de d = 0,04 (95%CI: 0,16 a 0,25). No hubo diferencias estadísticamente significativas entre los tamaños del efecto entre las tres categorías de tratamiento (Qb = 2,36, df = 2, ns). No hubo poder estadístico adecuado para evaluar el efecto debido a la duración del tratamiento o la duración del seguimiento como variables moderadoras en diferentes tipos de tratamiento. Los tamaños generales del efecto para la duración del tratamiento, la duración del seguimiento y el desgaste se reportan en la Tabla 3. Se realizaron análisis adicionales para examinar el grado en que la inclusión de los valores atípicos en el análisis alteró los resultados actuales. En particular, se evaluó una hipótesis "del mejor de los casos", en la que sólo se excluyeron del análisis los valores atípicos bajos. Los resultados no fueron significativamente diferentes del modelo con todos los valores atípicos eliminados. 4. Discusión En general, el tamaño del efecto debido a la intervención grupal de maltrato sobre la reincidencia de la violencia doméstica se encuentra en el rango “pequeño''. No hubo diferencias significativas en el tamaño promedio del efecto entre los programas de intervención de maltrato de tipo Duluth y los programas de intervención de maltrato cognitivo-conductual usando ya sea los registros policiales o los informes de las víctimas como índice de reincidencia. Aunque los diseños cuasi-experimentales tendieron a producir tamaños de efecto más altos que los experimentos reales, las diferencias en los tamaños de los efectos no fueron significativas. Independientemente del método de notificación, el diseño del estudio y el tipo de tratamiento, el efecto en las tasas de reincidencia se mantiene en un pequeño rango. En el mejor de los casos, usando diseños cuasiexperimentales basados en el informe de la pareja, el tamaño del efecto es d = 0,34, lo que indica que los agresores tratados mostraron una desviación estándar de un tercio en la mejora de la reincidencia en comparación con los agresores no tratados. Si uno se basa exclusivamente en los cinco estudios experimentales, los tamaños del efecto son aún más pequeños. Sin embargo, los tamaños del efecto pueden ser pequeños como resultado de errores de medición y dificultades metodológicas comunes a la investigación en entornos aplicados (McCartney & Rosenthal, 2000). McCartney y Rosenthal (2000, p. 178) advierten que '(g) dado que las apuestas son tan altas, debemos tener cuidado de no aceptar la hipótesis nula cuando bien podría ser falsa, como casi siempre lo es''. Sobre la base de los estudios experimentales, el tamaño del efecto (d) debido al tratamiento es de 0,09 y 0,12, según el informe de la víctima y los registros policiales, respectivamente. Esto significa que el tratamiento es responsable de aproximadamente una décima parte de la mejora de la desviación estándar en la reincidencia. Basado en un reporte de la pareja, los agresores tratados tienen un 40% de probabilidades de ser exitosamente no violentos, y sin tratamiento, los hombres tienen un 35% de probabilidades de mantener la no violencia. Por lo tanto, hay un aumento del 5% en la tasa de éxito atribuible al tratamiento. Para un médico, esto significa que una mujer tiene un 5% menos de probabilidad de ser re-asaltada por un hombre que fue arrestado, sancionado, y fue a un programa de agresores que por un hombre que simplemente fue arrestado y sancionado. El que esta tasa de éxito sea motivo de celebración o desesperación depende de un análisis de costo-beneficio; teniendo en cuenta el costo del tratamiento y los posibles "efectos secundarios" frente a los beneficios de la prevención de lesiones y la disminución del riesgo psicológico para la víctima, así como para los niños expuestos a la violencia familiar. Una disminución del 5% en la violencia puede parecer insignificante; sin embargo, el tratamiento de los agresores en todos los casos reportados de violencia doméstica en los Estados Unidos equivaldría a aproximadamente 42,000 mujeres por año que ya no son maltratadas. 4.1. ¿Qué tan grande es el tamaño del efecto que debemos esperar? Una manera de contextualizar el tamaño del efecto debido al tratamiento es comparándolo con los tamaños del efecto para el tratamiento en otras poblaciones. Davis y Taylor (1999) compararon el tamaño del efecto del tratamiento de 0,41 con el tamaño del efecto de un ensayo clínico temprano sobre el efecto de la aspirina en los ataques cardíacos, que fue de sólo 0,068 y constituye una reducción del 4% en los ataques cardíacos (Rosnow & Rosenthal, 1988). En comparación con este estándar, ellos concluyen que ''los tamaños de los efectos vistos en los estudios de tratamiento de los agresores son bastante sustanciales'' (Davis & Taylor, 1999, p. 85). Sin embargo, el tamaño promedio del efecto entre los estudios de psicoterapia es mucho mayor, aproximadamente d = 0.85 (Smith, Glass y Miller, 1980). En términos prácticos, la psicoterapia produce beneficios en el 70% de los casos (Rosenthal, 1995). En comparación con este estándar, hay un gran margen de mejora en las intervenciones de tratamiento de nuestros agresores. Sin embargo, la comparación con los resultados de la psicoterapia en general puede no ser justa. La mayoría de las psicoterapias abordan problemas de interiorización (por ejemplo, depresión, ansiedad) en lugar de externalizar la conducta problemática, como la agresión. Dado que la agresión es difícil de tratar, agravada con el hecho de que los agresores generalmente no buscan tratamiento voluntariamente y no necesariamente esperan que las intervenciones ayuden (Gondolf, 2001), tal vez se pueda anticipar un pequeño efecto general debido al tratamiento. Un reciente meta-análisis de psicoterapia con niños y adolescentes revela que el tamaño del efecto para los tratamientos de la agresión fue d = 0.32 (Weisz, Weiss, Han, Granger, & Morton, 1995), indicando una mejora del 16% en la tasa de éxito sobre ningún tratamiento. Los tratamientos correccionales con prisioneros adultos dan como resultado un promedio de tamaños de efecto de d = 0.25 (Loesel & Koeferl, 1987, citado en Lipsey & Wilson, 1993), con una tasa de mejora aproximada del 12%. Basado en la revisión anterior de Rosenfeld (1992) de la literatura, Dutton (1998, p. 177) especuló que los efectos de las intervenciones de maltrato caen en un rango medio entre los efectos debidos a la psicoterapia y los efectos debidos a la rehabilitación de los delincuentes. Los resultados de este meta-análisis revelan que incluso la modesta afirmación de Dutton parece ser demasiado optimista. Los efectos debidos a la intervención de maltrato están mucho más cerca de los efectos de la rehabilitación que los tamaños de los efectos de la psicoterapia en general. 4.2. "¿Han ganado todos y todos deben tener premios? Aunque el efecto atribuible al tratamiento depende en cierta medida de las metodologías empleadas en los estudios, los tamaños del efecto para el modelo de Duluth y los tratamientos de TCC siguen siendo relativamente similares. Con las estimaciones liberales basadas en estudios cuasiexperimentales, las intervenciones de Duluth producen un tamaño de efecto pequeño de d = 0,35, mientras que las intervenciones de TCC producen un tamaño de efecto más pequeño de d = 0,29. Sin embargo, dada la variabilidad en los tamaños del efecto de los estudios que componen estos promedios, no se puede decir que la TCC sea superada por el tratamiento de tipo Duluth. Mientras que algunos pueden intentar utilizar selectivamente estos datos para reforzar sus argumentos, las afirmaciones sobre la superioridad de un tipo de tratamiento sobre otro no están justificadas. En retrospectiva, no es sorprendente que no haya habido diferencias significativas entre las intervenciones de tipo TCC y Duluth. Los grupos modernos de agresores tienden a mezclar diferentes enfoques teóricos del tratamiento, combinando tanto la teoría feminista del poder y el control como intervenciones específicas para tratar el control de la ira, el control del estrés y la mejora de las habilidades de comunicación (Davis & Taylor, 1999; Healy et al., 1998). Las etiquetas de "marca" pueden ser engañosas. Hasta la fecha, ningún investigador ha llevado a cabo una comparación cara a cara entre las intervenciones de maltrato de tipo TCC y Duluth, tal vez debido a la dificultad de identificar técnicas de tratamiento exclusivas de cada escuela. Es común en la literatura de resultados de la psicoterapia encontrar que las diferentes modalidades de tratamiento son igualmente efectivas y concluir que todas han ganado (Beutler, 1991). Este fenómeno de encontrar comparabilidad en los resultados del tratamiento se conoce como el "veredicto del pájaro dodo" (Beutler, 1991; Luborsky et al., 1975). Los tamaños del efecto equivalente debido al tratamiento son resultados comunes de estudios comparativos de dos tratamientos activos (DeRubeis & Crits-Cristoph, 1998). En este caso, sólo un estudio ha realizado un ensayo clínico aleatorio de dos tratamientos activos (TCC y grupos de parejas) contra un control sin tratamiento (Dunford, 2000). Dentro de este estudio y a través del dominio de los estudios hasta la fecha, los tamaños de los efectos debidos a todos los tipos de intervenciones son pequeños. 4.3. ¿Todos han perdido? Aunque el tamaño del efecto debido al tratamiento en general está en el rango pequeño, hay algunos estudios específicos que encuentran tamaños de efecto grandes. Como se muestra en la Tabla 1, las intervenciones con los tamaños de efecto más grandes se obtuvieron a partir de terapias de grupo de 16 semanas complementadas con técnicas de retención (Taft et al., 2001) y grupos de capacitación en habilidades para el mejoramiento de relaciones de 12 semanas (Waldo, 1988). Estos hallazgos pueden ser descartados como ''valores atípicos'' entre los estudios científicos de tratamiento, o vistos como precursores de intervenciones potencialmente poderosas. En el primer estudio, Taft et al. (2001) asignaron aleatoriamente a los hombres a grupos de TCC o de terapia de apoyo, los cuales fueron complementados con técnicas diseñadas para mejorar la retención del tratamiento basadas en los principios de las entrevistas motivacionales (Miller & Rollnick, 1991). Estas técnicas consistían en llamadas telefónicas de recordatorio y notas manuscritas de apoyo después de la admisión y después de faltar a las sesiones. Como resultado, los autores reportan una de las tasas de abandono más bajas en la literatura. Las terapias centrales difieren drásticamente entre sí, una muy estructurada y la otra no estructurada, pero ambas revelan un gran tamaño de los efectos, especialmente cuando se basan en los informes policiales. Este estudio sugiere que el pequeño tamaño del efecto debido a las intervenciones de los agresores puede ser en parte atribuible a la falta de inversión del cliente y la subsiguiente deserción de los programas. Estas técnicas simples, que pueden ser un complemento de cualquier tipo de programa, pueden aumentar la percepción del cliente de que el programa es consciente de su ausencia y está invertido en su bienestar. Por lo tanto, puede estar más motivado para completar y participar activamente en el programa, reduciendo el desgaste y la reincidencia. El segundo estudio para encontrar un efecto de gran tamaño fue una evaluación de una intervención llamada mejora de la relación (Guerney, 1977). Los objetivos de la mejora de las relaciones en lo que se refiere al maltrato son ayudar a los hombres a desarrollar habilidades interpersonales que mejoren las relaciones y les permitan poner fin al uso de la violencia (Waldo, 1988). Las intervenciones incluyen juegos de roles y tareas asignadas dirigidas a mejorar las habilidades expresivas, la empatía, la comunicación con la pareja y la identificación y el manejo de sus emociones (véase Waldo, 1985). Este estudio sugiere que intervenciones más enfocadas en las emociones, en lugar de enfocadas cognitivamente, pueden aumentar el tamaño del efecto del tratamiento de los agresores. Por supuesto, los resultados de cualquier estudio único y no replicado no deben ser excesivamente generalizados. Se necesita más investigación sobre la efectividad de las entrevistas motivacionales, así como los enfoques centrados en las emociones como modalidades de tratamiento o como componentes aditivos de los grupos de intervención de los agresores existentes. 4.4. Limitaciones Una de las mayores preocupaciones a la hora de realizar un meta-análisis es la facilidad con la que se recuerda la "línea de fondo" y se olvidan o ignoran las extensas advertencias de precaución. Aunque sólo se seleccionaron los estudios que cumplieron con los criterios mínimos de rigor (inclusión de un grupo de comparación, un período de seguimiento más allá del final del tratamiento, sin depender del autoinforme de los agresores), sigue habiendo una variabilidad significativa en la calidad de los estudios de investigación. Incluso los estudios experimentales se ven obstaculizados por problemas con altas tasas de deserción, inconsistencias en la notificación de la reincidencia por deserción y bajas tasas de notificación en el seguimiento (Gondolf, 2001). Algunos de estos factores que afectan la calidad de los estudios de investigación se confunden con la calidad del tratamiento y la calidad de la respuesta de la comunidad, factores más amplios que no siempre se pueden determinar. Por lo tanto, se justifica la cautela en la interpretación de estos resultados. Los meta-análisis son sólo tan sólidos como los estudios individuales que se han tenido en cuenta. Los cuasi-experimentos constituyen el grueso de los estudios incluidos en este metanálisis, pero los estudios que comparan a los que completan el tratamiento con los que abandonan los estudios están intrínsecamente confundidos por la autoselección. Los cuasi-experimentos capitalizan en ''creaming'' (Davis & Taylor, 1999); es decir, comparando a los bateadores más motivados con los menos motivados, ''apilando así la baraja a favor de encontrar efectos del programa'' (Davis & Taylor, 1999, p. 74). Sin embargo, los experimentos también tienen sesgos interpretativos. La mayoría de los estudios basan los resultados en la asignación aleatoria original. Si el tratamiento experimental tiene altas tasas de desgaste y los datos de los resultados se basan en "intención de tratar", existe una gran posibilidad de que pocas personas hayan recibido una "dosis" adecuada de tratamiento (Gondolf, 2001). La alternativa, utilizando el tratamiento realmente recibido, resulta en una violación de la asignación aleatoria mientras que simultáneamente participa en el "creaming" (BATIDO CREo), haciendo que el experimento no sea más riguroso que un cuasi-experimento. Los responsables de la formulación de políticas quieren saber si la obligatoriedad de la consejería conduce a tasas más bajas de reincidencia en comparación con otros enfoques. Esta pregunta tiene dos partes: (1) ¿Asistirán al tratamiento si es obligatorio? (2) ¿Tendrá el tratamiento un impacto en la reincidencia si asisten? Tanto los verdaderos como los cuasi-experimentos deben lidiar con la forma de separar las dos partes de esta pregunta. Otras limitaciones incluyen la variabilidad entre los estudios con respecto a lo que constituye la finalización exitosa del tratamiento. En algunos casos, la definición fue clara (por ejemplo, completar el 70% u 80% de las sesiones requeridas) y en otros estudios, no se especificó. Los futuros investigadores deben especificar cuidadosamente lo que califica como finalización exitosa del tratamiento y también examinar la relación entre el número de sesiones de tratamiento asistidas y el resultado para identificar cualquier curva potencial ''dosis-respuesta''. La dependencia en variables dicotómicas de la reincidencia puede ser una estimación demasiado conservadora y disminuir el tamaño del efecto del tratamiento de los agresores. El tamaño total del efecto puede ser mayor si se utiliza una reducción de la violencia en lugar de la cesación de la violencia como medida de resultado. Sin embargo, ello daría lugar a la inclusión de un número menor de estudios, ya que varios de los primeros estudios no informan de las estadísticas necesarias. Además, la importancia clínica del cambio en la violencia atribuible a la intervención de los agresores puede ser cuestionable. Todos los estudios longitudinales se ven afectados por las tasas de seguimiento. Como se muestra en las Tablas 1 y 2, muchos estudios no informan las tasas de participación de las parejas en el seguimiento. Cuando se reportan tasas de contacto de seguimiento con la pareja, éstas varían entre el 22% y el 90% de la muestra. Se cree que los que se pierden en el seguimiento son más abusivos (DeMaris & Jackson, 1987) y, por lo tanto, las tasas de éxito pueden estar infladas (Tolman & Bennett, 1990). Como tal, los tamaños de los efectos resultantes también serían probablemente sobreestimados. Al igual que los informes de las parejas, los informes policiales como medidas de resultado de la reincidencia también son problemáticos y pueden no reflejar adecuadamente la realidad. Dado que las parejas ya están involucradas en intervenciones contra la violencia familiar, sólo una de cada cinco agresiones por violencia doméstica es denunciada a las autoridades (Rosenfeld, 1992). En algunas jurisdicciones, los informes de la policía son inexactos. Los delitos cometidos fuera de la jurisdicción estatal o local, o los incidentes de violencia en los que se aplazó la sentencia, pueden no aparecer en los antecedentes penales. Los delitos que sí aparecen en el registro pueden ser ambiguos en cuanto a si fueron violencia familiar u otros tipos de agresión, y los investigadores tienen que lidiar con qué tipos de delitos ''cuentan'' en términos de reincidencia. Además, el tamaño del efecto debido al tratamiento para los agresores ordenados por el tribunal se confunde con la fuerza de los esfuerzos coordinados de la policía, la libertad condicional y el sistema legal. La potencia del sistema legal que sanciona a los hombres por incumplimiento puede tener un efecto profundo en las tasas de finalización del tratamiento y, como resultado, en el efecto del tratamiento. Sin embargo, pocos estudios intentan examinar los efectos aditivos del arresto, enjuiciamiento, tratamiento, libertad condicional y acción legal por incumplimiento (Babcock & Steiner, 1999; Murphy, Musser, & Maton, 1998, son excepciones). Dadas estas cuestiones metodológicas y pragmáticas, no es sorprendente que el tamaño del efecto atribuible al tratamiento de los agresores sea pequeño. Aunque se excluyeron los estudios de comparación de tratamientos porque sólo permiten una estimación del tamaño de la diferencia entre dos intervenciones activas, toda la literatura sobre la intervención de los agresores en realidad está dominada por estudios de análisis de componentes, que intentan medir el componente aditivo del tratamiento además de las intervenciones legales. Dado que la participación en el sistema legal es probablemente beneficiosa para reducir la reincidencia (Dutton, 1987), los programas de tratamiento ordenados por los tribunales deben reducir aún más la reincidencia por abuso para demostrar la eficacia del tratamiento más allá de las intervenciones del sistema legal (Rosenfeld, 1992). Las diferencias entre dos intervenciones activas son más difíciles de encontrar que entre las condiciones de tratamiento y las de no tratamiento. A esto se suma la tasa de cese espontáneo de la violencia en muestras no clínicas de alrededor del 35% (O'Leary et al., 1989). Para que las intervenciones de los agresores sean efectivas, deben reemplazar tanto la tasa de recuperación espontánea como los efectos de las intervenciones legales. 4.5. Implicaciones clínicas y políticas Los políticos (se refiere a formuladores de políticas) no deben aceptar la hipótesis nula y descartar la posibilidad de que las intervenciones de los agresores tengan un impacto en el abuso de la pareja íntima. Los resultados que muestran un pequeño efecto del tratamiento sobre la abstinencia de la violencia no implican que debamos abandonar nuestros actuales programas de intervención de maltrato. Se encuentran efectos pequeños similares en los meta-análisis de los tratamientos de abuso de sustancias cuando la abstinencia del alcohol es el resultado de interés (Agosti, 1995). Sin embargo, algunas personas son capaces de transformar dramáticamente sus vidas después de las intervenciones de abuso de sustancias o maltrato. Dado lo que ahora sabemos sobre el pequeño tamaño general del efecto del tratamiento de los agresores, las energías de los proveedores de tratamiento, defensores e investigadores por igual pueden estar mejor dirigidas a las maneras de mejorar el tratamiento de los agresores. Debido a que ningún modelo o modalidad de tratamiento ha demostrado superioridad sobre otros, es prematuro que los estados emitan mandatos que limiten el rango de opciones de tratamiento para los agresores. Es más probable que las agencias de intervención para maltratadores mejoren sus servicios añadiendo componentes o adaptando sus tratamientos a la clientela específica, que adhiriéndose rígidamente a cualquier plan de estudios en ausencia de evidencia empírica de su eficacia superior. Diferentes tipos de agresores pueden beneficiarse preferentemente de formas específicas de intervención (Saunders, 1996), pero hasta la fecha no se han llevado a cabo estudios controlados de seguimiento del tratamiento. Aunque un pequeño número de estudios han evaluado los formatos de grupos y parejas, ningún estudio publicado hasta la fecha ha intentado evaluar la eficacia del tratamiento individual para el maltrato, aunque estos investigadores se están embarcando en esta frontera (por ejemplo, Fruzzetti, 2001; Rathus, 2001). Las prometedoras direcciones para mejorar la eficacia del tratamiento incluyen dirigir los tratamientos a submuestras específicas, tales como diferentes grupos étnicos minoritarios, agresores que son químicamente dependientes, agresores en diferentes etapas de motivación, diferentes tipos de agresores (por ejemplo, sólo familia, límite, y tipos antisociales/generalmente violentos), y mujeres arrestadas por violencia doméstica. Los proveedores de tratamiento deben desarrollar técnicas alternativas y colaborar con los investigadores para evaluar su eficacia en un esfuerzo por desarrollar una práctica basada en la evidencia. Con este fin, los investigadores deben convertirse en parte integral de la respuesta coordinada de la comunidad a la violencia doméstica. El tratamiento de los agresores es sólo un componente de la respuesta coordinada de la comunidad a la violencia doméstica. La respuesta de la policía, el enjuiciamiento, la libertad condicional y el tratamiento afectan a la reincidencia de las parejas violentas en el hogar. Incluso los mejores programas de tratamiento ordenados por el tribunal probablemente serán ineficaces en ausencia de una fuerte respuesta legal en la sentencia inicial y en la sanción de los infractores que no cumplan con el tratamiento. Aún así, el tratamiento puede no ser la mejor intervención para todos los agresores. Las sanciones alternativas deben ser desarrolladas y probadas empíricamente junto con los tratamientos alternativos.