DISEÑO DE CASOS Y CONTROLES 1. Objetivos: - Comprender que el diseño de casos y controles representa una estrategia muestral del diseño de cohorte Reconocer las ventajas y limitaciones de las diferentes fuentes de obtención de casos y controles Identificar sesgos más comunes de este diseño y como éstos pueden afectar la validez de los resultados Calcular e interpretar las medidas de riesgo relacionadas con este diseño y su intervalo de confianza Reconocer ventajas y limitaciones de este diseño 2. Términos Claves: Población base, caso incidente, caso prevalente, odds ratio. 3. Desarrollo del tema: 3.1. Introducción El estudio de caso y control, al igual que el estudio transversal y de cohorte, corresponde a un diseño de tipo observacional analítico de base individual. En este diseño la estrategia para determinar si existe asociación entre un evento (enfermedad o muerte) y la exposición a un determinado factor consiste en seleccionar a los individuos que padecen la enfermedad (casos), y a individuos libres del evento (controles). Posteriormente se comparan ambos grupos en relación a la exposición al factor en estudio, la cual se mide forma retrospectiva. Si la prevalencia de exposición entre casos y controles es diferente, entonces puede inferirse que la exposición puede estar asociada a una aparición aumentada o disminuida del resultado de interés. Por ejemplo, para estudiar la relación entre enfermedad renal y la exposición a metales y solventes, se selecciona un grupo que presente la enfermedad renal y otro grupo compuesto por personas que no padezcan la enfermedad y se investiga la exposición a metales y solventes que ambos grupos tuvieron en el pasado. Si existe asociación, entonces la proporción de expuestos al factor, será mayor en el grupo que presenta la enfermedad. El diseño de casos y controles es muy utilizado en enfermedades de baja prevalencia o con períodos de latencia largos, donde los enfermos ya están disponibles y no es necesario esperar un prolongado período de tiempo desde el inicio del estudio para obtener los casos. Si bien el diseño de cohorte es el único diseño observacional que parte de la exposición en busca del efecto, su realización frecuentemente está limitada por la carencia de tiempo o recursos financieros necesarios para estudiar los grandes grupos poblacionales que se requieren para el estudio de enfermedades poco frecuentes; por esta razón, los estudios de casos y controles constituyen una alternativa costo-efectiva para identificar factores de riesgo y generar hipótesis para estudios posteriores. El diseño de casos y controles representa una estrategia muestral, siendo la identificación de la población base uno de los aspectos cruciales de este diseño. A nivel ocupacional, la población base se puede obtener a partir de sistemas de registro de empresas, usuarios de hospitales o clínicas que atienden exclusivamente a población trabajadora, etcétera. Una vez identificada la población base -definida como aquella de donde se originan los casos– se utilizará la misma población para la selección de los controles. Estos últimos deberán representar de manera adecuada a los miembros de la población base que no desarrollaron el evento en estudio, pero que de haberlo desarrollado se podrían haber seleccionado como caso. Conceptualmente, el diseño de caso y control se basa en la identificación de los casos incidentes en una determinada población durante un período de observación definido, tal y como se lleva a cabo en los estudios de cohorte. La diferencia con la cohorte radica en que en el diseño de caso y control se identifica la cohorte (población base), se identifica a los casos y se obtiene una muestra representativa de los individuos de esa cohorte (población base) que no desarrollaron el evento en estudio; esto último tiene el propósito de estimar la proporción de individuos expuestos y no expuestos en la cohorte o población base, evitando de esta manera la necesidad de determinar la presencia de la exposición en todos los miembros de la población o cohorte en estudio. De esta manera se reduce el costo de seguimiento de una cohorte completa a través de un período prolongado de tiempo y por otro lado disminuye el tiempo necesario para realizar el estudio. La principal diferencia entre el diseño de cohorte y de casos y controles se encuentra en la selección de los sujetos de estudio. Mientras que en el diseño de cohorte se parte de un grupo de individuos inicialmente libres del evento en estudio, el cual se sigue en el tiempo con el fin de registrar la ocurrencia del evento, en el diseño de casos y controles se selecciona a los sujetos en función de la presencia o ausencia de la enfermedad o evento en estudio, es decir se parte del efecto en busca de la posible causa, motivo por el cual este diseño es susceptible a diferentes errores o sesgos en su interpretación. Otra limitación es que, en general, no se puede estimar de manera directa las medidas de incidencia o prevalencia que tradicionalmente se obtienen en los estudios de cohorte o transversales. 3.2. Definición de caso Para la definición de caso es esencial tener criterios precisos con el fin de conseguir un grupo lo más homogéneo posible desde el punto de vista diagnóstico. Para ello se recomienda utilizar documentación objetiva que asegure que los casos realmente padecen la enfermedad, por ejemplo en el caso de cáncer se recomienda solicitar un diagnóstico confirmado por histopatología. De modo contrario, si el investigador incluye como casos a personas no confirmadas, se corre el riesgo de diluir el grupo de casos con algunos no casos, disminuyendo la posibilidad de encontrar una diferencia real en la prevalencia a la exposición entre casos y controles. Lo contrario puede ocurrir cuando se incorpora sólo formas graves del proceso en estudio lo que impide que los casos que no hayan evolucionado a formas graves puedan ser estudiados (baja sensibilidad, alta especificidad). En ambos casos se producirá un sesgo en la estimación del riesgo. Al asegurar que los casos sean un grupo relativamente homogéneo, se aumenta la posibilidad de detectar relaciones etiológicas importantes. 3.3. Selección de casos Existen diferentes alternativas para la selección de casos, éstos pueden ser casos prevalentes o incidentes. Lo ideal es incluir a los casos incidentes, es decir todos los casos nuevos que aparecen en una población base dentro de un período de tiempo establecido. Los casos prevalentes corresponden a todos los casos existentes (nuevos y anteriores) en una población en un período de tiempo breve. El uso de casos incidentes presenta varias ventajas en comparación con el uso de casos prevalentes: a) disminución del sesgo de memoria porque el sujeto puede recordar mejor la experiencia pasada por ser más reciente; b) la supervivencia del enfermo no está condicionada por los factores de riesgo como pudiera ocurrir en los casos prevalentes; y c) es menos probable que los casos incidentes hayan modificado la exposición al factor de riesgo como resultado de la enfermedad. El principal inconveniente de utilizar una serie de casos prevalentes es que los pacientes con duración prolongada de la enfermedad tienden a estar sobre representados ya que todos aquellos con una corta duración desaparecen del conjunto de casos prevalentes por recuperación o muerte. Por otro lado la supervivencia de los casos prevalentes puede estar ligada a un determinado factor y si este factor está presente con mayor frecuencia en los casos que en los controles, se le puede atribuir erróneamente el papel causal en la etiología de la enfermedad. Finalmente la utilización conjunta de casos incidentes y prevalentes resta homogeneidad a la definición de caso, dado que es bastante probable que los criterios diagnósticos cambien con el tiempo. Los casos prevalentes pueden ser incluidos cuando no se dispone de casos nuevos porque la enfermedad es muy rara y tiene baja letalidad, y cuando la exposición no modifica el curso clínico (sobrevida) de la enfermedad, como es el caso de enfermedades de predisposición genética. Fuente de casos Los casos de un estudio de casos y controles provienen principalmente de dos fuentes: hospitales, en cuyo caso se incluyen todos los casos que hayan sido tratados en un determinado centro hospitalario durante un período determinado de tiempo (base secundaria del estudio), y los casos basados en la población, que corresponde a todos los casos que provienen de una población claramente definida, como un país o una ciudad, durante un período determinado de tiempo (base primaria del estudio). La obtención de casos a partir de una base primaria ofrece mayores dificultades ya que se requiere disponer de una serie de mecanismos que garanticen una cobertura adecuada de toda la población base (por ejemplo, registros de cáncer). La obtención de casos a partir de una fuente secundaria es más utilizada debido a su mayor facilidad logística y a su menor costo. Selección de los controles El grupo control debe ser una muestra representativa de la población base de la que surgieron los casos. Por el contrario la población base del estudio no necesita ser representativa de ninguna otra población. Los controles en un estudio de caso y control se utilizan fundamentalmente para estimar la proporción de individuos expuestos y no expuestos en la población base que da origen a los casos. Por esta razón, los procedimientos para la selección de los controles quedarán definidos en la medida que se expliciten claramente los criterios de selección de los casos, así como de la población de donde se originan éstos. Generalmente, el grupo control más apropiado corresponde a la subpoblación de individuos que está en riesgo de desarrollar el evento en estudio y de los cuales se puede asegurar, con relativa certeza, que en el caso teórico de que desarrollaran el evento o enfermedad en estudio quedarían incluidos en el grupo de casos. Cuando los casos se obtienen de una población claramente definida en tiempo, espacio y lugar, y éstos constituyen una muestra representativa de los eventos en estudio, la selección de controles se puede realizar mediante un muestreo aleatorio simple de la población base. Otra condición en la selección de los controles es que éstos deben ser seleccionados independientemente de su condición de expuestos o no expuestos para garantizar que representen adecuadamente a la población base. Esto se logra siempre y cuando la condición de exposición no determine la posibilidad de que un individuo sea o no incluido en el estudio como control. Si un control tiene mayor posibilidad de ser seleccionado por estar expuesto, la estimación del riesgo estará sesgada hacia el valor nulo. La probabilidad de selección para los controles debe ser proporcional al tiempo que el sujeto permaneció elegible para desarrollar el evento o enfermedad en estudio. Una manera de operacionalizar este concepto es seleccionando un control del grupo de individuos elegibles cada vez que se selecciona un caso; esto se conoce como selección por grupo en riesgo. En teoría, utilizando este esquema de selección se asegura que los controles están en riesgo de desarrollar el evento en el momento en que son seleccionados. Al seleccionar al grupo control se espera que éstos sean similares al grupo de casos en lo que se refiere a otras variables que pudieran ser factores de riesgo para el desarrollo del evento y al mismo tiempo estar asociados con la exposición. Para controlar estas variables conocidas como confusoras se puede utilizar un esquema de selección que implica que los controles además de cumplir el criterio de estar en riesgo deberán cumplir el criterio de ser del mismo género y grupo de edad. Otro aspecto importante es que la medición de variables debe ser comparable entre los casos y los controles. Todos los procedimientos para medir la exposición o los factores de confusión potenciales deben ser aplicados, reportados y registrados de la misma manera en casos y controles. Fuentes para la selección de los controles En un estudio caso-control basado en la población, los controles deben elegirse aleatoriamente entre los miembros sin la enfermedad de la misma población base (control poblacional). Por ejemplo si se eligen casos nuevos de cáncer pulmonar diagnosticados en la zona de cobertura de un registro regional de cáncer, los controles para estos casos se tomarían correctamente de la población de la misma zona en los mismos grupos de sexo y edad. También se puede utilizar controles hospitalarios, es decir sujetos que acuden al mismo hospital donde se realizó la selección de los casos, pero por un padecimiento diferente. La principal limitación de este grupo control es que los investigadores raramente pueden estar seguros de que la exposición no está relacionada con la enfermedad o el motivo de hospitalización. Por ello se necesita utilizar una variedad de diagnósticos posibles cuando se decide utilizar este tipo de controles, esto con el fin de eliminar sesgos de selección ocasionados al atenuar los efectos de incluir un grupo diagnóstico específico que puede estar relacionado con la exposición en estudio. Es decir, es probable que al padecer algún tipo de enfermedad difieran de los individuos sanos en una serie de factores que tienen relación con el proceso de enfermar, como pueden ser mayor prevalencia en el consumo de tabaco, alcohol o deficientes hábitos dietéticos, y estos factores pueden estar relacionados directa o indirectamente con la exposición en estudio. Una forma de limitar este problema es restringir los controles a aquellas enfermedades que no guardan relación con la exposición de interés. El uso de controles hospitalarios tiene la ventaja de que existen muchos factores de selección que llevan a las personas a los hospitales (nivel socioeconómico, zona de residencia, etc.) y eligiendo controles del mismo conjunto de pacientes del que proceden los casos, se reduce el potencial efecto de estos factores. Como estos pacientes también han experimentado un diagnóstico de enfermedad y una hospitalización, se asemejan a los casos en lo que respecta a su disposición a proporcionar información completa y exacta. Algunos estudios utilizan múltiples controles de una misma base poblacional (dos o más controles por cada caso) para incrementar el poder de estudio. Se acepta que se gana incremento en el poder solamente hasta un índice de un caso por cada cuatro controles. También se puede utilizar múltiples controles de diferentes tipos. Apareamiento El apareamiento es el proceso mediante el cual se selecciona a los controles considerando que éstos tengan características similares a los casos con respecto a una o más posibles variables confundentes tales como sexo, edad y condición socioeconómica. Este procedimiento de reclutamiento de los controles tiene como ventajas aumentar la eficiencia estadística, y disminuir el sesgo asociado a factores de confusión conocidos. Dentro de las desventajas de parear en un estudio de casos y controles se encuentra la de no poder analizar el posible efecto de riesgo de una variable de pareamiento, porque, por definición, son iguales para casos y controles. Asimismo, otra posible desventaja es la de sobrepareamiento, que consiste en reducción de la eficiencia del estudio, y se genera porque se parea por una variable que es una condición intermedia en el camino causal entre exposición y enfermedad. 3.4. Sesgos El problema potencial más grave en los estudios caso-control es que los métodos utilizados para seleccionar a los casos y los controles pueden producir grupos que no sean comparables, introduciendo sesgos que disminuirán la validez de los resultados obtenidos. Este diseño es particularmente vulnerable a los sesgos de selección, por lo que se recomienda trabajar con casos incidentes y evitar que la exposición o variables asociadas a ésta condicionen la participación en el estudio, ya sea como caso o como control, de lo contrario se puede obtener una sobre o subestimación de la asociación real entre la exposición y la enfermedad. La baja tasa de participación también puede introducir un sesgo si los participantes más expuestos hubieran sido más o menos propensos a participar en el estudio. Como fue mencionado con anterioridad, el uso de controles prevalentes también constituye un sesgo de selección ya que estos sujetos representan a los pacientes que sobrevivieron hasta el momento en que se inicia la investigación y, en general, en este grupo hay alta proporción de sujetos que cursaron con la forma más benigna de la enfermedad. En este caso si la exposición estuviese asociada con la enfermedad y también con la sobrevida, el uso de casos prevalentes podría conducir a conclusiones erróneas sobre la relación entre exposición y enfermedad. Otro sesgo frecuente en los diseños de caso-control es el sesgo de medición debido a que normalmente es difícil obtener mediciones exactas de exposiciones en el pasado y el grado de exactitud de estas mediciones puede ser diferente para casos y controles. Es importante minimizar estas diferencias. Una forma de determinar la presencia de diferencia en la memoria de casos y controles es la utilización de fuentes de información independientes como el uso de registros para comparar las historias de exposición obtenidas de los casos y controles. Otro tipo de sesgo conocido como sesgo del entrevistador se puede producir cuando los entrevistadores conocen la condición de caso y control, lo que puede conducir a que la entrevista se realice de manera diferencial entre los grupos, induciendo respuestas positivas sobre la exposición preferencialmente en el grupo de casos. 3.5. Análisis e interpretación La medida de asociación que se utiliza en los estudios de caso y control para evaluar la fuerza de asociación entre el factor en estudio y el evento se conoce como odds ratio (OR). Esta medida indica la frecuencia relativa de la exposición entre los casos y los controles, es decir, casos expuestos sobre los no expuestos (odds de exposición en los casos, a/n1/c/n1=a/c) dividido por los controles expuestos entre los no expuestos (odds de exposición en los controles, b/n0/d/n0=b/d). Casos Controles Total a b m1 c d m0 n1 n0 N Expuestos No Expuestos Total El cociente entre el odds de exposición de los casos y el odds de exposición de los controles corresponde al odds ratio de exposición. OR = a/c = ad b/d cb A diferencia de los estudios de cohorte, en los estudios de casos y controles no se puede estimar directamente la incidencia de la enfermedad en los expuestos y no expuestos, ya que los individuos son seleccionados con base en la presencia o ausencia del evento de estudio y no por el estatus de exposición (a excepción de algunas variantes del estudio de caso-control que son los estudios anidados y de caso-cohorte). Sin embargo, cuando la frecuencia de la enfermedad es baja, el odds ratio puede ser un estimador no sesgado de la razón de tasas de incidencia o del riesgo relativo. El odds ratio obtenido en un estudio caso-control indica cuantas veces es mayor (o menor si la exposición actúa como un factor protector) la probabilidad de que los casos hayan estados expuestos al factor en estudio en comparación con los controles. Su valor oscila entre 0 e infinito, un OR=1 significa que la exposición estudiada no se asocia con la enfermedad; si el OR es menor de uno, la exposición disminuye la posibilidad de desarrollar el evento; y si el OR es mayor de uno, significa que la exposición aumenta la posibilidad de desarrollar el evento. Una vez calculado el odds ratio que es una estimación puntual de la magnitud de asociación entre un determinado factor y una enfermedad, es necesario calcular una medida de la variabilidad de esta estimación, es decir, un intervalo de confianza. Cuando más amplio es el intervalo de confianza menor es la precisión de la estimación. La interpretación habitual indica que el intervalo de confianza calculado a partir de un determinado estudio tiene una probabilidad del 95% de contener el verdadero valor de la asociación (el valor obtenido si se hubiera estudiado a toda la población). Un intervalo de confianza que incluye el valor 1 indica que la asociación no es significativa y que el verdadero valor del OR en el universo podría estar sobre o bajo el valor de no asociación (1). Ventajas − Debido al menor tamaño de muestra requerido respecto el diseño de cohorte, éste diseño es más económico en término de recursos y tiempo. − Casos y controles es el diseño más adecuado para enfermedades con largo período de inducción. La elección de un diseño prospectivo no resultaría eficiente ya que para detectar los casos se tendría que seguir durante un largo período a la población completa. − Con este diseño se puede evaluar simultáneamente la exposición a múltiples factores etiológicos a diferencia del diseño de cohorte en que generalmente se evalúa la exposición a un sólo factor. Desventajas − Este diseño es más susceptible a sesgos que otros diseños, por ejemplo al sesgo de información. Sin embargo esta posibilidad disminuye si el estudio considera el uso de datos recolectados con anterioridad a la ocurrencia de la enfermedad como sería el caso de registros de exposición ocupacional. − El riesgo o la incidencia de la enfermedad no se puede medir directamente. 4. Referencias Bibliográficas - - Lazcano Ponce E y col. Estudios epidemiológicos de casos y controles. Fundamento teórico, variantes y aplicaciones. Salud Pub Mex.2001. 43 (2): 135-150. Piédrola Gil. Medicina Preventiva y Salud Pública. 10ª Edición. Editorial Masson. 2002. Rothman KJ, Greenland S. Modern Epidemiology. 2a. edition. LippincottRaven. 1998. Checkoway H, Pearce N, Kriebel D. Research Methods in Occupational Epidemiology. Second Edition. Oxford University Press. 2004.