diseño de casos y controles

Anuncio
DISEÑO DE CASOS Y CONTROLES
1. Objetivos:
-
Comprender que el diseño de casos y controles representa una estrategia
muestral del diseño de cohorte
Reconocer las ventajas y limitaciones de las diferentes fuentes de obtención de
casos y controles
Identificar sesgos más comunes de este diseño y como éstos pueden afectar la
validez de los resultados
Calcular e interpretar las medidas de riesgo relacionadas con este diseño y su
intervalo de confianza
Reconocer ventajas y limitaciones de este diseño
2. Términos Claves:
Población base, caso incidente, caso prevalente, odds ratio.
3. Desarrollo del tema:
3.1. Introducción
El estudio de caso y control, al igual que el estudio transversal y de cohorte,
corresponde a un diseño de tipo observacional analítico de base individual. En
este diseño la estrategia para determinar si existe asociación entre un evento
(enfermedad o muerte) y la exposición a un determinado factor consiste en
seleccionar a los individuos que padecen la enfermedad (casos), y a individuos
libres del evento (controles). Posteriormente se comparan ambos grupos en
relación a la exposición al factor en estudio, la cual se mide forma retrospectiva. Si
la prevalencia de exposición entre casos y controles es diferente, entonces puede
inferirse que la exposición puede estar asociada a una aparición aumentada o
disminuida del resultado de interés. Por ejemplo, para estudiar la relación entre
enfermedad renal y la exposición a metales y solventes, se selecciona un grupo
que presente la enfermedad renal y otro grupo compuesto por personas que no
padezcan la enfermedad y se investiga la exposición a metales y solventes que
ambos grupos tuvieron en el pasado. Si existe asociación, entonces la proporción
de expuestos al factor, será mayor en el grupo que presenta la enfermedad.
El diseño de casos y controles es muy utilizado en enfermedades de baja
prevalencia o con períodos de latencia largos, donde los enfermos ya están
disponibles y no es necesario esperar un prolongado período de tiempo desde el
inicio del estudio para obtener los casos.
Si bien el diseño de cohorte es el único diseño observacional que parte de la
exposición en busca del efecto, su realización frecuentemente está limitada por la
carencia de tiempo o recursos financieros necesarios para estudiar los grandes
grupos poblacionales que se requieren para el estudio de enfermedades poco
frecuentes; por esta razón, los estudios de casos y controles constituyen una
alternativa costo-efectiva para identificar factores de riesgo y generar hipótesis
para estudios posteriores. El diseño de casos y controles representa una
estrategia muestral, siendo la identificación de la población base uno de los
aspectos cruciales de este diseño. A nivel ocupacional, la población base se
puede obtener a partir de sistemas de registro de empresas, usuarios de
hospitales o clínicas que atienden exclusivamente a población trabajadora,
etcétera. Una vez identificada la población base -definida como aquella de donde
se originan los casos– se utilizará la misma población para la selección de los
controles. Estos últimos deberán representar de manera adecuada a los miembros
de la población base que no desarrollaron el evento en estudio, pero que de
haberlo desarrollado se podrían haber seleccionado como caso.
Conceptualmente, el diseño de caso y control se basa en la identificación de los
casos incidentes en una determinada población durante un período de
observación definido, tal y como se lleva a cabo en los estudios de cohorte. La
diferencia con la cohorte radica en que en el diseño de caso y control se identifica
la cohorte (población base), se identifica a los casos y se obtiene una muestra
representativa
de los individuos de esa cohorte (población base) que no
desarrollaron el evento en estudio; esto último tiene el propósito de estimar la
proporción de individuos expuestos y no expuestos en la cohorte o población
base, evitando de esta manera la necesidad de determinar la presencia de la
exposición en todos los miembros de la población o cohorte en estudio. De esta
manera se reduce el costo de seguimiento de una cohorte completa a través de un
período prolongado de tiempo y por otro lado disminuye el tiempo necesario para
realizar el estudio.
La principal diferencia entre el diseño de cohorte y de casos y controles se
encuentra en la selección de los sujetos de estudio. Mientras que en el diseño de
cohorte se parte de un grupo de individuos inicialmente libres del evento en
estudio, el cual se sigue en el tiempo con el fin de registrar la ocurrencia del
evento, en el diseño de casos y controles se selecciona a los sujetos en función de
la presencia o ausencia de la enfermedad o evento en estudio, es decir se parte
del efecto en busca de la posible causa, motivo por el cual este diseño es
susceptible a diferentes errores o sesgos en su interpretación.
Otra limitación es que, en general, no se puede estimar de manera directa las
medidas de incidencia o prevalencia que tradicionalmente se obtienen en los
estudios de cohorte o transversales.
3.2. Definición de caso
Para la definición de caso es esencial tener criterios precisos con el fin de
conseguir un grupo lo más homogéneo posible desde el punto de vista
diagnóstico. Para ello se recomienda utilizar documentación objetiva que asegure
que los casos realmente padecen la enfermedad, por ejemplo en el caso de
cáncer se recomienda solicitar un diagnóstico confirmado por histopatología. De
modo contrario, si el investigador incluye como casos a personas no confirmadas,
se corre el riesgo de diluir el grupo de casos con algunos no casos, disminuyendo
la posibilidad de encontrar una diferencia real en la prevalencia a la exposición
entre casos y controles. Lo contrario puede ocurrir cuando se incorpora sólo
formas graves del proceso en estudio lo que impide que los casos que no hayan
evolucionado a formas graves puedan ser estudiados (baja sensibilidad, alta
especificidad). En ambos casos se producirá un sesgo en la estimación del riesgo.
Al asegurar que los casos sean un grupo relativamente homogéneo, se aumenta
la posibilidad de detectar relaciones etiológicas importantes.
3.3. Selección de casos
Existen diferentes alternativas para la selección de casos, éstos pueden ser casos
prevalentes o incidentes. Lo ideal es incluir a los casos incidentes, es decir todos
los casos nuevos que aparecen en una población base dentro de un período de
tiempo establecido. Los casos prevalentes corresponden a todos los casos
existentes (nuevos y anteriores) en una población en un período de tiempo breve.
El uso de casos incidentes presenta varias ventajas en comparación con el uso de
casos prevalentes: a) disminución del sesgo de memoria porque el sujeto puede
recordar mejor la experiencia pasada por ser más reciente; b) la supervivencia del
enfermo no está condicionada por los factores de riesgo como pudiera ocurrir en
los casos prevalentes; y c) es menos probable que los casos incidentes hayan
modificado la exposición al factor de riesgo como resultado de la enfermedad.
El principal inconveniente de utilizar una serie de casos prevalentes es que los
pacientes con duración prolongada de la enfermedad tienden a estar sobre
representados ya que todos aquellos con una corta duración desaparecen del
conjunto de casos prevalentes por recuperación o muerte. Por otro lado la
supervivencia de los casos prevalentes puede estar ligada a un determinado factor
y si este factor está presente con mayor frecuencia en los casos que en los
controles, se le puede atribuir erróneamente el papel causal en la etiología de la
enfermedad.
Finalmente la utilización conjunta de casos incidentes y prevalentes resta
homogeneidad a la definición de caso, dado que es bastante probable que los
criterios diagnósticos cambien con el tiempo.
Los casos prevalentes pueden ser incluidos cuando no se dispone de casos
nuevos porque la enfermedad es muy rara y tiene baja letalidad, y cuando la
exposición no modifica el curso clínico (sobrevida) de la enfermedad, como es el
caso de enfermedades de predisposición genética.
Fuente de casos
Los casos de un estudio de casos y controles provienen principalmente de dos
fuentes: hospitales, en cuyo caso se incluyen todos los casos que hayan sido
tratados en un determinado centro hospitalario durante un período determinado de
tiempo (base secundaria del estudio), y los casos basados en la población, que
corresponde a todos los casos que provienen de una población claramente
definida, como un país o una ciudad, durante un período determinado de tiempo
(base primaria del estudio).
La obtención de casos a partir de una base primaria ofrece mayores dificultades
ya que se requiere disponer de una serie de mecanismos que garanticen una
cobertura adecuada de toda la población base (por ejemplo, registros de cáncer).
La obtención de casos a partir de una fuente secundaria es más utilizada debido a
su mayor facilidad logística y a su menor costo.
Selección de los controles
El grupo control debe ser una muestra representativa de la población base de la
que surgieron los casos. Por el contrario la población base del estudio no necesita
ser representativa de ninguna otra población. Los controles en un estudio de caso
y control se utilizan fundamentalmente para estimar la proporción de individuos
expuestos y no expuestos en la población base que da origen a los casos. Por
esta razón, los procedimientos para la selección de los controles quedarán
definidos en la medida que se expliciten claramente los criterios de selección de
los casos, así como de la población de donde se originan éstos. Generalmente, el
grupo control más apropiado corresponde a la subpoblación de individuos que
está en riesgo de desarrollar el evento en estudio y de los cuales se puede
asegurar, con relativa certeza, que en el caso teórico de que desarrollaran el
evento o enfermedad en estudio quedarían incluidos en el grupo de casos.
Cuando los casos se obtienen de una población claramente definida en tiempo,
espacio y lugar, y éstos constituyen una muestra representativa de los eventos en
estudio, la selección de controles se puede realizar mediante un muestreo
aleatorio simple de la población base.
Otra condición en la selección de los controles es que éstos deben ser
seleccionados independientemente de su condición de expuestos o no expuestos
para garantizar que representen adecuadamente a la población base. Esto se
logra siempre y cuando la condición de exposición no determine la posibilidad de
que un individuo sea o no incluido en el estudio como control. Si un control tiene
mayor posibilidad de ser seleccionado por estar expuesto, la estimación del riesgo
estará sesgada hacia el valor nulo.
La probabilidad de selección para los controles debe ser proporcional al tiempo
que el sujeto permaneció elegible para desarrollar el evento o enfermedad en
estudio. Una manera de operacionalizar este concepto es seleccionando un
control del grupo de individuos elegibles cada vez que se selecciona un caso; esto
se conoce como selección por grupo en riesgo. En teoría, utilizando este esquema
de selección se asegura que los controles están en riesgo de desarrollar el evento
en el momento en que son seleccionados.
Al seleccionar al grupo control se espera que éstos sean similares al grupo de
casos en lo que se refiere a otras variables que pudieran ser factores de riesgo
para el desarrollo del evento y al mismo tiempo estar asociados con la exposición.
Para controlar estas variables conocidas como confusoras se puede utilizar un
esquema de selección que implica que los controles además de cumplir el criterio
de estar en riesgo deberán cumplir el criterio de ser del mismo género y grupo de
edad.
Otro aspecto importante es que la medición de variables debe ser comparable
entre los casos y los controles. Todos los procedimientos para medir la exposición
o los factores de confusión potenciales deben ser aplicados, reportados y
registrados de la misma manera en casos y controles.
Fuentes para la selección de los controles
En un estudio caso-control basado en la población, los controles deben elegirse
aleatoriamente entre los miembros sin la enfermedad de la misma población base
(control poblacional). Por ejemplo si se eligen casos nuevos de cáncer pulmonar
diagnosticados en la zona de cobertura de un registro regional de cáncer, los
controles para estos casos se tomarían correctamente de la población de la misma
zona en los mismos grupos de sexo y edad.
También se puede utilizar controles hospitalarios, es decir sujetos que acuden al
mismo hospital donde se realizó la selección de los casos, pero por un
padecimiento diferente. La principal limitación de este grupo control es que los
investigadores raramente pueden estar seguros de que la exposición no está
relacionada con la enfermedad o el motivo de hospitalización. Por ello se necesita
utilizar una variedad de diagnósticos posibles cuando se decide utilizar este tipo
de controles, esto con el fin de eliminar sesgos de selección ocasionados al
atenuar los efectos de incluir un grupo diagnóstico específico que puede estar
relacionado con la exposición en estudio. Es decir, es probable que al padecer
algún tipo de enfermedad difieran de los individuos sanos en una serie de factores
que tienen relación con el proceso de enfermar, como pueden ser mayor
prevalencia en el consumo de tabaco, alcohol o deficientes hábitos dietéticos, y
estos factores pueden estar relacionados directa o indirectamente con la
exposición en estudio. Una forma de limitar este problema es restringir los
controles a aquellas enfermedades que no guardan relación con la exposición de
interés.
El uso de controles hospitalarios tiene la ventaja de que existen muchos factores
de selección que llevan a las personas a los hospitales (nivel socioeconómico,
zona de residencia, etc.) y eligiendo controles del mismo conjunto de pacientes del
que proceden los casos, se reduce el potencial efecto de estos factores. Como
estos pacientes también han experimentado un diagnóstico de enfermedad y una
hospitalización, se asemejan a los casos en lo que respecta a su disposición a
proporcionar información completa y exacta.
Algunos estudios utilizan múltiples controles de una misma base poblacional (dos
o más controles por cada caso) para incrementar el poder de estudio. Se acepta
que se gana incremento en el poder solamente hasta un índice de un caso por
cada cuatro controles. También se puede utilizar múltiples controles de diferentes
tipos.
Apareamiento
El apareamiento es el proceso mediante el cual se selecciona a los controles
considerando que éstos tengan características similares a los casos con respecto
a una o más posibles variables confundentes tales como sexo, edad y condición
socioeconómica. Este procedimiento de reclutamiento de los controles tiene como
ventajas aumentar la eficiencia estadística, y disminuir el sesgo asociado a
factores de confusión conocidos.
Dentro de las desventajas de parear en un estudio de casos y controles se
encuentra la de no poder analizar el posible efecto de riesgo de una variable de
pareamiento, porque, por definición, son iguales para casos y controles. Asimismo,
otra posible desventaja es la de sobrepareamiento, que consiste en reducción de
la eficiencia del estudio, y se genera porque se parea por una variable que es una
condición intermedia en el camino causal entre exposición y enfermedad.
3.4. Sesgos
El problema potencial más grave en los estudios caso-control es que los métodos
utilizados para seleccionar a los casos y los controles pueden producir grupos que
no sean comparables, introduciendo sesgos que disminuirán la validez de los
resultados obtenidos.
Este diseño es particularmente vulnerable a los sesgos de selección, por lo que
se recomienda trabajar con casos incidentes y evitar que la exposición o variables
asociadas a ésta condicionen la participación en el estudio, ya sea como caso o
como control, de lo contrario se puede obtener una sobre o subestimación de la
asociación real entre la exposición y la enfermedad. La baja tasa de participación
también puede introducir un sesgo si los participantes más expuestos hubieran
sido más o menos propensos a participar en el estudio.
Como fue mencionado con anterioridad, el uso de controles prevalentes también
constituye un sesgo de selección ya que estos sujetos representan a los pacientes
que sobrevivieron hasta el momento en que se inicia la investigación y, en general,
en este grupo hay alta proporción de sujetos que cursaron con la forma más
benigna de la enfermedad. En este caso si la exposición estuviese asociada con la
enfermedad y también con la sobrevida, el uso de casos prevalentes podría
conducir a conclusiones erróneas sobre la relación entre exposición y enfermedad.
Otro sesgo frecuente en los diseños de caso-control es el sesgo de medición
debido a que normalmente es difícil obtener mediciones exactas de exposiciones
en el pasado y el grado de exactitud de estas mediciones puede ser diferente para
casos y controles. Es importante minimizar estas diferencias. Una forma de
determinar la presencia de diferencia en la memoria de casos y controles es la
utilización de fuentes de información independientes como el uso de registros para
comparar las historias de exposición obtenidas de los casos y controles.
Otro tipo de sesgo conocido como sesgo del entrevistador se puede producir
cuando los entrevistadores conocen la condición de caso y control, lo que puede
conducir a que la entrevista se realice de manera diferencial entre los grupos,
induciendo respuestas positivas sobre la exposición preferencialmente en el grupo
de casos.
3.5. Análisis e interpretación
La medida de asociación que se utiliza en los estudios de caso y control para
evaluar la fuerza de asociación entre el factor en estudio y el evento se conoce
como odds ratio (OR). Esta medida indica la frecuencia relativa de la exposición
entre los casos y los controles, es decir, casos expuestos sobre los no expuestos
(odds de exposición en los casos, a/n1/c/n1=a/c) dividido por los controles
expuestos entre los no expuestos (odds de exposición en los controles,
b/n0/d/n0=b/d).
Casos
Controles
Total
a
b
m1
c
d
m0
n1
n0
N
Expuestos
No
Expuestos
Total
El cociente entre el odds de exposición de los casos y el odds de exposición de los
controles corresponde al odds ratio de exposición.
OR
=
a/c = ad
b/d
cb
A diferencia de los estudios de cohorte, en los estudios de casos y controles no se
puede estimar directamente la incidencia de la enfermedad en los expuestos y no
expuestos, ya que los individuos son seleccionados con base en la presencia o
ausencia del evento de estudio y no por el estatus de exposición (a excepción de
algunas variantes del estudio de caso-control que son los estudios anidados y de
caso-cohorte). Sin embargo, cuando la frecuencia de la enfermedad es baja, el
odds ratio puede ser un estimador no sesgado de la razón de tasas de incidencia
o del riesgo relativo.
El odds ratio obtenido en un estudio caso-control indica cuantas veces es mayor (o
menor si la exposición actúa como un factor protector) la probabilidad de que los
casos hayan estados expuestos al factor en estudio en comparación con los
controles. Su valor oscila entre 0 e infinito, un OR=1 significa que la exposición
estudiada no se asocia con la enfermedad; si el OR es menor de uno, la
exposición disminuye la posibilidad de desarrollar el evento; y si el OR es mayor
de uno, significa que la exposición aumenta la posibilidad de desarrollar el evento.
Una vez calculado el odds ratio que es una estimación puntual de la magnitud de
asociación entre un determinado factor y una enfermedad, es necesario calcular
una medida de la variabilidad de esta estimación, es decir, un intervalo de
confianza. Cuando más amplio es el intervalo de confianza menor es la precisión
de la estimación.
La interpretación habitual indica que el intervalo de confianza calculado a partir de
un determinado estudio tiene una probabilidad del 95% de contener el verdadero
valor de la asociación (el valor obtenido si se hubiera estudiado a toda la
población). Un intervalo de confianza que incluye el valor 1 indica que la
asociación no es significativa y que el verdadero valor del OR en el universo
podría estar sobre o bajo el valor de no asociación (1).
Ventajas
− Debido al menor tamaño de muestra requerido respecto el diseño de cohorte,
éste diseño es más económico en término de recursos y tiempo.
− Casos y controles es el diseño más adecuado para enfermedades con largo
período de inducción. La elección de un diseño prospectivo no resultaría
eficiente ya que para detectar los casos se tendría que seguir durante un largo
período a la población completa.
− Con este diseño se puede evaluar simultáneamente la exposición a múltiples
factores etiológicos a diferencia del diseño de cohorte en que generalmente se
evalúa la exposición a un sólo factor.
Desventajas
− Este diseño es más susceptible a sesgos que otros diseños, por ejemplo al
sesgo de información. Sin embargo esta posibilidad disminuye si el estudio
considera el uso de datos recolectados con anterioridad a la ocurrencia de la
enfermedad como sería el caso de registros de exposición ocupacional.
− El riesgo o la incidencia de la enfermedad no se puede medir directamente.
4. Referencias Bibliográficas
-
-
Lazcano Ponce E y col. Estudios epidemiológicos de casos y controles.
Fundamento teórico, variantes y aplicaciones. Salud Pub Mex.2001. 43 (2):
135-150.
Piédrola Gil. Medicina Preventiva y Salud Pública. 10ª Edición. Editorial
Masson. 2002.
Rothman KJ, Greenland S. Modern Epidemiology. 2a. edition. LippincottRaven. 1998.
Checkoway H, Pearce N, Kriebel D. Research Methods in Occupational
Epidemiology. Second Edition. Oxford University Press. 2004.
Descargar