Descuento Temporal, Impulsividad y Estimación Temporal en un Modelo Animal de Trastorno por Déficit de Atención e Hiperactividad. Responsable Dr. Vladimir Orduña El presente proyecto está basado en la revisión de 4 diferentes líneas de investigación: A) El estudio de la elección en análisis experimental de la conducta, fuertemente influida por el desarrollo de modelos de descuento temporal hiperbólicos, y la relación de éstos con la impulsividad; B) El área de estimación temporal y su relación con la conducta de elección; C) El estudio de los síntomas del trastorno por déficit de atención e hiperactividad, y D) Los intentos por encontrar modelos animales de este trastorno que faciliten la investigación del mismo. A continuación se describirá con mayor detalle estas áreas de investigación, para después proponer cinco experimentos que las integran. Las metas científicas, de formación de recursos y la infraestructura disponible para el desarrollo de los mismos se presentan en la parte final del escrito. ANTECEDENTES A. EL ÁREA DE ELECCIÓN EN ANÁLISIS EXPERIMENTAL DE LA CONDUCTA. Dadas las notorias regularidades en el comportamiento generadas por los diversos programas de reforzamiento (Ferster y Skinner, 1957), se ha investigado extensivamente el tema de elección empleando como herramienta los programas de reforzamiento. Uno de los productos más importantes de esta línea de investigación es la ley de igualación (Herrnstein, 1961,1970), que afirma que en una situación con dos programas de reforzamiento de intervalo variable disponibles concurrentemente, la tasa relativa de respuestas de cada programa será igual a la tasa relativa de reforzamiento que dicho programa otorga. La ley de igualación ha sido extendida a otros problemas de elección como el que se genera cuando los reforzadores a elegir difieren en magnitud (Catania, 1963), o en demora (Chung y Herrnstein, 1967), o cuando se elige entre reforzadores condicionados (Herrnstein, 1964). En particular, cuando los reforzadores difieren tanto en magnitud como en demora, la ley de igualación predice que la demora afectará la preferencia hasta tal punto que los organismos preferirán una opción con una demora menor, a pesar que esto les impida maximizar la cantidad de reforzamiento obtenida en la sesión. La relación existente entre el valor de un reforzador y la demora para obtenerlo ha sido un tema extensivamente estudiado. Con la intención de conocer de manera precisa la función de descuento temporal, Mazur (1984) diseñó el “procedimiento de ajuste de demora”, en el que el organismo puede elegir entre dos alternativas, una cantidad pequeña obtenida después de una demora fija (p.ej, 2 seg), y una cantidad grande después de una demora ajustable (p.ej, 6 seg.) Si el organismo selecciona repetidamente la cantidad grande, la demora ajustable es incrementada, mientras que si el organismo selecciona la cantidad pequeña, la demora ajustable es disminuida. Cuando el sujeto elige ambas alternativas por igual y se cumplen ciertos requisitos de estabilidad, se asume que el incremento en cantidad compensa el incremento en demora. Esto se considera un punto de indiferencia. Mediante un conjunto de puntos de indiferencia usando diferentes demoras fijas, la función de descuento temporal puede ser calculada. Mazur (1987) ajustó diferentes funciones (incluyendo una función exponencial, de amplio uso en economía) a los datos obtenidos mediante el procedimiento de ajuste de demora y encontró que la siguiente ecuación hiperbólica es la que mejor describe sus datos: A V= (1) 1 + kD Donde V es el valor del reforzador, A es la cantidad de reforzamiento, D es la demora de reforzamiento, y k es un parámetro que indica la sensibilidad a la demora. La curva de decaimiento hiperbólico obtenida empíricamente tanto con sujetos animales (Mazur, 1987; Richards et al 1997) como con humanos (Myerson y Green, 1995), proporciona un buen ajuste cuantitativo a los datos de experimentos en los cuales cantidades, probabilidades y distribuciones de reforzamiento son variadas (para una revisión, ver Mazur, 2001). Entre otras importantes consecuencias sobre la motivación, el descuento temporal hiperbólico predice la inconsistencia en el tiempo que caracteriza la conducta impulsiva: El valor relativo de dos alternativas disponibles después de cierto tiempo puede cambiar con la adición o sustracción de una demora igual a las dos alternativas. Dada la forma de la función de descuento temporal, una alternativa que era inferior desde cierta distancia temporal puede ser preferida cuando su disponibilidad se vuelve inmediata. De esta manera, el descuento temporal hiperbólico tiene como consecuencia inconsistencias sistemáticas en la preferencia. Los modelos de descuento temporal hiperbólico han sido aplicados a numerosas situaciones de elección, tanto animal como humana. Orduña y Bouzas (2004), por ejemplo, contrastaron 2 modelos de elección bajo riesgo, encontrando que la preferencia de palomas entre dos alternativas que diferían en el riesgo en la demora al reforzador, fue adecuadamente predicha por un modelo basado en descuento temporal hiperbólico. En cuanto a investigación con humanos, se ha encontrado que el parámetro de sensibilidad a la demora (k en la ecuación 1) es mayor en: a) adictos a heroína y anfetaminas que en personas que nunca han usado dichas drogas (Bretteville-Jensen, 1999; Kirby et al, 1999); b) bebedores problema que en bebedores sociales (Vuchinich y Simpson, 1998); c) en personas adictas al juego (Alessi y Petri, 2003); d) en fumadores (Baker et al, 2003); y e) en adolescentes que reportan un mayor uso de sustancias prohibidas (Kollins, 2003). Todas estas conductas son consideradas impulsivas debido a que involucrarse en ellas impide que el sujeto maximice la cantidad de reforzadores obtenida a largo plazo. El hecho de que se haya encontrado una sensibilidad mayor a la demora en personas que sufren de la ejecución de conductas tan diversas sugiere que la impulsividad en general se deriva de las propiedades que relacionan las recompensas con la conducta, en especial el gradiente de demora al reforzador. B. ESTIMACIÓN TEMPORAL Y SU IMPORTANCIA EN LA CONDUCTA DE ELECCIÓN. La estimación temporal adquiere un papel cada vez más relevante en las teorías del aprendizaje y la elección animal. Gallistel y Gibbon (2000) han mostrado como los fenómenos mas importantes del condicionamiento clásico y operante, y del área de elección pueden ser parsimoniosamente explicados asumiendo que las variables controladoras del comportamiento son el conocimiento de los intervalos temporales entre eventos y el recíproco de dichos intervalos, la tasa de ocurrencia de los eventos. Los procesos que le permiten a un organismo estimar el paso del tiempo y ajustar su conducta a las propiedades temporales del ambiente han sido ampliamente estudiados mediante diversos procedimientos que modelan la relación existente entre el tiempo y el comportamiento. Killeen y Fetterman (1988) clasifican las tareas de estimación temporal en tres grupos dependiendo de esta relación: a) en las tareas de estimación inmediata, las respuestas de un organismo reflejan la estimación del tiempo que está transcurriendo; b) en las tareas de estimación retrospectiva, las respuestas de los organismos reflejan la estimación temporal de un evento que ya ha transcurrido; y c) en las tareas de estimación prospectiva, las respuestas de los organismos dependen de la estimación del tiempo que transcurrirá entre su conducta y la ocurrencia de un evento. La evaluación del gradiente de demora cae en esta última característica debido a que las respuestas de los organismos dependen del tiempo que separa la obtención del reforzador de su respuesta. Debido a que estos procedimientos serán empleados en los experimentos de este proyecto, a continuación se describen con algún detalle B1. En los procedimientos de estimación temporal inmediata, la tarea del organismo es estimar el paso de cierto intervalo, normalmente el tiempo necesario para que un reforzador esté disponible. Cuando el inicio de dicho intervalo es marcado por la propia respuesta del organismo tenemos un programa de reforzamiento conocido como de tiempo entre respuestas (TER); cuando el intervalo comienza con la obtención del reforzador tenemos un programa de reforzamiento de intervalo fijo (IF), o un procedimiento de pico. En los programas TER>t, el reforzador se entrega a cada respuesta que esté separada de la respuesta anterior por al menos el tiempo criterio (t). Para valorar la ejecución en estos programas se evalúan la tasa de respuestas y la tasa de reforzamiento, que están inversamente relacionadas, y la razón entre estas medidas es considerada como un índice de la “eficiencia”. Estas medidas son suficientes para detectar los efectos de ciertos fármacos, y lesiones en el cerebro (Al-Ruwaitea et al 1997). Además de estas medidas, se analiza la distribución de frecuencias de los TER, que normalmente es bimodal, con una moda en TERs muy cortos, y la otra aproximadamente en el TER criterio. El procedimiento de pico (Catania, 1970) tiene como antecedente la regularidad en el comportamiento observada en los programas de reforzamiento de intervalo fijo (regla que especifica que se entregará reforzador a la primera respuesta que ocurra después de que ha transcurrido cierto intervalo desde la obtención del reforzador anterior) en los que la tasa de respuesta es muy baja inmediatamente después de la obtención del reforzador y va acelerándose cada vez más, hasta la obtención del siguiente reforzador. En el procedimiento de pico, además de los ensayos reforzados en los que un IF está en efecto, existen ensayos no reforzados de una duración tres veces mayor al IF que solamente pueden diferenciarse por que ha transcurrido el tiempo sin la obtención del reforzador. Cuando el organismo se ha ajustado a este programa, en los ensayos no reforzados se observa un incremento progresivo en la tasa de respuestas que tiene un punto máximo (pico) alrededor de la duración del IF de los ensayos reforzados, seguida por una disminución progresiva de la tasa de respuesta. Este programa, por lo tanto, permite observar tanto la estimación de la anticipación del reforzador, como la estimación de que el tiempo esperado para el reforzamiento ha transcurrido sin que éste se presente. B2. En los procedimientos de estimación temporal retrospectiva, el dato de principal interés es la respuesta de un organismo con relación a la duración de un evento que ya ha terminado. El procedimiento de estimación retrospectiva mas ampliamente utilizado es la bisección temporal (Church y Deluty, 1997). En esta tarea, los organismos son entrenados a distinguir entre dos duraciones del estímulo muestra. Por ejemplo, si la duración de una tecla encendida fue 2 segundos, picar la tecla derecha es reforzado; si la duración de la tecla encendida fue 8 segundos, picar la tecla izquierda es reforzado. Cuando los sujetos responden adecuadamente ante estos estímulos, se someten a prueba mediante ensayos no reforzados en los que se presentan duraciones del estímulo situadas entre los dos valores entrenados. Esta prueba de generalización temporal permite determinar que duración, entre las de la prueba de generalización, estima el sujeto como punto medio entre los dos criterios entrenados (punto de bisección); ésta será la duración del estímulo situada entre 2 y 8 segundos ante la que el sujeto manifieste indiferencia, eligiendo en el 50 por ciento de los ensayos una tecla determinada y el 50 por ciento restante la otra tecla. Para cada una de estas duraciones de prueba , se registra el porcentaje de veces que el sujeto responde en la tecla asociada con la duración larga (%L), y el resultado común es que %L es una función sigmoidal de la duración del estímulo muestra, con un punto de bisección en la media geométrica de las dos duraciones entrenadas, lo cual significa que los sujetos emplean en su decisión la razón entre el estímulo entrenado y el presentado en las pruebas de generalización. B3. Como fue revisado anteriormente, la eficacia de un reforzador disminuye como una función de la separación temporal de la respuesta que lo produjo. Cuando un organismo selecciona una opción asociada con una demora, se asume que de alguna manera está estimando el tiempo que transcurrirá después de su respuesta hasta la obtención del reforzador. Debido a esto, las tareas que permiten la evaluación del gradiente de demora, pueden ser consideradas también procedimientos de estimación temporal prospectiva Los resultados de estos tres tipos de tareas han sugerido una importante propiedad del proceso de estimación temporal. Los organismos comparan duraciones empleando las razones entre ellas y no las diferencias absolutas, es decir, los estimados subjetivos de las duraciones absolutas se ajustan a la ley de Weber: la diferencia requerida para discriminar una duración de otra es una fracción de dicha magnitud. Esta propiedad da como resultado que si graficamos nuestra variable dependiente como una función del tiempo relativo, las líneas se sobreimponen (Gibbon, 1977). Este resultado ha dado lugar a diversos modelos de estimación temporal entre los que destaca la teoría de expectancia escalar (Gibbon, 1977, 1991). De acuerdo a esta teoría, existen tres diferentes fases en el proceso de ajuste temporal del comportamiento. El primer nivel, El Reloj, consiste en a) un generador que emite pulsos mediante los cuales el tiempo es medido b) un switch sensible a procesos atencionales que determina cuando los pulsos son tomados en cuenta, y c) un acumulador en el que el número total de pulsos es almacenado. El número de pulsos en el acumulador representa la cantidad de tiempo que ha transcurrido desde que el switch fue cerrado y la estimación temporal comenzó. La siguiente fase, Memoria, está compuesta por una memoria de trabajo, en la que el contenido del acumulador en el ensayo actual es copiado, y una memoria de referencia, en la que se encuentran los diversos tiempos que han sido depositados en el acumulador. La tercera fase, Comparación, aplica una regla de decisión que determina si el valor en el acumulador (memoria de trabajo) se aproxima al valor de una muestra obtenida de la memoria de referencia, en cuyo caso se ejecuta la respuesta. Esta teoría de alguna manera ha guiado la investigación de la estimación temporal y ha permitido la investigación conjunta de las diversas disciplinas relacionadas con el ajuste temporal del comportamiento. Por ejemplo, ha fomentado un gran interés en encontrar la relación entre diversas manipulaciones farmacológicas y la estimación temporal, encontrando que las diversas etapas del reloj pueden ser alteradas mediante la administración de diversos fármacos. Por ejemplo, los fármacos dopaminérgicos incrementan la velocidad de la generación de pulsos (Maricq y Church, 1983), los fármacos noradrenérgicos afectan los procesos atencionales relacionados con la operación del switch (Penney et al, 1996), y los fármacos colinérgicos afectan la velocidad con la que la información es transmitida del acumulador a la memoria de referencia (Meck y Church, 1987). La relación entre la impulsividad y la estimación temporal, implícita en los modelos de estimación prospectivos, ha sido estudiada mediante la lesión del sistema serotonérgico, bajo la suposición de que la impulsividad es afectada debido a la alteración de las funciones de estimación temporal (Ho et al, 1995, 1998). Van den Broek et al (1987), en un intento de relacionar la impulsividad con la estimación temporal clasificaron a sus sujetos (humanos) de acuerdo a la presencia de impulsividad, y los sometieron a un programa de reforzamiento TER>10 segundos. Los sujetos impulsivos ganaron menos reforzadores debido a la emisión de muchas respuestas con tiempos entre respuesta cortos (menores a 10 segundos). Debido a que la deficiente ejecución en los programas TER>t no necesariamente implica un déficit en la estimación temporal, Van den Broek et al (1992) sometieron a sujetos impulsivos y no impulsivos a una tarea de reproducción temporal, encontrando que los sujetos impulsivos producían tiempos más cortos que los requeridos. De esta manera, parece ser que lo sujetos impulsivos tienen un problema en la evaluación del paso del tiempo, y registran un tiempo mayor al realmente transcurrido, lo que puede ocasionar el déficit conductual mencionado. C. EL TRASTORNO POR DÉFICIT DE ATENCIÓN E HIPERACTIVIDAD. La impulsividad discutida en los párrafos anteriores es uno de los componentes principales de varios trastornos psiquiátricos entre los que destaca el Trastorno por Déficit de Atención e Hiperactividad (TDAH). Las estimaciones de la abundancia de este trastorno en la población infantil varían entre 3 y 17%, mientras que su abundancia en la población adulta es de aproximadamente 4% (Taylor, 1998). El diagnóstico del TDAH está basado en los criterios del DSM-IV el cual distingue entre 3 diferentes subtipos: El predominantemente inatentivo, el predominantemente impulsivo-hiperactivo, y el combinado. Las características principales de los diversos síntomas se presentan a continuación Déficit de Atención. El déficit de atención de los pacientes con TDAH se manifiesta en la atención focalizada visual y auditiva, en tareas de vigilancia, y en distractibilidad. Estos problemas de atención están relacionados con factores motivacionales, y probablemente se derivan de ellos, puesto que cuando los pacientes están involucrados en actividades altamente reforzantes, el déficit se atenúa, o desaparece. De acuerdo a Voeller (2003), el déficit de atención está relacionado con dificultades en la planeación, o en la adherencia a los planes para alcanzar metas en el futuro. Otra aspecto implícitamente relacionado con la atención es la habilidad de estimar el tiempo transcurrido. Las personas con TDAH tienen mayor dificultad para visualizarse en el futuro, por lo que es difícil organizar los materiales para llevar a acabo alguna actividad en el futuro. También tienen dificultades para desarrollar representaciones de lo que ha ocurrido en el pasado. El registro del paso del tiempo y la habilidad para reproducir duraciones están deterioradas en niños (Barkley et al, 1997; Meaux et al, 2003), adultos (Barkley et al, 2001a), y adolescentes (Barkley et al, 2001b) con TDAH. Es posible que esta incapacidad influya en la dificultad para demorar las recompensas observadas en pacientes con TDAH. Hiperactividad El incremento en la actividad motora es una característica fundamental del TDAH. Diferentes estudios que registran los niveles de actividad reportan que los niños con TDAH recorren áreas 4 veces mas grandes que niños sin TDAH (Teicher et al, 1996). La mayor actividad en niños con TDAH se da incluso durante el sueño (Porrino et al, 1983). Los niños con TDAH hablan más a otros niños, los molestan, y hacen más ruidos que niños sin TDAH. Impulsividad La impulsividad es el conjunto de síntomas que recientemente ha sido propuesto como el más importante en TDAH (Johansen et al, 2002; Johansen y Sagvolden, 2004). En términos generales, puede ser definida como actuar sin reflexionar sobre las consecuencias, y sin planeación. Se suele dividir a la impulsividad en impulsividad motora (que es difícil de distinguir de la hiperactividad), e impulsividad cognitiva, que implica que los pensamientos cambian constantemente, resultando en olvidos, uso ineficiente del tiempo, problemas para organizar la propia conducta, y problemas para generar y ajustarse a planes. En cuanto a la etiología del trastorno, actualmente existe acuerdo en que la carga genética es un factor importante en la expresión de TDAH, ya que diversos estudios han encontrado que el estimado de heredabilidad es por lo menos .7 (para una revisión, ver Tannock, 1998) Otros factores que contribuyen a la existencia del TDAH es la adversidad psicosocial y ambiental (Rutter et al, 1975; Sprich-Buckminster et al, 1993). El estrés marital, la disfunción familiar, la clase social baja, por un lado, y la exposición a sustancias tóxicas, y complicaciones en el embarazo y en el parto, por el otro, son factores de riesgo para el desarrollo de TDAH. A pesar de que no existe un perfil patofisiológico claro de TDAH, los datos existentes implican una disfunción en las vías fronto-subcorticales que controlan la atención y la conducta motora. La efectividad de estimulantes como el metilfenidato en el tratamiento del trastorno, estudios de imagenología cerebral en humanos y estudios neurobiológicos en modelos animales sugieren que una alteración en los sistemas catecolaminérgicos, en especial dopaminérgicos, consituye un factor muy relevante en el desarrollo del TDAH (para una revisión, ver Faraone y Biederman, 1998). En un intento de unir diversas teorías sobre TDAH, Barkley (1997, 1999) propone que la inhibición de respuestas es el problema más importante en este trastorno. La inhibición de respuestas de acuerdo a este autor tiene tres vertientes. A) la capacidad de retardar la respuesta que obtiene un reforzador inmediato o lo ha obtenido en el pasado B) la capacidad de interrumpir respuestas con base en retroalimentación ambiental acerca de la inefectividad de éstas, y C) la capacidad de inhibir respuestas a fuentes de interferencia mientras se está involucrado en tareas dirigidas a metas. Existe considerable evidencia obtenida por grupos de investigación diferentes (para una revisión, ver Barkley, 1997, 1999) que estos tres tipos de inhibición de respuestas están dañados en personas con TDAH, por lo que la capacidad de inhibición de respuestas ha sido considerada como un endofenotipo (característica cuantificable y heredable que indica la propensión de un individuo a desarrollar cierta enfermedad (Almasy y Blangero, 2001)) del TDAH (Castellanos y Tannock, 2002). Johansen y Sagvolden (2004), por otro lado, proponen que los problemas en la inhibición de respuestas pueden ser explicados a su vez por un déficit en los mecanismos de reforzamiento y extinción derivados de los bajos niveles dopaminérgicos observados en las personas que sufren TDAH. En particular sugiere que un gradiente de demora más corto puede explicar los tres conjuntos de síntomas prevalecientes en el TDAH, el déficit de atención, la impulsividad y la hiperactividad. Castellanos y Tannock (2002) destacan la necesidad de encontrar los endofenotipos asociados a TDAH, y sugieren que la inhibición de respuestas puede ser uno de ellos. El gradiente de demora al reforzador, y el procesamiento de información temporal son considerados por estos autores como otros dos potenciales endofenotipos capaces de explicar la hiperactividad motora, la impulsividad cognitiva, el déficit de estimación temporal, y la variabilidad en tiempos de reacción observados en pruebas de inhibición motora. De esta manera, encontramos que dos líneas de investigación diferentes plantean la estrecha relación existente entre el gradiente de demora, la estimación temporal y los diversos síntomas del TDAH, por lo que parece importante conocer de manera mas precisa el impacto de estos procesos en el TDAH. D. MODELOS ANIMALES DE TDAH. La investigación realizada con personas que sufren TDAH, como toda investigación cuasiexperimental, tiene la desventaja de que no permite aislar el impacto de algunas variables, pues la presencia del trastorno normalmente no es la única diferencia con las personas que son usadas como controles. En todas las áreas de la ciencia se intenta encontrar o construir modelos que puedan ser usados para simplificar un fenómeno y facilitar su comprensión. La investigación clínica se beneficia del uso de modelos animales ya que tienen las ventajas de que el investigador trabaja con un sistema más simple, los datos son más fáciles de interpretar que el caso clínico en toda su expresión, los grupos son genéticamente más homogéneos, y es posible realizar una mayor cantidad de intervenciones que en los seres humanos. Además de estas ventajas, los modelos animales evitan los complejos efectos de la comorbilidad, la previa exposición a fármacos, las interacciones familiares y otros factores sociales implicados en los trastornos psiquiátricos. En general, un modelo animal debe parecerse al desorden clínico en sintomatología, respuestas al tratamiento, patofisiología, e idealmente, etiología. Aunque no se tienen criterios establecidos para evaluar la validez de un modelo, ha sido sugerido (Wilner, 1984) que los modelos mas adecuados deben a) imitar, aunque de una forma más simple los déficits conductuales del caso clínico (validez aparente), b) ser consistente con aspectos teóricos del trastorno como la patofisiología y los tratamientos (validez de constructo) y c) ser capaces de predecir aspectos conductuales, genéticos y neurobiológicos desconocidos hasta el momento en el caso clínico (validez predictiva). Como posibles modelos animales del TDAH se han propuesto ratones transgénicos carentes de receptor a la dopamina, ratas sometidas a hipoxia neonatal, ratas con desarrollo alterado del cerebelo, animales expuestos a tóxicos ambientales, ratas macho hiposexuales y ratas espontáneamente hipertensas, entre otros (para una revisión, ver Davids et al, 2003). Las ratas espontáneamente hipertensas (REH) son a la fecha el modelo animal de TDAH más empleado y aceptado. Esta cepa se originó de ratas Wistar-Kyoto (RWK) seleccionadas artificialmente por hipertensión. De manera no esperada, la selección por hipertensión trajo consigo una actividad motora exagerada, además de diversas características conductuales y neurobiológicas similares al TDAH. La validez aparente del modelo ha sido demostrada en diferentes experimentos. Johansen et al (1998), por ejemplo, han investigado los síntomas del TDAH tanto en niños con este trastorno como en REH mediante un procedimiento en el que un programa Intervalo fijo y uno de extinción alternaban cada dos minutos teniendo diferentes estímulos discriminativos asociados (programa múltiple IF/Ext). El intervalo fijo evalúa la reactividad a reforzadores, la actividad y la impulsividad motora, mientras que el componente de extinción evalúa la sensibilidad al cambio de estímulos y la atención sostenida. Al inicio del procedimiento, ni los niños con TDAH, ni las REH difirieron de sus grupos de comparación en el número de respuestas durante el componente extinción, sin embargo, conforme el entrenamiento fue continuado, el número de respuestas durante la extinción aumentó respecto al grupo control. Estos hechos demuestran una normal sensibilidad al cambio de estímulos, pero déficit en la atención sostenida. De igual manera, tanto los niños con TDAH, como las REH muestran un gradual aumento de actividad conforme avanza el programa (cada vez mayor número de respuestas durante el IF), e impulsividad motora (mayor proporción de tiempos entre respuestas cortos durante el IF). Las REH también muestran impulsividad cognitiva: En una tarea que requiere cierto número de respuestas antes de presionar otra palanca para obtener el reforzador, tuvieron mayor dificultad que sus controles en presionar 6 veces antes de cambiar a la otra palanca (Evenden y Meyerson, 1999). La hiperactividad también ha sido demostrada con otros procedimientos: Cuando REH fueron reforzadas por permanecer inmóviles en un área específica de la caja durante un corto tiempo, se comportaron tan bien como los sujetos control; sin embargo, cuando se requirieron 8-10 segundos de inmovilidad, las REH fueron incapaces de obtener reforzadores (Wultz y Sagvolden, 1992), conducta parecida a los movimientos agitados de los niños con TDAH. Las REH son también mas sensibles a reforzamiento inmediato, y menos sensibles al reforzamiento demorado (Sagvolden et al, 1993), hecho análogo a la preferencia de niños con TDAH por reforzadores pequeños inmediatos sobre grandes demorados (Sonuga-Barke et al, 1992). Uno de los hechos en que existe consenso es la estrecha relación existente entre el TDAH y la alteración del sistema dopaminérgico, por lo que es interesante encontrar que en REH también se ha mostrado un funcionamiento del sistema dopaminérgico por debajo de lo normal (Sadile, 2000), lo cual contribuye a la validez de constructo del modelo REH. Elementos adicionales de la validez de constructo, los tenemos en el hecho de que las anormalidades cognitivas y funcionales de REH son atenuadas mediante tratamiento con fármacos estimulantes de amplio uso en el tratamiento de TDAH como el metilfenidato y danfetaminas (Myers et al, 1982). Aunque siempre se ha supuesto que existen alteraciones en el mecanismo del reforzamiento en niños con TDAH, los detalles de estos procesos y sus consecuencias no se conocieron hasta el desarrollo de modelos animales. De particular interés es la posibilidad de conocer el curso del desarrollo de la hiperactividad y la impulsividad (ausente en situaciones novedosas, pero rápidamente desarrollado). Por otro lado, los métodos disponibles en laboratorios de neurociencias pueden encontrar con gran precisión las estructuras cerebrales que están alteradas y proveer datos anatómicos y bioquímicos para investigar el TDAH en niños. Estos hechos sugieren que el modelo REH también tiene validez predictiva potencial. De especial interés para el presente proyecto es la posibilidad de que el conocimiento derivado de la evaluación del gradiente de demora y de los procesos de estimación temporal en REH puedan dar algunas claves acerca de tratamientos potenciales de problemas de autocontrol y de impulsividad motora en niños con TDAH. PLANTEAMIENTO DEL PROBLEMA Y OBJETIVOS La breve revisión presentada en los párrafos anteriores nos permite llegar a las siguientes conclusiones: a) la impulsividad es actualmente considerada como la base de diferentes conductas no adaptativas humanas; b) dicha impulsividad es uno de los resultados de la función hiperbólica que relaciona el valor de los reforzadores con la demora con la que son obtenidos; c) los procesos de estimación temporal están estrechamente relacionados con la conducta de elección en general, y con la impulsividad en particular; d) entre los trastornos psiquiátricos afectados por la impulsividad tenemos el TDAH, en cuya comprensión cada vez adquiere mayor relevancia el papel de la impulsividad; e) Las REH han sido considerado el modelo animal más válido del TDAH, pues aspectos conductuales, neurobiológicos, y de reacción al tratamiento en dichas ratas son similares a los que se observan en humanos con este trastorno f) el gradiente de demora y el procesamiento temporal han sido propuestos por diferentes líneas de investigación como variables importantes en el desarrollo de los síntomas del TDAH. A pesar de la estrecha relación existente entre estos diversos temas, no se ha realizado investigación sistemática acerca del impacto del gradiente de demora y la estimación temporal en los síntomas característicos del TDAH. Debido a este vacío en la literatura, el presente proyecto tiene como objetivos la evaluación en REH de: 1) el gradiente de demora, 2) los diferentes tipos de estimación temporal, y 3) el efecto de la administración aguda de metilfenidato en todas estas conductas. Es importante enfatizar que la intención principal de la administración del fármaco es la validación del modelo que resultaría en el caso de que los déficit conductuales disminuyan con su uso, más que el discernimiento de los mecanismos farmacológicos de acción de dicha sustancia. METODOLOGÍA GENERAL Sujetos Cada uno de los experimentos se llevará a cabo con 8 REH, y 8 RWK, Los animales serán obtenidos del proveedor Harlan. Serán colocados en compartimientos individuales, en una habitación con temperatura controlada (21° C. ±1° C. ) y un ciclo luz-oscuridad de 12:12 horas. El peso de los animales al inicio del experimento será entre 190-250 gr. Una vez habituados a las condiciones del bioterio, se les restringirá el alimento, otorgándoles aproximadamente 15 gr. de comida por día, durante la duración del experimento. Tendrán acceso a agua sin restricciones mientras estén en su caja habitación. Preentrenamiento. Sesiones 1-2 Las ratas serán habituadas a las cajas operantes durante 30 minutos en las que habrá pellets disponibles en el comedero. Sesiones 3-4 Cada 30 segundos se encenderá la luz del comedero, y se entregará un pellet, para permitir la asociación entre el comedero y el reforzamiento. Sesiones 4-n Las presión de palanca será reforzada de acuerdo a un programa razón fija 1. Se encenderá la luz encima de cada una de las palancas, y cada presión de palanca será reforzada. Este entrenamiento durará hasta que se obtengan 80 reforzadores dos días seguidos, lo cual ocurre normalmente después de dos o tres sesiones. Después de este entrenamiento, el procedimiento diferirá de acuerdo a los experimentos que se describen más adelante. Aparatos. Se emplearán 6 cámaras de condicionamiento operante (Med-008-B1), que estarán contenidas en cajas sonoamortiguadoras. Cada rata será evaluada en la misma caja para aumentar la consistencia de los datos. Las cajas operantes miden 21.5 * 24.5 * 24.5 y tienen una palanca de respuesta (4cm. * 1.5 cm.) en la pared frontal, a cada lado del receptor de pellets. Una luz se encuentra en la parte trasera de la caja para proveer iluminación general, y un foco arriba de cada palanca es encendido siempre que la respuesta en esa palanca es potencialmente reforzable. Cada caja cuenta con un extractor de aire que a la vez funciona como ruido blanco, para enmascarar aun más los sonidos provenientes del exterior. La presentación de estímulos y la recolección de datos se realizan mediante una interfase (Med-Syst.-8) conectada a una computadora Pentium III. Administración de fármaco. El metilfenidato (Sigma Aldrich, St. Louis, MO, USA) será disuelto en agua salina al 0.9%, y cada inyección contendrá .8 ml. Las inyecciones serán aplicadas 10 minutos antes de la sesión experimental. En el Experimento 4 se realizará una curva dosis-respuesta empleando 3 dosis de metilfenidato (1.25, 5, y 10 mg/kg). Se realizarán cinco inyecciones intraperitoneales de cada dosis y 5 inyecciones del vehículo. La dosis que provoque el mayor efecto será empleada en los otros 3 experimentos. Experimento 1. Evaluación del gradiente de demora en REH y RWK Como fue indicado en la introducción, la evaluación del gradiente de demora ha sido uno de los principales impulsores del avance de la comprensión de la elección; sin embargo, se desconoce el impacto que esta variable tiene en el TDAH, pues aunque los resultados de diferentes experimentos son consistentes con un gradiente de demora más corto, no existe evidencia directa acerca del valor del parámetro de la sensibilidad a la demora. El presente experimento pretende evaluar el gradiente de demora en el modelo animal de TDAH más empleado y en sus sujetos control en condiciones libres de fármaco. Procedimiento. Se empleará el procedimiento de “ajuste de demora” (Mazur, 1987), que aunque fue reportado originalmente con palomas, ha sido replicado con ratas (Richards et al, 1997). El procedimiento básicamente consiste en presentarle a los sujetos después de 60 segundos de intervalo entre ensayos (IEE), dos oportunidades de elección entre dos opciones: A) dos pellets después de una demora fija, o B) seis pellets después de una demora ajustable (empezando por ejemplo en 6 segundos). Si el sujeto selecciona en ambas oportunidades la opción B, la demora ajustable será aumentada 1 segundo para los siguientes 4 ensayos, dos de ellos forzados. Si el sujeto selecciona en ambos ensayos la opción A, la demora ajustable será disminuida 1 segundo para los siguientes 4 ensayos. Si el sujeto selecciona la mitad de las veces cada alternativo, la demora ajustable no es modificada. Durante el periodo de demora estará encendido un estímulo discriminativo diferente para cada opción. Las sesiones durarán 64 ensayos, y la condición será terminada cuando los siguientes criterios de estabilidad sean satisfechos: a) en las seis últimas sesiones, no debe ocurrir la media de la demora ajustable mas baja o más alta de la condición; b) la media de las últimas seis sesiones no podrá ser la mas baja ni la más alta de cualquier conjunto de seis sesiones de la condición; y c) la media de la demora ajustable de las últimas seis sesiones no podrá diferir de la media de las anteriores seis sesiones por más del 10% o 1 segundo. El experimento contará con 6 diferentes condiciones que diferirán en el valor de la demora fija, el cual será 0.5,1,2,4,8,12 segundos. Estas condiciones serán presentadas en diferente orden para cada sujeto. El número medio de sesiones que se ha reportado para cumplir con los criterios de estabilidad es de 17 (Mazur, 1987), por lo que se espera que el experimento sea terminado en 102 sesiones aproximadamente. Análisis de datos. El valor de la demora ajustable al final de cada una de las condiciones permite la generación de funciones de indiferencia que de acuerdo a Kheramin et al (2002,2003) permite detectar el efecto tanto de la sensibilidad a la demora, como de la sensibilidad a la cantidad. La pendiente y el intercepto de estas funciones de indiferencia serán comparados para los dos grupos empleando una prueba t. El análisis descrito por Kheramin et al (2002) es interesante debido a que las manipulaciones quirúrgicas y farmacológicas que han aumentado la preferencia por demoras pequeñas inmediatas sobre grandes demoradas no necesariamente han afectado la sensibilidad a la demora, como generalmente se supone, sino que probablemente han afectado la sensibilidad a la cantidad. Una vez encontrada la función de indiferencia para cada grupo, será calculado el valor de k mediante la siguiente fórmula: k= (pendiente-1)/intercepto (Ho et al, 1997). Experimento 2 Evaluación de la propensión al riesgo y su relación con tratamiento agudo con metilfenidato. El diseño del experimento 1 no permite la evaluación del efecto de tratamiento agudo con metilfenidato, pues el efecto la administración de este fármaco sería confundido con una inestabilidad en el valor de la demora ajustable. Con la intención de evaluar el efecto del fármaco en el gradiente de demora, se evaluará la conducta de las ratas en un procedimiento de elección sensible al gradiente de demora, que además nos brindará información acerca de diferencias en la propensión al riesgo en las dos cepas de ratas analizadas. Procedimiento. Se empleará el procedimiento de encuentros sucesivos (Lea, 1979), descrito a continuación. La sesión comienza cuando la luz general y el foco sobre la palanca derecha se encienden. Esto da inicio al periodo de búsqueda, en el cual está en operación un programa intervalo fijo 10 segundos. Una vez que el requerimiento de respuesta es satisfecho, inicia el periodo de elección, en el cual están activas dos palancas, la derecha señalada por una luz blanca, y la izquierda con uno o dos focos encendidos (Seleccionado cuasi aleatoriamente con reemplazo con probabilidad .5); un foco encendido está asociado a un programa de reforzamiento fijo, mientras que dos focos encendidos señalan un programa de reforzamiento variable. Durante este periodo de elección, si la rata completa un programa Razón Fija 3 en la palanca derecha (búsqueda) o si no presenta ninguna respuesta durante 120 segundos el periodo de búsqueda es reiniciado y la palanca izquierda es apagada (esto se considera un rechazo de la opción presentada); si el programa Razón Fija 3 es completado en la palanca izquierda, se inicia el periodo de manejo asociado con el estímulo presente y la palanca derecha es apagada (esto se considera una aceptación de la opción presentada). Después del reforzador el ciclo se repite hasta que se cumple una duración de 1 hora. La preferencia en este procedimiento es indicada por la probabilidad de aceptación de cada uno de los resultados presentados, siendo el resultado común una preferencia por la opción riesgosa, que se manifiesta en que esta opción es aceptada siempre que es encontrada, mientras que la opción segura es rechazada en algunas ocasiones. De acuerdo a la ecuación 1, incrementos en el valor de k nos llevarían a una mayor preferencia por la opción variable, que se manifestaría en un mayor rechazo de la opción fija. Los valores empleados en este experimento serán los siguientes: Búsqueda IF 10 segundos; Opción fija Intervalo fijo 20 segundos, Opción variable Intervalo variable 20 segundos. Con estos valores, se ha encontrado que la probabilidad de aceptación del IF es aproximadamente .7 en pichones (Orduña y Bouzas, 2004). Una vez que haya estabilidad, a lo largo de 20 sesiones se correrán cinco sesiones de prueba con metilfenidato, y cinco sesiones de prueba con vehículo, con la idea de conocer el efecto de este fármaco en la propensión al riesgo. La duración estimada de este experimento es de 40 días. Análisis de datos. La variable dependiente en este procedimiento es la probabilidad de aceptación de la opción fija. El valor de esta variable será calculado durante las últimas 5 sesiones para cada uno de los grupos. Los datos de las sesiones de prueba con metilfenidato serán contrastados con las sesiones en las que solamente se inyectó el vehículo mediante un análisis de varianza de medidas repetidas. Experimento 3.-Ejecución en programas de reforzamiento TER>60 y su relación con tratamiento agudo con metilfenidato. En los programas de reforzamiento TER>t, una respuesta operante es reforzada solamente cuando ha pasado cierto tiempo desde la última respuesta. Las respuestas que se emiten antes de que transcurra dicho tiempo no son reforzadas y además reinician el periodo de espera. La impulsividad es definida como el grado en que el organismo emite respuestas prematuras. Procedimiento. La respuesta de apretar una palanca será reforzada bajo un programa de reforzamiento RF1. Una vez que los sujetos obtengan 50 reforzadores en una sesión, se introducirá un programa TER>2 segundos hasta que los sujetos obtengan 50 reforzadores, el TER mínimo reforzado será incrementado gradualmente (5, 10, 20, 30, 60) y se pasará al siguiente cuando durante dos sesiones seguidas se obtengan un número mínimo de reforzadores (50, 40, 40, 30, 20, respectivamente, de acuerdo al TER que define la condición). El número de sesiones requerido para llegar a TER>60 varía según la cepa de ratas entre 20 y 45 (Bull et al, 2000). Una vez que la respuesta se ha estabilizado, se evaluará el impacto de la administración aguda de metilfenidato mediante 5 inyecciones aplicadas durante el transcurso de tres semanas en días seleccionados aleatoriamente con la limitación de que no ocurran dos aplicaciones de fármaco en días seguidos. Se aplicarán también 5 inyecciones del vehículo. Análisis de datos. Durante cada una de las sesiones se registrará el número de reforzadores obtenidos y el número de respuestas, los cuales permitirán el cálculo de la eficiencia (reforzadores/respuestas*100). Se realizará un análisis estadístico a tres diferentes medidas de la ejecución de los sujetos: a) El valor de eficiencia durante los primeros 5 días de cada condición, b)El valor de eficiencia durante los últimos 5 días de cada condición, y c) El número total de sesiones requerido para completar el entrenamiento en TER<60. Además, para cada grupo se comparará el nivel de eficiencia los días en que se aplique metilfenidato, contra los días en que solamente se inyecte el vehículo. Se espera que este experimento esté terminado después de 60 sesiones. La ejecución de los sujetos en los programas TER>t puede reflejar fallas en el proceso de estimación temporal, pero es posible que refleje la fuerza de los procesos de inhibición de respuestas. Debido a ello, se proponen dos experimentos adicionales que permitirán conocer con mayor precisión la diferencia en el proceso de estimación temporal en REH y en Wistar-Kyoto, además del impacto del tratamiento agudo con metilfenidato. Como fue revisado en la introducción la teoría de expectancia escalar es la dominante en el área de estimación temporal. Se ha demostrado que uno de los componentes principales de dicha teoría, la velocidad del generador de pulsos, es afectada por la administración de agonistas dopaminérgicos. Siendo las disfunciones del sistema dopaminérgico una de las principales características del TDAH, es razonable suponer que existirá déficit en la estimación temporal, lo cual ha sido comprobado en humanos (Barkley et al, 1997). Sin embargo, no existen investigaciones de los procesos de estimación temporal en REH, que pueden brindar importante información acerca de la validez del modelo. Los experimentos 4 y 5 tienen el objetivo de llenar este vacío en la literatura. Experimento 4.-Ejecución en programa de Pico con tratamiento agudo con metilfenidato Procedimiento. Sesiones 1-2 Durante las primeras 2 sesiones se empleará un programa de reforzamiento Intervalo Fijo (IF) 10 segundos, señalado por una luz encendida sobre la palanca de respuesta. Después de obtenido el reforzador, habrá un IEE de duración variable (media 15 segundos). Sesiones 1-4 El entrenamiento será idéntico a las sesiones anteriores, con excepción que se empleará un IF 20 segundos Sesiones 5-15 El entrenamiento será idéntico a las sesiones anteriores, con excepción que se empleará un IF 40 segundos Sesiones 16-50 En el 50 % de los ensayos, no operará el programa de reforzamiento IF, y además el estímulo discriminativo asociado con él permanecerá encendido durante 150 segundos. Sesiones 51-80. Durante estas sesiones, en días seleccionados aleatoriamente se realizarán cinco inyecciones de metilfenidato de cada una de tres diferentes dosis (1.25, 5 y 10 mg/kg), y cinco inyecciones de vehículo para cada uno de los sujetos con la limitación de que no ocurran dos inyecciones de fármaco seguidas. El estimado de duración del presente experimento es de 80 días. Análisis de datos El periodo de respuesta, tanto en ensayos reforzados, como en no reforzados, será dividido en periodos de 2 segundos, y se registrará en que periodo ocurre cada una de las respuestas para conocer la frecuencia de respuestas por periodo. El periodo en el que ocurre el mayor número de respuestas es conocido como el tiempo pico. Los periodos en donde ocurren por lo menos el 70% del nivel máximo de respuestas nos permiten conocer el tiempo de propagación (spread time), el cual, dividido entre el tiempo pico nos permite calcular la fracción de Weber, que nos indica la discriminabilidad. Todos estos valores serán calculados para cada uno de los grupos y se compararán mediante una prueba t. Por último también será evaluada estadísticamente una posible diferencia en el tiempo pico, y en la fracción de Weber en las sesiones con inyección de metilfenidato en sus cuatro niveles, para lo cual se empleará un análisis de varianza de medidas repetidas. Experimento 5.- Ejecución de REH y Wistar-Kyoto en programa de Bisección temporal y su relación con tratamiento agudo con metilfenidato. Procedimiento Se les presentará a las ratas un sonido con una de dos posibles duraciones (2 u 8 segundos), después de este estímulo muestra se encenderán las luces sobre las palancas izquierda y derecha. En caso de que la duración del sonido haya sido 2 segundos, responder a la palanca derecha será reforzado, mientras que responder a la palanca izquierda llevará al IEE (30 segundos durante los cuales todos los estímulos de la caja, a excepción del ventilador, están apagados). En caso de que la duración del sonido haya sido de 8 segundos, responder a la palanca izquierda será reforzado y responder a la palanca derecha llevará al IEE. Habrá 60 ensayos en cada sesión. Una vez que los sujetos respondan correctamente el 80% de los ensayos, lo cual ocurre aproximadamente a los 30 días, se reducirá la probabilidad de reforzamiento de 1.0 a .5. Esta fase se mantendrá durante 10 días. A partir de entonces iniciará la fase de prueba (20 días), en la que en el 50% de los ensayos se le presentará a los sujetos duraciones de estímulo muestra intermedias entre las dos entrenadas (3,4,5,6,7), y se registrará el porcentaje de veces que el sujeto responde a la palanca asociada al estímulo “largo” (%L). Con estos datos se construirán las curvas psicofísicas que describen %L como una función de la duración del estímulo de prueba. Se emplearán 20 sesiones de prueba adicionales para evaluar el impacto de cinco inyecciones de metilfenidato y cinco inyecciones de vehículo, las cuales serán administradas en días seleccionados aleatoriamente, con la limitación de que no ocurran dos inyecciones de fármaco seguidas. La duración estimada del presente experimento es de 80 sesiones. Análisis de datos Las funciones psicofísicas permiten la obtención del punto de bisección (la duración del estímulo prueba ante el que %L es 50%), y el límen diferencial (la mitad de la diferencia entre la duración del estímulo prueba que provoca %L = 25% y la que provoca que %L sea 75%). La razón entre el límen diferencial y el punto de bisección permite el cálculo de la fracción de Weber (Church y Deluty, 1977). Otro dato derivado de este procedimiento importante de analizar es el posible desplazamiento de la curva sigmoidal hacia la derecha o hacia la izquierda, que nos indica, de acuerdo a la teoría de expectancia escalar (Gibbon, 1977) la velocidad del generador de pulsos. Cada uno de estos datos será comparado entre grupos (REH vs. Wistar-Kyoto) e intragrupos (metilfenidato vs. vehículo). También se comparará el número de sesiones requerido para llegar al criterio que permite la introducción de estímulos de prueba. Metas científicas El grupo de experimentos propuestos nos permitirá tener un panorama bastante completo de los procesos de estimación temporal en REH, ya que emplearemos procedimientos de estimación inmediata (exp 3 y 4), de estimación retrospectiva (exp 5) y de estimación prospectiva (exp 1 y 2). De especial importancia es el experimento 1, pues es la liga entre la estimación temporal que presumiblemente está alterada en pacientes con TDAH y el descuento temporal que ha demostrado ser uno de los factores mas importantes en la elección tanto animal como humana. Si, como Castellanos y Tannock (2000) sugieren, el procesamiento temporal y el gradiente de demora efectivamente son dos factores que provocan un alto porcentaje de los síntomas del TDAH, los resultados del presente proyecto aportarán datos que podrán ser empleados de manera inmediata en la validación del modelo animal de TDAH más aceptado, y después de una replicación en seres humanos posiblemente puedan ser empleados como herramienta diagnóstica del TDAH. Metas de formación de recursos Durante el desarrollo del presente proyecto se espera que dos participantes se titulen de licenciados en psicología en la Facultad de Psicología de la UNAM, y además que dos participantes sean aceptados en el programa de doctorado de esa misma institución; el trabajo realizado como parte de este proyecto les permitirá realizar su examen de postulación. Debido a la duración propuesta del proyecto (2 años), no es posible que dichos estudiantes obtengan el grado de doctor, sin embargo, se esperaría un avance sustancial que les permita la obtención del grado poco tiempo después (entre uno y dos años). Grupo de trabajo e infraestructura disponible La infraestructura de nuestro laboratorio es la siguiente: Se cuenta con 4 espacios de Condicionamiento Operante. Este equipo está conectado y controlado por 1 computadora PC Pentium III. La presentación de estímulos y el registro de las ejecuciones se controlan por medio de una interfase MED-PC y el software de Med Associates Inc. También se cuenta con dos Computadoras Pentium III para el análisis de datos y elaboración de presentación de resultados. La mayoría del equipo descrito se encuentra conectado a Internet y a una red local del laboratorio con impresoras láser. Se cuenta también con un bioterio donde se mantienen las condiciones necesarias y suficientes para el cuidado e higiene de los sujetos experimentales. Recursos Académicos: En el Laboratorio hay 2 académicos de tiempo completo, 2 de asignatura y 7 estudiantes de Licenciatura. Resultados entregables Publicaciones. Se espera publicar por lo menos tres artículos de investigación en revistas internacionales con nivel de impacto entre .814 y 2.8, dos presentaciones en congresos internacionales y una en congreso nacional. Graduados. Esperamos que los resultados de este proyecto permitan el inicio de dos tesis de doctorado, y la culminación de dos tesis de licenciatura. Referencias Al Ruwaitea, A. S. A., Al-Zahrani, S. S. A., Ho, M. Y., Bradshaw, C. M., y Szabadi, E. (1997). 5Hydroxytryptamine and interval timing. C.M. Bradshaw, y E.Szabadi Time and Behaviour . The Netherlands: Elsevier. Alessi, S. M., y Petry, N. M. (2003). Pathological gambling severity is associated with impulsivity in a delay discounting procedure . Behavioural Processes, 64(3), 345-354. Almasy, L., y Blangero, J. (2001). Endophenotypes as quantitative risk factors for psychiatric disease: rationale and study design. American Journal of Medicine Genetics, 105, 42-44. Baker, F., Johnson, M. V., y Bickel, W. (2003). Delay discounting in current and never-before cigarrete smokers: similarities and differences across comodity, sign and magnitude. Journal of Abnormal Psychology, 112, 382-392. Barkley, R. A. (1997). Behavioral Inhibition, Sustained Attention, and Executive Functions: Constructing a Unifying Theory of ADHD. Psychological Bulletin, 121(1), 65-94. Barkley, R. A. (1999). Response inhibition in attention-deficit hyperactivity disorder. Mental Retardation and Developmental Disabilities Research Reviews, 5, 177-184. Barkley, R. A., Koplowitz, S., Anderson, T., y McMurray, M. B. (1997). Sense of time in children with ADHD: effects of duration, distraction, and stimulant medication. Journal of International Neuropsychology Society, 3, 359-369. Barkley, R. A., y Murphy, K. R. a. B. T. (2001a). Time Perception and Reproduction in Young Adults With Attention Deficit Hyperactivity Disorder . Neuropsychology, 15(3), 351-360. Barkley, R. A., Edwards, G., Laneri, M., Fletcher, K., y Metevia, L. (2001b). Executive functioning, temporal discounting, and sense of time in adolescents with attention deficit hyperactivity disorder (ADHD) and oppositional deviant disorder(ODD).. Journal of Abnormal Child Psychology, 29, 541-556. Bretteville-Jensen, A. L. (1999). Addiction and discounting . Journal of Health Economics, 18(4), 393-407. Bull, E., Reavill, Ch., Hagan, J. J., Overend, P., y Jones, D. N. C. (2000). Evaluation of the spontaneously hypertensive rat as a model of attention deficit hyperactivity disorder: acquisition and performance of the DRL-60s test . Ehavioural Brain Research, 109(1), 27-35. Castellanos, F. X., y Tannock, R. (2002). Neuroscience of attention-deficit hyperactivity disorder: The serach for endophenotipes. Nature Reviews Neuroscience, 3, 617-628. Catania, A. C. (1963). Concurrent performances: A baseline for the study of reinforcement magnitude. Journal of the Experimental Analysis of Behavior, 6, 299-300. Catania, A. C. (1970). Reinforcement schedules and psychophysical judgements: a study of some temporal properties of behavior. W.N. Schoenfeld The theory of reinforcement schedules . New-York: Appleton-Century-Crofts. Chung, S. H., y Herrnstein, R. J. (1967). Choice and delay of reinforcement. Journal of the Experimental Analysis of Behavior, 10, 67-74. Church, R. M., y Deluty, M. Z. (1977). Bisection of temporal intervals. Journal of Experimental Psychology (Animal Behavior Processes), 3, 216-228. Davids, E., Zhang, K., Tarazi, F. I., y Baldessarini, R. J. (2003). Animal models of attention-deficit hyperactivity disorder. Brain Research Reviews, 42(1), 1-21. Evenden, J., y Meyerson, B. (1999). The Behavior of Spontaneously Hypertensive and Wistar Kyoto Rats Under a Paced Fixed Consecutive Number Schedule of Reinforcement. Pharmacology Biochemistry and Behavior, 63(1), 71-82. Faraone, S. V., y Biederman, J. (1998). Neurobiology of attention-deficit hyperactivity disorder. Biological Psychiatry, 44(10), 951-958. Ferster, C. S., y Skinner, B. F. (1957). Schedules of Reinforcement. Nueva York: AppletonCentury_Crofts. Gallistel, C. R., y Gibbon, J. (2000). Time, Rate, and Conditioning. Psychological Review, 107(2), 289344. Gibbon, J. (1977). Scalar expectancy theory and Weber's law in animal timing. Psychological Review, 84, 278-325. Gibbon, J. (1991). Origins of scalar timing. Learning and Motivation, 22, 3-38. Goldschmidt, J. N., y Fantino, E. (2000). Differences, not ratios, control choice in an experimental analogue to foraging. Psychological Science, 11(3), 229-233. Herrnstein, R. J. (1961). Relative and absolute strength of response as a function of frequency of reinforcement. Journal of the Experimental Analysis of Behavior, 4, 267-272. Herrnstein, R. J. (1964). Secondary reinforcement and rate of primary reinforcement. Journal of the Experimental Analysis of Behavior, 7, 27-36. Ho, M. Y., Al-Zahrani, S. S. A., Velazquez-Martinez D.N., Lopez-Cabrera, M., Bradshaw, C. M., y Szabadi, E. (1995). The role of the ascending 5-hidroxytriptaminergic pathways in timing behaviour: further observations with the interval bisection task. Psychopharmacology, 120, 213-219. Ho, M.-Y., Bradshaw, C. M., y Szabadi, E. (1997). Choice between delayed reinforcers: interaction between delay and deprivation level. Quarterly Journal of Experimetnal Psychology, 50b, 193-202. Ho, M. Y., Al-Zahrani, S. S. A., Al-Rumaitea, A. S. A., Bradshaw, C. M., y Szabadi, E. (1998). 5Hidroxitriptamine and impulse control: prospects for a behavior analysis. Journal of Psychopharmacology, 12, 68-78. Johansen, E. B., Aase, H., Meyer, A., y Sagvolden, T. (2002). Attention-deficit/hyperactivity disorder (ADHD) behaviour explained by dysfunctioning reinforcement and extinction processes . Behavioural Brain Research, 130(1-2), 37-45. Johansen, E. B., y Sagvolden, T. (2004). Response disinhibition may be explained as an extinction deficit in an animal model of attention-deficit/hyperactivity disorder (ADHD). Behavioural Brain Research, 149(2), 183-196. Kheramin, S., Body, S., Mobini, S., Velázquez-Martinez, D. N., Bradshaw, C. M., Szabadi, E., Deakin, J. F. W., y Anderson, I. M. (2002). Effects of quinolinic acid-induced lesions of the orbital prefrontal cortex of intertemporal choice: a quantitative analysis. Psychopharmacology, 165, 9-17. Kheramin, S., Body, S., Ho, M.-Y., Velázquez-Martinez, D. N., Bradshaw, C. M., Szabadi, E., Deakin, J. F. W., y Anderson, I. M. (2003). Role of the orbital prefrontal cortex in choice between delayed and uncertain reinforcers: a quantitative analysis. Behavioural Processes, 64(3), 239-250. Killen, P., y Fetterman, J. G. (1988). A Behavioral Theory of Timing. Psychological Review, 95(2), 274-295. Kirby, K. N., Petry, N. M., y Bickel, W. K. (1999). Heroin Addicts Have Higher Discount Rates for Delayed Rewards Than Non-Drug-Using Controls. Journal of Experimental Psychology: General, 128(1), 78-87. Kollins, S. H. (2003). Delay discounting is associated with substance use in college students . Addictive Behaviors, 28(6), 1167-1173. Lea, S. E. G. (1979). Foraging and reinforcement schedules in the pigeon: Optimal and non-optimal aspects of choice. Animal Behaviour, 27, 875-886. Maricq, A. V., y Church, R. M. 1. (1983). The differential effects of haloperidol and metamphetamine on time estimation in the rat. Psychopharmacology, 79, 10-15. Mazur, J. E. (1984). Test of an equivalence rule for fixed and variable reinforcer delays. Journal of Experimental Psychology: Animal Behevior Processes, 10, 426-436. Mazur, J. E. (1987). An adjusting procedure for studyng delayed reinforcement. M.L. Commons, J.E.Mazur, J.A. Nevin, y H.Rachlin (Eds), Quantitative Analyses of Behavior: The effect of delay and of intervening events on reinforcement value (pp. 55-73). New Jersey: Erlbaum. Mazur, J. E. (2001). Hyperbolic value addition and general models of animal choice. Psychological Review, 108, 96-112. Meaux, J. B., y Chelonis, J. G. (2003). Time perception differences in children with and without ADHD . Journal of Pediatric Health Care, Volume 17, Issue 2, March-April 2003, Pages 64-71 , 17(2), 64-71. Meck, W. H., y Church, R. M. (1987). Cholinergic modulation of the content of temporal memory. Behavioral Neuroscience, 98, 3-22. Myers, M. M., y Richard E. Musty, R. E. H. E. H. (1982). Attenuation of hyperactivity in the spontaneously hypertensive rat by amphetamine . Behavioral and Neural Biology, 34(1), 42-54. Myerson, J., y Green, L. (1995). Discounting of delayed rewards: Models of individual choice. Journal of the Experimental Analysis of Behavior, 64, 263-276. Orduña, V., Bouzas, A. (2004). Energy budget versus temporal discounting as determinants of preference in risky choice. Behavioural Processes, 67(2), 147-156. Porrino, L.J., Rapoport. J.L.,Behar, D., Sceery, W., Ismond, D.R.,Bunney, W.A. (1983) A naturalisitic assessment of the motor activity of hyperactive boys. I. Comparison with normal controls. Archives of General Psychiatry, 40, 681-687 Penney, T. B., Holder, M. D., y Meck, W. H. (1996). Clonidine-induced antagonism of norepinephrine modulates tha attentional processes involved in peak-interval timing. Experimental and Clinical Psychopharmacology, 4, 82-92. Richards, J. B., Mitchell, S. H., de Wit, H., y Seiden, L. S. Determination of discount functions in rats with an adjusting-amount procedure. Journal of the Experimental Analysis of Behavior, 67, 353-366. Rutter, M., Cox, A., Tupling, C., Berger, M., y Yule, W. (1975). Attainment and adjustment in two geographical areas:Vol 1. The prevalence of psychiatric disorders. British Journal of Psychiatry, 126, 493-509. Sadile, A. G. (2000). Multiple evidence of a segmental defect in the anterior forebrain of an animal model of hyperactivity and attention deficit . Neuroscience & Biobehavioral Reviews, 24(1), 161-169. Sagvolden, T., Metzger, M. A., y Sagvolden, G. (1993). Frequent reward eliminates differences in activity between hyperkinetic rats and controls. Behavioral and Neural Biology, 59, 225-229. Sagvolden T., Aase, H., Zeiner, P., y Berger, D. (1998). Altered reinforcement mechanisms in attention-deficit/hyperactivity disorder . Behavioural Brain Research, 94(1), 61-71. Sonuga-Barke, E. J., Taylor, E., Sembi, S., y Smith, J. (1992). Hyperactivity and delay aversion: I. The effect of delay on choice. Journal Child Psychology and Psychiatry, 33(387-398). Sprich-Buckminster, S., Biederman, J., Milberger, S., Faraone, S., y Krifcher, L. (1993). Are perinatal complications relevant to the manifestation of ADD? Issues of comorbidity and familiality. Journal of American Academic Child and Adolescence Psychiatry, 32, 10321037. Tannock, R. (1998). Attention deficit hyperactivity disorderadvances in cognitive, neurobiological and genetic research. Journal of Child Psychology and Psychiatry, 39, 65-99. Taylor, E.(1998).Clinical foundations of hyperactivity research. Behavioral Brain Research,94,11-24. Teicher, M. H., Ito, Y., Glod, C. A., y Barber, N. I. (1996). Objective measurement of hyperactivity and attentional problems in ADHD. Journal of American Academic Child and Adolescence Psychiatry, 35, 334-342. van den Broek, M. D., Bradshaw, C. M., y Szabadi, E. (1987). Behaviour of ‘impulsive’ and ‘nonimpulsive’ humans in a temporal differentiation schedule of reinforcement. Personality and Individual Differences, 8(2), 233-239. van den Broek, M. D., Bradshaw, C. M., y Szabadi, E. (1992). Performance of impulsive and nonimpulsive subjects on two temporal differentiation tasks. Personality and Individual Differences, 13(2), 169-174. Voeller, K.K.S. (2001) Attention-Deficit/Hyperactivity Disorder as a frontal subcortical disorder. En: David G. Lichter y Jeffrey L.Cummings (Eds). Frontal-Subcortical Circuits in Psychiatric and Neurological Disorders. The Guilford Press: New York Vuchinich, R. E., y Simpson, C. A. (1998). Hyperbolic Temporal Discounting in Social Drinkers and Problem Drinkers. Experimental and Clinical Psychopharmacology, 6(3), 292-305. Wilner, P. (1984). Validation criteria for animal models of human mental disorders: Learned helplessness as a paradigm case. Progress in Neuro-Psychopharmacology and Biological Psychiatry, 10(6), 677-690. Wultz, B., y Sagvolden, T. (1992). The hiperactive spontaneously hypertensive rat learns to sit still, but not to stop bursts of responses with short interresponse times. Behavioral Genetics, 22, 415433.