Utilidades SF-6D para España. Guía de uso Utilidades SF-6D para España. Guía de uso José María Abellán Perpiñán Cátedra de Economía de la Salud 2012/ 8 | 1 2012/8 Utilidades SF-6D para España. Guía de uso Las opiniones y juicios expresados en este documento son responsabilidad exclusiva de los autores del mismo y no representan necesariamente el ideario de la Universidad Pablo de Olavide ni la política de la Consejería de Salud de la Junta de Andalucía. Este documento puede ser reproducido parcial o totalmente para uso no comercial, siempre que se cite explícitamente su precedencia. Para citar este informe: Abellán Perpiñán J.M. (2012). Utilidades SF-6D para España. Guía de uso 2012/8. Sevilla: Cátedra de Economía de la Salud. Universidad Pablo de Olavide. Consejería de Salud de la Junta de Andalucía. Recuperado de www.upo.es/cades. Correspondencia a los autores: dionisos@um.es CÁTEDRA DE ECONOMÍA DE LA SALUD DIRECTOR: Dr. D. José Luis Pinto Prades Departamento de Economía, Métodos Cuantitativos e Historia Económica Universidad Pablo de Olavide, Ctra. Sevilla-Utrera, Km. 1. 41013 Sevilla Web: www.upo.es/cades Email: admon.cades@gmail.com Cátedra de Economía de la Salud 2012/ 8 | 2 Utilidades SF-6D para España. Guía de uso LA CÁTEDRA DE ECONOMÍA DE LA SALUD La Cátedra de Economía de la Salud, creada por la Universidad Pablo de Olavide y la Agencia de Evaluación de Tecnologías Sanitarias de la Consejería de Salud de la Junta de Andalucía, es un proyecto innovador que persigue generar conocimiento compartido y promover la realización y fomento de actividades de investigación, docencia y difusión del conocimiento en el área de la economía de la salud aplicada a la evaluación de tecnologías sanitarias. Las publicaciones realizadas en el marco de la Cátedra se dividen en Documentos de Trabajo y Notas Técnicas, siendo los primeros estudios en profundidad sobre un área determinada y, las segundas, aproximaciones iniciales a temas concretos de interés en el campo de la economía de la salud. EL AUTOR José María Abellán Perpiñán Es Doctor en Ciencias Económicas y Empresariales por la Universidad de Murcia. Actualmente es Profesor Titular de Universidad en el Departamento de Economía Aplicada de la Universidad de Murcia, Campus de Excelencia Internacional Regional “Campus Mare Nostrum”, miembro del Grupo de Trabajo en Economía de la Salud (GTES) e investigador principal del Grupo de Investigación en Economía de la Salud y Evaluación Económica de la misma universidad. Sus líneas de investigación fundamentales giran en torno a la evaluación económica y la economía del comportamiento. Posee publicaciones en importantes revistas internacionales como Journal of Health Economics, Management Science o Social Choice and Welfare. Forma parte de la Junta Directiva de la Asociación Española de Economía de la Salud (AES) y del comité de trabajo del grupo de interés en Evaluación Económica de AES. Es experto asesor del Comité Regional de Evaluación de Tecnologías Sanitarias de la Región de Murcia. Cátedra de Economía de la Salud 2012/ 8 | 3 Utilidades SF-6D para España. Guía de uso | Índice INTRODUCCIÓN 5 CAPÍTULO I: Del SF-36 al SF-6D 7 1.1 Medidas de CVRS y evaluación económica 8 1.2 El SF-36 10 1.3 El SF-6D y su conexión con el SF-36 13 CAPÍTULO II: La tarifa española del SF-6D 20 2.1 El estudio de campo 21 2.2 El algoritmo y su aplicación 22 DISCUSIÓN Y CONCLUSIONES 25 REFERENCIAS 28 Cátedra de Economía de la Salud 2012/ 8 | 4 Utilidades SF-6D para España. Guía de uso | Introducción El objetivo principal de la asistencia sanitaria es mejorar la salud de la población. Para valorar en qué medida se alcanza dicho objetivo es preciso definir y medir los resultados (los efectos sobre la salud) derivados de la prestación de los servicios sanitarios. La visión tradicional, anclada en el paradigma biomédico clásico, ha considerado históricamente que los únicos resultados relevantes son los “resultados centrados en el médico”, esto es, los efectos sobre la salud definidos y medidos por los clínicos. Ejemplos de este tipo de resultados son, por ejemplo, el volumen máximo espirado en una espirometría, la glucemia registrada en una analítica o la esperanza de vida ganada tras una intervención quirúrgica. Medidas biomédicas de resultados como las anteriores se utilizan en evaluación económica en el marco del análisis coste-efectividad. La utilidad de estas medidas es, no obstante, muy limitada en el caso de las enfermedades crónicas y discapacidades, donde la “carga” de la enfermedad no se deriva de la muerte prematura, sino de la disminución de la calidad de vida de los pacientes (Murray y López, 1997). Ante estas patologías (las más prevalentes, de hecho) cobra pleno sentido medir preferentemente los “resultados percibidos por el paciente” y no meramente aquellos exclusivamente centrados en el médico. Si bien cabe pensar en principio en una gran variedad de posibles resultados “percibidos” por los pacientes, en la práctica este concepto suele equipararse al de Calidad de Vida Relacionada con la Salud (CVRS), esto es, a la “percepción subjetiva que posee el paciente del impacto de su enfermedad y su tratamiento en su vida diaria, funcionamiento físico, psicológico y social, así como en su bienestar” (Riazi, 2006). La conexión entre la medición de la CVRS y la evaluación económica se hace evidente a través de los Años de Vida Ajustados por la Calidad (AVAC), medida de resultados recomendada por académicos e instituciones para la realización de análisis costeefectividad. Así, el National Institute for Health and Clinical Excellence (NICE), la agencia de evaluación económica más influyente del mundo, recomienda en sus directrices dirigidas a los fabricantes de tecnologías sanitarias (NICE, 2008: p. 38), que: “Para los análisis coste-efectividad, el valor de los efectos en salud deberían expresarse en términos de AVAC para el horizonte temporal apropiado.”. El número de AVAC derivado de una intervención sanitaria no es sino el tiempo de vida ganado a resultas de la misma, ponderado por la CVRS aparejada. Así, una ganancia de 5 AVAC es equivalente a una ganancia de 10 años con una calidad de vida del 50% de la salud perfecta o ideal. Esa fracción de la salud perfecta (1/2 en nuestro ejemplo) se denomina “peso” de CVRS o simplemente “utilidad”. De ahí que a la variante del análisis Cátedra de Economía de la Salud 2012/ 8 | 5 Utilidades SF-6D para España. Guía de uso coste-efectividad que utiliza los AVAC como medida de resultados se la conozca también como análisis coste-utilidad. Por tanto, la medición de la CVRS es un requisito imprescindible para calcular la ganancia en AVAC y la razón incremental coste-utilidad de un tratamiento, indicador éste crucial para decidir, por comparación con un umbral o ratio crítico (máximo precio que se está dispuesto a pagar por AVAC adicional), si dicho tratamiento es coste-efectivo. Llegados a este punto, la cuestión clave es determinar qué medida, escala o cuestionario de CVRS resulta aprovechable para el análisis coste-utilidad. Y esto porque no todas las medidas de CVRS existentes han sido concebidas para su utilización en evaluación económica ni, menos aún, específicamente diseñadas para calcular AVAC. A estos efectos, resulta útil distinguir entre las medidas de CVRS no basadas en preferencias, también denominadas “perfiles de salud” o “medidas del estado de salud”, y las “medidas basadas en preferencias” o “escalas de utilidad multiatributo” (Guyatt, Feeny y Patrick, 1993; Brazier et al., 1999). Unas y otras sirven para capturar cambios (en el tiempo) y diferencias (entre grupos de pacientes) en la CVRS, ya sea en el marco de ensayos clínicos o en condiciones de práctica clínica real, pero sólo las segundas generan “utilidades” que, combinadas con los años de vida, dan lugar a los AVAC. Esto se debe a que, de hecho, la utilidad o peso asignado a la CVRS percibida por el paciente es una medida del bienestar (de la preferencia individual en definitiva) que reporta dicha percepción. Por tanto, de los dos tipos de escalas mencionadas, sólo los instrumentos de utilidad multiatributo posibilitan la práctica del análisis coste-utilidad. El NICE (2008: p. 38) lo señala expresamente cuando afirma, al respecto de cómo abordar las evaluaciones económicas, que “la medición de los cambios en la CVRS debería provenir directamente de los pacientes y el valor de dichos cambios (esto es, las utilidades) deberían basarse en las preferencias del público”. En este documento describimos los rasgos básicos de una de las medidas de CVRS basada en preferencias más populares en la actualidad, el instrumento SF–6D. Esta medida posee la cualidad de conciliar la riqueza descriptiva del SF-36, el perfil de salud más ampliamente utilizado en el mundo (Garratt et al., 2002), con la posibilidad de calcular AVAC. Esta propiedad hace particularmente interesante conocer cómo obtener las utilidades SF-6D a partir de una base de datos SF-36. Con este objetivo, en el primer capítulo del documento se repasan los rasgos básicos del cuestionario SF-36 y del sistema SF-6D, mostrando la conexión entre ambos. En el segundo capítulo se describe el algoritmo que permite calcular para España la utilidad de cualquier estado de salud (descripción de CVRS) SF-6D y se explica cómo aplicarlo e interpretarlo. El documento finaliza con un apartado de discusión y conclusiones. Cátedra de Economía de la Salud 2012/ 8 | 6 Utilidades SF-6D para España. Guía de uso CAPÍTULO I: Del SF-36 al SF-6D > En este capítulo se presenta una taxonomía de medidas de CVRS, señalando las principales características de cada tipo. Se describen así mismo los rasgos básicos del SF-36 y del SF-6D, explicando la relación existente entre ambos instrumentos. 1.1 La perspectiva individual Cátedra de Economía de la Salud 2012/ 8 | 7 Utilidades SF-6D para España. Guía de uso 1.1 Medidas de CVRS y evaluación económica Los primeros intentos por medir la CVRS se remontan a la década de 1940 (Karnofsky y Burchenal, 1949), si bien no es hasta los decenios de 1960-1970 cuando podemos encontrar lo que hoy en día se concibe como medidas de CVRS, esto es, medidas caracterizadas en su mayoría por tres rasgos fundamentales (Badía y Lizán, 2003): • • • La importancia de los dominios físico, psíquico y social en la multidimensionalidad del concepto. El carácter subjetivo de la medición, efectuada a partir de las respuestas de los pacientes a las preguntas o ítems en que se descompone cada una de las dimensiones de la CVRS por medio de un cuestionario. La conversión de las respuestas dadas a los ítems en forma de puntuaciones numéricas parciales y/o globales. Mientras que los dos primeros rasgos (multidimensionalidad y subjetividad) son comunes a todas las medidas de CVRS, el tercero (la traslación de la descripción del estado de salud a un valor numérico) marca la diferencia entre las dos grandes categorías de instrumentos que se mencionaron en la introducción, a saber: perfiles de salud y medidas basadas en preferencias o, yendo a lo concreto, los instrumentos SF-36 y SF6D. Antes de abundar en la diferencia entre estos dos tipos de instrumentos, conviene precisar que tanto los perfiles de salud como las medidas basadas en preferencias pueden ser “específicos” o “genéricos”. Las medidas específicas pretenden medir la CVRS asociada a pacientes afectados por una patología o condición concreta –asma, diabetes, depresión, etc.–, mientras que las medidas genéricas, como su propio nombre indica, no están vinculadas a problemas específicos, siendo susceptibles de aplicarse a poblaciones diversas. A este último grupo pertenecen tanto el SF-36 como el SF-6D. Hasta finales del siglo XX prácticamente todas las medidas específicas disponibles eran perfiles de salud 1 , si bien a partir de esa fecha el ritmo de desarrollo de medidas específicas basadas en preferencias ha sido muy intenso2. Por tanto, los argumentos que vamos a exponer a continuación para justificar la utilidad que revisten las medidas basadas en preferencias para la evaluación económica, son de aplicación tanto a medidas genéricas como específicas. En primer lugar, la mayoría de los perfiles de salud carecen de un valor o puntuación global. Esto automáticamente los convierte en inútiles para el cálculo de razones 1 Ejemplos de este pefiles de salud específicos son el Ashma Quality of Life Questionnaire, Skindex-29 o el Diabetes Quality of Life Questionnaire. En esta categoría se encuentran, por ejemplo, el Rhinitis Symptom Utility Index, Asthma Symptom Utility Index o la valoración del International Prostate Symptom Score. 2 Cátedra de Economía de la Salud 2012/ 8 | 8 Utilidades SF-6D para España. Guía de uso incrementales coste-efectividad (Brazier et al., 1999) donde es preciso determinar si el beneficio que produce una intervención compensa en su conjunto (teniendo en cuenta todas las dimensiones de la CVRS) el mayor coste de la misma. A este respecto, hay que tener presente que la única finalidad perseguida por los perfiles de salud es describir la CVRS del paciente y no ser utilizados como medida de resultados para la evaluación económica, razón por la cual, con alguna excepción, este tipo de medidas suelen presentar (como mucho) puntuaciones separadas por dimensión, pero no una agregación de las mismas. En segundo lugar, tanto la asignación de valores por dimensión como su agregación entre dimensiones (en los pocos instrumentos que ésta se practica) descansan sobre supuestos arbitrarios, que en principio no guardan ninguna relación con las preferencias de los entrevistados (Brazier et al., 1999). Por ejemplo, en el SF-36, para calcular la puntuación de la dimensión “Dolor corporal”, se agregan las respuestas dadas a los dos ítems que integran dicha dimensión. Cada uno de esos ítems consta de una serie de niveles (categóricos) de respuesta. Pues bien, para obtener el valor asociada a dicha dimensión, se asume primero que la distancia o intervalo entre categorías contiguas dentro de un ítem es siempre la misma3, y además que los dos ítems que componen la dimensión tienen el mismo peso. Estos supuestos distan mucho de ser evidentes, ya que cada persona puede atribuir una mayor importancia a unas categorías que a otras, así como a un ítem respecto del otro4 . En definitiva, las puntuaciones de los perfiles de salud, incluso aunque sean globales, no son “utilidades”, esto es, índices representativos de las preferencias de los entrevistados, de modo que no son adecuadas para computar AVAC. Por último, como se desprende del mismo ejemplo con el SF-36, las escalas de respuesta de los perfiles de salud, al ser a lo sumo ordinales (p.ej. “Nada”, “Un poco”, “Regular”, “Bastante”, “Mucho”), aun cuando mediante una regla (arbitraria) de agregación diesen lugar a una medida global de CVRS, ésta no podría utilizarse para comparar entre sí las razones incrementales coste-efectividad de dos o más intervenciones (Sánchez, Abellán y Martínez, 2010). Para que dichas comparaciones tengan sentido es preciso que la relación entre las razones incrementales sea invariable, para lo cual se requiere que las ganancias de CVRS se mida en escalas cardinales, no ordinales5. 3 Es decir, al asignar la puntuación al ítem “Durante las últimas 4 semanas, ¿hasta qué punto el dolor le ha dificultado su trabajo habitual?” el SF-36 asume que la distancia entre la categoría “Un poco” y la categoría “Nada” es la misma que entre “Bastante” y “Mucho”. 4 Por ejemplo, una persona podría preferir más intensamente pasar de tener “Un poco” de dolor a no tener “Nada” de dolor, antes que pasar de tener “Mucho” dolor a tener “Bastante” dolor. 5 Una ilustración práctica de cómo las escalas ordinales pueden dar lugar a resultados contradictorios al comparar entre sí las razones incrementales de dos o más tecnologías sanitarias se muestra en Sánchez, Abellán y Martínez (2010), Recuadro 6. Puede consultarse en: http://www.gestion-sanitaria.com/3-medidaresultados.html Cátedra de Economía de la Salud 2012/ 8 | 9 Utilidades SF-6D para España. Guía de uso Por el contrario, las medidas de CVRS basadas en preferencias sí permiten obtener auténticas “utilidades” y, por ende, construir AVAC y razones incrementales costeutilidad. Cada una de estas medidas (a las que pertenece el SF-6D) posee dos componentes: un sistema descriptivo de clasificación del estado de salud y un modelo de valoración o algoritmo que sirve para generar los índices cardinales de preferencias o utilidades. El primero de estos componentes es similar al de los perfiles de salud, esto es, una combinación de varias dimensiones e ítems (multidimensionalidad), por medio de cuya combinación puede describirse la CVRS percibida por el paciente (subjetividad). La diferencia con los perfiles de salud radica en el segundo componente, el algoritmo; un modelo estadístico que permite asociar una utilidad a cada uno de los estados de salud que es capaz de describir el instrumento. El conjunto de todas las utilidades que puede generar dicho modelo suele recibir el nombre de “tarifa social” o simplemente “conjunto de valores” (value set). 1.2 El SF-36 El cuestionario SF-36 fue diseñado por Ware y otros en Estados Unidos a principios de los años noventa (Ware y Sherbourne, 1992; Ware et al., 1993) para su utilización en el denominado “Estudio de los Resultados Médicos” (Medical Outcomes Study). El cuestionario abarca 8 dimensiones, cada una de ellas con un número variable de ítems (véase Tabla 1). De manera adicional, el SF-36 incluye un ítem de transición que pregunta por el cambio en el estado de salud general respecto al año anterior. Este ítem no se utiliza para el cálculo de ninguna puntuación, pero proporciona información útil sobre el cambio auto-percibido en la propia salud. Los 35 ítems distribuidos a lo largo de las 8 dimensiones más este último ítem de transición suman los 36 ítems que dan nombre al instrumento. La Tabla 2 pone en contexto el SF-36 en relación a otros perfiles genéricos de salud. Las puntuaciones de las 8 dimensiones del SF-36 se ordenan de forma tal que cuanto mayor sea el valor registrado, tanto mejor es el estado de salud correspondiente. Dentro de cada dimensión los ítems son codificados, agregados y transformados en una escala que va de 0 (peor puntuación) a 100 (mejor puntuación). Además, el cuestionario permite el cálculo de dos puntuaciones resumen, la “componente resumen física” (PCS) y la “componente resumen mental” (MCS), mediante la suma ponderada de las puntuaciones de las 8 dimensiones principales. Las ponderaciones empleadas se obtuvieron a partir de estudios de análisis factorial realizados con diferentes muestras de la población general estadounidense (Ware et al., 1994). La principal ventaja que ofrece fundamentar las puntuaciones resumen en algoritmos derivados de una población de referencia es que los resultados obtenidos son directamente interpretables respecto a la misma. En concreto, como puede apreciarse en la Tabla 1, puntuaciones superiores o Cátedra de Economía de la Salud 2012/ 8 | 10 Utilidades SF-6D para España. Guía de uso inferiores a 50 indican un mejor o peor estado de salud, respectivamente, que la población de referencia. Tabla 1. Rasgos principales de los cuestionarios SF-36 y SF-12* Ítems SF-36 SF-12 Dimensiones Función física Rol físico Dolor corporal Salud general Vitalidad Función social Rol emocional Salud mental PCS MCS 10 4 2 5 4 2 3 5 21 14 2 2 1 1 1 1 2 2 6 6 Niveles SF-36v1 SF-36v2 21 5 11 21 21 9 4 26 --- 21 17 11 21 17 9 13 21 --- SF-36v1 Puntuación SF-36v2 SF-12 0-100 0-100 0-100 0-100 0-100 0-100 0-100 0-100 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) 50 (10) *: Las puntuaciones 0-100 tienen ese rango, interpretándose como el peor o mejor estado de salud, respectivamente. En las puntuaciones 50 (10) la población de referencia tiene una puntuación media de 50, con una desviación estándar de 10, por lo que valores superiores o inferiores a 50 indican un mejor o peor estado de salud, respectivamente, que la población de referencia. Fuente: Adaptado de Vilagut et al. (2005). Tabla 2. Perfiles de salud genéricos más importantes Sistema descriptivo SIPa NHP COOP/-WONCAd SF-36e SF-12f Procedencia EE.UU. Reino Unido EE.UU. EE.UU. EE.UU. Atributos 12 6 6(+1 op.) 8 8 Ítems 136 38 6(+1 op.) 36 12 Traducción al castellano validada * Badía y Alonso (1994)b Alonso et al. (1990)c Lizán y Reig (1999) Alonso et al. (1995) No a. b. c. d. Existe una versión abreviada conocida como SIP68 (de Bruin et al., 1994). El nombre dado en la traducción al SIP es el de Perfil de las Consecuencias de la Enfermedad. El nombre dado en la traducción al NHP es el de Perfil de Salud de Nottingham. Las viñetas COOP/WONCA tienen 6 dimensiones, más una séptima opcional. Las viñetas COOP originales poseen 9 dimensiones con 1 ítem por dimensión. e. Existen dos versiones del cuestionario SF-36: SF-36 v1.0 (Ware y Sherbourner, 1992) y SF-36 v2.0 (Ware et al., 2000). f. Existen dos versiones del cuestionario SF-12: SF-12 v1.0 (Ware et al., 1996) y SF-12 v2.0 (Ware et al., 2002). *: Por traducción validada se entiende aquella que se ha obtenido merced a un protocolo de adaptación transcultural del instrumento de CVRS original para su utilización, con las mismas garantías psicométricas, en un ámbito cultural y lingüístico diferente (Guillemin et al., 1993). Cátedra de Economía de la Salud 2012/ 8 | 11 Utilidades SF-6D para España. Guía de uso A finales de los años noventa se desarrolló la versión 2.0 del cuestionario original SF-36 con el objetivo, entre otros, de mejorar las características métricas de las escalas de rol físico y emocional (Ware et al., 2000). Una síntesis de las principales modificaciones que introduce esta nueva versión del SF-36 puede consultarse en Vilagut et al. (2005). Una de estas diferencias es que el SF-36v2 permite estandarizar las puntuaciones de cada dimensión sobre la base de normas poblacionales, de modo que, como sucedía con las puntuaciones resumen PCS y MCS, sean comparables con una población de referencia. Como se observa en las Tablas 1 y 2, hay un cuestionario emparentado con el SF-36, conocido como SF-12. Este cuestionario surgió (Ware et al., 1996) como un intento de acortar el tiempo requerido para la administración del cuestionario SF-36, sin merma significativa de la capacidad explicativa de las puntuaciones resumen. Este instrumento está formado por una selección de 12 ítems del conjunto total que integra el SF-36 (1-2 por dimensión). Al igual que sucedía con el SF-36 hay dos versiones del cuestionario SF12 (Ware et al., 2002), cuyos niveles y puntuaciones se muestran en la Tabla 1. Como ya se comentó en la Introducción, el SF-36 es la medida de CVRS que más frecuentemente se administra a grupos de pacientes. La revisión bibliográfica abordada por Garratt et al. (2002) reveló que de casi 3.000 publicaciones identificadas, más del 10% de las mismas (408) eran aplicaciones del SF-36. En España, de acuerdo al índice desarrollado por Badía et al. (1996) para valorar el grado de desarrollo de una medida de CVRS en nuestro país (índice GRAQoL), el SF-36 tendría un grado de desarrollo calificado como bueno 6 . A esto se une que el SF-36 posee buenas propiedades psicométricas, destacando su gran sensibilidad para detectar cambios en la salud, superior en promedio a cualquiera de los otros instrumentos recogidos en la Tabla 2, lo cual sin duda proviene de su gran riqueza informativa (puede describir millones de estados de salud diferentes). Por todas estas razones sería muy interesante disponer de un instrumento basado en preferencias que sirviera de “puente” entre el SF-36 y los AVAC. Dicho instrumento es el SF-6D, que se describe a continuación. 6 De acuerdo a la escala del GRAQoL, un valor (expresado en porcentaje) inferior al 50% indica un escaso grado de desarrollo del instrumento en cuestión en España; entre 51% y 70%, un nivel de implantación aceptable; y del 71% en adelante, un nivel de desarrollo bueno. El SF-6D obtuvo un valor del 77%. Cátedra de Economía de la Salud 2012/ 8 | 12 Utilidades SF-6D para España. Guía de uso 1.3 El SF-6D y su conexión con el SF-36 El SF-6D intenta conciliar la riqueza descriptiva del SF-36 con la capacidad para calcular AVAC propia de las medidas basadas en preferencias. Con ese objetivo, Brazier et al. (1998) llevaron a cabo un estudio en el Reino Unido siguiendo las siguientes etapas: 1. Redimensionar el SF-36 hasta reducirlo a un sistema descriptivo lo suficientemente manejable como para obtener valoraciones fiables de la población de los nuevos estados de salud. Nacía así el sistema de clasificación de CVRS conocido como SF-6D. 2. Someter a valoración directa por parte de una muestra de conveniencia un subconjunto (59 estados) del total de estados (9.000 diferentes) que potencialmente puede describir el sistema7. 3. Estimar, por medio de técnicas de inferencia estadística (lo que se ha denominado enfoque “compuesto”8), un algoritmo para valorar la totalidad de los estados definidos por el sistema SF-6D. La versión inicial del SF-6D fue objeto de cambios posteriormente (Brazier et al., 2002), dando lugar al sistema actualmente en vigor. Una consecuencia de los cambios introducidos en los niveles del instrumento fue la duplicación del número de estados de salud que es capaz de describir, ascendiendo así a 18.000 (véase la Tabla 3). Cada uno de estos estados se define como una combinación de seis dimensiones con un número variable de niveles, que va de 4 a 6 por dimensión, cuyo contenido se muestra en la Tabla 4. Para estimar el nuevo algoritmo, Brazier et al. (2002) siguieron los mismos antes enunciados, con la salvedad de que ahora fue una muestra representativa de la población inglesa compuesta por 836 individuos la que valoró un total de 249 estados9. Esta valoración se efectuó empleando un procedimiento conocido como “lotería estándar”10, el cual ha sido considerado durante mucho tiempo el “estándar de oro” o 7 El procedimiento por el cual se selecciona el subconjunto de estados que se somete a valoración se conoce como ortogonalización, y muchos paquetes estadísticos (p.ej. SPSS) contienen un módulo para su ejecución. 8 Otras medidas de CVRS basadas en preferencias emplean otro enfoque conocido como “descompuesto” o de la “función de utilidad multiatributo” (Dolan, 2002; Stevens et al. 2007). Dicho enfoque es el empleado para modelizar el algoritmo de toda la familia de índices HUI (véase Tabla 1). 9 El núcleo de estados surgido de la ortogonalización ascendió a 49. A estos se añadieron otros 200 a fin de poder estimar modelos que contemplasen interacciones entre las diferentes dimensiones del SF-6D. Con los estados derivados de una ortogonalización sólo puede estimarse un modelo puramente aditivo, esto es, un modelo que omite la posibilidad de que existan efectos cruzados entre atributos (p.ej. que las dimensiones Funcionamiento Físico y Funcionamiento Social sean complementarias). A este tipo de modelos aditivos también se les denomina de “efectos principales”. 10 La lotería estándar presenta al entrevistado dos opciones hipotéticas: pasar el resto de la vida con un estado de salud inferior a la salud perfecta, o bien someterse a un tratamiento que puede salir bien, recuperando entonces la salud plena, pero que también puede fracasar, representando entonces la muerte inmediata. El entrevistado debe determinar para qué riesgo de muerte le resultarían equivalentes las dos alternativas. Una descripción más detallada de esta técnica puede encontrarse en Torrance (1986) o en Drummond et al. (2005). Cátedra de Economía de la Salud 2012/ 8 | 13 Utilidades SF-6D para España. Guía de uso método de referencia en cuanto a medición de utilidades de estados de salud se refiere (Torrance et al., 2001). Tabla 3. Componente descriptivo de varios sistemas de utilidad multiatributo Sistema descriptivo QWBa Rosserb 15-Dc HUI3d EQ-5De AQoLf SF-6D (SF-36)g SF-6D (SF-12)h Atributos Niveles por atributo 4 2 15 8 5 15 6 6 3, 5 y 27 4y8 5 5ó6 3 4 4a6 3a5 Estados de salud 1215 29 > 30 millardos 972000 243 > 1 millardo 18000 7500 a. b. c. d. The Quality of Well-Being Scale (Patrick et al., 1973) Rosser y Kind (1978) Sintonen (1994) Los antecedentes del Healh Utility Index Mark 3 (Feeny et al., 1998) son el HUI1(Torrance et al., 1982) y el HUI2 (Torrance et al., 1996). e. EuroQol-5D (EQ-5D), Brooks (1996). Estimado para España por Badía et al. (2001). f. The Assessment of Quality of Life (Hawthorne et al., 1997). g. Brazier et al. (2002). h. Brazier y Roberts (2004). Fuente: Adaptado de Dolan (2002). Existe una versión diferente del SF-6D (Brazier y Roberts, 2004), cuya singularidad radica en que está derivada a partir del SF-12 y no del SF-36. Aunque todos los ítems que componen el SF-12 provienen del SF-36, hay algunos ítems empleados para definir el sistema clasificatorio SF-6D construido a partir del SF-36 que no se encuentran en el SF-12; por este motivo, no resulta posible aplicar el algoritmo estimado para el SF6D(SF-36) al SF-6D(SF-12). La Tabla 5 muestra qué ítems concretos de la versión 2 de los cuestionarios SF-36 y SF-12 se extraen para definir el SF-6D en cada caso. Como puede apreciarse en dicha tabla, mientras el SF-6D(SF-36) proviene de una extracción de 11 ítems del SF-36, el SF-6D(SF-12) surge de una extracción de 7 ítems. Centrándonos en el caso del SF-36v2, la conversión de las respuestas dadas por un paciente a este cuestionario en estados SF-6D se efectúa siguiendo la correspondencia establecida en la Tabla 6. Por ejemplo, si a la pregunta 22 del SF-36 (“¿Hasta qué punto el dolor le ha dificultado su trabajo habitual?” el sujeto responde “Bastante”, se le asignará el nivel 5 de la dimensión “Dolor” del SF-6D. Si, por ejemplo, a la pregunta 3 del SF-36 (“Su salud actual, ¿le limita para hacer … esfuerzos intensos, tales como correr, levantar objetos pesados, o participar deportes agotadores”) el entrevistado Cátedra de Economía de la Salud 2012/ 8 | 14 Utilidades SF-6D para España. Guía de uso responde “No, no me limita nada”, le corresponderá el nivel 1 en la dimensión “Funcionamiento Físico”. Y así, sucesivamente. Una vez realizada esta conversión, ya pueden aplicarse a los estados así obtenidos las utilidades que correspondan según un determinado algoritmo. Cómo efectuar dicha aplicación se explica en el siguiente capítulo. Al modelo inicialmente recomendado por Brazier et al. (2002) para el Reino Unido siguió otro, más consistente, estimado por Brazier y Roberts (2004). Con posterioridad, y empleando técnicas de modelización diferentes a las empleadas previamente, se han obtenido nuevas estimaciones para el Reino Unido por McCabe et al. (2006) y Kharroubi et al. (2007). Asimismo, hay en la actualidad algoritmos estimados para otros territorios como Hong Kong (Lam et al., 2008), Portugal (Ferreira et al., 2010) o Japón (Brazier et al., 2009). La tarifa estimada para España se describe en el siguiente capítulo. Por último, en relación a las propiedades empíricas del SF-6D, hay que decir que, en comparación al EQ-5D (la medida basada en preferencias más extensamente utilizada), goza de una menor practicabilidad (Gerard et al., 2004; Barton et al., 2008), pero en contrapartida parece ofrecer una superior capacidad para discriminar entre pacientes de dispar gravedad (Petrou y Hockley, 2005) y una sensibilidad al cambio igual o incluso mayor (Marra et al., 2005; Walters y Brazier, 2003; 2005). Así mismo, mientras que el EQ-5D parece sufrir de un “efecto techo”, el SF-6D se ve afectado por un “efecto suelo”. En general, el efecto suelo se asocia a la incapacidad que parece poseer el sistema de clasificación SF-6D para describir adecuadamente estados de salud relativamente graves (Longworth y Bryan, 2003). Esta potencial debilidad del instrumento se pone de manifiesto en el hecho de que muchos pacientes seleccionan el nivel inferior (el más grave) de ciertas dimensiones para describir su propio estado de salud (Ferreira et al., 2008). El fenómeno opuesto sucede con el EQ-5D, donde una fracción importante de encuestados suele describir su estado de salud mediante este instrumento como “perfecto” (Brazier et al., 2004). Por su parte, el efecto suelo del SF-6D también se evidencia en la existencia de una utilidad mínimo (un “suelo”) muy superior a la del EQ5D. En concreto, el “suelo” de la tarifa británica del SF-6D(SF-36) estimada por Brazier y Roberts (2004) es de 0.354, mientras que el valor mínimo de la tarifa británica del EQ5D estimada por Dolan (1997) es de -0.594. El rango de utilidades considerablemente más estrecho del SF-6D hace que las utilidades correspondientes a estados de salud relativamente graves sean mayores con el SF-6D que con el EQ-5D (Bryan y Longworth, 2005; Lamers et al., 2006; Buxton et al., 2007). Cátedra de Economía de la Salud 2012/ 8 | 15 Funcionamiento físico Su salud no le limita para realizar esfuerzos intensos (p.ej. correr, levantar objetos pesados, participar en deportes agotadores). Su salud le limita un poco para realizar esfuerzos intensos (p.ej. correr, levantar objetos pesados, participar en deportes agotadores). Su salud le limita un poco para realizar esfuerzos moderados (p.ej. mover una mesa, pasar la aspiradora o caminar más de 1 hora). Su salud le limita mucho para realizar esfuerzos moderados (p.ej. mover una mesa, pasar la aspiradora o caminar más de 1 hora). Su salud le limita un poco para bañarse o vestirse por sí mismo. Su salud le limita mucho para bañarse o vestirse por sí mismo. Nivel 1 2 3 Cátedra de Economía de la Salud 4 2012/ 8 5 6 Ha dejado de hacer algunas tareas en su trabajo o en sus actividades cotidianas a causa de su salud física y hace menos de lo que quisiera hacer a causa de sus problemas emocionales. Hace menos de lo que quisiera hacer a causa de sus problemas emocionales. Ha dejado de hacer algunas tareas en su trabajo o en sus actividades cotidianas a causa de su salud física. No tiene problemas con su trabajo u otras actividades cotidianas a causa de su salud física o de sus problemas emocionales. Limitaciones de rol Se siente muy nervioso o desanimado y deprimido casi siempre. Tiene dolor que interfiere moderadamente con su trabajo habitual (fuera de casa o en las tareas del hogar). Su salud le dificulta sus actividades sociales (como visitar a amigos o familiares) siempre. Su salud le dificulta sus actividades sociales (como visitar a amigos o familiares) casi siempre. Tiene dolor que interfiere mucho con su trabajo habitual (fuera de casa o en las tareas del hogar). Tiene dolor que interfiere bastante con su trabajo habitual (fuera de casa o en las tareas del hogar). Se siente muy nervioso o desanimado y deprimido algunas veces. Tiene dolor que interfiere un poco con su trabajo habitual (fuera de casa o en las tareas del hogar). Su salud le dificulta sus actividades sociales (como visitar a amigos o familiares) algunas veces. Se siente muy nervioso o desanimado y deprimido sólo alguna vez. Tiene dolor pero no interfiere con su trabajo habitual (fuera de casa o en las tareas del hogar). Su salud le dificulta sus actividades sociales (como visitar a amigos o familiares) sólo alguna vez. Salud mental Nunca se siente muy nervioso o desanimado y deprimido. Dolor No tiene dolor. Su salud no le dificulta sus actividades sociales (como visitar a amigos o familiares) en ningún momento. Funcionamiento social Tabla 4. El sistema de clasificación de estados de salud SF-6D(SF-36). Brazier et al. (2002) Vitalidad mucha casi Nunca tiene mucha energía. Tiene mucha energía sólo alguna vez. Tiene mucha energía algunas veces. Tiene energía siempre. Tiene mucha energía siempre. Utilidades SF-6D para España. Guía de uso | 16 Cátedra de Economía de la Salud 2012/ 8 Limitaciones de rol (emocional) Limitaciones de rol (físico) Funcionamiento físico Salud general Escalas Ítems 1 11a 11b 11c 11d 3a 3b 3c 3d 3e 3f 3g 3h 3j 4a 4b 4c 4d 5a 5b 5c SF-36v2 Pregunta 1 33 34 35 36 3 4 5 6 7 8 9 10 12 13 14 15 16 17 18 19 Niveles 5 5 5 5 5 3 3 3 3 3 3 3 3 3 5 5 5 5 5 5 5 4a 4b 6 7 4 5 3 2b 3a 3b 2 2a Ítems 1 SF-12 v2 Pregunta 1 5 5 5 5 3 3 Niveles 5 5 4 3 1 2 SF-6D(SF-36) Equivalencia 3 2 1 SF-6D(SF-12) Equivalencia X X X Comunes Tabla 5. Equivalencias entre las dos versiones del SF-6D y los cuestionarios de los que se derivan* Limitaciones de rol Limitaciones de rol Funcionamiento físico Funcionamiento físico Funcionamiento físico SF-6D Dimensiones Utilidades SF-6D para España. Guía de uso | 17 Cátedra de Economía de la Salud 2012/ 8 Ítems 6 7 8 9a 9e 9g 9l 9b 9c 9d 9f 9h 10 SF-36v2 Pregunta 20 21 22 23 27 29 31 24 25 26 28 30 32 Niveles 5 6 5 5 5 5 5 5 5 5 5 5 5 7 12 10 11 9 6b 6a 6c 8 5 Ítems SF-12 v2 Pregunta 5 5 5 5 5 Niveles 11 10 8 9 6 7 SF-6D(SF-36) Equivalencia 7 6 5 4 SF-6D(SF-12) Equivalencia X X X X Comunes Funcionamiento social Salud mental Salud mental Vitalidad Dolor Dolor SF-6D Dimensiones primer lugar, el segundo tiene 3 niveles menos en la dimensión “Funcionamiento físico”, uno de los cuales, además, no coincide con los del SF-6D(SF-36). En segundo lugar, el SF-6D(SF-12) tiene un nivel menos en la dimensión “Dolor”. * A partir del SF-36 v2 pueden extraerse las respuestas a los ítems del SF-12 vs. No es posible, sin embargo, pasar del SF-6D(SF-36) al SF-6D(SF-12), pues, en Funcionamiento social (frecuencia) Salud mental Funcionamiento social (extensión) Dolor (magnitud) Dolor (interferencia) Vitalidad Escalas Tabla 5 (cont.). Equivalencias entre las dos versiones del SF-6D y los cuestionarios de los que se derivan * Utilidades SF-6D para España. Guía de uso | 18 Utilidades SF-6D para España. Guía de uso Tabla 6. Conversión de las respuestas SF-36v2 en estados SF-6D Pregunta SF-36v2* 3, 4, 12 15, 18 32 21, 22 24, 28 27 Cátedra de Economía de la Salud Respuestas (tras el igual se indica el nivel) Dimensión (nivel) SF-6D Si P3 = 3 y P4 = 3 y P12 = 3 Funcionamiento Físico (1) Si P3 = 1 y P4 = 3 y P12 = 3 FF(2) Si P3 = 2 y P12 = 3 FF (3) Si P4 = 1 y P12 = 3 FF (4) Si P12 = 2 FF (5) Si P12 = 1 FF (6) Si P15 = 5 y P18 = 5 Limitaciones de Rol (1) Si P15 < 5 y P18 = 5 LR (2) Si P18 < 5 LR (3) Si P15 < 5 y P18 < 5 LR (4) Si P32 = 1 Funcionamiento Social (1) Si P32 = 2 FS (2) Si P32 = 3 FS (3) Si P32 = 4 FS (4) Si P32 = 5 FS (5) Si P21 = 1 y P22 = 1 Dolor (1) Si P21 > 1 y P22 = 1 D (2) SI P22 = 2 D (3) Si P22 = 3 D (4) Si P22 = 4 D (5) Si P22 = 5 D (6) Si P24 = 5 y P28 = 5 Salud Mental (1) Si P24 = 4 y P28 = 4 SM (2) Si P24 = 3 y P28 = 3 SM (3) Si P24 = 2 y P28 = 2 SM (4) Si P24 = 1 y P28 = 1 SM (5) Si P27 = 1 Vitalidad (1) Si P27 = 2 V (2) Si P27 = 3 V (3) Si P27 = 4 V (4) Si P27 = 5 V (5) 2012/ 8 | 19 Utilidades SF-6D para España. Guía de uso CAPÍTULO II: La tarifa española del SF-6D > En esta sección del documento se describe el estudio realizado para estimar el algoritmo SF-6D a partir de las preferencias de la población española. Asimismo se explica cómo aplicar dicho algoritmo a los estados de salud SF-6D de los pacientes. ste abundante evidencia empírica que apoya el supuesto de que un año de vida ganado Cátedra de Economía de la Salud 2012/ 8 | 20 Utilidades SF-6D para España. Guía de uso 2.1 El estudio de campo El estudio para obtener la tarifa española del SF-6D(SF-36) (Abellán et al. 2012) abordó la realización de dos encuestas: una (la principal) para recabar las valoraciones de una amplia muestra de la población general española, a partir de las cuales poder inferir el algoritmo de valoración SF-6D para España; otra, mucho más reducida, con el objeto de contrastar directamente si el “efecto suelo” atribuido al SF-6D puede ser, al menos parcialmente, consecuencia del método de valoración (la lotería estándar) que han empleado la práctica totalidad de los estudios precedentes. En relación al estudio principal, se seleccionó un total de 78 estados de salud SF-6D para su valoración directa por parte de una muestra representativa (N = 1.020) por cuotas de edad y sexo de la población general española. Aunque el conjunto mínimo de estados necesario para poder inferir estadísticamente el modelo fue de 49 (el mismo número identificado por Brazier et al., 2002), se optó por incrementarlo hasta un total de 78, a fin de poder estudiar interacciones potenciales entre los atributos. La muestra fue dividida en 17 subgrupos, cada uno de los cuales valoró 5 estados de salud. La principal novedad del estudio fue la utilización de una técnica de valoración distinta a la lotería estándar. El procedimiento empleado se llama “lotería equivalente” (McCord y de Neufville, 1986), por cuanto el entrevistado confronta dos loterías (dos tratamientos hipotéticos arriesgados), siendo el objetivo del procedimiento variar las probabilidades de una de las dos (manteniendo constantes las de la otra), hasta que el entrevistado declare que considera equivalentes ambas loterías. La motivación para aplicar este método en lugar de la tradicional lotería estándar radica en la evidencia previa existente (Kahneman y Tversky, 1979) que sugiere que la lotería estándar puede propiciar utilidades demasiado elevadas (sesgadas al alza); sesgo que parece corregirse al emplear la lotería equivalente (Cohen y Jaffray, 1988). La expectativa previa a la estimación de la tarifa española sería, por tanto, que el “suelo” del SF-6D se redujese, ampliando el rango de utilidades del instrumento. La segunda encuesta antes referida pretende aportar evidencia añadida sobre la mencionada diferencia entre la lotería estándar y la lotería equivalente, mediante una comparación directa entre las dos. Con este fin, un grupo adicional de 60 sujetos valoró mediante la lotería estándar los mismos 5 estados de salud que fueron valorados mediante la lotería equivalente por uno de los 17 subgrupos de la encuesta principal. Todas las entrevistas (de ambas encuestas) fueron presenciales y asistidas por ordenador. La duración media de cada una de ellas rondó los 20 minutos. Cátedra de Economía de la Salud 2012/ 8 | 21 Utilidades SF-6D para España. Guía de uso 2.2 El algoritmo y su aplicación A partir de las valoraciones obtenidas con la lotería equivalente de la muestra de 1.020 personas, y mediante la aplicación de procedimientos de inferencia estadística (análisis de regresión), se estimó el algoritmo SF-6D para España. Como es habitual en este tipo de estudios se estimaron varios modelos, tanto con datos individuales, como con datos medios. Asimismo, se ensayaron diversas especificaciones, con y sin términos de interacción entre las diferentes dimensiones del SF-6D. Ninguno de los términos de interacción introducidos fue estadísticamente significativo, de modo que los algoritmos finalmente seleccionados fueron puramente aditivos. De éstos, al igual que sucediera a los investigadores británicos, el modelo que demostró una mayor capacidad predictiva11 fue el modelo estimado utilizando utilidades medias, cuyos coeficientes se muestran en la Tabla 7, en comparación a los del análogo británico. Lo primero que hay que explicar al lector es cómo interpretar los coeficientes del algoritmo, así como la manera en que hay que combinarlos para predecir la utilidad de cualquier estado de salud SF-6D. Con este propósito, imaginemos primero que hemos administrado el cuestionario SF-36v2 a un paciente, y que hemos traducido sus respuestas a los niveles correspondientes del SF-6D, de acuerdo a lo indicado en la Tabla 6. Supongamos que el estado de salud del mencionado paciente corresponde a la siguiente combinación de niveles de las seis dimensiones del SF-6D: 231254. Esta combinación se lee como nivel 2 en la dimensión “Funcionamiento Físico”, nivel 3 en la dimensión “Limitaciones de rol”, y así sucesivamente, siguiendo el mismo orden mostrado en la Tabla 6. Ahora hemos de aplicar el algoritmo. Para ello, cada vez que el nivel de una dimensión es distinto de 1 (ausencia de problemas o limitaciones en la dimensión), eso indica que se produce una desviación de la salud perfecta. En consecuencia, el valor negativo del coeficiente correspondiente señala en cuánto se reduce la utilidad de la salud perfecta a consecuencia de tener algún problema en esa dimensión. La utilidad de la salud perfecta es por convención igual a la unidad. Por tanto, la utilidad del estado 231254 se calculará mediante el algoritmo español como: 1 – FF2 – LR3 – DO2 – SM5 – VI4 Donde FF2, LR3, DO2, SM5 y VI4 aluden los coeficientes del nivel 2 de “Funcionamiento físico”, el nivel 3 de “Limitaciones del rol”, el nivel 2 de “Dolor”, el nivel 5 de “Salud 11 La capacidad predictiva del modelo se verifica observando en qué medida se aproximan las utilidades predichas por el algoritmo a las valoradas directamente por la población. El indicador que permite dicha verificación es el Error Absoluto Medio (EMA) que corresponde al promedio de las diferencias, tomadas en valor absoluto, entre las utilidades observadas y las utilidades predichas. Cátedra de Economía de la Salud 2012/ 8 | 22 Utilidades SF-6D para España. Guía de uso mental” y el nivel 4 de “Vitalidad”, respectivamente (la dimensión “Funcionamiento social” no supone pérdida alguna de utilidad, pues se encuentra en el nivel 1). Asignando a cada coeficiente su valor correspondiente según el citado algoritmo, tendríamos que la utilidad del estado 231254 es igual a: 1 – 0.015 – 0.038 – 0 – 0.018 – 0.224 – 0.157 =0.548 El algoritmo británico, por su parte, asigna a este mismo estado una puntuación de 0.62, la cual se deriva según la siguiente fórmula: 1 – FF23 – LR234 – DO23 – SM5 – VI234 - MOST La aplicación de este sencillo ejemplo pone de manifiesto algunas diferencias entre el algoritmo británico y el español. En primer lugar, la utilidad predicha por el modelo español es más pequeña, lo cual es congruente con el ensanchamiento del rango de utilidades logrado por la nueva estimación. Si tomamos el peor estado posible del SF-6D, esto es, el estado 645655, y calculamos su utilidad con los dos algoritmos, observamos que el valor mínimo predicho por el modelo español es -0.357, muy inferior a 0.354, el mínimo predicho por el modelo del Reino Unido. Parece claro, por tanto, que el estudio realizado ha logrado reducir el “suelo” del SF-6D. En segundo lugar, todos los coeficientes del modelo español resultan estadísticamente significativos; no observándose, además, ninguna inconsistencia entre ellos. Por inconsistencia nos referimos a que la magnitud negativa de los coeficientes de una misma dimensión no crezca conforme lo hagan los niveles (conforme lo haga la gravedad del estado de salud). Ejemplo de este tipo de inconsistencias fue la producida en la estimación británica de Brazier et al. (2002), donde estar en el nivel 4 de “Limitaciones de rol” restaba menos utilidad que estar en el nivel 3 o en el nivel 2. Por esta razón, Brazier y Roberts (2004) unieron los tres niveles estimando un nuevo coeficiente RL234, que es el que se muestra en la Tabla 7. Finalmente, como ya se apuntó, el algoritmo español no incorpora ningún término de interacción entre dimensiones. A este respecto el modelo británico sólo halló significativa la variable MOST, un término que refleja la pérdida adicional de utilidad que produce alcanzar el nivel más grave en alguna de las dimensiones. En cualquier caso, si la comparación del modelo español se circunscribe a los modelos aditivos estimados en el Reino Unido 12 , continúa cumpliéndose que el rango de las utilidades españolas es significativamente mayor. Además, pese a haber valorado un número de estados 12 Por ejemplo, el modelo de efectos principales número 6 estimado por Brazier et al. (2002). Cátedra de Economía de la Salud 2012/ 8 | 23 Utilidades SF-6D para España. Guía de uso sensiblemente inferior al manejado por Brazier y colaboradores (78 vs 249), el error cometido al predecir las utilidades es muy similar al del Reino Unido (0.081 vs 0.074). Tabla 7.- Algoritmo SF-6D español vs británico Algoritmo español* FF2 -0.015 FF3 -0.034 FF4 Algoritmo británico** FF23 -0.035 -0.090 FF4 -0,044 FF5 -0.111 FF5 -0,056 FF6 -0.338 FF6 -0,117 LR2 -0.014 LR3 -0.038 LR234 -0.053 LR4 -0.070 FS2 -0.037 FS2 -0,057 FS3 -0.060 FS3 -0,059 FS4 -0.203 FS4 -0,072 FS5 -0.208 FS5 -0,087 DO2 -0.018 DO23 -0.042 DO3 -0.034 DO4 -0.198 DO4 -0,065 DO5 -0.202 DO5 -0,102 DO6 -0.318 DO6 -0,171 SM2 -0.066 SM23 -0.042 SM3 -0.078 SM4 -0.096 SM4 -0,100 SM5 -0.224 SM5 -0,118 VI2 -0.058 VI3 -0.121 VI234 -0,071 VI4 -0.157 VI5 -0.199 VI5 -0,092 MOST -0,061 *: Todos los coeficientes del algoritmo español son significativos al 1%. **: Aparecen agrupados aquellos coeficientes que no fueron significativos (p.ej. FF2) o que daban lugar a inconsistencias (p.ej. LR4). Todos los coeficientes del algoritmo británico son significativos al 10%. Cátedra de Economía de la Salud 2012/ 8 | 24 Utilidades SF-6D para España. Guía de uso DISCUSIÓN Y CONCLUSIONES En este documento hemos explicado la relevancia que entraña la medición de la CVRS para la evaluación económica de las intervenciones sanitarias. Hemos constatado que el NICE, en sus directrices para evaluar económicamente tecnologías sanitarias, equipara la valoración de los efectos sobre la salud con la medición de los cambios experimentados en la CVRS de los pacientes y que el valor de tales cambios debe estar fundamentado en las preferencias de la población. A este valor representativo de las preferencias individuales se le denomina “peso” de calidad de vida o simplemente “utilidad”. De la combinación de utilidades y años de vida se derivan los AVAC, la medida de resultados también recomendada por el NICE para acometer los análisis coste-efectividad. Para medir los cambios en la CVRS y las utilidades asociadas a tales cambios se requieren dos elementos: un sistema clasificatorio de estados de salud y un modelo de valoración de las preferencias. El primer elemento es común a todas las medidas de CVRS existentes; todas ellas describen la CVRS mediante una combinación de dimensiones o atributos y niveles. Sin embargo, sólo las medidas basadas en preferencias (también llamadas “medidas de utilidad multiatributo”) contienen el segundo de los elementos enunciados. El modelo o algoritmo de valoración que incorporan medidas como el EQ-5D, el HUI3 o el instrumento que ha sido objeto de mayor atención en este documento, el SF-6D, aplicado a las descripciones de la CVRS de los pacientes, genera las correspondientes utilidades. Para estimar el algoritmo se precisa seleccionar un subconjunto de todos los estados de salud posibles que es capaz de describir el sistema clasificatorio, y someterlo a valoración directa por parte de una muestra amplia de la población general. El motivo principal que movió originariamente al desarrollo del SF-6D (Brazier et al., 1998) fue que, pese a la mayor riqueza descriptiva y sensibilidad al cambio del SF-36 frente al EQ-5D (Brazier, Jones y Kind, 1993), aquél no era aprovechable para la evaluación económica, puesto que no posibilita el cómputo de AVAC. Así surgió el SF-6D como un ‘puente’ entre el sistema clasificatorio SF-36 y los AVAC. Desde entonces se han multiplicado las aplicaciones del SF-6D (y su comparación con el EQ-5D), tanto en grupos de pacientes (Longworth y Bryan, 2003; Gerard et al., 2004; Lamers et al., 2006; Xie et al., 2007; Brazier et al., 2004; van Stel et al., 2006; Kontodimopoulos et al., 2009), como en población general (Petrou y Hockley, 2005; Bharmal y Thomas, 2006; Barton et al., 2008; Kontodimopoulos et al., 2009; Fryback et al., 2010). Asimismo, se han ido sucediendo las estimaciones disponibles del conjunto de utilidades o “tarifa” del SF-6D en distintos países. Hoy día, junto a la del Reino Unido (Brazier et al., 2002; Brazier y Cátedra de Economía de la Salud 2012/ 8 | 25 Utilidades SF-6D para España. Guía de uso Roberts, 2004; McCabe et al., 2006; Kharrubi et al., 2007) se han publicado (en papel u online) ya las de Hong Kong (Lam et al., 2008), Portugal (Ferreira et al., 2010), Japón (Brazier et al., 2009) y la de España (Abellán et al., 2012). Hay otras estimaciones realizadas, pendientes de publicación. El recuento completo de las tarifas SF-6D existentes puede consultarse en la web de la Universidad de Sheffield (http://www.shef.ac.uk/scharr/sections/heds/mvh/sf-6d), en el Reino Unido, creada por los investigadores pioneros del instrumento. Las abundantes comparaciones cruzadas entre el EQ-5D y el SF-6D han puesto de manifiesto un patrón habitual, consistente en que el EQ-5D tiende a generar mayores utilidades que el SF-6D entre aquellas personas con mejor salud, mientras que el SF-6D arroja utilidades superiores entre aquellos individuos con peor calidad de vida. Este “cross-over” entre las utilidades predichas por ambos instrumentos parece situarse en torno a un valor entre 0.7 y 0.75 (Barton et al., 2008; Kontodimopoulos et al., 2009), de modo que sujetos con una utilidad EQ-5D inferior (superior) a dicho valor recibirían una utilidad mayor (menor) con el SF-6D. Habida cuenta que los métodos de estimación del algoritmo son semejantes en los dos casos (Brazier et al., 2004), la explicación para la divergencia anterior se ha basado (Bryan y Longworth, 2005), bien en las diferencias existentes entre los dos sistemas descriptivos, bien en que el método de valoración directo empleado fue diferente en los dos estudios. En relación a lo primero, la evidencia disponible sugiere que aunque las descripciones proporcionadas por ambos instrumentos son consistentes (hay una estrecha correlación entre dimensiones y niveles semejantes), no obstante, parece que miden conceptos diferentes (Ferreira et al., 2008). Esto se manifiesta, por ejemplo, en el hecho de que el EQ-5D no incluye explícitamente las dimensiones “Vitalidad” y “Funcionamiento social”, que sí posee el SF-6D (Grieve, Girshchenko y Cairns, 2008). En este sentido, el hecho de que los estados de salud SF-6D (incluso los peores) sean percibidos por la mayoría de los entrevistados como preferibles a la muerte (Brazier et al., 2002), unido a que muchos de ellos describen su estado de salud haciendo uso de los niveles más bajos de varias de las dimensiones (Brazier et al., 2004), hace que se hable de un “efecto-suelo” o incapacidad por parte del sistema clasificatorio SF-6D para describir los estados de salud más graves. En contraposición, el EQ-5D adolecería de un “efecto-techo” o insensibilidad para describir los estados de salud más leves, manifestado por el hecho de que con este instrumento mucha gente describe su estado de salud como “perfecto” (Sturgis et al., 2001). Parece que la forma de subsanar estas deficiencias descriptivas (Brazier et al., 2004) pasa por añadir más niveles intermedios al EQ-5D o añadir más niveles inferiores al SF-6D. En esta línea cabe encuadrar el reciente alumbramiento del sistema EQ-5D-5L (Herdman et al., 2011), con dos niveles adicionales por dimensión con respecto al tradicional EQ-5D-3L, y el estudio de Cátedra de Economía de la Salud 2012/ 8 | 26 Utilidades SF-6D para España. Guía de uso factibilidad de un sistema SF-6D modificado (Ferreira et al., 2011), que incorpora niveles adicionales en las dimensiones “Funcionamiento físico” y “Limitaciones de rol”. Otra posible razón para la divergencia observada entre las utilidades del SF-6D y el EQ5D radica en el método de valoración empleado para medir directamente las preferencias de la población general. Esta hipótesis ha encontrado respaldo en algunos estudios previos (Longworth y Bryan, 2005; Tsuchiya et al., 2006; Fryback et al., 2010). El estudio realizado por Abellán et al. (2012) para estimar la tarifa española del SF-6D se inscribe en esta segunda corriente explicativa. Así, como se señaló en la sección 2.1., se empleó un método inédito en el ámbito de los estudios sobre el SF-6D para medir las preferencias de la población española. Esta técnica, llamada “lotería equivalente”, fue escogida porque teoría (Bleichrodt y Schmidt, 2002) y práctica (Pinto y Abellán, 2005) avalan a priori la conjetura de que producirá utilidades inferiores a las del procedimiento usual, conocido como “lotería estándar”. De hecho, una parte del estudio español consistió en comparar directamente ambos métodos para 5 estados de salud SF-6D. Las utilidades medias de estos estados obtenidas por la “lotería equivalente” fueron significativamente inferiores a las de la “lotería estándar”, confirmando así la hipótesis previa13. La principal consecuencia de lo anterior es que el algoritmo estimado para España rebaja claramente el valor mínimo (el “suelo”) de tarifas anteriores obtenidas en otras latitudes. Así, el mínimo para España es -0.357, mientras que para Reino Unido es 0.354, para Hong Kong 0.152 o para Japón 0.348. En consecuencia, cabe suponer que con la nueva tarifa española la divergencia entre las utilidades SF-6D y EQ-5D será menor, habida cuenta de que el rango de los dos instrumentos es ahora más semejante. Así, si tomamos la tarifa EQ-5D estimada para España (Badía et al. 2001), podemos comprobar que el valor correspondiente al peor estado posible es -0.654, con lo que el rango de las utilidades EQ-5D sería aproximadamente un 22% superior al de las nuevas utilidades SF6D (1,654 vs 1,357). Si esta misma comparación la hacemos ahora entre las tarifas del Reino Unido (Dolan, 1997; Brazier y Roberts, 2004), resulta que el rango del EQ-5D más que duplica el del SF-6D (1,594 vs 0,646). En el documento se ha explicado en detalle cómo puede aplicarse el nuevo algoritmo a las respuestas dadas por los pacientes al cuestionario SF-36. Este cuestionario es profusamente utilizado por clínicos y estudiosos, pero no sirve por sí sólo para medir resultados aptos para el análisis coste-efectividad. Esperamos que este manuscrito haya servido para mostrar cómo puede salvarse ese obstáculo. 13 El rango de variación de las utilidades medias obtenidas con la lotería equivalente fue de 0.599 a 0.832, mientras que con la lotería estándar abarcó desde 0.78 hasta 0.955. Todas las diferencias fueron significativas al 5%. Cátedra de Economía de la Salud 2012/ 8 | 27 Utilidades SF-6D para España. Guía de uso REFERENCIAS Abellán JM, Sánchez FI, Matínez JE, Méndez I. (2012). Lowering the ‘floor’ of the SF-6D scoring algorithm using a lottery equivalent method. Health Economics, 21(11), 12711285. (DOI: 10.1002/hec.1792). Alonso J, Antó JM, Moreno C. (1990). Spanish version of the Nottingham Health Profíle: translation and preliminary validity. American Journal of Public Health, 80, 704-708. Alonso J, Prieto L, Antó JM. (1995). La versión española del SF-36 Health Survey (Cuestionario de Salud SF-36): Un instrumento para la medida de los resultados clínicos. Med Clin; 104(20), 771-6. Badía, X. y Alonso, J. (1994). Adaptación de una medida de la disfunción relacionada con la enfermedad: la versión española del Sickness Impact Profile. Medicina Clínica; 102: 90-95 Badía X, Salamero M, Alonso J, Ollé A. La medida de salud. Guía de escalas de medición en español. Promociones y Publicaciones Universitarias. Barcelona, 1996. Badía X, Lizán L. Estudios de calidad de vida. En Martín A. y J. Cano (Eds.). Atención primaria: Conceptos, organización y práctica clínica. Madrid: Elsevier. 2003. Barton G, Sach T, Avery A, Jenkinson C, Doherty M, Whynes D, Muir K. (2008). A comparison of the performance of the EQ-5D and SF-6D for individuals aged ≥ 45 years. Health Economics; 17: 815-832. Bharmal, M., Thomas, J. 3rd. (2006). Comparing the EQ-5D and the SF-6D descriptive systems to assess their ceiling effects in the US general population. Value Health; 9(4): 262–271 Bleichrodt H, Schmidt, U. (2002). A context-dependent model of the gambling effect. Management Science; 48, 802-812. Brazier JE, Jones N, Kind P. (1993). Testing the validity of the Euroqol and comparing it with the SF-36 Health Questionnaire. Quality of Life Research; 2: 169-180 Brazier J, Usherwood T, Harper R, Thomas K. (1998). Deriving a preference-based single index from the UK SF-36 health survey. J Clin Epidemiol; 51: 1115-28. Cátedra de Economía de la Salud 2012/ 8 | 28 Utilidades SF-6D para España. Guía de uso Brazier J, Deverill M, Green C, Harper R, Booth A. (1999). A review of the use of health status measures in economic evaluation. Health Technol Assess.; 3 (9). Brazier J, Roberts J, Deverill M. (2002). The estimation of a preference-based measure of health from the SF-36. J Health Econ; 21: 271-92. Brazier J, Roberts J. (2004). The estimation of a preference-based measure of health from the SF-12. Med Care; 42: 851-9. Brazier J, Roberts J, Tsuchiya A, Busschbach J. (2004). A comparison of the EQ-5D and SF-6D across seven patients groups. Health Econ; 13: 873-84. Brazier J, Fukuhara S, Roberts J, Kharroubi S, Yamamoto Y, Ikeda S, Doherty J, Kurokawa K. (2009). Estimating a preference-based index form the Japanese SF-36. Journal of Clinical Epidemiology; 62: 1323-1331. Brooks R. (1996). EuroQol: the current state of play. Health Policy; 37(1):53–72. Bryan S, Longworth L. (2005). Measuring health-related utility: Why the disparity between EQ-5D and SF-6D? European Journal of Health Economics; 6: 253–260. Buxton MJ, Lacey LA, Feagan BG, Niecko T, Miller DW, Townsend RJ. (2007). Mapping from disease-specific measures to utility: An analysis of the relationships between the Inflammatory Bowel Disease Questionnaire and Crohn’s Disease Activity Index in Crohn’s disease and measures of utility. Value in Health; 10(3): 214-220. Cohen M, Jaffray J. (1988). Certainty effect versus probability distortion: an experimental analysis of decision making under risk. Journal of Experimental Psychology; 14: 554-560. Dolan P. (1997). Modelling valuations for EuroQol health states. Medical Care; 35: 10951108. De Bruin AF, Diederiks JPM, de Witte LP, Stevens FCJ, Philipsen H. (1994). The development of a short generic version of the Sickness Impact Profile. J Clin Epidemiol; 47: 407–18. Dolan P. “Modelling the relationship between description and valuation of health states”. En Murray C., Salomon J., Mathers C., López A. (eds). Summary Measures of Population Health: Concepts, Ethics, Measurement and Applications. Geneva, World Health Organization. 2002 Cátedra de Economía de la Salud 2012/ 8 | 29 Utilidades SF-6D para España. Guía de uso Drummond M, Sculpher M, Torrance G, O’Brien B, Stoddart G. Methods for the economic evaluation of health care programmes. Oxford: Oxford University Press, 2005. Feeny D, Furlong W, Torrance GW, Goldsmith CH, Zenglong Z, Depauw S, Denton M, Boyle M. (2002). Multi-attribute and single-attribute utility function for the Health Utility Index Mark 3 system. Med Care; 40: 113-28. Ferreira PL, Ferreira LN, Pereira LN. (2008). How consistent are health utility values? Quality of Life Research; 17:1031-1042. Ferreira LN, Ferreira PL, Pereira LN, Brazier J, Rowen D. (2010). A Portuguese Value Set for the SF-6D. Value in Health; 13(5): 624-630. Ferreira LN, Ferreira PL, Pereira LN, Rowen Donna. (2011). Reducing the Floor Effect in the SF-6D: A Feasibility Study. Applied Research in Quality of Life. Online first: DOI: 10.1007/s11482-011-9149-3. Fryback DG, Palta M, Cherepanov D, Bolt D, Kim J-S. (2010). Comparison of 5 healthrelated quality-of-life indexes using item response theory analysis. Medical Decision Making; 30: 5-15. Garratt AM, Schmidt L, MacKintosh A, Fitzpatrick R. (2002). Quality of life measurement: Bibliographic study of patient assessed health outcome measures. British Medical Journal; 324: 1417-21. Gerard K, Nicholson T, Mullee M, Mehta R, Roderick P. (2004). EQ-5D versus SF-6D in an older, chronically ill patient group. Appl Health Econ Health Policy; 3:91-102 Grieve R, Grishchenko M, Cairns, J. (2008). SF-6D versus EQ-5D: reasons for differences in utility scores and impact on reported cost-utility. Eur J Health Econ; 10 (1): 15-23. Guillemin F, Bombardier C, Beaton D. (1993). Cross-cultural adaptation of health-related quality of life measures: Literature review and proposed guidelines. J Clin Epidemiol; 12: 1417-32. Guyatt GH, Feeny DH, Patrick DL. (1993). Measuring Health-related Quality of Life. Ann Intern Med.; 118: 622-629. Hawthorne G, Richardson J, Osborne R, McNeil H. (1997).The assessment of quality of life (AQoL) instrument: construction, initial validation and utility scaling. (CHPE Working Paper no 76.) Monash University, Centre for Health Program Evaluation, Melbourne. Cátedra de Economía de la Salud 2012/ 8 | 30 Utilidades SF-6D para España. Guía de uso Herdman M, Gudex C, Lloyd A, Janssen MF, Kind P, Parkin D, Bonsel G, Badia X. (2011). Development and preliminary testing of the new five-level version of EQ-5D (EQ-5D-5L). Qual Life Res; 20(10): 1727–1736. Karnofsky D., Burchenal J. (1949) The clinical evaluation of chemotherapeutic agents in cancer. In: Macleod, C.M. (Ed.) Evaluation of Chemotherapeutic Agents. New York: Columbia University Press, pp 191-205. Kharroubi SA, Brazier J, Roberts J, O’Hagan A. (2007). Modelling SF-6D health state preference data using a nonparametric Bayesian method. J Health Econ; 26: 597-612. Kahneman D, Tversky A. (1979). Prospect theory: an analysis of decision under risk. Econometrica; 4: 263-291. Kontodimopoulos N, Pappa E, Papadopoulos AA, Tountas Y, Niakas D. (2009). Comparing SF-6D and EQ-5D utilities across groups differing in health status. Qual Life Res; 18: 87-97. Lam CL, Brazier J, McGhee SM. (2008). Valuation of the SF-6D health states is feasible, acceptable, reliable, and valid in a Chinese population. Value in Health; 11: 295–303. Lamers LM, Bouwmans CAM, van Straten A, Donker MCH, Hakkaart L. (2006). Comparison of EQ-5D and SF-6D utilities in mental health patients. Health Economics 15: 1229-1236. Lizán L, Reig A. (1999). Adaptación transcultural de una medida de calidad de vida relacionada con la salud: la versión española de las viñetas Coop-Wonca. Aten Primaria; 24: 75-82. Longworth L, Bryan S. (2003). An empirical comparison of EQ-5D and SF-6D in liver transplant patients. Health Economics; 12: 1061-1067. Marra CA, Woolcott JC, Kopec JA, Shojania K, Offer R, Brazier JE, Esdaile JM, Anis AH. (2005). A comparison of generic, indirect utility measures (the HUI2, HUI3, SF-6D, and the EQ-5D) and disease-specific instruments (the RAQoL and the HAQ) in rheumatoid arthritis. Social Science & Medicine; 60: 1571–1582. McCabe C, Brazier J, Gilks P, Tsuchiya A, Roberts J, O’Hagan A, Stevens K. (2006). Using rank data to estimate health state utility models. J Health Econ; 25: 418-31. Cátedra de Economía de la Salud 2012/ 8 | 31 Utilidades SF-6D para España. Guía de uso McCord M, de Neufville R. (1986). Lottery equivalents: Reduction of the certainty effect problem in utility assessment. Management Science 32: 56–60. Murray CJ, Lopez AD. (1997). Global mortality, disability, and the contribution of risk factors: Global Burden of Disease Study. Lancet; 349:1436-1442. National Institute for Clinical Excellence (NICE). (2008) Guide to the Methods of Technology Appraisal. Updated June 2008. NICE. [Disponible en http://www.nice.org.uk/ media/B52/A7/TAMethodsGuideUpdatedJune2008.pdf]. Patrick DL, Bush JW, Chen MM. (1973). Methods for measuring levels of well-being for a health status index. Health Services Research; 8: 228–45. Petrou S, Hockley C. (2005). An investigation into the empirical validity of the EQ-5D and SF-6D based on hypothetical preferences in a general population. Health Economics; 14: 1169-1189. Pinto JL, Abellán JM. (2005). Measuring the health of populations: the veil of ignorant approach. Health Economics; 14: 69 – 82 Riazi A. (2006). Patient-reported Outcome Measures in Multiple Sclerosis. The International MS Journal; 13: 92-99. Rosser R, Kind P. (1978). A scale of valuations of states of illness: is there a social consensus? International Journal of Epidemiology; 7: 347–358. Sánchez FI, Abellán, JM, Martínez JE. (2010). Métodos de evaluación económica para la toma de decisiones en el sector sanitario. En Cabo J (Dir.). Gestión Sanitaria Integral: Pública y Privada. Ediciones CEF, pp. 211-289 Sintonen H. (1994). The 15-D measure of HRQoL: reliability, validity and the sensitivity of its health state descriptive system. (CHPE Working Paper no 41.) Monash University, Melbourne. Stevens K, McCabe C, Brazier J, Roberts J. (2007). Multi-attribute utility function or statistical inference models: A comparison of health state valuations models using the HUI2 health state classification system. J Health Econom; 26: 992-1002. Sturgis P, Thomas R, Purdon S, Bridgwood A, Dodd T. Comparative review and assessment of key health state measures of the general population. Department of Health 2001, UK. Cátedra de Economía de la Salud 2012/ 8 | 32 Utilidades SF-6D para España. Guía de uso Torrance GW. Multi-attribute utility theory as a method of measuring social preferences for health states in long-term care. En Kane RL, Kane RA (eds.): Values in long-term care. Lexington Books, DC Health, Lexington, MA. 1982 Torrance GW. (1986). Measurement of health-state utilities for economic appraisal: A review. Journal of Health Economics; 5: 1-30. Torrance GW, Feeny D, Furlong W. (2001). Visual analog scales: do the have a role in the measurement of preferences for health states? Medical Decision Making; 21(4): 329334. Torrance GW, Feeny D, Furlong W, Barr R, Zhang Y, Wang Q. (1996). Multiattribute preference functions for a comprehensive health status classification system: health utilities index mark II. Med Care; 34:702–2. Tsuchiya A, Brazier J, Roberts J. (2006). Comparison of valuation methods used to generate the EQ-5D and the SF-6D value sets. Journal of Health Economics; 25: 334– 346. van Stel HF, Buskens E. (2006). Comparison of the SF-6D and the EQ-5D in patients with coronary heart disease. Health and Quality of Life Outcomes; 4: 20. Vilagut G, Ferrer M, Rajmil L, Rebollo P, Permanyer-Miralda G, Quintana JM, et al. (2005). El cuestionario de salud SF-36 español: una década de experiencia y nuevos desarrollos. Gac Sanit; 19: 135-50. Walters SJ, Brazier JE. (2003). What is the relationship between the minimally important difference and health state utility values? The case of the SF-6D. Health and Quality of Life Outcomes; 1: 4. Walters SJ, Brazier JE. (2005). Comparison of the minimally important difference for two health state utility measures: EQ-5D and SF-6D. Quality of Life Research 14: 1523–1532. Ware JE, Sherbourne CD. (1992). The MOS 36-Item Short-Form Health Survey 1: conceptual framework and item selection. Med Care; 30: 473-83. Ware JE, Snow KK, Kosinski M, Gandek B. The SF36 Health Survey Manual and Interpretation Guide. Boston, Massachusetts: The Health Institute, New England Medical Center. 1993. Cátedra de Economía de la Salud 2012/ 8 | 33 Utilidades SF-6D para España. Guía de uso Ware JE, Kosinski M, Keller SD. SF-36 Physical and Mental Health Summary Scales: A User's Manual. Boston, Massachusetts: The Health Institute, New England Medical Center. 1994. Ware JE Jr, Kosinski M, Keller SD. (1996). A 12-Item Short-Form Health Survey: construction of scales and preliminary tests of reliability and validity. Med Care; 34: 22033. Ware JE Jr, Kosinski M, Dewey JE. How to score version 2 of the SF-36 Health Survey. Lincoln RI: Quality Metric Incorporated. 2000. Ware JE Jr, Kosinski M, Turner-Bowker DM, Gandek B. How to Score Version 2 of the SF12 Health Survey (With a Supplement Documenting Version 1). Lincoln, RI: Quality Metric Incorporated. 2002. Xie F, Li SC, Luo N, Lo NN, Yeo SJ, Yang KY, Fong KY, Thumboo J. (2007). Comparison of the EuroQol and short form 6D in Singapore multiethnic Asian knee osteoarthritis patients scheduled for total knee replacement. Arthritis Rheum; 15: 57(6):1043–9. Cátedra de Economía de la Salud 2012/ 8 | 34 Utilidades SF-6D para España. Guía de uso Cátedra de Economía de la Salud 2012/ 8 | 35