VALIDACIÓN DE MÉTODOS ANALÍTICOS CUALITATIVOS Itziar Ruisánchez, Esther Trullols y F. Xavier Rius Grupo de Quimiometría y Cualimetría. Departamento de Química Analítica y Química Orgànica. Universitat Rovira i Virgili. Pl. Imperial Tàrraco, 1, 43005 Tarragona. Es bi en conocida la necesi dad de vali dar los mé todos de análi si s y, e n co ncreto , e n este art íc ulo se aborda la vali daci ón de los métodos de análi si s cualita ti vos . Si bi en el concepto de vali daci ón no depende de que ésta sea cua nti tati va o c uali tati va, en la prácti ca los parámetros de cali dad que caracte ri za n a los mé todos cuali tati vos so n disti ntos. As í, además de descri bi r las caracter ísti cas de los métodos cua li tati vos, se defi nen los pri nci pales parámetros de calidad como son: falsos posi ti vos y nega ti vos , sensi bi li dad, especifi ci dad, regi ón de i ncerti dumbre, l ími te de corte, etc. F i nalmente , se descri ben muy bre veme nte c uatro vías para estab lecer dic hos parámetros . Introducción a los sistemas de medida cualitativos Estos En los laboratorios de análisis es cada habitualmente sistemas de screening o vez más frecuente la introducción de de cribado. Desde el punto de vista sistemas de medida de respuesta rápida práctico, que generan respuestas más de tipo desarrollo de estos sistemas radica en cualitativo que cuantitativo. La repuesta que se utilizan como una etapa previa de cualitativa suele ser binaria del tipo cribado de las muestras (figura 1), de SI/NO y puede responder a distintas manera que se evita así que todas las situaciones: presencia/ausencia de un muestras sean sometidas a todo el determinado analito en una muestra, proceso de medida químico. Únicamente presencia/ausencia por encima de un seguirán determinado cuantitativo nivel (normalmente de sistemas el el se principal interés proceso aquellas denominan de en el análisis muestras cuya concentración) que habitualmente viene respuesta sea un ‘SI’ (positivo), aquellas fijado por la legislación o el cliente, etc. en las que se detecte la presencia de un 1 analito o se detecte que está por encima realiza en base a los sentidos humanos del nivel permitido. como pueden ser la vista, olfato, etc. El Hay analito por encima de un determinado valor, XSL? más utilizado es la vista y la mayoría de >X SL < XSL sistemas se basan en la aparición o no MUESTRAS SISTEMA DE SCREENING SI de un determinado color como resultado ANÁLISIS CUANTITATIVO de una reacción química, bioquímica o NO inmunológica. NO SE ANALIZA En este tipo de sistemas, la respuesta Figura 1. Sistemas de cribado (screening). binaria ‘SI/NO’ se obtiene de forma Tipos de sistemas de directa, sin ningún tratamiento de los medida cualitativos. datos. Generalmente , la presencia de un Hacer clasificaciones siempre resulta analito se determina por comparación difícil ya que depende de los criterios respecto a un blanco (muestra sin el que se utilicen. Si atendemos al tipo de analito), por ejemplo si se obtiene un sistema utilizado para la obtención de la determinado color hay analito, mientras respuesta que si no se obtiene (color del blanco) no (detección) podemos lo hay. diferenciar dos grandes grupos: análisis cualitativo clásico o sensorial y análisis Dentro de este grupo de sistemas cualitativo instrumental (Tabla 1). cualitativos denominados se encuentran ‘tests kits’. los Son ü ü Detección sensorial p Color: cambio, aparición, etc. p Olor p ELISA dispositivos comerciales diseñados para una aplicación concreta que contienen todos los reactivos necesarios y en ü ü Detección instrumental instrumental p UV-Vis, Fluorescencia, Potenciometría, etc. p Sensores : químicos, bio- químicos, etc. p ELISA algunos casos incluyen un sistema instrumental sencillo necesario para la obtención de la respuesta. Tabla 1. Tipos de sistemas de utilizados en el cribado El otro gran grupo es el que hemos En el análisis cualitativo clásico la denominado detección es de tipo sensorial y se 2 análisis cualitativo instrumental. En este caso, la detección que los test kits, la detección puede ser se realiza en base a una medida tanto sensorial como instrumental. instrumental (colorimetría, fluorescencia, voltamperometría, etc.). La presencia o Validación de los sistemas de medida no de un determinado analito depende cualitativos del nivel al que interese detectarlo. Bien Al igual que los métodos de medida puede ser al nivel del límite de detección cuantitativos, los métodos cualitativos o a un nivel superior que generalmente también deben validarse. La validación corresponde al fijado por la legislación. de un método no depende de que éste sea cuantitativo o cualitativo, ya que En este tipo de sistemas de medida, la validar respuesta instrumental que se obtiene documentar su validez, su adecuación a debe transformarse en respuesta binaria unos del tipo SI/NO y por lo tanto implica un establecidos. Esta es la idea que queda tratamiento de datos. Primero hay que recogida en la definición proporcionada establecer la respuesta instrumental, por por la norma ISO 8402 (ver cuadro 1) y ejemplo un valor de absorbancia para la que implica el concepto de adecuación a concentración correspondiente al valor al la finalidad o propósito perseguido, ‘fit- que for-purpose’. se quiere concentración cribar establecido (nivel de por la consiste en requisitos verificar y previamente legislación) y debe compararse con la Validación respuesta instrumental obtenida para Validación es la confirmación mediante la examen cada muestra. Si es superior, hay analito y la provisión de una evidencia objetiva de que se han satisfecho unos requisitos particulares para un por lo que la respuesta binaria es SI, y si uso pretendido y específico. el valor es inferior la respuesta binaria es NO. Cuadro 1, Definición de validación según la norma ISO 8402 Otro grupo de sistemas cualitativos que podemos considerar aparte son los que Por utilizan el método ELISA. Están basados concreto, la validación implica como en una reacción inmunológica y al igual paso previo la definición de los requisitos 3 lo tanto, ante cada problema analíticos, o parámetros de calidad (en segundo es la probabilidad de error inglés, performance characteristics), que asociada a la decisión tomada. se precisan y, una vez definidos, el siguiente paso consiste Parámetros de calidad en determinarlos. Los sistemas de screening tienen unas connotaciones especiales que conllevan La primera gran encontramos entre diferencia el que una cuidadosa adaptación de los análisis parámetros de calidad que están bien cuantitativo y el análisis cualitativo es la definidos y estudiados en los procesos forma de expresar el resultado (figura 2). de medida con finalidad cuantitativa, Es bien conocido que la expresión de un bien sean de tipo físico como químico. resultado cuantitativo se caracteriza por En la tabla 2 se muestran los parámetros dos valores numéricos, el primero es la más relevantes desde el punto de vista estimación del valor verdadero y el matemático-estadístico, segundo corresponde a la incertidumbre cuantitativos como cualitativos. Algunos que está asociada a la dispersión del de los parámetros de tipo cualitativo, han resultado o intervalo dentro del cual sido definidos recientemente por la tenemos cierta fiabilidad de que se AOAC [Feldsine 2000], mientras que en encuentra el valor verdadero. otros se está actualmente trabajando en tanto su definición. A NÁ LISI S CUA NTI TA TI V O A NÁ LI SI S CUA LI TA TIVO / SCR EE NI NG Cuantitativo Cuantitativo ü Sensibilidad, Especificidad VA LOR E STI MA DO ± I NCER TI D UMB R E ü Selectividad: Interferencias SI / NO CO N P ROBA BIDA D DE E RO R ü Probabilidad de falso positivo y negativo ü Límite de detección ü Sensibilidad, Especificidad ü Rango y Linealidad ü Selectividad: Interferencias ü Incertidumbre ü Límite de detección ü Exactitud: veracidad, precisión ü Robustez Figura 2, Expresión del resultado analítico. Binario/Cualitativo Binario/Cualitativo ü… ü Límite de corte (cut -off ) ü Incertidumbre o región de error ü Robustez ü …. Tabla 2. Parámetros de calidad. El resultado de un análisis cualitativo también se caracteriza por dos valores, el primero es binario ‘SI/NO’, y el 4 Cabe resaltar que algunos son tomamos como referencia la presencia específicos del análisis cualitativo, como de un contaminante, la legislación fija el son la proporción de falsos positivos y contenido negativos y el límite de corte o cut-off. contenido máximo de Aflatoxina B1 en Otros, como especificidad, sensibilidad y fruto seco es de 2 ng/g [EC No límite de detección, pueden tener un 257/2002]. máximo, por ejemplo el significado ligeramente diferente aunque mantienen el mismo nombre que en el Centrémonos en los cuantitativo. Finalmente, decir que la cualitativos sensoriales, concretamente mayoría de los parámetros cualitativos, en los test kit que hoy en día son al ser de naturaleza binaria SI/NO, se ampliamente expresan en términos probabilísticos. concreto sería aquel en que cuando la utilizados. métodos Un caso muestra contiene menos de 2 ng/g de De forma genérica podríamos decir que Aflatoxina B 1 se obtiene una repuesta la validación de cualquier método de negativa (aparece color), mientras que si análisis implica el establecimiento de los la concentración es superior la respuesta parámetros de calidad considerados es positiva (no aparece color) [Aflacard básicos: B1 2002]. trazabilidad, representatividad, parámetros de etc. calidad exactitud, De los propios y En este tipo de test kits lo ideal es que el característicos del análisis cualitativo límite real al que criba el test kit, podemos destacar aquellos que hacen denominado límite de corte o cut-off, referencia o están relacionados con coincida con el límite legislativo, pero así niveles de concentración; así podemos como el legislativo es un límite teórico, el distinguir el límite de detección, el límite de corte es un límite experimental (figura de corte o cut-off y el límite legislativo. 3). La situación habitual que nos solemos Respuesta Negativa encontrar es que la legislación indica el Respuesta Positiva c= 2ng/g contenido máximo o mínimo de un Concentración Figura 3, Res puesta teórica de un test kit determinado analito en una muestra. Si 5 Pero desde el punto vista este caso concreto, interesa que la zona experimental hay que tener en cuenta 2) esté por debajo del límite legislativo que si representamos la respuesta del kit para asegurar la ausencia de falsos en función de la concentración se negativos y además que esté lo más pueden distinguir 3 zonas (figura 4): a) próximo posible al límite legislativo, para zona donde se obtiene siempre una reducir el número de falsos positivos, respuesta (figura 5). negativa de (correctos negativos), b) zona donde para una misma concentración se pueden obtener tanto respuestas positivas Región de no fiabilidad o error Zona de correctos negativos como negativas, corresponde a la zona de falsos positivos y negativos, y c) zona Zona de Zona de correctos falsos positivo positivos s Límite de corte = c’ c= 2ng/g Concentración Fig. 5, Límite de corte en el caso de un contaminante donde se obtiene siempre una respuesta positiva (correctos positivos). Como queda reflejado en las figuras, alrededor del límite de corte se sitúa una zona o región de error o falta de Región de no fiabilidad o error Zona de correctos negativos Zona de falsos positivo s Zona de falsos negativo s c= 2ng/g fiabilidad (que en la literatura inglesa se Zona de correctos positivos denomina, Concentración unreliability). corresponde Figura 4, Respuesta experimental de un test kit al Esta zona intervalo de concentraciones donde se obtienen los En el ejemplo contaminante concreto como puede de un ser la falsos positivos y negativos, por lo que está definida por un valor superior e inferior de concentración de analito en Aflatoxina B1, está claro que interesa no muestra. Estos dos tipos de errores son dar ningún falso negativo (decir que no dos hay analito cuando en realidad si lo hay), caracterización mientras que sí podemos aceptar falsos toda muestra que de una respuesta analiza un en la sistema de 1997]: implicaría un riesgo para la salud ya que se de básicos screening y se definen como [Massart positivos puesto que en ningún caso positiva parámetros Falsos posteriormente negativos. Corresponden a aquellas muestras que contienen uno o mediante el método confirmatorio. En 6 más analitos por encima del valor límite La sensibilidad se define como la permitido (límite legislativo) y que al capacidad o habilidad del sistema de aplicar el test de screening dan una screening de detectar muestras positivas respuesta negativa. Es decir, como cuando realmente son positivas. De resultado del test de screening se forma similar, la especificidad se define concluye que la muestra no contiene capacidad o habilidad del sistema de analito por encima del nivel máximo screening de fijado negativas cuando cuando en realidad sí que contiene. Falsos detectar muestras realmente son negativas. positivos. Corresponden a Finalmente, al igual que en los sistemas aquellas muestra s que realmente no de contienen analito por encima del nivel comprobarse que el método que se máximo permitido y que sin embargo el utiliza para cribar tenga un límite de test de screening indica que están por detección inferior o igual al límite de encima de dicho nivel. corte. Hay dos parámetros que medida cuantitativos, debe Métodos para caracterizar un sistema están relacionados con los límites inferior y de screening superior de concentración que definen la Se han desarrollado varios métodos que zona la permiten caracterizar un sistema de sensibilidad y la especificidad. Hay que screening. Cada uno de ellos tiene resaltar que, como ya se ha comentado distinto grado de adaptación a las anteriormente, ambos se expresan como diferentes situaciones y problemáticas probabilidades. que pueden encontrarse, atendiendo al de no fiabilidad La que son sensibilidad está relacionada con el valor superior de la tipo de medida o resultado obtenido. región de no fiabilidad, mientras que la especificidad lo está con el valor inferior Dos de ellos se fundamentan en el de dicha región. concepto de probabilidad y en dicho sentido asocian una probabilidad al resultado de la medida: las tablas de 7 contingencia y el teorema de Bayes [McFall 1999]. Un tercer método se basa MUESTRA S Situación real (método cuantitativo) en el establecimiento de las curvas funcionamiento [EURACHEM 1999], y finalmente, se describe un método basado en Igual o superior Inferior Total tp fp tp+fp Negativo fn tn fn+tn Total tp+fn fp+tn N Positivo screening de Resultado características la aplicación de los tests de hipótesis [Pulido 2002]. Este último es similar al Tabla 3, Tabla de contingencia con 2 categorías. que se utiliza para el establecimiento de Fp: falsos positivos, fn: falsos negativos, tp: total los parámetros de calidad en el análisis positivos, tn: total negativos, N: número total de ensayos realizados cuantitativo. Una de las ventajas más importantes es A continuación presentamos los rasgos su fácil aplicación a múltiples tipos de generales de cada una de los métodos bio-ensayos, campo en el que aparecen sin pretender desarrollarlos, sino dar una la mayoría de las aplicaciones [Neil idea general de cuando sería más 1975, Hawass 1997]. adecuado adoptar cada una de ellos. Cabe resaltar que estos parámetros dan Tablas de Contingencia Las más diferencian sencillas las son las que muestras en dos una medida global de la capacidad del método de screening. Esto significa que se supone que la muestra problema a categorías, positivo/negativo según el examinar método de screening, y establece una tabla de comparación respecto se comportará estadísticamente de forma semejante a al las ya analizadas, con lo cual no se resultado obtenido mediante un método calcula una probabilidad de error para de referencia o confirmatorio (tabla 3). cada muestra en particular. A partir de la tabla, se calculan los cuatro Otro de los grandes inconvenientes es parámetros básicos, definidos en la que la capacidad de la tabla depende del sección anterior: falsos positivos, falsos número de muestras analizadas y el negativos, sensibilidad y especificidad. diseño 8 experimental utilizado para elaborar la tabla, y que para el cálculo de Consiste en representar la probabilidad los parámetros de calidad mencionados, de todas las muestras deben analizarse por distintos niveles de concentración. Esta los dos métodos, el de cribado y el representación confirmatorio. posición y amplitud de la curva es obtener resultados característica Teorema de Bayes es positivos sigmoidal, de cada y a la sistema de screening (figura 6). El teorema de Bayes se basa en la teoría de probabilidades por lo que, desde el punto de vista analítico, la Región de Incertidumbre Sensibilidad=P(X) =1-FN=100-β 100 terminología utilizada es compleja y 100 - β presenta la dificultad del cálculo de las distintas probabilidades intermedias. En N(x ) 70 probability probabilidad 90 80 60 P(X) 50 40 30 P(x) 20 10 concreto se calcula la probabilidad de α 0 1,0 1,2 1,4 1,6 1,8 2,0 AFB1 concentration (ppb) Especificidad= N(X) =1-FP= α dar como válido (positivo o negativo) un 2,2 2,4 Cut -off Límite de detección resultado cuando en realidad es válido, Figura 6, Curva característica de funcionamiento. P(a/p). Esta probabilidad se denomina condicional. El principal inconveniente de este Cabe destacar que una buena estima de método, al igual que se ha mencionado la incertidumbre o probabilidad de error en el método de Bayes, es la elevada mediante este procedimiento implica un carga experimental ya que hay que número elevado de muestras. Si se realizar un número elevado de análisis a compara con las tablas de contingencia, distintos niveles de concentración. el teorema de Bayes sí permite una estima individual (para cada muestra Como ventaja, tal y como se refleja en la analizada) de la incertidumbre asociada figura 6, resaltar que además de los o probabilidad de dar un resultado cuatro erróneo. positivos, falsos negativos, sensibilidad y parámetros especificidad), información Curvas características 9 se básicos obtiene adicional sobre (falsos mucha las características del método de screening: falsos positivos) es mayoritaria-mente el límite de corte, límite de detección, conocida y utilizada en los laboratorios región de incertidumbre, etc. de análisis, no ocurre lo mismo con la probabilidad β (probabilidad de cometer Aplicación de los tests de hipótesis falsos negativos). En este caso, se establece el valor de respuesta de Además, es un método rápido y sencillo, concentración al que se quiere cribar fácilmente automatizable, que permite la (normalmente con un patrón) y para asignación decidir si una muestra problema es probabilidad de equivocarnos utilizando positiva o negativa, se compara el valor como técnica de screening una técnica de respuesta instrumental de la muestra instrumental. Como principal desventaja problema resaltar que no es directamente aplicable establecido instrumental con el (del valor al nivel previamente patrón). de una incertidumbre o Esta cuando la técnica de screening aplicada comparación se realiza mediante tests es un kit no instrumental o se basa en de hipótesis [Pulido 2002]. una observación visual no cuantificable por parte del analista. Como ventajas cabe resaltar la familiaridad que desde un punto de vista analítico se tiene de trabajar con los tests de hipótesis. Si bien la probabilidad α de error (probabilidad de comete r Referencias bibliográficas P. Feldsine, C. Abeyta, W. Andrews. AOAC International Method Committee. Guidelines for Validation of Qualitative and Quantitative Microbiological Official Methods of Analysis. Draft, November 2000. URL: http://aoac.org/vmeth/MicrobiologyGuidelines112700.htm Commission Regulation (EC) No 257/2002. Official Journal of the European Community, 12.2.2002, No. L 041, pp12-15. 10 Aflacard B1 Product Overview. R-Biopharm Rhone Ltd , 2002. www.rhone-diagnostics.co.uk D.L. Massart, B.G.M. Vandeginste, L.M.C. Buydens, S. de Jong, P.J. Lewi, J. Smeyers-Verbeke. Handbook of Chemometrics and Qualimetrics: Part A. Elsevier, Amsterdam, 1997. R.M. McFall, T.A. Treat. Annual Reviews Psychology; 50 (1999) 215-241. EURACHEM. Quantifying Uncertainty in Analytical Measurement, Draft: EURACHEM Workshop, 2nd edition, Helsinki, 1999. A. Pulido, I. Ruisánchez, R. Boqué, F.X. Rius. Analytica Chimica Acta, 455 (2002) 267-275. B.J. Neil, E. Keeler, S. J. Adelstein. The New England Journal of Medicine, 293 (1975) 211-215. N. E. Hawass. The British Journal of Radiology, 70 (1997) 360-366. Los autores agradecen todos los comentarios relacionados con los contenidos de este artículo. Pueden dirigirse, mediante mensaje electrónico, a la dirección: quimio@quimica.urv.es. Una versión en soporte electrónico de este artículo e información adicional puede encontrarse en http://www.quimica.urv.es/quimio 11