Química Analítica (9123) 1 Errores y tratamiento estadístico de datos TRATAMIENTO DE LOS RESULTADOS ANALITICOS A- SIGNIFICADO DE LA MEDICION DE UNA MAGNITUD Medir una magnitud física es asociarle a la misma un valor dimensionado en relación a la unidad que arbitrariamente se ha definido para medirla. Así, medir una distancia significa establecer el número de veces que la unidad de longitud (cm, m, pulgada, etc.) está contenida en dicha distancia. Es imposible realizar una medición de forma tal que los resultados estén totalmente libres de errores o incertezas. La tarea principal es tratar de mantener dichas incertezas dentro de un nivel tolerable y estimar los errores cometidos de la forma más precisa posible. Se debe tener en cuenta siempre que los resultados expresados sín especificar qué grado de incerteza los afecta son generalmente inútiles. Existe una relación directa entre el tiempo invertido en realizar una medición y la precisión de la misma. Así, si se desea hacer una medición muy precisa se deberá invertir mas tiempo que si se realiza la misma determinación con una precisión aceptable. El simple hecho de agregar una cifra decimal cierta a un resultado puede convertirse en un proceso que lleve horas, días, o incluso semanas de trabajo. De esta manera, se plantea una situación de compromiso entre el tiempo a invertir y la precisión con que se desea expresar los resultados. Al planificar los experimentos a realizar se debe tener en cuenta siempre que es inútil invertir tiempo y esfuerzo en generar resultados que sean mas precisos que lo necesario. 2 Química Analítica (9123) Errores y tratamiento estadístico de datos B- EXACTITUD vs. PRECISION Los conceptos de precisión y exactitud pueden ser mejor entendidos mediante el uso de la siguiente figura: z z z z z z z z zz z zz z z z z z z z z z z z zz Precisión baja Precisión baja Precisión alta Precisión alta Exactitud baja Exactitud alta Exactitud baja Exactitud alta La exactitud de una medición indica cuán cerca esta dicha medición del verdadero valor y normalmente se expresa mediante el error. La exactitud mide la concordancia entre el valor experimental obtenido y el verdadero valor de la magnitud determinada . La precisión mide la concordancia entre varios resultados obtenidos realizando iguales observaciones. La precisión se puede determinar haciendo varias mediciones. En contraste, la exactitud no puede determinarse nunca exactamente porque el verdadero valor de la cantidad medida nunca es conocido exactamente. C- TIPOS DE ERRORES EN LAS MEDICIONES EXPERIMENTALES ERRORES DETERMINADOS Los errores determinados tienen un origen definido que normalmente puede ser identificado. Este tipo de error se manifiesta de forma tal que los resultados obtenidos son siempre o altos o bajos. Dada esta naturaleza unidireccional, a los errores determinados se los denomina también errores sistemáticos. ORÍGEN DE LOS ERRORES DETERMINADOS Hay tres tipos de errores determinados: I- instrumentales, II- del método, y III- personales. Química Analítica (9123) 3 Errores y tratamiento estadístico de datos I. Errores instrumentales. Todos los instrumentos de medición son fuentes de errores determinados. Por ejemplo, las buretas, las pipetas y los matraces aforados pueden tener pequeñas diferencias respecto de los volúmenes indicados en sus graduaciones. II. Errores del método. Estos son generalmente introducidos por el comportamiento físico ó químico no ideal de los reactivos o reacciones en los cuales se basa el método. Por ejemplo, pueden ser fuentes de errores deteminados del método la lentitud de las reacciones químicas involucradas, las inestabilidad de las especies o la existencia de reacciones laterales. III. Errores personales. Este tipo de error determinado es a menudo introducido debido al hecho de que muchas mediciones requieren juicios personales. Por ejemplo, cuando se debe estimar la posición de una aguja entre dos divisiones, el color en el punto final de una titulación, o el nivel del líquido con respecto a las graduaciones en una pipeta o en una bureta. Una fuente universal de errores personales es la tendencia natural que cada persona tiene para estimar una lectura de forma tal de aumentar la precisión del conjunto. DETECCIÓN DE LOS ERRORES DETERMINADOS PERSONALES E INSTRUMENTALES Tanto los errores determinados personales como los instrumentales pueden ser relativamente fácil de detectar y corregir. En el caso de los errores instrumentales, éstos pueden ser detectados y corregidos mediante la calibración periódica de los equipos. Los errores personales pueden ser minimizados poniendo especial cuidado durante el manipuleo del instrumental y reactivos. DETECCIÓN DE LOS ERRORES DETERMINADOS DEL MÉTODO Este tipo de errores son difíciles de detectar. Sin embargo, dicha tarea puede ser llevada a cabo mediante la realización de uno o más de los siguientes pasos: • Análisis de muestras patrón • Utilización de un segundo método de análisis (análisis independiente) • Determinaciones en blanco, es decir, la duplicación completa del análisis, pero sin el agregado de la sustancia a analizar • Variar el tamaño de la muestra ERRORES INDETERMINADOS También son llamados errores aleatorios. Se los encuentra normalmente cuando un sistema de medición es utilizado en su escala de máxima sensibilidad. Ellos son causados por variables incontrolables que son parte inevitable de cada medición física o química. El efecto acumulado de los errores indeterminados es causar que los resultados se distribuyan en forma aleatoria alrededor del valor medio. 4 Química Analítica (9123) Errores y tratamiento estadístico de datos -D- ERROR RELATIVO Y ERROR ABSOLUTO Tal como lo dijimos anteriormente, todo proceso de medición lleva involucrado un error en la magnitud determinada. Si llamamos Xv al valor verdadero y Xi al valor experimental determinado en la i-ésima medición, el error cometido en ella será: E i = X v − xi (1) La magnitud de Ei puede ser grande o pequeña depende de la experiencia de la persona que realiza el análisis, calidad del instrumental usado etc.. El analista buscará que dicho error sea lo mas pequeño posible y tener un conocimiento preciso de su magnitud. El error absoluto quedó definido por la ecuación (1) y su valor poco dice respecto de la exactitud con la que se realizó una medida. Por ejemplo, si se dice que el error cometido en una pesada es de 0,01 g, a priori no podemos decidir si dicha operación fue buena o mala. Si la masa determinada era de 1 Kg. habrá sido una muy buena pesada en cambio si la masa era de 0,0365 g habrá sido una mala operación. Esto nos lleva a pensar en la necesidad de definir una relación que vincule el error absoluto cometido con el verdadero valor que se busca determinar. El error relativo nos dá este vínculo: Eri = Xv − xi Xv (2) este valor (adimensional), nos da una idea real de cuan buena fue una medida y, para mejorar su interpretación se define el error relativo porcentual. Eri = X v − xi × 100 Xv (3) E- VALOR PROMEDIO En todas las definiciones anteriores se ha usado el término Xv para denotar el verdadero valor, sin embargo no se ha dicho nada de como conocer el valor Xv. Dado que, como dijimos al comienzo, toda medida involucra un error, el verdadero valor es una cantidad que nunca se conoce. Experimentalmente se pueden determinar valores muy próximos al verdadero pero nunca se conocerá este exactamente. 5 Química Analítica (9123) Errores y tratamiento estadístico de datos En lugar del verdadero valor se usa el valor promedio X o valor más probable, el cual hace mínimas las desviaciones individuales Ei. Este hecho puede ser demostrado facilmente de la siguiente manera. Dado que la suma de los errores absolutos puede ser cero, ya que los errores positivos se compensan con los negativos (a medida que crece el número total de mediciones, la suma ∑(X-xi) se aproxima mas a cero), se toma el cuadrado de la desviación absoluta Ei2, consiguiéndose solo sumandos positivos E2i = (X− xi )2 (4) El valor que tomaremos como valor promedio será aquel que haga mínima la suma ∑ Ei = ∑ ( X − xi ) 2 2 i (5) i lo que nos asegura que cada sumando (4) también será mínimo. El valor más probable será aquel que verifique que ∂ ∑ E i2 =0 i ∂X por tanto ∂ ∑ ( X − xi ) 2 i ∂X o sea = (6) ∂ ∂X ∑(X 2 − 2 Xx i + x i2 ) = 0 (7) i 2 XN − 2 ∑ xi = 0 (8) i por lo tanto: ∑ X = xi i N (9) la que es la conocida expresión del valor promedio para N determinaciones. A partir de lo dicho en los párrafos anteriores, la expresión de los errores absoluto y relativo quedarán ahora definidos por: Ei = X−xi y Eri = respectivamente. X − xi X (10) (11) 6 Química Analítica (9123) Errores y tratamiento estadístico de datos F- LA CURVA NORMAL DE ERROR (Distribución de Gauss) La aplicación de la estadística al problema de errores indeterminados se basa fundamentalmente en dos suposiciones: • Existe la misma probabilidad de que se registren desviaciones negativas o positivas respecto del valor medio • Las desviaciones respecto del valor medio tienden a ser pequeñas Estas condiciones se verifican, generalmente, cuando el número de mediciones que se realizan es muy grande. Y Cuando se grafica la frecuencia relativa de una desviación (el número de veces que se produjo una dada desviación sobre el total de desviaciones observadas) en función del valor de dicha desviación, se obtiene la curva normal de error, la cual tiene la forma: x-µ Curva Gaussiana de error Cuando el número de mediciones tiende a infinito, la curva normal de error puede ser descripta por la ecuación: y = en esta ecuación e − ( x i − µ ) 2 / 2σ σ 2 2π xi es el valor de una medida individual, µ es la media de la población infinita (valor medio calculado a partir de un número grande de mediciones). De esta manera, el valor (xi -µ) es la desviación respecto del valor medio que tiene una medida individual, e y es la frecuencia relativa con la cual se dá una dada desviación. El ancho de la curva normal de error está dado por σ, el cual es el valor de (xi - µ) al cual se presenta el punto de inflexión. Química Analítica (9123) 7 Errores y tratamiento estadístico de datos La inspección de la ecuación anterior ha mostrado que existe un único valor de σ para cada curva de distribución normal. Entonces se puede hacer una relación entre una determinada desviación y la probabilidad de que dicha desviación pueda ocurrir. Por ejemplo, se puede demostrar que: el 68,3% de los valores de las desviaciones están en el rango −σ a +σ ó que el 68,3% de todos los valores de xi de una población infinita caen dentro de los límites de µ ± σ, el 95,5% está en el rango −2σ a +2σ para las desviaciones y µ ± 2σ para los valores xi.. El valor de σ puede ser calculado mediante la ecuacion: σ= ∑ (x i − µ) 2 i N cuando el número de determinaciones es grande, o mediante la ecuación: s= ∑ (x i − X) 2 i N −1 cuando el número de determinaciones es pequeño (caso normal en las determinaciones analíticas). AYUDA ESTADISTICA PARA LA PRUEBA DE HIPOTESIS Los resultados experimentales raramente coinciden con los predichos teóricamente. Por lo tanto, una de las tareas del científico es probar si dicha desviación es debida al efecto de los errores indeterminados. Las pruebas estadísticas generalmente usadas para dilucidar dichas cuestiones hacen uso de la hipótesis nula. Esta hipótesis supone que las cantidades que se comparan son, efectivamente las mismas, es decir que las diferencias que presentan se deben al efecto de errores indeterminados. Comparación de una media experimental con el verdadero valor Uno de los métodos mas comunes para probar la presencia de errores determinados es realizar el análisis de sustancias cuya composición es conocida con exactitud. Química Analítica (9123) 8 Errores y tratamiento estadístico de datos Es muy probable que el promedio experimental (X) difiera del verdadero valor (µ). Entonces, se debe evaluar si dicha diferencia se debe a errores indeterminados ó determinados. Para tratar este problema en forma estadística, la diferencia (X - µ) se compara con la diferencia que sería causada por errores indeterminados. -Si (X - µ) es menor que la diferencia predicha para un dado nivel de confidencia, luego se puede decir que los valores comparados son los mismos y que la probable presencia de errores determinados no puede ser detectada. Si (X - µ) es significativamente mayor que el valor crítico, se puede decir que existe una diferencia real entre X y µ y que el error determinado es significativo. El valor crítico para descartar la hipótesis nula se calcula mediante la fórmula (criterio “t” de Student): X − µ = ± ts N donde cada símbolo tiene su significado habitual. En el caso de que s puede reemplazar t por z. σ se I- RECHAZO DE VALORES DUDOSOS Cuando una serie de mediciones contiene menos de 10 resultados es aconsejable aplicar el criterio Q de rechazo de valores dudosos. Cuando este test indica rechazar un resultado existe un 90% de probabilidad de que este resultado esté afectado por un error particular (VER EJEMPLO más adelante). Se procede de la siguiente forma: 1. Calcular el rango de los resultados 2. Calcular la diferencia entre el valor dudoso y el resultado más próximo al resultado dudoso 3. Dividir la diferencia calculada en 2. por el rango. Ese cociente es el cociente Q. 4. Consultar con Tabla de valores de Q. Si el valor calculado en 3. es mayor que el de la Tabla, se debe desechar el resultado dudoso ya que existe un 90% de probabilidad de que ese valor esté afectado de un error que no estuvo presente en los demás resultados. La siguiente Tabla informa algunos valores de Q No de determinaciones 3 4 5 6 7 8 9 10 Q90% 0.90 0.76 0.64 0.56 0.51 0.47 0.44 0.41 9 Química Analítica (9123) Errores y tratamiento estadístico de datos DIAGRAMAS DE CONTROL El método de los diagramas de control se desarrolló originalmente para mantener la calidad durante las operaciones de manufactura en gran escala. - Mantener la calidad del producto. - Verificación del método analítico. % de agua Nmnm encontrado en la muestra standard límite de control Valor de límite de control 2 4 6 8 número de semanas 10 12 Límites de control: ± 1,96 σ ± 3σ 95% (5% = 1 en 20 fuera del intervalo) 99,7% (0,3% = 3 en 1000 fuera del ” ) conocido muestra