CITA 6016 - Análisis Sensorial de Alimentos Métodos Estadísticos Este documento es un resumen del capítulo 13 de Sensory Evaluation Techniques (Mielgaard et al., 1999) con anotaciones pertinentes añadidas por Fernando Pérez Muñoz. Definiciones o Población – colección completa de los elementos de interés. En sensorial, esto se puede referir a los panelistas o las muestras dependiendo de que estamos haciendo. o Elementos – cada una de las unidades que componen la población. Por ejemplo, si estamos hablando de la población de estudiantes del Recinto Universitario de Mayagüez, un elemento es un estudiante. Un elemento también puede referirse a una muestra o producto. Un ejemplo es decir que las bolsitas de maní es un elemento de la población de alimentos que se distribuyen el los aviones. En el análisis estadístico tomamos medidas sobre una porción o muestra de los elementos de la población para poder hacer inferencias sobre la conducta general de dicha población. o Muestra – porción de la población escogida aleatoriamente para ser evaluada. Esta porción contiene los elementos a los que se le realizarán las medidas de interés. o Distribución de probabilidad – Las medidas que tomamos a los elementos pueden ser discretos (valores específicos como caliente, verde o alto) o continuos (donde el rango de valores es prácticamente infinito aún entre ciertos límites). Las medidas tomadas a los elementos se relacionan con la población a través de una distribución de probabilidad. Esto es, la distribución es una relación matemática que describe la ocurrencia de valor al medir un elemento con la probabilidad de que este valor ocurra en la población. o Parámetro – valores fijos asociados a la distribución que dan información de la población. Algunos de estos parámetros son el promedio, la desviación estándar y la proporción de población. o Promedio – centro numérico de las medidas tomadas o la distribución. Se representa con el símbolo μ. o Desviación Estándar – valor de la dispersión de las medidas alrededor del promedio. E representa con el símbolo σ. o Proporción de Población – Parámetro de las distribuciones discretas que representa la fracción de la población (p) que tiene un valor o valores específicos a la medida de interés. Por ejemplo, preferencia por uno de dos productos. o Estadísticas – funciones matemáticas con las que se obtiene un estimado del valor real de la medida de interés. Conceptos Generales La validez de los paneles sensoriales estriba en el uso de métodos estadísticos para el análisis de los datos. Por ende, requieren que el investigador persiga la rigurosidad necesaria durante el diseño del experimento y la recopilación y análisis de los datos. Esto incluye los conceptos de bloques, aleatoriedad, balance, repetición y replicación. o Bloques – En análisis sensorial los bloques pueden ser días de experimentación, localidades de prueba, técnico de preparación de muestras o cualquier otro factor que no sean los productos bajo consideración o los panelistas. Una excepción a esta aseveración es cuando estamos adiestrando panelistas. Este proceso pretende “calibrar” al panelista como instrumento de prueba. Para esto debemos analizar el desempeño de cada panelista por separado hasta lograr el nivel de adiestramiento deseado. o Aleatoriedad – Se refiere al orden en que presentamos los tratamientos a los panelistas. El concepto de aleatoriedad implica que los tratamientos se presentarán a los panelistas de forma tal que no se siga ningún patrón o secuencia en particular. Esto provee igual oportunidad a todos los tratamientos y evita posibles prejuicios por orden de presentación. o Balance – Balance en un panel sensorial tiene que ver con dar igual oportunidad a todas las combinaciones de tratamientos. Por ejemplo, si tenemos tres productos y cada panelista va a recibir una muestra de cada uno, el balance manda a que cada uno de las seis posibles combinaciones (ABC, ACB, BAC, BCA, CAB, CBA) esté la misma cantidad de veces. Esto requiere que el número de panelistas sea en múltiplos de seis. o Repetición – Pretende reducir el error asociado con utilizar varias veces el mismo instrumento con la misma muestra, es decir, el error de medición. Una vez recopilados los datos de un panel sensorial, al igual que en otros experimentos estadísticos, el investigador debe preparar tablas y gráficas para observar la distribución de los datos y detectar tendencias que podría afectar la forma en que se deben analizar los datos. Por ejemplo, una gráfica de los datos puede hacer evidente que la distribución es bimodal en vez de normal. Esto llevaría al investigador a tratar de romper los datos en dos grupos para poder analizarlo correctamente. Diseños Experimentales Hipótesis Antes de diseñar un experimento es imperativo que el investigador formule el objetivo que quiere probar. De aquí entonces se generan las hipótesis nula y alterna, es decir, relaciones matemáticas entre los parámetros relevantes de las poblaciones a comparar. La hipótesis nula es la condición que esperamos prevalezca al realizar la comparación. La hipótesis alterna es la condición que vamos a aceptar como más probable si la hipótesis nula debe ser rechazada. Por ejemplo, asumamos que se desea cualificar un nuevo suplidor para la pulpa utilizada en la formulación de jugo de piña. Una hipótesis nula podría ser que la intensidad del jugo control es percibido igual a la del jugo preparado con la pulpa del nuevo suplidor. Otra hipótesis nula podría ser que la proporción de personas que puedan distinguir la diferencia no es mayor al 50%. La selección de la hipótesis nula (y la alterna) a ser probada determinará el tipo de prueba sensorial que vamos a realizar. El ejemplo anterior, el determinar la intensidad, llama a utilizar escalas numéricas (de línea). Por otro lado, determinar la proporción de personas que distinguen requiere pruebas de diferencia general. En términos de la hipótesis alterna, debemos considerar lo que se conoce como pruebas de una cola y pruebas de dos colas. Estos conceptos se refieren al interés que tenga el investigador por probar que una de las muestras es superior a la otra o si sencillamente son diferentes. Por ejemplo, digamos que un fabricante de galletas de avena está interesado en compararse con su principal competidor. El objetivo es determinar si su producto tiene mas pasas que el competidor. Para esto se asume una hipótesis nula de que ambos productos tienen, en promedio, igual cantidad de pasas (μA = μB). Puesto que el objetivo es determinar que su producto tiene más pasas que el del consumidor, se toma la hipótesis alterna de que su producto tiene, en promedio, mas pasas que el consumidor (μA > μB). Nótese que no interesa saber si el producto A tiene menos pasas. Por tanto, esta es una prueba de una cola. Por otro lado, si se hubiese querido determinar que no tenían igual cantidad de pasas, la hipótesis nula hubiese sido (μA ≠ μB). Error La última consideración al diseñar un experimento es el nivel de error que estamos dispuestos a aceptar. Este error surge de la realidad de que no estamos midiendo la población completa sino haciendo inferencias en base a mediciones realizadas sobre una muestra o porción de la población. Hay básicamente dos errores que podemos cometer. Se conoce como error tipo I (α) a la probabilidad de aceptar la hipótesis nula como cierta cuando en realidad no lo es. El error tipo II (β), por otro lado, es la probabilidad de rechazar la hipótesis nula cuando en realidad es cierta. Ambos tipos de error se refieren a la probabilidad de llegar a la conclusión equivocada. Entonces, el escoger valores apropiados de α y β tiene impacto directo en el nivel de confianza que vamos a tener en los resultados. Pruebas de Diferencia General Las pruebas de diferencia general incluyen las pruebas triángulo, dúo-trío, dos-de-cinco, diferencia simple, A-No A, y diferente al control. Estas pretenden probar si la proporción de la población que identifica las muestras correctamente es sustancialmente diferente a la probabilidad de adivinar. No todas, sin embargo se analizan de la misma forma. Triángulo, dúo-trío y dos-de-cinco Para analizar datos de estas pruebas se sigue el siguiente procedimiento. 1. El análisis de estas pruebas comienza con el recuento de las respuestas correctas (k). 2. Luego, se calcula el valor experimental de la estadística. k pa n z pa n(1 pa ) donde n es el número total de respuestas y pa es la probabilidad de adivinar (1/3 para triángulo, 1/10 para dos-de-cinco y ½ para dúo-trío). 3. Finalmente, comparamos el valor experimental de la estadística con el valor teórico (zα = tα,n-1). Este valor teórico se consigue en tablas o utilizando computadores con funciones estadísticas. 4. Si el valor experimental es mayor que el valor teórico, rechazamos la hipótesis nula (no diferencia entre los tratamientos) a favor de la alterna (los tratamientos son diferentes). Es posible también estimar intervalos de confianza para la proporción de personas (pc) que pueden obtener la respuesta correcta al comparar los dos tratamientos. k k k z 1 n 2 n n n Ahora bien, entendiendo que algunos panelistas podrían adivinar la respuesta correcta, es importante tener una idea de la proporción que realmente puede distinguir. Esto se consigue despejando la siguiente ecuación para pd, la proporción de los panelistas que realmente puede discriminar entre ambos tratamientos. pc pd pa 1 pd pc Diferencia simple y A-No A Para analizar datos de estas pruebas se sigue el siguiente procedimiento. 1. El análisis de estas pruebas comienza con el recuento de las respuestas correctas (k = k1 + k2). 2. Con estos datos se prepara una tabla como la siguiente Diferencia Simple Muestra iguales Panelistas Responden Muestras diferentes Total Panelistas Reciben Muestra iguales Muestras diferentes Total (k1) (k2) (n) Panelistas Reciben A No A (k1) (k2) A-No A A Panelistas Responden No A Total Total (n) 3. Entonces se calcula el valor experimental de la estadística. 2 Observado ij Estimado ij 2 Estimado ij donde Total fila i Total colum na j Estim adoij Total de respuestas 4. Finalmente, comparamos el valor experimental de la estadística con el valor teórico (χ2α,1). Este valor teórico se consigue en tablas o utilizando computadores con funciones estadísticas. 5. Si el valor experimental es mayor que el valor teórico, rechazamos la hipótesis nula (no diferencia entre los tratamientos) a favor de la alterna (los tratamientos son diferentes). Es posible también estimar intervalos de confianza para la proporción de personas (pc) que pueden obtener la respuesta correcta al comparar los dos tratamientos. k k k z 1 n 2 n n n Ahora bien, entendiendo que algunos panelistas podrían adivinar la respuesta correcta, es importante tener una idea de la proporción que realmente puede distinguir. Esto se consigue despejando la siguiente ecuación para pd, la proporción de los panelistas que realmente puede discriminar entre ambos tratamientos. pc pd pa 1 pd Diferente al control pc Esta es la única prueba de diferencia general que permite comparar mas de un tratamiento contra el tratamiento control. Además, esta prueba ofrece una manera de medir la diferencia entre los tratamientos bajo estudio. Esto es posible debido a la presencia de un control ciego como parte de los tratamientos bajo consideración de los panelistas. Este control ciego es que el permite determinar si la diferencia precibida por los panelistas es o no estadísticamente significativa. Nótese que esta prueba no mira el número de respuestas correctas sino la diferencia percibida entre los tratamientos bajo evaluación. Los datos recopilados son continuos y representan la diferencia entre los tratamientos. Para analizar datos de estas pruebas se sigue el siguiente procedimiento. 1. El análisis de estas pruebas comienza con la tabulación de los datos con el siguiente formato. Panelista 1 2 3 Control Ciego Tratamiento 1 Tratamiento 2 2. Analizar los datos utilizando ANOVA para dos factores (tratamientos y panelistas) sin replicación. ANOVA proveerá la probabilidad de que la estadística experimental sea mayor que la teórica. Si está probabilidad es menor o igual a error tipo I que estamos dispuestos a aceptar (α), rechazamos la hipótesis nula a favor de la alterna. 3. Una vez que determinamos diferencia entre los tratamientos, debemos discriminar cual o cuales tratamientos son diferentes entre si. Esto se realiza calculando intervalos de confianza, x t ,n1 s 2 n donde x es el promedio de las observaciones, s es la desviación estándar y n es el número de observaciones. 4. Finalmente comparamos los intervalos de confianza del control ciego contra los promedios de los demás tratamientos. Si el intervalo de confianza del control ciego no solapa con el intervalo de confianza de algún tratamiento, entonces ese tratamiento es significativamente diferente al control. Nota: También podemos utilizar los procedimientos de Fisher (Least Significant Difference) o Tukey (Honest Significant Difference). De estos, Tukey provee un estimado mas conservador.