Metodos Estadísticos - Uprm - Recinto Universitario de Mayagüez

Anuncio
CITA 6016 - Análisis Sensorial de Alimentos
Métodos Estadísticos
Este documento es un resumen del capítulo 13 de Sensory Evaluation Techniques
(Mielgaard et al., 1999) con anotaciones pertinentes añadidas por Fernando Pérez Muñoz.
Definiciones
o Población – colección completa de los elementos de interés. En sensorial, esto se
puede referir a los panelistas o las muestras dependiendo de que estamos
haciendo.
o Elementos – cada una de las unidades que componen la población. Por ejemplo,
si estamos hablando de la población de estudiantes del Recinto Universitario de
Mayagüez, un elemento es un estudiante. Un elemento también puede referirse a
una muestra o producto. Un ejemplo es decir que las bolsitas de maní es un
elemento de la población de alimentos que se distribuyen el los aviones. En el
análisis estadístico tomamos medidas sobre una porción o muestra de los
elementos de la población para poder hacer inferencias sobre la conducta general
de dicha población.
o Muestra – porción de la población escogida aleatoriamente para ser evaluada.
Esta porción contiene los elementos a los que se le realizarán las medidas de
interés.
o Distribución de probabilidad – Las medidas que tomamos a los elementos pueden
ser discretos (valores específicos como caliente, verde o alto) o continuos (donde
el rango de valores es prácticamente infinito aún entre ciertos límites). Las
medidas tomadas a los elementos se relacionan con la población a través de una
distribución de probabilidad. Esto es, la distribución es una relación matemática
que describe la ocurrencia de valor al medir un elemento con la probabilidad de
que este valor ocurra en la población.
o Parámetro – valores fijos asociados a la distribución que dan información de la
población. Algunos de estos parámetros son el promedio, la desviación estándar y
la proporción de población.
o Promedio – centro numérico de las medidas tomadas o la distribución. Se
representa con el símbolo μ.
o Desviación Estándar – valor de la dispersión de las medidas alrededor del
promedio. E representa con el símbolo σ.
o Proporción de Población – Parámetro de las distribuciones discretas que
representa la fracción de la población (p) que tiene un valor o valores específicos
a la medida de interés. Por ejemplo, preferencia por uno de dos productos.
o Estadísticas – funciones matemáticas con las que se obtiene un estimado del valor
real de la medida de interés.
Conceptos Generales
La validez de los paneles sensoriales estriba en el uso de métodos estadísticos para el
análisis de los datos. Por ende, requieren que el investigador persiga la rigurosidad
necesaria durante el diseño del experimento y la recopilación y análisis de los datos. Esto
incluye los conceptos de bloques, aleatoriedad, balance, repetición y replicación.
o Bloques – En análisis sensorial los bloques pueden ser días de experimentación,
localidades de prueba, técnico de preparación de muestras o cualquier otro factor
que no sean los productos bajo consideración o los panelistas. Una excepción a
esta aseveración es cuando estamos adiestrando panelistas. Este proceso pretende
“calibrar” al panelista como instrumento de prueba. Para esto debemos analizar el
desempeño de cada panelista por separado hasta lograr el nivel de adiestramiento
deseado.
o Aleatoriedad – Se refiere al orden en que presentamos los tratamientos a los
panelistas. El concepto de aleatoriedad implica que los tratamientos se
presentarán a los panelistas de forma tal que no se siga ningún patrón o secuencia
en particular. Esto provee igual oportunidad a todos los tratamientos y evita
posibles prejuicios por orden de presentación.
o Balance – Balance en un panel sensorial tiene que ver con dar igual oportunidad
a todas las combinaciones de tratamientos. Por ejemplo, si tenemos tres
productos y cada panelista va a recibir una muestra de cada uno, el balance manda
a que cada uno de las seis posibles combinaciones (ABC, ACB, BAC, BCA,
CAB, CBA) esté la misma cantidad de veces. Esto requiere que el número de
panelistas sea en múltiplos de seis.
o Repetición – Pretende reducir el error asociado con utilizar varias veces el mismo
instrumento con la misma muestra, es decir, el error de medición.
Una vez recopilados los datos de un panel sensorial, al igual que en otros experimentos
estadísticos, el investigador debe preparar tablas y gráficas para observar la distribución
de los datos y detectar tendencias que podría afectar la forma en que se deben analizar los
datos. Por ejemplo, una gráfica de los datos puede hacer evidente que la distribución es
bimodal en vez de normal. Esto llevaría al investigador a tratar de romper los datos en
dos grupos para poder analizarlo correctamente.
Diseños Experimentales
Hipótesis
Antes de diseñar un experimento es imperativo que el investigador formule el objetivo
que quiere probar. De aquí entonces se generan las hipótesis nula y alterna, es decir,
relaciones matemáticas entre los parámetros relevantes de las poblaciones a comparar.
La hipótesis nula es la condición que esperamos prevalezca al realizar la comparación.
La hipótesis alterna es la condición que vamos a aceptar como más probable si la
hipótesis nula debe ser rechazada.
Por ejemplo, asumamos que se desea cualificar un nuevo suplidor para la pulpa utilizada
en la formulación de jugo de piña. Una hipótesis nula podría ser que la intensidad del
jugo control es percibido igual a la del jugo preparado con la pulpa del nuevo suplidor.
Otra hipótesis nula podría ser que la proporción de personas que puedan distinguir la
diferencia no es mayor al 50%.
La selección de la hipótesis nula (y la alterna) a ser probada determinará el tipo de prueba
sensorial que vamos a realizar. El ejemplo anterior, el determinar la intensidad, llama a
utilizar escalas numéricas (de línea). Por otro lado, determinar la proporción de personas
que distinguen requiere pruebas de diferencia general.
En términos de la hipótesis alterna, debemos considerar lo que se conoce como pruebas
de una cola y pruebas de dos colas. Estos conceptos se refieren al interés que tenga el
investigador por probar que una de las muestras es superior a la otra o si sencillamente
son diferentes.
Por ejemplo, digamos que un fabricante de galletas de avena está interesado en
compararse con su principal competidor. El objetivo es determinar si su producto tiene
mas pasas que el competidor. Para esto se asume una hipótesis nula de que ambos
productos tienen, en promedio, igual cantidad de pasas (μA = μB). Puesto que el objetivo
es determinar que su producto tiene más pasas que el del consumidor, se toma la hipótesis
alterna de que su producto tiene, en promedio, mas pasas que el consumidor (μA > μB).
Nótese que no interesa saber si el producto A tiene menos pasas. Por tanto, esta es una
prueba de una cola. Por otro lado, si se hubiese querido determinar que no tenían igual
cantidad de pasas, la hipótesis nula hubiese sido (μA ≠ μB).
Error
La última consideración al diseñar un experimento es el nivel de error que estamos
dispuestos a aceptar. Este error surge de la realidad de que no estamos midiendo la
población completa sino haciendo inferencias en base a mediciones realizadas sobre una
muestra o porción de la población.
Hay básicamente dos errores que podemos cometer. Se conoce como error tipo I (α) a la
probabilidad de aceptar la hipótesis nula como cierta cuando en realidad no lo es. El
error tipo II (β), por otro lado, es la probabilidad de rechazar la hipótesis nula cuando en
realidad es cierta. Ambos tipos de error se refieren a la probabilidad de llegar a la
conclusión equivocada. Entonces, el escoger valores apropiados de α y β tiene impacto
directo en el nivel de confianza que vamos a tener en los resultados.
Pruebas de Diferencia General
Las pruebas de diferencia general incluyen las pruebas triángulo, dúo-trío, dos-de-cinco,
diferencia simple, A-No A, y diferente al control. Estas pretenden probar si la proporción
de la población que identifica las muestras correctamente es sustancialmente diferente a
la probabilidad de adivinar. No todas, sin embargo se analizan de la misma forma.
Triángulo, dúo-trío y dos-de-cinco
Para analizar datos de estas pruebas se sigue el siguiente procedimiento.
1. El análisis de estas pruebas comienza con el recuento de las respuestas correctas
(k).
2. Luego, se calcula el valor experimental de la estadística.
k  pa n
z
pa n(1  pa )
donde n es el número total de respuestas y pa es la probabilidad de adivinar (1/3
para triángulo, 1/10 para dos-de-cinco y ½ para dúo-trío).
3. Finalmente, comparamos el valor experimental de la estadística con el valor
teórico (zα = tα,n-1). Este valor teórico se consigue en tablas o utilizando
computadores con funciones estadísticas.
4. Si el valor experimental es mayor que el valor teórico, rechazamos la hipótesis
nula (no diferencia entre los tratamientos) a favor de la alterna (los tratamientos
son diferentes).
Es posible también estimar intervalos de confianza para la proporción de personas (pc)
que pueden obtener la respuesta correcta al comparar los dos tratamientos.
k
k k
 z
1    n
2
n
n  n
Ahora bien, entendiendo que algunos panelistas podrían adivinar la respuesta correcta, es
importante tener una idea de la proporción que realmente puede distinguir. Esto se
consigue despejando la siguiente ecuación para pd, la proporción de los panelistas que
realmente puede discriminar entre ambos tratamientos.
pc  pd  pa 1  pd 
pc 
Diferencia simple y A-No A
Para analizar datos de estas pruebas se sigue el siguiente procedimiento.
1. El análisis de estas pruebas comienza con el recuento de las respuestas correctas
(k = k1 + k2).
2. Con estos datos se prepara una tabla como la siguiente
Diferencia Simple
Muestra
iguales
Panelistas
Responden
Muestras
diferentes
Total
Panelistas Reciben
Muestra iguales Muestras diferentes
Total
(k1)
(k2)
(n)
Panelistas Reciben
A
No A
(k1)
(k2)
A-No A
A
Panelistas
Responden
No A
Total
Total
(n)
3. Entonces se calcula el valor experimental de la estadística.
2

Observado ij  Estimado ij 
2
 
Estimado ij
donde
Total fila i  Total colum na j
Estim adoij 
Total de respuestas
4. Finalmente, comparamos el valor experimental de la estadística con el valor
teórico (χ2α,1). Este valor teórico se consigue en tablas o utilizando computadores
con funciones estadísticas.
5. Si el valor experimental es mayor que el valor teórico, rechazamos la hipótesis
nula (no diferencia entre los tratamientos) a favor de la alterna (los tratamientos
son diferentes).
Es posible también estimar intervalos de confianza para la proporción de personas (pc)
que pueden obtener la respuesta correcta al comparar los dos tratamientos.
k
k k
 z
1    n
2
n
n  n
Ahora bien, entendiendo que algunos panelistas podrían adivinar la respuesta correcta, es
importante tener una idea de la proporción que realmente puede distinguir. Esto se
consigue despejando la siguiente ecuación para pd, la proporción de los panelistas que
realmente puede discriminar entre ambos tratamientos.
pc  pd  pa 1  pd 
Diferente al control
pc 
Esta es la única prueba de diferencia general que permite comparar mas de un tratamiento
contra el tratamiento control. Además, esta prueba ofrece una manera de medir la
diferencia entre los tratamientos bajo estudio. Esto es posible debido a la presencia de un
control ciego como parte de los tratamientos bajo consideración de los panelistas. Este
control ciego es que el permite determinar si la diferencia precibida por los panelistas es
o no estadísticamente significativa.
Nótese que esta prueba no mira el número de respuestas correctas sino la diferencia
percibida entre los tratamientos bajo evaluación. Los datos recopilados son continuos y
representan la diferencia entre los tratamientos. Para analizar datos de estas pruebas se
sigue el siguiente procedimiento.
1. El análisis de estas pruebas comienza con la tabulación de los datos con el
siguiente formato.
Panelista
1
2
3
Control Ciego
Tratamiento 1
Tratamiento 2
2. Analizar los datos utilizando ANOVA para dos factores (tratamientos y
panelistas) sin replicación. ANOVA proveerá la probabilidad de que la
estadística experimental sea mayor que la teórica. Si está probabilidad es menor o
igual a error tipo I que estamos dispuestos a aceptar (α), rechazamos la hipótesis
nula a favor de la alterna.
3. Una vez que determinamos diferencia entre los tratamientos, debemos discriminar
cual o cuales tratamientos son diferentes entre si. Esto se realiza calculando
intervalos de confianza,
x  t ,n1 s
2
n
donde x es el promedio de las observaciones, s es la desviación estándar y n es el
número de observaciones.
4. Finalmente comparamos los intervalos de confianza del control ciego contra los
promedios de los demás tratamientos. Si el intervalo de confianza del control
ciego no solapa con el intervalo de confianza de algún tratamiento, entonces ese
tratamiento es significativamente diferente al control.
Nota: También podemos utilizar los procedimientos de Fisher (Least Significant
Difference) o Tukey (Honest Significant Difference). De estos, Tukey provee un
estimado mas conservador.
Descargar