DOS TESTS ESTADÍSTICOS PARA EL VALOR MÁS PROBABLE DEL P.E.R.T RAFAEL HERRERÍAS PLEGUEZUELO FEDERICO PALACIOS GONZÁLEZ EDUARDO PÉREZ RODRÍGUEZ Facultad de Ciencias Económicas y Empresariales Universidad de Granada 1. INTRODUCCIÓN Es conocida la dificultad del experto para proporcionar una estimación subjetiva del valor más probable, ya que, en general, es más comprometida que las estimaciones subjetivas de los valores pesimista y optimista en cualquiera de los problemas (análisis de inversiones, valoración de los tiempos en la realización de una tarea, etc.) en los que se aplica la metodología PERT. Por ello, consideramos muy conveniente disponer de medidas o tests que nos permitan discernir, bajo distintas hipótesis y con criterios científicos, la mejor o peor adecuación de las estimaciones subjetivas proporcionadas por el experto, al modelo probabilístico subyacente en la utilización del PERT clásico. Fruto de esta inquietud, manifestada hace un quinquenio en Herrerías, (1989), fue el trabajo de Herrerías, Palacios, y Pérez, (1993), cuyo objetivo esencial es profundizar lo apuntado en el anterior. 2. SOBRE EL MODELO PROBABILISTICO UTILIZADO EN EL PERT En la metodología PERT se utiliza la distribución beta cuya función de densidad es: p -1 f(x) = q -1 (x - a ) (b - x ) si a < x < b, siendo p > 1 y q > 1 (1) p +q -1 (b - a ) β(p,q) La media y la moda de esta distribución vienen dadas, respectivamente, por bp + aq b(p - 1) + a(q - 1) µ = E(X) = , m= (2) p+ q p+ q - 2 existiendo entre ambas la siguiente relación: Índice Índice de autores 84 R. HERRERÍAS – F. PALACIOS – E. PÉREZ µ = E(X) = a + (p + q - 2)m + b p+ q (3) En la metodología del PERT clásico, a los parámetros p y q del modelo beta se le asignan los valores, (Véase Thomas, (1968).) p= 3+ 2 q = 3- 2 si m > ( a + b) 2 p= 3 - 2 q= 3+ 2 si m < (a + b ) 2 Entonces, a partir de las fórmulas (2), para el caso de una β(3 + 2 ,3 - 2 ) se tiene: µ= bp + aq a + b 2 a+b 2 b(p - 1)+ a(q - 1) = + (b - a) < + (b - a) = =m p+q 2 6 2 4 p+q - 2 de lo que se deduce que: a) el punto medio no puede coincidir ni con la media ni con la moda b) ( a + b ) 2 < µ < m c) el modelo presenta asimetría a la izquierda ( µ - m < 0) y para el caso de una β(3 - 2 ,3 + 2 ) se obtiene: bp + aq a + b 2 a+b 2 b(p - 1) + a(q - 1) = (b - a) > (b - a) = =m p+ q 2 6 2 4 p+ q - 2 de lo que se deduce que: a') el punto medio no puede coincidir ni con la media ni con la moda b') ( a + b ) 2 > µ > m µ= c') el modelo presenta asimetría a la derecha, µ − m > 0 3. UNA MEDIDA SOBRE LA ADECUACIÓN DE LA ESTIMACIÓN AL MODELO Es lógico pensar que los valores proporcionados por el experto para el valor más probable no coincidan exactamente con los valores que, para m, suministra la distribución beta, a saber a+ b 2 ± (b - a) 2 4 dependiendo de la asimetría de la misma, que podemos determinar sin mas que comparar la estimación del experto con el punto medio del intervalo. La medida de esta discrepancia (valores de la moda proporcionados por el experto y valores de la moda deducidos de la distribución beta) puede servir de indicador para m= Índice Índice de autores 85 DOS TEST ESTADÍSTICOS PARA EL VALOR MÁS PROBABLE ... valorar la adecuación de las estimaciones subjetivas al modelo probabilístico utilizado. En primer lugar podría pensarse en una medida n (m t - m*t )2 Q= (4) * mt t =1 donde: mt = estimación subjetiva proporcionada por el experto para el período t m* t = valor proporcionado por la relación teórica de m con a y b correspondiente al caso, de acuerdo con la asimetría, actuando de acuerdo con la siguiente regla: 1) El experto ó técnico proporciona las estimaciones de a, m y b. 2) Se comprueba si el m proporcionado es mayor o menor que (a+b)/2 3) Se calcula el valor de m* de acuerdo con el modelo probabilístico subyacente según la asimetría 4) Se calcula la cantidad Q. Está claro que valores próximos a cero indicarían una gran adecuación, por el contrario valores grandes de Q señalarían poca adecuación del modelo con las estimaciones realizadas. El problema principal de la medida (4) es que no conocemos su distribución probabilística, por lo que no sirve como test estadístico para valorar la adecuación. Por ello habrá que modificar (4) y realizar algunas hipótesis que nos permitan utilizar la Estadística Inferencial. ∑ 4. UN PRIMER TEST PARA EL VALOR MÁS PROBABLE Bajo la hipótesis de coherencia del modelo PERT clásico con las estimaciones del experto, cabe esperar que estas últimas se comporten de acuerdo con el esquema: (5) m t = m*t + εt con εt i.i.d. N(0,σ 2 ) es decir, las estimaciones del experto se distribuyen en torno a los valores de la moda de la distribución beta. La falsedad de esa hipótesis se manifes-taría a través de esperanzas no nulas del término de perturbación, i.e. E( εt ) = µt (6) En este caso, trabajando con una muestra de tamaño n, es evidente que el estadístico n ∑ t =1 2 ( mt - m*t - µt ) σ2 sigue una χ 2 con n grados de libertad. n = ∑ t= 1 2 ( εt - µt ) σ2 (7) Índice Índice de autores 86 R. HERRERÍAS – F. PALACIOS – E. PÉREZ Por otro lado, mediante transformaciones algebraicas elementales, puede demostrarse que n ∑ 2 ( εt - µt ) = n( ε - µ )2 n + ∑ [( εt - ε ) - ( µt - µ ) ] 2 (8) 2 2 2 σ σ σ t=1 Considerando la variable aleatoria Y t = ε t - µt (t = 1,..., n) , es evidente que Yt t=1 sigue una N(0,σ 2 ) , y aplicándole el teorema de Fisher, su media muestral, Y = ε − µ , es independiente (en el muestreo) de su cuasivarianza muestral 1 n 1 n ( Y t - Y )2 = [( εt - ε ) - ( µt - µ ) ] 2 n - 1 t =1 n - 1 t=1 ∑ ∑ (9) Teniendo en cuenta la distribución en el muestreo de la media de Y, el teorema de Fisher y la relación (8), se deduce que el estadístico n ∑ [( εt - ε ) - ( µt - µ ) ] 2 t=1 2 σ 2 sigue una χ con n-1 grados de libertad. Finalmente, el estadístico n( ε - µ ) t= n 1 [( εt - ε ) - ( µt - µ ) ] 2 n - 1 t=1 (10) Índice (11) ∑ sigue una t de Student con n -1 grados de libertad. Bajo la hipótesis nula de adecuación entre las estimaciones del experto y el modelo PERT clásico µt = 0 t = 1,2,..., n y el estadístico (11) se convierte en nε t= (12) n ∑ 1 ( εt - ε ) 2 n - 1 t=1 que puede utilizarse para contrastar dicha hipótesis nula, aunque habrá que analizar con detenimiento la potencia del test. El estadístico (12) (t experimental), cuando falla la hipótesis nula, puede no desplazarse hacia las colas de la distribución, y ello por dos motivos: a) puede ocurrir que siendo µt ≠ 0 para todo t se verifique que µ = 0 b) si 1 n 1 n ( µt - µ )2 - 2 ( εt - ε )( µt - µ ) > 0 , n - 1 t =1 n - 1 t =1 ∑ ∑ Índice de autores 87 DOS TEST ESTADÍSTICOS PARA EL VALOR MÁS PROBABLE ... el no cumplimiento de H0 ocasionaría un incremento en el denominador del estadístico de contraste y por tanto una disminución en el valor de la t experimental. Por tanto nos encontramos ante un primer contraste, que en ocasiones puede ser no muy potente pero si muy cómodo de aplicar, para estudiar la adecuación del modelo PERT clásico. Caso de que se aceptare la hipótesis nula es conveniente la aplicación posterior de otros tests más potentes. 5. UN SEGUNDO TEST PARA EL VALOR MÁS PROBABLE Consideramos la hipótesis de que la moda, mt , que proporciona el experto es una función desconocida del período t, esto es: (13) m t = µ(t)+ εt donde las ε t son unas perturbaciones esféricas y supondremos, además, que µ(t) pertenece a un espacio lineal de dimensión finita k, de forma que siendo X1 (t), X2 (t),..., Xk (t) una base del mismo µ(t) = k ∑ bi X i (t) (14) i=1 Índice Proporcionada por el experto una muestra (mt1 ,mt2 ,...,mtn ) constituida por sus estimaciones del valor más probable para los n (>k) períodos del problema, teniendo en cuenta (13) y (14) podemos escribir: mt 1 X 1 ( t 1 ) r mt 2 X 1 ( t 2 ) M= = ... ... ( ) mt n X 1 t n X k ( t 1 ) b1 ε t 1 X 2 ( t 2 ) ... X k ( t k ) b 2 ε t 2 r r + = Xb + ε ... ... ... ... ... X 2 ( t n ) ... X k ( t n ) b k ε t n X 2 ( t 1 ) ... (15) Nos encontramos ante un modelo lineal en el que se cumplen las hipótesis del Teorema de Gauss-Markov, tanto en lo que se refiere a las perturbaciones aleatorias, que hemos supuesto esféricas, como a las variables no estocásticas Xi (t), que hemos supuesto linealmente independientes al constituir una base del espacio lineal. Por tanto podemos obtener un estimador ELIO r bˆ = ( X ′X )-1 X ′M (16) Llamando Mˆ = X bˆ , y teniendo en cuenta (15) y (16) resulta r r r r r Mˆ = Xbˆ = X(X ′X )-1 X ′M = X(X ′X )-1 X ′( Xb + ε ) = Xb + X(X ′X )-1 X ′ε , de donde Índice de autores 88 R. HERRERÍAS – F. PALACIOS – E. PÉREZ r r r r r r [ Xb - Mˆ ] ′[Xb - Mˆ] = ε ′X(X ′X )-1 X ′ε = ε ′Dε (17) -1 siendo D=X'(X'X) X , una matriz simétrica e idempotente de rango, coincidente con su traza, igual a k. Por tanto, la forma cuadrática r r r r [Xb - Mˆ ] ′[Xb - Mˆ ] ε ′Dε = (18) 2 2 σ σ se distribuye según una χ 2 de k grados de libertad (Véase Johnston, J. (1987)). Por otra parte: r r r r r M - Mˆ = Xb + ε - Xˆ b = Xb + ε - X( X ′X )-1 M = (19) r r r r r r = Xb + ε - X(X ′X )-1 Xb - X( X ′X )-1 Xε = [I - X( X ′X )-1 X] ε = Nε siendo N = [I-X(X'X)-1 X'] una matriz simétrica e idempotente cuyo rango, coincidente con su traza, es igual a n-k. Por tanto, la forma cuadrática r r [M - Mˆ ] ′[M - Mˆ ] ε ′Nε = (20) 2 2 σ σ se distribuye según una χ 2 de n-k grados de libertad.(Véase Johnston, J. (1987)). Como además (18) y (20) se distribuyen independientemente, porque ND = (I-D)D = D-D2 = D-D=0 (21) el estadístico r r [Xb - Mˆ ] ′[Xb - Mˆ ] k r (22) r [M - Mˆ ] ′[M - Mˆ ] n-k se distribuye según una F de Snedecor de [k, n-k] grados de libertad. r r Si la hipótesis nula H 0 : X b = M * es cierta, donde M * es el vector columna de F= los valores modales (mt1 * , m* t2 ,..., m* tn ), calculados por la fórmula de la beta de acuerdo con el modelo clásico, es decir, según se explica en el apartado 3 anterior, entonces el estadístico r r [ M * - Mˆ ] ′[ M * - Mˆ ] k r (23) r [M - Mˆ ] ′[M - Mˆ ] n-k se distribuye según una F de Snedecor de [k,n-k] grados de libertad, y nos permite decidir si las estimaciones del experto para los diferentes n períodos, mti , están adecuadas a los valores que nos proporciona la beta del PERT, m* ti , a través de los valores estimados µ̂( t i ) del ajuste del modelo lineal M = Xb + εt , mediante la F= comparación del valor de F de (23) con el dado por las tablas de la F de Snedecor Índice Índice de autores 89 DOS TEST ESTADÍSTICOS PARA EL VALOR MÁS PROBABLE ... para [k, n-k] grados de libertad, al nivel de confianza prefijado α, concluyendo que: acepta si F <> F k,n -k ( α ) se la hipótesis H 0 : µ(t) = M * rechaza es decir, los valores que proporciona el experto son, o no, adecuados a los del modelo probabilístico subyacente. 6. ANOMALÍA POSIBLE PARA EL SEGUNDO TEST Si existiese una mala especificación del modelo (14), en la muestra tendríamos: r r r r r M = µ(t ) + ε pero µ (t ) ≠ Xb y podríamos escribir r r Mˆ = Xbˆ = X(X ′X )-1 X ′M = X(X ′X )-1 X ′[ µ( t ) + ε ] = r r = X(X ′X ) -1 X ′µ( t ) + X(X ′X )-1 X ′ε luego r r r r Mˆ - X(X ′X )-1 X ′µ(t ) = X(X ′X )-1 X ′ε ; Mˆ - Dµ (t )= Dε y por tanto, la forma cuadrática r r [Mˆ - Dµ(t )] ′[ Mˆ - Dµ(t )] σ2 = r ε ′Dε′ σ2 (24) (25) Índice (26) sigue una χ 2 con k grados de libertad. Por otro lado, si a M = µ(t)+ ε t se le resta (24) miembro a miembro, obtenemos r r r r r M - Mˆ = [I - X(X ′X )-1 X ′] µ(t )+ [I - X(X ′X )-1 X ′] ε = Nµ (t )+ Nε de donde (27) r r r M - Mˆ - Nµ(t ) = Nε (28) r r r r r r [ M - Mˆ - Nµ(t )] ′[M - Mˆ - Nµ(t )] σ 2 = ε ′Nε σ 2 (29) y la forma cuadrática se distribuye según una χ 2 de n-k grados de libertad, por lo que el estadístico r r 1 ˆ [M - D µ(t )] ′[Mˆ - D µ( t )] k F= (30) r r r r 1 [M - Mˆ - Nµ(t ) ] ′[ M - Mˆ - Nµ(t )] n -k donde D=X(X'X)-1 X' y N=I-D, sigue una F de Snedecor de [k, n-k] grados de libertad. Índice de autores 90 R. HERRERÍAS – F. PALACIOS – E. PÉREZ r Luego para contrastar si la hipótesis nula H 0 : µ(t ) = M * es cierta comparamos el valor del estadístico F bajo H0 con el valor suministrado por las tablas de la F de Snedecor de los grados de libertad señalados y al nivel de confianza α prefijado, es decir, se compara el valor de 1 ˆ [M - D M * ] ′[Mˆ - D M * ] k F= (31) r r 1 [M - Mˆ - N M * ] ′[M - Mˆ + N M * ] n-k con F k,n- k ( α) , concluyéndose de igual forma que en el epígrafe 5. r Obsérvese que si no hay error de especificación, entonces µ(t ) = Xb y r r r r Dµ (t ) = X(X ′X )-1 X ′X b = Xb = µ(t ) por lo que (30) coincide con (22), pues r r r r r r Nµ( t ) = (I - D) µ( t ) = µ(t ) - D µ(t ) = µ( t ) - µ( t ) = 0 BIBLIOGRAFÍA HERRERÍAS, R. Y CALVETE, H. (1987). "Una ley de probabilidad para el estudio de los flujos de caja de una inversión ". Libro -Homenaje al Prof. Gonzalo Arnaiz Vellando, pp 279-296, INE, Madrid. HERRERÍAS, R. (1989). "Modelos probabilísticos alternativos para el método PERT. Aplicación al análisis de inversiones". Estudios de Economía Aplicada, pp 89112. Secretariado de Publicaciones. Universidad de Valladolid. HERRERÍAS, R, PALACIOS, F Y PÉREZ, E. (1993). "Una medida sobre la adecuación de las estimaciones subjetivas con el modelo del PERT clásico". Estudios de Economía Aplicada, pp 419-425. Servicio de Publicaciones, Universidad de Cádiz. JOHNSTON, J. (1987). Métodos de Econometría . Ed. Vicens Universidad. Barcelona. THOMAS, G. (1968). "Introduction de l'aleatoire dans les problèmes d'ordonnancement. Méthode de simulation". Incluido en J.Agard, Les méthodes de simulation, pp 107124. Ed Dunod. Paris Artículo defendido en la VIII Reunión Anual de ASEPELT-ESPAÑA, celebrada en 1994 en la Universidad de las Islas Baleares. Publicado en las Actas de la mencionada Reunión: Estudios d e Economía Aplicada, Volumen 1, páginas 153-159. Índice Índice de autores