ESTIMACIÓN DE UNA DISTRIBUCIÓN BETA COMO MODELO PARA SU UTILIZACIÓN EN EL MÉTODO PERT RAFAEL HERRERÍAS PLEGUEZUELO EDUARDO PÉREZ RODRÍGUEZ Departamento de Economía Aplicada. Facultad de Ciencias Económicas y Empresariales. Universidad de Granada 1. INTRODUCCIÓN En los últimos años, a partir de la pregunta abierta lanzada por Sasieni (1986), se ha visto resurgir el interés por perfilar mejor el modelo probabilístico empleado en la metodología PERT. Suponiendo que la duración de una actividad es una variable aleatoria sobre un intervalo finito, existe un acuerdo generalizado de que la distribución beta es un buen modelo para la distribución de tal variable aleatoria, debido a que esta familia de distribuciones puede adoptar una amplia variedad de formas, con distintas intensidades en su asimetría y en su curtosis. Este acuerdo se refuerza aún más, si cabe, cuando la asimetría es un factor importante en el problema bajo consideración. (Véase Moitra, 1990). Habida cuenta de la escasísima, por no decir nula, información muestral disponible para “ajustar” la distribución, es evidente que hay que recurrir al conocimiento subjetivo de la actividad en estudio. Es por ello por lo que, en las aplicaciones PERT, se determinan subjetivamente (opinión del experto) tres duraciones: una optimista (a), otra pesimista (b) y otra más probable (m). Los creadores del PERT sugirieron estimar los valores de la media y de la varianza de la distribución beta mediante las fórmulas a + 4m + b µ= (1) 6 (b − a )2 σ2 = (2) 36 Las razones que les llevaron a ellas son eminentemente prácticas y sustentadas por intuiciones atractivas (Véanse Hillier y Lieberman (1982) y Yu Chuen-Tao, (1980)), pero desde luego no pueden obtenerse a partir de la Índice Índice de autores 20 RAFAEL HERRERÍAS PLEGUEZUELO – EDUARDO PÉREZ RODRÍGUEZ función de densidad de la distribución beta con las informaciones disponibles de a, b y m. Con el fin de resaltar la rigidez de este modelo, y para salvaguardar la flexibilidad modeladora, Herrerías (1989) desarrolló unos modelos alternativos, en las que las estimaciones de µ y σ 2 se obtienen por las fórmulas: a + Km + b K +2 (1 + K )(b − a) 2 + K 2 (m − a )(b − m ) µ= σ2 = (K + 2) 2 ( K + 3) (3) (4) dejando la determinación de la ponderación K a nuestra confianza (subjetiva) en la pericia del experto que determinó a, b y m. Farnum y Stanton (1987) proporcionan una cierta base teórica para el uso de las fórmulas clásicas en un intervalo, determinado, de valores modales, y presentan una mejora de esas fórmulas para los valores de m que caen fuera de ese intervalo. A nuestro juicio, al partir de la hipótesis de que σ 2 ( p, q) = σ 2 ( p −1, q −1) = 1 / 36 su base teórica es igual de rígida que las fórmulas que intentan sustentar. Golenko-Ginzburg (1988) llega, por otro camino, a resultados análogos a los ya citados de Herrerías, y determina el valor de la ponderación K, con la siguiente condición: ∫ 1 σ2 dm = 1 36 (5) 0 (Véase la expresión (4), en la que σ 2 aparece como función de m). Como puede verse es una condición armonizadora con los clásicos. Moitra (1990) centra muy bien el problema, haciendo constar que la distribución beta tiene cuatro parámetros y nosotros sólo disponemos de tres elementos de información: a, b y m. Por ello es necesario, o bien más información o bien realizar alguna hipótesis. Él, en su trabajo, opta por el primer camino. Concretamente, propone pedirle al experto alguna información “banda”, o bien sobre la simetría de la distribución, o bien sobre la confianza que él tiene en su propia estimación del valor más probable. A pesar de su claridad de ideas, acaba, un tanto confusamente, discutiendo el valor adecuado de la constante c, por la que hay que dividir (b-a), para obtener la desviación típica de la distribución, ignorando que esa constante queda perfectamente determinada dentro de la ”blandura” de la información recabada. Índice Índice de autores ESTIMACIÓN DE UNA DISTRIBUCIÓN BETA COMO MODELO... 21 2. FORMULACIÓN DEL MODELO Nosotros vamos a trabajar con la distribución beta “estandarizada”, cuya función de densidad es: 1 f ( x) = x p −1 (1 − x) q −1 si 0 < x < 1 (6) β( p , q ) que, como puede verse, tan sólo tiene dos parámetros p y q, ambos mayores que 1. A cambio sólo disponemos de la información sobre el valor m. Las informaciones sobre los valores de a y b ya han sido usadas para realizar la “estandarización”. Para esta distribución sabemos que 1 + ( p + q − 2 ) m 1 + Km µ= = (7) p+q K +2 σ2 = pq ( p + q + 1)( p + q )2 (8) Nuestra filosofía es la de ir a los principios, es decir a determinar los parámetros p y q de la distribución beta, con un total respeto a la estimación subjetiva del experto del valor más probable. Sabido es que p −1 m= (9) p +q−2 de donde se d educe que 1 1 q = − 1 p + 2 − (10) m m es decir, al dar una estimación de m el experto está proporcionando una relación entre p y q, que habremos de respetar si deseamos que la distribución ajustada tenga como valor modal el proporcionado, tan trabajosamente, por el experto. Teniendo en cuenta esta relación, la varianza de la distribución beta, (8), puede expresarse como σ2 = m 2 p [ p (1 − m ) + (2 m − 1)] ( p + 3m − 11)( p + 2m − 1)2 (11) El problema es la elección de un valor para el parámetro p. Teniendo en cuenta la ausencia de cualquier información al respecto, recurrimos a la filosofía subyacente en el PERT, que en términos vulgares podría expresarse como “curarse en salud”, es decir en caso de duda adoptar el valor de p que conduzca a la máxima incertidumbre. Índice Índice de autores 22 RAFAEL HERRERÍAS PLEGUEZUELO – EDUARDO PÉREZ RODRÍGUEZ La máxima incertidumbre aparece al usar la distribución uniforme, que corresponde a p=q=1, pero si nos decantaramos por ella estaríamos desaprovechando el gran esfuerzo realizado por el experto para destacarnos un sólo m. Revisando nuestro “cajón de modelos” nos encontramos con la distribución triangular (en el intervalo unitario) que es el único modelo que queda perfectamente determinado por el valor de m. Para esta distribución sabemos que su varianza puede expresarse por m2 − m +1 (12) 18 Pensamos que, con la información disponible (el valor de un único m), no podemos aspirar a una incertidumbre inferior a la que proporciona este modelo triangular. Es por ello, por lo que a diferencia de Littlefield y Randolph (1987) consideramos como valor del parámetro p, aquel con el que se consigue una varianza igual a la de la distribución triangular. Para ello hemos resuelto en p la ecuación 2 σT = m 2 p [ p (1 − m ) + (2 m − 1)] ( p + +3m − 1)( p + 2m − 1) 2 = m2 − m +1 18 (13) para distintos valores de m. Esta ecuación cúbica sólo tiene una solución mayor que 1, para cualquier valor de m comprendido entre 0 y 1. Para encontrarla hemos seguido un método iterativo, partiendo de la solución inicial p=0. Los valores obtenidos figuran en la Tabla 1. Conocido el valor de p, mediante la relación (9), hemos determinado el valor de q, el de la suma p+q y el de la varianza correspondiente. Todos estos resultados figuran también en la Tabla 1. 3. COMENTARIOS A LOS RESULTADOS En primer lugar nos centramos en K=p+q-2. Obsérvese que, con nuestro modelo, esta ponderación de la fórmula (6) varía desde 1,19 hasta 3, según los valores de m. Ello nos confirma en nuestra sospecha de que esa ponderación, y para que el modelo beta no tenga rigideces y pueda adaptarse perfectamente a las estimaciones subjetivas que nos proporcionen, debe ser variable (quizás función de m) En esta línea hemos ajustado a los valores de p+q-2 de la tabla 1, por Mínimos Cuadrados Ordinarios, una parábola, obteniendo el siguiente resultado Índice Índice de autores ESTIMACIÓN DE UNA DISTRIBUCIÓN BETA COMO MODELO... K ( m ) = 0 ,5881 + 9, 0786 m − 9 ,0786 m 2 (0,0907 ) (0, 4176 ) (0,4057 ) R 2 = 0,969 23 (14) Como es habitual, entre paréntesis y debajo de cada coeficiente, figura el error estándar de la estimación. m 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 p 1,0595602 1,1405829 1,2465114 1,3799051 1,5411081 1,7268154 1,9291488 2,1358071 2,3314493 2,5000000 2,6273269 2,7037106 2,7255620 2,6959027 2,6233242 2,5196204 2,3968877 2,2652464 2,1316430 Q 2,1316438 2,2652461 2,3968979 2,5196204 2,6233243 2,6959026 2,7255621 2,7037107 2,6273269 2,5000000 2,3314493 2,1358071 1,9291488 1,7268154 1,5411081 1,3799051 1,2465096 1,1405829 1,0595602 p+q 3,19120400 3,40582900 3,64340933 3,89952550 4,16443240 4,42271800 4,65471086 4,83951775 4,95877622 5,00000000 4,95877618 4,83951767 4,65471077 4,42271814 4,16443227 3,89952550 3,64339729 3,40582933 3,19120316 Varianza 0,05291667 0,05055556 0,04847222 0,04666667 0,04513889 0,04388889 0,04291667 0,04222222 0,04180556 0,04166667 0,04180556 0,04222222 0,04291667 0,04388889 0,04513889 0,04666667 0,04847222 0,05055556 0,05291667 Tabla 1 Llevando (14) a (7) se obtiene la función 1 + 0 ,5881 m + 9, 0786 m 2 (1 − m ) (15) 2,5881 + 9 ,0786 m (1 − m ) cuya representación gráfica, junto con la de la media del modelo triangular, aparece en la figura 1. En esta figura puede apreciarse la “casi” perfecta linealidad de la función, en la zona comprendida entre su mínimo y su máximo. Determinados ambos puntos, la ecuación de la recta que pasa por ellos es 108 m + 71 µ= (16) 250 µ= Índice Índice de autores 24 RAFAEL HERRERÍAS PLEGUEZUELO – EDUARDO PÉREZ RODRÍGUEZ 1 0,8 0,6 0,4 0,2 0 0 0,2 0,4 0,6 Mod. propuesto 0,8 1 Mod. triangular Figura 1 Obsérvese que la µ es una media ponderada de los extremos del intervalo (0,1), y del valor más probable, m. Figurando este último con una ponderación superior a 1,52 En segundo lugar, la varianza de nuestro modelo, para todos los valores de m, es superior a la del modelo clásico, como no podía ser de otra forma, pues de la desigualdad evidente m 2 + (m − 1) 2 > 0 , se deduce, utilizando (12), que σ 2 > 1 36 ∀m ∈ (0,1) (17) por lo que su utilización conducirá a resultados más conservadores, que evitarán la crítica más habitual del método PERT de conducir a resultados excesivamente optimistas. 4. CONCLUSIONES 1) El modelo presentado es totalmente respetuoso con las estimaciones proporcionadas por el experto, cosa que no todos, y desde luego el clásico, lo son. Por lo que evita las dificultades que suelen presentarse a la hora de simular la duración de una actividad. 2) Dicho modelo es sumamente conservador, en el sentido de conducir a una varianza no inferior a la que podríamos aspirar con la información disponible. 3) Al estimar p y q puede soportar estudios posteriores sobre la distribución, en los que sea necesario el uso de otros momentos de orden superior, o la expresión explícita de la función de densidad. Índice Índice de autores ESTIMACIÓN DE UNA DISTRIBUCIÓN BETA COMO MODELO... 25 4) El uso de este modelo, para valores de m incluidos en el intervalo (0,1162; 0,8838) nos proporcionará varianzas superiores a las del PERT clásico, aunque la ponderación que se obtiene para la moda es intermedia entre la ponderación dada en el modelo triangular, 1, y la del modelo clásico, 4. 5) Obsérvese en la figura 1 que la media del modelo triangular, representada por la recta µ = (1 + m ) 3 , ajusta mucho peor en el intervalo mencionado, que la recta (16). 6) Obsérvese que la región obtenida con el modelo presentado mejora, en cuanto a amplitud, en un 8,5% a la obtenida por Herrerías (1992), por lo que son trasladables todas las conclusiones allí obtenidas a la región indicada. BIBLIOGRAFÍA DUMAS DE RAULY,D. (1968). L’estimation statistique. Gauthier-Villars. FARNUM, N.R y STANTON, L.W. (1987). Some Results Concerning the Estimation of Beta Distribution Parameters in PERT. J Opl. Res. Soc. Vol 38 nº3 pp 287-290. GOLENKO-GINZBURG, D. (1988). On the Distribution of Activity Time in PERT . J.Opl. Soc. Vol. 39 nº8 pp 767-771. HERRERÍAS, R. (1989). Modelos probabilísticos alternativos para el método PERT. Aplicación al Análisis de Inversiones. Estudios de Economía Aplicada, pp. 89112. Secretariado de Publicaciones de la Universidad de Valladolid. HERRERÍAS, R. (1992). Utilización de modelos probabilísticos para el PERT que permiten una ponderación variable del valor más probable , en análisis de inversiones. Ponencias de la III Reunión anual de la Asociación Científica Europea de Economía Aplicada. Biblioteca de Socioeconomía Sevillana. (Diputación de Sevilla) pp: 557 - 562. HILLIER, I Y LIEBERMAN G.J. (1982). Introducción ala Investigación de Operaciones. McGraw-Hill. LITTLEFIELD, T.K Y RANDOLPH, P.H. (1987). An Answer to Sasieni’s Question on PERT Times. Management Sci. 33 pp 1357-1359. MOITRA, S.D. (1990). Skwness and the beta distribution. J. Opl. Res. Soc. Vol 41 nº 10 pp. 953-961 SASIENI, M.W. (1986). A note on PERT Times . Management Sci. 32 pp 1652-1653 YU CHUEN-TAO, L. (1980). Aplicaciones prácticas del PERT y CPM. Gestión-Deusto. Artículo defendido en la V Reunión Anual de ASEPELT-ESPAÑA, celebrada en 1991 en la Universidad de Las Palmas de Gran Canaria. Publicado en las Actas de la mencionada Reunión, páginas 1191-1199. Índice Índice de autores