dos tests estadísticos para el valor más probable del pert

Anuncio
DOS TESTS ESTADÍSTICOS PARA
EL VALOR MÁS PROBABLE DEL P.E.R.T
RAFAEL HERRERÍAS PLEGUEZUELO
FEDERICO PALACIOS GONZÁLEZ
EDUARDO PÉREZ RODRÍGUEZ
Facultad de Ciencias Económicas y Empresariales
Universidad de Granada
1. INTRODUCCIÓN
Es conocida la dificultad del experto para proporcionar una estimación
subjetiva del valor más probable, ya que, en general, es más comprometida que las
estimaciones subjetivas de los valores pesimista y optimista en cualquiera de los
problemas (análisis de inversiones, valoración de los tiempos en la realización de
una tarea, etc.) en los que se aplica la metodología PERT. Por ello, consideramos
muy conveniente disponer de medidas o tests que nos permitan discernir, bajo
distintas hipótesis y con criterios científicos, la mejor o peor adecuación de las
estimaciones subjetivas proporcionadas por el experto, al modelo probabilístico
subyacente en la utilización del PERT clásico.
Fruto de esta inquietud, manifestada hace un quinquenio en Herrerías, (1989),
fue el trabajo de Herrerías, Palacios, y Pérez, (1993), cuyo objetivo esencial es
profundizar lo apuntado en el anterior.
2. SOBRE EL MODELO PROBABILISTICO UTILIZADO EN EL PERT
En la metodología PERT se utiliza la distribución beta cuya función de
densidad es:
p -1
f(x) =
q -1
(x - a ) (b - x )
si a < x < b, siendo p > 1 y q > 1
(1)
p +q -1
(b - a )
β(p,q)
La media y la moda de esta distribución vienen dadas, respectivamente, por
bp + aq
b(p - 1) + a(q - 1)
µ = E(X) =
, m=
(2)
p+ q
p+ q - 2
existiendo entre ambas la siguiente relación:
Índice
Índice de autores
84
R. HERRERÍAS – F. PALACIOS – E. PÉREZ
µ = E(X) =
a + (p + q - 2)m + b
p+ q
(3)
En la metodología del PERT clásico, a los parámetros p y q del modelo beta se
le asignan los valores, (Véase Thomas, (1968).)
p= 3+ 2 q = 3- 2
si m > ( a + b) 2
p= 3 - 2 q= 3+ 2
si m < (a + b ) 2
Entonces, a partir de las fórmulas (2), para el caso de una β(3 + 2 ,3 - 2 ) se
tiene:
µ=
bp + aq a + b
2
a+b
2
b(p - 1)+ a(q - 1)
=
+
(b - a) <
+
(b - a) =
=m
p+q
2
6
2
4
p+q - 2
de lo que se deduce que:
a) el punto medio no puede coincidir ni con la media ni con la moda
b) ( a + b ) 2 < µ < m
c) el modelo presenta asimetría a la izquierda ( µ - m < 0)
y para el caso de una β(3 - 2 ,3 + 2 ) se obtiene:
bp + aq a + b
2
a+b
2
b(p - 1) + a(q - 1)
=
(b - a) >
(b - a) =
=m
p+ q
2
6
2
4
p+ q - 2
de lo que se deduce que:
a') el punto medio no puede coincidir ni con la media ni con la moda
b') ( a + b ) 2 > µ > m
µ=
c') el modelo presenta asimetría a la derecha, µ − m > 0
3. UNA MEDIDA SOBRE LA ADECUACIÓN DE LA ESTIMACIÓN AL
MODELO
Es lógico pensar que los valores proporcionados por el experto para el valor
más probable no coincidan exactamente con los valores que, para m, suministra la
distribución beta, a saber
a+ b
2
±
(b - a)
2
4
dependiendo de la asimetría de la misma, que podemos determinar sin mas que
comparar la estimación del experto con el punto medio del intervalo. La medida
de esta discrepancia (valores de la moda proporcionados por el experto y valores
de la moda deducidos de la distribución beta) puede servir de indicador para
m=
Índice
Índice de autores
85
DOS TEST ESTADÍSTICOS PARA EL VALOR MÁS PROBABLE ...
valorar la adecuación de las estimaciones subjetivas al modelo probabilístico
utilizado.
En primer lugar podría pensarse en una medida
n
(m t - m*t )2
Q=
(4)
*
mt
t =1
donde:
mt = estimación subjetiva proporcionada por el experto para el período t
m* t = valor proporcionado por la relación teórica de m con a y b correspondiente
al caso, de acuerdo con la asimetría, actuando de acuerdo con la siguiente
regla:
1) El experto ó técnico proporciona las estimaciones de a, m y b.
2) Se comprueba si el m proporcionado es mayor o menor que (a+b)/2
3) Se calcula el valor de m* de acuerdo con el modelo probabilístico
subyacente según la asimetría
4) Se calcula la cantidad Q. Está claro que valores próximos a cero indicarían
una gran adecuación, por el contrario valores grandes de Q señalarían poca
adecuación del modelo con las estimaciones realizadas.
El problema principal de la medida (4) es que no conocemos su distribución
probabilística, por lo que no sirve como test estadístico para valorar la adecuación.
Por ello habrá que modificar (4) y realizar algunas hipótesis que nos permitan
utilizar la Estadística Inferencial.
∑
4. UN PRIMER TEST PARA EL VALOR MÁS PROBABLE
Bajo la hipótesis de coherencia del modelo PERT clásico con las estimaciones
del experto, cabe esperar que estas últimas se comporten de acuerdo con el
esquema:
(5)
m t = m*t + εt con εt i.i.d. N(0,σ 2 )
es decir, las estimaciones del experto se distribuyen en torno a los valores de la
moda de la distribución beta. La falsedad de esa hipótesis se manifes-taría a través
de esperanzas no nulas del término de perturbación, i.e.
E( εt ) = µt
(6)
En este caso, trabajando con una muestra de tamaño n, es evidente que el
estadístico
n
∑
t =1
2
( mt - m*t - µt )
σ2
sigue una χ 2 con n grados de libertad.
n
=
∑
t= 1
2
( εt - µt )
σ2
(7)
Índice
Índice de autores
86
R. HERRERÍAS – F. PALACIOS – E. PÉREZ
Por otro lado, mediante transformaciones algebraicas elementales, puede
demostrarse que
n
∑
2
( εt - µt )
=
n( ε - µ )2
n
+
∑
[( εt - ε ) - ( µt - µ ) ] 2
(8)
2
2
2
σ
σ
σ
t=1
Considerando la variable aleatoria Y t = ε t - µt (t = 1,..., n) , es evidente que Yt
t=1
sigue una N(0,σ 2 ) , y aplicándole el teorema de Fisher, su media muestral,
Y = ε − µ , es independiente (en el muestreo) de su cuasivarianza muestral
1 n
1 n
( Y t - Y )2 =
[( εt - ε ) - ( µt - µ ) ] 2
n - 1 t =1
n - 1 t=1
∑
∑
(9)
Teniendo en cuenta la distribución en el muestreo de la media de Y, el teorema
de Fisher y la relación (8), se deduce que el estadístico
n
∑ [( εt - ε ) - ( µt - µ ) ] 2
t=1
2
σ
2
sigue una χ con n-1 grados de libertad.
Finalmente, el estadístico
n( ε - µ )
t=
n
1
[( εt - ε ) - ( µt - µ ) ] 2
n - 1 t=1
(10)
Índice
(11)
∑
sigue una t de Student con n -1 grados de libertad.
Bajo la hipótesis nula de adecuación entre las estimaciones del experto y el
modelo PERT clásico µt = 0 t = 1,2,..., n y el estadístico (11) se convierte en
nε
t=
(12)
n
∑
1
( εt - ε ) 2
n - 1 t=1
que puede utilizarse para contrastar dicha hipótesis nula, aunque habrá que
analizar con detenimiento la potencia del test.
El estadístico (12) (t experimental), cuando falla la hipótesis nula, puede no
desplazarse hacia las colas de la distribución, y ello por dos motivos:
a) puede ocurrir que siendo µt ≠ 0 para todo t se verifique que µ = 0
b) si
1 n
1 n
( µt - µ )2 - 2
( εt - ε )( µt - µ ) > 0 ,
n - 1 t =1
n - 1 t =1
∑
∑
Índice de autores
87
DOS TEST ESTADÍSTICOS PARA EL VALOR MÁS PROBABLE ...
el no cumplimiento de H0 ocasionaría un incremento en el denominador del
estadístico de contraste y por tanto una disminución en el valor de la t
experimental.
Por tanto nos encontramos ante un primer contraste, que en ocasiones puede
ser no muy potente pero si muy cómodo de aplicar, para estudiar la adecuación del
modelo PERT clásico. Caso de que se aceptare la hipótesis nula es conveniente la
aplicación posterior de otros tests más potentes.
5. UN SEGUNDO TEST PARA EL VALOR MÁS PROBABLE
Consideramos la hipótesis de que la moda, mt , que proporciona el experto es
una función desconocida del período t, esto es:
(13)
m t = µ(t)+ εt
donde las ε t son unas perturbaciones esféricas y supondremos, además, que µ(t)
pertenece a un espacio lineal de dimensión finita k, de forma que siendo X1 (t),
X2 (t),..., Xk (t) una base del mismo
µ(t) =
k
∑ bi X i (t)
(14)
i=1
Índice
Proporcionada por el experto una muestra (mt1 ,mt2 ,...,mtn ) constituida por sus
estimaciones del valor más probable para los n (>k) períodos del problema,
teniendo en cuenta (13) y (14) podemos escribir:
 mt 1   X 1 ( t 1 )

 

r  mt 2   X 1 ( t 2 )

M=
= 
...
...

 

  ( )
 mt n   X 1 t n
X k ( t 1 )  b1   ε t 1 
 
 
X 2 ( t 2 ) ... X k ( t k )  b 2   ε t 2  r
r
+   = Xb + ε



... ...
... ...  ...
 
 
X 2 ( t n ) ... X k ( t n )  b k   ε t n 
X 2 ( t 1 ) ...
(15)
Nos encontramos ante un modelo lineal en el que se cumplen las hipótesis del
Teorema de Gauss-Markov, tanto en lo que se refiere a las perturbaciones
aleatorias, que hemos supuesto esféricas, como a las variables no estocásticas
Xi (t), que hemos supuesto linealmente independientes al constituir una base del
espacio lineal. Por tanto podemos obtener un estimador ELIO
r
bˆ = ( X ′X )-1 X ′M
(16)
Llamando Mˆ = X bˆ , y teniendo en cuenta (15) y (16) resulta
r
r
r
r
r
Mˆ = Xbˆ = X(X ′X )-1 X ′M = X(X ′X )-1 X ′( Xb + ε ) = Xb + X(X ′X )-1 X ′ε ,
de donde
Índice de autores
88
R. HERRERÍAS – F. PALACIOS – E. PÉREZ
r
r
r
r r r
[ Xb - Mˆ ] ′[Xb - Mˆ] = ε ′X(X ′X )-1 X ′ε = ε ′Dε
(17)
-1
siendo D=X'(X'X) X , una matriz simétrica e idempotente de rango, coincidente
con su traza, igual a k. Por tanto, la forma cuadrática
r
r
r r
[Xb - Mˆ ] ′[Xb - Mˆ ] ε ′Dε
=
(18)
2
2
σ
σ
se distribuye según una χ 2 de k grados de libertad (Véase Johnston, J. (1987)).
Por otra parte:
r
r
r
r
r
M - Mˆ = Xb + ε - Xˆ b = Xb + ε - X( X ′X )-1 M =
(19)
r r
r
r
r
r
= Xb + ε - X(X ′X )-1 Xb - X( X ′X )-1 Xε = [I - X( X ′X )-1 X] ε = Nε
siendo N = [I-X(X'X)-1 X'] una matriz simétrica e idempotente cuyo rango,
coincidente con su traza, es igual a n-k. Por tanto, la forma cuadrática
r r
[M - Mˆ ] ′[M - Mˆ ] ε ′Nε
=
(20)
2
2
σ
σ
se distribuye según una χ 2 de n-k grados de libertad.(Véase Johnston, J. (1987)).
Como además (18) y (20) se distribuyen independientemente, porque
ND = (I-D)D = D-D2 = D-D=0
(21)
el estadístico
r
r
[Xb - Mˆ ] ′[Xb - Mˆ ]
k r
(22)
r
[M - Mˆ ] ′[M - Mˆ ]
n-k
se distribuye según una F de Snedecor de [k, n-k] grados de libertad.
r
r
Si la hipótesis nula H 0 : X b = M * es cierta, donde M * es el vector columna de
F=
los valores modales (mt1 * , m* t2 ,..., m* tn ), calculados por la fórmula de la beta de
acuerdo con el modelo clásico, es decir, según se explica en el apartado 3 anterior,
entonces el estadístico
r
r
[ M * - Mˆ ] ′[ M * - Mˆ ]
k r
(23)
r
[M - Mˆ ] ′[M - Mˆ ]
n-k
se distribuye según una F de Snedecor de [k,n-k] grados de libertad, y nos permite
decidir si las estimaciones del experto para los diferentes n períodos, mti , están
adecuadas a los valores que nos proporciona la beta del PERT, m* ti , a través de los
valores estimados µ̂( t i ) del ajuste del modelo lineal M = Xb + εt , mediante la
F=
comparación del valor de F de (23) con el dado por las tablas de la F de Snedecor
Índice
Índice de autores
89
DOS TEST ESTADÍSTICOS PARA EL VALOR MÁS PROBABLE ...
para [k, n-k] grados de libertad, al nivel de confianza prefijado α, concluyendo
que:
 acepta
si F <> F k,n -k ( α ) se 
la hipótesis H 0 : µ(t) = M *
 rechaza
es decir, los valores que proporciona el experto son, o no, adecuados a los del
modelo probabilístico subyacente.
6. ANOMALÍA POSIBLE PARA EL SEGUNDO TEST
Si existiese una mala especificación del modelo (14), en la muestra tendríamos:
r
r
r r
r
M = µ(t ) + ε pero µ (t ) ≠ Xb
y podríamos escribir
r r
Mˆ = Xbˆ = X(X ′X )-1 X ′M = X(X ′X )-1 X ′[ µ( t ) + ε ] =
r
r
= X(X ′X ) -1 X ′µ( t ) + X(X ′X )-1 X ′ε
luego
r
r
r
r
Mˆ - X(X ′X )-1 X ′µ(t ) = X(X ′X )-1 X ′ε ; Mˆ - Dµ (t )= Dε
y por tanto, la forma cuadrática
r
r
[Mˆ - Dµ(t )] ′[ Mˆ - Dµ(t )]
σ2
=
r
ε ′Dε′
σ2
(24)
(25)
Índice
(26)
sigue una χ 2 con k grados de libertad.
Por otro lado, si a M = µ(t)+ ε t se le resta (24) miembro a miembro,
obtenemos
r
r
r
r
r
M - Mˆ = [I - X(X ′X )-1 X ′] µ(t )+ [I - X(X ′X )-1 X ′] ε = Nµ (t )+ Nε
de donde
(27)
r
r
r
M - Mˆ - Nµ(t ) = Nε
(28)
r
r
r
r
r r
[ M - Mˆ - Nµ(t )] ′[M - Mˆ - Nµ(t )] σ 2 = ε ′Nε σ 2
(29)
y la forma cuadrática
se distribuye según una χ 2 de n-k grados de libertad, por lo que el estadístico
r
r
1 ˆ
[M - D µ(t )] ′[Mˆ - D µ( t )]
k
F=
(30)
r
r
r
r
1
[M - Mˆ - Nµ(t ) ] ′[ M - Mˆ - Nµ(t )]
n -k
donde D=X(X'X)-1 X' y N=I-D, sigue una F de Snedecor de [k, n-k] grados de
libertad.
Índice de autores
90
R. HERRERÍAS – F. PALACIOS – E. PÉREZ
r
Luego para contrastar si la hipótesis nula H 0 : µ(t ) = M * es cierta
comparamos el valor del estadístico F bajo H0 con el valor suministrado por las
tablas de la F de Snedecor de los grados de libertad señalados y al nivel de
confianza α prefijado, es decir, se compara el valor de
1 ˆ
[M - D M * ] ′[Mˆ - D M * ]
k
F=
(31)
r
r
1
[M - Mˆ - N M * ] ′[M - Mˆ + N M * ]
n-k
con F k,n- k ( α) , concluyéndose de igual forma que en el epígrafe 5.
r
Obsérvese que si no hay error de especificación, entonces µ(t ) = Xb y
r
r
r
r
Dµ (t ) = X(X ′X )-1 X ′X b = Xb = µ(t ) por lo que (30) coincide con (22), pues
r
r
r
r
r
r
Nµ( t ) = (I - D) µ( t ) = µ(t ) - D µ(t ) = µ( t ) - µ( t ) = 0
BIBLIOGRAFÍA
HERRERÍAS, R. Y CALVETE, H. (1987). "Una ley de probabilidad para el estudio de
los flujos de caja de una inversión ". Libro -Homenaje al Prof. Gonzalo Arnaiz
Vellando, pp 279-296, INE, Madrid.
HERRERÍAS, R. (1989). "Modelos probabilísticos alternativos para el método PERT.
Aplicación al análisis de inversiones". Estudios de Economía Aplicada, pp 89112. Secretariado de Publicaciones. Universidad de Valladolid.
HERRERÍAS, R, PALACIOS, F Y PÉREZ, E. (1993). "Una medida sobre la adecuación
de las estimaciones subjetivas con el modelo del PERT clásico". Estudios de
Economía Aplicada, pp 419-425. Servicio de Publicaciones, Universidad de Cádiz.
JOHNSTON, J. (1987). Métodos de Econometría . Ed. Vicens Universidad. Barcelona.
THOMAS, G. (1968). "Introduction de l'aleatoire dans les problèmes d'ordonnancement.
Méthode de simulation". Incluido en J.Agard, Les méthodes de simulation, pp 107124. Ed Dunod. Paris
Artículo defendido en la VIII Reunión Anual de ASEPELT-ESPAÑA, celebrada en 1994
en la Universidad de las Islas Baleares. Publicado en las Actas de la mencionada
Reunión: Estudios d e Economía Aplicada, Volumen 1, páginas 153-159.
Índice
Índice de autores
Descargar