Estudi,o de la restricción a reglas de decisión no^ aleatorizadas

Anuncio
ESTADiSTICA ESPAÑ4LA
Núm. 97, 1982, págs. 119 a 126
Estud i,o de la restricción a reglas de dec is ión
no^ aleatorizadas para el criterio R-^
por J. DE LA HC^RRA NAVARRC^
Departamento de Estedística
e Investigación C)perative
Facultad de Ciencias ^llatemáticas
(Universided Complutense de Medrid)
RESUMEN
Se considera el criterio R-E en un problema de decisión (^H , D*, R)
con ^H finito y se estudia el efecto de la restricción a reglas no aleatorizadas. Se encuentra una condición necesaria y suficiente para que se
verifique, en todo problema de decisión, que el ínfimo de los riesgos R-E
sea el mismo sobre D( reglas no aleatorizadas) que sobre D* (reglas
aleatorizadas).
Palabras ^•!a ^•e: Criterio R-E , reglas de decisión aieatorizadas, reglas de
decisión no aleatorizadas.
l.
INTRCIDUCCIUN
Consideremos un problema de dec isión (^H , A, L}, y sea X una variable aleatoria
tomando valores en x y con distribución de probabilidad P,^(X). Representamos por D*
el conjunto de reglas de decisión aleatorizadas. Cada ó E D* viene representada por su
función de riesgo R{Et, b), como es usual. Para cada ii tijo, suponemos que R(8, ó) es
función medible con respecto a una cs -álgebra apropiada ( que será la discreta si ^H es
finito).
ESTADISTit A E sP,+'^ÑO!_A
Dacia una distribución de probabilidad T sobre (^ y un valor f: E[U,1), podemc^s
aplicar el criteriu R-E para orcienar las reglas de dec isión ^i , como se indicó en D^e la
Horra ( lyKl ). En definitiva, si GS es la funcián de distribución inducida por R(t}, ó) a
partir de t, ^;e definia e1 riesgo R^ de ^^ D*, cuandc3 la distribución sobre ^H es j,
c:c^mo
R^1t, d) = min {y E iR/Ga^v) >_ 1-^:}
, E D* es la regla R-e, con respecto a la distribución t, cuando
F^ (t • do) ^ RE (r . L^ ), t^ ^^ D*
.
.
En el casc^ especialmente Impcartante de que H sea finito, H, _{E)^, ..., E^„}, cada
d^ D* viene representada por un vector ( R(f^,, ó), ..., R(f)n, ^i)) E R,,, y de lo que se
trata es de ordenar estos vectores.
La distribucián r vendrá dada ahc^ra por
PT(^^; ) - P; , t!i = 1,
Entonces, si el vector de riesgo de b, (R(Et,, ^i), . .., R(f>,,, d)) _(X,, ..., Xn), se
sitúa en la región {(X, ..., X„)/X,^,, _< ... _< X;^n^} (que representaremos abreviadamente
por X;^1^ ^... ^ X,^n^), tendremos RE (t , t^ )= X;^k,, si y sólu si
P^^1 ^ + .., + P;,^_!^ < 1 - ^
P;t ^ ^ + . . . + P;^k ^ >_ 1 - E
Por tanto, en esa región es [a coordenada X;^k^ la que da el riesgo R-E .
2.
ESTUDIO DE LA RESTRICCION A REGLAS DE DECISION NO
ALEATOR[ZADAS
Consideremos, entonces, (Hi fnito, y la aplicación del criteriu R-^ como se ha
indicado en el párrafo anterior.
Una cuestión que se plantea de modo natural es la tiiguiente, siendo D el conjunto
de reglas de decisión no aleatorizadas: A1 aplicar el criterio R-E, ^,podemos restringirnos
a las reglas no aleatarizadas, en cualquier problema de decisión, sin sutrir ningún
perjuicio?
O dicho más formalmente: al aplicar el criterio R-£, ^,se verif<ca, en todo problema
de decisión, que
inf
bE D"
RE(t , ó) = inf RE(t , d)?
dE D
ESTUDIO DE LA RESTRICCION A R^GLAS DE DEC[Sloht NU ALEATORIZADAS PARA EL CRiTE Ri0 R-F I Z l
Recordemos que la respuesta es afirmativa para el eriterio Sayes, y negativa para el
criterio minimax.
:
Para el c: riterio R-^ basta observar lo que oc urre c uando ^H ={{^ ,,^ 2}, para darnos
cuenta de que los cuatro tipos posibles de ordenaciones R-E , que se obtienen para
distintas combinaciones de P= (p ,, p 2) y E, en tres de ellas se verifica la igualdad de
los ^nfimos, pero en la cuarta no es cierto para todo problema de decisión.
En vista de esto, lo lógico es modificar la pregunta anterior, y plantearnos lo
siguiente:
^,Qué condiciones debe verificar una ordenación R-E para que en todo problerna de
decisión se verifique que
inf
bED•
R^tt , b)= inf R^(z , d)`?
dEn
Para dar una primera respuesta a este problema, pensemos en la ordenación de
vectores producida por un criterio cualquiera V, considerado como una aplícación V:
R" -^ R, de tal manera que un vector (X,, ..., X") será preferido a otro (y,, ..., y„) si
V( X, , . . ., X„) _< V(y , , . . . , y") ( desernpeña, por tanto, el papel de un riesgo). Si ( X, , . . . ,
X,^) es el vector de riesgo de b, emplearemos la notación V(X,, ..., X") = V(F),
Probamos, entonces, el siguiente resultado general:
TEfJREMA
Sea ^H finito, y V un criterio cualquiera. Una condicián necesaria y suficiente para
que en todo problema de decisión se tenga que
inf V(^ ) = inf V(d )
dED
SED'
es que los conjuntos {(X,, ..., X") E[R"/V(X,, ..., X") >_ k} sean convexos, dk E IR.
DpmuslracFi^n
a) Sea S el conjunto de vectores de riesgo en un prob[ema de decisión cuatquiera,
y supongamos que {{X,, ..., X") E IR"/V(X,, ..., X"} > k} es convexo, dK E 1R.
S es la cápsula convexa del conjunto de riesgo no aleatorizado S^.
i22
ESTADtSTICA ESPAIVOLA
Sea K^, = inf V(D); en tonce s:
eu^
S^^ C {tX,, ..., ^yV(X,. ..., X„) > K^^
que es convexo.
Como S es la cápsuta convexa de Sb,
S C{(X,. ..., X„^^/V(X,, ..., X„) ^ Koi
Luego, b6 E D*: V(ó ) z Ko, y, por tanto: inf V(b) ^ I{^,
s t DEn definitiva, inf V(ó )= inf V{d ), ya que mayor no puede ser, y la condición es
d^E°
^D*
suficiente.
b>
Probarnos que la condición es necesaria por reducción al absurdo. Sea
{(X,, ..., X,,,1 E IR"/V(X,, ..., X„) >_ K^,}
no convexo; esto significa que podemos encontrar
(X,. ..., X") e {y,, ..., V")
tales que
V(X,, ..., X,^) >_ K,,, V(y,, ..., y") ? K^ ^
y para algún a^ E(0,1), el vector
(Z,, ..., Z") _ ^^(X1, ..., X,^) + (1 - h) (y,, ..., y")
verifica que V( "L, ,., ., Z„) < K^.
Considerando entonces un problema de decisión con dos reglas de decisión no
aleatorizadas d, y d^ cuyos vectores de riesgo sean, respectivamente (X,, ..., X")
(y,, ..., y"), resulta que el vector (1,, ..., I^) corresponde a una regla aleatorizada, y así
inf V(b) < inf V{d)
dED
bED•
c.q.d..
Esta condición necesaria y suficiente general, al intentar aplicarla al criterio R-E
para P=(p,, ..., pM) y E dados, tiene el inconveniente de que no podemos saber de
una manera directa, si se verifica o no.
EST^,1Dl^^ DE LA RESTRICCION A REGLAS DE DECISION NO" ALEATC3RIZADAS PARA EL CR1TERt© R-^ I Z3
Es convenienie, p^ar este motivo, que intentemos enunciar esta condición de una
manera equivalente, pero que tenga en cuenta la coordenada que mide el riesgo R^ en
cada región X;^1^ ^ ... ^ X;w^.
Vol vamos a pe nsar, para esto, en el caso en que
H^ _ {^ t,^ 2}. C uando la
ordenación R-E coincide con la minimax ( único caso de los cuatro en que la aleatorización es capaz de disminuir el riesgo), observamos que en la regián X, ^ X2, la
coordenada X2 que mide el riesgo R-E en dicha región es mayor que la coordenada X,
que mide el riesgo R^ en la otra región.
Esta circunstancia sólo ocurre en esta ordenación R-^, de las cuatro posibles para
n = 2.
Esto nos lleva a pensar que, posiblemente, se trate de una caracterización del
problema que se intenta resolver, como efectivamente ocurre:
TEOREMA
Sea X;^tkr ^ la coordenada que mide el riesgo R-E en la región X;^^iy <_ ... < X;^{A^,
t-- 1. ..., n! É para P-(p,, .., ^,^) y E dados].
Una condición necesaria y suficiente para que en todo problema de decisión se tenga
que
inf R,^(T , ó)= irtf RE(i , d)
^D'
dED
es que
dj, t E { l, ..., n!} se tenga X^^^^^ > X;^^k^^ en la región X;t^lj ^... S X;r^"^.
Demvstrucic^n
Si el vector de riesgo asociado a b es (X^, ..., X,; ), pondremos
R^(z, a) -- ^.t(X,, ..., X").
Por el teorema anterior, lo que tenemos que probar es que esta nueva cond ición es
equivalente a Ia convexidad de los conjuntos {(X,, ..., X") ^ R"/RE,T(X,, ..., X,;) ? K}.
u)
Supongamos cierta 1a condición del enunciado, y tomemos
(X,, ..., X,^) e w,, ..., y")
del conjunto
{(X,, ..., X„) E R."/^.^(X,, ..., X") ? K}
ESTADISTtC,^^ ESPAÑOLA
124
Sea
R€.t^X^• ..., X„) - x;r^k ^ 1
Para ^^ E ( 0.1) , formamas ( Z, , . . . , ZM, ) = ^^ ( X, . . . . , X„ ) + (1 - ^^ ) Cv , , . . . v,^ ), y se
tiene:
^.t(Zi, ... , ^^} - ^rj^kkt, ._ ^^ X,I`Ikli + (^ T ^)y'i(k!1 >
^ mín
{X ^ir^t.ii' Y^i^k.i^ }
Sin pérdida de generalidad, supongamos que este mínimo es X;^c^^, y tenemos, por
tanto:
RE,t(7. ^ , . . . , Z„ } ? X'iu^^ ?
X^,ckt}
por hipótesis.
Luego: R^.t( Z ^ . . .. , Z„) >_ X,^^,) = RE,t( X ^ , . . . , X") ? k
' prubada !a convexidad de {(X,, .. ., Xn) ^ R"/RE,t(X,, ..., X„) ? K}
quedandu as^
h)
Se hará pur reducción al absurdo: sean, para esto, las regiones
X^^ct) ^... ^ X;^c") Y X^^t) ^... ^ X^^(")
con coordenadas caracterizando el riesgo R-E, X;^ck, ^ Y X;j^,^^) respectivamente, tales que
en la primera regic^n Xr2(k=) ^^r,ck,1^
Tomamos ( X,, ..., X„) del interiar de la primera región y(,v,, ..., y„) de! interior de
1a segunda, de tal forma que R£,t(X, ,..., X„) = R^,tCv, ,..., y„) = k.
Se va a probar que {( X, , ..., X„) E^t"JR^,t( X, ,..., X„) ?
K} no es convexo.
Tomamos para esto {Z,, ..., Z„) _^^ (X,, ..., X„) +{ 1 -- ^^) Cv^. ..., y„), con a
suficientemente próximo a cer^, para que (Z,, ... Z„) pertenezca al interior de la
segunda región. Tenemos:
12F,i ( Z^
^ .. ••
Z„ )
= Z;^kZ^
^ t11iiX { xiz(k:i' ^^i2tk2)}
- t. X^:(k:l +( 1
- Rli3X { X ^^(ki ^ •
l^ ) ti'^:(ki)
^
R^.t( ti',, .... 1'„)}
= máx iXi:(k2), R^,t(.X,, ..., X")} = maX {X;=(k2), Xri(k^)
por la hipótesis
- X^^ck^^ ^ ^.t(X,, ,.,, X„) = K
no siendo, por tanto, convexo. c.q.d.
Esta condición es directamente comprobable para el criterica R-E, ya que lo que
requiere es anotar, para cada región X;ci, <... <_ X;^„^, i(K) y el conjunto
{i(k), i(k + 1), ..., i(n)}
y observar si se verii'ica la condición necesaria y suficiente hallada.
ESTUDIO DN LA RI^STRIC^C'K)N A RfrGLAS DE DE=C'ISION NO AI.E:ATORI"LADAS PARA F:l_ ('RITE'RIO R-t: l^5
Ciertamente, estas anutaciones son laboriosas, aunyue nu tantc^ como pudiera parecer en principio, ya que no hay que hacerlas para las n! regiones existentes, dado que al
ser E próximo a cero én la práctica, el riesgo R-E en X,^I^ ^... ^ X,^,,, vendrá dado par
una de las coordenadas mayores, no importando la forma en que se permutan las más
pequeñas.
En definitiva, dado P=(p ^, ..., p„) y E, se trata solamente de hallar aquellas valores
de p; tales que
P^^+^ ^ + ... + P<<,^^ { E
P^u^a + ... + P,i„^ > E
y anotar i{k ) y {i{k ), i(k + 1),
..., p;^^ tampoco influiría).
., i(n )}. ((^bviamente, el orden en que aparezcan p;^k + i,,
En el caso de ser E próximo a uno, se procederia de manera dual con las coordenadas más pequeñas.
BIBLIOGRAFIA
DE LA HoRRA, J.:« Ex istenc ia de reglas de decisión con mínimo riesgo R-rE ». Traóajcas de Estadrstica v de InvestiRación Operativa, 32, 43-51, 1981.
Ríos, S.: «Procesos dinámicos de decisión en concurrencia». Real Academia de Ciencias Exactas,
Físicas y Naturales de Madrid, 1967.
SUMMARY
Criterion R-E is considered tior a decision problem (^, D*, R), with
^_{E^,, ... , E)„} , and the effect of the restriction to nonrandomized rules
is tituciieci. A necessary and sut't'icient condition ti^r the infimum R-E risk to
be the same on D ( nonrandornizeci rules) and D* ( randornized rules), in
every deci:sion problem, is given,
Kc^v ^t•c^rds: Criterion R^ , randomized rules decision, nonrandomied rules
decision.
AMS, 1980, Subject cla.5sification: 62C'O5.
Descargar