ESTADiSTICA ESPAÑ4LA Núm. 97, 1982, págs. 119 a 126 Estud i,o de la restricción a reglas de dec is ión no^ aleatorizadas para el criterio R-^ por J. DE LA HC^RRA NAVARRC^ Departamento de Estedística e Investigación C)perative Facultad de Ciencias ^llatemáticas (Universided Complutense de Medrid) RESUMEN Se considera el criterio R-E en un problema de decisión (^H , D*, R) con ^H finito y se estudia el efecto de la restricción a reglas no aleatorizadas. Se encuentra una condición necesaria y suficiente para que se verifique, en todo problema de decisión, que el ínfimo de los riesgos R-E sea el mismo sobre D( reglas no aleatorizadas) que sobre D* (reglas aleatorizadas). Palabras ^•!a ^•e: Criterio R-E , reglas de decisión aieatorizadas, reglas de decisión no aleatorizadas. l. INTRCIDUCCIUN Consideremos un problema de dec isión (^H , A, L}, y sea X una variable aleatoria tomando valores en x y con distribución de probabilidad P,^(X). Representamos por D* el conjunto de reglas de decisión aleatorizadas. Cada ó E D* viene representada por su función de riesgo R{Et, b), como es usual. Para cada ii tijo, suponemos que R(8, ó) es función medible con respecto a una cs -álgebra apropiada ( que será la discreta si ^H es finito). ESTADISTit A E sP,+'^ÑO!_A Dacia una distribución de probabilidad T sobre (^ y un valor f: E[U,1), podemc^s aplicar el criteriu R-E para orcienar las reglas de dec isión ^i , como se indicó en D^e la Horra ( lyKl ). En definitiva, si GS es la funcián de distribución inducida por R(t}, ó) a partir de t, ^;e definia e1 riesgo R^ de ^^ D*, cuandc3 la distribución sobre ^H es j, c:c^mo R^1t, d) = min {y E iR/Ga^v) >_ 1-^:} , E D* es la regla R-e, con respecto a la distribución t, cuando F^ (t • do) ^ RE (r . L^ ), t^ ^^ D* . . En el casc^ especialmente Impcartante de que H sea finito, H, _{E)^, ..., E^„}, cada d^ D* viene representada por un vector ( R(f^,, ó), ..., R(f)n, ^i)) E R,,, y de lo que se trata es de ordenar estos vectores. La distribucián r vendrá dada ahc^ra por PT(^^; ) - P; , t!i = 1, Entonces, si el vector de riesgo de b, (R(Et,, ^i), . .., R(f>,,, d)) _(X,, ..., Xn), se sitúa en la región {(X, ..., X„)/X,^,, _< ... _< X;^n^} (que representaremos abreviadamente por X;^1^ ^... ^ X,^n^), tendremos RE (t , t^ )= X;^k,, si y sólu si P^^1 ^ + .., + P;,^_!^ < 1 - ^ P;t ^ ^ + . . . + P;^k ^ >_ 1 - E Por tanto, en esa región es [a coordenada X;^k^ la que da el riesgo R-E . 2. ESTUDIO DE LA RESTRICCION A REGLAS DE DECISION NO ALEATOR[ZADAS Consideremos, entonces, (Hi fnito, y la aplicación del criteriu R-^ como se ha indicado en el párrafo anterior. Una cuestión que se plantea de modo natural es la tiiguiente, siendo D el conjunto de reglas de decisión no aleatorizadas: A1 aplicar el criterio R-E, ^,podemos restringirnos a las reglas no aleatarizadas, en cualquier problema de decisión, sin sutrir ningún perjuicio? O dicho más formalmente: al aplicar el criterio R-£, ^,se verif<ca, en todo problema de decisión, que inf bE D" RE(t , ó) = inf RE(t , d)? dE D ESTUDIO DE LA RESTRICCION A R^GLAS DE DEC[Sloht NU ALEATORIZADAS PARA EL CRiTE Ri0 R-F I Z l Recordemos que la respuesta es afirmativa para el eriterio Sayes, y negativa para el criterio minimax. : Para el c: riterio R-^ basta observar lo que oc urre c uando ^H ={{^ ,,^ 2}, para darnos cuenta de que los cuatro tipos posibles de ordenaciones R-E , que se obtienen para distintas combinaciones de P= (p ,, p 2) y E, en tres de ellas se verifica la igualdad de los ^nfimos, pero en la cuarta no es cierto para todo problema de decisión. En vista de esto, lo lógico es modificar la pregunta anterior, y plantearnos lo siguiente: ^,Qué condiciones debe verificar una ordenación R-E para que en todo problerna de decisión se verifique que inf bED• R^tt , b)= inf R^(z , d)`? dEn Para dar una primera respuesta a este problema, pensemos en la ordenación de vectores producida por un criterio cualquiera V, considerado como una aplícación V: R" -^ R, de tal manera que un vector (X,, ..., X") será preferido a otro (y,, ..., y„) si V( X, , . . ., X„) _< V(y , , . . . , y") ( desernpeña, por tanto, el papel de un riesgo). Si ( X, , . . . , X,^) es el vector de riesgo de b, emplearemos la notación V(X,, ..., X") = V(F), Probamos, entonces, el siguiente resultado general: TEfJREMA Sea ^H finito, y V un criterio cualquiera. Una condicián necesaria y suficiente para que en todo problema de decisión se tenga que inf V(^ ) = inf V(d ) dED SED' es que los conjuntos {(X,, ..., X") E[R"/V(X,, ..., X") >_ k} sean convexos, dk E IR. DpmuslracFi^n a) Sea S el conjunto de vectores de riesgo en un prob[ema de decisión cuatquiera, y supongamos que {{X,, ..., X") E IR"/V(X,, ..., X"} > k} es convexo, dK E 1R. S es la cápsula convexa del conjunto de riesgo no aleatorizado S^. i22 ESTADtSTICA ESPAIVOLA Sea K^, = inf V(D); en tonce s: eu^ S^^ C {tX,, ..., ^yV(X,. ..., X„) > K^^ que es convexo. Como S es la cápsuta convexa de Sb, S C{(X,. ..., X„^^/V(X,, ..., X„) ^ Koi Luego, b6 E D*: V(ó ) z Ko, y, por tanto: inf V(b) ^ I{^, s t DEn definitiva, inf V(ó )= inf V{d ), ya que mayor no puede ser, y la condición es d^E° ^D* suficiente. b> Probarnos que la condición es necesaria por reducción al absurdo. Sea {(X,, ..., X,,,1 E IR"/V(X,, ..., X„) >_ K^,} no convexo; esto significa que podemos encontrar (X,. ..., X") e {y,, ..., V") tales que V(X,, ..., X,^) >_ K,,, V(y,, ..., y") ? K^ ^ y para algún a^ E(0,1), el vector (Z,, ..., Z") _ ^^(X1, ..., X,^) + (1 - h) (y,, ..., y") verifica que V( "L, ,., ., Z„) < K^. Considerando entonces un problema de decisión con dos reglas de decisión no aleatorizadas d, y d^ cuyos vectores de riesgo sean, respectivamente (X,, ..., X") (y,, ..., y"), resulta que el vector (1,, ..., I^) corresponde a una regla aleatorizada, y así inf V(b) < inf V{d) dED bED• c.q.d.. Esta condición necesaria y suficiente general, al intentar aplicarla al criterio R-E para P=(p,, ..., pM) y E dados, tiene el inconveniente de que no podemos saber de una manera directa, si se verifica o no. EST^,1Dl^^ DE LA RESTRICCION A REGLAS DE DECISION NO" ALEATC3RIZADAS PARA EL CR1TERt© R-^ I Z3 Es convenienie, p^ar este motivo, que intentemos enunciar esta condición de una manera equivalente, pero que tenga en cuenta la coordenada que mide el riesgo R^ en cada región X;^1^ ^ ... ^ X;w^. Vol vamos a pe nsar, para esto, en el caso en que H^ _ {^ t,^ 2}. C uando la ordenación R-E coincide con la minimax ( único caso de los cuatro en que la aleatorización es capaz de disminuir el riesgo), observamos que en la regián X, ^ X2, la coordenada X2 que mide el riesgo R-E en dicha región es mayor que la coordenada X, que mide el riesgo R^ en la otra región. Esta circunstancia sólo ocurre en esta ordenación R-^, de las cuatro posibles para n = 2. Esto nos lleva a pensar que, posiblemente, se trate de una caracterización del problema que se intenta resolver, como efectivamente ocurre: TEOREMA Sea X;^tkr ^ la coordenada que mide el riesgo R-E en la región X;^^iy <_ ... < X;^{A^, t-- 1. ..., n! É para P-(p,, .., ^,^) y E dados]. Una condición necesaria y suficiente para que en todo problema de decisión se tenga que inf R,^(T , ó)= irtf RE(i , d) ^D' dED es que dj, t E { l, ..., n!} se tenga X^^^^^ > X;^^k^^ en la región X;t^lj ^... S X;r^"^. Demvstrucic^n Si el vector de riesgo asociado a b es (X^, ..., X,; ), pondremos R^(z, a) -- ^.t(X,, ..., X"). Por el teorema anterior, lo que tenemos que probar es que esta nueva cond ición es equivalente a Ia convexidad de los conjuntos {(X,, ..., X") ^ R"/RE,T(X,, ..., X,;) ? K}. u) Supongamos cierta 1a condición del enunciado, y tomemos (X,, ..., X,^) e w,, ..., y") del conjunto {(X,, ..., X„) E R."/^.^(X,, ..., X") ? K} ESTADISTtC,^^ ESPAÑOLA 124 Sea R€.t^X^• ..., X„) - x;r^k ^ 1 Para ^^ E ( 0.1) , formamas ( Z, , . . . , ZM, ) = ^^ ( X, . . . . , X„ ) + (1 - ^^ ) Cv , , . . . v,^ ), y se tiene: ^.t(Zi, ... , ^^} - ^rj^kkt, ._ ^^ X,I`Ikli + (^ T ^)y'i(k!1 > ^ mín {X ^ir^t.ii' Y^i^k.i^ } Sin pérdida de generalidad, supongamos que este mínimo es X;^c^^, y tenemos, por tanto: RE,t(7. ^ , . . . , Z„ } ? X'iu^^ ? X^,ckt} por hipótesis. Luego: R^.t( Z ^ . . .. , Z„) >_ X,^^,) = RE,t( X ^ , . . . , X") ? k ' prubada !a convexidad de {(X,, .. ., Xn) ^ R"/RE,t(X,, ..., X„) ? K} quedandu as^ h) Se hará pur reducción al absurdo: sean, para esto, las regiones X^^ct) ^... ^ X;^c") Y X^^t) ^... ^ X^^(") con coordenadas caracterizando el riesgo R-E, X;^ck, ^ Y X;j^,^^) respectivamente, tales que en la primera regic^n Xr2(k=) ^^r,ck,1^ Tomamos ( X,, ..., X„) del interiar de la primera región y(,v,, ..., y„) de! interior de 1a segunda, de tal forma que R£,t(X, ,..., X„) = R^,tCv, ,..., y„) = k. Se va a probar que {( X, , ..., X„) E^t"JR^,t( X, ,..., X„) ? K} no es convexo. Tomamos para esto {Z,, ..., Z„) _^^ (X,, ..., X„) +{ 1 -- ^^) Cv^. ..., y„), con a suficientemente próximo a cer^, para que (Z,, ... Z„) pertenezca al interior de la segunda región. Tenemos: 12F,i ( Z^ ^ .. •• Z„ ) = Z;^kZ^ ^ t11iiX { xiz(k:i' ^^i2tk2)} - t. X^:(k:l +( 1 - Rli3X { X ^^(ki ^ • l^ ) ti'^:(ki) ^ R^.t( ti',, .... 1'„)} = máx iXi:(k2), R^,t(.X,, ..., X")} = maX {X;=(k2), Xri(k^) por la hipótesis - X^^ck^^ ^ ^.t(X,, ,.,, X„) = K no siendo, por tanto, convexo. c.q.d. Esta condición es directamente comprobable para el criterica R-E, ya que lo que requiere es anotar, para cada región X;ci, <... <_ X;^„^, i(K) y el conjunto {i(k), i(k + 1), ..., i(n)} y observar si se verii'ica la condición necesaria y suficiente hallada. ESTUDIO DN LA RI^STRIC^C'K)N A RfrGLAS DE DE=C'ISION NO AI.E:ATORI"LADAS PARA F:l_ ('RITE'RIO R-t: l^5 Ciertamente, estas anutaciones son laboriosas, aunyue nu tantc^ como pudiera parecer en principio, ya que no hay que hacerlas para las n! regiones existentes, dado que al ser E próximo a cero én la práctica, el riesgo R-E en X,^I^ ^... ^ X,^,,, vendrá dado par una de las coordenadas mayores, no importando la forma en que se permutan las más pequeñas. En definitiva, dado P=(p ^, ..., p„) y E, se trata solamente de hallar aquellas valores de p; tales que P^^+^ ^ + ... + P<<,^^ { E P^u^a + ... + P,i„^ > E y anotar i{k ) y {i{k ), i(k + 1), ..., p;^^ tampoco influiría). ., i(n )}. ((^bviamente, el orden en que aparezcan p;^k + i,, En el caso de ser E próximo a uno, se procederia de manera dual con las coordenadas más pequeñas. BIBLIOGRAFIA DE LA HoRRA, J.:« Ex istenc ia de reglas de decisión con mínimo riesgo R-rE ». Traóajcas de Estadrstica v de InvestiRación Operativa, 32, 43-51, 1981. Ríos, S.: «Procesos dinámicos de decisión en concurrencia». Real Academia de Ciencias Exactas, Físicas y Naturales de Madrid, 1967. SUMMARY Criterion R-E is considered tior a decision problem (^, D*, R), with ^_{E^,, ... , E)„} , and the effect of the restriction to nonrandomized rules is tituciieci. A necessary and sut't'icient condition ti^r the infimum R-E risk to be the same on D ( nonrandornizeci rules) and D* ( randornized rules), in every deci:sion problem, is given, Kc^v ^t•c^rds: Criterion R^ , randomized rules decision, nonrandomied rules decision. AMS, 1980, Subject cla.5sification: 62C'O5.