Teorı́a de la Decisión Estadı́stica Ejercicios 1. Una librerı́a debe decidir cuántas revistas pedir. Las compra a 20 euros y las vende a 25. Las revistas que no vende al final del dı́a no tienen valor. La librerı́a sabe que cada dı́a puede vender con igual probabilidad entre 6 y 10 revistas. ¿Cuántos ejemplares debe pedir? 2. Un vendedor de revistas hace semanalmente un pedido de una cierta revista, cuyo coste unitario es de 400 euros y su precio de venta 500. Se supone que cada unidad no vendida en la semana constituye una pérdida de 5 euros. La demanda vale 0, 1 ó 2, pero es desconocida su ley de probabilidad. Buscar la decisión óptima en los distintos ambientes posibles si se desea ganar lo máximo posible. 3. Según los criterios de decisión, determinar con cada uno de ellos cuál serı́a la decisión óptima: a1 a2 a3 a4 θ1 2 1 0 1 θ2 2 1 4 3 θ3 0 1 0 0 θ4 1 1 0 0 teniéndose la siguiente distribución sobre los estados: (0.35, 0.2, 0.2, 0.25). 4. Una compañı́a de construcción está considerando si participar o no en la realización de un centro comercial. El principal problema para la compañı́a estriba en el resultado del convenio que se está negociando con los trabajadores. El beneficio previsto es de 20 millones de euros siempre y cuando sus trabajadores acepten la propuesta que se está negociando. Por el contrario, si no se aprueba el convenio, los beneficios serı́an de 10 millones de euros, debido a la gran cantidad de mano de obra exigida por el proyecto. La evolución histórica de los últimos convenios dice que en un 80% de ellos se ha aprobado la propuesta de la empresa. La compañı́a ha recibido otra oferta que garantiza unos beneficios de 16.5 millones de euros, con total seguridad, ya que prácticamente no exige mano de obra, sino fundamentalmente maquinaria. Para hacer su elección, la compañı́a acuerda hacer una consulta a un grupo de expertos en cuestiones sindicales, cuya respuesta ha sido: ’Existe una alta correlación entre el nivel de inflación y el porcentaje de negociaciones aceptadas, y se ha determinado que en 7 de cada 10 casos de huelga, ha habido una alta inflación y por el contrario, en casos de convenios con acuerdos sólo en 2 de cada 7 casos ha habido una alta inflación...’ La compañı́a sabe con seguridad que en el año actual el ı́ndice de inflación es muy alto. (a) Obtener la decisión óptima sin utilizar la información de la inflación. (b) Analizar si se alteran o no los resultados utilizando la información dada por el sindicato. 1 (c) Analizar el beneficio monetario esperado en los dos casos, y determinar qué cantidad estarı́a dispuesta a pagar la compañı́a por obtener un informe sobre si hay alta o baja inflación. 5. Describir el siguiente problema de decisión: Una persona tiene que desplazarse de un lugar a otro en una gran ciudad. Después de recorrer varios itinerarios, encuentra que dos son los mejores, uno atraviesa la ciudad y el otro va por la carretera de circunvalación. Cuando el tráfico es fluido por el primer camino sólo tarda 15 minutos, pero cuando no lo es tarda 35 minutos. Si va por el segundo la duración es de 25 minutos y el tráfico siempre es uniforme. ¿Cuál de los dos debe elegir? 6. Supongamos que en X, es una relación transitiva y conexa, y definamos ≺ y ∼ como sigue: x ≺ y ≡ no(y x) x ∼ y ≡ [x y Λ y x] Demostrar que ≺ es un orden débil y ∼ es de equivalencia. 7. Se dice que es un casi-orden en X si es reflexiva y transitiva. Demostrar que si es un casi-orden en X y definimos ≺ y ∼ como en el ejercicio anterior, entonces: (a) ∼ es de equivalencia. (b) ≺ no es transitivo. (c) ∀x, y, z ∈ X x ∼ y Λ y ≺ z ⇒ x ≺ z; x≺yΛy∼z⇒x≺z 8. Demostrar que si (A, ) es un orden débil, entonces (A, ) es un orden débil reflexivo, donde x y si y solo si (sii) x y o x ∼ y. 9. Si ≺ es una relación en X, se define su cierre transitivo ≺t como: ( t x≺ y⇔ ó x ≺ y ó ∃ x1 , ..., xm tales que x ≺ x1 ≺ ... ≺ xm ≺ y Demostrar que si ≺t es asimétrica, entonces ≺t es un orden parcial estricto. 10. Sea A = {(a, b)/a, b ∈ {1, 2, 3, 4}} con (a, b)R(c, d) ⇔ a > c. Demostrar que (A, R) es un orden débil y calcular su reducción. 11. Consideremos un experimento en el cual una persona fija inicialmente un cierto número de unidades monetarias m, y posteriormente observa el valor de una variable continua Y . Si Y ≥ m entonces dicha persona recibe una recompensa igual a Y unidades monetarias. Si Y < m entonces recibe una recompensa aleatoria X siguiendo una distribución dada. Se supone que X e Y son variables aleatorias independientes. Demostrar que para maximizar la utilidad esperada de su recompensa, la persona en cuestión deberı́a fijar inicialmente un número m tal que u(m) = E[u(X)]. 12. Sean p y m dos números prefijados de antemano, y consideremos la siguiente situación: una persona dispone de m unidades que puede apostar distribuidas entre un suceso A con probabilidad p y su complementario. Cuando ocurre cualquiera de los sucesos obtiene una recompensa igual a lo apostado a ese suceso. Determinar la apuesta más preferida cuando la función de utilidad en [0, m] es la siguiente: 2 (a) u(r) = rα , con α > 1 (b) u(r) = r (c) u(r) = log r (d) u(r) = 2 r m0 − r m0 2 , donde m0 > m 13. Supóngase que dos personas A y B poseen una fortuna igual a x0 euros, y que ambos tienen 1 la misma utilidad u de tener una fortuna de x euros que es u(x) = (x − x0 ) 3 . Uno de los dos recibe como regalo un billete de loterı́a que proporciona un premio de r euros o un premio de 0 euros con igual probabilidad. Demostrar que existe un número b > 0 con la propiedad siguiente: ’Cualquiera que sea el que reciba el premio, puede venderlo al otro por b euros siendo la venta ventajosa para ambos’. 14. Consideremos una rueda de ruleta dividida en k sucesos disjuntos A1 , ..., Ak tales que P (Ai ) = pi , i = 1, ..., k. Supongamos que un jugador dispone de m unidades monetarias para apostarlas entre todos los sucesos, y que recibe como recompensa la cantidad xi que ha apostado al suceso Ai cuando este suceso ocurre. Si la función de utilidad de una recompensa positiva r es u(r) = log(r), demostrar que la distribución óptima de apuesta es la dada por xi = m pi , para i = 1, ..., k. 15. Una persona pretende vender refrescos en un espectáculo, y debe decidir de antemano cuántas botellas debe adquirir. Supongamos que por cada botella que vende gana m unidades monetarias, e incurre en una pérdida de c por cada una que no consigue vender. La demanda de botellas se puede aproximar por una variable aleatoria X, siendo la utilidad de un beneficio r igual a dicho beneficio. Demostrar que la cantidad α de botellas que debe adquirir corresponde m de la citada variable. al percentil m+c 16. Dos cajas C1 y C2 contienen ambas bolas blancas y bolas negras. La proporción de blancas en C1 es 1/2 y en C2 es X. Dicha proporción X es desconocida, pero se sabe que sigue una distribución sobre (0, 1) con media 1/4 y varianza 1/16. Un jugador puede seleccionar sucesiva y aleatoriamente n bolas con la condición de que todas ellas sean extraı́das de la misma caja, devolviendo la bola a su caja después de cada extracción. Dicho jugador recibe una ganancia de 1 unidad monetaria por cada bola blanca extraı́da y 0 por cada bola negra. Se pide analizar qué caja preferirá elegir el jugador suponiendo que la función de utilidad de una ganancia r es u(r) = r2 − n2 . 17. Supongamos que dos personas A y B desean hacer una apuesta. A pagará a B una unidad si ocurre un determinado suceso S, y B pagará x unidades a A si no ocurre S. Supongamos que tanto A como B acuerdan que P (S) = p, 0 < p < 1, y que las utilidades uA y uB son funciones estrictamente crecientes en las ganancias monetarias. Demostrar que existe un valor x que es mutuamente ventajoso para ambos si y sólo si u−1 A uA (0) − p uA (−1) 1−p ! <x< −u−1 B uB (0) − p uB (1) 1−p ! 18. Supóngase que la fortuna de una persona es de x0 euros, y tiene la oportunidad de comprar un billete de loterı́a que proporcione un premio de r euros ó 0 con igual probabilidad. Su función de utilidad es u(x) = log(x), con x > 0. Demostrar que la persona debe comprar el billete de loterı́a para cualquier cantidad b tal que q 1 b < x0 + r − r2 + 4 x20 2 3 19. Suponiendo Θ = {0, 1}, ξ = { 43 , 14 } como distribución a priori, buscar el riesgo Bayes y la acción Bayes (si existe) cuando: (a) A = [0, 1] y L(θ, a) = |θ − a| (b) A = (0, 1] y L(θ, a) = |θ − a| (c) A = [0, 1] y L(θ, a) = |θ − a|α , α > 1 20. Buscar la acción minimax en los siguientes casos: (a) A = [0, 1], Θ = {0, 1} y L(θ, a) = |θ − a| (b) A = Θ = [0, 1] y L(θ, a) = |θ − a| (c) A = Θ = [0, 1] y L(θ, a) = |θ − a|2 21. Una compañı́a va a lanzar al mercado un nuevo tipo de coche, y se quiere determinar el número de unidades a producir. Mediante un estudio de mercado se puede obtener información sobre la proporción θ de población con intención de comprar el nuevo modelo de coche. Se sabe que la venta viene influenciada por el estado de la economı́a Y , el cual es desconocido, pero sigue una distribución U(0, 1). Se supone que Z = (1 + Y ) 107 θ es el número de coches vendidos. Por cada venta se obtiene un beneficio de 500, y una pérdida de 300 unidades cada coche no vendido. Suponiendo u(m) = m para una ganancia m, determinar la función de pérdida L(θ, a). 22. Tres personas pretenden simultáneamente una plaza de avión que ha sido cancelada. El horario de vuelo exige que la lista de pasajeros esté completa y cerrada a las 5 de la tarde, y para ello la compañı́a abre aleatoriamente la lista de espera entre las 4 y las 5, y la reserva debe hacerse por teléfono por parte de los interesados. Se supone que • cada una de las tres personas dispone de una única moneda para llamar por teléfono, • el primero que llama estando abierta la lista, obtiene la plaza y • la utilidad para cada una de las personas es: u(obtener la plaza) u(otro obtenga la plaza) = −1, u(ninguno obtenga la plaza) = 0 = 1, Se pide (a) Hallar la función de utilidad de un pasajero determinado. (b) Si suponemos que B y C llaman aleatoria e independientemente entre las 4 y las 5, encontrar un camino para determinar la acción Bayes para A. 23. Un casino tiene dos mesas de juego, cada una con una ruleta. El casino siempre juega con una ruleta trucada, en la cual la probabilidad de obtener rojo es 1/4. Calcular respecto a una función de probabilidad ξ dada, cuál serı́a la decisión a tomar (es decir: en qué mesa está la ruleta no trucada), sabiendo que la función de pérdida es de tipo {0,1} (0 si acierta, 1 si falla), realizando para ello una sola jugada en la mesa A y apostando siempre por rojo. 24. Sea A = Θ = [0, 1], L(θ, a) = (θ − a)2 , (X, BX , Pθ ) tal que X sigue una binomial B(2, θ). Sean las reglas no aleatorizadas d1 (x) = x/2, d2 (x) = 1/2, y consideremos la aleatorizada δ que elige entre d1 y d2 con probabilidad 1/2. Calcular R(θ, δ). Suponiendo que la distribución inicial es una uniforme en el intervalo (0, 1), determinar R(ξ, δ). 4 25. Dado el problema de decisión (A, Θ, L), con A = <, θ = N , L(θ, a) = (θ − a)2 , realizamos ˙ ˙ es la función de densidad de una una experimentación X = < y (X, BX , f (|θ)) tal que f (|θ) 2 distribución χθ . Calcular: (a) L(θ, a∗ ) en (A∗ , Θ, L), siendo a∗ ≡ N (µ, σ 2 ). (b) R(θ, d) en (D, Θ, R), siendo d(x) = x − 7. (c) Determinar R(ξ, d) para una distribución inicial de Poisson de parámetro λ. 26. Dado el problema de decisión (A, θ, L) donde A = {a1 , a2 }, Θ = [0, 1], L(θ, ai ) = θi . Se realiza una experimentación x ∈ X = {x0 , x1 , x2 } tal que tenemos definido (X, BX , Pθ ) siendo Pθ ≡ B(2, θ). (a) Determinar el conjunto de decisiones y sus riesgos asociados (D, Θ, R). (b) Calcular en (D∗ , Θ, R) los riesgos correspondientes a δ0 ≡ U (D) y δ1 ≡ B(7, 1/2). (c) Dado (D, Θ, R), calcular los riesgos R(τ0 , d1 ), R(τ1 , d2 ) si τ0 ≡ U (0, 1) y τ1 es la distribución sobre Θ con densidad f (θ) = 2 θ en [0, 1]. 27. Probar los siguientes resultados a partir de los axiomas 1 al 3: (a) Si A, B y D son tres sucesos tales que A B y B ≺ D entonces A ≺ D. (b) Si A y B son dos sucesos, entonces A B si y sólo si Ac B c . (c) Si A y B son sucesos tales que A ⊂ B entonces A B. (d) Si A1 , . . . An y B1 , . . . Bn son sucesos tales que Bi Bj = ∅ para i 6= j y Ai Bi para S S i = 1, 2, . . . , n entonces ni=1 Ai ni=1 Bi . Si además Ai ≺ Bi para al menos algún valor S S de i, entonces ni=1 Ai ≺ ni=1 Bi . Además, el resultado sigue siendo cierto si la condición de que los Bi sean disjuntos se sustituye por la condición (más débil) que Bi Bj ∼ ∅ para i 6= j. 28. Supóngase los axiomas 1 al 3. Si A1 , . . . Am son sucesos disjuntos y B1 , . . . Bn también, tales S S que ni=1 Ai = ni=1 Bi = S, A1 · · · Am , B1 · · · Bn y m ≤ n, probar que B1 Am . Pruébese también que si m < n entonces B1 ≺ Am . 29. Probar los siguientes enunciados a partir de los axiomas 1 al 4: (a) Si A1 ⊃ A2 ⊃ · · · es una secuencia decreciente se sucesos y B es otro suceso tal que T∞ i=1 Ai ≺ B, entonces B Ai sólamente para un número finito de valores de i. Enunciar y probar el resultado análogo para una secuencia creciente de sucesos A1 ⊂ A2 ⊂ · · ·. (b) Si A1 ⊂ A2 ⊂ · · · es una secuencia creciente de sucesos y B1 ⊃ B2 ⊃ · · · es una secuencia S T∞ decreciente tal que Ai Bi para todo i, entonces ∞ i=1 Ai i=1 Bi . (c) Si A1 ⊃ A2 ⊃ · · · es una sucesión decreciente de sucesos y B1 ⊃ B2 ⊃ · · · es otra tal T T∞ que Ai Bi para todo valor de i, entonces ∞ i=1 Ai i=1 Bi . Además, si Ai ∼ Bi para T∞ T∞ i = 1, 2, . . ., entonces i=1 Ai ∼ i=1 Bi . Enunciar y probar el resultado análogo para sucesiones crecientes de sucesos A1 ⊂ A2 ⊂ · · · y B1 ⊂ B2 ⊂ · · ·. (d) Si A1 , A2 , . . . y B1 , B2 , . . . son sucesos tales que Bi Bj ∼ ∅ para i 6= j y Ai Bi para S S i = 1, 2, . . . , n entonces ∞ Ai ∞ i=1 i=1 Bi . Si además Ai ≺ Bi para al menos algún valor S∞ S∞ de i, entonces i=1 Ai ≺ i=1 Bi . 5 (e) Si A1 , A2 , . . . es una secuencia de sucesos disjuntos, y B es otro sucesos tal que B ∅, entonces Ai B sólamente para un número finito de valores de i (i = 1, 2, . . .). 30. Sea P una distribución de probabilidad dada en el conjunto S de enteros positivos {1, 2, . . .} tal que asigna a cada entero en S una probabilidad positiva. Sea S1 = {1, 3, 5, . . .} y S2 = {2, 4, 6, . . .}. Por tanto, todo subconjunto A de S puede expresarse como A = (AS1 ) ∪ (AS2 ). Se define la relación entre subconjuntos de S de la forma siguiente: si A y B son subconjuntos de S, entonces A B si P (AS1 ) < P (BS1 ) o si se cumplen las condiciones P (AS1 ) = P (BS1 ) y P (AS2 ) ≤ P (BS2 ). Probar que la relación satisface los axiomas 1, 2 y 3 pero no el 4. 31. Sea P una distribución de probabilidad dada en el conjunto S de enteros positivos {1, 2, . . .} tal que asigna a cada entero en S una probabilidad positiva. Sea S1 = {1, 3, 5, . . .} y S2 = {2, 4, 6, . . .}. Por tanto, todo subconjunto A de S puede expresarse como A = (AS1 ) ∪ (AS2 ). Se define la relación entre subconjuntos de S de la forma siguiente: si A y B son subconjuntos de S, entonces A B si P (A) < P (B) o si se cumplen las condiciones P (A) = P (B) y P (AS1 ) ≤ P (BS1 ). Probar que la relación satisface los axiomas 1, 2 y 3 pero no el 4. 32. Probar los siguientes resultados a partir de los axiomas 1 al 4 y el axioma CP: (a) Si D es un suceso, entonces D ∼ ∅ si y sólo si (A|D) ∼ (B|D) para todo par de sucesos A y B. (b) Si A y D son sucesos, entonces (∅|D) (A|D) (D|D). (c) Sean los sucesos A, B, D y E tales que ADE ∼ BDE ∼ ∅. Entonces (A|E) (B|E) si y sólo si [(A ∪ D)|E] [(B ∪ D)|E]. (d) Si A, B, D y E son sucesos tales que (A|E) (B|E) y (B|E) (D|E), entonces (A|E) (D|E). (e) Si A y B son sucesos tales que A ⊂ B, entonces (A|D) (B|D) para cualquier suceso D. (f) Dados los sucesos cualesquiera A, B y D, entonces (A|D) (B|D) si y sólo si (Ac |D) (B c |D) (g) Si A1 ⊃ A2 ⊃ · · · es una sucesión decreciente de sucesos y B y D son sucesos cualesquiera T tales que (Ai |D) (B|D) para todo i entonces ( ∞ i=1 Ai |D) (B|D). (h) Sean A1 , A2 , . . ., B1 , B2 , . . . y D sucesos tales que Bi Bj D ∼ ∅ para i 6= j y (Ai |D) S T (Bi |D) para todo i. Entonces se verifica que ( ∞ ( ∞ |D). Si además i=1 Ai |D) i=1 BiT S∞ (Ai |D) ≺ (Bi |D) para al menos un valor de i, entonces ( i=1 Ai |D) ≺ ( ∞ i=1 Bi |D). S∞ (i) Sean D1 , D2 , . . . sucesos tales que Di Dj ∼ ∅ si i 6= j y i=1 Di ∼ S. Si A y B son sucesos tales que (A|Di ) (B|Di ) para todos los valores de i, entonces A B. Si además (A|Di ) ≺ (B|Di ) para al menos un valor de i, entonces A ≺ B. 33. Considérense dos juegos X e Y para los que las ganancias tienen las siguientes distribuciones de probabilidad: P (X = −3) = 0.5; P (Y = −2) = 0.3; P (X = 2.5) = 0.4; P (Y = 1) = 0.4; P (X = 6) = 0.1 P (Y = 3) = 0.3 Expresar qué decisión, entre jugar a X, jugar a Y o no jugar, tomará una persona que tiene una función de utilidad 6 (a) lineal: U (x) = a x + b, (b) cúbica: U (x) = x a>0 3 (c) logarı́tmica: U (x) = log(x + 4) 34. Supóngase que una persona tiene un billete de loterı́a del cual recibirá una ganancia de 36 euros con probabilidad 1/4 ó 0 con probabilidad 3/4. ¿Cuánto dinero estarı́a dispuesto a pagarle por el billete si su función de utilidad es (a) cuadrática? (b) raı́z cuadrada? 35. Considérense tres juegos X, Y y Z para los que las distribuciones de probabilidad de las ganancias son: 1 P (X = 5) = P (X = 25) = 2 1 P (Y = 10) = P (Y = 20) = 2 P (Z = 15) = 1 Deducir cuál de los tres juegos preferirı́a una persona con función de utilidad (a) cuadrática (b) raı́z cuadrada (c) lineal (pendiente positiva) 36. Sea U una función de utilidad para la que U (0) = 0 y U (100) = 1. Si una persona que tiene esta función de utilidad se muestra indiferente entre aceptar un juego cuya ganancia será 0 euros con probabilidad 1/3 ó 100 euros con probabilidad 2/3, y aceptar 50 euros seguros, ¿cuál es el valor de U (50)? 37. Sea ahora U una función de utilidad tal que U (0) = 5, U (1) = 8 y U (2) = 10. Supóngase que una persona que tiene esta función de utilidad se muestra indiferente entre dos juegos X e Y cuyas distribuciones de probabilidad de las ganancias son las siguientes: P (X = −1) = 0.6; P (X = 0) = 0.2; P (Y = 0) = 0.9; P (X = 2) = 0.2 P (Y = 1) = 0.1 ¿Cuál es el valor de U (−1)? 38. Una persona tiene que jugar a un juego en el que apuesta una cantidad a (que puede elegir, siendo 0 ≤ a ≤ 1) a la ocurrencia de un suceso que tiene probabilidad p de ocurrir, y el resto, (1 − a), a su complementario. ¿Cuál debe ser el valor de a elegido si su función de utilidad es (a) el logaritmo? (b) la raı́z cuadrada? (c) la identidad? 7 39. Sean los juegos X1 , X2 , X3 y X4 para los que las distribuciones de probabilidad de las ganancias son las siguientes: P (X1 = 0) = 0.2; P (X1 = 1) = 0.5; P (X1 = 2) = 0.3 P (X2 = 0) = 0.4; P (X2 = 1) = 0.2; P (X2 = 2) = 0.4 P (X3 = 0) = 0.3; P (X3 = 1) = 0.3; P (X3 = 2) = 0.4 P (X4 = 0) = P (X4 = 2) = 0.5 Si la función de utilidad de la persona es tal que prefiere X1 a X2 , ¿qué juego elegirı́a entre X3 y X4 ? 40. Una persona tiene un capital A > 0, y puede apostar en cierto juego en el que de ganar (para lo que tiene una probabilidad p) dobları́a el dinero apostado. ¿Cuál debe ser la cantidad a apostar si su función de utilidad es (a) el logaritmo? (b) la raı́z cuadrada? (c) la identidad? (d) cuadrática? 41. Supóngase que una persona tiene un billete de loterı́a con el que espera ganar X euros, donde X tiene una distribución uniforme sobre el intervalo (0, 4). Si la función de utilidad de la persona es U (x) = xα si x ≥ 0, donde α es una constante positiva conocida, ¿por cuánto dinero estarı́a dispuesta a vender el billete? 42. El número de horas X que funcionará una máquina antes de fallar tiene una distribución continua con f.d.p. f (x), y en el momento en que la máquina empieza a funcionar debe decidirse cuando se regresará para inspeccionarla. Si se vuelve antes de que la máquina haya fallado, se ocasionará un costo de b euros por haber desperdiciado la inspección. Si se vuelve después de que la máquina haya fallado, se ocasionará un costo de c euros por cada hora que la máquina no haya funcionado después de fallar. ¿Cuál es el número óptimo de horas que deberı́a decidirse esperar antes de regresar a la inspección para minimizar el costo esperado? 43. Supóngase que la función de utilidad de una persona es U (x) = x2 para x ≥ 0. Demuéstrese que la persona preferirá siempre un juego en el que se obtenga una ganancia aleatoria de X euros antes que recibir la cantidad E[X] con certeza, siendo P (X ≥ 0) = 1 y E[X] < ∞. 44. Sea el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 , θ3 , θ4 }, el espacio de decisiones A = {a1 , a2 , a3 }, y la función de pérdida L(θ, a) la especificada por la tabla θ1 θ2 θ3 θ4 a1 0 1 3 1 8 a2 2 0 4 2 a3 3 2 0 0 (a) Si la función de probabilidad inicial para los parámetros es ξ, donde 1 ξ(θ1 ) = , 8 3 ξ(θ2 ) = , 8 1 ξ(θ3 ) = ξ(θ4 ) = , 4 hallar la decisión Bayes. (b) Si se tiene otra función de pérdida L0 (θ, a) dada por θ1 θ2 θ3 θ4 a1 4 0 0 1 a2 6 -1 1 2 a3 7 1 -3 0 probar que las decisiones Bayes son las mismas para ambas funciones de pérdida, sea cual sea la distribución inicial del parámetro. 45. Considérese el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio de decisiones A = {a1 , a2 , a3 }, y la función de pérdida la de la tabla θ1 θ2 a1 0 8 a2 a3 10 4 0 3 Hallar la decisión Bayes para cualquier función de probabilidad inicial sobre los parámetros. 46. Tenemos el problema de decisión para el que el espacio de parámetros es Θ = [0, 1], el de decisiones A = <, y la función de pérdida L(θ, a) = 100 (θ − a)2 , θ ∈ Θ, a ∈ A. (a) Hallar la decisión Bayes y el riesgo Bayes si la función de densidad inicial del parámetro es ξA (θ) = 2θ, 0 ≤ θ ≤ 1. (b) Otro estadı́stico B difiere de las ideas de su compañero A del apartado anterior, y piensa que la función de distribución inicial deberı́a más bien ser ξB (θ) = 3θ2 , 0 ≤ θ ≤ 1. Según la opinión de B, ¿en cuanto riesgo adicional incurrirá A a causa de sus incorrectas ideas sobre la distribución inicial del parámetro? 47. Supóngase que en un problema de decisión, cierta decisión a∗ es una decisión Bayes para dos distribuciones P1 y P2 del parámetro θ. Probar que entonces, dado α tal que 0 < α < 1, a∗ debe ser también una decisión Bayes para la distribución αP1 + (1 − αP2 ). 48. Sea el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio de decisiones A = {a1 , a2 , a3 , a4 , a5 }, y la función de pérdida L(θ, a) la especificada por la tabla θ1 θ2 a1 0 4 a2 4 5 9 a3 2 0 a4 1 1 a5 5 0 ¿Para qué distribución del parámetro no hay una única decisión bayes? 49. Dado el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio de decisiones A = {a1 , . . . , a7 }, y la función de pérdida L(θ, a) la de la tabla a1 a2 1 6 10 1 θ1 θ2 a3 a4 0 2 13 8 a5 7 0 a6 3 5 a7 4 4 encontrar las decisiones Bayes para todas las posibles distribuciones del parámetro. 50. Considérese un problema de decisión para el que tanto el espacio de parámetros Θ como el de decisiones A tienen infinitos elementos. Supóngase que Θ = {θ1 , θ2 , . . .}, A = {a1 , a2 , . . .}, y la función de pérdida L(θ, a) es la de la tabla a∗ θ1 θ2 θ3 θ4 θ5 .. . 1 2 1 2 1 2 1 2 1 2 .. . a1 0 1 1 1 1 .. . a2 0 0 1 1 1 .. . a3 0 0 0 1 1 .. . a4 0 0 0 0 1 .. . ··· ··· ··· ··· ··· ··· ... Probar que a∗ es la única decisión admisible en el conjunto A pero que sin embargo no es decisión Bayes para ninguna distribución del parámetro W . 51. Supóngase que hay una probabilidad 1/10 de que una señal se manifieste en cierto sistema en algún momento, y una probabilidad 9/10 de que la señal no se haga presente en el sistema. Una medida hecha en el sistema cuando la señal está presente se distribuye normalmente con media 50 y varianza 1, y en cambio la medida tomada cuando la señal no está presente está también distribuida normalmente con la misma varianza pero con media 52. En cierto instante se hace una medida en el sistema, obteniéndose el valor x. ¿Qué condición deberı́a cumplirse para que la probabilidad final de que la señal esté presente fuera mayor que la de que no lo esté? 52. Considérese el problema de decisión para el cual Θ = {θ1 , θ2 }, A = {a1 , a2 }, y la función de pérdida L(θ, a) la que figura en la tabla θ1 θ2 a1 a2 0 5 10 0 Supóngase que el estadı́stico puede observar una variable aleatoria Z cuya distribución condicional es normal, con media 0 y varianza 1 cuando W = θ1 y con media 1 y varianza 1 cuando W = θ2 . (a) Para cualquier distribución inicial dada ξ = P (W = θ1 ) encontrar una función de decisión Bayes para ξ, δ ∗ . (b) Representar el riesgo Bayes ρ∗ (ξ) como una función de ξ sobre el intervalo 0 ≤ ξ ≤ 1. 10 53. Supóngase que un estadı́stico debe decidir si una cierta variable tiene una distribución uniforme sobre el intervalo (0, 1) o uniforme sobre el intervalo (0, 1/2), teniendo ambas la misma probabilidad (1/2) de ser la distribución correcta. Si la función de pérdida vale 0 cuando se elige correctamente y a > 0 cuando no sucede ası́; y si el estadı́stico puede seleccionar el número que quiera de observaciones de la variable aleatoria, cada una de las cuales cuesta c > 0, probar que deberı́a tomar n∗ observaciones, donde n∗ es el entero no negativo que minimiza el valor a2−(n+1) + nc. 54. Sea el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio de decisiones A = {a1 , a2 , a3 }, y la función de pérdida L(θ, a) la dada por θ1 θ2 a1 a2 a3 0 10 3 10 0 3 Supóngase que se puede disponer de una observación X con las siguientes distribuciones condicionales: 3 1 P (X = 1|W = θ1 ) = , P (X = 0|W = θ1 ) = , 4 4 1 3 P (X = 1|W = θ2 ) = , P (X = 0|W = θ2 ) = , 4 4 y sea ξ = P (W = θ1 ). (a) Encontrar una decisión Bayes para cada valor de ξ (0 ≤ ξ ≤ 1), y representar el riesgo Bayes ρ∗ (ξ) como una función de ξ. (b) Supóngase que antes de tomar una decisión se puede observar una muestra aleatoria X1 , . . . Xn distribuidas como X. Encontrar una función de decisión Bayes para cada valor de ξ para un n dado. (c) En las condiciones del apartado anterior, calcular el valor de n que habrı́a que tomar para minimizar el riesgo total, ası́ como el valor de éste, si ξ = 1/2 y el coste de cada observación es c = 1/10. (d) En las mismas hipótesis (ξ = 1/2) contestar a las mismas preguntas supóniendo ahora que el coste varı́a con cada observación, siendo 0.15 el coste de cada observación que valga 1 y 0.05 el coste de cada una de las que valgan 0. 55. Sea el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio de decisiones A = {a1 , a2 }, y la función de pérdida L(θ, a) la dada por θ1 θ2 a1 a2 0 1000 1000 0 Supóngase que P (W = θ1 ) = P (W = θ2 ) = 1/2, que la distribución condicional de una observación X cuando W = θ1 es normal con media -1 y varianza 9, y que la distribución condicional de X cuando W = θ2 es normal con media 1 y varianza 9. Además, antes de elegir, se puede observar valores X1 , . . . , Xn de la variable aleatoria, que para un valor dado de W son una muestra aleatoria de la distribución condicionada de X. Si cada observación en la muestra cuesta 1 euro, calcular el número óptimo de observaciones n∗ y el riesgo mı́nimo total. 11 56. Considérese las variables aleatorias X1 , . . . , Xk . Supóngase que la función de densidad de una de ellas es g y la de las otras k − 1 es h, pero que no se sabe exactamente cuál es la que tiene densidad g. Para i = 1, . . . , k sea ξi la probabilidad inicial de que Xi sea la variable aleatoria P cuya distribución es g, donde ξi > 0 para todo i y ki=1 ξi = 1. (a) Si se observa que la variable X1 toma el valor x, calcular la probabilidad final de que su función de densidad sea g. (b) Si se observa que la variable X3 toma el valor x, calcular la probabilidad final de que la función de densidad de X1 sea g. 57. Se tienen dos urnas A y B cada una de las cuales contiene bolas rojas y verdes. Se sabe que una de las urnas contiene la mitad de bolas rojas y la otra mitad verdes, mientras que la otra contiene la cuarta parte de rojas y el resto verdes. No se sabe cuál es cuál, pero sı́ que si llamamos W a la que contiene la mitad de cada color, P (W = A) = ξ y P (W = B) = (1 − ξ), con 0 < ξ < 1. El estadı́stico tiene que seleccionar una bola de A o de B, y tras observar su color debe decidir si W = A ó W = B. Elegir la urna de la que deberı́a tomar la bola para cada valor de ξ. 58. Sea el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio de decisiones A = {a1 , a2 }, y la función de pérdida L(θ, a) la dada por θ1 θ2 a1 0 a2 a2 a1 0 Supóngase que se puede observar una variable aleatoria X u otra Y cuyas distribuciones condicionadas son las siguientes: 2 P (X = 1|W = θ1 ) = , 3 1 P (X = 0|W = θ1 ) = , 3 1 1 P (X = 1|W = θ2 ) = , P (X = 0|W = θ2 ) = , 2 2 3 1 P (Y = 1|W = θ1 ) = , P (Y = 0|W = θ1 ) = , 4 4 1 1 P (Y = 1|W = θ2 ) = , P (Y = 0|W = θ2 ) = , 2 2 Si el coste de observar X es el mismo que el de observar Y , probar que para cualquier distribución inicial de W y para cualesquiera valores de las pérdidas a1 y a2 se deberı́a observar Y mejor que X. 59. Sea W un parámetro que toma los valores θ1 y θ2 con probabilidades iniciales respectivas ξ y (1 − ξ), f (·|θi ) la probabilidad condicional de X dado un valor del parámetro W = θi i = 1, 2 y ξ(X) la probabilidad final de que W = θ1 cuando X = x. (a) Probar que E[ξ(X)] = ξ, donde la esperanza se calcula suponiendo que W tiene la distribución inicial especificada (claro, aún no hemos observado X). (b) Si suponemos que realmente W = θ1 , probar que E[ξ(X)] ≥ ξ, es decir, que la distribución final asignará, en media, una mayor probabilidad al verdadero valor del parámetro que la que le asignaba la distribución inicial. 12 (c) Si ξ = 1/2 y W = θ1 , probar que para todo (0 < < 1), P (ξ(X) ≤ ) ≤ , 1− lo que puede interpretarse como que hay una probabilidad muy pequeña de que la distribución final asigne una probabilidad pequeña al verdadero valor del parámetro. 60. Sea Θ = {θ1 , θ2 , θ3 } y P el conjunto de todas las distribuciones de probabilidad (p1 , p2 , p3 ) tal que p1 ≥ 0 (i = 1, 2, 3) y p1 + p2 + p3 = 1. Sea C el conjunto de puntos dentro o en la frontera de un triángulo equilátero que tiene altura unidad, ν1 , ν2 y ν3 los vértices de ese triángulo, y Si (i = 1, 2, 3) el lado del triángulo opuesto al vértice νi . (a) Probar que la suma de distancias de cualquier punto del triángulo a los tres lados del triángulo es 1, y por tanto que hay una correspondencia biunı́voca entre los conjuntos P y C. (b) Si, fijado un punto (p1 , p2 , p3 ) ∈ P, se coloca un peso pi en el vértice νi (i = 1, 2, 3), encontrar el centro de gravedad x de este sistema de tres puntos de masa y mostrar que la posición de x define una correspondencia biunı́voca entre P y C (para cada punto x ∈ C sus coordenadas en P se llaman coordenadas baricéntricas). (c) Probar que las correspondencias entre P y C de los dos apartados anteriores son la misma. 61. Supóngase que la compañı́a internacional Potatoes S.L. tiene en su plantilla k estadı́sticos, cada uno de los cuales tiene su propia distribución inicial ξi para un cierto parámetro W . El ejecutivo principal de la famosa firma de instrumental electrónico de precisión forma su opinión sobre W de las opiniones de los k estadı́sticos, y asigna la siguiente probabilidad inicial a cada punto θ ∈ Θ: ξ ∗ (θ) = α1 ξ1 (θ) + . . . + αk ξk (θ), donde α1 , . . . , αk son pesos tales que αi ≥ 0 para todo i y α1 + · · · + αk = 1, reflejando cada αi la confianza que el ejecutivo tiene en la opinión del estadı́stico i. Un dı́a quedan todos juntos para observar el valor de una variable aleatoria X, cuya función de densidad condicional cuando W = θ es f (·|θ). probar que la distribución final del ejecutivo será nuevamente una combinación lineal de las distribuciones finales de los k estadı́sticos, con nuevos pesos β1 , . . . , βk que dependerán del valor observado de X. Discutir además las condiciones bajo las cuales un peso βi de la distribución final será mayor que su correspondiente peso αi de la distribución inicial. 62. La proporción p de artı́culos defectuosos en un gran lote es desconocida. Como no tenemos ninguna información acerca de p, le asignamos la función de densidad inicial uniforme en el intervalo (0, 1). Hallar la función de densidad final de p. 63. Se va a observar la duración de cierto tipo de lámparas fluorescentes. Se sabe que la distribución de la duración decualquiera lámpara concreta es una exponencial de parámetro θ desconocido. Debido a resultados anteriores, se asigna a θ inicialmete una distribución Gamma de media 0.0002 y desviación tı́pica 0.0001. Hallar la distribución final de θ. 64. Se sabe que la proporción p de artı́culos defectuosos en un gran lote manufacturado es 0.1 ó 0.2, y que la función de probabilidad inicial de p es ξ(0.1) = 0.7; 13 ξ(0.2) = 0.3 Se seleccionan al azar ocho artı́culos del lote y se encuentran dos defectuosos. Hallar la función de probabilidad final de p, y razonar el resultado obtenido. 65. El número de defectos en una cinta magnética de grabación tiene una distribución de Poisson de media λ, donde la distribución inicial de λ (que puede ser 1 ó 1.5) es ξ(1) = 0.4; ξ(1.5) = 0.6 Si una cinta seleccionada al azar resulta con tres defectos, ¿cuál es la probabilidad final de λ? Interpreta el resultado. 66. Supóngase que la proporción p de artı́culos defectuosos en un lote es desconocida. Hallar la distribución final de p, su estimación bayesiana y el riesgo Bayes para una función de pérdida cuadrática, sabiendo que de una muestra de ocho artı́culos tres resultaron defectuosos, (a) si la distribución inicial de p es uniforme en el intervalo (0, 1) (b) si la distribución inicial de p es ( ξ(p) = 2(1 − p) si 0 < p < 1 0 e.o.c. 67. Supongamos que se va a seleccionar una observación, X, de una distribución uniforme sobre el intervalo (θ − 21 , θ + 12 ), con θ desconocido, siendo la distribución inicial de θ uniforme sobre el intervalo (10, 20). Si el valor observado de X es 12, ¿cuál es la distribución final de θ? ¿Y si seleccionamos seis observaciones, obteniendo los valores 11, 11.5, 11.7, 11.1, 11.4, 10.9? 68. Supóngase que se desconoce la proporción p de artı́culos defectuosos de un gran cargamento, y tras seleccionar al azar 100 artı́culos se encuentran 3 defectuosos, obteniéndose una probabilidad final para el parámetro, Beta de media 2/51 y varianza 98/(512 103). ¿Qué distribución incial asignó a p el estadı́stico? Estimación Bayes para la función de pérdida cuadrática. 69. Sea λ el número promedio de defectos por cada 100 pies de cinta magnetofónica, siendo λ desconocido, y que se asigna a λ una distribución inicial Gamma con parámetros α = 2 y β = 10. Cuando se inspecciona una cinta de 1200 pies, se encuentran exactamente cuatro defectos. Hallar la distribución final de λ e interpretar el resultado obtenido. 70. Supóngase que el tiempo (en minutos) requerido para atender a un cliente en cierto servicio tiene una distribución exponencial de parámetro θ desconocido, y que la distribución inicial de θ es una distribución Gamma de media 0.2 y desviación tı́pica 1. Si se observa que el tiempo esperado requerido para atender a una muestra aleatoria de 20 clientes es 3.8 minutos, ¿cuál es la distribución final de θ? Analizar el resultado. 71. Supóngase que las estaturas de los individuos de cierta población tienen una distribución normal con media µ desconocida y desviación tı́pica 2 pulgadas. Supóngase además que la distribución inicial de µ es normal, con media 68 pulgadas y desviación tı́pica 1 pulgada. Si se seleccionan al azar 10 personas de la población y se encuentra que su estatura promedio es 69.5 pulgadas, (a) ¿cuál es la distribución final de µ? Explica el resultado. (b) ¿qué intervalo de longitud 1 pulgada tiene la mayor probabilidad inicial de contener el valor de µ? ¿cuál es esa probabilidad? 14 (c) ¿qué intervalo de longitud 1 pulgada tiene la mayor probabilidad final de contener el valor de µ? ¿cuál es esa probabilidad? 72. Se selecciona una muestra aleatoria de 20 observaciones de una distribución normal de media µ desconocida y varianza 1, resultando X̄ = 10 y que la distribución final de µ es una normal de media 8 y varianza 1/25. ¿Cuál fue la distribución inicial de µ? 73. Supóngase que el número de minutos que una persona debe esperar un autobús cada mañana tiene una distribución uniforme sobre el intervalo (0, θ), con θ desconocido. Si la distribución inicial de θ es ( 192 si θ ≥ 4 θ4 ξ(θ) = 0 e.o.c. y los tiempos de espera observados durante tres mañanas sucesivas son 5, 3, y 8 minutos, ¿cuál es la distribución final de θ? 74. Se desconoce la proporción p de artı́culos defectuosos de una gran cargamento, pero se le supone una distribución inicial Beta(α = 5, β = 10). Tras analizar 20 artı́culos del cargamento, (a) si se encuentra que solamente uno de ellos resulta defectuoso, y se utiliza la función de pérdida del error cuadrático, ¿cuál es la estimación Bayes de p? (b) ¿para qué número de artı́culos defectuosos de la muestra será un máximo el error cuadrático medio del estimador Bayes? ¿para qué número será mı́nimo? 75. El número de defectos en una cinta magnética de grabación de 1200 pies tiene una distribución de Poisson de media λ desconocida, y la distribución inicial de λ es una Gamma(α = 3, β = 1). Se seleccionan al azar cinco cintas, y tras inspeccionarlas arrojan las cantidades de defectos 2, 2, 6, 0, 3. ¿Cuál es la estimación Bayes de λ para la función de pérdida del error cuadrático? 76. En las condiciones del ejercicio 70. El tiempo en minutos necesario para atender a un cliente en cierto servicio tiene una distribución exponencial con parámetro θ desconocido, la distribución inicial de θ es una Gamma de media 0.2 y desviación tı́pica 1, y el promedio del tiempo requerido para atender una muestra aleatoria de 20 clientes es 3.8 minutos. Si se utiliza la función de pérdida del error cuadrático, ¿cuál es la estimación Bayes de θ? 77. En las condiciones del ejercicio 71. Las estaturas de los individuos de una cierta población tienen una distribución normal con media µ desconocida y desviación tı́pica 2 pulgadas. Si la distribución inicial de µ es N (68, 1), y tras seleccionar a 10 personas de la población se obtiene una estatura promedio de 69.5 pulgadas, ¿cuál serı́a la estimación Bayes de µ si se utiliza como función de pérdida el error cuadrático medio? ¿Y si se utiliza el error absoluto medio? 78. Supóngase que X1 , . . . , Xn constituyen una muestra aleatoria simple de una distribución uniforme en el intervalo [3 θ, 4 θ] (θ desconocido). Si asignamos a θ la distribución inicial ( ξ(θ) = 2 θ3 0 θ>1 e.o.c. ¿cuáles serı́an los estimadores bayes respecto de las funciones de pérdida del error cuadrático medio y del error absoluto medio para la muestra 3.825, 3.600, 3.782? 15