Teor´ıa de la Decisión Estad´ıstica Ejercicios

Anuncio
Teorı́a de la Decisión Estadı́stica
Ejercicios
1. Una librerı́a debe decidir cuántas revistas pedir. Las compra a 20 euros y las vende a 25. Las
revistas que no vende al final del dı́a no tienen valor. La librerı́a sabe que cada dı́a puede
vender con igual probabilidad entre 6 y 10 revistas. ¿Cuántos ejemplares debe pedir?
2. Un vendedor de revistas hace semanalmente un pedido de una cierta revista, cuyo coste
unitario es de 400 euros y su precio de venta 500. Se supone que cada unidad no vendida en la
semana constituye una pérdida de 5 euros. La demanda vale 0, 1 ó 2, pero es desconocida su
ley de probabilidad. Buscar la decisión óptima en los distintos ambientes posibles si se desea
ganar lo máximo posible.
3. Según los criterios de decisión, determinar con cada uno de ellos cuál serı́a la decisión óptima:
a1
a2
a3
a4
θ1
2
1
0
1
θ2
2
1
4
3
θ3
0
1
0
0
θ4
1
1
0
0
teniéndose la siguiente distribución sobre los estados: (0.35, 0.2, 0.2, 0.25).
4. Una compañı́a de construcción está considerando si participar o no en la realización de un
centro comercial. El principal problema para la compañı́a estriba en el resultado del convenio
que se está negociando con los trabajadores. El beneficio previsto es de 20 millones de euros
siempre y cuando sus trabajadores acepten la propuesta que se está negociando. Por el
contrario, si no se aprueba el convenio, los beneficios serı́an de 10 millones de euros, debido
a la gran cantidad de mano de obra exigida por el proyecto. La evolución histórica de los
últimos convenios dice que en un 80% de ellos se ha aprobado la propuesta de la empresa.
La compañı́a ha recibido otra oferta que garantiza unos beneficios de 16.5 millones de euros,
con total seguridad, ya que prácticamente no exige mano de obra, sino fundamentalmente
maquinaria. Para hacer su elección, la compañı́a acuerda hacer una consulta a un grupo de
expertos en cuestiones sindicales, cuya respuesta ha sido: ’Existe una alta correlación entre el
nivel de inflación y el porcentaje de negociaciones aceptadas, y se ha determinado que en 7 de
cada 10 casos de huelga, ha habido una alta inflación y por el contrario, en casos de convenios
con acuerdos sólo en 2 de cada 7 casos ha habido una alta inflación...’
La compañı́a sabe con seguridad que en el año actual el ı́ndice de inflación es muy alto.
(a) Obtener la decisión óptima sin utilizar la información de la inflación.
(b) Analizar si se alteran o no los resultados utilizando la información dada por el sindicato.
1
(c) Analizar el beneficio monetario esperado en los dos casos, y determinar qué cantidad
estarı́a dispuesta a pagar la compañı́a por obtener un informe sobre si hay alta o baja
inflación.
5. Describir el siguiente problema de decisión: Una persona tiene que desplazarse de un lugar
a otro en una gran ciudad. Después de recorrer varios itinerarios, encuentra que dos son los
mejores, uno atraviesa la ciudad y el otro va por la carretera de circunvalación. Cuando el
tráfico es fluido por el primer camino sólo tarda 15 minutos, pero cuando no lo es tarda 35
minutos. Si va por el segundo la duración es de 25 minutos y el tráfico siempre es uniforme.
¿Cuál de los dos debe elegir?
6. Supongamos que en X, es una relación transitiva y conexa, y definamos ≺ y ∼ como sigue:
x ≺ y ≡ no(y x)
x ∼ y ≡ [x y Λ y x]
Demostrar que ≺ es un orden débil y ∼ es de equivalencia.
7. Se dice que es un casi-orden en X si es reflexiva y transitiva. Demostrar que si es un
casi-orden en X y definimos ≺ y ∼ como en el ejercicio anterior, entonces:
(a) ∼ es de equivalencia.
(b) ≺ no es transitivo.
(c) ∀x, y, z ∈ X
x ∼ y Λ y ≺ z ⇒ x ≺ z;
x≺yΛy∼z⇒x≺z
8. Demostrar que si (A, ) es un orden débil, entonces (A, ) es un orden débil reflexivo, donde
x y si y solo si (sii) x y o x ∼ y.
9. Si ≺ es una relación en X, se define su cierre transitivo ≺t como:
(
t
x≺ y⇔
ó x ≺ y
ó ∃ x1 , ..., xm tales que x ≺ x1 ≺ ... ≺ xm ≺ y
Demostrar que si ≺t es asimétrica, entonces ≺t es un orden parcial estricto.
10. Sea A = {(a, b)/a, b ∈ {1, 2, 3, 4}} con (a, b)R(c, d) ⇔ a > c. Demostrar que (A, R) es un
orden débil y calcular su reducción.
11. Consideremos un experimento en el cual una persona fija inicialmente un cierto número de
unidades monetarias m, y posteriormente observa el valor de una variable continua Y . Si
Y ≥ m entonces dicha persona recibe una recompensa igual a Y unidades monetarias. Si
Y < m entonces recibe una recompensa aleatoria X siguiendo una distribución dada. Se
supone que X e Y son variables aleatorias independientes. Demostrar que para maximizar
la utilidad esperada de su recompensa, la persona en cuestión deberı́a fijar inicialmente un
número m tal que u(m) = E[u(X)].
12. Sean p y m dos números prefijados de antemano, y consideremos la siguiente situación: una
persona dispone de m unidades que puede apostar distribuidas entre un suceso A con probabilidad p y su complementario. Cuando ocurre cualquiera de los sucesos obtiene una recompensa
igual a lo apostado a ese suceso. Determinar la apuesta más preferida cuando la función de
utilidad en [0, m] es la siguiente:
2
(a) u(r) = rα , con α > 1
(b) u(r) = r
(c) u(r) = log r
(d) u(r) = 2
r
m0
−
r
m0
2
, donde m0 > m
13. Supóngase que dos personas A y B poseen una fortuna igual a x0 euros, y que ambos tienen
1
la misma utilidad u de tener una fortuna de x euros que es u(x) = (x − x0 ) 3 . Uno de los dos
recibe como regalo un billete de loterı́a que proporciona un premio de r euros o un premio
de 0 euros con igual probabilidad. Demostrar que existe un número b > 0 con la propiedad
siguiente: ’Cualquiera que sea el que reciba el premio, puede venderlo al otro por b euros
siendo la venta ventajosa para ambos’.
14. Consideremos una rueda de ruleta dividida en k sucesos disjuntos A1 , ..., Ak tales que P (Ai ) =
pi , i = 1, ..., k. Supongamos que un jugador dispone de m unidades monetarias para apostarlas entre todos los sucesos, y que recibe como recompensa la cantidad xi que ha apostado
al suceso Ai cuando este suceso ocurre. Si la función de utilidad de una recompensa positiva
r es u(r) = log(r), demostrar que la distribución óptima de apuesta es la dada por xi = m pi ,
para i = 1, ..., k.
15. Una persona pretende vender refrescos en un espectáculo, y debe decidir de antemano cuántas
botellas debe adquirir. Supongamos que por cada botella que vende gana m unidades monetarias, e incurre en una pérdida de c por cada una que no consigue vender. La demanda de
botellas se puede aproximar por una variable aleatoria X, siendo la utilidad de un beneficio r
igual a dicho beneficio. Demostrar que la cantidad α de botellas que debe adquirir corresponde
m
de la citada variable.
al percentil m+c
16. Dos cajas C1 y C2 contienen ambas bolas blancas y bolas negras. La proporción de blancas
en C1 es 1/2 y en C2 es X. Dicha proporción X es desconocida, pero se sabe que sigue una
distribución sobre (0, 1) con media 1/4 y varianza 1/16. Un jugador puede seleccionar sucesiva
y aleatoriamente n bolas con la condición de que todas ellas sean extraı́das de la misma caja,
devolviendo la bola a su caja después de cada extracción. Dicho jugador recibe una ganancia
de 1 unidad monetaria por cada bola blanca extraı́da y 0 por cada bola negra. Se pide analizar
qué caja preferirá elegir el jugador suponiendo que la función de utilidad de una ganancia r
es u(r) = r2 − n2 .
17. Supongamos que dos personas A y B desean hacer una apuesta. A pagará a B una unidad
si ocurre un determinado suceso S, y B pagará x unidades a A si no ocurre S. Supongamos
que tanto A como B acuerdan que P (S) = p, 0 < p < 1, y que las utilidades uA y uB son
funciones estrictamente crecientes en las ganancias monetarias. Demostrar que existe un valor
x que es mutuamente ventajoso para ambos si y sólo si
u−1
A
uA (0) − p uA (−1)
1−p
!
<x<
−u−1
B
uB (0) − p uB (1)
1−p
!
18. Supóngase que la fortuna de una persona es de x0 euros, y tiene la oportunidad de comprar
un billete de loterı́a que proporcione un premio de r euros ó 0 con igual probabilidad. Su
función de utilidad es u(x) = log(x), con x > 0. Demostrar que la persona debe comprar el
billete de loterı́a para cualquier cantidad b tal que
q
1
b < x0 +
r − r2 + 4 x20
2
3
19. Suponiendo Θ = {0, 1}, ξ = { 43 , 14 } como distribución a priori, buscar el riesgo Bayes y la
acción Bayes (si existe) cuando:
(a) A = [0, 1] y L(θ, a) = |θ − a|
(b) A = (0, 1] y L(θ, a) = |θ − a|
(c) A = [0, 1] y L(θ, a) = |θ − a|α , α > 1
20. Buscar la acción minimax en los siguientes casos:
(a) A = [0, 1], Θ = {0, 1} y L(θ, a) = |θ − a|
(b) A = Θ = [0, 1] y L(θ, a) = |θ − a|
(c) A = Θ = [0, 1] y L(θ, a) = |θ − a|2
21. Una compañı́a va a lanzar al mercado un nuevo tipo de coche, y se quiere determinar el número
de unidades a producir. Mediante un estudio de mercado se puede obtener información sobre
la proporción θ de población con intención de comprar el nuevo modelo de coche. Se sabe que
la venta viene influenciada por el estado de la economı́a Y , el cual es desconocido, pero sigue
una distribución U(0, 1). Se supone que Z = (1 + Y ) 107 θ es el número de coches vendidos.
Por cada venta se obtiene un beneficio de 500, y una pérdida de 300 unidades cada coche
no vendido. Suponiendo u(m) = m para una ganancia m, determinar la función de pérdida
L(θ, a).
22. Tres personas pretenden simultáneamente una plaza de avión que ha sido cancelada. El
horario de vuelo exige que la lista de pasajeros esté completa y cerrada a las 5 de la tarde, y
para ello la compañı́a abre aleatoriamente la lista de espera entre las 4 y las 5, y la reserva
debe hacerse por teléfono por parte de los interesados. Se supone que
• cada una de las tres personas dispone de una única moneda para llamar por teléfono,
• el primero que llama estando abierta la lista, obtiene la plaza y
• la utilidad para cada una de las personas es:
u(obtener la plaza)
u(otro obtenga la plaza) = −1, u(ninguno obtenga la plaza) = 0
=
1,
Se pide
(a) Hallar la función de utilidad de un pasajero determinado.
(b) Si suponemos que B y C llaman aleatoria e independientemente entre las 4 y las 5,
encontrar un camino para determinar la acción Bayes para A.
23. Un casino tiene dos mesas de juego, cada una con una ruleta. El casino siempre juega con
una ruleta trucada, en la cual la probabilidad de obtener rojo es 1/4. Calcular respecto a una
función de probabilidad ξ dada, cuál serı́a la decisión a tomar (es decir: en qué mesa está
la ruleta no trucada), sabiendo que la función de pérdida es de tipo {0,1} (0 si acierta, 1 si
falla), realizando para ello una sola jugada en la mesa A y apostando siempre por rojo.
24. Sea A = Θ = [0, 1], L(θ, a) = (θ − a)2 , (X, BX , Pθ ) tal que X sigue una binomial B(2, θ). Sean
las reglas no aleatorizadas d1 (x) = x/2, d2 (x) = 1/2, y consideremos la aleatorizada δ que
elige entre d1 y d2 con probabilidad 1/2. Calcular R(θ, δ). Suponiendo que la distribución
inicial es una uniforme en el intervalo (0, 1), determinar R(ξ, δ).
4
25. Dado el problema de decisión (A, Θ, L), con A = <, θ = N , L(θ, a) = (θ − a)2 , realizamos
˙
˙ es la función de densidad de una
una experimentación X = < y (X, BX , f (|θ))
tal que f (|θ)
2
distribución χθ . Calcular:
(a) L(θ, a∗ ) en (A∗ , Θ, L), siendo a∗ ≡ N (µ, σ 2 ).
(b) R(θ, d) en (D, Θ, R), siendo d(x) = x − 7.
(c) Determinar R(ξ, d) para una distribución inicial de Poisson de parámetro λ.
26. Dado el problema de decisión (A, θ, L) donde A = {a1 , a2 }, Θ = [0, 1], L(θ, ai ) = θi . Se
realiza una experimentación x ∈ X = {x0 , x1 , x2 } tal que tenemos definido (X, BX , Pθ ) siendo
Pθ ≡ B(2, θ).
(a) Determinar el conjunto de decisiones y sus riesgos asociados (D, Θ, R).
(b) Calcular en (D∗ , Θ, R) los riesgos correspondientes a δ0 ≡ U (D) y δ1 ≡ B(7, 1/2).
(c) Dado (D, Θ, R), calcular los riesgos R(τ0 , d1 ), R(τ1 , d2 ) si τ0 ≡ U (0, 1) y τ1 es la distribución sobre Θ con densidad f (θ) = 2 θ en [0, 1].
27. Probar los siguientes resultados a partir de los axiomas 1 al 3:
(a) Si A, B y D son tres sucesos tales que A B y B ≺ D entonces A ≺ D.
(b) Si A y B son dos sucesos, entonces A B si y sólo si Ac B c .
(c) Si A y B son sucesos tales que A ⊂ B entonces A B.
(d) Si A1 , . . . An y B1 , . . . Bn son sucesos tales que Bi Bj = ∅ para i 6= j y Ai Bi para
S
S
i = 1, 2, . . . , n entonces ni=1 Ai ni=1 Bi . Si además Ai ≺ Bi para al menos algún valor
S
S
de i, entonces ni=1 Ai ≺ ni=1 Bi . Además, el resultado sigue siendo cierto si la condición
de que los Bi sean disjuntos se sustituye por la condición (más débil) que Bi Bj ∼ ∅ para
i 6= j.
28. Supóngase los axiomas 1 al 3. Si A1 , . . . Am son sucesos disjuntos y B1 , . . . Bn también, tales
S
S
que ni=1 Ai = ni=1 Bi = S, A1 · · · Am , B1 · · · Bn y m ≤ n, probar que B1 Am .
Pruébese también que si m < n entonces B1 ≺ Am .
29. Probar los siguientes enunciados a partir de los axiomas 1 al 4:
(a) Si A1 ⊃ A2 ⊃ · · · es una secuencia decreciente se sucesos y B es otro suceso tal que
T∞
i=1 Ai ≺ B, entonces B Ai sólamente para un número finito de valores de i. Enunciar
y probar el resultado análogo para una secuencia creciente de sucesos A1 ⊂ A2 ⊂ · · ·.
(b) Si A1 ⊂ A2 ⊂ · · · es una secuencia creciente de sucesos y B1 ⊃ B2 ⊃ · · · es una secuencia
S
T∞
decreciente tal que Ai Bi para todo i, entonces ∞
i=1 Ai i=1 Bi .
(c) Si A1 ⊃ A2 ⊃ · · · es una sucesión decreciente de sucesos y B1 ⊃ B2 ⊃ · · · es otra tal
T
T∞
que Ai Bi para todo valor de i, entonces ∞
i=1 Ai i=1 Bi . Además, si Ai ∼ Bi para
T∞
T∞
i = 1, 2, . . ., entonces i=1 Ai ∼ i=1 Bi . Enunciar y probar el resultado análogo para
sucesiones crecientes de sucesos A1 ⊂ A2 ⊂ · · · y B1 ⊂ B2 ⊂ · · ·.
(d) Si A1 , A2 , . . . y B1 , B2 , . . . son sucesos tales que Bi Bj ∼ ∅ para i 6= j y Ai Bi para
S
S
i = 1, 2, . . . , n entonces ∞
Ai ∞
i=1
i=1 Bi . Si además Ai ≺ Bi para al menos algún valor
S∞
S∞
de i, entonces i=1 Ai ≺ i=1 Bi .
5
(e) Si A1 , A2 , . . . es una secuencia de sucesos disjuntos, y B es otro sucesos tal que B ∅,
entonces Ai B sólamente para un número finito de valores de i (i = 1, 2, . . .).
30. Sea P una distribución de probabilidad dada en el conjunto S de enteros positivos {1, 2, . . .}
tal que asigna a cada entero en S una probabilidad positiva. Sea S1 = {1, 3, 5, . . .} y S2 =
{2, 4, 6, . . .}. Por tanto, todo subconjunto A de S puede expresarse como A = (AS1 ) ∪
(AS2 ). Se define la relación entre subconjuntos de S de la forma siguiente: si A y B son
subconjuntos de S, entonces A B si P (AS1 ) < P (BS1 ) o si se cumplen las condiciones
P (AS1 ) = P (BS1 ) y P (AS2 ) ≤ P (BS2 ). Probar que la relación satisface los axiomas 1, 2
y 3 pero no el 4.
31. Sea P una distribución de probabilidad dada en el conjunto S de enteros positivos {1, 2, . . .}
tal que asigna a cada entero en S una probabilidad positiva. Sea S1 = {1, 3, 5, . . .} y S2 =
{2, 4, 6, . . .}. Por tanto, todo subconjunto A de S puede expresarse como A = (AS1 ) ∪
(AS2 ). Se define la relación entre subconjuntos de S de la forma siguiente: si A y B
son subconjuntos de S, entonces A B si P (A) < P (B) o si se cumplen las condiciones
P (A) = P (B) y P (AS1 ) ≤ P (BS1 ). Probar que la relación satisface los axiomas 1, 2 y 3
pero no el 4.
32. Probar los siguientes resultados a partir de los axiomas 1 al 4 y el axioma CP:
(a) Si D es un suceso, entonces D ∼ ∅ si y sólo si (A|D) ∼ (B|D) para todo par de sucesos
A y B.
(b) Si A y D son sucesos, entonces (∅|D) (A|D) (D|D).
(c) Sean los sucesos A, B, D y E tales que ADE ∼ BDE ∼ ∅. Entonces (A|E) (B|E) si
y sólo si [(A ∪ D)|E] [(B ∪ D)|E].
(d) Si A, B, D y E son sucesos tales que (A|E) (B|E) y (B|E) (D|E), entonces
(A|E) (D|E).
(e) Si A y B son sucesos tales que A ⊂ B, entonces (A|D) (B|D) para cualquier suceso
D.
(f) Dados los sucesos cualesquiera A, B y D, entonces (A|D) (B|D) si y sólo si (Ac |D) (B c |D)
(g) Si A1 ⊃ A2 ⊃ · · · es una sucesión decreciente de sucesos y B y D son sucesos cualesquiera
T
tales que (Ai |D) (B|D) para todo i entonces ( ∞
i=1 Ai |D) (B|D).
(h) Sean A1 , A2 , . . ., B1 , B2 , . . . y D sucesos tales que Bi Bj D ∼ ∅ para i 6= j y (Ai |D) S
T
(Bi |D) para todo i. Entonces se verifica que ( ∞
( ∞
|D). Si además
i=1 Ai |D)
i=1 BiT
S∞
(Ai |D) ≺ (Bi |D) para al menos un valor de i, entonces ( i=1 Ai |D) ≺ ( ∞
i=1 Bi |D).
S∞
(i) Sean D1 , D2 , . . . sucesos tales que Di Dj ∼ ∅ si i 6= j y i=1 Di ∼ S. Si A y B son sucesos
tales que (A|Di ) (B|Di ) para todos los valores de i, entonces A B. Si además
(A|Di ) ≺ (B|Di ) para al menos un valor de i, entonces A ≺ B.
33. Considérense dos juegos X e Y para los que las ganancias tienen las siguientes distribuciones
de probabilidad:
P (X = −3) = 0.5;
P (Y = −2) = 0.3;
P (X = 2.5) = 0.4;
P (Y = 1) = 0.4;
P (X = 6) = 0.1
P (Y = 3) = 0.3
Expresar qué decisión, entre jugar a X, jugar a Y o no jugar, tomará una persona que tiene
una función de utilidad
6
(a) lineal: U (x) = a x + b,
(b) cúbica: U (x) = x
a>0
3
(c) logarı́tmica: U (x) = log(x + 4)
34. Supóngase que una persona tiene un billete de loterı́a del cual recibirá una ganancia de 36
euros con probabilidad 1/4 ó 0 con probabilidad 3/4. ¿Cuánto dinero estarı́a dispuesto a
pagarle por el billete si su función de utilidad es
(a) cuadrática?
(b) raı́z cuadrada?
35. Considérense tres juegos X, Y y Z para los que las distribuciones de probabilidad de las
ganancias son:
1
P (X = 5) = P (X = 25) =
2
1
P (Y = 10) = P (Y = 20) =
2
P (Z = 15) = 1
Deducir cuál de los tres juegos preferirı́a una persona con función de utilidad
(a) cuadrática
(b) raı́z cuadrada
(c) lineal (pendiente positiva)
36. Sea U una función de utilidad para la que U (0) = 0 y U (100) = 1. Si una persona que tiene
esta función de utilidad se muestra indiferente entre aceptar un juego cuya ganancia será 0
euros con probabilidad 1/3 ó 100 euros con probabilidad 2/3, y aceptar 50 euros seguros, ¿cuál
es el valor de U (50)?
37. Sea ahora U una función de utilidad tal que U (0) = 5, U (1) = 8 y U (2) = 10. Supóngase que
una persona que tiene esta función de utilidad se muestra indiferente entre dos juegos X e Y
cuyas distribuciones de probabilidad de las ganancias son las siguientes:
P (X = −1) = 0.6;
P (X = 0) = 0.2;
P (Y = 0) = 0.9;
P (X = 2) = 0.2
P (Y = 1) = 0.1
¿Cuál es el valor de U (−1)?
38. Una persona tiene que jugar a un juego en el que apuesta una cantidad a (que puede elegir,
siendo 0 ≤ a ≤ 1) a la ocurrencia de un suceso que tiene probabilidad p de ocurrir, y el resto,
(1 − a), a su complementario. ¿Cuál debe ser el valor de a elegido si su función de utilidad es
(a) el logaritmo?
(b) la raı́z cuadrada?
(c) la identidad?
7
39. Sean los juegos X1 , X2 , X3 y X4 para los que las distribuciones de probabilidad de las ganancias
son las siguientes:
P (X1 = 0) = 0.2;
P (X1 = 1) = 0.5;
P (X1 = 2) = 0.3
P (X2 = 0) = 0.4;
P (X2 = 1) = 0.2;
P (X2 = 2) = 0.4
P (X3 = 0) = 0.3;
P (X3 = 1) = 0.3;
P (X3 = 2) = 0.4
P (X4 = 0) = P (X4 = 2) = 0.5
Si la función de utilidad de la persona es tal que prefiere X1 a X2 , ¿qué juego elegirı́a entre
X3 y X4 ?
40. Una persona tiene un capital A > 0, y puede apostar en cierto juego en el que de ganar (para
lo que tiene una probabilidad p) dobları́a el dinero apostado. ¿Cuál debe ser la cantidad a
apostar si su función de utilidad es
(a) el logaritmo?
(b) la raı́z cuadrada?
(c) la identidad?
(d) cuadrática?
41. Supóngase que una persona tiene un billete de loterı́a con el que espera ganar X euros, donde
X tiene una distribución uniforme sobre el intervalo (0, 4). Si la función de utilidad de la
persona es U (x) = xα si x ≥ 0, donde α es una constante positiva conocida, ¿por cuánto
dinero estarı́a dispuesta a vender el billete?
42. El número de horas X que funcionará una máquina antes de fallar tiene una distribución
continua con f.d.p. f (x), y en el momento en que la máquina empieza a funcionar debe
decidirse cuando se regresará para inspeccionarla. Si se vuelve antes de que la máquina haya
fallado, se ocasionará un costo de b euros por haber desperdiciado la inspección. Si se vuelve
después de que la máquina haya fallado, se ocasionará un costo de c euros por cada hora que
la máquina no haya funcionado después de fallar. ¿Cuál es el número óptimo de horas que
deberı́a decidirse esperar antes de regresar a la inspección para minimizar el costo esperado?
43. Supóngase que la función de utilidad de una persona es U (x) = x2 para x ≥ 0. Demuéstrese
que la persona preferirá siempre un juego en el que se obtenga una ganancia aleatoria de X
euros antes que recibir la cantidad E[X] con certeza, siendo P (X ≥ 0) = 1 y E[X] < ∞.
44. Sea el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 , θ3 , θ4 }, el
espacio de decisiones A = {a1 , a2 , a3 }, y la función de pérdida L(θ, a) la especificada por la
tabla
θ1
θ2
θ3
θ4
a1
0
1
3
1
8
a2
2
0
4
2
a3
3
2
0
0
(a) Si la función de probabilidad inicial para los parámetros es ξ, donde
1
ξ(θ1 ) = ,
8
3
ξ(θ2 ) = ,
8
1
ξ(θ3 ) = ξ(θ4 ) = ,
4
hallar la decisión Bayes.
(b) Si se tiene otra función de pérdida L0 (θ, a) dada por
θ1
θ2
θ3
θ4
a1
4
0
0
1
a2
6
-1
1
2
a3
7
1
-3
0
probar que las decisiones Bayes son las mismas para ambas funciones de pérdida, sea
cual sea la distribución inicial del parámetro.
45. Considérese el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el
espacio de decisiones A = {a1 , a2 , a3 }, y la función de pérdida la de la tabla
θ1
θ2
a1
0
8
a2 a3
10 4
0 3
Hallar la decisión Bayes para cualquier función de probabilidad inicial sobre los parámetros.
46. Tenemos el problema de decisión para el que el espacio de parámetros es Θ = [0, 1], el de
decisiones A = <, y la función de pérdida
L(θ, a) = 100 (θ − a)2 ,
θ ∈ Θ,
a ∈ A.
(a) Hallar la decisión Bayes y el riesgo Bayes si la función de densidad inicial del parámetro
es
ξA (θ) = 2θ, 0 ≤ θ ≤ 1.
(b) Otro estadı́stico B difiere de las ideas de su compañero A del apartado anterior, y piensa
que la función de distribución inicial deberı́a más bien ser
ξB (θ) = 3θ2 ,
0 ≤ θ ≤ 1.
Según la opinión de B, ¿en cuanto riesgo adicional incurrirá A a causa de sus incorrectas
ideas sobre la distribución inicial del parámetro?
47. Supóngase que en un problema de decisión, cierta decisión a∗ es una decisión Bayes para dos
distribuciones P1 y P2 del parámetro θ. Probar que entonces, dado α tal que 0 < α < 1, a∗
debe ser también una decisión Bayes para la distribución αP1 + (1 − αP2 ).
48. Sea el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio de
decisiones A = {a1 , a2 , a3 , a4 , a5 }, y la función de pérdida L(θ, a) la especificada por la tabla
θ1
θ2
a1
0
4
a2
4
5
9
a3
2
0
a4
1
1
a5
5
0
¿Para qué distribución del parámetro no hay una única decisión bayes?
49. Dado el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio
de decisiones A = {a1 , . . . , a7 }, y la función de pérdida L(θ, a) la de la tabla
a1 a2
1 6
10 1
θ1
θ2
a3 a4
0 2
13 8
a5
7
0
a6
3
5
a7
4
4
encontrar las decisiones Bayes para todas las posibles distribuciones del parámetro.
50. Considérese un problema de decisión para el que tanto el espacio de parámetros Θ como el
de decisiones A tienen infinitos elementos. Supóngase que Θ = {θ1 , θ2 , . . .}, A = {a1 , a2 , . . .},
y la función de pérdida L(θ, a) es la de la tabla
a∗
θ1
θ2
θ3
θ4
θ5
..
.
1
2
1
2
1
2
1
2
1
2
..
.
a1
0
1
1
1
1
..
.
a2
0
0
1
1
1
..
.
a3
0
0
0
1
1
..
.
a4
0
0
0
0
1
..
.
···
···
···
···
···
···
...
Probar que a∗ es la única decisión admisible en el conjunto A pero que sin embargo no es
decisión Bayes para ninguna distribución del parámetro W .
51. Supóngase que hay una probabilidad 1/10 de que una señal se manifieste en cierto sistema en
algún momento, y una probabilidad 9/10 de que la señal no se haga presente en el sistema.
Una medida hecha en el sistema cuando la señal está presente se distribuye normalmente
con media 50 y varianza 1, y en cambio la medida tomada cuando la señal no está presente
está también distribuida normalmente con la misma varianza pero con media 52. En cierto
instante se hace una medida en el sistema, obteniéndose el valor x. ¿Qué condición deberı́a
cumplirse para que la probabilidad final de que la señal esté presente fuera mayor que la de
que no lo esté?
52. Considérese el problema de decisión para el cual Θ = {θ1 , θ2 }, A = {a1 , a2 }, y la función de
pérdida L(θ, a) la que figura en la tabla
θ1
θ2
a1 a2
0 5
10 0
Supóngase que el estadı́stico puede observar una variable aleatoria Z cuya distribución condicional es normal, con media 0 y varianza 1 cuando W = θ1 y con media 1 y varianza 1 cuando
W = θ2 .
(a) Para cualquier distribución inicial dada ξ = P (W = θ1 ) encontrar una función de decisión
Bayes para ξ, δ ∗ .
(b) Representar el riesgo Bayes ρ∗ (ξ) como una función de ξ sobre el intervalo 0 ≤ ξ ≤ 1.
10
53. Supóngase que un estadı́stico debe decidir si una cierta variable tiene una distribución uniforme sobre el intervalo (0, 1) o uniforme sobre el intervalo (0, 1/2), teniendo ambas la misma
probabilidad (1/2) de ser la distribución correcta. Si la función de pérdida vale 0 cuando
se elige correctamente y a > 0 cuando no sucede ası́; y si el estadı́stico puede seleccionar el
número que quiera de observaciones de la variable aleatoria, cada una de las cuales cuesta
c > 0, probar que deberı́a tomar n∗ observaciones, donde n∗ es el entero no negativo que
minimiza el valor a2−(n+1) + nc.
54. Sea el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio
de decisiones A = {a1 , a2 , a3 }, y la función de pérdida L(θ, a) la dada por
θ1
θ2
a1 a2 a3
0 10 3
10 0 3
Supóngase que se puede disponer de una observación X con las siguientes distribuciones
condicionales:
3
1
P (X = 1|W = θ1 ) = , P (X = 0|W = θ1 ) = ,
4
4
1
3
P (X = 1|W = θ2 ) = , P (X = 0|W = θ2 ) = ,
4
4
y sea ξ = P (W = θ1 ).
(a) Encontrar una decisión Bayes para cada valor de ξ (0 ≤ ξ ≤ 1), y representar el riesgo
Bayes ρ∗ (ξ) como una función de ξ.
(b) Supóngase que antes de tomar una decisión se puede observar una muestra aleatoria
X1 , . . . Xn distribuidas como X. Encontrar una función de decisión Bayes para cada
valor de ξ para un n dado.
(c) En las condiciones del apartado anterior, calcular el valor de n que habrı́a que tomar
para minimizar el riesgo total, ası́ como el valor de éste, si ξ = 1/2 y el coste de cada
observación es c = 1/10.
(d) En las mismas hipótesis (ξ = 1/2) contestar a las mismas preguntas supóniendo ahora
que el coste varı́a con cada observación, siendo 0.15 el coste de cada observación que
valga 1 y 0.05 el coste de cada una de las que valgan 0.
55. Sea el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio
de decisiones A = {a1 , a2 }, y la función de pérdida L(θ, a) la dada por
θ1
θ2
a1
a2
0
1000
1000
0
Supóngase que P (W = θ1 ) = P (W = θ2 ) = 1/2, que la distribución condicional de una
observación X cuando W = θ1 es normal con media -1 y varianza 9, y que la distribución
condicional de X cuando W = θ2 es normal con media 1 y varianza 9. Además, antes de
elegir, se puede observar valores X1 , . . . , Xn de la variable aleatoria, que para un valor dado
de W son una muestra aleatoria de la distribución condicionada de X. Si cada observación en
la muestra cuesta 1 euro, calcular el número óptimo de observaciones n∗ y el riesgo mı́nimo
total.
11
56. Considérese las variables aleatorias X1 , . . . , Xk . Supóngase que la función de densidad de una
de ellas es g y la de las otras k − 1 es h, pero que no se sabe exactamente cuál es la que tiene
densidad g. Para i = 1, . . . , k sea ξi la probabilidad inicial de que Xi sea la variable aleatoria
P
cuya distribución es g, donde ξi > 0 para todo i y ki=1 ξi = 1.
(a) Si se observa que la variable X1 toma el valor x, calcular la probabilidad final de que su
función de densidad sea g.
(b) Si se observa que la variable X3 toma el valor x, calcular la probabilidad final de que la
función de densidad de X1 sea g.
57. Se tienen dos urnas A y B cada una de las cuales contiene bolas rojas y verdes. Se sabe que
una de las urnas contiene la mitad de bolas rojas y la otra mitad verdes, mientras que la otra
contiene la cuarta parte de rojas y el resto verdes. No se sabe cuál es cuál, pero sı́ que si
llamamos W a la que contiene la mitad de cada color, P (W = A) = ξ y P (W = B) = (1 − ξ),
con 0 < ξ < 1.
El estadı́stico tiene que seleccionar una bola de A o de B, y tras observar su color debe decidir
si W = A ó W = B. Elegir la urna de la que deberı́a tomar la bola para cada valor de ξ.
58. Sea el problema de decisión para el que el espacio de parámetros es Θ = {θ1 , θ2 }, el espacio
de decisiones A = {a1 , a2 }, y la función de pérdida L(θ, a) la dada por
θ1
θ2
a1
0
a2
a2
a1
0
Supóngase que se puede observar una variable aleatoria X u otra Y cuyas distribuciones
condicionadas son las siguientes:
2
P (X = 1|W = θ1 ) = ,
3
1
P (X = 0|W = θ1 ) = ,
3
1
1
P (X = 1|W = θ2 ) = , P (X = 0|W = θ2 ) = ,
2
2
3
1
P (Y = 1|W = θ1 ) = , P (Y = 0|W = θ1 ) = ,
4
4
1
1
P (Y = 1|W = θ2 ) = , P (Y = 0|W = θ2 ) = ,
2
2
Si el coste de observar X es el mismo que el de observar Y , probar que para cualquier distribución inicial de W y para cualesquiera valores de las pérdidas a1 y a2 se deberı́a observar
Y mejor que X.
59. Sea W un parámetro que toma los valores θ1 y θ2 con probabilidades iniciales respectivas ξ y
(1 − ξ), f (·|θi ) la probabilidad condicional de X dado un valor del parámetro W = θi i = 1, 2
y ξ(X) la probabilidad final de que W = θ1 cuando X = x.
(a) Probar que E[ξ(X)] = ξ, donde la esperanza se calcula suponiendo que W tiene la
distribución inicial especificada (claro, aún no hemos observado X).
(b) Si suponemos que realmente W = θ1 , probar que E[ξ(X)] ≥ ξ, es decir, que la distribución final asignará, en media, una mayor probabilidad al verdadero valor del parámetro
que la que le asignaba la distribución inicial.
12
(c) Si ξ = 1/2 y W = θ1 , probar que para todo (0 < < 1),
P (ξ(X) ≤ ) ≤
,
1−
lo que puede interpretarse como que hay una probabilidad muy pequeña de que la distribución final asigne una probabilidad pequeña al verdadero valor del parámetro.
60. Sea Θ = {θ1 , θ2 , θ3 } y P el conjunto de todas las distribuciones de probabilidad (p1 , p2 , p3 ) tal
que p1 ≥ 0 (i = 1, 2, 3) y p1 + p2 + p3 = 1. Sea C el conjunto de puntos dentro o en la frontera
de un triángulo equilátero que tiene altura unidad, ν1 , ν2 y ν3 los vértices de ese triángulo, y
Si (i = 1, 2, 3) el lado del triángulo opuesto al vértice νi .
(a) Probar que la suma de distancias de cualquier punto del triángulo a los tres lados del
triángulo es 1, y por tanto que hay una correspondencia biunı́voca entre los conjuntos P
y C.
(b) Si, fijado un punto (p1 , p2 , p3 ) ∈ P, se coloca un peso pi en el vértice νi (i = 1, 2, 3),
encontrar el centro de gravedad x de este sistema de tres puntos de masa y mostrar que
la posición de x define una correspondencia biunı́voca entre P y C (para cada punto
x ∈ C sus coordenadas en P se llaman coordenadas baricéntricas).
(c) Probar que las correspondencias entre P y C de los dos apartados anteriores son la misma.
61. Supóngase que la compañı́a internacional Potatoes S.L. tiene en su plantilla k estadı́sticos,
cada uno de los cuales tiene su propia distribución inicial ξi para un cierto parámetro W .
El ejecutivo principal de la famosa firma de instrumental electrónico de precisión forma su
opinión sobre W de las opiniones de los k estadı́sticos, y asigna la siguiente probabilidad inicial
a cada punto θ ∈ Θ:
ξ ∗ (θ) = α1 ξ1 (θ) + . . . + αk ξk (θ),
donde α1 , . . . , αk son pesos tales que αi ≥ 0 para todo i y α1 + · · · + αk = 1, reflejando cada αi
la confianza que el ejecutivo tiene en la opinión del estadı́stico i. Un dı́a quedan todos juntos
para observar el valor de una variable aleatoria X, cuya función de densidad condicional
cuando W = θ es f (·|θ). probar que la distribución final del ejecutivo será nuevamente
una combinación lineal de las distribuciones finales de los k estadı́sticos, con nuevos pesos
β1 , . . . , βk que dependerán del valor observado de X. Discutir además las condiciones bajo
las cuales un peso βi de la distribución final será mayor que su correspondiente peso αi de la
distribución inicial.
62. La proporción p de artı́culos defectuosos en un gran lote es desconocida. Como no tenemos
ninguna información acerca de p, le asignamos la función de densidad inicial uniforme en el
intervalo (0, 1). Hallar la función de densidad final de p.
63. Se va a observar la duración de cierto tipo de lámparas fluorescentes. Se sabe que la distribución de la duración decualquiera lámpara concreta es una exponencial de parámetro
θ desconocido. Debido a resultados anteriores, se asigna a θ inicialmete una distribución
Gamma de media 0.0002 y desviación tı́pica 0.0001. Hallar la distribución final de θ.
64. Se sabe que la proporción p de artı́culos defectuosos en un gran lote manufacturado es 0.1 ó
0.2, y que la función de probabilidad inicial de p es
ξ(0.1) = 0.7;
13
ξ(0.2) = 0.3
Se seleccionan al azar ocho artı́culos del lote y se encuentran dos defectuosos. Hallar la función
de probabilidad final de p, y razonar el resultado obtenido.
65. El número de defectos en una cinta magnética de grabación tiene una distribución de Poisson
de media λ, donde la distribución inicial de λ (que puede ser 1 ó 1.5) es
ξ(1) = 0.4;
ξ(1.5) = 0.6
Si una cinta seleccionada al azar resulta con tres defectos, ¿cuál es la probabilidad final de λ?
Interpreta el resultado.
66. Supóngase que la proporción p de artı́culos defectuosos en un lote es desconocida. Hallar la
distribución final de p, su estimación bayesiana y el riesgo Bayes para una función de pérdida
cuadrática, sabiendo que de una muestra de ocho artı́culos tres resultaron defectuosos,
(a) si la distribución inicial de p es uniforme en el intervalo (0, 1)
(b) si la distribución inicial de p es
(
ξ(p) =
2(1 − p) si 0 < p < 1
0
e.o.c.
67. Supongamos que se va a seleccionar una observación, X, de una distribución uniforme sobre
el intervalo (θ − 21 , θ + 12 ), con θ desconocido, siendo la distribución inicial de θ uniforme sobre
el intervalo (10, 20). Si el valor observado de X es 12, ¿cuál es la distribución final de θ? ¿Y
si seleccionamos seis observaciones, obteniendo los valores 11, 11.5, 11.7, 11.1, 11.4, 10.9?
68. Supóngase que se desconoce la proporción p de artı́culos defectuosos de un gran cargamento, y
tras seleccionar al azar 100 artı́culos se encuentran 3 defectuosos, obteniéndose una probabilidad final para el parámetro, Beta de media 2/51 y varianza 98/(512 103). ¿Qué distribución
incial asignó a p el estadı́stico? Estimación Bayes para la función de pérdida cuadrática.
69. Sea λ el número promedio de defectos por cada 100 pies de cinta magnetofónica, siendo λ
desconocido, y que se asigna a λ una distribución inicial Gamma con parámetros α = 2 y
β = 10. Cuando se inspecciona una cinta de 1200 pies, se encuentran exactamente cuatro
defectos. Hallar la distribución final de λ e interpretar el resultado obtenido.
70. Supóngase que el tiempo (en minutos) requerido para atender a un cliente en cierto servicio
tiene una distribución exponencial de parámetro θ desconocido, y que la distribución inicial
de θ es una distribución Gamma de media 0.2 y desviación tı́pica 1. Si se observa que el
tiempo esperado requerido para atender a una muestra aleatoria de 20 clientes es 3.8 minutos,
¿cuál es la distribución final de θ? Analizar el resultado.
71. Supóngase que las estaturas de los individuos de cierta población tienen una distribución
normal con media µ desconocida y desviación tı́pica 2 pulgadas. Supóngase además que la
distribución inicial de µ es normal, con media 68 pulgadas y desviación tı́pica 1 pulgada. Si
se seleccionan al azar 10 personas de la población y se encuentra que su estatura promedio es
69.5 pulgadas,
(a) ¿cuál es la distribución final de µ? Explica el resultado.
(b) ¿qué intervalo de longitud 1 pulgada tiene la mayor probabilidad inicial de contener el
valor de µ? ¿cuál es esa probabilidad?
14
(c) ¿qué intervalo de longitud 1 pulgada tiene la mayor probabilidad final de contener el
valor de µ? ¿cuál es esa probabilidad?
72. Se selecciona una muestra aleatoria de 20 observaciones de una distribución normal de media
µ desconocida y varianza 1, resultando X̄ = 10 y que la distribución final de µ es una normal
de media 8 y varianza 1/25. ¿Cuál fue la distribución inicial de µ?
73. Supóngase que el número de minutos que una persona debe esperar un autobús cada mañana
tiene una distribución uniforme sobre el intervalo (0, θ), con θ desconocido. Si la distribución
inicial de θ es
(
192
si θ ≥ 4
θ4
ξ(θ) =
0 e.o.c.
y los tiempos de espera observados durante tres mañanas sucesivas son 5, 3, y 8 minutos,
¿cuál es la distribución final de θ?
74. Se desconoce la proporción p de artı́culos defectuosos de una gran cargamento, pero se le
supone una distribución inicial Beta(α = 5, β = 10). Tras analizar 20 artı́culos del cargamento,
(a) si se encuentra que solamente uno de ellos resulta defectuoso, y se utiliza la función de
pérdida del error cuadrático, ¿cuál es la estimación Bayes de p?
(b) ¿para qué número de artı́culos defectuosos de la muestra será un máximo el error cuadrático
medio del estimador Bayes? ¿para qué número será mı́nimo?
75. El número de defectos en una cinta magnética de grabación de 1200 pies tiene una distribución
de Poisson de media λ desconocida, y la distribución inicial de λ es una
Gamma(α = 3, β = 1). Se seleccionan al azar cinco cintas, y tras inspeccionarlas arrojan
las cantidades de defectos 2, 2, 6, 0, 3. ¿Cuál es la estimación Bayes de λ para la función de
pérdida del error cuadrático?
76. En las condiciones del ejercicio 70. El tiempo en minutos necesario para atender a un cliente en
cierto servicio tiene una distribución exponencial con parámetro θ desconocido, la distribución
inicial de θ es una Gamma de media 0.2 y desviación tı́pica 1, y el promedio del tiempo
requerido para atender una muestra aleatoria de 20 clientes es 3.8 minutos. Si se utiliza la
función de pérdida del error cuadrático, ¿cuál es la estimación Bayes de θ?
77. En las condiciones del ejercicio 71. Las estaturas de los individuos de una cierta población
tienen una distribución normal con media µ desconocida y desviación tı́pica 2 pulgadas. Si
la distribución inicial de µ es N (68, 1), y tras seleccionar a 10 personas de la población se
obtiene una estatura promedio de 69.5 pulgadas, ¿cuál serı́a la estimación Bayes de µ si se
utiliza como función de pérdida el error cuadrático medio? ¿Y si se utiliza el error absoluto
medio?
78. Supóngase que X1 , . . . , Xn constituyen una muestra aleatoria simple de una distribución uniforme en el intervalo [3 θ, 4 θ] (θ desconocido). Si asignamos a θ la distribución inicial
(
ξ(θ) =
2
θ3
0
θ>1
e.o.c.
¿cuáles serı́an los estimadores bayes respecto de las funciones de pérdida del error cuadrático
medio y del error absoluto medio para la muestra 3.825, 3.600, 3.782?
15
Descargar