Procesos estocásticos Junio 2012 — Primera Semana Tres jugadores, A, B y C disponen de un mazo de cartas, en cada una de las cuales figura una de las tres letras A, B o C. Inicialmente A extrae una carta al azar y gana el juego si obtiene una carta con su propio nombre. En caso contrario pasa el turno al jugador que indique la carta obtenida y éste, una vez devuelta la carta al mazo, realiza su jugada de la misma manera. La partida continúa hasta que alguno consigue ganar. Además, se sabe que la proporción p de cartas marcadas con B y con C es la misma y p se elige para que los tres jugadores tengan la misma probabilidad de ganar. a) Determinar el valor de p. b) Hallar la duración media de la partida. c) Obtener la distribución del número de jugadas que realiza A. d) Si hay que poner un euro en la mesa cada vez que se hace una extracción y el ganador se lo lleva todo, calcular el beneficio esperado de cada jugador. Solución a) Puesto que en cada extracción las probabilidades de obtener cada resultado son P (B) = P (C) = p, P (A) = 1 − 2p, la cadena que indica el jugador que realiza la extracción hasta que alguno consigue ganar tiene matriz de transición A B C GA GB GC A p p 1 − 2p B 1 − 2p p p C 1 − 2p p p 1 GA GB 1 GC 1 Las probabilidades fi = fi,GA de que gane A si le toca jugar a i = A, B, C verifican fA = 1 − 2p + pfB + pfC fB = (1 − 2p)fA + pfC fC = (1 − 2p)fA + pfB De las dos últimas ecuaciones se obtiene fB + fC = 2(1 − 2p) fA , 1−p con lo cual (1 − p)(1 − 2p) 1 − 2p = . 1 − 2p(1 − 2p)/(1 − p) 1 − 3p + 4p2 √ Para que sea fA = 1/3 debe ser p = (3 − 5)/2 ' 00 382. Directamente se deduce fA,GB = fA,GC = 1/3 (porque fA,GB + fA,GC = 2/3 y fA,GB = fAGC por simetrı́a). fA = b) Las duraciones mi de la partida cuando le toca jugar a i = A, B, C cumplen mA = 1 + pmB + pmC mB = 1 + (1 − 2p)mA + pmC mC = 1 + (1 − 2p)mA + pmB , en cuya solución es √ √ 1+p 5+2 5 0 mA = = ' 3 157 para p = (3 − 5)/2. 1 − 3p + 4p2 3 c) Las probabilidades fi = fi,A de alcanzar el estado A desde i = A, B, C satisfacen fA = pfB + pfC fB = 1 − 2p + pfC fC = 1 − 2p + pfB de modo que √ 2p(1 − 2p) = 7 − 3 5 ' 00 292. 1−p Por consiguiente el número VA de veces que se llega al estado A tiene distribución √ √ P{VA = k} = (7 − 3 5)k−1 (3 5 − 6) para k = 1, 2, 3, . . . fA = d) Para simplificar los cálculos pueden agruparse los estados B y C en un solo estado A, de modo que la matriz de transición queda A A GA GA A 2p 1 − 2p A 1 − 2p p p GA 1 GA 1 Con ella las probabilidades de que gane o pierda A, según que la próxima extracción la realice o no A, son fA,GA = (1 − p)(1 − 2p) 1 − 3p + 4p2 fA,GA = 2p2 1 − 3p + 4p2 fA,GA = (1 − 2p)2 1 − 3p + 4p2 fA,GA = p 1 − 3p + 4p2 Las partidas que gana A se producen de acuerdo con la matriz de transición A A GA A 2p(1 − 2p)/(1 − p) 1 − 2p(1 − 2p)/(1 − p) A 1−p p GA 1 y la ganancia media de A es el número medio de visitas a A. Como aquı́ fA,A = 2p(1 − 2p) , 1−p fA,A = 3p − 4p2 , resulta 3p − 4p2 1 − 3p + 4p2 2p(1 − 2p) . PA,A (1) = (1 − p)(1 − 3p + 4p2 ) PA,A (1) = En cambio las partidas que pierde A transcurren según la matriz de transición A A GA A 1 A 2p(1 − 2p) p 1 − 3p + 4p2 GA 1 y la pérdida de A es entonces el número medio de visitas a A, mas 1 por el euro inicial. Ahora fA,A = fA,A = con lo cual 1 + PA,A (1) = 1 + 2p(1 − 2p) 1−p 2p(1 − 2p) 1−p = . 1 − 3p + 4p2 1 − 3p + 4p2 En definitiva, el beneficio esperado de A resulta 2p(1 − 2p) 1−p − fA,GA 2 (1 − p)(1 − 3p + 4p ) 1 − 3p + 4p2 2p((1 − 5p + 5p2 ) = (1 − 3p + 4p2 )2 √ Para el valor de p seleccionado es B = −2(1 + 5)/9 ' −00 72 euros. B = fA,GA