Septiembre 2004

Anuncio
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
Estadı́stica aplicada y modelización. 15 de septiembre de 2004
SOLUCIÓN MODELO A
1. La siguiente tabla muestra el número de averı́as al año, X, de 50 máquinas y la temperatura
de funcionamiento de las mismas, Y, en el momento de la averı́a.
X\Y
2
3
4
5
30 40 50
1 2 2
5 5 10
2 3 10
0 4 6
(a) Calcula las distribuciones marginales de frecuencias de las variables aleatorias X e Y ,
indicando frecuencias absolutas y relativas de ambas variables.
xi
2
3
4
5
ni. fi. Ni. xi ni. x2i ni.
5 1/10 5
10
20
20 2/5 25 60
180
15 3/10 40 60
240
10 1/5 50 50
250
50
1
180 690
yj n.j
f.j
N.j yj n.j yj2 n.j
30 8 4/25
8
240 7200
40 14 7/25 22 560 22400
50 28 14/25 50 1400 70000
50
1
2200 99600
(b) Calcula mediana y moda de ambas variables, el número medio de averı́as al año y la
temperatura media de funcionamiento durante las averı́as.
Para la variable X:
Mediana: como N/2 = 25 = N2. , entonces la mediana será el punto medio de la modalidad
3+4
correspondiente y la siguiente; en este caso, Me =
= 3.5.
2
Moda: es el valor de mayor frecuencia, por tanto Mo = 3
180
Media: X =
= 3.6.
50
Para la variable Y :
Mediana: como N/2 = 25 ∈ (22, 50), entonces la mediana es la modalidad correspondiente
al mayor de los extremos del intervalo anterior; Me=50.
Moda: es el valor de mayor frecuencia, por tanto Mo=50.
2200
Media: Y =
= 44.
50
(c) Calcula el coeficiente de variación de ambas variables.
690
2
=
Varianza de X: σX
− (3.6)2 = 0.84.
50
Coeficiente de variación de X:
√
√
σ2
0.84
= 0.2545
CV(X) =
=
3.6
X
99600
− 442 = 56.
Varianza de Y : σY2 =
50
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
1
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
Coeficiente de variación de Y :
√
56
CV(Y ) =
= 0.17.
44
(d) Calcula la recta de regresión de Y sobre X y, a través del coeficiente de correlación
lineal, analiza la bondad de dicho ajuste.
Dado que ya se han calculado la media de X e Y y también la varianza de X, para calcular
la recta de regresión es más cómodo emplear la fórmula de la misma, en lugar del sistema
de ecuaciones. Sólo falta calcular la covarianza.
σXY =
60 + 160 + 200 + 450 + 600 + 1500 + 240 + 480 + 2000 + 800 + 1500
−3.6·44 = 1.4.
50
La recta de regresión de Y sobre X queda
y − 44 =
1.4
(x − 3.6) ⇔ y = 1.66x + 38.
0.84
Coeficiente de correlación lineal:
ρ= √
1.4
√ = 0.2041.
0.84 56
Como es un número próximo a cero, se deduce que el ajuste lineal no es bueno para este
conjunto de datos.
2. Dos profesoras comparten un despacho con un solo teléfono. Han comprobado que el 45%
de las llamadas recibidas son para la profesora A y el resto para la profesora B.
Dos de cada cinco llamadas que recibe la profesora A son externas y las otras tres son
llamadas realizadas desde la misma Universidad. La profesora B recibe cuatro de cada seis
llamadas desde la Universidad y el resto externas.
(a) Calcula la probabilidad de que se reciba en el despacho una llamada externa.
Llamamos E al suceso E = ”se reciba una llamada externa en el despacho”. Como dicha
llamada puede ir dirigida a la profesora A o a la profesora B, hay que aplicar el teorema de
la probabilidad total. Si se denominan LA y LB a los sucesos
LA = ”la profesora A reciba una llamada”;
LB =”la profesora B reciba una llamada”;
entonces
P (E) = P (E | LA ) · P (LA ) + P (E | LB ) · P (LB ) =
2
2
· 0.45 + · 0.55 = 0.3633.
5
6
(b) Sabiendo que se ha recibido una llamada realizada desde la Universidad en el despacho,
¿qué probabilidad hay de que fuera dirigida a la profesora A?
Las llamadas que se reciben en el despacho se están haciendo desde la Universidad o son
externas, por tanto podemos llamar E c al suceso ”se reciba una llamada hecha desde la
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
2
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
Universidad”. La probabilidad pedida en este apartado es la probabilidad condicionada,
P (LA | E c ), para la que hay que usar la fórmula de Bayes
3
· 0.45
P (E | LA ) · P (LA )
P (LA E )
c
5
=
=
= 0.424.
P (LA | E ) =
P (E c )
P (E c )
1 − 0.3633
T
c
c
3. Un jugador lanza 2 veces una moneda perfecta. Describe la distribución de probabilidad de
la variable aleatoria X que mide el número de caras que obtiene.
Otro jugador lanza la moneda 3 veces.
(a) ¿Cuál es la probabilidad de que ambos jugadores obtengan el mismo número de caras?
(b) ¿Y de que el segundo jugador saque más caras que el primero?
Para la primera parte del problema, se llama X=”número de caras en 2 lanzamientos” que
es una variable discreta que sigue una distribución binomial:
el experimento de Bernoulli es el lanzamiento de la moneda;
se está considerando éxito=”salir cara”, con lo cual, la probabilidad de éxito es p =
1
;
2
el experimento se repite n = 2 veces.
Para dar la distribución de probabilidad, se ha de decir, en primer lugar, los valores que
toma la variable, en este caso
X ∈ {0, 1, 2}
y las probabilidades de que X tome dichos valores:
à ! µ ¶0 µ ¶2
P (X = 0) =
2
0
1
2
1
2
=
2
1
1
2
1
2
1
1
=2 =
4
2
2
2
1
2
1
2
=
à ! µ ¶1 µ ¶1
P (X = 1) =
à ! µ ¶2 µ ¶0
P (X = 2) =
1
4
1
4
Para la segunda parte:
Llamamos Y =”número de caras en 3 lanzamientos”. Como en el caso anterior, esta variable
también sigue una distribución binomial, aunque de parámetros n = 3 y p = 1/2.
Para que ambos jugadores obtengan el mismo número de caras, lo que debe ocurrir es que
o ambos no obtengan ninguna cara, es decir, X = 0 e Y = 0, o que ambos obtengan 1 cara,
X = 1 e Y = 1 o que ambos obtengan 2 caras, X = 2 e Y = 2. Si se denota por A al suceso
A=”ambos jugadores obtengan el mismo número de caras ”
se verifica
A = ({X = 0} ∩ {Y = 0}) ∪ ({X = 1} ∩ {Y = 1}) ∪ ({X = 2} ∩ {Y = 2})
Como las variables X e Y toman valores de forma independiente, P ({X = i} ∩ {Y = i}) =
P (X = i) · P (Y = i) para i ∈ {0, 1, 2} y como los distintos resultados al lanzar una
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
3
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
moneda son incompatibles, la probabilidad de esta unión de sucesos es solamente la suma
de las probabilidades. Se puede usar la tabla de la distribución binomial:
P (A) = P (X = 0) · P (Y = 0) + P (X = 1) · P (Y = 1) + P (X = 2) · P (Y = 2) =
0.25 · 0.125 + 0.5 · 0.375 + 0.25 · 0.375 = 0.3125
El suceso B=”el segundo jugador saque más caras que el primero” se puede expresar
B = ({X = 0} ∩ {Y > 0}) ∪ ({X = 1} ∩ {Y > 1}) ∪ ({X = 2} ∩ {Y > 2})
siendo la probabilidad
P (B) = P (X = 0) · (P (Y = 1) + P (Y = 2) + P (Y = 3))+
P (X = 1) · (P (Y = 2) + P (Y = 3)) + P (X = 2) · P (Y = 3) =
0.25(0.375 + 0.375 + 0.125) + 0.5(0.375 + 0.125) + 0.25 · 0.125 = 0.5
4. La velocidad a la que circulan los vehı́culos por una autovı́a sigue una distribución normal
de parámetros 100 y 40.
(a) ¿Cuál es la probabilidad de que un vehı́culo circule a 120 km/h.?
Al tratarse X=”velocidad a la que circulan los vehı́culos por la autovı́a” de una variable
aleatoria continua, la probabilidad de que dicha variable tome un valor concreto es siempre
0.
P (X = 120) = 0.
(b) Calcula la probabilidad de que un vehı́culo circule entre 90 y 120 km/h.
µ
¶
90 − 100
120 − 100
<Z<
=
40
40
P (−0.25 < Z < 0.5) = 1 − (P (Z > 0.5) + P (Z < −0.25)) =
P (90 < X < 120) = P
1 − (P (Z > 0.5) + P (Z > 1)) = 1 − 0.3085 − 0.4013 = 0.2902
(c) Se ha estimado que el 11.9% de los vehı́culos circulan a una velocidad demasiado alta,
que pone en peligro la seguridad de los demás conductores. ¿A partir de qué velocidad se
está considerando que un vehı́culo representa una amenaza para los demás?
Si se representa por a al valor buscado, lo que se sabe sobre él es que
µ
a − 100
0.119 = P (X > a) = P Z >
40
¶
a − 100
por tanto,
= z0.119 . El valor de z0.119 se deduce usando las tablas de la normal
40
tipificada: buscamos el número 0.119 en el interior de la tabla y se anota a qué fila y
columna corresponde. La fila del valor 1.1 y la columna del 0.08. Entonces, z0.119 = 1.18.
a − 100
= 1.18, de donde
Para calcular el valor de a sólo hay que resolver la ecuación
40
a = 100 + 40 · 1.18 = 147.2.
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
4
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
Los vehı́culos que circulan a velocidad superior a los 147.2 km/h se considera que representan
una amenaza para los demás conductores.
(d) De una muestra de 6 vehı́culos elegidos al azar entre aquellos que circulaban por la
autovı́a, calcula la probabilidad de que sólo dos de ellos circularan a más de 120 Km/h,
mientras que los otros cuatro lo hicieran por debajo de esta velocidad.
Obsérvese que esta cuestión puede verse como la repetición de una prueba de Bernoulli, lo
cual hace pensar en la distribución binomial.
Prueba de Bernoulli: un vehı́culo circula a 120 km/h o no.
Número de pruebas : 6, que es el número de vehı́culos cuya velocidad se observa.
Si se considera como éxito ”un vehı́culo circule a más de 120 km/h”, la probabilidad de éxito
será
µ
¶
120 − 100
p = P (X > 120) = P Z >
= P (Z > 0.5) = 0.3085
40
Si llamamos Y = ”número de vehı́culos que circulan a más de 120 km/h de una muestra de
6 vehı́culos”, la probabilidad que se pide es P (Y = 2). Como no se encuentra el valor de
p = 0.3085, en las tablas de la binomial, se usa la fórmula correspondiente:
à !
P (Y = 2) =
6
6!
0.30852 (1 − 0.3085)4 =
0.0951 · 0.2281 = 0.326.
2! · 4!
2
5. Cada año se lleva a cabo en la Reserva Natural de la laguna de Fuente Piedra (Málaga) una
campaña de anillamiento de flamencos que permite conocer aspectos tan importantes para la
conservación de la especie como su supervivencia y mortalidad, movimientos, migraciones,
causas de mortandad, uso de hábitats, reproducción, intercambio entre poblaciones, etc.
El número de pollos a anillar depende de las tasas de nacimiento registradas en los años
anteriores. Se ha estimado que el número de nacimientos por año sigue una distribución de
Poisson y la media de nacimientos durante los últimos 30 años es 14023.75 pollos al año.
(a) Estima un intervalo de confianza al 90% para la media de nacimientos que se registran
en la laguna por año.
Si se consulta la correspondiente tabla de intervalos de confianza, se observa que el intervalo
para la media de una distribución de Poisson es

x − zα/2
s
s 
x
x
, x + zα/2
n
n
donde x representa la media muestral, en este caso x = 14023.75
α es el nivel de significación, α = 1 − 0.9 = 0.1 y
n el tamaño muestral, n = 30.
Se tienen que usar las tablas de la normal para calcular zα/2 = z0.05 . Buscamos 0.05 en el
interior de la tabla. Al no encontrar este número, se han de considerar dos valores entre
los cuales 0.05 esté comprendido. Éstos son 0.0505 y 0.0495, que corresponden a las abcisas
1.64 y 1.65, respectivamente. Hay que hacer una interpolación lineal con ambos valores,
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
5
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
aunque en este caso es sencillo pues 0.05 es el punto medio de 0.0495 y 0.0505, luego z0.05
será el punto medio entre z0.0495 y z0.0505 , es decir z0.05 = 1.645.
Ahora sólo queda sustituir cada uno de los valores

x − zα/2
s
s 

s
s

x
x 
14023.75
14023.75 
, x + zα/2
= 14023.75 − 1.645
, 14023.75 + 1.645
=
n
n
30
30
[14023.75 − 35.5661, 14023.75 + 35.5661] = [13988.184, 14059.316]
(b) ¿Puede admitirse que el número medio de nacimientos es de 14000 pollos al año, a un
nivel de significación α = 0.1?
Hay que realizar un contraste de hipótesis estadı́sticas sobre la media de una distribución
de Poisson. Como la pregunta no hace referencia a si el número de nacimientos está por
encima o por debajo de los 14000 ejemplares, sino solamente importa si se puede considerar
igual o no, habrá que plantear un contraste bilateral:
H0 : λ = 14000
Ha : λ 6= 14000
Si observamos la tabla de contrastes de hipótesis,
s
se rechaza H0 : λ = 14000
si
| x − λ0 |> zα/2
λ0
n
Se sustituye cada elemento de la fórmula por su valor (obsérvese que λ0 representa el valor
con el que se está comparando la media, por tanto, λ0 = 14000):
s
| x − λ0 |=| 14023.75 − 14000 |= 23.75 < 35.536 = zα/2
λ0
n
por tanto, como no se cumple la condición de rechazo, se acepta H0 .
Entonces, sı́ puede admitirse que el número de nacimientos será de 14000 pollos al año, con
el nivel de significación considerado.
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
6
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
SOLUCIÓN MODELO B
1. Se quiere analizar la relación calcio - creatinina en la orina con objeto de diagnosticar
la presencia de cierto tipo de cálculos renales. Para ello se realiza una simulación en el
laboratorio en la que se toman cinco muestras con distintas cantidades de Ca y se registran
los niveles de creatinina a fin de determinar el tipo de asociación entre ambas variables.
Calcio (X, mg/l)
Creatinina (Y, mg/l)
1.5 2 2.5 3 3.5
0.5 1/3 0.5 0.3 0.2
(a) Ajusta una recta de regresión Y | X.
Se puede emplear la correspondiente fórmula:
recta de regresión de Y | X :
y−Y =
σXY
(x − X)
2
σX
para lo cual, hay que calcular los diversos elementos de la misma. Disponemos en forma de
tabla los cálculos necesarios para que quede más claro:
xi
yi
xi · yi
x2i
3/2 1/2
3/4
9/4
2
1/3
2/3
4
5/2 1/2
5/4
25/4
3
3/10 9/10
9
7/2 1/5 7/10 49/4
25/2 11/6 64/15 135/4
Entonces,
N
X
media de X,
X=
25/2
5
= = 2.5
5
2
yi
11/6
11
=
= 0.366
N
5
30
PN
xi yi
64/15 5 · 11
= i=1
−X ·Y =
−
= 0.85333 − 0.91666 = −0.06333
N
5
2 · 30
media de Y,
σXY
=
N
N
X
covarianza
xi
i=1
Y =
N
X
varianza de X,
2
σX
=
x2i
i=1
N
i=1
2
−X =
=
135/4
− 2.52 = 6.75 − 6.25 = 0.5
5
Tras sustituir se obtiene:
y − 0.366 =
−0.06333
(x − 2.5) ⇔ y = −0.1266x + 0.6825
0.5
También se pueden deducir los dos coeficientes de la ecuación de la recta de regresión, cuya
expresión genérica se tomará y = a + bx, por medio del sistema de ecuaciones que resulta
de aplicar el método de los mı́nimos cuadrados:
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
7
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
N
X
yi
=
aN + b
i=1
N
X
N
X
i=1
i=1
xi y i = a
N
X
xi
i=1
N
X
xi + b









x2i 

i=1
Ya se han calculado antes todos los términos del sistema, que queda
11
25
= 5a + b
6
2







64
25
135 


= a+
b 
15
2
4
y las soluciones son a = 0.683, b = −0.1266.
1
a + bx
Haciendo un sencillo cambio de variable, se puede reducir al caso lineal:
1
1
si y =
, entonces = a + bx, que se puede ver como la ecuación de una recta si se
a + bx
y
1
llama y 0 = . Por tanto, se ha de ajustar una recta de regresión de Y 0 sobre X. Se puede
y
utilizar el sistema de ecuaciones correspondiente o la fórmula de la recta. En cualquiera de
ambos casos, se tienen que realizar los cálculos necesarios con la nueva variable Y 0 .
(b) Ajusta una hipérbola de la forma y =
yi0 =
1
yi
xi · yi0
2
3
3
6
2
5
10/3
10
5
35/2
46/3 = 15.333 83/2 = 41.5
El sistema de ecuaciones serı́a
N
X
yi0
i=1
N
X
=
xi yi0 = a
i=1
aN + b
N
X
i=1
N
X
xi
i=1
N
X
xi + b









x2i 

i=1
15.333 =
41.5
=
25
5a + b
2







25
135 


a+
b 
2
4
cuyas soluciones son a = −0.1 y b = 1.27.
Si se prefiere aplicar la fórmula, se determinan los valores de
Y0 =
15.333
41.5
= 3.066 y σXY 0 =
− 2.5 · 3.066 = 0.635
5
5
y sustituı́mos
y0 − Y 0 =
σXY 0
0.635
(x − X) ⇔ y − 3.0666 =
(x − 2.5) ⇔ y 0 = 1.27x − 0.1
2
σX
0.5
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
8
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
Por tanto, la ecuación de la hipérbola será
y=
1
1.27x − 0.1
(c) Realiza una estimación del nivel de creatinina para un contenido de calcio de 2.8 mg/l
con ambas curvas de regresión.
Solamente hay que sustituir el valor x = 2.8 en ambas curvas:
En la recta de regresión: y = −0.1266 · 2.8 + 0.6825 = 0.328.
1
En la hipérbola: y =
= 0.289.
1.27 · 2.8 − 0.1
2. Un sistema está formado por dos componentes C1 y C2 conectados en paralelo y otro componente C3 conectado en serie a los dos anteriores, tal como muestra la figura
C1
C3
C2
Cada componente funciona de forma independiente a los demás siendo las probabilidades
de fallo 0.1, 0.15 y 0.01, para los componentes C1 , C2 y C3 , respectivamente. Calcula la
probabilidad de que
(a) fallen los tres componentes
Si se denota por Ci = ”falle la componente” i, el suceso A=”fallen los tres componentes” se
puede expresar como
A = C1 ∩ C2 ∩ C3
por tanto P (A) = P (C1 ) · P (C2 ) · P (C3 ) = 0.1 · 0.15 · 0.01 = 0.00015.
(b) falle alguno de los componentes
El suceso B =”falle alguno de los componentes” se puede expresar como
B = C1 ∪ C2 ∪ C3
puesto que ”fallar alguno” significa que falle el primero o el segundo o el tercer componente.
Como C1 , C2 y C3 no son sucesos incompatibles, es decir, sı́ pueden ocurrir a la vez, puesto
que pueden fallar C1 y C2 al mismo tiempo o C1 y C3 o . . .. Esto implica que para calcular
la probabilidad asociada al suceso B, habrı́a que tener en cuenta todas las intersecciones,
esto es
P (B) = P (C1 ) + P (C2 ) + P (C3 ) − P (C1 ∩ C2 ) − P (C1 ∩ C3 ) − P (C2 ∩ C3 ) + P (C1 ∩ C2 ∩ C3 )
Por eso es más sencillo usar el suceso complementario de B,
B c = ”no falle ningún componente” = C1c ∩ C2c ∩ C3c
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
9
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
Entonces
P (B) = 1−P (B c ) = 1−((1−P (C1 ))·(1−P (C2 ))·(1−P (C3 ))) = 1−(0.9·0.85·0.99) = 0.24265
(c) el sistema funcione, es decir, funcione al menos uno de los componentes C1 , C2 y funcione
el componente C3 .
Para que el sistema funcione tiene que funcionar C3 forzosamente y funcionar C1 o C2 , por
consiguiente, S =”el sistema funcione” se puede expresar
S = C3c ∩ (C1c ∪ C2c ) luego
P (S) = P (C3c ) · P (C1c ∪ C2c ) = P (C3c ) · (P (C1c ) + P (C2c ) − P (C1c ∩ C2c )) =
0.99 · (0.9 + 0.85 − 0.9 · 0.85) = 0.99 · 0.985 = 0.97515
(d) el componente C3 falle, sabiendo que el sistema está funcionando
P (C3 ∩ S)
Se trata de la probabilidad condicionada P (C3 | S) =
, pero como C3 ∩ S = ∅, es
P (S)
decir, si C3 falla, es imposible que funcione el sistema, P (C3 ∩ S) = 0 y, como consecuencia,
P (C3 | S) =
P (C3 ∩ S)
= 0.
P (S)
(e) el componente C3 falle, sabiendo que el sistema falla.
Ésta es otra probabilidad condicionada:
P (C3 | S c ) =
P (C3 ∩ S c )
P (S c )
El suceso intersección C3 ∩ S c serı́a que C3 falle y el sistema falle, pero como un fallo en el
componente C3 implica que el sistema falle, C3 ∩ S c = C3 . Entonces, la probabilidad pedida
P (C3 | S c ) =
P (C3 ∩ S c )
P (C3 )
0.01
=
=
= 0.4024.
c
P (S )
1 − P (S)
1 − 0.97515
3. El tiempo de vida, medido en años, de cierto dispositivo eléctrico sigue una variable aleatoria
de densidad
(
k + x2 si 0 ≤ x ≤ 1
f (x) =
0
en el resto
(a) Calcula el valor de la constante k.
Para que f (x) sea función de densidad se deben cumplir dos condiciones:
1. f (x) ≥ 0 para todo x, lo cual implica que k debe ser un número real positivo, y
2.
Z ∞
−∞
f (x)dx = 1 lo cual va a permitir obtener el valor concreto de k:
1=
Z ∞
−∞
f (x)dx =
Z 0
−∞
f (x)dx +
Z 1
0
f (x)dx +
Z ∞
1
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
f (x)dx = 0 +
Z 1
0
f (x)dx + 0 =
10
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
Z 1³
0
1
=
3
(b) ¿Cuánto se estima
por tanto k = 1 −
k+x
2
´
"
x3
dx = kx +
3
#1
=k+
0
1
3
2
.
3
que puede durar como mucho un dispositivo?
Como la función de densidad de la variable X=”años que puede durar el dispositivo eléctrico”
toma valores no nulos solamente en el intervalo [0, 1], ésto quiere decir que el tiempo de vida
está comprendido entre 0 y 1 año. Por lo tanto, se estima que un dispositivo puede durar
como mucho un año.
(c) Calcula la probabilidad de que un dispositivo dure menos de seis meses.
En primer lugar, como la variable mide el tiempo de vida en años y la pregunta se hace por
1
meses, hay que tener en cuenta que seis meses es de año. Se pide entonces
2
¶
µ
P X<
0+
Z 1/2
Z 0
Z 1/2
1
=
f (x)dx =
f (x)dx +
f (x)dx =
2
−∞
−∞
0
Z 1/2 µ
2
0
3
¶
+x
2
"
2
x3
dx = x +
3
3
#1/2
=
0
2 1 1 1
3
· + · 3 = .
3 2 3 2
8
(d) ¿Cuál es el tiempo de vida medio de un dispositivo?
Lo que se ha de calcular es la esperanza matemática de la variable X
E(X) =
Z ∞
−∞
xf (x)d x =
Z 1µ
2
0
3
¶
x+x
3
"
2 x2 x4
dx =
+
3 2
4
#1
=
0
21 1
7
+ = .
32 4
12
Expresado en meses, se puede decir que el tiempo de vida medio de un dispositivo es 7
meses.
(e) Sabiendo que un dispositivo lleva funcionando tres meses, calcula la probabilidad de
que dure menos de cuatro meses.
Teniendo en cuenta que 3 meses representa 3/12 de un año y 4 meses, 4/12 de un año, lo
que se pide es la probabilidad condicionada
¾
µ½
µ
P X<
¶
P
4
3
X>
=
12
12
½
3
4 T
X>
X<
12
¶ 12
µ
3
P X>
12
¾¶
µ
1
1
<X<
P
4µ
¶3
=
1
P X>
4
¶
Calculamos los valores de numerador y denominador:
µ
P
¶
µ
¶
"
Z 1/3
1
2
x3
1
2
<X<
=
+ x2 d x = x +
4
3
3
3
3
1/4
#1/3
=
1/4
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
21 1 1
21 1 1
+
−
−
= 0.0626.
3 3 3 33 3 4 3 43
11
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
4. El propietario de un olivar estima que el número de olivos que posee por cada 100 m2 sigue
una distribución de Poisson de parámetro 2.
(a) ¿Cuántos olivos tiene por término medio cada parcela de 100 m2 ?
Lo que se está pidiendo es la esperanza de la variable X=”número de olivos en cada 100
m2 ”. Como X sigue una distribución de Poisson, la media es precisamente el parámetro de
dicha Poisson, esto es λ = 2.
(b) Calcula la probabilidad de que en una parcela de 100 m2 haya más de 3 olivos plantados.
Se utilizan las tablas de la Poisson:
P (X > 3) = 1 − P (X ≤ 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)) =
1 − 0.1353 − 0.2707 − 0.2707 − 0.1804 = 0.1429.
(c) Calcula la probabilidad de que en una parcela de 100 m2 haya uno o dos olivos.
P (X = 1) + P (X = 2) = 0.2707 + 0.2707 = 0.5414.
(d) Si una extensión de 1000 m2 está separada en parcelas de 100 m2 , calcula la probabilidad
de que en la mitad de las parcelas haya exactamente 2 olivos plantados en cada una.
Una extensión de 1000 m2 contiene 10 parcelas de 100 m2 , por lo tanto, lo que se está pidiendo
es la probabilidad de que entre 10 parcelas de 100 m2 , 5 tengan dos olivos plantados y las
otras 5 no tengan 2 olivos plantados.
Estamos ante la repetición 10 veces de la prueba de Bernoulli: ”en una parcela de 100 m2
hay 2 olivos plantados o no”. Si se considera como éxito el suceso ”en una parcela de 100
m2 hay 2 olivos plantados”, la probabilidad de éxito
p = P (X = 2) = 0.2707
La variable Y =”número de parcelas con 2 olivos plantados de 10 parcelas observadas” sigue,
entonces una distribución binomial de parámetros n = 10 y p = 0.2707. La probabilidad
que se pide en este apartado es
!
Ã
10
0.27075 · (1 − 0.2707)5 = 0.0755.
P (Y = 5) =
5
5. Para analizar la variabilidad de la temperatura en las cimas de las Sierras Tejeda y Almijara
(Málaga), se seleccionan al azar 20 dı́as y se registra una cuasidesviación muestral de 5
grados centı́grados. Suponiendo que la temperatura se distribuye normalmente,
(a) estima un intervalo de confianza al 95% para la varianza poblacional;
Si se consulta la correspondiente tabla de intervalos de confianza, el intervalo que se pide en
el problema viene dado por


(n − 1)S 2 (n − 1)S 2 
, 2
I= 2
χ α , n−1
χ1− α , n−1
2
2
donde
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
12
I.T. DISEÑO INDUSTRIAL. CURSO 03/04
n representa el tamaño muestral, n = 20,
S 2 es la cuasivarianza muestral, S 2 = 52 = 25
α, nivel de significación, α = 1 − 0.95 = 0.05 y
χ2γ, n es el número real que verifica P (χ2n > χ2γ, n ) = γ
Para obtener los valores de χ2α , n−1 = χ20.025,19 y χ21− α , n−1 = χ20.975,19 se usan las tablas de la Ji
2
2
cuadrado. Sólo hay que buscar n = 19 en la primera columna y 0.025 y 0.975 en la primera
fila; ası́:
χ20.025,19 = 32.852
y
χ20.975,19 = 8.907.
El intervalo de confianza para la varianza de la variable que mide la temperatura en las
cimas de las Sierras a un nivel de confianza del 95% es
·
¸
19 · 25 19 · 25
,
= [14.45, 53.32]
32.852 8.907
(b) ¿Se puede considerar que la desviación tı́pica es significativamente mayor que 4, tomando
α = 0.01?
En este apartado hay que plantear un contraste de hipótesis acerca de la desviación tı́pica
de una distribución normal. Si consultamos las tablas de los contrastes de hipótesis más
usuales, se observa que no hay un modelo especı́fico para hipótesis sobre la desviación tı́pica,
aunque sı́ sobre la varianza. Cualquier afirmación que se realice sobre la desviación tı́pica se
puede hacer en términos de la varianza (que es el cuadrado de la desviación tı́pica). Como
la pregunta del problema es si se puede considerar la desviación tı́pica poblacional mayor
que 4, se debe tomar el contraste cuya hipótesis alternativa plantee esta cuestión:
H0 : σ 2 = 42 = 16
Ha : σ 2 > 16
Mirando en las tablas de los contrastes de hipótesis, encontramos que la condición de rechazo
es
(n − 1)S 2
se rechaza H0 si
> χ2α,n−1
σ02
donde σ02 denota el número real concreto con el que se está comparando la varianza, es decir,
σ02 = 16.
19 · 25
(n − 1)S 2
= 29.68 < 36.191 = χ20.01,19
=
2
σ0
16
Como no se cumple la condición de rechazo, se debe aceptar la hipótesis nula H0 .
Los datos proporcionados por la muestra no dan motivos para pensar que la desviación tı́pica
de la temperatura sea mayor que 4, por tanto, se considera que la desviación tı́pica es igual
(o, en todo caso, menor que 4) pero no mayor que 4.
Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada
13
Descargar