Nombre: Examen final de ESTADÍSTICA APLICADA 23 de mayo de

Anuncio
Nombre:
Examen final de ESTADÍSTICA APLICADA
23 de mayo de 2016
Primer curso del grado en Bioquı́mica
EXPLICAR DEBIDAMENTE LA RESOLUCIÓN DE CADA PROBLEMA
1. La esteatosis (acumulación anormal de grasa en las células) se da en más de la mitad de los pacientes con infección crónica del virus de la hepatitics C (VHC). Hickman et al. (2002)1 conjeturaron
que una reducción de peso en estos pacientes producirı́a una disminución en el grado de la esteatosis.
Para comprobarlo, se sometió a 10 sujetos con VHC crónico a un programa de reducción de peso de
tres meses de duración. En cada sujeto se biopsió el hı́gado antes y después del tratamiento. Entre
otros marcadores, en cada biopsia se midió la expresión (en células/mm2 ) de alfa actina de músculo
liso (ACTA-2) en el tracto portal, obteniéndose los siguientes resultados:
ACTA-2
Antes Después
347
60
412
363
488
12
219
156
168
199
1273
691
410
123
319
239
209
141
225
49
a)
(1 punto) Obtener un intervalo de confianza al 95 % para la diferencia de niveles medios de
expresión de ACTA-2 antes y después de la dieta.
b) (1 punto) Al nivel de significación α = 0.05, ¿proporcionan estos datos suficiente evidencia
estadı́stica para afirmar que la dieta seguida disminuye el nivel medio de expresión de ACTA-2?.
c)
(0.5 puntos) En la consola de R escribimos
Datos = read.table("ACTA2portal.txt",header=TRUE)
X = Datos$Antes
Y = Datos$Despues
Al estudiar el contraste de (a) con R utilizando la función t.test se obtuvo la siguiente salida (de
la que se han borrado algunas lı́neas):
data: X and Y
t = 3.2011, df = 9, p-value = 0.005406
alternative hypothesis: true difference in means is greater than 0
sample estimates:
mean of the differences
203.7
Explica qué es el valor t y cómo se calcula. Interpreta el p-valor del contraste.
1
I J Hickman, A D Clouston, G A Macdonald, D M Purdie, J B Prins, S Ash, J R Jonsson, E E Powell (2002).
Effect of weight reduction on liver histology and biochemistry in patients with chronic hepatitis C. Gut, 51, 89–94.
1
d)
(0.5 puntos) Explica qué se hace con el siguiente código de R y lo que se obtiene. Dibuja
(aproximadamente) el gráfico resultante en la Figura 1.
L = lm(Y~X)
L
Call:
lm(formula = Y ~ X)
Coefficients:
(Intercept)
1.1698
X
0.4966
700
plot(X,Y)
abline(L)
400
500
600
●
300
Y
●
200
●
●
●
●
100
●
●
●
0
●
200
400
600
800
1000
1200
X
Figura 1
e)
(0.5 puntos) Obtén el coeficiente de correlación entre la expresión de ACTA-2 antes y después
de la dieta a partir de la siguiente información:
var(X)
[1] 103632
var(Y)
[1] 39794.9
cov(X,Y)
[1] 51467.22
Interpreta el valor obtenido de la correlación ayudándote del gráfico que hayas dibujado en (c).
2
2.
La enantiostilia es un fenómeno por el cual el pistilo de una flor está desviado a la izquierda o a la
derecha, de manera que cada tipo de flor es la imagen especular de la otra. Esta asimetrı́a promueve
la polinización cruzada en plantas visitadas por abejas, y disminuye el nivel de autopolinización.
La orientación (a izquierda o derecha) de una planta describe la localización de su pistilo (ver
Figura 2). La orientación a izquierda es un rasgo recesivo. Bajo cierto modelo genético, una flor de
segunda generación resultante del cruce de dos homozigotos (uno dominante y otro recesivo) tiene
una probabilidad p = 0.25 de estar orientada a la izquierda. En un experimento de este tipo, en la
segunda generación se obtuvieron un total de 9 flores orientadas a la izquierda y 24 orientadas a la
derecha.
Figura 2
a)
(1 punto) Obtener un intervalo de confianza para p en base a la muestra observada, a un nivel
de confianza del 95 %.
b) (0.5 puntos) A un nivel de significación de 0.05, ¿hay suficiente evidencia en contra de la
hipótesis de que p = 0.25?.
c)
(0.5 puntos) Explica el siguiente código de R e interpreta la correspondiente salida:
prop.test(9,33,p=0.25,alternative="less",correct=FALSE)
1-sample proportions test without continuity correction
data: 9 out of 33, null probability 0.25
X-squared = 0.090909, df = 1, p-value = 0.6185
alternative hypothesis: true p is less than 0.25
95 percent confidence interval:
0.0000000 0.4137471
sample estimates:
p
0.2727273
3.
(1.5 puntos) Un individuo con genotipo AaBb se cruza con otro individuo de genotipo aabb.
Se observan los siguientes fenotipos en los descendientes de primera generación: 114 AB, 97 ab, 78
Ab y 71 aB. A nivel de significación 0.05, ¿hay suficiente evidencia en contra de la distribución de
probabilidad obtenida cuando los dos genes se segregan independientemente?.
3
4.
En un experimento para comparar el valor nutritivo de un maı́z transgénico y uno genéticamente
no modificado, se alimentó a 20 pollos con el primer tipo de maı́z y a otros 20 pollos con el segundo.
Al final del experimento se midió la ganancia de peso de cada pollo en el primer grupo (X) y
en el segundo grupo (Y ). Suponemos que todas las variables medidas son independientes entre sı́.
Supongamos asimismo que X sigue una distribución normal con esperanza y desviación tı́pica de
385 g y 50 g respectivamente, y que Y sigue una distribución normal con esperanza y desviación
tı́pica de 360 g y 55 g respectivamente.
a) (0.5 puntos) ¿Cuál es la probabilidad de que la ganancia de peso de un pollo alimentado con
maı́z transgénico difiera de su valor esperado en más de 100 g?
b) (0.5 puntos) Denotamos las medias muestrales de X e Y por X̄ y Ȳ respectivamente. ¿Qué distribución siguen X̄, Ȳ y X̄ − Ȳ ?
c) (1 punto) ¿Cuál es la probabilidad de que la ganancia promedio de peso en los pollos alimentados
con máiz transgénico supere a la ganancia promedio de peso en los pollos alimentados sin transgénico
en más de 40 g?
5.
Cuestiones: Se ha medido el nivel de selenio (en µg/100g) en cuatro tipos de carne adquirida
en Appalachian Ohio (EEUU): VEN es carne de venado, SQU es carne de ardilla, RRB es carne de
ternera local y NRB es carne de ternera no local. A continuación mostramos los diagramas de caja
de los datos:
150
8
Selenio
100
40
31
50
0
NRB
RRB
SQU
VEN
Carne
Indica si las siguientes afirmaciones son verdaderas o falsas, justificando el porqué de tu respuesta:
a) (0.2 puntos) El nivel de selenio en la carne de ternera de la zona es claramente superior al de
la carne de ternera no local.
b)
(0.2 puntos) Es razonable esperar que la mediana en la carne de ternera local sea inferior a la
media.
c) (0.2 puntos) El 75 % de la carne de ardilla tiene un nivel de selenio superior a 75 µg/100g.
d) (0.2 puntos) La máxima cantidad de selenio en la carne de ternera local es superior a la máxima
cantidad de selenio en la carne de venado.
e) (0.2 puntos) El 75 % de las ardillas tienen una cantidad de selenio inferior al nivel de selenio
en el 75 % de la carne de ternera no local.
4
Descargar