Apuntes de prácticas de Estadística con R-Studio Sesión 2 (la 1 no entra) Si por ejemplo, X siguiera una binomial de 10 experimentos y probabilidad de éxito = 0.8 (𝑋~𝐵𝑖𝑛(10,0.8)) y quisiéramos calcular P(X=6) = f(6) escribiríamos dbinom(6,size=10,prob=0.8) Para calcular P(X≤ 8) = F(8) escribiríamos pbinom(8,size=10,prob=0.8) Si queremos que nos muestre todas las probabilidades de unos valores en un intervalo escribimos el intervalo poniendo “valor inicial”:”valor final”. Por ejemplo, si queremos representar las probabilidades de x=0, x=1, x=2, así hasta x=6 siguiendo el mismo modelo de antes escribiríamos dbinom(0:6,size=10,prob=0.8) Si quisiéramos representar una gráfica con los valores de x en el eje de abscisas y f(x) en el de coordenadas tendríamos que poner plot(dbinom(0:6,size=10,prob=0.8)) Para guardar un valor constante en una letra usamos una flechita. Por ejemplo, si queremos guardar “dbinom(6,size=10,prob=0.8)” en “x” escribiríamos x <- dbinom(6,size=10,prob=0.8) Para simular valores de esta distribución utilizamos table(rbinom(0:6,size=10,prob=0.8))/100 (genera números aleatorios siguiendo esa distribución y nos dice la probabilidad de cada valor con una tabla) Para representar la función que forma X~Exp(2) desde 0 hasta 10, por ejemplo, escribimos curve(dexp(x,rate=2),from=0,to=10) Para que nos de números aleatorios entre 0 y 1 escribimos runif(“número de números aleatorios que queremos”) (es un generador aleatorio de resultados que sigue una uniforme (min=0,max=1 por defecto)) Si queremos calcular el percentil 0.95 de de una distribución normal tipificada escribimos qbinom(0.95) (el programa da por hecho que es N(0,1)) Sesión 3 Partimos de un conjunto de valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 observados de una variable X. Frecuencia: número de veces que aparece un valor dado. Hay dos tipos: o Absoluta o Relativa: Es la absoluta partido de el número total de experimentos. Tabla de frecuencias: Donde 𝑥𝑖 = "𝑈𝑛 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟𝑎 𝑑𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜" 𝑛𝑖 = "𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 ℎ𝑎 𝑜𝑐𝑢𝑟𝑟𝑖𝑑𝑜 𝑒𝑠𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜" 𝑓𝑖 = 𝑛𝑖 /𝑛 𝑁𝑖 = "𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑞𝑢𝑒 𝑙𝑙𝑒𝑣𝑎𝑚𝑜𝑠 𝑠𝑢𝑚𝑎𝑑𝑜𝑠 ℎ𝑎𝑠𝑡𝑎 "𝑖"" 𝐹𝑖 = 𝑁𝑖 /𝑛 Ejemplo: En R, para ver cada una de las frecuencias lo que hacemos es lo siguiente: Siendo 𝑥1 el conjunto de resultados de una distribución cualquiera 𝑛𝑖 = 𝒕𝒂𝒃𝒍𝒆(𝒙𝟏) 𝑓𝑖 = 𝒕𝒂𝒃𝒍𝒆(𝒙𝟏)/"𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔" 𝑁𝑖 = 𝒄𝒖𝒎𝒔𝒖𝒎(𝒕𝒂𝒃𝒍𝒆(𝒙𝟏)) 𝐹𝑖 = 𝒄𝒖𝒎𝒔𝒖𝒎(𝒕𝒂𝒃𝒍𝒆(𝒙𝟏)/"𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔") Si no conociéramos el número de elementos usaríamos el comando 𝒍𝒆𝒏𝒈𝒕𝒉(𝒙𝟏) Para conocer la varianza y esperanza de 𝑥1 usamos, respectivamente, los comandos 𝒗𝒂𝒓(𝒙𝟏) ; 𝒎𝒆𝒂𝒏(𝒙𝟏) Para representar en una tabla de barras el valor de cada uno de los elementos escribiríamos el comando barplot(x1). Supongamos que x1<-rbinom(100,10,0.8) Tras escribir barplot(x1) saldría algo parecido a esto (no tiene por qué ser igual, son números aleatorios): También podemos hacer una tabla de barras con las frecuencias. Por ejemplo, si queremos hacer una tabla con las frecuencias absolutas, escribiríamos barplot(table(x1)). Asimismo, también se puede hacer con la de frecuencias relativas, y las acumuladas…Usa tu imaginación para estas últimas…;D En variable continua, realizamos histogramas. Por ejemplo, si queremos guardar en x2 100 resultados de un experimento normal (0,1) y representar el histograma tomando los límites de uno en uno desde -6 hasta 6 escribiremos x2<-rnorm(100) limites<-c(-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6) hist(x2,breaks=limites,freq=F) Nos saldría algo así (puede variar, pues son resultados aleatorios) Lo que hace es calcular la densidad desde -6 hasta -5, desde -5 hasta -4 , desde -4 hasta -3…y así, de uno en uno, hasta el 6, pues así es como lo hemos establecido con limites<-c(-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6) Del histograma tenemos que saber interpretar: Simetría Colas largas Máximos (unimodal, bimodal,…) Datos atípicos Localización del centro Dispersión Para dibujar la curva formada por la distribución tendríamos que poner el comando curve(dnorm(x),from=-6,to=6) y nos saldría lo siguiente (típica campana de gauss): Sesión 4 Ya en vectores aleatorios, imaginemos la variable 𝑋 = ∑12 𝑖=1(𝑈𝑖 ) − 6, con 𝑈1 , 𝑈2 , … , 𝑈6 variables aleatorias independientes e idénticamente distribuidas (m.a) con distribución 𝑈(0,1) Para poder generar n=10000 resultados de esa variable X usaremos el comando x<-replicate(10000,(sum(runif(12))-6)) (guardamos en la letra x el resultado del replicate) Este sería un histograma posible del resultado Usaremos el comando par(mfrow=c(“número”, ”número”)) para establecer el tamaño de la gráfica que nos va a salir. Cuanto mayor sean los números de dentro de c, más pequeño será el dibujo. El segundo número establece la anchura, y el primero la altura.