Subido por Jorge Alexander Caho

Apuntes de prácticas de Estadística con R

Anuncio
Apuntes de prácticas de Estadística con R-Studio
Sesión 2 (la 1 no entra)
Si por ejemplo, X siguiera una binomial de 10 experimentos y probabilidad de éxito = 0.8
(𝑋~𝐵𝑖𝑛(10,0.8)) y quisiéramos calcular P(X=6) = f(6) escribiríamos
dbinom(6,size=10,prob=0.8)
Para calcular P(X≤ 8) = F(8) escribiríamos
pbinom(8,size=10,prob=0.8)
Si queremos que nos muestre todas las probabilidades de unos valores en un intervalo
escribimos el intervalo poniendo “valor inicial”:”valor final”. Por ejemplo, si queremos
representar las probabilidades de x=0, x=1, x=2, así hasta x=6 siguiendo el mismo modelo de
antes escribiríamos
dbinom(0:6,size=10,prob=0.8)
Si quisiéramos representar una gráfica con los valores de x en el eje de abscisas y f(x) en el de
coordenadas tendríamos que poner
plot(dbinom(0:6,size=10,prob=0.8))
Para guardar un valor constante en una letra usamos una flechita. Por ejemplo, si queremos
guardar “dbinom(6,size=10,prob=0.8)” en “x” escribiríamos
x <- dbinom(6,size=10,prob=0.8)
Para simular valores de esta distribución utilizamos
table(rbinom(0:6,size=10,prob=0.8))/100 (genera números aleatorios siguiendo esa
distribución y nos dice la probabilidad de cada valor con una tabla)
Para representar la función que forma X~Exp(2) desde 0 hasta 10, por ejemplo, escribimos
curve(dexp(x,rate=2),from=0,to=10)
Para que nos de números aleatorios entre 0 y 1 escribimos
runif(“número de números aleatorios que queremos”)
(es un generador aleatorio de resultados que sigue una uniforme (min=0,max=1 por defecto))
Si queremos calcular el percentil 0.95 de de una distribución normal tipificada escribimos
qbinom(0.95) (el programa da por hecho que es N(0,1))
Sesión 3
Partimos de un conjunto de valores 𝑥1 , 𝑥2 , … , 𝑥𝑛 observados de una variable X.
 Frecuencia: número de veces que aparece un valor dado. Hay dos tipos:
o Absoluta
o Relativa: Es la absoluta partido de el número total de experimentos.
Tabla de frecuencias:
Donde





𝑥𝑖 = "𝑈𝑛 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟𝑎 𝑑𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜"
𝑛𝑖 = "𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 ℎ𝑎 𝑜𝑐𝑢𝑟𝑟𝑖𝑑𝑜 𝑒𝑠𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜"
𝑓𝑖 = 𝑛𝑖 /𝑛
𝑁𝑖 = "𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑞𝑢𝑒 𝑙𝑙𝑒𝑣𝑎𝑚𝑜𝑠 𝑠𝑢𝑚𝑎𝑑𝑜𝑠 ℎ𝑎𝑠𝑡𝑎 "𝑖""
𝐹𝑖 = 𝑁𝑖 /𝑛
Ejemplo:
En R, para ver cada una de las frecuencias lo que hacemos es lo siguiente:
Siendo 𝑥1 el conjunto de resultados de una distribución cualquiera




𝑛𝑖 = 𝒕𝒂𝒃𝒍𝒆(𝒙𝟏)
𝑓𝑖 = 𝒕𝒂𝒃𝒍𝒆(𝒙𝟏)/"𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔"
𝑁𝑖 = 𝒄𝒖𝒎𝒔𝒖𝒎(𝒕𝒂𝒃𝒍𝒆(𝒙𝟏))
𝐹𝑖 = 𝒄𝒖𝒎𝒔𝒖𝒎(𝒕𝒂𝒃𝒍𝒆(𝒙𝟏)/"𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔")
Si no conociéramos el número de elementos usaríamos el comando 𝒍𝒆𝒏𝒈𝒕𝒉(𝒙𝟏)
Para conocer la varianza y esperanza de 𝑥1 usamos, respectivamente, los comandos
𝒗𝒂𝒓(𝒙𝟏) ; 𝒎𝒆𝒂𝒏(𝒙𝟏)
Para representar en una tabla de barras el valor de cada uno de los elementos escribiríamos el
comando barplot(x1).
Supongamos que x1<-rbinom(100,10,0.8)
Tras escribir barplot(x1) saldría algo parecido a esto (no tiene por qué ser igual, son números
aleatorios):
También podemos hacer una tabla de barras con las frecuencias. Por ejemplo, si queremos
hacer una tabla con las frecuencias absolutas, escribiríamos barplot(table(x1)). Asimismo,
también se puede hacer con la de frecuencias relativas, y las acumuladas…Usa tu imaginación
para estas últimas…;D
En variable continua, realizamos histogramas. Por ejemplo, si queremos guardar en x2 100
resultados de un experimento normal (0,1) y representar el histograma tomando los límites de
uno en uno desde -6 hasta 6 escribiremos
x2<-rnorm(100)
limites<-c(-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6)
hist(x2,breaks=limites,freq=F)
Nos saldría algo así (puede variar, pues son resultados aleatorios)
Lo que hace es calcular la densidad desde -6 hasta -5, desde -5 hasta -4 , desde -4 hasta -3…y
así, de uno en uno, hasta el 6, pues así es como lo hemos establecido con
limites<-c(-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6)
Del histograma tenemos que saber interpretar:






Simetría
Colas largas
Máximos (unimodal, bimodal,…)
Datos atípicos
Localización del centro
Dispersión
Para dibujar la curva formada por la distribución tendríamos que poner el comando
curve(dnorm(x),from=-6,to=6)
y nos saldría lo siguiente (típica campana de gauss):
Sesión 4
Ya en vectores aleatorios, imaginemos la variable 𝑋 = ∑12
𝑖=1(𝑈𝑖 ) − 6, con 𝑈1 , 𝑈2 , … , 𝑈6
variables aleatorias independientes e idénticamente distribuidas (m.a) con distribución 𝑈(0,1)
Para poder generar n=10000 resultados de esa variable X usaremos el comando
x<-replicate(10000,(sum(runif(12))-6)) (guardamos en la letra x el resultado del replicate)
Este sería un histograma posible del resultado
Usaremos el comando par(mfrow=c(“número”, ”número”)) para establecer el tamaño de la
gráfica que nos va a salir. Cuanto mayor sean los números de dentro de c, más pequeño será
el dibujo. El segundo número establece la anchura, y el primero la altura.
Descargar