estadisticadescriptiva

Anuncio
Material preparado por la profesora Rita Luna
ESTADISTICA DESCRIPTIVA.
a) a) CONCEPTO.
¿Qué es la estadística descriptiva o para qué nos sirve?
Cuando necesitamos analizar un proceso cualquiera, es necesario tomar una
muestra de datos del proceso en cuestión y a partir de los mismos obtener sus
características tales como la media, la mediana, la moda, la desviación estándar, el
rango, etc., también es necesario saber el tipo de distribución de probabilidad que
tiene, así como también es necesario visualizar de forma objetiva el comportamiento
de los datos al ser graficados de diversas formas, todo lo anterior es posible gracias a
la estadística descriptiva.
¿Qué es una muestra? Es una parte de los datos del proceso que se desea analizar, la
cuál debe de ser representativa del proceso en cuanto al número de elementos que
contiene y en cuanto a lo que está ocurriendo en el proceso, esto último se logra
tomando cada uno de los elementos de la muestra de forma aleatoria o totalmente al
azar; para determinar el número de elementos idóneo en la muestra se hace uso de
la inferencia estadística, por el momento no nos ocuparemos de ello debido a que
esto se ve con detalle en cursos más avanzados de estadística.
b) TRATAMIENTO PARA DATOS NO AGRUPADOS.
¿A qué se refiere esto? Cuando la muestra que se ha tomado de la población o
proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la
muestra, entonces estos datos son analizados sin necesidad de formar clases con
ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.
b1. Medidas de tendencia central. Se les llama medidas de tendencia central a la
media aritmética, la mediana, la media geométrica, la moda, etc. debido a que al
observar la distribución de los datos, estas tienden a estar localizadas
generalmente en su parte central. A continuación definiremos algunas medidas
de tendencia central y la forma de calcular su valor.
1) 1) Media aritmética (x ). También se le conoce como promedio ya que es el
promedio de las lecturas o mediciones individuales que se tienen en la
muestra, se determina con la fórmula siguiente:
n

x
x
i 1
i
n
donde:
x = media aritmética
xi = dato i
n = número de datos en la muestra
1
Material preparado por la profesora Rita Luna
Ejemplos:
1. Se han tomado como muestra las medidas de seis cables usados en un arnés
para lavadora, las cuales son; 15.2 cm, 15.0, 15.1, 15.2, 15.1 y 15.0, determine
su media aritmética.
Solución:

x
15.2  15.0  15.1  15.2  15.1  15.0
 15.1cm
6
2. Se toman varias muestras de cierto tipo de queso y se determina la
cantidad de proteína por cada 100 gramos de queso, encontrándose lo
siguiente: 26.5 gramos, 24.8, 25.3, 30.5, 21.4, determine la cantidad promedio
de proteína encontrada en la muestra por cada 100 gramos de queso que se
elabora.
Solución:
_
x
26.5  24.8  25.3  30.5  21.4
 25.7 grs
5
3. 3.
Se hacen varias lecturas de una muestra que contiene cobre, las
lecturas se hacen en un espectrofotómetro de absorción atómica y son la
siguientes: 12.3%, 12.28, 12.27, 12.3, 12.24, 15.01, determine la
concentración promedio de Cu en la muestra.
Solución:
_
x
12.3  12.28  12.27  12.3  12.24  15.01 76.4

 12.73%Cu
6
6
Si observamos las lecturas del espectrofotómetro nos damos cuenta que el
valor de 15.01% es un valor diferente al de las lecturas anteriores, por lo que
se descarta el valor ya que se considera un valor atípico, es decir un valor que
es debido a circunstancias especiales, en este caso puede ser que se deba al
hecho de que se está descalibrando el aparato de absorción atómica o
simplemente que se ha equivocado el operador del aparato al tomar la
lectura, por lo que la media se debe calcular con las primeras cinco lecturas;
como se muestra a continuación:
Solución:
2
Material preparado por la profesora Rita Luna
12.3  12.28  12.27  12.3  12.24 61.39

 12.278 %Cu
5
5
y esta sería la
media correcta
_
x
4. Si deseamos determinar la edad promedio de los estudiantes de una
escuela de nivel superior al iniciar sus estudios, suponga que se toman las
edades de algunos de los alumnos de cierta clase y estas son las que siguen:
20, 18, 18, 19, 18, 19, 35, 20, 18, 18, 19.
Solución:
Luego, la media se determinará con solo 10 de las edades ya que es
necesario descartar la edad de 35 años, que es un dato atípico o un caso
especial, por lo que;
_
x
20  18  18  19  18  19  20  18  18  19 187

 18.7años
10
10
Nota: Cuando es necesario determinar aquellas medidas de tendencia central que
hagan uso de todos los datos de la muestra se recomienda descartar todos aquellos
datos atípicos que se encuentren en la muestra o muestras tomadas.
2) 2) Media geométrica (G). Es la raíz en enésima del producto de los valores
de los elementos de la muestra, es usada cuando los valores de los datos de
la muestra no son lineales, es decir que su valor depende de varios factores a
la vez, se determina de la siguiente forma:
G  n x1 * x2 * ...* xn
Donde:
G = media geométrica
xi = dato i
n = número de datos en la muestra
Ejemplos:
1. 1. Las siguientes temperaturas han sido tomadas de un proceso químico,
13.4oC, 12.8, 11.9, 13.6, determine la temperatura promedio de este proceso.
3
Material preparado por la profesora Rita Luna
Solución:
4
4
G = 13.4x12.8x11.9x13.6  27758.7968= 12.9077 oC
2. 2. Las siguientes temperaturas han sido tomadas de un proceso para
fabricar queso chihuahua, 21.4oC, 23.1, 20.2, 19.7, 21.0, determine la
temperatura promedio de este proceso.
Solución:
G=
5
21.4x23.1x20.2x19.7 x21.0  5 4131070.852 = 21.048 oC
3) Media aritmética ponderada ( xw ). Esta media se usa cuando el peso que
tiene cada uno de los datos de la muestra es diferente, se calcula de la siguiente
manera:
k
xw 
 wi x i
i 1
k
 wi
i 1
donde:
xw = media aritmética ponderada
xi = dato i
wi = peso del dato i
Ejemplo:
A continuación se mencionan las materias que Luis Pérez llevó en el primer
semestre de Ingeniería Química, el número de créditos y la calificación obtenida;
MATERIA
NUMERO CREDITOS
CALIFICACIÓN
Metodología de la investigación
8
90.5
Matemáticas I
10
100.0
Programación
8
81.0
Química
10
78.0
Dibujo
4
100.0
Economía
8
84.0
Determine la calificación promedio que obtuvo Luis Pérez en su primer
semestre.
4
Material preparado por la profesora Rita Luna
Solución:
Xw 
( 8 x90.5 )  ( 10 x100 .0 )  ( 8 x81.0 )  ( 10 x78.0 )  ( 4 x100 )  ( 8 x84.0 )
=
8  10  8  10  4  8

724  1000  648  780  400  672 4224

 88.0
48
48
Nota: Sí comparamos este promedio con el que se obtiene usando simplemente la
media aritmética, que es un 88.91, nos damos cuenta de que este último es
mayor, por no tomar en cuenta el peso o número de créditos que aporta cada
materia a la carrera que se estudia, el promedio de esta persona es menor al de
la media aritmética debido a que obtiene una calificación baja es Química que es
una de las materias que aporta más créditos.
4) 4) Media armónica (H). La media armónica se define como el recíproco del
promedio de los recíprocos de cada uno de los datos que se tienen en la
muestra, y
se determina de la siguiente manera:
H 
1
n
1 / n1 / xi
i 1

n
n
1 / xi
i 1
Ejemplo: Determine la media armónica de los siguientes datos, 3.1, 2.8, 2.84, 3.05,
3.09
Solución:
H 

5

1 / 3.1  1 / 2.8  1 / 2.84  1 / 3.05  1 / 3.09
5
5

 2.9703
0.3226  0.3571  0.3521  0.3279  0.3236 1.6833
5) 5) Mediana (xmed). La mediana es aquel valor que se encuentra en la parte
central de los datos que se tienen en la muestra una vez que estos han sido
ordenados según su valor o magnitud. Para calcular la mediana se presentan
dos casos:
a. a. Cuando el número de datos en la muestra es impar.- En este caso
después de ordenar los datos de la muestra en cuanto a su magnitud,
5
Material preparado por la profesora Rita Luna
es decir de mayor a menor valor o de menor a mayor valor, se
procede a localizar aquel dato que se encuentra justo en el centro de
los datos o en la parte central de los mismos, el valor de este dato será
el que dé valor a la mediana.
Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un
arnés de lavadora; se toman como muestra siete circuitos y sus mediciones son:
11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5 cm.
Solución:
Ordenando los datos de menor a mayor valor;
11.2, 11.2, 11.2, 11.3, 11.4, 11.5, 11.5
Se observa que el dato 11.3 es el que queda en la parte central, por lo
que este es el que dará valor a la mediana; entonces,
xmed = 11.3 cm.
b. b. Cuando el número de datos en la muestra es par.- En este caso
después de ordenar los datos en cuanto a su magnitud, observamos
que en la parte central de los datos no se encuentra dato alguno, en
este caso, la mediana tomará el valor del promedio de dos datos; el
que se encuentra antes de la parte central y el que se encuentra
después de la parte central.
Ejemplo:
Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un
arnés de lavadora; se toman como muestra ocho circuitos y sus mediciones son:
11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5, 11.4 cm.
Solución:
Ordenando los datos de mayor a menor valor,
6
Material preparado por la profesora Rita Luna
11.5, 11.4, 11.4, 11.3, 11.2, 11.2, 11.2, 11,1 cm.
Se observa que en la parte central de los datos no hay dato alguno por lo que la
mediana se determina con el promedio de los datos subrayados, entonces,
Xmed 
11.3  11.2
 11.25cm
2
Nota: Es imprescindible para calcular el valor de la mediana el que primero se
ordenen los datos en cuanto a su magnitud, ya que de no hacerlo, se incurriría en
un grave error.
5) 5) Moda (xmod). La moda se define como aquel valor o valores que más se
repiten o que tienen mayor frecuencia entre los datos que se han obtenido en
una muestra, la muestra de una población nos genera la distribución de los
datos una vez que estos se han graficado y en esta gráfica es posible observar
la moda o modas de la misma, es por esto que una distribución de datos
puede ser amodal (carece de moda), unimodal (tiene una sola moda), bimodal
(tiene dos modas) o polimodal (tiene más de dos modas).
Ejemplos:
1. 1. Determine la moda de los datos que se muestran a
continuación, se refieren a la estatura de un grupo de
7
Material preparado por la profesora Rita Luna
jóvenes; 1.60m, 1.65, 1.70, 1.71, 1.70, 1.70, 1.70, 1.71, 1.70,
1.93, 1.87, 1.85
Solución:
Estatura
Frecuencia
1.60
1
1.65
1
1.70
5*
1.71
2
1.85
1
1.87
1
1.93
1
La tabla muestra la distribución de frecuencias de los datos o el
número de veces que estos se repiten, la mayor frecuencia que es 5
corresponde a una estatura de 1.70m, por lo que esta sería la moda.
Luego, xmod = 1.70m
2. 2. Determine la moda de los siguientes datos que se refieren
a la edad de alumnos de primer semestre del tecnológico de
Chihuahua, 18 años, 17, 19, 21, 19, 18, 22, 22, 18, 18, 17, 19,
19, 19, 18, 20, 21, 20, 18, 19, 18, 19, 18,19, 22, 35
Solución:
8
Material preparado por la profesora Rita Luna
Edad
17
18
19
20
21
22
35
Frecuencia
2
7*
8*
2
2
3
1
En este caso se observa que las edades que más frecuencia tienen son las
de 18 y 19 años, por lo que se concluye que existen dos modas,
Xmod1= 18 años , Xmod2= 19años
Hay que hacer notar que la frecuencia para ambas modas puede ser de
igual magnitud o diferente, como en el caso que se ilustra.
b2. Medidas de Dispersión. Cuando se tiene una muestra de datos
obtenida de una población cualquiera, es importante determinar sus
medidas de tendencia central así como también es básico el determinar
que tan dispersos están los datos en la muestra, por lo que se hace
necesario determinar su rango, la varianza, la desviación estándar, etc.,
ya que una excesiva variabilidad o dispersión en los datos indica la
inestabilidad del proceso en análisis en la mayoría de los casos.
1) 1) Rango o recorrido. El rango es la diferencia entre el valor mayor
y el valor menor encontrados en la muestra, también se le denomina
recorrido ya que nos dice entre que valores hace su recorrido la
variable de interés; y se determina de la siguiente manera:
R = VM – Vm
Donde:
R = rango o recorrido
VM = valor mayor en la muestra
Vm = valor menor en la muestra
Ejemplo:
1. Se han tomado como muestras las mediciones de la resistencia a la tensión de la soldadura usada para unir dos cables,
estas son: 78.5kg, 82.4, 87.3, 78.0, 90.0, 86.5, 77.9, 92.4, 75.9, determine su rango o recorrido.
Solución:
VM = 92.4 kg
Vm = 75.9 kg
9
Material preparado por la profesora Rita Luna
R = VM – Vm = 92.4 – 75.9 = 16.5 kg
2. Se toman las mediciones de la cantidad de grasa de la leche en gramos por cada 100 ml de leche que entra a un proceso
de pasteurización, a continuación se enumeran; 14.85, 15.32, 12.76, 16.29, 15.84, 17.3, 17.61, 16.33, determine el rango o
recorrido de la cantidad de grasa de la leche.
Solución:
VM = 17.61
Vm = 12.76
R = 17.61 – 12.76 = 4.85gramos
_
2)
2) Desviación absoluta media ( d ). Esta medida de dispersión nos representa la diferencia absoluta
promedio que existe entre cada dato que se encuentra en la muestra y la media de los datos y se
determina de la siguiente manera:
n
_
d

_
xi  x
i 1
n
Donde:
xi = dato i
_
x = media aritmética de la muestra
n = número de datos en la muestra
Ejemplo:
1. Determine la desviación absoluta media de los siguientes datos que son las concentraciones de plomo de algunas
muestras, las que a continuación se enumeran: 18gr, 12, 21, 19, 16, 20, 22
Solución:
Para determinar la desviación absoluta media o promedio, lo primero que hay que hacer es calcular la media aritmética
de los datos de la muestra, la que es 128/7 =18.286, luego se procede a calcular el promedio de las diferencias absolutas
entre cada dato y la media calculada.
_
d
18  18.286  12  18.286  ..... 20  18.286  22  18.286
7

10
Material preparado por la profesora Rita Luna
_
d
0.286  6.286  2.714  0.714  2.286  1.714  3.714 17.714

 2.5305 gr
7
7
La interpretación de este resultado sería que el grado de alejamiento absoluto promedio de los datos con respecto a su
media es de 2.5305 gramos.
¿Por qué sacar el valor absoluto de las diferencias entre cada dato y la media aritmética? Si solo se hicieran diferencias
entre cada dato y la media aritmética, estas tendrían signos positivos y negativos ya que algunos datos son menores que la
media y otros son mayores que la media, luego al sumar las diferencias, con sus signos correspondientes, éstas se irían
anulando unas con otras y no sería posible medir leal grado de alejamiento promedio de los datos en la muestra.
3)
3)
Varianza o variancia (s2). Es el promedio de las diferencias elevadas al cuadrado entre cada valor
_
que se tiene en la muestra (xi) y la media aritmética (
manera:
x ) de los datos y se determina de la siguiente
_ 2



xi

x




i 1 
2
S 
n 1
n
Donde n es el número de datos en la muestra.
Ejemplo:
Los siguientes datos es la cantidad de glucosa en miligramos encontrada en muestras de sangre de algunos pacientes,
14.2, 12.1, 15.6, 18.1, 14.3, determine su varianza.
Solución:
Lo primero que hay que calcular es la media aritmética de la muestra como ya se ha hecho anteriormente.

x
14.2  12.1  15.6  18.1  14.3 74.3

 14.86 mg
5
5
2
2
2
( 14.2  14.86 )  ( 12.1  14.86 )  .... ( 14.3  14.86 )
s 

5 1
2
11
Material preparado por la profesora Rita Luna
s2 
0.4356  7.6176  0.5476  10.4976  0.3136 19.412

 4.853 mg
4
4
2
Nota:
Dentro de la inferencia estadística se plantea la deferencia entre una variancia muestral s 2 y una poblacional,
representada por 2.
4)
4) Desviación estándar (s). Es la desviación o diferencia promedio que existe entre cada dato de la
muestra y la media aritmética de la muestra. Y se obtiene a partir de la varianza, sacándole raíz
cuadrada.
s s
2
donde:
s2= varianza o variancia
Por tanto la desviación estándar de la muestra anterior sería;
2
s=
4.853mg  2.2029mg
La interpretación de este resultado sería, que la cantidad de glucosa encontrada en la muestra es en promedio
de 14.86 miligramos y que la cantidad de glucosa en la muestra se aleja o dispersa en promedio 1.9704 mg
alrededor de la media.
En este caso solo nos interesa conocer el significado de la desviación estándar, aunque es necesario decir que s
es la desviación de la muestra y que  es la desviación de la población, así como s2 es la varianza de la muestra
y 2 es la varianza de la población.
C) TRATAMIENTO PARA DATOS AGRUPADOS.
Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos
en clases y a partir de estas determinar las características de la muestra y por
consiguiente las de la población de donde fue tomada.
Antes de pasar a definir cuál es la manera de determinar las características de
interés (media, mediana, moda, etc.) cuando se han agrupado en clases los datos
de la muestra, es necesario que sepamos como se agrupan los datos.
Pasos para agrupar datos.
a. Determinar el rango o recorrido de los datos.
Rango = Valor mayor – Valor menor
b. Establecer el número de clases (k)en que se van a agrupar los datos tomando
como base para esto la siguiente tabla.
Tamaño de muestra o No. De datos
Número de clases
12
Material preparado por la profesora Rita Luna
Menos de 50
50 a 99
100 a 250
250 en adelante
5a7
6 a 10
7 a 12
10 a 20
El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para
establecer el número de clases en las que se van a agrupar los datos, existen otros
para hacerlo.
c. Determinar la amplitud de clase para agrupar (C).
C
Rango
k
d. d. Formar clases y agrupar datos.
Para formar la primera clase, se pone como límite inferior de la primera clase
un valor un poco menor que el dato menor encontrado en la muestra y
posteriormente se suma a este valor C, obteniendo de esta manera el límite
superior de la primera clase, luego se procede a obtener los límites de la clase
siguiente y así sucesivamente.
Ejemplo:
Los siguientes datos se refieren al diámetro en pulgadas de un engrane.
6.75
6.50
7.25
7.00
7.25
7.00
6.50
6.70
6.70
6.75
7.00
6.50
6.00
6.50
6.25
6.75
6.25
6.75
6.75
6.25
6.50
6.25
6.00
6.25
7.00
6.50
6.50
6.75
6.65
6.75
7.15
6.65
6.75
6.75
7.00
7.00
7.00
7.10
7.10
7.15
a) Agrupe datos, considere k=6.
b) Obtenga: Histograma, polígono de frecuencias, ojiva y distribución de
probabilidad.
c) c) Obtenga: media, mediana, moda y desviación estándar.
Solución:
a) a) Agrupando datos;
R= VM - Vm = 7.25 – 6.00 = 1.25
k=6
R 1.25
3. C  
 0.2083  0.21
k
6
4.Formando clases.
1.
2.
13
Material preparado por la profesora Rita Luna
Para formar la primera clase se toma un valor un poco menor que el valor menor
encontrado en la muestra; luego,
LI
LS Frecuencia Marca
clase
5.97 – 6.18
6.19 – 6.40
6.41 – 6.62
6.63 – 6.84
6.85 – 7.06
7.07 – 7.28
Total
2
5
7
13
7
6
40
6.075
6.295
6.515
6.735
6.955
7.175
de Límite real Límite real Frecuencia Frecuencia
inferior
superior
relativa
Relativa
acumulada
5.965
6.185
2/40 = 0.05 0.05
6.185
6.405
5/40=0.125 0.175
6.405
6.625
0.175
0.350
6.625
6.845
0.325
0.675
6.845
7.065
0.175
0.850
7.065
7.285
0.15
1.000
1.000
b) b) Gráficas:
HISTOGRAMA
FRECUENCIA
16
13
5.965 - 6.185
11
6
5
7
7
2
6
6.185 - 6.405
6.405 - 6.625
6.625 - 6.845
1
6.845 - 7.065
-4
7.065 - 7.285
LIMITES REALES
14
Material preparado por la profesora Rita Luna
FRECUENCIA
POLIGONO DE FRECUENCIA
16
14
12
10
8
6
4
2
0
5.635 5.855 6.075 6.295 6.515 6.735 6.955 7.175 7.395 7.615
MARCA DE CLASE
OJIVA "MENOR QUE" O CRECIENTE
FRECUENCIA RELATIVA
ACUMULADA
1
1
0. 85
0.8
0. 675
0.6
0.4
0. 35
0.2
0. 1 75
0. 05
0
0
5.965
6.185
6.405
6.625
6.845
7.065
7.285
LIMITES REALES
PROBABILIDAD
DISTRIBUCION DE PROBABILIDAD
0.4
0.325
5.965 - 6.185
0.3
6.185 - 6.405
0.175
0.2
0.1
0.125
0.175
0.15
0.05
6.405 - 6.625
6.625 - 6.845
6.845 - 7.065
0
7.065 - 7.285
LIMITES REALES
_
b) a) Media ( x ).
15
Material preparado por la profesora Rita Luna
k

x
=
x * f
i
i 1
n
i

( 6.075)( 2 )  ( 6.295)( 5 )  ... ( 7.175)( 6 ) 12.15  31.475 ... 43.05


40
40
268 .52
 6.713 pu lg adas
40
Donde:
k = número de clases
xi = marca de clase i
fi = frecuencia de la clase i
k
n=
f
i 1
i

número de datos en la muestra
c) b) Mediana (Xmed).
 n / 2  Fm e 1
 40 / 2  14
Xm ed  Li  
 A  6.625 
( 0.22 )  6.7265
13
fm e




Donde:
Li = límite real inferior de la clase que contiene a la mediana
Fme-1 = sumatoria de las frecuencias anteriores a la clase en donde se encuentra
la mediana
fme = frecuencia de la clase en donde se encuentra la mediana
A = amplitud real de la clase en donde se encuentra la mediana
A = LRS-LRI
LRS = límite real superior de la clase que contiene a la mediana
LRI = límite real inferior de la clase que contiene a la mediana
N = número de datos en la muestra
f) Moda (Xmod).
 d1 
 6 
X m od  Li  
A  6.625 
( 0.22 )  6.735pu lg adas

6  6
 d1  d 2 
Donde:
Li = límite real inferior de la clase que contiene a la moda
fmo fmo1 13  7  6
d1 =
=
16
Material preparado por la profesora Rita Luna
fmo fmo1 13  7  6
d2 =
=
fmo = frecuencia de la clase que contiene a la moda
fmo-1= frecuencia de la clase anterior a la que contiene a la moda
fmo+1= frecuencia de la clase posterior a la que contiene a la moda
A = amplitud real de la clase que contiene a la moda
A = LRS – LRI
LRS = límite real superior de la clase que contiene a la moda
LRI = límite real inferior de la clase que contiene a la moda
g) Desviación estándar (S).
k
s
_
i 1
k
 fi  1
k
2
 ( xi  x ) fi

_
2
 ( xi  x ) fi
i 1
n 1
i 1

( 6.075 6.713)2 ( 2 )  ( 6.295 6.713)2 ( 5 )  ...  ( 7.175 6.713)2 ( 6 )

40  1
0.814088 0.87362 ...  1.280664
3.65904
=

 0.3063pu lg adas
39
39
Donde:
xi = marca de clase i
_
x = media aritmética
fi = frecuencia de la clase i
k
 fi  n = número total de datos en la muestra
i 1
D) DISTRIBUCIONES DE PROBABILIDAD.
Toda distribución de probabilidad es generada por una variable aleatoria x, la
que puede ser de dos tipos:
1. 1. Variable aleatoria discreta (x). Se le denomina variable
porque puede tomar diferentes valores, aleatoria, porque el
valor tomado es totalmente al azar y discreta porque solo
puede tomar valores enteros y un número finito de ellos.
Ejemplos:
17
Material preparado por la profesora Rita Luna
x Variable que nos define el número de burbujas por envase de vidrio que
son generadas en un proceso dado.
x0, 1, 2, 3, 4, 5, etc, etc. burbujas por envase
xVariable que nos define el número de productos defectuosos en un lote de
25 productos.
x0, 1, 2, 3,....,25 productos defectuosos en el lote
xVariable que nos define el número de alumnos aprobados en la materia
de probabilidad en un grupo de 40 alumnos.
x0, 1, 2, 3, 4, 5,....,40 alumnos aprobados en probabilidad
Con los ejemplos anteriores nos damos cuenta claramente que los valores de
la variable x siempre serán enteros, nunca fraccionarios.
2. 2. Variable aleatoria continua (x). Se le denomina variable
porque puede tomar diferentes valores, aleatoria, porque los
valores que toma son totalmente al azar y continua porque
puede tomar tanto valores enteros como fraccionarios y un
número infinito de ellos.
Ejemplos:
xVariable que nos define el diámetro de un engrane en pulgadas
x5.0”, 4.99, 4.98, 5.0, 5.01, 5.0, 4.96
xVariable que nos define la longitud de un cable o circuito utilizado en un arnés
de auto
x20.5 cm, 20.1, 20.0, 19.8, 20,6, 20.0, 20.0
xVariable que nos define la concentración en gramos de plata de algunas
muestras de mineral
x14.8gramos, 12.0, 10.0, 42.3, 15.0, 18.4, 19.0, 21.0, 20.8
Como se observa en los ejemplos anteriores, una variable continua puede tomar
cualquier valor, entero o fraccionario, una forma de distinguir cuando se trata de
una variable continua es que esta variable nos permite medirla o evaluarla,
mientras que una variable discreta no es medible, es una variable de tipo atributo,
cuando se inspecciona un producto este puede ser defectuoso o no, blanco o negro,
cumple con las especificaciones o no cumple, etc, etc.
Las variables descritas anteriormente nos
probabilidad, las que pueden ser.
generan
una distribución
de
1) 1) Distribución de probabilidad discreta.
2) 2) Distribución de probabilidad continua.
18
Material preparado por la profesora Rita Luna
Las características de cada una de las distribuciones anteriores se mencionarán
a continuación:
DISTRIBUCIÓN DE PROBABILIDAD DISCRETA.
Características:
1. Es generada por una variable discreta (x).
xVariable que solo toma valores enteros
x0, 1, 2, 3, 4, 5, 6, 7, 8, ... etc,etc.
2. p(xi)0 Las probabilidades asociadas a cada uno de los valores que toma x
deben ser mayores o iguales a cero.
3.p(xi) = 1 La sumatoria de las probabilidades asociadas a cada uno de los
valores que toma x debe ser igual a 1.
DISTRIBUCIÓN DE PROBABILIDAD CONTINUA.
Características:
1. Es generada por una variable continua (x).
x Es una variable que puede tomar tanto valores enteros como fraccionarios.
x 1.0, 3.7, 4.0, 4.6, 7.9, 8.0, 8.3, 11.5, .....,
2. f(x)0 Las probabilidades asociadas a cada uno de los valores que toma x
deben ser mayores o iguales a cero. Dicho de otra forma, la función de
densidad de probabilidad deberá tomar solo valores mayores o iguales a
cero. La función de densidad de probabilidad sólo puede estar definida en los
cuadrantes I y II.

 f ( x )dx 1
3. 
La sumatoria de las probabilidades asociadas a cada uno de los
valores que toma x debe ser igual a 1. El área definida bajo la función de
densidad de probabilidad deberá ser de 1.
CALCULO DE MEDIA Y DESVIACIÓN ESTANDAR PARA UNA
DISTRIBUCIÓN DISCRETA
19
Material preparado por la profesora Rita Luna
1. 1. Media o valor esperado de x.- Para determinar la media de la
distribución discreta se utiliza la siguiente fórmula:
  E( x )   xi* p( xi )
Donde:
 = media de la distribución
E(x) = valor esperado de x
xi = valores que toma la variable
p(xi) = probabilidad asociada a cada uno de los valores de la variable x
2. Desviación estándar. Para determinar la desviación estándar de la
distribución discreta se utiliza la siguiente fórmula:

( xi   )
2
* p( xi )
Donde:
 = desviación estándar
 = media o valor esperado de x
xi = valores que toma la variable x
p(xi) = probabilidad asociada a cada uno de los valores que toma x
Ejemplos:
1. Según estadísticas la probabilidad de que el motor de un auto nuevo, de
cierto modelo, y marca sufra de algún desperfecto en los primeros 12 meses
de uso es de 0.02, si se prueban tres automóviles de esta marca y modelo,
encuentre el número esperado de autos que no sufren de algún desperfecto en
los primeros doce meses de uso y su desviación estándar.
Solución:
Haciendo uso de un diagrama de árbol, usando las literales siguientes, se obtiene
el espacio muestral  como se muestra a continuación;
N = no sufre de algún desperfecto en el motor los primeros 12 meses de uso
S = sufre de algún desperfecto en el motor los primeros 12 meses de uso
N
N
S
N
20
Material preparado por la profesora Rita Luna
N
S
S
N
1er auto
N
S
S
N
2o
autoS
3o S
 = NNN, NNS, NSN, NSS, SNN, SNS, SSN, SSS
x = variable que nos define el número de autos que no sufre de algún desperfecto
en el motor durante los primeros 12 meses de uso
x = 0, 1, 2 o 3 autos que no sufren algún desperfecto en el motor en los primeros
12 meses de uso
p(x=0)=p(SSS)=(0.02)(0.02)(0.02)=0.000008
p(x=1)=p(NSS,
SNS,
SSN)=(0.98)(0.02)(0.02)+(0.02)(0.98)(0.02)+(0.02)(0.02)(0.98)=
=0.001176
p(x=2)=p(NNS,NSN,SNN)=(0.98)(0.98)(0.02)+(0.98)(0.02)(0.98)+(0.02)(0.98)(0.98
)==0.057624
p(NNN) = (0.98)(0.98)(0.98) =0.941192
Por tanto la media o valor esperado se determina de la siguiente manera:
xi* p( xi ) 
 =E(x) = 
(0)(0.000008)+(1)(0.001176)+(2)(0.057624)+(3)(0.941192)=
=0.0+0.001176+0.115248+2.823576=2.94 3 autos que no sufren algún desperfecto
en el motor en los primeros 12 meses de uso
La interpretación de la media o valor esperado es; se espera que los 3 autos
probados no sufran de algún desperfecto en el motor en los primeros 12 meses de
uso.
21
Material preparado por la profesora Rita Luna
2
=
2
( xi   )* p( xi ) =
2
2
 ( 0  3 )* ( 0.000008)  ( 1  3 )*( 0.001176)  ... ( 3  3 )*( 0.941192) 
= 0.000072 0.004704 0.05762 0.062396)  0.24970.0 autos que no
sufren algún desperfecto en su motor en los primeros 12 meses de uso.
Interpretación:
En este experimento se espera que los 3 autos probados no sufran de algún
desperfecto en su motor en los primeros 12 meses de uso y la variabilidad de este
experimento es de cero.
Nota:
La media y la desviación estándar se redondean a un valor entero ya que son la
media y desviación de una distribución de probabilidad discreta.
2. Se ha detectado en una línea de producción que 1 de cada 10 artículos
fabricados es defectuoso; se toman de esa línea tres artículos uno tras otro, a)
obtenga la distribución de probabilidad del experimento, b) encuentre el
número esperado de artículos defectuosos en esa muestra y su desviación
estándar.
Solución:
También haciendo uso de in diagrama de árbol, se obtiene el espacio muestral 
a)
D = objeto defectuoso
N = objeto no defectuoso
=DDD, DDN, DND, DNN, NDD, NDN, NND, NNN
Este espacio muestral ha sido obtenido haciendo uso de un diagrama de árbol,
x = Variable que nos define el número de objetos defectuosos encontrados
x = 0, 1, 2 o 3 objetos defectuosos
p(x=0)=p(NNN)=(0.9)(0.9(0.9)=0.729
p(x=1)=p(DNN, NDN, NND)=(0.1)(0.9)(0.9)+(0.9)(0.1)(0.9)+(0.9)(0.9)(0.1)=0.243
p(x=2)=p(DDN, DND, NDD)=(0.1)(0.1)(0.9)+(0.1)(0.9)(0.1)+(0.9)(0.1)(0.1)=0.027
p(x=3)=p(DDD)=(0.1)(0.1)(0.1)=0.001
Distribución de probabilidad
22
Material preparado por la profesora Rita Luna
x
0
1
2
3
P(x)
0.729
0.243
0.027
0.001
b)
   xi* p( xi )  (0)(0.729)+(1)(0.243)+(2)(0.027)+(3)(0.001)=
= 0.0 + 0.243 + 0.054 + 0.003 = 0.3 0 productos defectuosos
Interpretación:
Se espera que ninguno de los productos inspeccionados sea defectuoso.

2
 ( xi   )* p( xi ) 
2
2
2
 ( 0  0 )*( 0.729)  ( 1  0 )*( 0.243)  ... ( 3  0 )*( 0.001) 
 0.0  0.243 0.108 0.009  0.36 
= 0.6 = 1 producto defectuoso
Interpretación:
En este experimento se espera que ninguno de los productos inspeccionados sea
defectuoso, pero los resultados de este experimento pueden variar en  1
producto defectuoso, por lo que al inspeccionar los 3 productos el numero de
productos defectuosos puede variar desde –1 producto defectuoso, hasta 1
producto defectuoso, pero, ¿es posible obtener –1 producto defectuoso?, claro
que esto no puede ocurrir, luego el número de productos defectuosos en el
experimento variará de 0 a 1 producto defectuoso solamente.
3. Según estadísticas, la probabilidad de que un pozo petrolero que se perfore
en cierta región pueda ser beneficiado es de 0.30. Se perforan tres pozos en
esa región, encuentre el número esperado de pozos que pueden ser
beneficiados y su desviación estándar.
Solución:
Se obtiene el espacio muestral , de la misma forma que se ha hecho en los
ejemplos anteriores;
B = se puede el pozo que se perfora
N = no se puede beneficiar el pozo que se perfora
= BBB, BBN, BNB, BNN, NBB, NBN, NNB, NNN
23
Material preparado por la profesora Rita Luna
x = variable que nos define el número de pozos que se pueden beneficiar
x = 0, 1, 2 o 3 pozos que se pueden beneficiar
p’(x = 0) = p(NNN) = (0.7)(0.7)(0.7)= 0.343
p(x = 1) = p(BNN, NBN, NNB) = (0.3)(0.7)(0.7)(3)=0.441
p(x = 2) = p(BBN, BNB, NBB) = (0.3)(0.3)(0.7)(3)=0.189
p(x = 3) = p(BBB) =(0.3)(0.3)(0.3)= 0.027
   xi* p( xi ) 
 ( 0 )( 0.343)  ( 1 )( 0.441)  ( 2 )( 0.189)  ( 3 )( 0.027) 
 0.0  0.441 0.378 0.081 0.9
1 pozo beneficiado
Interpretación:
Se espera que solo 1 de los tres pozos perforados sea el que pueda ser
beneficiado.

2
( xi   )* p( xi ) 
2
2
2
2
 ( 0  1 )*( 0.343)  ( 1  1 )*( 0.441)  ( 2  1 )*( 0.189)  ( 3  1 )*( 0.027) 
 0.343 0.0  0.189 0.108  0.64  0.8  1 pozo
Interpretación:
La cantidad esperada de pozos que se pueden beneficiar puede variar en 1  1 pozo,
esto es la cantidad de pozos que se pueden beneficiar puede variar de 0 a 2 pozos.
4. La distribución de probabilidad de x , el número de defectos por cada 10
metros de una tela sintética en rollos continuos de ancho uniforme , es
x
0
p(x) 0.41
1
0.37
2
0.16
3
0.05
4
0.01
a) a) Determine la distribución de probabilidad acumulada de x; P(x).
b) b) Determine el número esperado de defectos por cada 10 metros de tela
sintética en rollos continuos de ancho uniforme y la desviación estándar del
número de defectos por cada 10 metros de tela .....
c) c) Determine la probabilidad de que en 10 metros de tela sintética se
encuentren como máximo 2 defectos.
d) d) Determine la probabilidad de que en 10 metros de tela sintética se
encuentren por lo menos 2 defectos.
24
Material preparado por la profesora Rita Luna
Solución:
a)
X
p(x)
P(x)
0
0.41
0.41
1
0.37
0.78
2
0.16
0.94
3
0.05
0.99
4
0.01
1.0
  E( x )   xi* p( xi )  ( 0 )( 0.41)  ( 1 )( 0.37 )  ... ( 4 )( 0.01) 
b)
 0.0  0.37  0.32  0.15  0.04  0.88  1 defecto
Interpretación:0.16, 0.05 ,0.01
Se espera que por cada 10 metros de tela se encuentre un defecto.

( xi   )
2
* p( xi )  ( 0  1 )2 ( 0.41 )  ( 1  1 )2 ( 0.37 )  ... ( 4  1 )2 ( 0.01 ) 
 0.41 0.0  0.16  0.2  0.09  0.86  0.9274 1defecto
Interpretación:
El número de defectos esperado puede variar en  1 defecto, es decir que el
número de defectos esperado por cada 10 metros de tela puede variar de 0 a 2.
c)
p(x  2)= p(x=0) + p(x=1) + p(x=2) = 0.41+0.37+0.16 = 0.94
d)
p(x  2) = p(x=2) + p(x=3) + p(x=4) = 0.16 + 0.05 + 0.01= 0.22
CALCULO DE MEDIA Y DESVIACIÓN ESTÁNDAR PARA UNA
DISTRIBUCIÓN CONTINUA
1.Media o valor esperado de x.- Para calcular la media de una distribución de
probabilidad continua se utiliza la siguiente fórmula:

   xf ( x )dx

Donde:
 = E(x) = media o valor esperado de la distribución
x = variable aleatoria continua
f(x) = función de densidad de la distribución de probabilidad
25
Material preparado por la profesora Rita Luna
2.Desviación estándar.- La fórmula para determinar la desviación estándar de
una distribución continua es;

2
   ( x   )* f ( x )dx
2

luego:
  2
Ejemplos:
1. Para la siguiente función,
f(x)
1 2
x cuando 0 x  3 ,
9
f(x) = 0 para cualquier otro valor
a) a) Diga si esta función nos define una distribución de probabilidad.
b) b) Si la función define una distribución de probabilidad, entonces,
determine su media y desviación estándar.
c) c) Determine la probabilidad de que 1 x  2.
Solución:
a) a) Para verificar que la función nos define una distribución de
probabilidad, es necesario que cumpla con las características que se
habían mencionado.
1. 1. x  sí es una variable continua porque puede tomar
cualquier valor entre 0 y 3
2. 2. f(x) 0, lo que se comprueba si damos diferentes valores a
x para ver que valores toma f(x), dándonos cuenta de que
efectivamente f(x) solo toma valores mayores o iguales a cero.
x
0
0.5
1.0
1.4
2.1
2.7
3.0
f(x)
0.0
0.02778
0.11111
0.21778
0.49
0.81
1.0
26
Material preparado por la profesora Rita Luna
3. 3. Para comprobar que la sumatoria de las probabilidades
que toma cada
valor de x es de 1, se integra la función de 0
a 3 como se muestra a continuación:

A

2 1
3

3
3
1 2
1 x
1
1
f ( x )dx   x dx  (
)  ( 3  0 )  ( 27  0 )  1
9
9 2 1
27
27
0
A= área bajo la función
Con las operaciones anteriores comprobamos que la función
1 2
x
9
sí nos define una distribución de probabilidad continua.
b) b) Cálculo de media y desviación estándar.

3
4
3
1 3
1 x
   x * f ( x )dx   x( 19 x )dx   x dx  ( ) 
9
9 4

0
0

4
4
1
1
81
( 3  0 )  ( 81 0 ) 
 2.25
36
36
36

2
2
3
2
2
1
9
2
   ( x   )* f ( x )dx  ( x  2.25 )*( x )dx 

0
3
3
4
3
2
1 2
x
x
5.0625x
  ( x  4.5 x  5.0625)( x )dx   (


)dx 
9
9
2
9
0
0
2
5
4
x
x


45
8

3
5.0625x

27
5
4
3
(3) (3)
5.0625( 3 )




45
8
27
243 81 136 .6875
 
 5.4  10.125  5.0625  0.3375
45
8
27
2
    0.3375  0.5809
Las barras nos indican la evaluación de la integral entre 0 y 3.
27
Material preparado por la profesora Rita Luna
c)
2
p( 1  x  2 )  
1
3
2
3
3
1 2
1 x
1 2
0
1 8
8
f ( x )dx   x dx  (
)  (

) ( )
 0.2963
9
9
3
9
3
3
9
3
27
1
La barra nos indica la evaluación de la integral de 1 a 2.
Con las operaciones anteriores nos damos cuenta que para evaluar probabilidades
para variables de tipo continuo, es necesario evaluar la función de densidad de
probabilidad en el rango de valores que se desea; que vendría siendo el área que se
encuentra entre f(x) y el eje de las x y entre el rango de valores definidos por la
variable x.
2. Suponga que el error en la temperatura de reacción, en oC, para un
experimento controlado de laboratorio es una variable aleatoria continua x,
que tiene la función de densidad de probabilidad:
f(x) 
x2
, para -1 x  2
3
y
f(x) = 0 en cualquier otro caso
a) a) Verifique la tercera condición de la definición de una distribución
de probabilidad continua.
b) b) Determine la media o valor esperado de la distribución de
probabilidad.
c) c) Encuentre la probabilidad de que 0 x  1.
Solución:
a) a) Como la tercera condición es que la sumatoria de las
probabilidades asociadas a cada uno de los valores que toma x debe
de ser 1, esto se comprueba de la siguiente manera:
x2
1 x3
1 23  13
8 1 9
dx

(
)

( 
)    1
1 3
3 3
3 3
3
9 9 9
2
A

b)
2
2
x2
x3
1 x4
  E( x )   x * f ( x )dx   x( )dx   dx  ( ) 
3
3
3 4

1
1
28
Material preparado por la profesora Rita Luna
1 2 4  14
16 1 15
 ( 
)  
 1.25
3 4
4
12 12 12
1
x2
1 x3
1 13 03
1 1 1
p( 0  x  1 )   dx  ( )  (  )  *   0.11111
3
3 3
3 3 3
3 3 9
0
c)
e) Problemas Propuestos.
1.Determine la media y la desviación estándar de las siguientes millas por galón
obtenidas en 20 corridas de prueba realizadas en avenidas urbanas con un
automóvil de tamaño mediano.
19.7
21.9
22.8
22.0
21.5
20.5
23.2
23.0
22.5
19.3
21.4
21.1
22.2
19.9
20.8
20.9
22.6
21.7
19.4
21.3
r. 21.38 y 1.19 mi/gal
2. Los siguientes son los números de torsiones que se requirieron para cortar 12
barras de aleación forjada: 33, 24, 39, 48, 26, 35, 38, 54, 23, 34, 29 y 27. Determine,
a) la media y b)la mediana.
r. a) 35 b) 34.5
3. Los siguientes son los números de los minutos durante los cuales una persona
debió esperar el autobús hacia su trabajo en 15 días laborales: 10, 0, 13, 9, 5, 10, 2,
10, 3, 8, 6, 17, 2, 10 y 15. Determine, a) la media, b) la mediana, c) la moda. r. a) 8
b) 9 c) 10
4.Las siguientes son medidas de las resistencias de la resistencia a rompimiento (en
onzas) de una muestra de 60 hilos de lino.
32.5
21.2
27.3
20.6
25.4
36.9
15.2
28.3
33.7
29.5
34.1
24.6
35.4
27.1
29.4
21.8
27.5
28.9
21.3
25.0
21.9
37.5
29.6
24.8
28.4
32.7
29.3
33.5
22.2
28.1
26.9
29.5
17.3
29.6
22.7
25.4
34.6
30.2
29.0
26.8
31.3
34.5
29.3
23.9
36.8
28.7
33.2
23.6
24.5
23.0
29.2
34.8
37.0
38.4
31.0
26.4
23.5
18.6
28.3
24.0
a) a) Agrupe los datos en 7 clases, b) obtenga media, mediana, moda y
desviación estándar, c)obtenga histograma y polígono de frecuencias, ojiva
menor que y distribución de probabilidad.
29
Material preparado por la profesora Rita Luna
5. Un edificio comercial tiene dos entradas, numeradas con I y II. Entran tres
personas al edificio a la 9:00 a.m. Sea x el número de personas que escogen la
entrada I, si se supone que la gente escoge las entradas en forma
independiente, determinar a)la distribución de probabilidades de x, b) el
número esperado de personas que que escogen la entrada I.
Respuesta:
b) 1.5  2 personas
a)
x
0
1 2 3
p(x) 1/8 3/8 3/8 1/8
6. Se observó que el 40% de los vehículos que cruzan determinado puente de
cuota, son camiones comerciales. Cuatro vehículos van a cruzar el puente en
el siguiente minuto. Determinar la distribución de probabilidad de x, el
número de camiones comerciales entre los cuatro, sí los tipos de vehículos son
independientes entre sí.
Respuesta:
x
0
1
p(x)
0.1296 0.3456
2
0.3456
3
0.1536
4
0.0256
7. Entre 10 solicitantes para un puesto 6 son mujeres y 4 son hombres.
Supóngase que se seleccionan al azar 3 candidatos de entre todos ellos para
concederles las entrevistas finales. Determinar; a)la función de probabilidad
para x, el número de candidatas mujeres entre los 3 finalistas, b)el número
esperado de candidatas mujeres entre los finalistas.
Respuesta:
a)
x
0
1
2
3
p(x) 1/30 9/30 15/30 5/30
b) 1.8  2 mujeres
8. Los registros de ventas diarias de una empresa fabricante de computadoras
señalan que se venderán 0, 1 o 2 sistemas centrales de cómputo con las
siguientes probabilidades:
Número de computadoras vendidas 0 1
2
Probabilidad
0.7 0.2 0.1
Calcular el valor esperado, la variancia y la desviación estándar de las ventas
diarias.
30
Material preparado por la profesora Rita Luna
r.
a)0
computadoras
b)0
computadoras
c)1una
computadora
9. Sea x la variable aleatoria que representa la vida en horas de un cierto
dispositivo electrónico. La función de densidad de probabilidad es:
f(x)
20 ,000
, para x  100 y 0 en cualquier otro caso
x3
Encuentre la vida esperada de este dispositivo.
r. 200 horas
10. Si la utilidad de un distribuidor en unidades de $1000, en un nuevo
automóvil puede considerarse como una variable aleatoria x con una función
de densidad
f(x) = 2(1- x) para 0 x  1
y
0 para cualquier otro caso
Encuentre la utilidad promedio por automóvil.
r. $333
11. ¿Qué proporción de personas puede esperarse que respondan a un cierto
requerimiento por correo, si la proporción x tiene la función de densidad
f(x)
2( x  2 )
5
0 x  1
y 0 en cualquier otro
caso?
r. 8/15
12. La función de densidad de la variable aleatoria continua x, el número total
de horas en unidades de 100 horas, de que una familia utilice una aspiradora
durante un año es de;
f(x) = x, para 0  x  1, f(x) = (2 - x) para 1  x  2, 0 en cualquier otro caso.
Encuentre el número promedio de horas por año que la familia utiliza la
aspiradora.
r. 100 horas
13. Suponga las probabilidades de 0.4, 0.3, 0.2 y 0.1, respectivamente, de que 0,
1, 2 o 3 fallas de energía eléctrica afecten una cierta subdivisión en un año
cualquiera. Encuentre la media y la desviación estándar de la variable aleatoria
31
Material preparado por la profesora Rita Luna
x
que representa el número de fallas de energía eléctrica que afectan esta
subdivisión.
r.  = 1 ,  = 1
14. La variable aleatoria x, que representa el número de pedacitos de chocolate en
una rebanada de pastel, tiene la siguiente distribución de probabilidad:
x
2
p(x) 0.01
3
4
5
0.25 0.4 0.3
6
0.04
Determine el número esperado de pedacitos de chocolate en una rebanada de pastel.
r. 4 pedacitos de chocolate
32
Descargar