Distribuciones de probabilidad

Anuncio
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Técnicas
Cuantitativas para el
Management y los
Negocios I
Licenciado en
Administración
Módulo II
Módulo II: ESTADÍSTICA INFERENCIAL
Contenidos
Unidad 4. Probabilidad
Conceptos básicos de probabilidad: experimento aleatorio, espacio muestral y evento. Probabilidad.
Definición. Enfoques de la probabilidad: clásico, de la frecuencia relativa y subjetivo. Probabilidad simple.
Cálculo de probabilidades: regla de la adición y de la multiplicación. Conceptos de exclusión e
independencia. Probabilidad condicional. Teorema de Bayes.
Unidad 5. Variables Aleatorias
Variables aleatorias discretas y continuas. Función de probabilidades. Indicadores de posición y dispersión.
Esperanza matemática. Varianza y desviación estándar. Interpretación y aplicaciones de la esperanza y la
desviación estándar.
Unidad 6. Algunas distribuciones de probabilidad especiales
Distribuciones discretas. Ensayos Bernoulli. Distribución Binomial, hipergeométrica y Poisson
Distribuciones continuas. Distribución Normal. Distribución estandarizada. Aproximación Normal de las
distribuciones Binomial y Poisson. Distribución t de Student, Chi-cuadrado y F de Fisher. Aplicaciones.
Unidad 7. Muestreo y Estimación
Nociones básicas de muestreo. Distribuciones muestrales en poblaciones infinitas y finitas. Teorema central
del límite. Estimación y estimador. Estimación puntual. Propiedades deseables de los estimadores.
Principales estimadores puntuales. Estimación por intervalos. Intervalos de confianza para la media,
proporción y varianza. Cálculo del tamaño muestral. Aplicaciones.
Unidad 8. Prueba de hipótesis
Conceptos básicos. Hipótesis estadística. Hipótesis nula y alternativa. Estadígrafo de contraste. Región
crítica y región de aceptación. Error de Tipo I y de Tipo II. Nivel de significación y potencia. Tipo de
contraste. p-valor. Contrastes de hipótesis referentes a media, proporción y varianza poblacional.
Aplicaciones.
Mag. María del Carmen Romero
1
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribuciones discretas y continuas
Contenidos
Distribuciones discretas. Ensayos Bernoulli.
Distribución Binomial, hipergeométrica y Poisson
Distribuciones continuas. Distribución Normal.
Distribución estandarizada. Aproximación Normal
de las distribuciones Binomial y Poisson.
Distribución t de Student, Chi-cuadrado y F de
Fisher. Aplicaciones.
Algunas
distribuciones de
probabilidad
Mag. María del Carmen Romero
2
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Algunas distribuciones de probabilidad
Leyes o modelos de probabilidad
Modelo Matemático
Expresión matemática que se utiliza
representar una variable de interés.
para
Permite calcular la probabilidad de ocurrencia
exacta correspondiente a cualquier resultado
específico para la variable aleatoria
Distribuciones
discretas
Mag. María del Carmen Romero
3
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Bernoulli
Distribución Bernoulli
Si un experimento tiene sólo dos resultados: “éxito”
y “fracaso” con probabilidades p y 1-p, entonces la
cantidad de éxitos (0 o 1) tiene una distribución de
Bernoulli:
O bien f ( x; p ) = p x (1 − p )1− x
para
x = 0,1
Llamando a (1-p)=q
E( X ) = p
y
var( X ) = pq
Distribución Binomial
Distribución Binomial
Si X1,..., Xn son n variables aleatorias idénticamente
distribuidas con la distribución de Bernoulli con
probabilidad de éxito p, entonces la variable
aleatoria
X = X1+...+ Xn
presenta una Distribución Binomial de probabilidad.
Se usa cuando la variable aleatoria discreta de
interés es la cantidad de éxitos en una
determinada cantidad (n) de pruebas.
Mag. María del Carmen Romero
4
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Binomial
Condiciones
El número de repeticiones (n) del experimento
debe ser finito.
En cada repetición del experimento pueden
ocurrir solamente dos resultados, que llamaremos
éxito (E) y fracaso (F).
Los resultados deben ser independientes.
Las probabilidades de éxito (p) y de fracaso (q)
permanecen constantes prueba a prueba.
Distribución Binomial
Ejemplos
El 60% de los estadounidenses leen su contrato de
trabajo incluyendo las letras pequeñas. La cantidad de
empleados que leen cada una de las palabras de su
contrato puede modelarse usando la distribución
binomial.
Un examen de opción múltiple tiene 10 preguntas con
2 opciones cada una. La cantidad de preguntas
respondidas correctamente (si se respondieron de manera
aleatoria) sigue una distribución binomial.
La probabilidad de que un cliente exceda su límite de
crédito en un negocio es de 0.05. La cantidad de clientes
que exceden el límite es una variable aleatoria binomial.
Mag. María del Carmen Romero
5
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Binomial
Función masa de probabilidad
P ( x; n, p ) = P( X = x) = Cnx p x q n − x
siendo:
n: número de pruebas
x: número de éxitos (entre 0 y n)
p: probabilidad de éxito en una prueba
q: probabilidad de fracaso en una prueba / p+q=1
n y p: parámetros de la distribución binomial
Cnx: combinatorio
Esperanza y varianza
E[ X ] = np
V [ X ] = npq
Distribución Binomial
Ejemplo
Por ejemplo, la distribución binomial se puede usar
para calcular la probabilidad de sacar 5 caras y 7
cruces en 12 lanzamientos de una moneda
Mag. María del Carmen Romero
6
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Hipergeométrica
Distribución Hipergeométrica
La variable aleatoria discreta de interés es la
cantidad de éxitos en una determinada cantidad (n)
de pruebas.
Condiciones:
Mismas condiciones para la distribución binomial,
excepto que los resultados de cada prueba deben
ser dependientes.
Distribución Hipergeométrica
Ejemplos
Un auditor selecciona una muestra de 6 declaraciones
de impuestos de personas de una profesión particular de
un total de 50. Si 2 o más de ellas indican deducciones
no autorizadas, se auditará a todo el grupo. La cantidad
de declaraciones con deducciones no autorizadas sigue
una distribución hipergeométrica.
El director de una facultad desea formar un grupo de
6 profesores exclusivos. El total es de 50 profesores, de
los cuales 35 pertenecen al área de ingeniería. La
cantidad de profesores del área ingeniería seleccionados
es una variable aleatoria hipergeométrica.
Mag. María del Carmen Romero
7
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Hipergeométrica
Función masa de probabilidad
P ( x; n,......) =
C mx1 C Nn −−xm1
C Nn
donde:
N: total de la población
n: tamaño de la muestra
m1: elementos con una determinada característica
(éxito)
x: número de éxitos
N, n y m1: parámetros
Esperanza y varianza
E[ X ] = np
V [ X ] = npq
N −n
N −1
Distribución Poisson
Distribución de Poisson
La variable aleatoria discreta de interés es la
cantidad de veces que se presenta una evento en un
área de oportunidad dada.
El área de oportunidad es una unidad continua o
intervalo de tiempo, volumen, o área en la cual
puede presentarse más de un evento.
Mag. María del Carmen Romero
8
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Poisson
Características
La probabilidad de que un evento se presente
en un área de oportunidad dada es igual para
todas las áreas de oportunidad.
La cantidad de eventos que ocurren en un área
de oportunidad es independiente de la cantidad
que se presenta en cualquier otra área.
La probabilidad de que 2 o más eventos se
presenten en un área de oportunidad tiende a
cero conforme esa área se vuelve menor.
Distribución Poisson
Ejemplos:
Cantidad de llamadas por quejas por productos
comprados en una determinada empresa.
Cantidad de defectos en la superficie de una
heladera.
Cantidad de fallas de la red en un día.
Cantidad de clientes que llegan a un banco
ubicado en la zona central de negocios de una gran
ciudad durante la hora del almuerzo.
Mag. María del Carmen Romero
9
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Poisson
Función masa de probabilidad
Una variable aleatoria discreta X tiene una
distribución de Poisson (y se la conoce como
variable aleatoria de Poisson) si y sólo si su
distribución de probabilidades está dada por:
p(x; λ ) =
λ x e −λ
para x = 0,1,2,...
x!
donde:
λ: cantidad de eventos esperado por unidad
e: constante matemática aprox. igual a 2.71828
x: número de éxitos
λ : parámetro
µ =σ2 = λ
Distribución Poisson
Mag. María del Carmen Romero
10
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Uniforme Discreta
Distribución Uniforme
Distribución Uniforme Discreta
Ejemplos
Lanzar un dado f(x)=1/6 x=1,...,6
Lanzar una moneda (balanceada) f(x)=1/2, x=1,2
Extraer una carta de un mazo de 52 cartas
Mag. María del Carmen Romero
11
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribuciones
continuas
Distribución Normal
Ley Normal (de Gauss o Gaussiana)
Características
Distribución unimodal simétrica con forma de
campana.
Media = mediana = moda.
La variable asociada es una variable
continua que toma valores entre -∞ y ∞.
Es la distribución más común.
Está caracterizada sólo por la media
y la varianza.
Mag. María del Carmen Romero
12
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Normal
Gráfico de la
Función de
Densidad
Gráfico de la
Función de
Densidad
Acumulada
Distribución Normal
Importancia
Muchas variables continuas comunes tienen
distribuciones que se asemejan a la distribución
normal.
Sirve
como
aproximación
a
diversas
distribuciones de probabilidad discreta (Binomial
y Poisson).
Proporciona la
inferencial clásica.
Mag. María del Carmen Romero
base
para
la
estadística
13
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Normal
Función de densidad de probabilidad
f(x; µ, σ2 ) =
1
σ 2π
e
1 x −µ 2
− (
)
2 σ
para − ∞ < x < −∞
siendo:
x: cualquier valor de la variable continua entre -∞ y ∞
µ: media
σ: desviación estándar
µ y σ: parámetros de la distribución normal
Distribución Normal
Ejemplo
Se tiene un programa de capacitación para mejorar las
habilidades de los supervisores de una línea de producción. El
programa es autoaplicable y por eso los supervisores
requieren un número de horas para terminarlo. Un estudio de
participantes anteriores revela que el tiempo medio dedicado
al programa es de 500 horas, con una dispersión de 100
horas y que dicho tiempo (requerido para terminarlo) sigue
una distribución aproximadamente normal.
a) ¿Cuál es la probabilidad de que un participante elegido de
manera aleatoria tarde más de 500 horas en terminar el
programa?
b) ¿Cuál es la probabilidad de que tarde entre 500 y 650
horas?
c) ¿Cuánto tardan como máximo el 10% de los empleados que
tardan menos tiempo?
Mag. María del Carmen Romero
14
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Normal
Cálculo
a
1
Pr ob( X ≤ a ) = ∫
e
− ∞ σ 2π
 ( x − µ )2
−
 2σ 2





dx
El área por debajo
de la curva entre x
y -∞ es la Prob(X≤x)
Distribución Normal
Ley Normal estandarizada
La
integral
es
dificil
de
resolver.
Afortunadamente, toda variable normal puede
ser reexpresada como una N(0,1), proceso que se
denomina estandarización.
De esta forma se computan tablas de
probabilidades para N(0,1) que se pueden usar
para cualquier variable Normal
Mag. María del Carmen Romero
15
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Normal
Ley Normal estandarizada
Sea
X : N ( µ x ; σ X2 ) , el proceso de estandarización de
la variable implica realizar la siguiente operación
z=
x − µx
σx
Tal que
µz = 0
y
σ z2 = 1
Distribución Normal
Ley Normal estandarizada
 ( x − µ )2

2σ 2
−

1
Pr ob( X ≤ a) = ∫
e
− ∞ σ 2π
a
a
Pr ob ( X ≤ a ) =
∫
−∞
Mag. María del Carmen Romero
 x2 

2 
− 
1
e 
2π




dx
dx
16
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Normal
Tabla de distribución normal estandarizada
Distribución Normal
Propiedades de las variables aleatorias
normales
La v.a. generada por una suma (finita) de v.a.
normales es normal (si X1 ,…, Xn son v.a.
Normales, Y=a1 X1+…+an Xn es también una v.a.
Normal)
Por ser una v.a. continua:
Prob(z<k) = Prob(z≤k)
Por tener una distribución simétrica:
Prob(z≤-k) = Prob(z≥k)
Mag. María del Carmen Romero
17
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Normal
La distribución normal como aproximación
a otras distribuciones de probabilidad
Discretas
Binomial
Hipergeométrica
Poisson
Continuas
Distribución Normal
Aproximación a binomial
Mag. María del Carmen Romero
18
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Normal
Aproximación a binomial
Condiciones
1) n . p ≥ 5
2) n . (1 - p) ≥ 5
Corrección por continuidad para
concretos
P (X = x1) ≈ P (z1 - 0.5 ≤ Z ≤ z1 + 0.5)
valores
Distribución Normal
Aproximación a binomial
Se obtiene una muestra de n = 1600 llantas en
un proceso de producción constante, en el que
8% de todas las llantas producidas son
defectuosas. ¿Cuál es la probabilidad de que en
esa muestra no más de 150 llantas sean
defectuosas?
Mag. María del Carmen Romero
19
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución t de Student
Distribución t de Student
Surge en estadística con el objetivo de hacer
inferencias sobre la media cuando no se conoce la
varianza y se utiliza una estimación.
El cociente de una variable normal estandarizada
sobre una variable Chi-cuadrado con n grados de
libertad sigue una t de Student con n grados de
libertad.
A medida que los grados de libertad tienden a
infinito, la t de Student converge a una distribución
Normal.
Distribución t de Student
Mag. María del Carmen Romero
20
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución t de Student
Distribución de probabilidad
Función de Densidad:
donde v son los grados de libertad de la ChiCuadrado
E[X]=0 para v>1 (sino no está definida)
Var(X)=
infinitio si
sino no está definida
Distribución Chi-cuadrado
Distribución Chi-cuadrado
La
suma
de
N
variables
aleatorias
independientes al cuadrado, donde cada una
tienen una distribución normal estándar, sigue
una distribución Chi-cuadrado (χ2) con N grados
de libertad.
N
Sean X1, …, Xn variables N(0,1) Q =
( X i )2
∑
i =1
donde :
Q ~ χ (N )
Es un caso especial de una distribución más
general llamada Gamma.
Mag. María del Carmen Romero
21
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución Chi-cuadrado
Gráfico de la Función
de Densidad
Gráfico de la Función
de Densidad
Acumulada
Distribución Chi-cuadrado
Distribución de probabilidad
Función de Densidad:
E(X) = k
Var(X) = 2k
Mag. María del Carmen Romero
22
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución F de Snedecor
Distribución F de Snedecor
Si X e Y son dos variables aleatorias
independientes que siguen una Chi-cuadrado
con grados de libertad d1 y d2 respectivamente,
entonces:
F=(X/ d1)/(Y/ d2)
Sigue una distribución F (o F de Snedecor)
Distribución F de Snedecor
Gráfico de la Función
de Densidad
Gráfico de la Función
de Densidad
Acumulada
Mag. María del Carmen Romero
23
Técnicas Cuantitativas para el
Manag. y los Negocios I - Clase 6
Segundo cuatrimestre - 2014
Distribución F de Snedecor
Distribución de probabilidad
Función de Densidad:
E[X]=d2/(d2-2) para d2>2
Var(X) =
Mag. María del Carmen Romero
para d2>4
24
Descargar