INTERVALOS DE CONFIANZA

Anuncio
INTERVALOS DE CONFIANZA
El problema que presenta la estimación puntual de un parámetro reside en que no garantiza ni
mide la precisión de la estimación. Sólo la bondad de ajuste y el tamaño de la muestra pueden
proporcionar una mayor o menor confianza en la estimación obtenida. Por esta razón es
necesario dar, junto a la estimación, una medida del grado de confianza que se merece, la cual
se consigue mediante un intervalo de confianza que proporcione unos límites dentro de los
cuales se confía esté el valor desconocido del parámetro.
Esta confianza de inclusión se mide mediante un porcentaje.
Con frecuencia se encuentra información como la siguiente:
El peso de un objeto es 104 mas o menos 2 gramos.
El diámetro de un tornillo es de 8 mas o menos 0.05 milímetros.
El contenido de proteínas de la carne de pollo es de 20.2 mas o menos 1%.
En estos casos y otros similares se quiere indicar que la media verdadera se encuentra en algún
lugar entre el intervalo.
Nociones Fundamentales.
En estadística muchos problemas exigen construir conjuntos (intervalos) que contengan el
verdadero valor del parámetro en estudio con una probabilidad dada generalmente alta.
Si por ejemplo X representa los grados de grasa de una margarina se puede estar interesado en
encontrar los límites bajos y altos aceptables para este tipo de producto; pero no se puede
asegurar con probabilidad de uno que el verdadero valor se encuentre entre estos dos límites, lo
máximo que se puede lograr es elegir un número uno menos alfa (1- α ) que esté muy próximo
a uno. En la práctica se elige un alfa fijo (á) generalmente pequeño 0.01 o 0.05. La probabilidad
que la afirmación del intervalo incluya al parámetro sea cierta es por lo menos (1-α ) ; por lo
tanto la probabilidad que la afirmación sea falsa es por lo más un alfa
Teoría de Estimación
El proceso de estimación conlleva a obtener un estimador que tenga ciertas condiciones
deseables para hacer inferencia sobre el modelo de probabilidad que ha generado los datos.
Entre los métodos de estimación de la estadística paramétrica, se tiene: Momentos, mínimos
cuadrados y máxima verosimilitud.
Estimación por Intervalos.
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de
valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro,
con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido
se denomina nivel de confianza, y se denota 1-α . La probabilidad de equivocarnos se llama
nivel de significancia y se simboliza α. Generalmente se construyen intervalos con confianza
1- α = 95% (o significancia α =5%). Menos frecuentes son los intervalos con α = 10% o α = 1%
Intervalos de confianza para medias con muestras pequeñas ( n < 30 )
Si la media de la población es ì la distribución muestral de n-1 t es una distribución t, teniendo
en cuenta que las observaciones, x1, x2, x3,. xn son elegidas aleatoriamente y extraídas de una
población normal.
Entonces, cuando las muestras son pequeñas la distribución muestral es la distribución t
La distribución t a medida que el tamaño de la muestra "n" aumenta, tal distribución t se va
pareciendo más a la normal, de tal modo que cuando n > 30 no existen diferencias entre la
distribución normal y la distribución t. Entonces, cuando n < 30 existe una curva diferente para
cada valor de "n".
Grados de libertad. Números de elementos en una muestra que pueden variar después de
haber seleccionado cierto número de ellas.
En general, para la distribución t de Student, se puede decir que el número de grados de libertad
es igual al tamaño de la muestra o número de datos menos uno, es decir: g.l = tn-1
Pasos para la construcción de un Intervalo de confianza para la media μ,
muestras pequeñas.
1. Determinar el nivel de confianza al que vamos a trabajar.
2. Obtener los grados de libertad g . 1 = n - 1
3. Calcular el valor t correspondiente al nivel de confianza fijado con grados de libertad y con
ayuda de la tabla del anexo.
4. La tabla se divide en 10 columnas. La primera indica los grados de libertad, y las siguientes
columnas corresponden a los niveles de significancía que son 0.5,
0.4, 0.2, 0.1, 0.05, 0.025, 0.010, 0.005 y 0.001
5. De esta manera para un valor t correspondiente a un nivel de significancía del 10% y 18
grados de libertad hay que buscar la intersección de la columna del 10% y de la fila 18 g .
1, obteniendo un valor de t = 1.734
6. Calcular el error típico de la media y determinar el error muestral
7. Determinar el intervalo de confianza para la media de la población, sumando y restando a
la media de la muestra ( x ) el error muestral así:
Ejemplo
Una muestra de 10 cajas de atún dio un peso neto medio de 184 gramos y una
desviación estándar de 3.0 gramos. Encontrar los límites de confianza con un 95%
para el verdadero peso promedio de todas las latas de atún.
La siguiente grafica nos ayuda a comprender la presente situación:
En la tabla de la distribución t con 9 grados de libertad y un nivel de significancia del 10%
para dos colas, se registra un valor de 2.26 como valor crítico.
El intervalo de confianza para la media de peso de todas las cajas de atún esta dado por:
Se interpreta que las cajas de atún tienen un promedio de peso entre 181.86 y 186.14 gramos
con un nivel de confianza del 95% y expresado matemáticamente es:
Intervalos de confianza para la Media con muestras grandes n 30
Recordemos que para obtener un intervalo de confianza se procese como sigue:
1. Se determina el riesgo de error que se quiere asumir al afirmar que el parámetro (en este
caso la media) se encuentra en el interior del intervalo.
2. El intervalo de confianza se obtiene separando a izquierda y derecha de la estimación del
parámetro (en este caso la media) un múltiplo de error estándar (
)n
. El múltiplo está determinado por el valor del estadístico Z asociado al
nivel de confianza escogido.
Para la construcción del intervalo de confianza para la media poblacional ì, se han fijado los
siguientes pasos:
1. Fijar el nivel de confianza 1- á
2. Calcular la estandarización z de acuerdo al nivel de confianza predeterminado a
través de la tabla de la distribución normal N (0,1)
3. Calcular la media x y desviación típica S de la muestra.
4. Calcular el error típico de la media (desviación típica de la distribución muestral)
5. Calcular el error muestral
6. Construir el intervalo de confianza, sumando y restando a la media de la muestra ( x ) el
error muestral.
Suponga por ejemplo que Ud. está dispuesto a aceptar un riesgo de error de 0.05;
entonces 10.95, luego se trata de un intervalo de confianza del nivel 0.95. Dado que esta
probabilidad se distribuye simétricamente a los dos lados de la media, se obtiene 0.475
a cada lado. Ahora bien, el valor de Z asociado a una probabilidad de 0.475 es de 1.96 (de
acuerdo a la tabla de la distribución normal) a la derecha de la media y de .1.96 a la
izquierda, como se puede apreciar el la siguiente grafica:
El intervalo de confianza está dado por la siguiente relación:
Expresado en forma generalizada, para poblaciones infinitas o si se muestrea sin
reemplazamiento una población finita, la relación es:
Si la población es finita o si se muestrea sin reemplazamiento una población finita, la
relación es la siguiente:
Recuerde que Z depende del nivel de confianza que se fije y que si la desviación estándar
poblacional es desconocida, se utiliza como estima la desviación muestral (S).
Podrá darse cuenta las semejanzas con los procedimientos utilizados para las pruebas
de
hipótesis, vistas anteriormente para pruebas unilaterales y bilaterales.
Ejemplo
El contenido de proteínas de una muestra de 100 pollos criados en una determinada granja
dio una media de 20.2 gramos con una desviación estándar de 1.14 gramos. Obtener el
intervalo de confianza del 99% para el contenido medio de proteína de todos los pollos de
la granja.
Solución:
Como el intervalo de confianza se distribuye simétricamente a los dos lados de la media,
en este caso a cada lado le corresponde una probabilidad de 0.495 (0.99/2 = 0.495). El valor de
Z asociado a una probabilidad de 0.795 es 2.58.
El intervalo para la media será:
El contenido medio de proteína de toda la población de pollos de la granja esta dentro
de un intervalo de 19.91 y 20.49 gramos con un nivel de confianza del 99%, y se expresa de la
siguiente forma:
Ejemplo:
Se toma una muestra al azar de 40 vasos de kumis de un lote de 500, dieron un promedio de 76
calorías por cada 100 gramos con una desviación estándar 2.9 calorías. Obtener el
intervalo de confianza del 95% para el contenido medio de calorías para todo el lote.
Solución:
Nótese que se trata de una población finita y muestreo sin reemplazamiento. El valor
de Z asociado a un nivel de confianza del 95% es 1.96 (0.95/2 = 0.475) de acuerdo a la tabla de
la distribución normal.
El intervalo de confianza en este caso está dado por:
Por tanto el contenido medio de calorías del lote esta dentro del intervalo de 75.13 y
76.87 calorías con un 95% de nivel de confianza, y expresado matemáticamente es:
Intervalo de confianza para la diferencia entre dos medias
El intervalo de confianza para la diferencia de medias de poblaciones infinitas está dado por:
Ejemplo:
Se analizó el contenido de vitamina A de una muestra de mantequilla y de una muestra
de margarina enriquecida. En la muestra de mantequilla formada por 40 potes de 100 gramos,
el contenido medio de vitamina A fue de 4.86 unidades con una desviación estándar de 0.06.
En la muestra de margarina enriquecida formada por 50 potes de 100 gramos el contenido
medio de vitamina A fue de 5.0 unidades con una desviación estándar de 0.08 unidades.
Encontrar el intervalo de confianza del 95% para la diferencia de contenido medio de vitamina
A para el experimento en mención.
Solución:
Generalmente el mayor valor de la media se toma como 1 X .
El nivel de confianza del 95% corresponde un Z = 1.96.
Aplicando la fórmula se tiene:
Por lo tanto se puede afirmar con un nivel del 95% que la diferencia de los dos contenidos de
vitamina A de la mantequilla y la margarina enriquecida se encuentran entre 0.111 y
0.169unidades.
PRUEBAS DE HIPÓTESIS
En casos relacionados con situaciones especiales en las cuales se desea comprobar la
efectividad de estándares preestablecidos, la técnica de prueba de hipótesis resultaba bastante
apropiada, por cuanto permite comprobar con bastante certeza el grado de acierto en la fijación
de éstos.
Una hipótesis estadística se define como un supuesto hecho sobre algún parámetro de la
población. Por ejemplo, los siguientes enunciados podrían ser tomados como hipótesis:
- El ingreso promedio de los trabajadores de la fábrica es de $X.
- El rendimiento promedio de los empleados de dos fábricas es diferente.
- El promedio de duración de las bombillas es de 1.000 horas.
- El promedio de duración de las llantas es de 100.000 kilómetros.
Ya se ha recabado en muchas ocasiones, que el objetivo es tomar muestras para extraer alguna
conclusión o inferencia sobre la población y que el único objetivo de examinar muestras, es que
las poblaciones suelen ser demasiado grandes y costosas de estudiar.
La prueba de hipótesis consiste en aplicar técnicas estadísticas que permitan aceptar o rechazar
una hipótesis. Este procedimiento se conoce como contraste de hipótesis. Las pruebas de
hipótesis utilizan un procedimiento de cinco pasos, los cuales se mencionan a continuación:
1. Plantear las hipótesis nula y alternativa.
2. Determinar el nivel de significancia.
3. Estimar el valor estadístico de prueba.
4. Establecer la regla de decisión.
5. Tomar la decisión.
Tipos de pruebas.
En la prueba de investigación, o de validez de una afirmación, se conocen las siguientes clases
de pruebas:
 Pruebas para grandes muestras.
 Pruebas para pequeñas muestras.






Pruebas de varianza.
En las pruebas de grandes muestras se realizan para los siguientes casos:
Pruebas de medias y de proporciones.
Pruebas de diferencias de medias y proporciones.
En las pruebas de pequeñas muestras se realizan para los siguientes casos:
Pruebas para medias y diferencias de medias.
Descargar