0.5 setgray0 0.5 setgray1 Fundamentos de Estadística Introducción a la Estadística Prof. Dr. Eduardo Valenzuela Domı́nguez eduardo.valenzuela@usm.cl Universidad Técnica Federico Santa Marı́a Dr. Eduardo Valenzuela D.; MEE 2005 – p. 1/6 Introducción Modelación Realidad versus Modelo Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/6 Introducción Modelación Realidad versus Modelo • Modelos Deterministicos Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/6 Introducción Modelación Realidad versus Modelo • Modelos Deterministicos • Modelos no-Deterministicos Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/6 Introducción Modelación Realidad versus Modelo • Modelos Deterministicos • Modelos no-Deterministicos Toma de decisiones bajo Incertidumbre Dr. Eduardo Valenzuela D.; MEE 2005 – p. 2/6 Definición Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6 Definición Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: • Ingeniería Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6 Definición Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: • Ingeniería • Compañías de Seguros Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6 Definición Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: • Ingeniería • Compañías de Seguros • Estudios de Mercado Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6 Definición Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: • Ingeniería • Compañías de Seguros • Estudios de Mercado • Control de Calidad Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6 Definición Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: • Ingeniería • Compañías de Seguros • Estudios de Mercado • Control de Calidad • Instrumentos Financieros Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6 Definición Estadistica: Mezcla entre ciencia y arte que entrega herramientas para modelar fenómenos no-deterministicos Algunas aplicaciones: • Ingeniería • Compañías de Seguros • Estudios de Mercado • Control de Calidad • Instrumentos Financieros • Medicina Dr. Eduardo Valenzuela D.; MEE 2005 – p. 3/6 Algunos Términos • Población: Colección completa de todas los individuos de interes para el investigador. • Parámetro: Valor que caracteriza un aspecto de la población. • Muestra: Subconjunto de la población y que es representativa de esta. • Estadistico: Medida descriptiva de la muestra que se utiliza para estimar al respectivo parámetro poblacional. • Variable: Caracteristica de la población que se analiza en el estudio estadistico. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 4/6 Técnicas de Muestreo • Muestreo Aleatorio simple: Procedimiento mediante el cuál todas las muestras de un determinado tamaño, poseen la misma "chance" de ser extraidas. • Muestreo Aleatorio Estratificado: Esquema de muestreo que primero particiona a la población en diversos "estratos" y posteriormente extrae una mustra aleatoria simple en cada uno de ellos. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 5/6 Muestreo • Error muestral: Diferencia entre el valor del parámetro poblacional y el producido por el estadistico o estadigrafo basado en una muestra. • Sesgo muestral: Tendencia a favorecer la selección de determinados individuos de la población. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 6/6 Muestreo • Población vs Muestra • Muestreo implica Error muestral • Acotar la probabilidad de cometer errores Estadistica • Descriptiva • Inferencial Dr. Eduardo Valenzuela D.; MEE 2005 – p. 7/6 Tipos de Variables • Variables cualitativas: Caracteristica que representa una cualidad de los individuos poblacionales. • Variables cuantitativas: Caracteristica que corresponde a una magnitud asociada a los individuos de la población. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 8/6 Escalas de Medición • Escala nominal: Nombres o clases que se utilizan para organizar los datos en categorias separadas y distintas. • Escala ordinal: Mediciones que jerarquizan los datos en categorias, ordenadas en virtud de un determinado criterio. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 9/6 Escalas de Medición • Escala de intervalos: Mediciones respecto de una escala numerica en la cual la diferencia entre valores tiene interpretación y la ubicación del cero es arbitrario. • Escala de proporciones: Mediciones respecto de una escala numerica en la cual tanto la diferencia como los cuocientes tienen interpretación y la ubicación del cero es absoluto. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 10/6 Estadistica Descriptiva Proporciona procedimientos que permiten organizar, procesar y presentar los datos muestrales con el fin de extraer información relevante que este contenida en ellos. Datos Muestrales Clasificación A1 , A2 , . . . , Ak : clases Dr. Eduardo Valenzuela D.; MEE 2005 – p. 11/6 Número de clases Si se dispone de n datos muestrales, se suele usar la regla de “Sturges”: k = [3, 3 · log n] + 1 Ejemplo: Para n = 1000, usar: k = [3, 3 · log 1000] + 1 = [3, 3 · 3] + 1 = 9 + 1 = 10 clases Dr. Eduardo Valenzuela D.; MEE 2005 – p. 12/6 Observaciones y Preguntas • Las clases deben ser excluyentes y todo elemento muestral debe pertenecer a una de ellas. • ¿Existen clases que concentren mas datos?. • ¿Se presenta un comportamiento uniforme?. • ¿Se visualiza mas de un punto de concentración?. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 13/6 Construcción de clases Si los datos muestrales estan medidos por lo menos al nivel de intervalos y si los representamos por: x1 , x2 , . . . , xn entonces la amplitud de las clases es de: max xi − min xi c= k Dr. Eduardo Valenzuela D.; MEE 2005 – p. 14/6 Construcción de clases con esto se determinan los limites superior e inferior de cada clase: clase limites relacin A1 [a1 → b1 ] b1 = a1 + c A2 ]a2 → b2 ] b2 = a2 + c .. .. .. . . . Ak ]ak → bk ] bk = ak + c en donde a1 = min xi y ak+1 = bk Dr. Eduardo Valenzuela D.; MEE 2005 – p. 15/6 Ejemplo Consideremos una muestra de n = 50 datos: 68 72 50 70 65 83 77 78 80 93 71 74 60 84 72 84 73 81 84 92 77 57 70 59 85 74 78 79 91 102 83 67 66 75 79 82 93 90 101 80 79 69 76 94 71 97 95 83 86 69 numero de clases: k = [3, 3 log 50] + 1 = 6 Dr. Eduardo Valenzuela D.; MEE 2005 – p. 16/6 Continuación Ejemplo min xi = 50 y max xi = 102, por lo que c = 102−50 = 8, 7 redondeando, tomaremos c = 9, 6 con lo que las clases quedan: clase A1 A2 A3 A4 A5 A6 limites marca de clase [50 → 59] 54, 5 ]59 → 68] 63, 5 ]68 → 77] 72, 5 ]77 → 86] 81, 5 ]86 → 95] 90, 5 ]95 → 104] 99, 5 Dr. Eduardo Valenzuela D.; MEE 2005 – p. 17/6 Gráfico de Tallo y Hoja Una forma alternativa de visualizar los datos, es mediante el gráfico de tallo y hoja: La coma decimal esta un digito a la derecha de los dos puntos: 5 6 7 8 9 10 : : : : : : 079 0567899 001122344567788999 001233344456 01233457 12 Dr. Eduardo Valenzuela D.; MEE 2005 – p. 18/6 Distribuciones de Frecuencias Para descubrir como se “reparten” los datos entre las clases, consideraremos las frecuencias • Frecuencia absoluta: Es el número de observaciones muestrales que caen en cada clase: ni , para i = 1, . . . , k. • Frecuencia relativa: Es la proporción de datos con respecto a toda la muestra que pertenecen a cada clase: fi , para i = 1, . . . , k. • Se tiene que: fi = ni n Dr. Eduardo Valenzuela D.; MEE 2005 – p. 19/6 Distribuciones de Frecuencias • • • Frecuencia absoluta acumulada: Es la suma acumulada de las frecuencias absolutas hasta cada clase: Ni , para i = 1, . . . , k. con Pi Ni = j=1 nj , para i = 1, . . . , k Frecuencia relativa acumulada: Es la suma acumulada de las fercuencias relativas hasta cada clase: Fi , para i = 1, . . . , k. con Pi Fi = j=1 fj , para i = 1, . . . , k Se tiene que: Fi = Ni n Dr. Eduardo Valenzuela D.; MEE 2005 – p. 20/6 Ejemplo clase A1 A2 A3 A4 A5 A6 total limites [50 → 59] ]59 → 68] ]68 → 77] ]77 → 86] ]86 → 95] ]95 → 104] ni 3 5 15 17 7 3 50 Ni 3 8 23 40 47 50 fi 0, 06 0, 10 0, 30 0, 34 0, 14 0, 06 1, 00 Fi 0, 06 0, 16 0, 46 0, 80 0, 94 1, 00 Dr. Eduardo Valenzuela D.; MEE 2005 – p. 21/6 Representaciones Gráficas Otra forma de representar la información muestral, es mediante gráficos • Histograma: Se grafican las frecuencias con respecto a las diversas clases. • Poligono de frecuencias: Representa las frecuencias en las marcas de clases unidas por segmentos de rectas. • Distribucion de frecuencias acumuladas: Aqui se representan las frecuencias acumuladas hasta cada clase. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 22/6 Representaciones Gráficas • Ojiva: Poligonal que une las frecuencias acumulativas en cada clase. • Gráfico de barras: Las frecuencias se representan por barras proporcionales a ellas. • Gráficos circulares: Las frecuencias se muestran como sectores circulares. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 23/6 Histograma 0.0 0.01 0.02 0.03 Histograma de x 50 60 70 80 90 100 110 x Dr. Eduardo Valenzuela D.; MEE 2005 – p. 24/6 Ojiva 0.0 0.2 0.4 Frec 0.6 0.8 1.0 Ojiva de x 50 60 70 80 90 100 x Dr. Eduardo Valenzuela D.; MEE 2005 – p. 25/6 Pastel Grafico circular de x Dr. Eduardo Valenzuela D.; MEE 2005 – p. 26/6 Estadistica descriptiva bivariada Analisis descriptivo conjunto de dos o mas variables. Si (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) es una muestra bivariada de las variables X e Y . Si k es el número de clases para X y l, para Y , se definen: • Frecuencia absoluta conjunta: El número de observaciones muestrales que caen en la clase Ai segun X y en la clase Bj segun Y . ni,j , i = 1, . . . , k, j = 1, . . . , l • Frecuencia relativa conjunta: Proporción muestral de ni,j . Dr. Eduardo Valenzuela D.; MEE 2005 – p. 27/6 Tablas de contingencia Se definen las frecuencias marginales de X e Y respectivamente por: ni,. = l X j=1 ni,j , n.,j = k X ni,j i=1 y las respectivas frecuencias relativas conjuntas y marginales por: fi,j ni,. n.,j ni,j , fi,. = , f.,j = = n n n Dr. Eduardo Valenzuela D.; MEE 2005 – p. 28/6 Ejemplo [1000;2000] ]2000;3000] ]3000;4000] ]4000;5000] n.,j [10;30] ]30;50] ]50;70] 15 8 4 5 12 9 2 13 10 1 16 18 ni,. 113 Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/6 Ejemplo [1000;2000] ]2000;3000] ]3000;4000] ]4000;5000] n.,j [10;30] ]30;50] ]50;70] 15 8 4 5 12 9 2 13 10 1 16 18 ni,. 27 26 25 35 113 Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/6 Ejemplo [1000;2000] ]2000;3000] ]3000;4000] ]4000;5000] n.,j [10;30] ]30;50] ]50;70] ni,. 15 8 4 5 12 9 2 13 10 1 16 18 23 49 41 113 Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/6 Ejemplo [1000;2000] ]2000;3000] ]3000;4000] ]4000;5000] n.,j [10;30] ]30;50] ]50;70] ni,. 15 8 4 27 5 12 9 26 2 13 10 25 1 16 18 35 23 49 41 113 Dr. Eduardo Valenzuela D.; MEE 2005 – p. 29/6 Medidas de tendencia central Son estadisticos que proporcionan valores representativos de la muestra, de tal manera que todos los datos muestrales caen en torno a estos valores. • Moda • Mediana • Media ( geométrica ) • Media ( aritmética ) Dr. Eduardo Valenzuela D.; MEE 2005 – p. 30/6 Si los datos muestrales han sido agrupados en clases y estas marcas de clase son x1 , . . . , xk con frecuencias relativas fi . Se define la media de x por x̄ = k X i=1 f i xi = k X 1 n n i xi i=1 Dr. Eduardo Valenzuela D.; MEE 2005 – p. 31/6 Medidas de variabilidad Las medidas de variabilidad o de dispersión, pretenden cuantificar el grado de homogeneidad presente en la muestra; determinan que tan concentrados o dispersos estan los datos. Algunas medidad de dispersión son: • Rango • Desviación media • Rango intercuartílico • Varianza y Desviación estandar Dr. Eduardo Valenzuela D.; MEE 2005 – p. 32/6 La varianza se define por: Sx2 = k X i=1 fi (xi − x̄)2 = k X 1 n i=1 ni (xi − x̄)2 y la desviación estandar por: p Sx = + Sx2 Dr. Eduardo Valenzuela D.; MEE 2005 – p. 33/6 Observación Cabe hacer notar que cuando la varianza muestral se usa como un estimador de la varianza poblacional, su definición se modifica levemente en la forma: 1 S = n−1 2 k X i=1 ni (xi − x̄)2 Esta varianza modificada es preferible como estimador, pues posee mejores propiedades que Sx2 . Dr. Eduardo Valenzuela D.; MEE 2005 – p. 34/6 Desigualdad de Tschebyscheff Una interpretación interesante de la desviacion estandar es la proporcionada por la “Desigualdad de Tschebyscheff”, que plantea intuitivamente que: En todo conjunto de observaciones y para todo numero real r > 1, se tiene que al menos 1 − r12 de ellas caen en el intervalo: [x̄ − rSx ; x̄ + rSx ] Dr. Eduardo Valenzuela D.; MEE 2005 – p. 35/6 Gráficamente: • • • • • Dr. Eduardo Valenzuela D.; MEE 2005 – p. 36/6 Resumen Las principales medidas descriptivas de la muestra son: • Resumen de $x$ Min. 1st Q. Med. Mean 3rd Q. Max. 50.00 71.00 78.50 78.36 84.00 102.00 N = 50 Median = 78.5 Quartiles = 71; 84 Que pueden representarse gráficamente por: Dr. Eduardo Valenzuela D.; MEE 2005 – p. 37/6 -1.0 -0.5 0.0 0.5 1.0 Gráfico de Cajón Dr. Eduardo Valenzuela D.; MEE 2005 – p. 38/6 Elementos de Inferencia Estadística Al modelar un fenómeno en la vida real, las variables que nos interesan generalmente son de naturaleza no-deterministica y en consecuencia pueden representarse por variables aleatorias. Para poder obtener probabilidades asociadas a estas variables aleatorias X, podemos ocupar su funcion de distribucion FX : FX (x) = P [X ≤ x] Dr. Eduardo Valenzuela D.; MEE 2005 – p. 39/6 Problema Pero en la mayoria de los casos, esta función, dependerá de parámetros desconocidos θ, es decir tenemos: FX (x; θ) = P [X ≤ x] y para que estos modelos sean de alguna utilidad, se requiere previamente estimar estos parametros a partir de informacion empírica recopilada a partir de una muestra aleatoria de X. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 40/6 Problemas Esto nos lleva a los principales problemas de la inferencia estadistica: Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/6 Problemas Esto nos lleva a los principales problemas de la inferencia estadistica: • Estimacion puntual. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/6 Problemas Esto nos lleva a los principales problemas de la inferencia estadistica: • Estimacion puntual. • Estimacion por intervalos de confianza. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/6 Problemas Esto nos lleva a los principales problemas de la inferencia estadistica: • Estimacion puntual. • Estimacion por intervalos de confianza. • Prueba de hipotesis. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 41/6 Estimacion puntual En el ámbito de la estimacion puntual se han desarrollado diversos metodos para “construir” estimadores puntuales, entre ellos: Lo que hace necesario definir cualidades de los estimadores, para asi poder seleccionar el “mejor” entre varios posibles. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/6 Estimacion puntual En el ámbito de la estimacion puntual se han desarrollado diversos metodos para “construir” estimadores puntuales, entre ellos: • Método de momentos. Lo que hace necesario definir cualidades de los estimadores, para asi poder seleccionar el “mejor” entre varios posibles. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/6 Estimacion puntual En el ámbito de la estimacion puntual se han desarrollado diversos metodos para “construir” estimadores puntuales, entre ellos: • Método de momentos. • Método de minimos cuadrados. Lo que hace necesario definir cualidades de los estimadores, para asi poder seleccionar el “mejor” entre varios posibles. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/6 Estimacion puntual En el ámbito de la estimacion puntual se han desarrollado diversos metodos para “construir” estimadores puntuales, entre ellos: • Método de momentos. • Método de minimos cuadrados. • Método de máxima verosimilitud. Lo que hace necesario definir cualidades de los estimadores, para asi poder seleccionar el “mejor” entre varios posibles. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 42/6 Propiedades Entre las principales propiedades de los estimadores se cuentan: Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6 Propiedades Entre las principales propiedades de los estimadores se cuentan: • Insesgamiento Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6 Propiedades Entre las principales propiedades de los estimadores se cuentan: • Insesgamiento • Varianza minima Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6 Propiedades Entre las principales propiedades de los estimadores se cuentan: • Insesgamiento • Varianza minima • Error cuadratico minimo Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6 Propiedades Entre las principales propiedades de los estimadores se cuentan: • Insesgamiento • Varianza minima • Error cuadratico minimo • Eficiencia Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6 Propiedades Entre las principales propiedades de los estimadores se cuentan: • Insesgamiento • Varianza minima • Error cuadratico minimo • Eficiencia • Consistencia Dr. Eduardo Valenzuela D.; MEE 2005 – p. 43/6 Ejemplo Supongamos que la variable aleatoria X esta distribuida normalmente: X ∼ N (µ, σ 2 ) Se dice que X1 , . . . , Xn es una Muestra aleatoria de X, si: • Los X1 , . . . , Xn son independientes • Cada Xi posee la misma ditribucion que X Dr. Eduardo Valenzuela D.; MEE 2005 – p. 44/6 Ejemplo Usando estos “datos” se pueden obtener estimadores puntuales de los parametros µ y σ 2 , los cuales poseen varias de las propiedades anteriores; ellos son: X̄n = 2 Sn 1 = n−1 n X 1 n Xi i=1 n X 2 (Xi − X̄n ) i=1 que son la media y varianza muestral. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 45/6 Ejemplo Notemos que los valores que estos estimadores producen, dependen de los valores muestrales y en consecuencia cambiaran de una a otra muestra. Esto nos lleva a considerar las distribuciones muestrales de estos estimadores. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 46/6 Distribuciones muestrales Bajo la suposicion de que: X ∼ N (µ, σ 2 ) se puede verificar que la distribucion empirica de la media muestral a partir de una muestra aleatoria de tamaño n es: σ2 X̄n ∼ N (µ, ) n que es nuevamente una normal. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 47/6 Distribuciones muestrales Analogamente la distribucion empirica de la varianza muestral es: (n − 1)Sn2 2 ∼ χ (n − 1) 2 σ que se denomina Chi cuadrado con n − 1 grados de libertad y que para usarla al igual que la normal, hay que recurrir a tablas estadisticas Dr. Eduardo Valenzuela D.; MEE 2005 – p. 48/6 Otras distribuciones Ademas de estas distribuciones, es necesario considerar otras mas que aparecen en los procesos de estimacion y prueba de hipotesis, ellas son: • La distribucion t de student con k grados de libertad, que se simboliza por t(k). • La distribucion Fisher con k y l grados de libertad, que se representa por F (k, l). Dr. Eduardo Valenzuela D.; MEE 2005 – p. 49/6 Otras distribuciones Analogamente a la distribucion normal y chi-cuadrado, para evaluar probabilidades asociadas a ellas, es necesario obtener los valores usando una tabla estadistica, una calculadora que las tenga implementadas o un programa computacional adecuado. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 50/6 Observación Cabe hacer notar que si bien es cierto estos estimadores puntuales, al evaluarlos en los datos muestrales, nos proporcionan una estimacion puntual, que sirve para aproximar el valor desconocido del parametro en estudio; ellos no entregan idea alguna sobre el error que se produce en este proceso de estimacion. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 51/6 Observación Para poder cuantificar este error, se requeriria estimar los parametros por medio de un intervalo de confianza, que nos indique una region que pudiera contener al parametro buscado, mas una evaluacion de la proporcion de veces que tomaremos una decision correcta al usar este procedimiento, para estimar los parametros; esto se conoce como el coeficiente de confianza Dr. Eduardo Valenzuela D.; MEE 2005 – p. 52/6 Estimacion por intervalos de confianza Llamaremos un intervalo de confianza para el parametro θ con coeficiente de confianza γ, a un intervalo del tipo: [T1 (X1 , . . . , Xn ); T2 (X1 , . . . , Xn )] que cumpla: P [T1 ≤ θ ≤ T2 ] ≥ γ Dr. Eduardo Valenzuela D.; MEE 2005 – p. 53/6 Estimacion por intervalos de confianza Se puede ver que si X ∼ N (µ, σ 2 ), entonces el intervalo de confianza para µ con coeficiente de confianza γ esta dado por: Sn Sn [X̂n − √ · t(1+γ)/2 (n − 1); X̂n + √ · t(1+γ)/2 (n − 1)] n n Dr. Eduardo Valenzuela D.; MEE 2005 – p. 54/6 Observación Existen algunas situaciones en las cuales la varianza σ 2 se conoce y por lo tanto no se requiere previamente estimarla. Tambien en aquellos casos en que el tamaño muestral n crece tendiendo a infinito n → ∞, se puede verificar que la distribucion t de student se aproxima en un cierto sentido a la distribucion normal. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 55/6 Observación Para estas situaciones, que se denominan muestras grandes, el intervalo de confianza para la media muestral X̂n se transforma en: σ σ [X̂n − √ · z(1+γ)/2 ; X̂n + √ · z(1+γ)/2 ] n n Dr. Eduardo Valenzuela D.; MEE 2005 – p. 56/6 Continuación Analogamente se puede obtener el intervalo de confianza para σ 2 con coeficiente de confianza γ, resultando: 2 2 (n − 1) · Sn (n − 1) · Sn ; χ(1+γ)/2 (n − 1) χ(1−γ)/2 (n − 1) El uso de estos intervalos de confianza nos permite estimar los parametros de interes, indicando la “precision” que permiten obtener los datos disponibles. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 57/6 Prueba de Hipótesis Existen situaciones en las cuales se tiene algun conocimiento previo sobre los parametros de una distribución ( Hipotesis ) y se desea analizar si este supuesto es consecuente con los datos muestrales. Esto lleva a una Prueba de Hipótesis, para lo que se necesita: Dr. Eduardo Valenzuela D.; MEE 2005 – p. 58/6 Prueba de Hipótesis Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6 Prueba de Hipótesis • Una hipotesis nula H0 . Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6 Prueba de Hipótesis • Una hipotesis nula H0 . • Una hipotesis alternativa H1 . Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6 Prueba de Hipótesis • Una hipotesis nula H0 . • Una hipotesis alternativa H1 . • Una funcion de los datos T (X1 , . . . , Xn ), cuya distribución bajo H0 se conozca. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6 Prueba de Hipótesis • Una hipotesis nula H0 . • Una hipotesis alternativa H1 . • Una funcion de los datos T (X1 , . . . , Xn ), cuya distribución bajo H0 se conozca. • Un nivel de significancia 0 < α < 1. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6 Prueba de Hipótesis • Una hipotesis nula H0 . • Una hipotesis alternativa H1 . • Una funcion de los datos T (X1 , . . . , Xn ), cuya distribución bajo H0 se conozca. • Un nivel de significancia 0 < α < 1. • Una región de rechazo. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 59/6 Acciones Al tomar la decisión de rechazar o no la hipótesis nula sobre la base de los datos muestrales, se producen las siguientes posibilidades: acción ; realidad H0 verdadera H0 falsa rechazar H0 Error I Correcto no rechazar H0 Correcto Error II La idea es limitar a valores pequeños las probabilidades de estos errores. Dr. Eduardo Valenzuela D.; MEE 2005 – p. 60/6 • • • • • Dr. Eduardo Valenzuela D.; MEE 2005 – p. 61/6